FR2850473A1 - Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web - Google Patents

Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web Download PDF

Info

Publication number
FR2850473A1
FR2850473A1 FR0300915A FR0300915A FR2850473A1 FR 2850473 A1 FR2850473 A1 FR 2850473A1 FR 0300915 A FR0300915 A FR 0300915A FR 0300915 A FR0300915 A FR 0300915A FR 2850473 A1 FR2850473 A1 FR 2850473A1
Authority
FR
France
Prior art keywords
document
translation
intercepted
information
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0300915A
Other languages
English (en)
Inventor
Etienne Annic
Anne Boutroux
Jean Francois Ravier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0300915A priority Critical patent/FR2850473A1/fr
Priority to EP04700468A priority patent/EP1588284A1/fr
Priority to CNA200480003075XA priority patent/CN1745379A/zh
Priority to US10/543,354 priority patent/US20070055489A1/en
Priority to PCT/FR2004/000020 priority patent/WO2004079587A1/fr
Publication of FR2850473A1 publication Critical patent/FR2850473A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

Pour la fourniture de traductions de documents diffusés par des fournisseurs de contenus (4) à une pluralité de terminaux d'utilisateurs (11, 12, 13) par l'intermédiaire d'un réseau (1) de transmission de données, ce procédé consiste à : insérer dans au moins un document diffusé par les fournisseurs de contenus (4) une information définissant un thème du document, cette information étant délimitée dans le document par des balises de délimitation de thème prédéfinies ; lorsqu'un document diffusé est transmis vers un terminal d'utilisateur (11, 12, 13), intercepter le document diffusé, extraire du document intercepté l'information de thème, traduire le document structuré en tenant compte de l'information de thème ; insérer la traduction obtenue dans un document résultant de la traduction ; et transmettre le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté pour être affiché à l'écran du terminal par le logiciel de navigation.

Description

- 1
PROCEDE ET SYSTEME POUR LA FOURNITURE D'UN SERVICE DE TRADUCTION AUTOMATIQUE DE CONTENU WEB.
La présente invention concerne les services à valeur ajoutée que peuvent offrir les fournisseurs d'accès au réseau Internet.
Elle s'applique notamment, mais non exclusivement, aux fournisseurs d'accès offrant un accès au réseau Internet et souhaitant élargir leurs offres d'accès en 10 proposant des services à valeur ajoutée à leurs clients.
Le réseau Internet étant un réseau mondial, il donne accès à des pages Web qui peuvent être dans n'importe quelle langue. Pour élargir leur audience, certains sites Web diffusent des pages Web dans plusieurs langues au choix de 15 l'utilisateur. Toutefois, ces sites sont très peu nombreux. En outre, la maintenance de sites en plusieurs langues est coteuse, puisqu'à chaque fois qu'une page Web est modifiée ou ajoutée, il faut traduire les modifications et reporter ces modifications dans les autres langues. Dans ce contexte, il est donc pertinent de proposer aux utilisateurs un service de traduction automatique, et 20 ce d'autant plus que le niveau de qualité des traductions fournies est élevé.
A l'heure actuelle, il existe plusieurs niveaux de qualité de traduction automatique de contenu de pages Web. Les systèmes de traduction automatique du premier niveau de qualité, dit "de base", utilisent exclusivement un 25 dictionnaire standard. La traduction des mots ambivalents est donc effectuée d'une manière arbitraire. Il en résulte que les traductions fournies par de tels systèmes peuvent être incompréhensibles et comporter de nombreux contresens.
Certains systèmes réalisant des traductions de meilleure qualité utilisent non 30 seulement un tel dictionnaire standard, mais également des thésaurus ou dictionnaires thématiques permettant de résoudre certaines ambigutés par rapport au sujet du document à traduire. Ces systèmes nécessitent le choix préalable d'un ou plusieurs dictionnaires thématiques. La qualité de la traduction réalisée par ces systèmes dépend donc de l'existence de dictionnaires 35 thématiques correspondant au document à traduire et de la pertinence du choix des dictionnaires à utiliser pour réaliser la traduction, en fonction de l'objet du document à traduire. - 2
Les systèmes offrant le meilleur niveau de qualité intègrent la notion de thème et de type. La notion de thème désigne le contexte dans lequel le contenu doit être traduit (par exemple finance, cuisine, sport). La notion de type désigne le genre littéraire auquel appartient le contenu à traduire (par exemple dépêche, 5 recette de cuisine, texte). Parmi les systèmes de ce type, on connaît par exemple le système TAUM (Traduction Automatique de l'Université de Montréal) qui est spécialisé dans la traduction de dépêches à connotation météorologique.
Ces systèmes présentent l'inconvénient d'être spécifiquement conçus pour un 10 thème et un type de document particulier. Pour pouvoir traduire une grande variété de documents d'origines diverses, il faut donc disposer d'un grand nombre de systèmes de traduction spécialisés.
La présente invention a pour but de supprimer ces inconvénients. Cet objectif 15 est atteint par la prévision d'un procédé de fourniture de traductions de documents diffusés par des fournisseurs de contenus à une pluralité de terminaux d'utilisateurs par l'intermédiaire d'un réseau de transmission de données numériques, les documents étant structurés par des balises qui sont traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs. 20 Selon l'invention, ce procédé comprend des étapes consistant à: (a) insérer dans au moins un document diffusé par les fournisseurs de contenus une information définissant un thème du document, cette information étant délimitée dans le document par des balises de délimitation de thème 25 prédéfinies; (b) lorsqu'un document diffusé est transmis vers un terminal d'utilisateur, intercepter le document diffusé, extraire du document intercepté l'information de thème du document diffusé, traduire le document structuré en tenant compte de l'information de thème, et insérer la traduction obtenue 30 dans un document résultant de la traduction; et (c) transmettre le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté pour être affiché à l'écran du terminal par le logiciel de navigation.
Avantageusement, les balises de délimitation de thème prédéfinies sont choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur le document diffusé, l'information de thème n'est pas affichée. - 3
Selon un mode d'exécution de l'invention, l'information de thème insérée dans un document diffusé par les fournisseurs de contenus est associée à une information de type de document, délimitée dans le document par des balises de 5 délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur le document diffusé, l'information de type n'est pas affichée, la traduction du document étant effectuée en tenant compte de l'information de type.
Selon un mode d'exécution de l'invention, un document structuré résultant de la traduction est transmis au terminal d'utilisateur en remplacement d'un document intercepté, uniquement sur demande préalable de l'utilisateur.
De préférence, un document intercepté est transmis du réseau vers un terminal d'utilisateur à la suite d'une requête émise par celui-ci au réseau, un document résultant de la traduction correspondant au document intercepté étant transmis au terminal d'utilisateur uniquement si la requête du document intercepté comprend un indicateur de demande de traduction. 20 Selon un mode d'exécution de l'invention, le terminal d'utilisateur accède au réseau par l'intermédiaire d'un fournisseur d'accès qui exécute les étapes (b) et (c) et lorsqu'il reçoit du réseau un document contenant une information de thème à destination d'un terminal d'utilisateur connecté au fournisseur d'accès. 25 Selon un autre mode d'exécution de l'invention, ce procédé comprend une étape de configuration par l'utilisateur auprès du fournisseur d'accès d'un paramètre indiquant s'il souhaite ou non obtenir une traduction en remplacement des documents qui lui sont transmis par le réseau, un document résultant de la 30 traduction étant transmis au terminal d'utilisateur en remplacement d'un document transmis par le réseau, tant que le paramètre indique que l'utilisateur souhaite obtenir une traduction des documents transmis par le réseau.
Selon un autre mode d'exécution de l'invention, une langue cible vers laquelle 35 les documents doivent être traduits est prédéfinie.
Alternativement, ce procédé comprend une étape de sélection par l'utilisateur d'une langue cible vers laquelle les documents doivent être traduits.
Selon un mode d'exécution de l'invention, ce procédé comprend une étape d'aiguillage du document intercepté vers une machine de traduction spécialisée, en fonction du thème et/ou du type extrait du document intercepté.
Avantageusement, si le thème et/ou le type extrait du document intercepté ne correspond pas à une machine de traduction spécialisée disponible, ou si aucune information de thème et/ou de type ne figure dans le document intercepté, le document intercepté est aiguillé vers une machine de traduction de base. 10 L'invention concerne également un système de fourniture de traductions de documents diffusés par des fournisseurs de contenus à une pluralité de terminaux d'utilisateurs par l'intermédiaire d'un réseau de transmission de données numériques, les documents étant structurés par des balises qui sont 15 traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs.
Selon l'invention, les documents diffusés comprennent au moins en partie une information de thème délimitée par des balises de délimitation de thème prédéfinies, le système comprenant: - des moyens pour intercepter les documents diffusés transmis par le réseau vers un terminal d'utilisateur, - des moyens pour extraire l'information de thème des documents interceptés, - des moyens pour traduire un document intercepté en tenant compte de 25 l'information de thème extraite du document, et pour insérer la traduction obtenue dans un document structuré résultant de la traduction, et - des moyens pour transmettre le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté, pour être affiché à l'écran du terminal par le logiciel de navigation. 30 Avantageusement, l'information de thème insérée dans un document diffusé par les fournisseurs de contenus est associée à une information de type de document, délimitée dans le document par des balises de délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les 35 interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur le document diffusé, l'information de type n'est pas affichée, les moyens de traduction tenant compte de l'information de type pour effectuer une traduction.
Selon un mode de réalisation de l'invention, ce système est mis en oeuvre par un fournisseur d'accès offrant aux terminaux d'utilisateurs un accès au réseau.
Selon un mode de réalisation de l'invention, ce système est mis en oeuvre à 5 l'aide du protocole ICAP pour intercepter les documents fournis en réponses aux requêtes émises par les terminaux d'utilisateur, et pour transmettre les documents interceptés à un service de fourniture de traductions de documents.
Avantageusement, les moyens de traduction comprennent des machines de 10 traduction spécialisées adaptées chacune à un thème et/ou un type, une machine de traduction de base, et des moyens d'aiguillage pour aiguiller chaque document intercepté vers la machine de traduction adaptée au thème et/ou au type extrait du document intercepté, ou vers la machine de traduction de base si le document intercepté ne comprend pas d'information de thème et/ou de type 15 ou si le thème et/ou le type extrait du document intercepté ne correspond à aucune des machines de traduction spécialisées.
Alternativement, le serveur de traductions comporte une machine de traduction, l'information de thème et de type servant à sélectionner un ou plusieurs 20 dictionnaires à utiliser par la machine de traduction pour effectuer une traduction, et l'information de type servant à sélectionner un mode de fonctionnement de la machine de traduction ou un logiciel de traduction spécialisé.
Un mode de réalisation préféré de l'invention sera décrit ci-après, à titre d'exemple non limitatif, avec référence aux dessins annexés dans lesquels: La figure l représente schématiquement un système selon l'invention; La figure 2 montre plus en détail le système représenté sur la figure 1.
Le système représenté sur la figure l comprend un fournisseur d'accès 3 permettant à des utilisateurs disposant d'une liaison avec un réseau de télécommunication 2 d'accéder à un réseau public i de transmission de données 35 tel que le réseau Internet, ce réseau étant relié à des serveurs 4 fournissant différents services comme la diffusion d'informations. - 6
Les utilisateurs disposent d'un terminal 11, 12, 13 connectable au réseau 2 pour accéder au fournisseur d'accès 3. Ce terminal peut être de type ordinateur personnel 11, assistant électronique personnel (PDA) 12 communiquant, ou encore téléphone mobile 13.
Selon l'invention, le fournisseur d'accès 3 comprend un serveur cache 5 ou un serveur mandataire cache (proxy/cache) disposé en coupure de flux, dédié à la fourniture d'un service de traduction automatique, ce serveur étant connecté à 10 un serveur de traductions 6.
Comme cela est montré plus en détail sur la figure 2, le serveur proxy/cache 5 comprend des moyens 21 pour recevoir à l'étape 31 des requêtes de pages Web émises par les utilisateurs, ces requêtes étant par exemple conformes au 15 protocole HTTP (HyperText Transfer Protocol). De telles requêtes comprennent notamment un identifiant du terminal émetteur de la requête, par exemple l'adresse IP (Internet Protocol) de l'émetteur, et l'adresse IP de la page à accéder, diffusée par un serveur 4.
D'une manière classique, les requêtes HTTP reçues sont mémorisées dans une table 23 et retransmises à l'étape 32 au réseau 1 dès leur réception.
Le serveur 5 comprend en outre des moyens 22 pour recevoir à l'étape 33 les pages Web transmises en réponse aux requêtes. Les moyens de retransmission 25 22 accèdent alors à la table 23 pour déterminer l'adresse du destinataire de la page Web reçue en fonction de l'adresse de cette dernière. Ayant ainsi déterminé l'utilisateur destinataire de la page Web, les moyens de retransmission 22 retransmettent celle-ci à l'utilisateur à l'étape 36.
Selon l'invention, le serveur cache 5 est en outre conçu pour gérer les demandes de traduction émises par les utilisateurs, en association avec les requêtes de pages Web, pour transmettre les pages Web reçues au serveur de traduction 6, et pour transmettre les traductions fournies par le serveur 6 aux utilisateurs.
En outre, selon l'invention, les pages Web diffusées par les serveurs 4, qui se présentent généralement sous la forme de fichiers HTML (HyperText Markup Language), comprennent une balise particulière, par exemple <theme> ...
</theme> délimitant une information de thème, et éventuellement une balise - 7 particulière, par exemple <type> ... </type> délimitant une information de type de contenu. Ces informations qui sont insérées par le fournisseur de contenu ou l'éditeur du site, permettent d'associer à une page Web un thème et un type.
Il est à noter que ces balises particulières sont choisies de manière à ne pas être interprétées par le logiciel de navigation employé par les utilisateurs pour afficher les pages Web reçues. Cela signifie que le logiciel de navigation n'affiche pas à l'écran du terminal les informations entre ces balises lorsqu'il affiche la page Web.
Par ailleurs, le serveur de traduction 6 comprend un serveur d'aiguillage 14 couplé à des machines de traduction thématiques 16 et éventuellement une machine de traduction de base 15. Le serveur d'aiguillage extrait et analyse le thème et le type associé à chaque page Web à traduire et envoie celle-ci à la 15 machine de traduction 16 correspondant au thème et/ou au type associés à la page. Si le thème et/ou le type de la page Web à traduire ne correspondent à aucune machine de traduction thématique 16 disponible ou si ces informations ne figurent pas dans la page Web, cette dernière est envoyée à la machine de traduction de base 15.
Alternativement, le serveur de traductions 6 peut ne comporter qu'une seule machine de traduction, l'information de thème et de type servant à sélectionner un ou plusieurs dictionnaires à utiliser pour effectuer une traduction et l'information de type servant à sélectionner un mode de fonctionnement de la 25 machine de traduction ou un logiciel de traduction spécialisé.
Dans une première variante de l'invention, l'utilisateur indique qu'il souhaite obtenir une traduction de la page Web qu'il demande à l'aide d'une interface Web qui lui permet de passer en mode traduction.
Ainsi, chaque page Web transmise par le fournisseur d'accès à l'utilisateur peut comprendre par exemple un bandeau de personnalisation qui est inséré à la volée par le fournisseur d'accès, par exemple par un service ICAP (Internet Content Adaptation Protocol). Ce bandeau comprend par exemple une case à cocher que l'utilisateur peut cocher pour sélectionner le mode traduction, ou 35 décocher pour passer en mode normal.
La langue cible vers laquelle les documents doivent être traduits peut être une langue prédéfinie, par exemple celle du pays dans lequel se trouve le fournisseur d'accès.
On peut prévoir également d'offrir à l'utilisateur la possibilité de choisir une langue cible à l'aide d'un champ de sélection prévu dans le bandeau de sélection du mode traduction.
Un indicateur de demande de traduction est mémorisé et mis à jour dans la table 23 ou dans un autre moyen de stockage 25, selon l'état de cette case à cocher, en association avec l'identifiant de l'utilisateur, et éventuellement avec un paramètre définissant la langue cible sélectionnée par l'utilisateur. 10 Le moyen de stockage 25 peut comprendre une liste de contrôle d'accès ACL (Access Control List) qui gère les adresses des utilisateurs pour lesquels le mode traduction est activé.
Le moyen de stockage 25 peut être localisé dans le serveur 5 ou être déporté et interrogeable par le serveur 5, par exemple par l'intermédiaire du réseau 1.
Lorsque les moyens de retransmission 22 reçoivent du réseau 1 une page Web associée dans la table 23 à un indicateur de demande de traduction, ils 20 retransmettent la page au serveur de traduction 6, à l'étape 34. A la réception d'une page Web, le serveur 6 l'analyse pour détecter les balises particulières donnant le thème et le type du contenu de la page Web, traduit le texte qui y figure en tenant compte des informations de thème et de type délimitées par les balises, et génère une page HTML présentant la traduction du texte. La page 25 HTML de traduction ainsi générée est transmise à l'étape 35 aux moyens de retransmission 22, lesquels la retransmettent au terminal de l'utilisateur à l'étape 36.
Il est à noter que la génération de la page HTMIL de traduction peut simplement 30 consister à remplacer les zones de texte de la page à traduire par la traduction de ces zones.
De cette manière, l'utilisateur peut obtenir une traduction des pages Web demandées qui soit compréhensible et pertinente.
En outre, l'association d'une définition d'un thème et d'un type à une page Web est simple puisqu'elle nécessite simplement la mise en oeuvre d'un système de balises.
Alternativement, on peut offrir à l'utilisateur la possibilité de configurer, par exemple auprès du fournisseur d'accès 3, via une interface Web, un paramètre de mode de traduction indiquant s'il souhaite ou non obtenir une traduction avant toute transmission de page Web provenant du réseau Internet, ainsi 5 qu'éventuellement un paramètre définissant la langue cible dans laquelle les traductions doivent être effectuées. Ces paramètres sont par exemple mémorisés dans le moyen de stockage 25 en association avec l'identifiant (adresse IP) de l'utilisateur. Tant que le paramètre mode de traduction indique que l'utilisateur souhaite obtenir des traductions, les moyens de retransmission 22 transmettent 10 une traduction à l'utilisateur en remplacement de toutes les pages qui lui sont destinées, provenant du réseau Internet.
Dans ce mode de réalisation, le moyen de stockage 25 peut également être localisé dans le serveur 5 ou être déporté et interrogeable par le serveur 5, par 15 exemple par l'intermédiaire du réseau 1.
Avantageusement, le système qui vient d'être décrit peut être facilement mis en oeuvre en utilisant le protocole ICAP. Ce protocole est particulièrement conçu pour intercepter des requêtes ou des réponses HTTP transitant via un serveur 20 proxy, et pour transmettre ces requêtes ou réponses à un service particulier qui les modifie avant de les retransmettre.
Bien entendu, le service de fourniture de traductions peut être réalisé sans utiliser le protocole ICAP. Il peut aussi être réalisé en utilisant l'API 25 (Application Programming Interface) d'un serveur proxy cache. 10

Claims (17)

REVENDICATIONS
1. Procédé de fourniture de traductions de documents diffusés par des fournisseurs de contenus (4) à une pluralité de terminaux d'utilisateurs (l 1, 5 12, 13) par l'intermédiaire d'un réseau (1) de transmission de données numériques, les documents étant structurés par des balises qui sont traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs, caractérisé en ce qu'il comprend des étapes consistant à: (a) insérer dans au moins un document diffusé par les fournisseurs de contenus 10 (4) une information définissant un thème du document, cette information étant délimitée dans le document par des balises de délimitation de thème prédéfinies; (b) lorsqu'un document diffusé est transmis vers un terminal d'utilisateur (11, 12, 13), intercepter le document diffusé, extraire du document intercepté 15 l'information de thème du document diffusé, traduire le document structuré en tenant compte de l'information de thème, et insérer la traduction obtenue dans un document résultant de la traduction; et (c) transmettre (36) le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté pour être affiché à 20 l'écran du terminal par le logiciel de navigation.
2. Procédé selon la revendication 1, caractérisé en ce que les balises de délimitation de thème prédéfinies sont choisies de manière à ce que le logiciel de navigation ne les interprète pas de 25 sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur (11, 12, 13) le document diffusé, l'information de thème n'est pas affichée.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que l'information de thème insérée dans un document diffusé 30 par les fournisseurs de contenus (4) est associée à une information de type de document, délimitée dans le document par des balises de délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur (11, 12, 13) le document diffusé, l'information de type n'est pas affichée, la 35 traduction du document étant effectuée en tenant compte de l'information de type.
4. Procédé selon la revendication 1 ou 3, - 11 caractérisé en ce qu'un document structuré résultant de la traduction est transmis au terminal d'utilisateur (11, 12, 13) en remplacement d'un document intercepté uniquement sur demande préalable de l'utilisateur.
5. Procédé selon l'une des revendications 1 à 4,
caractérisé en ce qu'un document intercepté est transmis du réseau (1) vers un terminal d'utilisateur (11, 12, 13) à la suite d'une requête émise par celui-ci au réseau, un document résultant de la traduction correspondant au document intercepté étant transmis au terminal d'utilisateur uniquement si la requête du 10 document intercepté comprend un indicateur de demande de traduction.
6. Procédé selon l'une des revendications 1 à 5,
caractérisé en ce que le terminal d'utilisateur (11, 12, 13) accède au réseau (1) par l'intermédiaire d'un fournisseur d'accès (3) qui exécute les étapes (b) et (c) 15 lorsqu'il reçoit du réseau un document contenant une information de thème à destination d'un terminal d'utilisateur connecté au fournisseur d'accès.
7. Procédé selon la revendication 6, caractérisé en ce qu'il comprend une étape de configuration par l'utilisateur 20 auprès du fournisseur d'accès (3) d'un paramètre indiquant s'il souhaite ou non obtenir une traduction en remplacement des documents qui lui sont transmis par le réseau (1), un document résultant de la traduction étant transmis au terminal d'utilisateur (11, 12, 13) en remplacement d'un document transmis par le réseau, tant que le paramètre indique que l'utilisateur souhaite obtenir une 25 traduction des documents transmis par le réseau.
8. Procédé selon l'une des revendications 1 à 7,
caractérisé en ce qu'une langue cible vers laquelle les documents doivent être traduits est prédéfinie.
9. Procédé selon l'une des revendications 1 à 7,
caractérisé en ce qu'il comprend une étape de sélection par l'utilisateur d'une langue cible vers laquelle les documents doivent être traduits.
10. Procédé selon l'une des revendications 1 à 9,
caractérisé en ce qu'il comprend une étape d'aiguillage du document intercepté vers une machine de traduction spécialisée (16), en fonction du thème et/ou du type extrait du document intercepté. - 12
11. Procédé selon la revendication 10, caractérisé en ce que si le thème et/ou le type extrait du document intercepté ne correspond pas à une machine de traduction spécialisée disponible, ou si aucune 5 information de thème et/ou de type ne figure dans le document intercepté, le document intercepté est aiguillé vers une machine de traduction de base (15).
12. Système de fourniture de traductions de documents diffusés par des fournisseurs de contenus (4) à une pluralité de terminaux d'utilisateurs (11, 10 12, 13) par l'intermédiaire d'un réseau (1) de transmission de données numériques, les documents étant structurés par des balises qui sont traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs, caractérisé en ce que les documents diffusés comprennent au moins en partie une information de thème délimitée par des balises de délimitation de thème 15 prédéfinies, le système comprenant: - des moyens (22) pour intercepter les documents diffusés transmis par le réseau (1) vers un terminal d'utilisateur (11, 12, 13), - des moyens (14) pour extraire l'information de thème des documents interceptés, - des moyens (14, 15, 16) pour traduire un document intercepté en tenant compte de l'information de thème extraite du document, et pour insérer la traduction obtenue dans un document structuré résultant de la traduction, et - des moyens (22) pour transmettre le document résultant de la traduction au terminal d'utilisateur (11, 12, 13) en remplacement du document intercepté, 25 pour être affiché à l'écran du terminal par le logiciel de navigation.
13. Système selon la revendication 12, caractérisé en ce que l'information de thème insérée dans un document diffusé par les fournisseurs de contenus (4) est associée à une information de type de 30 document, délimitée dans le document par des balises de délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur (l 1, 12, 13) le document diffusé, l'information de type n'est pas affichée, les moyens (14, 15, 16) de traduction tenant compte de l'information de type pour 35 effectuer une traduction.
14. Système selon la revendication 12 ou 13, caractérisé en ce qu'il est mis en oeuvre par un fournisseur d'accès (1) offrant - 13 aux terminaux d'utilisateurs un accès au réseau (1).
15. Système selon l'une des revendications 12 à 14, caractérisé en ce qu'il est mis en oeuvre à l'aide du protocole ICAP pour 5 intercepter les documents fournis en réponses aux requêtes émises par les terminaux d'utilisateur (11, 12, 13), et pour transmettre les documents interceptés à un service (6) de fourniture de traductions de documents.
16. Système selon l'une des revendications 13 à 15, caractérisé en ce que les moyens de traduction comprennent des machines de traduction (16) spécialisées adaptées chacune à un thème et/ou un type, une machine de traduction de base (15), et des moyens d'aiguillage (14) pour aiguiller chaque document intercepté vers la machine de traduction adaptée au thème et/ou au type extrait du document intercepté, ou vers la machine de 15 traduction de base (15) si le document intercepté ne comprend pas d'information de thème et/ou de type ou si le thème et/ou le type extrait du document intercepté ne correspond à aucune des machines de traduction spécialisées (16).
17. Système selon l'une des revendications 13 à 15, caractérisé en ce que le serveur de traductions (6) comporte une machine de traduction, l'information de thème et de type servant à sélectionner un ou plusieurs dictionnaires à utiliser par la machine de traduction pour effectuer une traduction, et l'information de type servant à sélectionner un mode de 25 fonctionnement de la machine de traduction ou un logiciel de traduction spécialisé.
FR0300915A 2003-01-28 2003-01-28 Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web Pending FR2850473A1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR0300915A FR2850473A1 (fr) 2003-01-28 2003-01-28 Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
EP04700468A EP1588284A1 (fr) 2003-01-28 2004-01-07 Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
CNA200480003075XA CN1745379A (zh) 2003-01-28 2004-01-07 提供自动网页内容翻译服务的方法与系统
US10/543,354 US20070055489A1 (en) 2003-01-28 2004-01-07 Method and system for supplying an automatic web content translation service
PCT/FR2004/000020 WO2004079587A1 (fr) 2003-01-28 2004-01-07 Procede et systeme pour la fourniture d’un service de traduction automatique de contenu web

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0300915A FR2850473A1 (fr) 2003-01-28 2003-01-28 Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web

Publications (1)

Publication Number Publication Date
FR2850473A1 true FR2850473A1 (fr) 2004-07-30

Family

ID=32669269

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0300915A Pending FR2850473A1 (fr) 2003-01-28 2003-01-28 Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web

Country Status (5)

Country Link
US (1) US20070055489A1 (fr)
EP (1) EP1588284A1 (fr)
CN (1) CN1745379A (fr)
FR (1) FR2850473A1 (fr)
WO (1) WO2004079587A1 (fr)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100399335C (zh) * 2005-11-15 2008-07-02 李利鹏 把源文档转换成目标网页文件的方法
CN102388383A (zh) * 2006-12-08 2012-03-21 帕特里克·J·霍尔 在线计算机辅助翻译
US20080243475A1 (en) * 2007-03-16 2008-10-02 Steven Scott Everhart Web content translation system, method, and software
US8515729B2 (en) * 2008-03-31 2013-08-20 Microsoft Corporation User translated sites after provisioning
US10671698B2 (en) 2009-05-26 2020-06-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US9405745B2 (en) * 2009-06-01 2016-08-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US8799408B2 (en) * 2009-08-10 2014-08-05 Sling Media Pvt Ltd Localization systems and methods
CN102567384B (zh) * 2010-12-29 2017-02-01 上海掌门科技有限公司 基于网页浏览器引擎的网页多语言动态切换方法及系统
US8843360B1 (en) * 2011-03-04 2014-09-23 Amazon Technologies, Inc. Client-side localization of network pages
US20120253784A1 (en) * 2011-03-31 2012-10-04 International Business Machines Corporation Language translation based on nearby devices
CN103581144A (zh) * 2012-08-06 2014-02-12 无锡稳捷网络技术有限公司 基于icap协议的网络安全访问控制方法
US20140223284A1 (en) * 2013-02-01 2014-08-07 Brokersavant, Inc. Machine learning data annotation apparatuses, methods and systems
US9591052B2 (en) 2013-02-05 2017-03-07 Apple Inc. System and method for providing a content distribution network with data quality monitoring and management
US10402061B2 (en) * 2014-09-28 2019-09-03 Microsoft Technology Licensing, Llc Productivity tools for content authoring
CN106326213A (zh) * 2015-06-19 2017-01-11 北京京东尚科信息技术有限公司 一种对web站点进行翻译的方法及装置
US10223356B1 (en) * 2016-09-28 2019-03-05 Amazon Technologies, Inc. Abstraction of syntax in localization through pre-rendering
US10261995B1 (en) 2016-09-28 2019-04-16 Amazon Technologies, Inc. Semantic and natural language processing for content categorization and routing
US10275459B1 (en) 2016-09-28 2019-04-30 Amazon Technologies, Inc. Source language content scoring for localizability
CN109426530B (zh) * 2017-08-17 2022-04-05 阿里巴巴集团控股有限公司 页面确定方法、装置、服务器和存储介质
CN110232193B (zh) * 2019-04-28 2020-08-28 清华大学 一种结构化文本翻译方法及装置
CN113723119B (zh) * 2021-08-26 2023-07-14 腾讯科技(深圳)有限公司 页面翻译方法、装置和存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5535120A (en) * 1990-12-31 1996-07-09 Trans-Link International Corp. Machine translation and telecommunications system using user ID data to select dictionaries
US6119078A (en) * 1996-10-15 2000-09-12 International Business Machines Corporation Systems, methods and computer program products for automatically translating web pages
US6208956B1 (en) * 1996-05-28 2001-03-27 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US6415249B1 (en) * 2000-03-01 2002-07-02 International Business Machines Corporation Method and system for using machine translation with content language specification
US20020123879A1 (en) * 2001-03-01 2002-09-05 Donald Spector Translation system & method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5535120A (en) * 1990-12-31 1996-07-09 Trans-Link International Corp. Machine translation and telecommunications system using user ID data to select dictionaries
US6208956B1 (en) * 1996-05-28 2001-03-27 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US6119078A (en) * 1996-10-15 2000-09-12 International Business Machines Corporation Systems, methods and computer program products for automatically translating web pages
US6415249B1 (en) * 2000-03-01 2002-07-02 International Business Machines Corporation Method and system for using machine translation with content language specification
US20020123879A1 (en) * 2001-03-01 2002-09-05 Donald Spector Translation system & method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"INTERNET CONTENT ADAPTATION PROTOCOL (ICAP)", INTERNATIONAL CONFERENCE ON ANTENNAS AND PROPAGATION, XX, XX, 30 July 2001 (2001-07-30), pages 1 - 13, XP002226584 *
KIM T ET AL: "FromTo-CLIR: web-based natural language interface for cross-language information retrieval", INFORMATION PROCESSING & MANAGEMENT, ELSEVIER, BARKING, GB, vol. 35, no. 4, July 1999 (1999-07-01), pages 559 - 586, XP004179085, ISSN: 0306-4573 *

Also Published As

Publication number Publication date
WO2004079587A1 (fr) 2004-09-16
US20070055489A1 (en) 2007-03-08
EP1588284A1 (fr) 2005-10-26
CN1745379A (zh) 2006-03-08

Similar Documents

Publication Publication Date Title
FR2850473A1 (fr) Procede et systeme pour la fourniture d&#39;un service de traduction automatique de contenu web
US9807160B2 (en) Autonomic content load balancing
US20020019849A1 (en) Information communication system
US6505233B1 (en) Method for communicating information among a group of participants
US7249197B1 (en) System, apparatus and method for personalising web content
US7058633B1 (en) System and method for generalized URL-rewriting
FI105249B (fi) Menetelmä ja järjestely informaation liittämiseksi verkkoresursseihin
US6725268B1 (en) System and method for providing status information from multiple information sources in a single display
US9411900B2 (en) Integrated adaptive URL-shortening functionality
US5815663A (en) Distributed posting system using an indirect reference protocol
KR100913687B1 (ko) 이메일 뉴스레터들과 같은 이메일에서 콘텐트 타겟팅된광고들을 서비스하는 방법
AU2005263962B2 (en) Improved user interface
US9164988B2 (en) Methods and systems for the dynamic creation of a translated website
US20140280623A1 (en) Auto-reply email system and method with personalized content
US20090313318A1 (en) System and method using interpretation filters for commercial data insertion into mobile computing devices
US20090248806A1 (en) System and method for dynamically changing item status in static email messages
US20080071616A1 (en) System and Method for Ensuring Delivery of Advertising
KR101229382B1 (ko) 전자 통신 디바이스용 전자 메시지 컨텐츠를 처리하기 위한 다중 메시지 및 다중 부분 메시지 방법 및 시스템
WO2001017173A1 (fr) Systeme de diffusion d&#39;informations parmi un groupe de participants
US20020004819A1 (en) Device and method for data interception and updating
US7840645B1 (en) Methods and apparatus for providing content over a computer network
FR2931268A1 (fr) Dispositif et procede de gestion de la disponibilite de l&#39;acces a des donnees numeriques
US20100057484A1 (en) Systems for generating business cards during domain name registration
KR100321926B1 (ko) 직접 접근 방식을 이용한 정보 및/또는 서비스를 제공하기 위한 컴퓨터 프로그램을 저장한 기록매체 및 시스템
JP2002183002A (ja) 訂正候補のドメイン名を通知するサーバ装置、およびこのサーバ装置により通知された訂正候補のドメイン名を利用するクライアントコンピュータ、およびこのクライアントコンピュータ上で動作するプログラムを記録した記録媒体、および訂正候補のメールアドレスを通知するメールサーバ