FR2850473A1 - Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web - Google Patents
Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web Download PDFInfo
- Publication number
- FR2850473A1 FR2850473A1 FR0300915A FR0300915A FR2850473A1 FR 2850473 A1 FR2850473 A1 FR 2850473A1 FR 0300915 A FR0300915 A FR 0300915A FR 0300915 A FR0300915 A FR 0300915A FR 2850473 A1 FR2850473 A1 FR 2850473A1
- Authority
- FR
- France
- Prior art keywords
- document
- translation
- intercepted
- information
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
Abstract
Pour la fourniture de traductions de documents diffusés par des fournisseurs de contenus (4) à une pluralité de terminaux d'utilisateurs (11, 12, 13) par l'intermédiaire d'un réseau (1) de transmission de données, ce procédé consiste à : insérer dans au moins un document diffusé par les fournisseurs de contenus (4) une information définissant un thème du document, cette information étant délimitée dans le document par des balises de délimitation de thème prédéfinies ; lorsqu'un document diffusé est transmis vers un terminal d'utilisateur (11, 12, 13), intercepter le document diffusé, extraire du document intercepté l'information de thème, traduire le document structuré en tenant compte de l'information de thème ; insérer la traduction obtenue dans un document résultant de la traduction ; et transmettre le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté pour être affiché à l'écran du terminal par le logiciel de navigation.
Description
- 1
PROCEDE ET SYSTEME POUR LA FOURNITURE D'UN SERVICE DE TRADUCTION AUTOMATIQUE DE CONTENU WEB.
La présente invention concerne les services à valeur ajoutée que peuvent offrir les fournisseurs d'accès au réseau Internet.
Elle s'applique notamment, mais non exclusivement, aux fournisseurs d'accès offrant un accès au réseau Internet et souhaitant élargir leurs offres d'accès en 10 proposant des services à valeur ajoutée à leurs clients.
Le réseau Internet étant un réseau mondial, il donne accès à des pages Web qui peuvent être dans n'importe quelle langue. Pour élargir leur audience, certains sites Web diffusent des pages Web dans plusieurs langues au choix de 15 l'utilisateur. Toutefois, ces sites sont très peu nombreux. En outre, la maintenance de sites en plusieurs langues est coteuse, puisqu'à chaque fois qu'une page Web est modifiée ou ajoutée, il faut traduire les modifications et reporter ces modifications dans les autres langues. Dans ce contexte, il est donc pertinent de proposer aux utilisateurs un service de traduction automatique, et 20 ce d'autant plus que le niveau de qualité des traductions fournies est élevé.
A l'heure actuelle, il existe plusieurs niveaux de qualité de traduction automatique de contenu de pages Web. Les systèmes de traduction automatique du premier niveau de qualité, dit "de base", utilisent exclusivement un 25 dictionnaire standard. La traduction des mots ambivalents est donc effectuée d'une manière arbitraire. Il en résulte que les traductions fournies par de tels systèmes peuvent être incompréhensibles et comporter de nombreux contresens.
Certains systèmes réalisant des traductions de meilleure qualité utilisent non 30 seulement un tel dictionnaire standard, mais également des thésaurus ou dictionnaires thématiques permettant de résoudre certaines ambigutés par rapport au sujet du document à traduire. Ces systèmes nécessitent le choix préalable d'un ou plusieurs dictionnaires thématiques. La qualité de la traduction réalisée par ces systèmes dépend donc de l'existence de dictionnaires 35 thématiques correspondant au document à traduire et de la pertinence du choix des dictionnaires à utiliser pour réaliser la traduction, en fonction de l'objet du document à traduire. - 2
Les systèmes offrant le meilleur niveau de qualité intègrent la notion de thème et de type. La notion de thème désigne le contexte dans lequel le contenu doit être traduit (par exemple finance, cuisine, sport). La notion de type désigne le genre littéraire auquel appartient le contenu à traduire (par exemple dépêche, 5 recette de cuisine, texte). Parmi les systèmes de ce type, on connaît par exemple le système TAUM (Traduction Automatique de l'Université de Montréal) qui est spécialisé dans la traduction de dépêches à connotation météorologique.
Ces systèmes présentent l'inconvénient d'être spécifiquement conçus pour un 10 thème et un type de document particulier. Pour pouvoir traduire une grande variété de documents d'origines diverses, il faut donc disposer d'un grand nombre de systèmes de traduction spécialisés.
La présente invention a pour but de supprimer ces inconvénients. Cet objectif 15 est atteint par la prévision d'un procédé de fourniture de traductions de documents diffusés par des fournisseurs de contenus à une pluralité de terminaux d'utilisateurs par l'intermédiaire d'un réseau de transmission de données numériques, les documents étant structurés par des balises qui sont traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs. 20 Selon l'invention, ce procédé comprend des étapes consistant à: (a) insérer dans au moins un document diffusé par les fournisseurs de contenus une information définissant un thème du document, cette information étant délimitée dans le document par des balises de délimitation de thème 25 prédéfinies; (b) lorsqu'un document diffusé est transmis vers un terminal d'utilisateur, intercepter le document diffusé, extraire du document intercepté l'information de thème du document diffusé, traduire le document structuré en tenant compte de l'information de thème, et insérer la traduction obtenue 30 dans un document résultant de la traduction; et (c) transmettre le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté pour être affiché à l'écran du terminal par le logiciel de navigation.
Avantageusement, les balises de délimitation de thème prédéfinies sont choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur le document diffusé, l'information de thème n'est pas affichée. - 3
Selon un mode d'exécution de l'invention, l'information de thème insérée dans un document diffusé par les fournisseurs de contenus est associée à une information de type de document, délimitée dans le document par des balises de 5 délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur le document diffusé, l'information de type n'est pas affichée, la traduction du document étant effectuée en tenant compte de l'information de type.
Selon un mode d'exécution de l'invention, un document structuré résultant de la traduction est transmis au terminal d'utilisateur en remplacement d'un document intercepté, uniquement sur demande préalable de l'utilisateur.
De préférence, un document intercepté est transmis du réseau vers un terminal d'utilisateur à la suite d'une requête émise par celui-ci au réseau, un document résultant de la traduction correspondant au document intercepté étant transmis au terminal d'utilisateur uniquement si la requête du document intercepté comprend un indicateur de demande de traduction. 20 Selon un mode d'exécution de l'invention, le terminal d'utilisateur accède au réseau par l'intermédiaire d'un fournisseur d'accès qui exécute les étapes (b) et (c) et lorsqu'il reçoit du réseau un document contenant une information de thème à destination d'un terminal d'utilisateur connecté au fournisseur d'accès. 25 Selon un autre mode d'exécution de l'invention, ce procédé comprend une étape de configuration par l'utilisateur auprès du fournisseur d'accès d'un paramètre indiquant s'il souhaite ou non obtenir une traduction en remplacement des documents qui lui sont transmis par le réseau, un document résultant de la 30 traduction étant transmis au terminal d'utilisateur en remplacement d'un document transmis par le réseau, tant que le paramètre indique que l'utilisateur souhaite obtenir une traduction des documents transmis par le réseau.
Selon un autre mode d'exécution de l'invention, une langue cible vers laquelle 35 les documents doivent être traduits est prédéfinie.
Alternativement, ce procédé comprend une étape de sélection par l'utilisateur d'une langue cible vers laquelle les documents doivent être traduits.
Selon un mode d'exécution de l'invention, ce procédé comprend une étape d'aiguillage du document intercepté vers une machine de traduction spécialisée, en fonction du thème et/ou du type extrait du document intercepté.
Avantageusement, si le thème et/ou le type extrait du document intercepté ne correspond pas à une machine de traduction spécialisée disponible, ou si aucune information de thème et/ou de type ne figure dans le document intercepté, le document intercepté est aiguillé vers une machine de traduction de base. 10 L'invention concerne également un système de fourniture de traductions de documents diffusés par des fournisseurs de contenus à une pluralité de terminaux d'utilisateurs par l'intermédiaire d'un réseau de transmission de données numériques, les documents étant structurés par des balises qui sont 15 traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs.
Selon l'invention, les documents diffusés comprennent au moins en partie une information de thème délimitée par des balises de délimitation de thème prédéfinies, le système comprenant: - des moyens pour intercepter les documents diffusés transmis par le réseau vers un terminal d'utilisateur, - des moyens pour extraire l'information de thème des documents interceptés, - des moyens pour traduire un document intercepté en tenant compte de 25 l'information de thème extraite du document, et pour insérer la traduction obtenue dans un document structuré résultant de la traduction, et - des moyens pour transmettre le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté, pour être affiché à l'écran du terminal par le logiciel de navigation. 30 Avantageusement, l'information de thème insérée dans un document diffusé par les fournisseurs de contenus est associée à une information de type de document, délimitée dans le document par des balises de délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les 35 interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur le document diffusé, l'information de type n'est pas affichée, les moyens de traduction tenant compte de l'information de type pour effectuer une traduction.
Selon un mode de réalisation de l'invention, ce système est mis en oeuvre par un fournisseur d'accès offrant aux terminaux d'utilisateurs un accès au réseau.
Selon un mode de réalisation de l'invention, ce système est mis en oeuvre à 5 l'aide du protocole ICAP pour intercepter les documents fournis en réponses aux requêtes émises par les terminaux d'utilisateur, et pour transmettre les documents interceptés à un service de fourniture de traductions de documents.
Avantageusement, les moyens de traduction comprennent des machines de 10 traduction spécialisées adaptées chacune à un thème et/ou un type, une machine de traduction de base, et des moyens d'aiguillage pour aiguiller chaque document intercepté vers la machine de traduction adaptée au thème et/ou au type extrait du document intercepté, ou vers la machine de traduction de base si le document intercepté ne comprend pas d'information de thème et/ou de type 15 ou si le thème et/ou le type extrait du document intercepté ne correspond à aucune des machines de traduction spécialisées.
Alternativement, le serveur de traductions comporte une machine de traduction, l'information de thème et de type servant à sélectionner un ou plusieurs 20 dictionnaires à utiliser par la machine de traduction pour effectuer une traduction, et l'information de type servant à sélectionner un mode de fonctionnement de la machine de traduction ou un logiciel de traduction spécialisé.
Un mode de réalisation préféré de l'invention sera décrit ci-après, à titre d'exemple non limitatif, avec référence aux dessins annexés dans lesquels: La figure l représente schématiquement un système selon l'invention; La figure 2 montre plus en détail le système représenté sur la figure 1.
Le système représenté sur la figure l comprend un fournisseur d'accès 3 permettant à des utilisateurs disposant d'une liaison avec un réseau de télécommunication 2 d'accéder à un réseau public i de transmission de données 35 tel que le réseau Internet, ce réseau étant relié à des serveurs 4 fournissant différents services comme la diffusion d'informations. - 6
Les utilisateurs disposent d'un terminal 11, 12, 13 connectable au réseau 2 pour accéder au fournisseur d'accès 3. Ce terminal peut être de type ordinateur personnel 11, assistant électronique personnel (PDA) 12 communiquant, ou encore téléphone mobile 13.
Selon l'invention, le fournisseur d'accès 3 comprend un serveur cache 5 ou un serveur mandataire cache (proxy/cache) disposé en coupure de flux, dédié à la fourniture d'un service de traduction automatique, ce serveur étant connecté à 10 un serveur de traductions 6.
Comme cela est montré plus en détail sur la figure 2, le serveur proxy/cache 5 comprend des moyens 21 pour recevoir à l'étape 31 des requêtes de pages Web émises par les utilisateurs, ces requêtes étant par exemple conformes au 15 protocole HTTP (HyperText Transfer Protocol). De telles requêtes comprennent notamment un identifiant du terminal émetteur de la requête, par exemple l'adresse IP (Internet Protocol) de l'émetteur, et l'adresse IP de la page à accéder, diffusée par un serveur 4.
D'une manière classique, les requêtes HTTP reçues sont mémorisées dans une table 23 et retransmises à l'étape 32 au réseau 1 dès leur réception.
Le serveur 5 comprend en outre des moyens 22 pour recevoir à l'étape 33 les pages Web transmises en réponse aux requêtes. Les moyens de retransmission 25 22 accèdent alors à la table 23 pour déterminer l'adresse du destinataire de la page Web reçue en fonction de l'adresse de cette dernière. Ayant ainsi déterminé l'utilisateur destinataire de la page Web, les moyens de retransmission 22 retransmettent celle-ci à l'utilisateur à l'étape 36.
Selon l'invention, le serveur cache 5 est en outre conçu pour gérer les demandes de traduction émises par les utilisateurs, en association avec les requêtes de pages Web, pour transmettre les pages Web reçues au serveur de traduction 6, et pour transmettre les traductions fournies par le serveur 6 aux utilisateurs.
En outre, selon l'invention, les pages Web diffusées par les serveurs 4, qui se présentent généralement sous la forme de fichiers HTML (HyperText Markup Language), comprennent une balise particulière, par exemple <theme> ...
</theme> délimitant une information de thème, et éventuellement une balise - 7 particulière, par exemple <type> ... </type> délimitant une information de type de contenu. Ces informations qui sont insérées par le fournisseur de contenu ou l'éditeur du site, permettent d'associer à une page Web un thème et un type.
Il est à noter que ces balises particulières sont choisies de manière à ne pas être interprétées par le logiciel de navigation employé par les utilisateurs pour afficher les pages Web reçues. Cela signifie que le logiciel de navigation n'affiche pas à l'écran du terminal les informations entre ces balises lorsqu'il affiche la page Web.
Par ailleurs, le serveur de traduction 6 comprend un serveur d'aiguillage 14 couplé à des machines de traduction thématiques 16 et éventuellement une machine de traduction de base 15. Le serveur d'aiguillage extrait et analyse le thème et le type associé à chaque page Web à traduire et envoie celle-ci à la 15 machine de traduction 16 correspondant au thème et/ou au type associés à la page. Si le thème et/ou le type de la page Web à traduire ne correspondent à aucune machine de traduction thématique 16 disponible ou si ces informations ne figurent pas dans la page Web, cette dernière est envoyée à la machine de traduction de base 15.
Alternativement, le serveur de traductions 6 peut ne comporter qu'une seule machine de traduction, l'information de thème et de type servant à sélectionner un ou plusieurs dictionnaires à utiliser pour effectuer une traduction et l'information de type servant à sélectionner un mode de fonctionnement de la 25 machine de traduction ou un logiciel de traduction spécialisé.
Dans une première variante de l'invention, l'utilisateur indique qu'il souhaite obtenir une traduction de la page Web qu'il demande à l'aide d'une interface Web qui lui permet de passer en mode traduction.
Ainsi, chaque page Web transmise par le fournisseur d'accès à l'utilisateur peut comprendre par exemple un bandeau de personnalisation qui est inséré à la volée par le fournisseur d'accès, par exemple par un service ICAP (Internet Content Adaptation Protocol). Ce bandeau comprend par exemple une case à cocher que l'utilisateur peut cocher pour sélectionner le mode traduction, ou 35 décocher pour passer en mode normal.
La langue cible vers laquelle les documents doivent être traduits peut être une langue prédéfinie, par exemple celle du pays dans lequel se trouve le fournisseur d'accès.
On peut prévoir également d'offrir à l'utilisateur la possibilité de choisir une langue cible à l'aide d'un champ de sélection prévu dans le bandeau de sélection du mode traduction.
Un indicateur de demande de traduction est mémorisé et mis à jour dans la table 23 ou dans un autre moyen de stockage 25, selon l'état de cette case à cocher, en association avec l'identifiant de l'utilisateur, et éventuellement avec un paramètre définissant la langue cible sélectionnée par l'utilisateur. 10 Le moyen de stockage 25 peut comprendre une liste de contrôle d'accès ACL (Access Control List) qui gère les adresses des utilisateurs pour lesquels le mode traduction est activé.
Le moyen de stockage 25 peut être localisé dans le serveur 5 ou être déporté et interrogeable par le serveur 5, par exemple par l'intermédiaire du réseau 1.
Lorsque les moyens de retransmission 22 reçoivent du réseau 1 une page Web associée dans la table 23 à un indicateur de demande de traduction, ils 20 retransmettent la page au serveur de traduction 6, à l'étape 34. A la réception d'une page Web, le serveur 6 l'analyse pour détecter les balises particulières donnant le thème et le type du contenu de la page Web, traduit le texte qui y figure en tenant compte des informations de thème et de type délimitées par les balises, et génère une page HTML présentant la traduction du texte. La page 25 HTML de traduction ainsi générée est transmise à l'étape 35 aux moyens de retransmission 22, lesquels la retransmettent au terminal de l'utilisateur à l'étape 36.
Il est à noter que la génération de la page HTMIL de traduction peut simplement 30 consister à remplacer les zones de texte de la page à traduire par la traduction de ces zones.
De cette manière, l'utilisateur peut obtenir une traduction des pages Web demandées qui soit compréhensible et pertinente.
En outre, l'association d'une définition d'un thème et d'un type à une page Web est simple puisqu'elle nécessite simplement la mise en oeuvre d'un système de balises.
Alternativement, on peut offrir à l'utilisateur la possibilité de configurer, par exemple auprès du fournisseur d'accès 3, via une interface Web, un paramètre de mode de traduction indiquant s'il souhaite ou non obtenir une traduction avant toute transmission de page Web provenant du réseau Internet, ainsi 5 qu'éventuellement un paramètre définissant la langue cible dans laquelle les traductions doivent être effectuées. Ces paramètres sont par exemple mémorisés dans le moyen de stockage 25 en association avec l'identifiant (adresse IP) de l'utilisateur. Tant que le paramètre mode de traduction indique que l'utilisateur souhaite obtenir des traductions, les moyens de retransmission 22 transmettent 10 une traduction à l'utilisateur en remplacement de toutes les pages qui lui sont destinées, provenant du réseau Internet.
Dans ce mode de réalisation, le moyen de stockage 25 peut également être localisé dans le serveur 5 ou être déporté et interrogeable par le serveur 5, par 15 exemple par l'intermédiaire du réseau 1.
Avantageusement, le système qui vient d'être décrit peut être facilement mis en oeuvre en utilisant le protocole ICAP. Ce protocole est particulièrement conçu pour intercepter des requêtes ou des réponses HTTP transitant via un serveur 20 proxy, et pour transmettre ces requêtes ou réponses à un service particulier qui les modifie avant de les retransmettre.
Bien entendu, le service de fourniture de traductions peut être réalisé sans utiliser le protocole ICAP. Il peut aussi être réalisé en utilisant l'API 25 (Application Programming Interface) d'un serveur proxy cache. 10
Claims (17)
1. Procédé de fourniture de traductions de documents diffusés par des fournisseurs de contenus (4) à une pluralité de terminaux d'utilisateurs (l 1, 5 12, 13) par l'intermédiaire d'un réseau (1) de transmission de données numériques, les documents étant structurés par des balises qui sont traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs, caractérisé en ce qu'il comprend des étapes consistant à: (a) insérer dans au moins un document diffusé par les fournisseurs de contenus 10 (4) une information définissant un thème du document, cette information étant délimitée dans le document par des balises de délimitation de thème prédéfinies; (b) lorsqu'un document diffusé est transmis vers un terminal d'utilisateur (11, 12, 13), intercepter le document diffusé, extraire du document intercepté 15 l'information de thème du document diffusé, traduire le document structuré en tenant compte de l'information de thème, et insérer la traduction obtenue dans un document résultant de la traduction; et (c) transmettre (36) le document résultant de la traduction au terminal d'utilisateur en remplacement du document intercepté pour être affiché à 20 l'écran du terminal par le logiciel de navigation.
2. Procédé selon la revendication 1, caractérisé en ce que les balises de délimitation de thème prédéfinies sont choisies de manière à ce que le logiciel de navigation ne les interprète pas de 25 sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur (11, 12, 13) le document diffusé, l'information de thème n'est pas affichée.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que l'information de thème insérée dans un document diffusé 30 par les fournisseurs de contenus (4) est associée à une information de type de document, délimitée dans le document par des balises de délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur (11, 12, 13) le document diffusé, l'information de type n'est pas affichée, la 35 traduction du document étant effectuée en tenant compte de l'information de type.
4. Procédé selon la revendication 1 ou 3, - 11 caractérisé en ce qu'un document structuré résultant de la traduction est transmis au terminal d'utilisateur (11, 12, 13) en remplacement d'un document intercepté uniquement sur demande préalable de l'utilisateur.
5. Procédé selon l'une des revendications 1 à 4,
caractérisé en ce qu'un document intercepté est transmis du réseau (1) vers un terminal d'utilisateur (11, 12, 13) à la suite d'une requête émise par celui-ci au réseau, un document résultant de la traduction correspondant au document intercepté étant transmis au terminal d'utilisateur uniquement si la requête du 10 document intercepté comprend un indicateur de demande de traduction.
6. Procédé selon l'une des revendications 1 à 5,
caractérisé en ce que le terminal d'utilisateur (11, 12, 13) accède au réseau (1) par l'intermédiaire d'un fournisseur d'accès (3) qui exécute les étapes (b) et (c) 15 lorsqu'il reçoit du réseau un document contenant une information de thème à destination d'un terminal d'utilisateur connecté au fournisseur d'accès.
7. Procédé selon la revendication 6, caractérisé en ce qu'il comprend une étape de configuration par l'utilisateur 20 auprès du fournisseur d'accès (3) d'un paramètre indiquant s'il souhaite ou non obtenir une traduction en remplacement des documents qui lui sont transmis par le réseau (1), un document résultant de la traduction étant transmis au terminal d'utilisateur (11, 12, 13) en remplacement d'un document transmis par le réseau, tant que le paramètre indique que l'utilisateur souhaite obtenir une 25 traduction des documents transmis par le réseau.
8. Procédé selon l'une des revendications 1 à 7,
caractérisé en ce qu'une langue cible vers laquelle les documents doivent être traduits est prédéfinie.
9. Procédé selon l'une des revendications 1 à 7,
caractérisé en ce qu'il comprend une étape de sélection par l'utilisateur d'une langue cible vers laquelle les documents doivent être traduits.
10. Procédé selon l'une des revendications 1 à 9,
caractérisé en ce qu'il comprend une étape d'aiguillage du document intercepté vers une machine de traduction spécialisée (16), en fonction du thème et/ou du type extrait du document intercepté. - 12
11. Procédé selon la revendication 10, caractérisé en ce que si le thème et/ou le type extrait du document intercepté ne correspond pas à une machine de traduction spécialisée disponible, ou si aucune 5 information de thème et/ou de type ne figure dans le document intercepté, le document intercepté est aiguillé vers une machine de traduction de base (15).
12. Système de fourniture de traductions de documents diffusés par des fournisseurs de contenus (4) à une pluralité de terminaux d'utilisateurs (11, 10 12, 13) par l'intermédiaire d'un réseau (1) de transmission de données numériques, les documents étant structurés par des balises qui sont traitées par un logiciel de navigation exécuté sur les terminaux d'utilisateurs, caractérisé en ce que les documents diffusés comprennent au moins en partie une information de thème délimitée par des balises de délimitation de thème 15 prédéfinies, le système comprenant: - des moyens (22) pour intercepter les documents diffusés transmis par le réseau (1) vers un terminal d'utilisateur (11, 12, 13), - des moyens (14) pour extraire l'information de thème des documents interceptés, - des moyens (14, 15, 16) pour traduire un document intercepté en tenant compte de l'information de thème extraite du document, et pour insérer la traduction obtenue dans un document structuré résultant de la traduction, et - des moyens (22) pour transmettre le document résultant de la traduction au terminal d'utilisateur (11, 12, 13) en remplacement du document intercepté, 25 pour être affiché à l'écran du terminal par le logiciel de navigation.
13. Système selon la revendication 12, caractérisé en ce que l'information de thème insérée dans un document diffusé par les fournisseurs de contenus (4) est associée à une information de type de 30 document, délimitée dans le document par des balises de délimitation de type prédéfinies, choisies de manière à ce que le logiciel de navigation ne les interprète pas de sorte que lorsqu'il affiche à l'écran du terminal d'utilisateur (l 1, 12, 13) le document diffusé, l'information de type n'est pas affichée, les moyens (14, 15, 16) de traduction tenant compte de l'information de type pour 35 effectuer une traduction.
14. Système selon la revendication 12 ou 13, caractérisé en ce qu'il est mis en oeuvre par un fournisseur d'accès (1) offrant - 13 aux terminaux d'utilisateurs un accès au réseau (1).
15. Système selon l'une des revendications 12 à 14, caractérisé en ce qu'il est mis en oeuvre à l'aide du protocole ICAP pour 5 intercepter les documents fournis en réponses aux requêtes émises par les terminaux d'utilisateur (11, 12, 13), et pour transmettre les documents interceptés à un service (6) de fourniture de traductions de documents.
16. Système selon l'une des revendications 13 à 15, caractérisé en ce que les moyens de traduction comprennent des machines de traduction (16) spécialisées adaptées chacune à un thème et/ou un type, une machine de traduction de base (15), et des moyens d'aiguillage (14) pour aiguiller chaque document intercepté vers la machine de traduction adaptée au thème et/ou au type extrait du document intercepté, ou vers la machine de 15 traduction de base (15) si le document intercepté ne comprend pas d'information de thème et/ou de type ou si le thème et/ou le type extrait du document intercepté ne correspond à aucune des machines de traduction spécialisées (16).
17. Système selon l'une des revendications 13 à 15, caractérisé en ce que le serveur de traductions (6) comporte une machine de traduction, l'information de thème et de type servant à sélectionner un ou plusieurs dictionnaires à utiliser par la machine de traduction pour effectuer une traduction, et l'information de type servant à sélectionner un mode de 25 fonctionnement de la machine de traduction ou un logiciel de traduction spécialisé.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0300915A FR2850473A1 (fr) | 2003-01-28 | 2003-01-28 | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
EP04700468A EP1588284A1 (fr) | 2003-01-28 | 2004-01-07 | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
CNA200480003075XA CN1745379A (zh) | 2003-01-28 | 2004-01-07 | 提供自动网页内容翻译服务的方法与系统 |
US10/543,354 US20070055489A1 (en) | 2003-01-28 | 2004-01-07 | Method and system for supplying an automatic web content translation service |
PCT/FR2004/000020 WO2004079587A1 (fr) | 2003-01-28 | 2004-01-07 | Procede et systeme pour la fourniture d’un service de traduction automatique de contenu web |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0300915A FR2850473A1 (fr) | 2003-01-28 | 2003-01-28 | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
Publications (1)
Publication Number | Publication Date |
---|---|
FR2850473A1 true FR2850473A1 (fr) | 2004-07-30 |
Family
ID=32669269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR0300915A Pending FR2850473A1 (fr) | 2003-01-28 | 2003-01-28 | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
Country Status (5)
Country | Link |
---|---|
US (1) | US20070055489A1 (fr) |
EP (1) | EP1588284A1 (fr) |
CN (1) | CN1745379A (fr) |
FR (1) | FR2850473A1 (fr) |
WO (1) | WO2004079587A1 (fr) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100399335C (zh) * | 2005-11-15 | 2008-07-02 | 李利鹏 | 把源文档转换成目标网页文件的方法 |
CN102388383A (zh) * | 2006-12-08 | 2012-03-21 | 帕特里克·J·霍尔 | 在线计算机辅助翻译 |
US20080243475A1 (en) * | 2007-03-16 | 2008-10-02 | Steven Scott Everhart | Web content translation system, method, and software |
US8515729B2 (en) * | 2008-03-31 | 2013-08-20 | Microsoft Corporation | User translated sites after provisioning |
US10671698B2 (en) | 2009-05-26 | 2020-06-02 | Microsoft Technology Licensing, Llc | Language translation using embeddable component |
US9405745B2 (en) * | 2009-06-01 | 2016-08-02 | Microsoft Technology Licensing, Llc | Language translation using embeddable component |
US8799408B2 (en) * | 2009-08-10 | 2014-08-05 | Sling Media Pvt Ltd | Localization systems and methods |
CN102567384B (zh) * | 2010-12-29 | 2017-02-01 | 上海掌门科技有限公司 | 基于网页浏览器引擎的网页多语言动态切换方法及系统 |
US8843360B1 (en) * | 2011-03-04 | 2014-09-23 | Amazon Technologies, Inc. | Client-side localization of network pages |
US20120253784A1 (en) * | 2011-03-31 | 2012-10-04 | International Business Machines Corporation | Language translation based on nearby devices |
CN103581144A (zh) * | 2012-08-06 | 2014-02-12 | 无锡稳捷网络技术有限公司 | 基于icap协议的网络安全访问控制方法 |
US20140223284A1 (en) * | 2013-02-01 | 2014-08-07 | Brokersavant, Inc. | Machine learning data annotation apparatuses, methods and systems |
US9591052B2 (en) | 2013-02-05 | 2017-03-07 | Apple Inc. | System and method for providing a content distribution network with data quality monitoring and management |
US10402061B2 (en) * | 2014-09-28 | 2019-09-03 | Microsoft Technology Licensing, Llc | Productivity tools for content authoring |
CN106326213A (zh) * | 2015-06-19 | 2017-01-11 | 北京京东尚科信息技术有限公司 | 一种对web站点进行翻译的方法及装置 |
US10223356B1 (en) * | 2016-09-28 | 2019-03-05 | Amazon Technologies, Inc. | Abstraction of syntax in localization through pre-rendering |
US10261995B1 (en) | 2016-09-28 | 2019-04-16 | Amazon Technologies, Inc. | Semantic and natural language processing for content categorization and routing |
US10275459B1 (en) | 2016-09-28 | 2019-04-30 | Amazon Technologies, Inc. | Source language content scoring for localizability |
CN109426530B (zh) * | 2017-08-17 | 2022-04-05 | 阿里巴巴集团控股有限公司 | 页面确定方法、装置、服务器和存储介质 |
CN110232193B (zh) * | 2019-04-28 | 2020-08-28 | 清华大学 | 一种结构化文本翻译方法及装置 |
CN113723119B (zh) * | 2021-08-26 | 2023-07-14 | 腾讯科技(深圳)有限公司 | 页面翻译方法、装置和存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5535120A (en) * | 1990-12-31 | 1996-07-09 | Trans-Link International Corp. | Machine translation and telecommunications system using user ID data to select dictionaries |
US6119078A (en) * | 1996-10-15 | 2000-09-12 | International Business Machines Corporation | Systems, methods and computer program products for automatically translating web pages |
US6208956B1 (en) * | 1996-05-28 | 2001-03-27 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
US6415249B1 (en) * | 2000-03-01 | 2002-07-02 | International Business Machines Corporation | Method and system for using machine translation with content language specification |
US20020123879A1 (en) * | 2001-03-01 | 2002-09-05 | Donald Spector | Translation system & method |
-
2003
- 2003-01-28 FR FR0300915A patent/FR2850473A1/fr active Pending
-
2004
- 2004-01-07 CN CNA200480003075XA patent/CN1745379A/zh active Pending
- 2004-01-07 WO PCT/FR2004/000020 patent/WO2004079587A1/fr not_active Application Discontinuation
- 2004-01-07 EP EP04700468A patent/EP1588284A1/fr not_active Withdrawn
- 2004-01-07 US US10/543,354 patent/US20070055489A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5535120A (en) * | 1990-12-31 | 1996-07-09 | Trans-Link International Corp. | Machine translation and telecommunications system using user ID data to select dictionaries |
US6208956B1 (en) * | 1996-05-28 | 2001-03-27 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
US6119078A (en) * | 1996-10-15 | 2000-09-12 | International Business Machines Corporation | Systems, methods and computer program products for automatically translating web pages |
US6415249B1 (en) * | 2000-03-01 | 2002-07-02 | International Business Machines Corporation | Method and system for using machine translation with content language specification |
US20020123879A1 (en) * | 2001-03-01 | 2002-09-05 | Donald Spector | Translation system & method |
Non-Patent Citations (2)
Title |
---|
"INTERNET CONTENT ADAPTATION PROTOCOL (ICAP)", INTERNATIONAL CONFERENCE ON ANTENNAS AND PROPAGATION, XX, XX, 30 July 2001 (2001-07-30), pages 1 - 13, XP002226584 * |
KIM T ET AL: "FromTo-CLIR: web-based natural language interface for cross-language information retrieval", INFORMATION PROCESSING & MANAGEMENT, ELSEVIER, BARKING, GB, vol. 35, no. 4, July 1999 (1999-07-01), pages 559 - 586, XP004179085, ISSN: 0306-4573 * |
Also Published As
Publication number | Publication date |
---|---|
WO2004079587A1 (fr) | 2004-09-16 |
US20070055489A1 (en) | 2007-03-08 |
EP1588284A1 (fr) | 2005-10-26 |
CN1745379A (zh) | 2006-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR2850473A1 (fr) | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web | |
US9807160B2 (en) | Autonomic content load balancing | |
US20020019849A1 (en) | Information communication system | |
US6505233B1 (en) | Method for communicating information among a group of participants | |
US7249197B1 (en) | System, apparatus and method for personalising web content | |
US7058633B1 (en) | System and method for generalized URL-rewriting | |
FI105249B (fi) | Menetelmä ja järjestely informaation liittämiseksi verkkoresursseihin | |
US6725268B1 (en) | System and method for providing status information from multiple information sources in a single display | |
US9411900B2 (en) | Integrated adaptive URL-shortening functionality | |
US5815663A (en) | Distributed posting system using an indirect reference protocol | |
KR100913687B1 (ko) | 이메일 뉴스레터들과 같은 이메일에서 콘텐트 타겟팅된광고들을 서비스하는 방법 | |
AU2005263962B2 (en) | Improved user interface | |
US9164988B2 (en) | Methods and systems for the dynamic creation of a translated website | |
US20140280623A1 (en) | Auto-reply email system and method with personalized content | |
US20090313318A1 (en) | System and method using interpretation filters for commercial data insertion into mobile computing devices | |
US20090248806A1 (en) | System and method for dynamically changing item status in static email messages | |
US20080071616A1 (en) | System and Method for Ensuring Delivery of Advertising | |
KR101229382B1 (ko) | 전자 통신 디바이스용 전자 메시지 컨텐츠를 처리하기 위한 다중 메시지 및 다중 부분 메시지 방법 및 시스템 | |
WO2001017173A1 (fr) | Systeme de diffusion d'informations parmi un groupe de participants | |
US20020004819A1 (en) | Device and method for data interception and updating | |
US7840645B1 (en) | Methods and apparatus for providing content over a computer network | |
FR2931268A1 (fr) | Dispositif et procede de gestion de la disponibilite de l'acces a des donnees numeriques | |
US20100057484A1 (en) | Systems for generating business cards during domain name registration | |
KR100321926B1 (ko) | 직접 접근 방식을 이용한 정보 및/또는 서비스를 제공하기 위한 컴퓨터 프로그램을 저장한 기록매체 및 시스템 | |
JP2002183002A (ja) | 訂正候補のドメイン名を通知するサーバ装置、およびこのサーバ装置により通知された訂正候補のドメイン名を利用するクライアントコンピュータ、およびこのクライアントコンピュータ上で動作するプログラムを記録した記録媒体、および訂正候補のメールアドレスを通知するメールサーバ |