FR2716734A1 - Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues. - Google Patents

Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues. Download PDF

Info

Publication number
FR2716734A1
FR2716734A1 FR9402157A FR9402157A FR2716734A1 FR 2716734 A1 FR2716734 A1 FR 2716734A1 FR 9402157 A FR9402157 A FR 9402157A FR 9402157 A FR9402157 A FR 9402157A FR 2716734 A1 FR2716734 A1 FR 2716734A1
Authority
FR
France
Prior art keywords
translation
document
database
language
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9402157A
Other languages
English (en)
Other versions
FR2716734B1 (fr
Inventor
Seite Bernard
Winkler Fernand
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SONOVISION ITEP TECHNOLOGIES
Original Assignee
SONOVISION ITEP TECHNOLOGIES
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SONOVISION ITEP TECHNOLOGIES filed Critical SONOVISION ITEP TECHNOLOGIES
Priority to FR9402157A priority Critical patent/FR2716734B1/fr
Publication of FR2716734A1 publication Critical patent/FR2716734A1/fr
Application granted granted Critical
Publication of FR2716734B1 publication Critical patent/FR2716734B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

L'invention concerne une méthode pour structurer un système de production de documents en plusieurs langues de façon à utiliser des systèmes (traitements de textes (3), publication assistée par ordinateur (3), gestion de bases de données (5), système d'exploitation (1) avec interface graphique) déjà présents dans un environnement informatique classique en bureautique. Un dispositif (9), conçu selon cette méthode, simplement ajouté à cet environnement standard (1, 3, 5) le transforme en un système de traduction assistée par ordinateur performant. Le système est ouvert et peut échanger des données avec d'autres systèmes identiques ou similaires grâce à des formats basés sur SGML. La méthode et le dispositif selon l'invention sont particulièrement destinés à satisfaire des utilisateurs devant faire face à de gros volumes de traduction.

Description

METHODE ET DISPOSITIF D'OPTIMISATION D'UN SYSTEME DE
PRODUCTION DE DOCUMENTS EN PLUSIEURS LANGUES
La présente invention a pour objet une méthode et un dispositif d'optimisation d'un système de production de documents en plusieurs langues.
La nécessité de la mise au point de systèmes de production de documents en plusieurs langues performants est apparue avec le développement des marchés internationaux. Pour conquérir des marchés à l'export, il est nécessaire de produire de façon optimale des documentations techniques et commerciales dans les langues locales. Du fait de l'interpénétration croissante des marchés internationaux, ces informations stratégiques doivent être produites en minimisant les coûts et les délais, tout en optimisant la qualité. Tous les experts s'accordent à penser que la seule solution pour résoudre ce problème est technologique. Il convient de mettre à disposition des opérateurs multilingues un ensemble de produits réellement productifs.
Les technologies développées durant les vingt dernières années n'ont pas su relever ce défi. Seules des solutions partielles ont été apportées:
Le brevet européen EP0189665, délivré le 3 mars 1993 à la firme TOSHIBA, décrit un système de traduction assistée par ordinateur. La machine propose à l'opérateur un choix entre plusieurs possibilités de traduction obtenues par recherche automatique dans un dictionnaire utilisé comme une base de données. Les choix de l'opérateur sont mémorisés dans la base et contribuent à réduire les ambiguïtés des traductions ultérieures. Le système apparaît comme un système dédié à la traduction de l'anglais en japonais. Son dictionnaire est augmenté au cours de l'utilisation autonome du dispositif, mais il n'est pas prévu d'importation de dictionnaires existants ou de coopération avec d'autres systèmes pour archiver de nouvelles possibilités de traductions.
Dans la demande de brevet W09212494, publiée le 23 juillet 1992, dans le cadre du PCT, il est décrit un système de traduction automatique faisant appel à des dictionnaires informatisés pouvant être modifiés par l'utilisateur. Un module de maintenance permet à un opérateur de créer ou de modifier un dictionnaire. Mais ce système, mis en oeuvre par ailleurs dans un dispositif de télécommunication, concerne strictement la problématique de la traduction automatique et n'est pas un système interactif.
Une méthode et un dispositif pour faciliter la traduction des messages, libellés de menus, etc..., d'un logiciel interactif est décrit dans la demande de brevet européen
EP0514305 par la société IBM, publiée le 19 novembre 1992. Le dispositif effectue une simulation de l'interface présentée à l'utilisateur par un logiciel tel que traitement de textes, tableur, ou éditeur graphique, et permet à un opérateur de traduire les affichages textuels et de juger in situ du résultat. Ce dispositif optimise ce type de traduction, mais répond seulement à des besoins précis et limités.
Un système de production de documents en plusieurs langues est décrit dans l'article de M. KRUGLER et ali, présenté à la conférence "MACHINE TRANSLATION SUMMIT III", qui s'est tenue le 4 juillet 1991 à Washington DC (USA). Il s'agit d'une station de travail pour traducteur adaptée au traitement et à la traduction de textes en plusieurs langues. Le système réunit un ensemble de composantes optimisées pour la tâche du traducteur professionnel. Malheureusement cela est encore insatisfaisant pour des opérateurs non spécialisés, car ceux-ci n'ont-généralement l'habitude que de leurs propres systèmes de traitement de textes, par exemple, standards et peuvent répugner à en changer.
Il ressort donc de l'état de technique tel que décrit dans les documents cités ci-dessus que tous les inconvénients liés à l'utilisation des systèmes de production de documents en plusieurs langues sont connus, mais qu'il n'existe aucune méthode ou dispositif connus pour les éviter tous simultanément.
La présente invention vise à pallier tous les inconvénients des systèmes de production de documents en plusieurs langues connus de l'état de la technique antérieur.
Elle a précisément pour objet une méthode d'optimisation d'un système de production de documents en plusieurs langues.
Le système auquel s'applique ladite méthode comportera généralement au moins un ordinateur avec au moins une unité de traitement de l'information, au moins une mémoire d'exécution de programmes et au moins un système d'exploitation. Pour dialoguer avec au moins un opérateur, il comportera également au moins un moyen d'entrer des commandes ainsi qu'au au moins un dispositif d'affichage. Pour produire des documents en plusieurs langues le système disposera au moins d'un moyen de saisir au moins un premier document dans au moins une première langue et au moins un moyen de l'éditer dans au moins une deuxième langue.
Ladite méthode concerne plus précisément un système, permettant à un traducteur, qui souhaite produire un document dans une langue différente de l'original, d'être aidé dans sa tâche par au moins un programme paramétrable pour traduire les documents d'une langue dans une autre. Ledit programme paramétrable s'appuiera sur au moins un dictionnaire bilingue et au moins une mémoire de traduction constituée par au moins les parties du document déjà traduites.
La méthode selon l'invention consiste à structurer un système de production de documents en plusieurs langues, tel que décrit ci-dessus, en quatre composantes matérielles et logicielles distinctes interagissant entre elles au travers d'interfaces de programmes d'application (API) standardisées, selon: - une première composante constituée par au moins un système d'exploitation présentant une première interface de programmes d'application (API) standardisée.
- une seconde composante constituée par un système de traitement de textes ou de publication assistée par ordinateur (PAO) présentant une deuxième interface de programmes d'application (API) standardisée - une troisième composante constituée par au moins un système de gestion de base de données comportant:
- une troisième interface de programmes d'application
standardisée (API)
- au moins une base de données terminologique constituée
par au moins un dictionnaire bilingue
- au moins une base de données de traduction constituée
au moins une mémoire de traduction - une quatrième composante comprenant un moteur de traduction automatique en interaction avec les autres composantes de façon que ces première, deuxième et troisième composantes soient des éléments pré-existants dans le système de production de documents en plusieurs langues et que la quatrième composante soit un élément distinct supplémentaire qu'il suffit d'ajouter aux autres composantes du système sans autres modifications pour réaliser un système de traduction assistée par ordinateur.
La méthode d'optimisation est également caractérisée en ce que la quatrième composante est conçue pour effectuer de façon optimale une traduction d'un document en deux phases: - une première phase consistant à utiliser la base de données terminologiques et la base de données de traduction pour produire un document pré-traduit - une seconde phase consistant en la modification du document pré-traduit par le traducteur ou en l'insertion d'autres information pré-traduites en utilisant les bases de données terminologiques et de traduction.
Dans le document pré-traduit sont identifiés, préférentiellement coloriés: - les phrases déjà traduites - les phrases presque traduites (à quelques mots près) - les termes techniques connus.
- les propositions du moteur de traduction automatique
La quatrième composante permet également une mise à jour des bases de données terminologiques et de traduction avec les résultats de traduction obtenus par analyse du document traduit.
Enfin, il est rendu possible à un opérateur d'importer, d'exporter et de modifier les données des bases de données terminologique et de traduction indépendamment des résultats de traduction.
Un autre aspect de l'invention est un dispositif adapté à la mise en oeuvre de la méthode décrite ci-dessus.
Ce dispositif permet d'optimiser un système de production de documents en plusieurs langues comportant: - au moins un ordinateur comprenant:
- au moins une unité de traitement de l'information
- au moins une mémoire d'exécution de programmes
- au moins un moyen d'entrer des commandes et des données
pour au moins un opérateur
- au moins un moyen de saisir au moins un premier document
dans au moins une première langue
- au moins un moyen d'éditer au moins premier document
dans au moins une deuxième langue
- au moins un dispositif d'affichage
- au moins un système d'exploitation présentant une
première interface de programme d'application (API)
standardisée - au moins un programme d'application de type "traitement de texte" ou de type "publication assistée par ordinateur" (PAO) comportant une seconde interface de programmes d'application standardisée - au moins un système de gestion de base de données comportant une troisième interface de programmes d'application standardisée (API).
Le dispositif se distingue de l'état de la technique en ce qu'il: - reçoit et resp. transmet au travers de la première interface de programmes d'application des commandes et des données de et resp. vers le système d'exploitation - reçoit et resp. transmet au travers de la seconde interface de programmes d'application des commandes et des données de et resp. vers le programme d'application de type "traitement de texte" ou de type "publication assistée par ordinateur" - génère et utilise au travers de la troisième interface de programmes d'application du système de gestion de base de données:
- au moins une base de données terminologique constituée
par un au moins un dictionnaire bilingue
- au moins une base de données de traduction constituée
par les premiers documents déjà traduits dans au moins &
deuxième langue.
de façon à réaliser sans autres modifications un système de traduction assistée par ordinateur.
Afin de mettre efficacement en oeuvre la méthode selon l'invention, le dispositif comporte un moteur de recherche floue pour accéder à la base de données de traduction, permettant de calculer un indice de similarité entre une phrase à traduire du document et une phrase déjà traduite figurant dans la base.
Le dispositif permet également à un opérateur de sélectionner les attributs du modèle de données de la base de données terminologiques de façon à l'adapter à différentes langues et de modifier les valeurs des attributs à l'intérieur d'un domaine fixé.
La clé de l'efficacité optimale du dispositif réside dans ses moyens d'importation et resp. d'exportation: - des documents dans un format générique, préférentiellement
ELDIF, permettant l'interconnexion avec n'importe quel programme de type "traitement de texte" ou PAO - des données de traduction dans un format spécifique de et resp. vers ladite base de données de traduction, préférentiellement basé sur SDF ou SGML - des données terminologiques dans un format spécifique de et resp. vers ladite base de données terminologique, préférentiellement basé sur SDF.
Enfin le dispositif peut être mis en oeuvre sur un ordinateur connectée en mode client à un réseau de plusieurs ordinateurs comportant au moins un ordinateur connecté en mode serveur sur lequel sont chargées les bases de données terminologiques et de traduction.
Les caractéristiques précédentes de la méthode et du dispositif adapté à sa mise en oeuvre assurent au système de production de documents en plusieurs langues qui les utilise des avantages inconnus de l'état de la technique: - le système demeure un système standard. En particulier le système de traitement de texte ou l'outil de PAO utilisé n'a pas à être modifié: les fonctions spécifiques du dispositif pour l'insertion ou la modification des informations prétraduites sont semblables (barres d'outils, raccourcis clavier, ...). L'utilisateur a donc peu de nouvelles fonctions à apprendre. Il travaille avec la même efficacité et n'est pas pénalisé par la préparation, la conversion, le formatage ou le reformatage des données imposés par les systèmes connus.
- le système devient de plus en plus performant au fil du temps. En effet, la mise en mémoire automatique des phrases et des termes techniques durant la traduction des documents renforce la capacité de détection des mémoires, réduisant sans cesse le volume à traduire. Le volume de traduction d'une documentation technique ou commerciale, ayant pour caractéristique d'être répétitive et consistante, est réduit de 30% en moyenne.
- le système est modulaire. Le partage des tâches est aisée et il est alors possible de faire face à des situations d'urgence avec succès car les échanges d'information sont réalisés selon des formats standardisés. Ainsi:
- des sociétés spécialisées peuvent fournir des bases de
données terminologiques.
- il est possible de se connecter à des bases existantes
ou de récupérer des glossaires d'autres systèmes
- des mémoires de traductions volumineuses peuvent être
gérées sur des serveurs dédiés. Ces mémoires accessibles
à un grand nombre d'utilisateurs, et aussi alimentées par
eux, peuvent permettre de dépasser les 30% de réduction
des volumes à traduire (42% constatés sur une
documentation logicielle).
- le système est rapide car les formats des données ont été optimisés en vue des affichages sur écran et des transferts sur réseau.
Ces caractéristiques techniques se traduisent sur le plan commercial par une réduction des coûts de traduction des documentations techniques (par exemple, des manuels livrés avec les logiciels), l'amélioration de la qualité et la diminution des délais de mise sur le marché des produits. La diminution des délais entre la date de commercialisation de la version originale d'un logiciel (généralement en anglais aux USA) et la date de distribution dans les autres pays, accompagné d'une documentation dans la langue nationale de bonne qualité, peut être un facteur décisif pour le succès commercial de ce logiciel.
L'invention sera mieux comprise à l'aide de la description qui suit en référence aux dessins schématiques annexés, représentant une forme d'exécution préférée mais non limitative d'un dispositif adapté à la mise en oeuvre de la méthode selon l'invention et de son utilisation.
La Figure 1 présente le concept global du dispositif adapté à la mise en oeuvre de la méthode selon l'invention.
La Figure 2 montre le principe général du dispositif d'optimisation de la production de documents en plusieurs langues selon l'invention.
La Figure 3 montre les fonctionnalités détaillées du dispositif d'optimisation de la production de documents en plusieurs langues selon l'invention.
La Figure 4 montre la structure détaillée du format d'échange de documents du dispositif d'optimisation de la production de documents en plusieurs langues selon l'invention.
Les références à la Figure 1 serviront à expliquer comment s'articulent les différentes composantes de l'invention.
Pour la simplicité des explications, on s'attachera tout d'abord à la description de la méthode et du dispositif d'optimisation d'un système de production de documents en plusieurs langues utilisé par un seul opérateur.
La Figure 1 représente de façon extrêmement schématique 1' environnement informatique d'un utilisateur.
Tous les systèmes d'ordinateur comporte un système d'exploitation (1). Certains sont de grande diffusion et connus par un grand nombre d'utilisateurs. Dans le monde de l'informatique personnelle ce peut être des environnements connus sous les noms de WINDOWSX ou WINDOWS NIT . Dans le monde des stations de travail, ce pourra-t-être UNIX.
Ce système interagit avec les programmes d'application par une interface de programmes d'application (API) standard (2).
Le système comporte également un logiciel (3) de traitement de textes ou de publication assistée par ordinateur (PAO) très largement connu tel que woRDD, INTERLEAFX ou FRAMEMAKEROR. Ces logiciels communiquent aussi au travers d'une
API (4) standardisée.
Un logiciel (5) de gestion de bases de données (SGBD) couramment utilisé en bureautique pour archiver des données de nature très diverse et les retrouver facilement fait généralement partie de cet environnement. On peut citer
ORACLES, SQL SERVERX, SYBASEX ou EUROLANG. Ce logiciel présente une API (6).
La base de données peut déjà contenir un dictionnaire bilingue (7) ou des documents déjà traduits ou partiellement traduits (8).
Alors que l'homme de l'art conçoit un système de production de documents en plusieurs langues comme un système dédié à cette tâche, la méthode inventive objet de la présente demande consiste à structurer le système de façon à en identifier la plupart des éléments à des éléments présents dans un environnement informatique classique en bureautique.
Il suffit alors d'insérer entre les composantes déjà mises en oeuvre (1,3,5) une composante additionnelle et distincte (9) pour obtenir un système de traduction assistée par ordinateur, comme il va maintenant être expliqué ci-après en relation avec la Figure 2.
La composante additionnelle (9) va utiliser un moteur de traduction automatique (10) pour générer, à partir d'un document (11), un document pré-traduit (12). En fait, le module (9) va d'abord faire appel au dictionnaire bilingue (7), appelé aussi base de données terminologique, ainsi qu'à la base de documents traduits ou en partie traduits (8), appelée aussi base de données de traduction ou mémoire de traduction, pour afficher sur l'écran de l'opérateur les phrases déjà traduites (13), les phrases presque traduites (à quelques mots près) (14) et les termes techniques connus (15). Le moteur (10) de traduction automatique (TAO) ne sera utilisé que pour afficher des propositions de traduction de termes ou de phrases (16).
Le fonctionnement du dispositif sera quant à lui plus facilement compris en se reportant à la Figure 3.
Quatre tâches principales sont exécutées par le dispositif: - une tâche de pré-traduction (17)
Il s'agit quasiment d'un traitement par lot. Dans une phase préparatoire, toute information nécessaire pour préparer et simplifier le travail du traducteur est rassemblée. Par définition le document source (11) n'est pas modifiable. Il est donc utilisé pour extraire des bases de données (7,8) toutes les données pertinentes pour la traduction, c'est-à-dire:
- les termes correspondant de la base terminologique (7)
- les phrases correspondant de la mémoire de
traduction (8) (correspondance parfaite)
- les phrases correspondant en partie de la mémoire de
traduction (8) ( correspondance floue)
- des indications sur certains termes ou portions de texte
à ne pas traduire
Ces données sont assemblées avec une copie du document source (11) selon un format générique d'échange de documents qui sera décrit en liaison avec la Figure 4.
- une tâche de traduction (18)
Les données assemblées à l'issue de la tâche précédente servent de ressource locale pour l'éditeur de texte (3) au travers de l'API (4). Pour son travail interactif, le traducteur dispose (dans un environnement comportant une interface utilisateur graphique de type WINDOWS):
- une fenêtre dite "fenêtre principale" affichant le
document pré-traduit (12)
- une fenêtre dite "fenêtre de source" affichant les
paragraphes inaltérés du document source (11)
- une fenêtre dite "fenêtre de phrase" par laquelle sont
proposées les correspondances parfaites ou approchées avec
les phrases des paragraphes du document source
- une fenêtre dite "fenêtre de glossaire" donnant la
terminologie à utiliser pour les paragraphes
Pour être utilisable par l'utilisateur, ces ressources doivent être intégrées dans l'environnement du traducteur, par exemple FRAMEMAKER. Dans ce but, le dispositif selon l'invention utilise préférentiellement 1'API de FRAMEMAKER V4.
Pour les autres logiciels de PAO et éditeurs, l'utilisation des fenêtre dépendra des fonctionnalités offertes et de l'API.
- une tâche de post-traduction (19)
Les bases de données terminologiques (7) et la mémoire de traduction (8) sont mises à jour avec les résultats de traduction.
- une tâche de gestion des ressources
I1 s'agit d'assurer la maintenance des bases de données (7,8) à l'aide du SGBD (5): vérification de l'intégrité, nettoyage, import et export de données, mise à jour. Les formats d'échange des données sont basés sur SGML (Standard
Generalized Markup Language) ou SDF (Structured Document
Format).
Le format générique des échanges de documents est représenté sur la Figure 4.
I1 est basé sur le standard SGML (Norme ISO 8879).
Ce format, mis au point, par les inventeurs sous le nom de ELDIF (EuroLangS Document Interchange Format) comporte: - une en-tête (20) - des données au format SGML (21) - des étiquettes indicatrices de répétition (22) - des données constituant un glossaire de termes (23) - des données constituant un glossaire de phases (24) - des pointeurs de termes ou phrases provenant du dictionnaire, de la mémoire de traduction ou de la TAO. (25) - un journal des erreurs (26)
La modularité du dispositif lui permet d'être facilement mis en oeuvre sur des réseaux informatiques et porté sur des architectures client-serveur.
Des bases de données terminologiques (27) peuvent être fournies par des sociétés spécialisées, comme la société
SONOVISION ITEP TECHNOLOGIES. Le format de ces données est basé sur SGML ou SDF. Les données terminologiques peuvent également être exportées dans ces formats.
Comme il va de soi, l'invention ne se limite pas à la seule forme d'exécution du dispositif d'optimisation d'un système de production de documents en plusieurs langues adapté à la mise en oeuvre de la méthode, ni à sa seule application à une configuration monoposte, décrites ci-dessus à titre d'exemple; elle embrasse, au contraire, toutes les variantes de réalisations.

Claims (8)

REVENDICATIONS
1) Méthode d'optimisation d'un système de production de documents en plusieurs langues, ledit système comportant: - au moins un ordinateur comprenant:
- au moins une unité de traitement de l'information
- au moins une mémoire d'exécution de programmes
- au moins un moyen d'entrer des commandes et des données
par au moins un opérateur
- au moins un dispositif d'affichage
- au moins un système d'exploitation
- au moins un moyen de saisir au moins un premier document
dans au moins une première langue
- au moins un moyen d'éditer ledit au moins premier
document dans au moins une deuxième langue - au moins un programme paramétrable permettant de traduire ledit au moins premier document dans ladite au moins seconde langue - au moins deux ensembles de paramètres dudit programme paramétrable comprenant:
-au moins un dictionnaire bilingue
-au moins une mémoire de traduction constituée par au
moins les parties dudit premier document déjà traduites
dans au moins ladite deuxième langue.
caractérisée en ce que ledit système est structuré en quatre composantes matérielles et logicielles distinctes interagissant entre elles au travers d'interfaces de programmes d'application standardisées, selon: - une première (1) desdites composantes constituée par au moins un système d'exploitation présentant une première (2) desdites interfaces de programmes d'application standardisées.
- une seconde (3) desdites composantes constituée par un système de traitement de textes ou de publication assistée par ordinateur (PAO) présentant une deuxième (4) desdites interfaces de programmes d'application standardisées - une troisième (5) desdites composantes constituée par au moins un système de gestion de base de données comportant:
- une troisième (6) desdites interfaces de programmes
d'application standardisée
- au moins une base de données terminologique constituée
par au moins ledit dictionnaire bilingue (7)
- au moins une base de données de traduction constituée
au moins ladite mémoire de traduction (8) - une quatrième (9) desdites composantes comprenant un moteur de traduction automatique (10) en interaction avec lesdites première (1), deuxième (3) et troisième (5) composantes de façon que lesdites première (1), deuxième (3) et troisième (5) composantes soient des éléments pré-existants dans ledit système de production de documents en plusieurs langues et que ladite quatrième (9) composante soit un élément distinct supplémentaire qu'il suffit d'ajouter aux autres dites composantes du système sans autres modifications pour réaliser un système de traduction assistée par ordinateur.
2) Méthode d'optimisation d'un système de production de documents en plusieurs langues selon la revendication 1, caractérisée en ce que ladite quatrième (9) composante permet d'effectuer une traduction dudit au moins premier document (11) dans ladite au moins première langue en ladite au moins seconde langue en deux phases (17,18): - une première (17) desdites phases consistant à utiliser ladite base de données terminologiques (7) et ladite base de données de traduction (8) pour produire un document (12) prétraduit - une seconde (18) desdites phases consistant en la modification dudit document (12) pré-traduit par ledit opérateur ou en l'insertion d'autres information pré-traduites en utilisant lesdites bases (7,8) de données terminologiques et de traduction.
3) Méthode d'optimisation d'un système de production de documents en plusieurs langues selon la revendication 2, caractérisée en que, dans ledit document (12) pré-traduit sont identifiés, préférentiellement coloriés - les phrases déjà traduites (13) - les phrases presque traduites (14) (à quelques mots près) - les termes techniques connus (15) - les propositions du moteur de traduction automatique (16).
4) Méthode d'optimisation d'un système de production de documents en plusieurs langues selon l'une quelconque des revendications 1 à 3 caractérisée en ce qu'on effectue une comparaison entre ledit premier document dans ladite au moins première langue et le document traduit dans ladite deuxième langue et on effectue une mise à jour (19) des dites bases de données terminologiques (7) en fonction de la comparaison.
5) Dispositif d'optimisation d'un système de production de documents en plusieurs langues, adapté à la mise en oeuvre de la méthode selon l'une quelconque des revendications 1 à 5, ledit système comportant - au moins un ordinateur comprenant
- au moins une unité de traitement de l'information
- au moins une mémoire d'exécution de programmes
- au moins un moyen d'entrer des commandes et des
données pour au moins un opérateur
- au moins un moyen de saisir au moins un premier
document dans au moins une première langue
- au moins un moyen d'éditer ledit au moins premier
document dans au moins une deuxième langue
- au moins un dispositif d'affichage
- au moins un système d'exploitation présentant une
première interface de programme d'application standardisée - au moins un programme d'application de type "traitement de texte" ou de type "publication assistée par ordinateur" comportant une seconde interface de programmes d'application standardisée - au moins un système de gestion de base de données comportant une troisième interface de programmes d'application standardisée caractérisé en ce que: - ledit dispositif d'optimisation reçoit et resp. transmet au travers de ladite première (2) interface de programmes d'application des commandes et des données de et resp. vers ledit système d'exploitation (1) - ledit dispositif d'optimisation reçoit et resp. transmet au travers de ladite seconde (4) interface de programmes d'application des commandes et des données de et resp. vers ledit programme (3) d'application de type "traitement de texte" ou de type "publication assistée par ordinateur" - ledit dispositif d'optimisation génère et utilise au travers de ladite troisième (6) interface de programmes d'application dudit système de gestion de base de données (5):
- au moins une base de données terminologique constituée
par un au moins un dictionnaire bilingue (7)
- au moins une base de données de traduction constitue
par lesdits premiers documents déjà traduits dans au moins
ladite deuxième langue (8).
de façon à réaliser sans autres modifications un système de traduction assistée par ordinateur.
6)Dispositif d'optimisation d'un système de production de documents en plusieurs langues selon la revendication 6, caractérisé en ce qu'il comporte un moteur de recherche floue pour accéder à ladite base de données de traduction (7), permettant de calculer un indice de similarité entre une phrase à traduire dudit au moins premier document et une phrase déjà traduite figurant dans ladite base.
7)Dispositif d'optimisation d'un système de production de documents en plusieurs langues selon l'une quelconque des revendications 6 à 7, caractérisé en ce qu'il permet à un opérateur de sélectionner les attributs du modèle de données de ladite base de données terminologiques de façon à l'adapter à différentes langues et de modifier les valeurs desdits attributs à l'intérieur d'un domaine fixé.
)Dispositif d'optimisation d'un système de production de documents en plusieurs langues selon l'une quelconque des revendications 6 à 8, caractérisé en ce qu'il comporte des moyens (6) d'importation et resp. d'exportation: - des documents dans un format générique, préférentiellement
ELDIF (20,21,22,23,24,25,26), permettant l'interconnexion avec n'importe quel programme (3) de type "traitement de texte" ou
PAO - des données de traduction dans un format spécifique de et resp. vers ladite base de données de traduction (8), préférentiellement basé sur SDF ou SGML - des données terminologiques (27) dans un format spécifique de et resp. vers ladite base de données terminologiques (7), préférentiellement basé sur SDF.
9)Dispositif d'optimisation d'un système de production de documents en plusieurs langues selon l'une quelconque des revendications 6 à 9, caractérisé en ce qu'il peut être mis en oeuvre sur un ordinateur connectée en mode client à un réseau de plusieurs ordinateurs comportant au moins un ordinateur connecté en mode serveur sur lequel sont chargées lesdites bases de données terminologiques (7) et de traduction (8).
FR9402157A 1994-02-25 1994-02-25 Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues. Expired - Fee Related FR2716734B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9402157A FR2716734B1 (fr) 1994-02-25 1994-02-25 Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9402157A FR2716734B1 (fr) 1994-02-25 1994-02-25 Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues.

Publications (2)

Publication Number Publication Date
FR2716734A1 true FR2716734A1 (fr) 1995-09-01
FR2716734B1 FR2716734B1 (fr) 1996-05-15

Family

ID=9460419

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9402157A Expired - Fee Related FR2716734B1 (fr) 1994-02-25 1994-02-25 Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues.

Country Status (1)

Country Link
FR (1) FR2716734B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1288793A1 (fr) * 2001-08-27 2003-03-05 Sony NetServices GmbH Système de gestion de traduction de texte

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0514305A2 (fr) * 1991-04-18 1992-11-19 International Business Machines Corporation Procédé et dispositif pour faciliter la traduction contextuelle de langues au sein d'application de logiciel interactif
WO1994006086A1 (fr) * 1992-09-04 1994-03-17 Caterpillar Inc. Systeme de traduction et de redaction integre

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0514305A2 (fr) * 1991-04-18 1992-11-19 International Business Machines Corporation Procédé et dispositif pour faciliter la traduction contextuelle de langues au sein d'application de logiciel interactif
WO1994006086A1 (fr) * 1992-09-04 1994-03-17 Caterpillar Inc. Systeme de traduction et de redaction integre

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
L.C. MILLER: "Babelware for the Desktop", BYTE, vol. 18, no. 1, January 1993 (1993-01-01), LONDON, GB, pages 177 - 183, XP000334435 *
N. HOSHINO ET AL: "Translators' Workbench PIVOT/JE, EJ and Online Machine Translation Service", NEC RESEARCH AND DEVELOPMENT, vol. 34, no. 3, July 1993 (1993-07-01), TOKYO JP, pages 372 - 384, XP000403469 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1288793A1 (fr) * 2001-08-27 2003-03-05 Sony NetServices GmbH Système de gestion de traduction de texte

Also Published As

Publication number Publication date
FR2716734B1 (fr) 1996-05-15

Similar Documents

Publication Publication Date Title
US6632251B1 (en) Document producing support system
US7496230B2 (en) System and method for automatic natural language translation of embedded text regions in images during information transfer
US6278969B1 (en) Method and system for improving machine translation accuracy using translation memory
Hutchins The development and use of machine translation systems and computer-based translation tools
EP2811414A2 (fr) Réécriture motivée par la confiance de textes sources pour traduction améliorée
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
JP3266586B2 (ja) データ分析システム
FR2809509A1 (fr) Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique
Derwojedowa et al. Words, concepts and relations in the construction of Polish WordNet
JP4304268B2 (ja) 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム
US7712088B2 (en) Method and system for a batch parser
JP2010521758A (ja) 自動翻訳方法
FR2716734A1 (fr) Méthode et dispositif d'optimisation d'un système de production de documents en plusieurs langues.
CA2297905C (fr) Methode et systeme de traduction interlingual
FR2827686A1 (fr) Utilisation d'hyperliens dans un programme d'une application d'automatisme et station de programmation d'une telle application
Simard et al. TransSearch: A bilingual concordance tool
JP2546245B2 (ja) 自然言語文生成方法
Šostaka et al. The Semi-Algorithmic Approach to Formation of Latvian Information and Communication Technology Terms.
KR100836159B1 (ko) 반자동 번역 서비스 제공 시스템 및 방법
Schneider User driven development: metal as an integrated multilingual system
US20240143948A1 (en) User interface for collaborative computer-aided language translation platform
EP1811373A1 (fr) Procédé de composition automatique de services web, produit de programme d'ordinateur et système informatique de mise en oeuvre de ce procédé
Aluthman Technology-Based Platforms in the Translation Workflow: An Investigation of the Use of CAT Tools among Saudi Professional Translators
Kuang Practical Research on Computer Aided Translation
Meeus et al. OCCAM: cross-lingual unlocking of non-digital texts

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20061031