FR2659461A1 - Dispositif de traduction automatique d'un document. - Google Patents

Dispositif de traduction automatique d'un document. Download PDF

Info

Publication number
FR2659461A1
FR2659461A1 FR9003071A FR9003071A FR2659461A1 FR 2659461 A1 FR2659461 A1 FR 2659461A1 FR 9003071 A FR9003071 A FR 9003071A FR 9003071 A FR9003071 A FR 9003071A FR 2659461 A1 FR2659461 A1 FR 2659461A1
Authority
FR
France
Prior art keywords
translation
computer
document
scanner
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR9003071A
Other languages
English (en)
Inventor
Crasnianski Serge
Gruel Henri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kis France SA
Original Assignee
Kis France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kis France SA filed Critical Kis France SA
Priority to FR9003071A priority Critical patent/FR2659461A1/fr
Publication of FR2659461A1 publication Critical patent/FR2659461A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

Dispositif pour effectuer automatiquement une traduction d'un document, caractérisé en ce qu'il comprend: - un scanneur (5); - une unité centrale de traitement (10) constituée par un ordinateur, reliée au scanneur (5), et dont la mémoire stocke: . d'une part, un logiciel de reconnaissance de caractères; . d'autre part, un logiciel de traduction dans la langue considérée à partir des caractères reconnus et de leur séquencement; - un écran (4) relié à l'unité centrale (10) permettant la visualisation du processus de traduction et les propositions de traduction émises par l'ordinateur (10); - un clavier (3), relié à l'unité centrale (10), pour initialiser le processus de traduction et valider les propositions de traduction émises par l'ordinateur et affichées à l'écran (4); - une imprimante (11) reliée à l'unité centrale (10) pour restituer la traduction proposée.

Description

DISPOSITIF DE TRADUCTION AUTOMATIOUE D'UN DOCUMENT.
L'invention a pour but de proposer un dispositif apte à permettre la réalisation d'une traduction d'un document, notamment d'un document dactylographié.
A ce jour, on ne connait pas de dispositif permettant d'obtenir une traduction intégrale d'un texte même dactylographié. Il existe certes de petits micro-ordinateurs, intégrant un logiciel de traduction et permettant de restituer de manière immédiate la traduction ponctuelle d'un mot entré par l'utilisateur. Or, dans le cadre de l'échange international sans cesse croissant, il s'avère nécessaire de réaliser une machine susceptible de pouvoir restituer une traduction intégrale d'un document dans un délai raisonnable.
C'est l'objet de la présente invention. Celle-ci propose un dispositif pour effectuer automatiquement la traduction d'un document, caractérisé en ce qu'il comprend
- un scanneur comportant
une plaque transparente sur laquelle on appli
que la feuille du document à traduire
et un chariot mobile en translation présentant
une pluralité de photorécepteurs destinés à
capter les signaux lumineux réfléchis par le
document éclairé au moyen d'une source lumineu
se, et à transformer ces signaux lumineux en
signaux analogiques, puis en signaux numéri
ques ;;
- une unité centrale de traitement constituée par un ordinateur , reliée au scanneur, et dont la mémoire stocke
d'une part, un logiciel de reconnaissance de
caractères à partir des signaux numériques émis
par le scanneur
et d'autre part, un logiciel de traduction dans
la langue considérée à partir des caractères
reconnus et de leur séquencement
- un écran relié à l'unité centrale, permettant la visualisation du processus de traduction et les propositions de traduction réalisées par l'ordinateur
- un clavier, relié à l'unité centrale, afin d'initialiser le processus de traduction et de valider les propositions de traduction émises par l'ordinateur et affichées sur l'écran
- une imprimante, reliée à l'unité centrale, afin de restituer la traduction proposée.
En d'autres termes, l'invention consiste essentiellement à associer dans le cadre d'une architecture particulière, un logiciel de reconnaissance de caractères et un logiciel de traduction, en vue de permettre à partir d'un texte donné, la restitution intégrale du texte dans la langue choisie.
Avantageusement, en pratique
- le déplacement en translation du chariot du scanneur est commandé par un moteur pas à pas ; le pas choisi peut soit être fonction de l'interligne reconnu du texte dactylographié à traduire, soit un pas préalablement établi lors de la mise en place du logiciel de reconnaissance de caractères, ce dernier étant alors capable de restituer la continuité du document d'un balayage linéaire au suivant
- l'ordinateur est apte à reconnaître les formes de présentation du texte à traduire, et à éliminer les caractères non graphiques
- le dispositif comprend en outre un organe de prépaiement relié au moyen d'un interface à l'unité centrale
- cet organe de pré-paiement est un monnayeur ou un lecteur de cartes, voire de billets de banque.
La manière dont l'invention peut être réalisée et les avantages qui en découlent ressortiront mieux de l'exemple de réalisation qui suit, donné à titre indicatif et non limitatif, à l'appui des fiugres annexées.
La figure 1 est un schéma synoptique simplifié de la structure du dispositif conforme à l'invention.
La figure 2 est une vue schématique en perspective d'une forme de réalisation du dispositif conforme à l'invention.
Selon l'invention, le dispositif apte à réaliser une traduction intégrale d'un document, comprend essentiellement un bâti (1) recevant une console (2), sur lequel sont agencés les différents éléments nécessaires au contrôle et à l'obtention de la traduction. Associé à cette console, on ménage un scanneur (5) comportant une vitre transparente horizontale sur laquelle on applique la face du document à traduire. De manière connue, on rabat un couvercle (6) sur cette vitre (5), système que l'on rencontre couramment dans les photocopieurs. Ce scanneur (5) comporte une source lumineuse située sous la vitre (5), et destinée à éclairer la face du document à traduire. Il comprend en outre une barrette de photodiodes destinée à se déplacer en translation afin de balayer toute la face dudit document.Les photodiodes sont destinées à capter les signaux lumineux réfléchis par la face éclairée et à transformer ainsi ces signaux lumineux en signaux analogiques. Dans une forme de réalisation avan tageuse, ces signaux analogiques sont transformés en signaux numériques ou en niveaux de gris (pixels). De la sorte, on obtient une cartographie numérisée correspondant et représentative de la face imprimée du document à traduire. La résolution typique de ce scanneur est voisine de douze points par millimètre.
Cette cartographie numérisée est alors transmise et stockée dans la mémoire d'une unité centrale comportant fondamentalement un ordinateur (10). Ce dernier stocke en mémoire tout d'abord un logiciel apte à reconnaître les caractères graphiques à partir de la cartographie numérisée transmise par le scanneur (5). Pour ce faire, ce logiciel procède tout d'abord à l'analyse de la page, et notamment à la reconnaissance du format. Il sélectionne alors parmi l'ensemble des différentes zones du documents, les zones de texte qui seules seront analysées.
Les éléments continus de ces zones sont alors détectés en vue de pouvoir être reconnu comme caractère lors de la procédure d'analyse.
Cette analyse de caractères commence tout d'abord par le calcul des alignements, et des paramètres propres à chaque document, tels que l'espacement et l'interligne.
La reconnaissance proprement dite des caractères s'effectue par le biais d'un modèle mathématique, utilisant des concepts de reconnaissance topologique de formes
A la fin de l'opération, les différents mots non reconnus sont affichés sur un écran (4), décrit ultérieurement, afin que l'utilisateur précise les les caractères mal ou non-reconnus.
On obtient ainsi un fichier-résultat renfermant l'ensemble des mots reconnus du document dactylographié de base, fichier qui va servir de base au logiciel de traduction, également stocké dans la mémoire de l'unité centrale (10). Fondamentalement, ce logiciel est destiné à traduire les mots, séquences de mots ou phrases reconnus par le logiciel de reconnaissance de caractères.
Le logiciel de traduction effectue préalablement une analyse grammaticale des phrases mises en mémoire dans le fichier-résultat. Il reconnait en outre la forme des phrases, à savoir affirmative, négative, interrogative, dont il connait la forme correspondante dans la langue dans laquelle le document de base doit être traduit.
Le logiciel intègre notamment deux dictionnaires, à savoir
- un dictionnaire d'expressions courantes, constituées d'une suite de mots formant un tout "logique", intraduisibles mot à mot ;
- un dictionnaire de mots unitaires, de capacité variable, mais au moins égale à 50 000 mots avec toutes leurs formes dérivées.
Ces deux dictionnaires sont suscpetibles d'être enrichis par l'utilisateur. De manière avantageuse, ce dernier peut opter préalablement au travail de ce logiciel, pour un domaine particulier, selectionnant alors le dictionnaire correspondant.
Pour le cas des mots inconnus par le logiciel, un échange interactif s'établit entre celui-ci et l'utilisateur, qui, dans la mesure de ses connaissances, doit fournir la traduction des mots manquants, et ainsi enrichir les dictionnaires.
Cette interactivité est rendue possible par l'utilisation d'un clavier (3) et d'un écran (4), disposés sur la console (2), et reliés à l'ordinateur. Le clavier est destiné tout d'abord à initialiser le processus de traduction et à valider les propositions de traduction présentées par l'ordinateur (10) et matérialisées sur l'écran de visualisation (4). De fait, pour chaque phrase ou séquence de mots, l'ordinateur (10) propose une ou plusieurs traductions, dont l'une est choisie puis validée par l'utilisateur. En outre, lorsque l'on désire procéder à la traduction d'un texte manuscrit, le clavier peut également servir à introduire ce texte en mémoire dans l'ordinateur (10).
Dans une réalisation du dispositif conforme à l'invention destinée à être proposée au public, on peut munir ce dernier d'un organe de pré-paiement constitué soit d'un monnayeur (7), soit d'un lecteur de cartes bancaires ou de pré-paiement, voire même d'un lecteur de billets bancaires. Cet organe de pré-paiement (7) est relié à l'ordinateur (10) par l'intermédiaire d'un interface (12) apte à permette, de manière connue, la détermination du montant acquitté.
Enfin, afin de restituer la traduction, le dispositif est équipé d'une imprimante (11) reliée à l'ordina- teur (10), typiquement une imprimante à laser. Mais il va de soi que tout autre type d'imprimante est utilisable.
Lorsque l'on désire procéder à la traduction d'un document, on appose la face imprimée du document sur la vitre du scanneur (5), on rabat le couvercle (6) sur la vitre, puis on procède à l'initialisation du processus de traduction. Cette initialisation, commandée par le clavier (3), commence par le balayage du texte à traduire par la barette de photodiodes, puis se poursuit par l'obtention d'une cartographie numérisée transmise à l'ordinateur (10) et stockée dans celui-ci. Ce dernier procède alors aux propositions de traduction affichées sur l'écran (4), puis validées par l'utilisateur.
L'impression de la traduction peut s'effectuer ligne par ligne ou phrase par phrase, voire même en une seule étape, les différents choix validés de l'utilisateur ayant été alors stockés dans une autre mémoire de l'ordinateur (10).
Ce dispositif permet ainsi de réaliser un gain de temps appréciable, en fournissant dans un délai raisonnable une traduction d'un texte dactylographié dans la langue désirée. Pour cela, il suffit de préselectionner au départ le logiciel de traduction correspondant, et avantageusement le domaine technique, juridique, etc. le plus approprié.

Claims (6)

REVENDICATIONS
1/ Dispositif pour effectuer automatiquement une traduction d'un document, caractérisé en ce qu'il comprend
- un scanneur (5) comportant
une plaque transparente sur laquelle on appli
que la face du document à traduire ;
et un chariot mobile en translation présentant
une pluralité de photorécepteurs destinés à
capter les signaux lumineux réfléchis par le
document éclairé par une source lumineuse
interne, et à transformer ces signaux lumineux
en signaux analogiques, puis en signaux numéri
ques
- une unité centrale de traitement (10) constituée par un ordinateur, reliée au scanneur (5), et dont la mémoire stocke
d'une part, un logiciel de reconnaissance de
caractères à partir des signaux numériques émis
par le scanneur (5) ;;
d'autre part, un logiciel de traduction dans la
langue considérée à partir des caractères re
connus et de leur séquencement ;
- un écran (4) relié à l'unité centrale (10) permettant la visualisation du processus de traduction et les propositions de traduction émises par l'ordinateur (10)
- un clavier (3), relié à l'unité centrale (10), pour initialiser le processus de traduction et valider les propositions de traduction émises par l'ordinateur et affichées à l'écran (4)
- une imprimante (11) reliée à l'unité centrale (10) pour restituer la traduction proposée.
2/ Dispositif selon la revendication 1, caractérisé en ce que le déplacement en translation du chariot du scanneur (5) est commandé par un moteur pas à pas.
3/ Dispositif selon l'une des revendications 1 et 2, caractérisé en ce que l'ordinateur est apte à reconnaître les formes de présentation du texte à traduire et à éliminer les caractères non graphiques.
4/ Dispositif selon l'une des revendications 1 à 3, caractérisé en ce qu'il comprend également un organe de pré-paiement (7) relié à l'unité centrale (10) au moyen d'un interface (12), apte à convertir les signaux émis par ledit organe (7) en signaux compatibles pour l'ordi- nateur (10).
5/ Dispositif selon la revendication 4, caractérisé en ce que l'organe de pré-paiement (7) est un monnayeur.
6/ Dispositif selon la revendication 4, caractérisé en ce que l'organe de pré-paiement (7) est un lecteur de cartes ou de billets bancaires.
FR9003071A 1990-03-06 1990-03-06 Dispositif de traduction automatique d'un document. Withdrawn FR2659461A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9003071A FR2659461A1 (fr) 1990-03-06 1990-03-06 Dispositif de traduction automatique d'un document.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9003071A FR2659461A1 (fr) 1990-03-06 1990-03-06 Dispositif de traduction automatique d'un document.

Publications (1)

Publication Number Publication Date
FR2659461A1 true FR2659461A1 (fr) 1991-09-13

Family

ID=9394599

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9003071A Withdrawn FR2659461A1 (fr) 1990-03-06 1990-03-06 Dispositif de traduction automatique d'un document.

Country Status (1)

Country Link
FR (1) FR2659461A1 (fr)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0762189A1 (fr) * 1995-08-24 1997-03-12 Noritsu Koki Co., Ltd. Appareil de tirage photographique
EP0774729A2 (fr) * 1995-11-15 1997-05-21 Hitachi, Ltd. Système de reconnaissance de caractères et de traduction et système de reconnaissance de voix et de traduction
WO1999045476A1 (fr) * 1998-03-03 1999-09-10 D'agostini Organizzazione S.R.L. Systeme de traduction et ordinateur multifonction destines en particulier au traitement de texte et a la traduction sur support papier

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5587160A (en) * 1978-12-23 1980-07-01 Ricoh Co Ltd Automatic vending apparatus of copying
JPS59206985A (ja) * 1983-05-11 1984-11-22 Hitachi Ltd 機械翻訳方式
EP0272158A2 (fr) * 1986-12-19 1988-06-22 Oki Electric Industry Company, Limited Dictionnaire électronique

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5587160A (en) * 1978-12-23 1980-07-01 Ricoh Co Ltd Automatic vending apparatus of copying
JPS59206985A (ja) * 1983-05-11 1984-11-22 Hitachi Ltd 機械翻訳方式
EP0272158A2 (fr) * 1986-12-19 1988-06-22 Oki Electric Industry Company, Limited Dictionnaire électronique

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IEEE PROCEEDINGS OF THE CONFERENCE OF COMPUTER VISION AND PATTERN RECOGNITION, Washington, 19-23 juin 1983, pages 291-296; HIROSHI MAKINO: "Representation and segmentation of document images" *
PATENT ABSTRACTS OF JAPAN, vol. 4, no. 134 (P-28)[616], 19 septembre 1980; & JP-A-55 87 160 (RICOH K.K.) *
PATENT ABSTRACTS OF JAPAN, vol. 9, no. 76 (P-346)[1799], 5 avril 1985; & JP-A-59 206 985 (HITACHI) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0762189A1 (fr) * 1995-08-24 1997-03-12 Noritsu Koki Co., Ltd. Appareil de tirage photographique
US6047891A (en) * 1995-08-24 2000-04-11 Noritsu Koki Co., Ltd. Photographic printing apparatus
EP0774729A2 (fr) * 1995-11-15 1997-05-21 Hitachi, Ltd. Système de reconnaissance de caractères et de traduction et système de reconnaissance de voix et de traduction
EP0774729A3 (fr) * 1995-11-15 1998-09-09 Hitachi, Ltd. Système de reconnaissance de caractères et de traduction et système de reconnaissance de voix et de traduction
SG81210A1 (en) * 1995-11-15 2001-06-19 Hitachi Ltd Character recognizing and translating system and voice recognizing and translating system
WO1999045476A1 (fr) * 1998-03-03 1999-09-10 D'agostini Organizzazione S.R.L. Systeme de traduction et ordinateur multifonction destines en particulier au traitement de texte et a la traduction sur support papier

Similar Documents

Publication Publication Date Title
KR920005854B1 (ko) 전자 사서
FR2696025A1 (fr) Terminal de jeux.
WO1988002586A1 (fr) Procede et dispositif portatif pour saisir, memoriser et eventuellement traiter et reproduire des signes graphiques figurant sur un support quelconque
FR2659461A1 (fr) Dispositif de traduction automatique d'un document.
FR2695500A1 (fr) Dispositif d'analyse de supports d'informations, notamment de bulletins de jeu.
EP2425375B1 (fr) Dispositif d'identification d'une personne par son empreinte
Foucault Le Mallarmé de J.-P. Richard
WO2001061624A1 (fr) Systeme et procede de commande dans un environnement informatique
FR2807560A1 (fr) Procede et appareil d'edition d'images representatives d'idees
FR2724801A1 (fr) Installation automatique pour la realisation de documents personnalises
US20030112476A1 (en) Business card scanner
CN214376517U (zh) 一种基于ocr的文字识别仪
FR2783946A1 (fr) Dispositif de transformation d'images permettant d'obtenir des caricatures
FR2555065A1 (fr) Ordinateur pour la compilation automatique de systemes reduits pour jeux de pronostic
CH661428A5 (en) Method for identifying a person from the geometry of his hand
Tjahja et al. Recursive text segmentation for Indonesian Automated Document Reader for people with visual impairment
FR2579345A1 (fr) Dispositif de traitement de cheques bancaires pour leur remise a l'encaissement
FR2829845A1 (fr) Procede pour la visualisation d'un document sur un equipement portatif
FR2882848A1 (fr) Dispositif permettant aux personnes sourdes et malentendantes de communiquer avec le monde exterieur et inversement
Su et al. A review of the Versatile Image Processor for persons with low vision
FR2814562A1 (fr) Procede pour afficher un document numerique, dispositif electronique, logiciel, publication numerique, support de donneees et procede de telechargement
Audureau Grammaire Formelle, Grammaire Générative et Grammaire
Puech The Essenes According to Classical Sources (Oxford Centre Textbooks 1)
FR3063170A1 (fr) Dispositif d'enregistrement d'informations a partir d'une capture d'une image d'un document
Fasseur Reading the world. Encyclopedic Writing in the Scholastic Age

Legal Events

Date Code Title Description
ST Notification of lapse