ITUD20090133A1 - "metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor" - Google Patents

"metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor" Download PDF

Info

Publication number
ITUD20090133A1
ITUD20090133A1 IT000133A ITUD20090133A ITUD20090133A1 IT UD20090133 A1 ITUD20090133 A1 IT UD20090133A1 IT 000133 A IT000133 A IT 000133A IT UD20090133 A ITUD20090133 A IT UD20090133A IT UD20090133 A1 ITUD20090133 A1 IT UD20090133A1
Authority
IT
Italy
Prior art keywords
translation
destination
text
source
column
Prior art date
Application number
IT000133A
Other languages
English (en)
Inventor
Agostini Giovanni D
Original Assignee
Agostini Organizzazione Srl D
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agostini Organizzazione Srl D filed Critical Agostini Organizzazione Srl D
Priority to ITUD2009A000133A priority Critical patent/IT1394813B1/it
Priority to PCT/EP2009/007790 priority patent/WO2011006524A1/en
Priority to EP09751792A priority patent/EP2454687A1/en
Publication of ITUD20090133A1 publication Critical patent/ITUD20090133A1/it
Application granted granted Critical
Publication of IT1394813B1 publication Critical patent/IT1394813B1/it

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Description

METODO DI TRADUZIONE E POSTCORREZIONE AL COMPUTER E RISPETTIVA MACCHINA TRADUTTRICE CON POST-EDITOR
DESCRIZIONE
La presente invenzione si riferisce ad un metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor.
Un sistema di traduzione comprendente tali metodo e macchina traduttrice à ̈ pure oggetto della presente invenzione.
Definizioni
In questa descrizione e nelle rivendicazioni le seguenti definizioni significano:
MT = macchina traduttrice o macchina di traduzione, cioà ̈ uno strumento, dispositivo o macchina operativi comprendente almeno un monitor ed un computer dotato di mezzi per realizzare almeno una traduzione automatica mediante sistemi interni o mediante sistemi esterni come ad esempio mediante connessione internet o entrambi. Il sistema operativo essendo preferibilmente in grado di lavorare in multitasking con più di un processore o processore/i multi-core.
Traduttore o unità di traduzione: si intende un motore di traduzione computerizzata applicato ad un sistema operativo di un computer. Un computer può avere più di un traduttore.
Motore di traduzione: si intende un insieme di istruzioni e memoria di dati in grado di realizzare una traduzione; un traduttore o una unità di traduzione possono comprendere più di un motore di traduzione.
Sistema di traduzione: si intende un insieme di computer collegati via rete (per esempio Ethernet, internet, ...), ciascun computer avente internamente almeno un traduttore o una unità di traduzione.
Testo sorgente: un testo elettronicamente editabile che deve essere gestito e/o tradotto. Testo di destinazione: una traduzione del testo sorgente in una seconda lingua.
Traduzione dall'interno o interna: traduzione realizzata internamente al computer mediante proprio motore di traduzione.
Traduzione esterna: traduzione effettuata dal computer esternamente, cioà ̈ via rete per esempio via internet.
Carattere: un carattere identificativo minimo che può essere immagazzinato in una memoria.
Parola: una serie di caratteri ciascuna serie essendo divisa da un'altra serie mediante uno spazio.
Elemento: un insieme di parole divise tramite una virgola un insieme di parole non avente à ̈ inteso come un oggetto.
Linea: un insieme di parole diviso da ritorni carrello, generalmente inteso come contenente una frase completa. Una linea può avere uno o più elementi.
Contenitore: qualsiasi contenitore elettronico di testo. Per esempio URL, campo, contenitore di memoria, ecc.
Memoria: dati immagazzinati in una memoria durante un processo da un ingresso o da un contenitore.
Campo: un contenitore avente un insieme di parole, elementi, linee.
Da-sorgente-a-destinazione: una usuale modalità di traduzione automatica per esempio Da-lnglese-a-italiano, dove, generalmente, si intende fornire una traduzione da una lingua sorgente (per esempio Inglese) ad una lingua di destinazione (per esempio Italiano).
Da-destinazione-a-destinazione: una traduzione automatica parallela per meglio realizzare la precedentemente definita traduzione da-sorgente-a-destinazione ed usata immediatamente a seguito di quest'ultima.
Insegnamento: un insieme di dati collegati comprendenti almeno: una parte del testo da tradurre corrispondente ad una o più parole (frammento sorgente), e corrispondente traduzione corretta (frammento di destinazione) della corrispondente parte del testo da tradurre.
- Frammento: una parte del testo da tradurre (sorgente) o una parte di un testo tradotto automaticamente (destinazione) o una parte di un testo corretto da un operatore (destinazione). Il frammento può essere composto da una o più parole. Preferibilmente, ma senza limitazione entro lo scopo della presente invenzione, il numero di parole da insegnare nella forma di un frammento à ̈ limitato a 10. Tuttavia il numero di parole da insegnare nella forma di un frammento può essere maggiore di 10.
Frammento sorgente: un insieme di parole selezionate dal testo sorgente del testo della traduzione.
Frammento di destinazione: un insieme di parole che corrispondono alla traduzione di un frammento sorgente nella traduzione corretta nella lingua di destinazione.
Destinazione errata: si intende una selezione di una parte della traduzione automatica come insegnamento sorgente in modalità da-destinazione-a-destinazione, per esempio quando nella lingua di destinazione si ottiene un risultato errato o non corrispondente al migliore risultato di traduzione.
- Destinazione corretta: si intende la correzione della Destinazione errata precedentemente definita da usare come un insegnamento insieme con la Destinazione errata e con una rispettiva qualifica o codice di istruzione da immagazzinare e da riutilizzare in modalità da-destinazione-a-destinazione da parte di un rispettivo motore di traduzione da-destinazione-a-destinazione.
- Codice di istruzione o qualifica: un codice in grado di permettere al motore di traduzione di identificare la qualifica dell'insegnamento. Contiene la categoria dell'insegnamento per esempio identificando se una certa parola à ̈ un articolo, un sostantivo, un avverbio, un aggettivo, ecc. e ulteriori dati codificati per permettere al motore di traduzione di effettuare meglio la traduzione mediante istruzioni interne.
- Struttura: una struttura o disposizione di un frammento o di una breve frase preferibilmente, ma senza limitazione entro lo scopo della presente invenzione, una frase con non più di 20 parole, più preferibilmente non più di 10 parole. Una traduzione strutturata consiste in una serie prefissata di coppie di traduzione strutturate grammaticalmente sequenziate, una delle quali riferita alla lingua sorgente e l'altra riferita alla lingua di destinazione, tramite le quali il motore di traduzione cerca di allocare la serie di parole successive di destinazione del testo da tradurre.
Dominio: un campo di applicazione che definisce l'argomento della traduzione. In funzione del dominio selezionato, si possono usare differenti dizionari per avere la migliore corrispondenza fra un termine in un linguaggio sorgente ed i suoi corrispondenti traduzione e significato nella lingua di destinazione. A solo titolo di esempio, il termine italiano “albero†sarà tradotto con il termine inglese “shaft†se il dominio à ̈ relativo ad un campo di applicazione meccanico ma sarà tradotto con il termine inglese “tree†se il dominio à ̈ relativo ad un campo di applicazione agricolo. Stato della tecnica
La modalità di traduzione da-sorgente-a-destinazione à ̈ ben nota.
È pure nota la modalità di traduzione da-destinazione-a-destinazione.
È pure ben nota la traduzione strutturata, consistente in una serie prefissata di coppie di traduzione strutturate grammaticalmente sequenziate, una delle quali riferita alla lingua sorgente e l'altra riferita alla lingua di destinazione, tramite le quali il motore di traduzione cerca di allocare la serie di parole successive di destinazione del testo da tradurre, il risultato essendo povero, complicato e veramente combaciante con difficoltà con tutti i componenti della struttura. Macchine traduttrici dotate di una funzionalità di postcorrezione sono ben note al fine di effettuare nel modo migliore una traduzione fatta da una macchine traduttrice automatica.
Si fa riferimento a W002054280 e US2003040900 a nome dello stesso richiedente che divulgano un sistema per prima effettuare una traduzione in modalità automatica e poi fornire almeno una coppia parallela di campi di scorrimento su uno dei quali à ̈ presente un testo sorgente e sull'altro dei quali à ̈ presente un testo di destinazione. Entrambi i campi scorrono in modo parallelo per permettere all'utilizzatore di effettuare correzioni, preferibilmente linea per linea, cioà ̈ operando su una linea alla volta. Ciascuna correzione viene immagazzinata con un rispettivo codice di istruzione al fine di riutilizzare la stessa correzione immediatamente sulle traduzioni seguenti, persino sullo stesso testo in corso di revisione.
Si fa anche riferimento a EP1058896B1 e US6937974B1 a nome dello stesso richiedente che divulgano un computer per trattamento di testo e sistema di traduzione automatica e traduttore, del tipo in cui si forniscono: primi mezzi di immagazzinamento di parole e stringhe di più parole con rispettive traduzioni corrette formante un dizionario di parole e frasi o porzioni di frase; secondi mezzi per ricevere un testo da tradurre in un campo dello schermo; terzi mezzi per immagazzinare il testo tradotto in un secondo campo dello schermo; quarti mezzi per ricercare in progressione le parole del testo da tradurre e compararle con le parole di detti primi mezzi per ottenere una traduzione progressiva; mezzi per optare da una forma di traduzione completamente automatica ad una traduzione interattiva o viceversa, in cui, durante detta opzione di traduzione interattiva, si forniscono ulteriormente: mezzi per visualizzare in una finestra a scomparsa su detto schermo le parole mancanti durante la ricerca delle parole e le frasi tradotte al completamento della traduzione di ciascuna frase, e permettere la correzione e memorizzazione.
Si fa anche riferimento a UD99A000171 a nome dello stesso richiedente che divulga un sistema di traduzione basato su una macchina ed un traduttore del tipo in cui si forniscono mezzi di postcorrezione con funzionalità di ricerca e sostituzione attivata automaticamente dalla correzione.
Si fa anche riferimento a W02007051484 e US2008288240 a nome dello stesso richiedente che divulgano un sistema di traduzione del tipo con una struttura di collegamento con una rete/internet di intercomunicazione, la quale rete comprende una pluralità di server interconnessi, comprendenti: a) almeno un apparato dell'utilizzatore a microprocessore comunicante in rete per la comunicazione in rete che comprende mezzi di collegamento alla rete e/o via rete/internet, e b) almeno un server di servizio in rete collegato a detta rete/internet di intercomunicazione comprendente un numero indefinito di server; c) detto server di servizio in rete comprendente o collegantesi ad almeno un database di servizio in rete; e d) una pluralità di computer di traduzione e/o server di traduzione comprendenti internamente almeno un sistema di traduzione automatica per una pluralità di lingue in varie combinazioni, ciascuno di detti computer di traduzione e/o server di traduzione ulteriormente comprendente: I. mezzi di collegamento a detta rete/internet di intercomunicazione e II. rispettivi mezzi di supervisione automatica in detto database di servizio in rete per verificare se à ̈ stato caricato almeno un testo da tradurre, Ili. mezzi per il rispettivo prelievo/scaricamento di detto testo da tradurre, IV. mezzi per tradurre almeno automaticamente detto testo da tradurre per ottenere automaticamente una traduzione e V. mezzi per mandare automaticamente detta traduzione a detto database di servizio in rete, per continuare la ricerca di nuovi testi in detto database di servizio in rete; e) detto apparato dell'utilizzatore comunicante in rete, comprendente similarmente: I. mezzi per l'invio di dati e di detto testo da tradurre a detto database di servizio in rete, II. mezzi per rilevare detto database di servizio in rete e verificare se la rispettiva traduzione à ̈ arrivata, e Ili. mezzi per il rispettivo prelievo/scaricamento di detta traduzione, f) così che detto apparato dell'utilizzatore comunicante in rete può comunicare per introdurre dati ed inviare la traduzione da effettuare e ricevere la traduzione completata, soltanto e esclusivamente con detto database di servizio in rete; g) ed in modo che detto computer di traduzione e/o server di traduzione comunicano per introdurre e catturare dati, nelle fasi di prelievo/scaricamento e di invio della traduzione soltanto con detto database di servizio in rete, h) detto server di servizio in rete comprendente mezzi di arresto o essendo privo di mezzi che permettono la connessione diretta fra detto apparato dell'utilizzatore comunicante in rete e detto computer e/o server di traduzione in rete.
Si fa anche riferimento a W02007101623 e UD2006A000049 a nome dello stesso richiedente che divulgano un metodo di traduzione computerizzata o suo completamento, comportante un sistema computerizzato in grado di immagazzinare e mostrare un rispettivo testo della lingua sorgente da tradurre ed il testo della lingua di destinazione, caratterizzato dal fatto che viene previsto, dopo traduzione automatica e/o interattiva, un secondo tipo di traduzione operante sulla traduzione di uscita in modalità da-lingua-destinazione-a-lingua-destinazione per ulteriore miglioramento della traduzione indipendentemente dalla lingua sorgente.
Si fa anche riferimento a EP2005328, W02007104492, US2009106017 e UD2006A000067 a nome dello stesso richiedente che divulgano un metodo di traduzione computerizzata automatica caratterizzato dall'uso di multi-tasking a due processori o a processore dual-core duplicando il sistema in due gemelli, uno diventando il server dell'altro ed incaricando il primo di inviare una parte rimanente inferiore alla metà al secondo mentre il primo inizia la traduzione della prima parte per poi, a completamento del suo lavoro, prelevare il testo tradotto dal secondo ed unirlo alla prima parte che à ̈ già stata tradotta.
Problemi della tecnica anteriore
Nonostante la avanzata tecnologia della tecnica odierna:
a) la traduzione automatica frequentemente fornisce inaspettate traduzioni scorrette, questo in particolare per la buona comprensione e correttezza della lingua di uscita; b) quanto sopra richiede una notevole quantità di correzioni alla traduzione automatica. Nei sistemi e/o metodi della tecnica anteriore, per effettuare meglio le correzioni, l'operatore à ̈ frequentemente obbligato a consultare dizionari su carta o dizionari elettronici, o andare in internet per cercare di risolvere certi problemi di risultato qualitativo relativamente alla traduzione.
In certi casi, per esempio quando la lingua sorgente à ̈ il Tedesco, à ̈ veramente difficile trovare traduzioni di certe parole poiché generalmente sui dizionari sono presenti soltanto le parole di base principali. Inoltre certe espressioni non sono facilmente traducibili con buoni risultati. Questo lavoro ha come risultato l'impiego di una grande quantità di tempo e si può non ottenere la qualità della traduzione finale.
Scopo dell’invenzione
È oggetto dell'invenzione come rivendicato realizzare una migliore soluzione per permettere un risparmio di tempo e migliori prestazioni relativamente alla qualità del risultato.
Vantaggi conseguiti mediante l’invenzione
I vantaggi sono relativi alla velocità di traduzione in quanto la soluzione in conformità con la presente invenzione consente un notevole risparmio di tempo in termini di tempo richiesto per effettuare una traduzione.
Ulteriori vantaggi sono relativi alla qualità della traduzione automatica ed anche nella postcorrezione in quanto la soluzione in conformità con la presente invenzione consente un rapido ed immediato confronto a video tra diverse possibili traduzioni del medesimo testo sorgente. Descrizione dei molti modi di attuazione dell’invenzione
Fig. 1 mostra le caratteristiche della macchina traduttrice della tecnica anteriore più prossima. Fig. 2 mostra una delle migliori caratteristiche della macchina di traduzione della presente invenzione, intendendo che la presente invenzione può visualizzare sul monitor anche le caratteristiche di Fig. 1 quando non viene attivata la traduzione esterna, prima di iniziare la traduzione.
Fig. 3 mostra la macchina traduttrice con l'aspetto di Fig. 1 , in cui la rispettiva 1<ma>traduzione appare sul secondo campo parallelo.
Fig. 4 mostra la macchina traduttrice della presente invenzione con l'aspetto di Fig. 2, in cui la rispettiva 1<ma>traduzione appare sul secondo campo parallelo.
Fig. 5 mostra l'aspetto della macchina traduttrice di Fig. 1 durante la postcorrezione.
Fig. 6 mostra l'aspetto della presente macchina traduttrice della presente invenzione con l'aspetto di Fig. 2 durante la postcorrezione.
Descrizione dell’invenzione
L'invenzione sarà di seguito descritta con l'aiuto dei disegni allegati in cui:
Fig. 1 rappresenta la MT che usualmente mostra due colonne parallele una vicina all'altra, cioà ̈ una prima colonna (1) ed una seconda colonna (2), ciascuna delle quali formata da due campi di scorrimento sovrapposti, cioà ̈ un primo campo superiore (4) ed un primo campo inferiore (5) relativamente alla prima colonna (1), ed un secondo campo superiore (6) ed un secondo campo inferiore (7) relativamente alla seconda colonna (2). La prima colonna (1) à ̈ il contenitore della lingua sorgente su cui apparirà il testo sorgente e la seconda colonna (2) à ̈ il contenitore della lingua di destinazione su cui apparirà la traduzione effettuata mediante il rispettivo motore della MT. Come sarà spiegato nel seguito della presente descrizione e come si può comprendere dai brevetti della tecnica anteriore a nome del medesimo richiedente:
il campo in alto a sinistra, cioà ̈ il campo in alto della prima colonna (1), cioà ̈ il primo campo superiore (4), corrisponde alla parte del testo sorgente già elaborata e/o revisionata dall'operatore
il campo in basso a sinistra, cioà ̈ il campo in basso della prima colonna (1), cioà ̈ il primo campo inferiore (5), corrisponde alla parte del testo sorgente che non à ̈ stata già elaborata e/o revisionata dall'operatore
il campo in alto a destra, cioà ̈ il campo in alto della seconda colonna (2), cioà ̈ il secondo campo superiore (4), corrisponde alla parte del testo sorgente già elaborata e/o revisionata dall'operatore
- il campo in basso a sinistra, cioà ̈ il campo in basso della seconda colonna (2), cioà ̈ il secondo campo inferiore (5), corrisponde alla parte del testo di destinazione che non à ̈ stata già elaborata e/o revisionata dall'operatore
Fig. 2 rappresenta, in conformità con l'invenzione, una seconda caratteristica che appare sullo schermo in cui viene aggiunta una terza colonna (3) pure composta da due campi di scorrimento sovrapposti, cioà ̈ un terzo campo superiore (8) ed un terzo campo inferiore (9). La terza colonna (3) conterrà una seconda traduzione automatica effettuata tramite un differente motore di MT, cioà ̈ una traduzione automatica che risulta differente dalla traduzione automatica contenuta nella seconda colonna (2), per esempio effettuata via internet ma sempre con un motore di traduzione differente rispetto al motore di traduzione usato per ottenere la traduzione automatica nella seconda colonna (2), al fine di ottenere anche una differente soluzione di destinazione nella stessa lingua di destinazione e usando lo stesso testo sorgente o alternativamente una seconda lingua di destinazione. In modo simile a quanto spiegato relativamente alla Fig. 1 :
il campo in alto a sinistra, cioà ̈ il campo in alto della prima colonna (1), cioà ̈ il primo campo superiore (4), corrisponde alla parte del testo sorgente già elaborata e/o revisionata dall'operatore
il campo in basso a sinistra, cioà ̈ il campo in basso della prima colonna (1), cioà ̈ il primo campo inferiore (5), corrisponde alla parte del testo sorgente che non à ̈ stata già elaborata e/o revisionata dall'operatore
- il campo in alto al centro, cioà ̈ il campo in alto della seconda colonna (2), cioà ̈ il secondo campo superiore (6), corrisponde alla parte del testo sorgente già elaborata e/o revisionata dall'operatore, relativamente alla traduzione ottenuta tramite un primo motore di traduzione
il campo in basso al centro, cioà ̈ il campo in basso della seconda colonna (2), cioà ̈ il secondo campo inferiore (7), corrisponde alla parte del testo di destinazione che non à ̈ stata già elaborata e/o revisionata dall'operatore, relativamente alla traduzione ottenuta tramite un primo motore di traduzione
il campo in alto a destra, cioà ̈ il campo in alto della terza colonna (3), cioà ̈ il terzo campo superiore (8), corrisponde alla parte del testo sorgente già elaborata e/o revisionata dall'operatore, relativamente alla traduzione ottenuta tramite un secondo motore di traduzione diverso rispetto al motore di traduzione usato per ottenere la traduzione automatica nella seconda colonna (2)
il campo in basso a destra, cioà ̈ il campo in basso della terza colonna (3), cioà ̈ il terzo campo inferiore (9), corrisponde alla parte del testo di destinazione che non à ̈ stata già elaborata e/o revisionata dall'operatore, relativamente alla traduzione ottenuta tramite un secondo motore di traduzione diverso rispetto al motore di traduzione usato per ottenere la traduzione automatica nella seconda colonna (2)
Fig. 3 rappresenta la MT di Fig. 1 in cui si à ̈ effettuata una prima traduzione con un primo motore di una MT, dove:
il primo campo superiore (4) della prima colonna (1) à ̈ vuoto poiché fino a questo momento à ̈ stata effettuata soltanto una traduzione automatica e l'operatore deve ancora processare e/o revisionare il testo automaticamente tradotto. Per questa ragione nel primo campo superiore (4) non à ̈ presente alcuna parte del testo sorgente già processato
il primo campo inferiore (5) della prima colonna (1) contiene tutto il testo sorgente il secondo campo superiore (6) della seconda colonna (2) à ̈ vuoto poiché fino a questo momento à ̈ stata effettuata soltanto una traduzione automatica e l'operatore deve ancora processare e/o revisionare il testo automaticamente tradotto. Per questa ragione nel secondo campo superiore (6) non à ̈ presente alcuna parte del testo di destinazione già processato
il secondo campo inferiore (7) della seconda colonna (2) contiene tutto il testo di destinazione automaticamente tradotto con il motore di una MT
Fig. 4, in conformità con la presente invenzione, rappresenta la MT di Fig. 2, in cui si à ̈ effettuata una prima traduzione con un primo motore di una MT ed una seconda traduzione con un secondo motore di una MT, dove:
il primo campo superiore (4) della prima colonna (1) à ̈ vuoto poiché fino a questo momento à ̈ stata effettuata soltanto una traduzione automatica e l'operatore deve ancora processare e/o revisionare il testo automaticamente tradotto. Per questa ragione nel primo campo superiore (4) non à ̈ presente alcuna parte del testo sorgente già processato
il primo campo inferiore (5) della prima colonna (1) contiene tutto il testo sorgente il secondo campo superiore (6) della seconda colonna (2) à ̈ vuoto poiché fino a questo momento à ̈ stata effettuata soltanto una traduzione automatica e l'operatore deve ancora processare e/o revisionare il testo automaticamente tradotto. Per questa ragione nel secondo campo superiore (6) non à ̈ presente alcuna parte del primo testo di destinazione già processato
il secondo campo inferiore (7) della seconda colonna (2) contiene tutto il primo testo di destinazione automaticamente tradotto con il primo motore di una MT
il terzo campo superiore (8) della terza colonna (3) à ̈ vuoto poiché fino a questo momento à ̈ stata effettuata soltanto una traduzione automatica e l'operatore deve ancora processare e/o revisionare il testo automaticamente tradotto. Per questa ragione nel terzo campo superiore (8) non à ̈ presente alcuna parte del secondo testo di destinazione già processato
il terzo campo inferiore (9) della terza colonna (3) contiene tutto il secondo testo di destinazione automaticamente tradotto con il secondo motore di una MT.
La rispettiva seconda traduzione che appare nel terzo campo inferiore (9) della terza colonna (3) à ̈ differente in maniera evidente rispetto alla prima traduzione che appare nel secondo campo inferiore (7) della seconda colonna (2). È evidente che la nuova macchina di traduzione à ̈ in grado di fornire una più grande varietà di traduzioni rispetto a qualsiasi altra precedente. In questo modo si permette in modo migliore all'operatore di comparare le due differenti traduzioni ed effettuare variazioni rapide e migliori nella seconda colonna (2) e/o nella terza colonna (3), o più precisamente nel secondo campo inferiore (7) e/o nel terzo campo inferiore (9).
Fig. 5 rappresenta la MT di Fig. 3 in cui si à ̈ effettuata una prima traduzione con un primo motore di una MT e parte del testo à ̈ già stata elaborata da un operatore, dove:
il primo campo superiore (4) della prima colonna (1) contiene la parte del testo sorgente corrispondente al testo di destinazione che à ̈ stato già elaborato e/o revisionato da parte dell’operatore, cioà ̈ corrispondente alla parte di testo di destinazione contenuta nel secondo campo superiore (6) della seconda colonna (2)
- il primo campo inferiore (5) della prima colonna (1) contiene la parte del testo sorgente corrispondente alla parte del testo di destinazione che deve ancora essere elaborato e/o revisionato da parte dell’operatore, cioà ̈ corrispondente alla parte di testo di destinazione contenuta nel secondo campo inferiore (7) della seconda colonna (2) il secondo campo superiore (6) della seconda colonna (2) contiene la parte di testo di destinazione che à ̈ stata già elaborata e/o revisionata da parte dell’operatore il secondo campo inferiore (7) della seconda colonna (2) contiene la parte del testo di destinazione automaticamente tradotto con il motore di una MT e che deve ancora essere elaborata e/o revisionata da parte dell’operatore
Come si può comprendere dai brevetti della tecnica anteriore a nome del medesimo richiedente, la MT à ̈ dotata di mezzi di trasferimento allo scopo di permettere all'operatore di trasferire contemporaneamente tutte le prime linee di ciascun campo inferiore nel corrispondente campo superiore, la prima linea del campo inferiore di una data colonna essendo trasferita sotto l'ultima linea presente nel campo superiore corrispondente al campo nferiore di detta colonna data o viceversa. Così quando l'operatore termina l'elaborazione e/o la revisione della prima linea del secondo campo inferiore (7) attiverà detti mezzi di trasferimento contemporaneamente trasferendo la prima linea del primo campo inferiore (5) dopo l'ultima inea del primo campo superiore (4) e trasferendo la prima linea del secondo campo inferiore (7) dopo l'ultima linea del secondo campo superiore (6). Il procedimento consistente in elaborazione/revisione e successivo trasferimento continuerà linea-per-linea fino al termine del testo da tradurre/elaborare. I campi superiori saranno fatti scorrere verso l’alto allo stesso tempo in modo da permettere all’operatore di vedere la parte inferiore dei campi superiori e non la parte superiore degli stessi. In questo modo l’operatore vede la continuità del testo nella stessa colonna nonostante la presenza di due campi sovrapposti.
Fig. 6, in conformità con la presente invenzione, rappresenta la MT di Fig. 4, in cui si à ̈ effettuata una prima traduzione con un primo motore di una MT ed una seconda traduzione con un secondo motore di una MT, ed in cui parte del testo à ̈ già stata elaborata da un operatore, dove:
il primo campo superiore (4) della prima colonna (1) contiene la parte del testo sorgente corrispondente al testo di destinazione che à ̈ stato già elaborato e/o revisionato da parte dell’operatore, cioà ̈ corrispondente alla parte di testo di destinazione contenuta nel secondo campo superiore (6) della seconda colonna (2) e nel terzo campo superiore (8) della terza colonna (3)
il primo campo inferiore (5) della prima colonna (1) contiene la parte del testo sorgente corrispondente alla parte del testo di destinazione che deve ancora essere elaborato e/o revisionato da parte dell’operatore, cioà ̈ corrispondente alla parte di testo di destinazione contenuta nel secondo campo inferiore (7) della seconda colonna (2) e nel terzo campo inferiore (9) della terza colonna (3)
il secondo campo superiore (6) della seconda colonna (2) contiene la parte di testo di destinazione che à ̈ stata già elaborata e/o revisionata da parte dell’operatore corrispondente alla prima traduzione fornita dal primo motore di una MT
il secondo campo inferiore (7) della seconda colonna (2) contiene la parte del testo di destinazione automaticamente tradotto con il primo motore di una MT e che deve ancora essere elaborata e/o revisionata da parte dell’operatore
il terzo campo superiore (8) della terza colonna (2) contiene la parte di testo di destinazione che à ̈ già stata utilizzata da parte dell’operatore in accordo con la prima e la seconda colonna e corrispondente alla seconda traduzione fornita dal secondo motore di una MT
il terzo campo inferiore (9) della terza colonna (3) contiene la parte del testo di destinazione automaticamente tradotto con il secondo traduttore MT e che deve ancora essere utilizzata da parte dell’operatore in accordo con la prima e la seconda colonna. Uno dei vantaggi derivanti dalle soluzioni di cui alle suesposte figure, consiste in particolare nel fatto che al posto di un grande numero di strumenti per aiutare l'operatore ad effettuare in maniera migliore correzioni/modifiche, si fornisce un terzo campo di scorrimento parallelo in aggiunta alla coppia di campi di scorrimento paralleli previamente descritti con riferimento alla tecnica anteriore e particolarmente con riferimento a W002054280 e US2003040900, in cui si fornisce una seconda traduzione automatica relativa allo stesso testo ma effettuata con un differente motore di traduzione che usa dati differenti rispetto alla prima traduzione automatica fornita.
Come si può comprendere dai brevetti della tecnica anteriore a nome del medesimo richiedente, la MT à ̈ dotata di mezzi di trasferimento allo scopo di permettere all'operatore di trasferire contemporaneamente tutte le prime linee superiori di ciascun campo inferiore nel corrispondente campo superiore, la prima linea del campo inferiore di una data colonna essendo trasferita sotto l'ultima linea presente nel campo superiore corrispondente al campo inferiore di detta colonna data o viceversa. Così quando l'operatore termina l'elaborazione e/o la revisione della prima linea del secondo campo inferiore (7) attiverà detti mezzi di trasferimento ottenendo come risultato il contemporaneo trasferimento di:
prima linea del primo campo inferiore (5) dopo l'ultima linea del primo campo superiore (4) nella prima colonna;
prima linea del secondo campo inferiore (7) dopo l'ultima linea del secondo campo superiore (6) nella seconda colonna;
prima linea del terzo campo inferiore (9) dopo l'ultima linea del terzo campo superiore (8) della terza colonna.
Il procedimento consistente in elaborazione/revisione e successivo trasferimento continuerà linea-per-linea fino al termine del testo da tradurre/elaborare.
Sarà evidente che le funzionalità di elaborazione e/o revisione possono essere indifferentemente fornite sulla seconda colonna (2) o sulla terza colonna (3) o su entrambe, sebbene la soluzione che prevede l’elaborazione e/o la revisione nella seconda colonna (2) sia preferibile a quella che prevede l’elaborazione e/o la revisione nella terza colonna (3), in quanto operare sulla colonna centrale dello schermo à ̈ più efficiente oltre che ergonomico.
Descrizione dettagliata dell’invenzione
Certi particolari del metodo, o del processo o con riferimento al motore di traduzione o in riferimento al sistema di traduzione, sono considerati ovvi e ben noti da parte di una persona esperta del settore. In particolare, detti particolari sono divulgati nei brevetti precedenti dello stesso inventore come citati nella tecnica anteriore di riferimento.
Per effettuare meglio la traduzione, l'operatore effettuerà una post-correzione inserendo e/o cancellando e/o modificando il testo sul secondo campo inferiore (7) della seconda colonna (2) e lavorando linea-per-linea cioà ̈ paragrafo-per-paragrafo, cioà ̈ sulla prima linea superiore (primo paragrafo) del secondo campo inferiore (7) della seconda colonna (2), poi con un pulsante, a solo titolo di esempio con il pulsante "Enter" o con il pulsante "Alto" della tastiera o con un pulsante virtuale sul campo dei pulsanti (11), si darà alla MT il comando di inviare automaticamente i testi verso l'alto verso i rispettivi campi superiori di tutte e tre le colonne (come rappresentato in Fig. 6 dalle frecce verso l’alto tra ciascun campo inferiore ed il corrispondente campo superiore), cioà ̈:
la prima linea (primo paragrafo) del primo campo inferiore (5) sarà trasferita dopo l'ultima linea del primo campo superiore (4), conseguendo un trasferimento del testo sorgente
la prima linea (primo paragrafo) del secondo campo inferiore (7) sarà trasferita dopo l'ultima linea del secondo campo superiore (6), conseguendo un trasferimento del primo testo di destinazione revisionato e/o corretto e/o modificato
la prima linea (primo paragrafo) del terzo campo inferiore (9) sarà trasferita dopo l'ultima linea del terzo campo superiore (8), conseguendo un trasferimento del secondo testo di destinazione automaticamente tradotto
La continuazione in questo modo à ̈ permessa fino alla fine del lavoro di traduzione.
In generale si forniscono mezzi di trasferimento allo scopo di permettere all'operatore di trasferire contemporaneamente tutte le prime linee di ciascun campo inferiore nel corrispondente campo superiore, la prima linea del campo inferiore di una data colonna essendo trasferita sotto l'ultima linea presente nel campo superiore corrispondente al campo inferiore di detta colonna data o viceversa.
Tutte le figure sono riprodotte copiando l'interfaccia reale che appare sullo schermo della macchina traduttrice, intendendo che le dimensioni e le proporzioni altezza/larghezza dell'interfaccia del motore di traduzione possono essere opportunamente cambiate in funzione della dimensione dello schermo del computer usato come macchina di traduzione mediante ben noti mezzi interni forniti.
Processo operativo:
a) Il testo sorgente (il testo da tradurre) viene incollato, o trascinato e lasciato [drag and drop], o caricato da un file mediante mezzi comunemente noti, sul primo campo inferiore (5) della prima colonna (1) e si effettua la scelta delle lingue e del dominio (se à ̈ fornita questa funzionalità), incominciando la traduzione;
b) Una prima traduzione automatica del testo sorgente viene messa automaticamente (Fig. 3 e Fig. 4) sul secondo campo inferiore (7) della seconda colonna (2);
c) Si effettua una seconda traduzione automatica con i medesimi dati (cioà ̈ con lo stesso testo sorgente e con la stessa lingua di destinazione e/o con la medesima selezione del dominio se à ̈ fornita questa funzionalità) tramite una differente macchina di traduzione; d) La seconda traduzione viene messa (Fig. 4) sul terzo campo inferiore (9) della terza colonna (3);
e) L'operatore incomincia la post-correzione revisionando il secondo campo inferiore (7) della seconda colonna (2), effettuando modifiche sulla prima linea superiore (paragrafo) di esso. Si ottengono modifiche di migliore qualità ed una migliore efficienza avendo in parallelo di lato, sulla stessa linea (di tutte e tre le colonne) la rispettiva linea superiore (paragrafo superiore) dei rispettivi campi inferiori delle tre colonne. Questo si ottiene mantenendo la stessa linea di divisione (10) per le tre colonne (1 , 2, 3), cioà ̈ la linea di divisione tra il primo campo superiore (4) ed il primo campo inferiore (5) coincide con la linea di divisione tra il secondo campo superiore (6) ed il secondo campo inferiore (7), la quale a sua volta coincide con la linea di divisione tra il terzo campo superiore (8) ed il terzo campo inferiore (9), le tre linee di divisione formanti una unica linea di divisione (10) tra tutti i campi superiori (4, 6, 8) e tutti i campi inferiori (5, 7, 9). Questo consente all'operatore di lavorare meglio e più velocemente, avendo l'aiuto della terza colonna (3) parallela su cui à ̈ presente la seconda traduzione. Per esempio se la prima linea (primo paragrafo) di interesse della terza colonna (3) à ̈ la stessa della prima linea (primo paragrafo) di interesse della seconda colonna (2), allora probabilmente riguarda una traduzione ben svolta e non necessita di alcun cambiamento o sono richiesti solo cambiamenti di secondaria importanza. Se i due testi tradotti sono differenti allora l'operatore sarà in grado in modo migliore di cambiare la prima traduzione automatica (cioà ̈ quella relativa alla prima linea o paragrafo del secondo campo inferiore (7) della seconda colonna (2) sullo schermo) con l'aiuto della seconda traduzione automatica (cioà ̈ quella relativa alla prima linea o paragrafo del terzo campo inferiore (9) della terza colonna (3) sullo schermo) senza avere bisogno di consultare continuamente dizionari esterni.
f) Dopo la correzione della linea superiore (paragrafo superiore) del secondo campo inferiore (7) della seconda colonna (2), il sistema permette il trasferimento automatico verso l'alto di tutte e tre le prime linee (paragrafi) delle tre colonne dalla linea superiore del rispettivo campo inferiore al rispettivo campo superiore dopo l'ultima linea inferiore del rispettivo campo superiore di ciascuna colonna, per mantenere il controllo in parallelo linea-per-linea, mentre i cambiamenti vengono automaticamente memorizzati per riutilizzo automatico senza ulteriore intervento da parte dell'operatore nel seguito della corrente operazione di postcorrezione e su ulteriori future traduzioni quando à ̈ presente il medesimo frammento revisionato;
g) La lavorazione continua fino alla fine del testo da tradurre;
h) Alla fine, tutti i cambiamenti memorizzati fatti dall'operatore vengono pure trasferiti ad un server centrale principale al fine di assicurare la stessa efficienza migliorata, tramite traduzioni on-line o su future versioni.
Nella soluzione più veloce ed economica e largamente prontamente direttamente utilizzata più ampiamente nel mondo, sia la prima traduzione che la seconda traduzione sono effettuate via rete. In questo caso la prima traduzione sarà collegata ad un proprio server controllato a cui accede un certo numero di motori di traduzione, detti motori di traduzione essendo tutti implementati per fornire esattamente la stessa traduzione, la seconda traduzione essendo effettuata mediante un motore di traduzione differente rispetto al motore di traduzione che effettua la prima traduzione. Il secondo motore di traduzione preferibilmente effettuerà la traduzione con un approccio differente così che differenti traduzioni saranno disponibili affinché l'operatore le confronti facilmente e prontamente. Per esempio il primo motore di traduzione usa un approccio basato su regole grammaticali ed il secondo motore di traduzione usa un approccio statistico. Questa soluzione avendo l'ulteriore vantaggio di permettere continuamente a tutti gli utilizzatori di introdurre nuovi insegnamenti ed allo stesso tempo permettendo l'introduzione degli insegnamenti sui traduttori centrali senza richiedere l'aggiornamento del traduttore stesso. Un ulteriore vantaggio à ̈ la possibilità di usare molti differenti motori di MT immediatamente disponibili su internet. Un ulteriore vantaggio di questa soluzione à ̈ la capacità di usare il sistema di traduzione con tutti i tipi di sistemi operativi (per esempio Windows o Mac, Unix, ...).
In una soluzione alternativa la prima traduzione viene effettuata internamente al computer e la seconda traduzione viene effettuata esternamente come per la soluzione sopradescritta. Questa soluzione à ̈ in grado di effettuare in modo migliore traduzioni di qualità, ma ha lo svantaggio di non mettere immediatamente a disposizione i nuovi insegnamenti forniti da altri operatori fino ad una nuova versione.
In una soluzione alternativa alla precedente il secondo motore di traduzione si trova su un altro computer raggiungibile tramite una rete Ethernet. Questa soluzione ha il vantaggio di usare un secondo motore di traduzione anche quando si lavora su sistemi operativi differenti (per esempio Windows o Mac).
In una ulteriore soluzione alternativa entrambi i differenti motori di traduzione si trovano residenti sullo stesso computer. Questa soluzione presenta il vantaggio di non necessitare di una connessione di rete ma ha lo svantaggio di non essere in grado di usare immediatamente e continuamente i prossimi insegnamenti fatti da altri utilizzatori che usano lo stesso sistema. Nella soluzione preferita il primo motore di traduzione comprende due motori di sub-traduzione: a) un primo motore di sub-traduzione per effettuare una prima traduzione dal testo sorgente al testo di destinazione, e
b) un secondo motore di sub-traduzione che segue immediatamente il primo motore di sub-traduzione, detto secondo motore di sub-traduzione essendo in grado di effettuare una ulteriore traduzione del testo di destinazione ottenuto da detto primo motore di subtraduzione al fine di ottenere un testo di destinazione tradotto in modo migliore.
In questo modo la prima macchina traduttrice fornisce una traduzione automatica migliore grazie all'uso di due motori di sub-traduzione: un motore di sub-traduzione per trasformare il testo sorgente in un testo di destinazione ed un motore di sub-traduzione per rendere migliore il testo di destinazione ottenuto in una modalità da-destinazione-a-destinazione.
Vantaggiosamente il sistema fornisce, alla fine di ogni processo di postcorrezione (per esempio sul secondo campo inferiore (7) della seconda colonna (2), se la funzionalità di postcorrezione à ̈ fornita su tale colonna), mezzi in grado di inviare immediatamente tramite e-mail gli insegnamenti automaticamente immagazzinati derivanti da correzioni precedenti eseguite da ciascun operatore.
Vantaggiosamente gli insegnamenti vengono effettuati in una forma di dati in grado di essere immagazzinati su due differenti database del primo motore di traduzione, cioà ̈:
a) Insegnamento da-sorgente-a-destinazione nella forma di tre dati: frammento sorgente, corrispondente frammento di destinazione corretto, codice di istruzione. Questa soluzione à ̈ in grado di consentire il miglioramento della traduzione da-sorgente-adestinazione sul primo motore di traduzione, o più precisamente su detto primo motore di sub-traduzione.
b) Insegnamento da-destinazione-a-destinazione nella forma di tre dati e/o quattro dati: b1) frammento di traduzione automatica di destinazione errato, corrispondente frammento di traduzione di destinazione corretto, corrispondente codice di istruzione. Questa soluzione à ̈ in grado di permettere il miglioramento di un seguente passo su detto primo motore di traduzione, o più precisamente su detto secondo motore di sub-traduzione, quando il testo proveniente dalla prima fase a) viene trattato mediante una traduzione da-destinazione-adestinazione.
b2) frammento di traduzione automatica di destinazione errato, corrispondente frammento di traduzione di destinazione corretto, corrispondente codice di istruzione, corrispondente frammento di sorgente. Questa soluzione à ̈ in grado di inserire sia i dati per la prima modalità di lavoro da-sorgente-adestinazione che per la prima modalità di lavoro da-destinazione-adestinazione.
In questo modo l’operatore può avere orizzontalmente sullo stesso livello lineare, uno di fianco all'altro, in modo parallelo, tre testi:
a) nel primo campo inferiore (5): il testo sorgente,
b) nel secondo campo inferiore (7): la traduzione automatica ottenuta con un primo motore di traduzione,
c) nel terzo campo inferiore (9): la traduzione automatica ottenuta con un secondo motore di traduzione differente rispetto al motore di traduzione relativo al secondo campo inferiore (7),
dove il secondo campo inferiore (7) à ̈ il campo in cui l'operatore lavora per effettuare correzioni. I vantaggi che si ottengono con questa soluzione derivano dalla considerazione che, come à ̈ ben noto, due differenti macchine di traduzione effettuano traduzioni differenti, cioà ̈ il risultato del testo di destinazione nel secondo campo inferiore (7) à ̈ differente dal risultato del testo di destinazione nel terzo campo inferiore (9).
Così l'operatore può comparare velocemente linea-per-linea II risultato del testo di destinazione del secondo campo inferiore (7) con il risultato del testo di destinazione del terzo campo inferiore (9) ed effettuare immediatamente eventuali modifiche sul secondo campo inferiore (7) con l'aiuto del terzo campo inferiore (9). In altre parole l'operatore utilizzerà le soluzioni migliori del secondo campo inferiore (7) e del terzo campo inferiore (9).
Contemporaneamente l'operatore può comparare il risultato del testo di destinazione del secondo campo inferiore (7) e del terzo campo inferiore (9) con il testo sorgente sul primo campo inferiore (5) per migliorare la comprensione del testo. Contemporaneamente l'operatore à ̈ in grado di guardare il testo sorgente precedentemente elaborato sul primo campo superiore (4), il testo di destinazione precedentemente revisionato e/o corretto e/o modificato sul secondo campo superiore (6) ed il testo di destinazione precedentemente elaborato sul terzo campo superiore (8).
Vantaggiosamente l'operatore lavorerà in modalità linea-per-linea.
Prove effettuate con la soluzione di questa invenzione non soltanto hanno migliorato l'esecuzione della traduzione finale da un punto di vista qualitativo ma hanno permesso anche di ridurre fortemente il tempo di correzione, poiché alcuni problemi di traduzione non risolti con il primo motore di traduzione più probabilmente vengono risolti con il secondo motore di traduzione. Prove effettuate con la soluzione di questa invenzione hanno fornito una riduzione del tempo di completamento di una traduzione circa del 50%.
In accordo con l’invenzione, gli insegnamenti sulla prima macchina di traduzione vengono effettuati in modo strutturato avendo sia sul frammento sorgente che sul frammento di destinazione gli stessi identificatori di parole variabili della stessa categoria, inseriti sul contesto del rispettivo frammento, al fine di ottenere frammenti sorgente e frammenti di destinazione con i medesimi identificatori su entrambi e posizionati nella corretta posizione per ciascun frammento, detti identificatori essendo mescolati con parole definite, formando due corrispondenti frammenti strutturati immagazzinati sulla medesima linea di un contenitore di dati strutturati e dove almeno il primo motore di sub-traduzione à ̈ dotato di mezzi che permettono, dopo aver ricercato con un risultato negativo se un frammento di lingua sorgente ha un corrispondente frammento di lingua di destinazione già tradotto, di incominciare una seconda ricerca su detto contenitore di dati strutturati per verificare la possibilità di abbinare detto frammento con uno di detti dati strutturati in detto contenitore e dove, se il risultato dell'abbinamento à ̈ positivo:
a) si ottiene il corrispondente frammento di destinazione strutturato;
b) si cambiano i rispettivi identificatori sul frammento di destinazione strutturato con corrispondenti traduzioni di parole di destinazione aventi rispettivo codice identificatore. In questo modo la probabilità di ottenere la traduzione di un certo frammento sorgente viene enormemente aumentata, grazie alla riduzione di variabili in detto frammento.
Il risultato sarà:
a) tradurre un certo numero parole alla volta al posto di una complessa analisi di sequenze di parole con forte riduzione del tempo di traduzione e forte riduzione del tempo di lavoro;
b) evitare il passaggio per un gestore di traduzione basato su regole molto vasto;
c) fornire una traduzione già ben effettuata del frammento come da insegnamenti di istruzioni da frammento a frammento;
d) aumentare fortemente la probabilità di abbinamento rispetto a istruzioni da frammento a frammento.
Probabilità di abbinamento
La probabilità di ripetizione di un frammento in un testo si riduce fortemente in modo esponenziale con l'aumentare del numero di parole nella sequenza costituente il frammento, poiché lo stesso frammento può avere componenti di parole in un numero indefinito; per esempio si fa riferimento all'uso di sostantivi poiché i sostantivi possono variare in un certo numero maggiore di 100.000-200.000 per una lingua latina e anche maggiore di 500.000 per il Tedesco.
Così se il frammento sorgente sull'insegnamento contiene due o tre sostantivi, la probabilità di abbinamento si riduce in modo esponenziale.
Esempio I
Si farà riferimento al seguente frammento, consistente in un frammento Italiano e nella sua corrispondente traduzione nella lingua Inglese:
“un gatto selvatico si mangia la coda, thà ̈ cat eats thà ̈ tail, frase"
=frammento sorgente, frammento di destinazione corretto, corrispondente codice di istruzione
Un noto sistema di traduzione consiste nel prefissare la struttura:
articolo+sostantivo+pronome+verbo+articolo+sostantivo (nel linguaggio sorgente, cioà ̈, per l'esempio, in Italiano)
La soluzione sembra facile ma il testo da tradurre non à ̈ così facile come sembra: à ̈ veramente complicato e complesso. Per questa ragione, questa soluzione non à ̈ in grado di fornire una buona traduzione generale a causa della quantità enorme di strutture concepibili.
D'altro canto se noi insegniamo detto frammento, la probabilità di abbinamento in un'altra traduzione generica à ̈ molto bassa poiché serve la corrispondenza esatta dell'intero frammento.
Al contrario con la presente invenzione noi realizziamo una mescolanza di insegnamenti di frammenti strutturati:
un §§§ YYY si mangia il 777 a agYYY so§§§ eats thà ̈ soZZZ, frase
dove:
“un†: articolo Italiano
“§§§â€ : prima variabile del frammento. Questo simbolo può indicare qualsiasi parola “ΥΎΥ†: seconda variabile del frammento. Questo simbolo può indicare qualsiasi parola “si mangia†: verbo Italiano
“il†: articolo Italiano
“777†· terza variabile del frammento. Questo simbolo può indicare qualsiasi parola separatore fra lingua sorgente e lingua di destinazione nell'insegnamento del frammento
“a†: articolo Inglese corrispondente alla traduzione dell'articolo italiano “un†“agYYY†: seconda variabile del frammento nella lingua di destinazione, specificando che à ̈ un aggettivo per mezzo della qualifica (codice di qualificazione/istruzione) “ag", che à ̈ un'abbreviazione di "aggettivo".
“<so>§§§â€ <:>prima variabile del frammento nella lingua di destinazione, specificando che à ̈ un sostantivo per mezzo della qualifica “so", che à ̈ un'abbreviazione di “sostantivo†che in Inglese significa “noun".
“eats†: verbo Inglese corrispondente alla traduzione del verbo italiano “si mangia†“thà ̈†: articolo Inglese corrispondente alla traduzione dell'articolo italiano “il" “soZZZ†: terza variabile del frammento nella lingua di destinazione, specificando che à ̈ un sostantivo per mezzo del codice di qualifica “so", che à ̈ un'abbreviazione di “sostantivo†che in Inglese significa “noun".
separatore fra i frammenti sorgente-destinazione ed il codice di qualificazione/istruzione dell'intero frammento
“frase†: codice di istruzione dell'intero frammento che specifica che à ̈ una frase Così dall'analisi precedente si può vedere che la struttura dell'insegnamento à ̈ la seguente:
(frammento sorgente con struttura mista), (frammento di destinazione con struttura mista), (codice di istruzione dell'intero frammento)
In questo modo abbiamo una mescolanza di parole definite ed identificatori, gli identificatori di destinazione essendo inoltre codificati (nell'esempio mediante i prefissi: “ag, ““so†e ““so†rispettivamente).
In questo modo, quando si cerca di abbinare la struttura, la traduzione viene effettuata soltanto se si possono abbinare anche i rispettivi prefissi del rispettivo identificatore, che à ̈ la qualifica corrispondente.
La soluzione à ̈ immediata in base alla velocità del processore del motore di traduzione, così il risultato sarà fornito per qualsiasi aggettivo e rispettivo sostantivo che si abbinano alla destinazione con struttura mista.
Per esempio se il mio testo da tradurre contiene il frammento in Italiano:
“un cane affamato si mangia il pelo†con la tecnica anteriore di insegnamenti di frammenti la traduzione non può essere fatta poiché non si ha l'abbinamento di questa frase con la frase precedentemente insegnata "un gatto selvatico si mangia la coda". Per contro con questa istruzione mista si otterrà comunque la traduzione, poiché avviene l'abbinamento non soltanto della sequenza degli identificatori ma anche dei rispettivi codici di qualifica sugli identificatori di destinazione.
Naturalmente la macchina di traduzione deve sapere non soltanto che la traduzione di “cane†à ̈ “dog", ma anche che “cane†à ̈ un sostantivo.
Così la traduzione sarà molto veloce non avendo bisogno di realizzare un'analisi “parola per parola†del frammento ma soltanto delle rispettive variabili definite dagli identificatori: “un cane affamato si mangia il peloâ€
Nel linguaggio sorgente:
Articolo †un†- qualsiasi sostantivo - qualsiasi aggettivo - verbo “si mangia†- articolo “il†-qualsiasi sostantivo
“a hungry dog eats thà ̈ hairâ€
Nella lingua di destinazione:
Articolo †a†- qualsiasi aggettivo - qualsiasi sostantivo - verbo “eats†- articolo “thà ̈†-qualsiasi sostantivo
Con questo esempio veramente semplice si può capire che si consente all'utilizzatore la facile realizzazione non soltanto di insegnamenti di frammenti di parole come il precedente ma anche insegnamenti di frammenti strutturati e codificati in una forma mista con rispettivi identificatori §§§, ΥΎΥ, 777 ecc. mescolati con parole fisse esistenti che vengono disposte e leggermente modificate se necessario tramite le istruzioni internamente al motore di traduzione come da metodo usuale.
Con riferimento agli “articoli†ed in generale anche qualsiasi “aggettivo†à ̈ da notare che il motore interno cambierà automaticamente l'articolo fra “un†, “uno", ecc. se necessario secondo la corrispondente regola grammaticale nella lingua di destinazione e declinerà anche automaticamente i sostantivi, se necessario secondo la corrispondente regola grammaticale nella lingua di destinazione. Questo avverrà per qualsiasi lingua di destinazione.
Esempio II
La correzione di insegnamenti corretti su una traduzione automatica errata con la tecnica anteriore precedente era, per esempio, in una traduzione da Tedesco a Inglese: vorzugsweise symmetrisch zur Fahrzeuglàngsachse angeordnet sind
are preferably arranged symmetrically to thà ̈ vehicle longitudinal axis
f
Tali insegnamenti hanno una probabilità molto limitata di essere riutilizzati dal motore di traduzione per via delle variabili di sostantivi, participi passati ed avverbi.
Con la nuova soluzione l'insegnamento strutturato può essere nella seguente forma: vorzugsweise §§§ zur ΥΎΥ angeordnet sind
are preferably arranged aw§§§ to thà ̈ soYYY
f
dove abbiamo due variabili:
“§§§â€œ che si specifica essere un avverbio, mediante la qualifica “aw†, che à ̈ un'abbreviazione di “avverbio†che in Inglese significa “adverb†,
e “YYY†che si specifica essere un sostantivo, mediante la qualifica “so", che à ̈ un'abbreviazione di “sostantivo†che in Inglese significa “noun".
Ma à ̈ pure possibile usare tre variabili, per esempio nel modo seguente: vorzugsweise §§§ zur YYY 777 sind
are preferably ppZZZ aw§§§ to thà ̈ soYYY
f
Dove abbiamo tre variabili:
“§§§â€œ che si specifica essere un avverbio, mediante la qualifica “aw†, che à ̈ un'abbreviazione di “awerbio†che in Inglese significa “adverb†,
“YYY†che si specifica essere un sostantivo, mediante la qualifica “so", che à ̈ un'abbreviazione di “sostantivo†che in Inglese significa “noun",
“777†che si specifica essere un participio passato, mediante la qualifica “pp", che à ̈ un'abbreviazione di “participio passato†.
Andando oltre questo limite, il buon risultato della traduzione non à ̈ assicurato grazie ad una soluzione corrispondente alla soluzione proposta nei sistemi della tecnica anteriore riguardanti traduzioni strutturate sulla base di strutture grammaticali.
Infatti questa non à ̈ una struttura grammaticale ma una struttura statistica che deriva dal modo di parlare abituale e che traduce il testo su cui l'operatore effettua continuamente cambiamenti.
Questa soluzione effettua insegnamenti usando parole fisse mescolate con un certo numero di identificatori che corrisponderanno ad un rispettivo numero di variabili di una certa categoria; tutti i dati di parole in memoria sul motore di traduzione sono dotati di rispettivi codici di istruzione come ben spiegato in precedenti brevetti a nome dello stesso richiedente, così avverrà l'abbinamento soltanto se tutto corrisponderà nel "puzzle" in costruzione rapidamente risolto dal presente motore di traduzione di questa invenzione.
In conformità con l'invenzione il motore di traduzione comprende mezzi per controllare automaticamente se la traduzione automatica à ̈ stata cambiata dall'operatore, immagazzinando automaticamente detti cambiamenti dopo la proposta all'operatore di un rispettivo codice di istruzione (auto-apprendimento interno).
Ovviamente questo tipo di insegnamenti a struttura mista sarà riutilizzato dal motore di traduzione per qualsiasi frammento corrispondente lungo un testo da tradurre e l'abbinamento avverrà per qualsiasi combinazione delle strutture miste di insegnamento memorizzate presenti nel rispettivo contenitore del motore di traduzione.
II vantaggio à ̈:
a) traduzione perfetta e sempre uniforme
b) forte riduzione del tempo di traduzione
c) massima probabilità di riutilizzo degli insegnamenti da parte del motore di traduzione. Esempio III
Per esempio se il testo Tedesco à ̈ differente per quanto riguarda una tale variabile esso può essere sempre intercettato dal motore di traduzione e prontamente ben tradotto come dal seguente esempio:
Testo sorgente:
“vorzugsweise gunstig zur Verfahren gelòst sindâ€
La traduzione automatica sarà immediatamente:
“are preferably solved opportunely to thà ̈ processâ€
La sequenza di identificatori formanti le rispettive variabili sorgenti à ̈:
vorzugsweise §§§ zur ΥΎΥ 777 sind
dove “ §§§â€œ corrisponde a “gLinstig", “YYY“ corrisponde a “Verfahren" e “ZZZ“ corrisponde a “sind“
La sequenza di identificatori formanti le rispettive variabili di destinazione à ̈:
are preferably ppZZZ aw§§§ to thà ̈ soYYY
dove “aw§§§â€œ corrisponde all'avverbio “opportunely", “soYYY “ corrisponde al sostantivo “process" e “ppZZZ" corrisponde al participio passato “solved".
Così non importa cosa siano le variabili §§§, ΥΎΥ, ZZZ, ma per evitare errori nella seguente condizione le variabili tradotte dovrebbero corrispondere ad un certo codice di istruzione singolarmente, come presente nella rispettiva predefinizione aw§§§ (avverbio), soYYY (sostantivo), ppZZZ (participio passato).
Questa forma di insegnamenti mescolati ai precedenti, cioà ̈ la traduzione di frammenti o sequenze di parole identici/che insieme alla traduzione di frammenti misti strutturati, in qualsiasi combinazione darà il risultato migliore.
Ovviamente, se un “frammento identico†à ̈ memorizzato assieme ad un corrispondente “frammento misto strutturato†, il primo sarà preferito dal motore della MT.
Cioà ̈ se abbiamo memorizzato entrambi i seguenti insegnamenti:
- “un §§§ YYY si mangia il 777 a agYYY so§§§ eats thà ̈ soZZZ, frase" - insegnamento di frammento misto strutturato
ed anche
“un gatto selvatico si mangia la coda, thà ̈ cat eats thà ̈ tail, sentence" - insegnamento di frammento identico
il motore di traduzione userà il secondo, che à ̈ l'insegnamento relativo ad un frammento identico.
Così il processo di traduzione si evolve usando un doppio motore di traduzione dotato di mezzi in grado di effettuare il lavoro usando una memoria su cui sono immagazzinati dati almeno del tipo contenente un illimitato numero di: parole / frammenti come insieme di parole di testosorgente, parola / frammento come insieme di parole di testo di destinazione, corrispondente codice d'istruzione, dove esso lavora come di seguito:
Primo sotto-processo: Traduzione da-sorgente-a-destinazione, dove sono disponibili almeno insegnamenti con riferimento a dati sorgente, dati di destinazione e rispettivo codice di istruzione per ciascuno e comprendente almeno i seguenti passi:
la) ricerca/verifica della presenza di precedente insegnamento identico di frammento già tradotto, corretto ed insegnato fra gli insegnamenti già immagazzinati nel sistema;
lb) a seguito di un risultato positivo, traduzione del frammento e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase 1 a);
lc) a seguito di un risultato negativo, verifica della presenza di precedenti insegnamenti a struttura mista di frammenti già tradotti, corretti ed insegnati tramite frammenti strutturati misti ed immagazzinati in un altro contenitore del sistema;
ld) a seguito di un risultato positivo, traduzione del frammento mediante rispettiva traduzione soltanto degli identificatori variabili, loro inserzione ed adattamento seguendo il contesto dei rispettivi codici d'istruzione e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase 1a);
le) a seguito di un risultato negativo completamento della traduzione della prima parola interessata e disposizione e posizionamento della stessa sul testo di destinazione eventualmente adattando corrispondenti parti del testo di destinazione già verificato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase 1 a); lf) ripetizione del processo fino alla terminazione del testo sorgente.
Secondo sotto-processo: Traduzione da-destinazione-a-destinazione dove à ̈ disponibile almeno un insegnamento che si riferisce a dati di destinazione errati provenienti dal primo sotto-processo, rispettiva correzione e rispettivo codice di istruzione per ciascuno e comprendente almeno i seguenti passi:
2a) ricerca/verifica della presenza di precedente insegnamento di frammento identico fra precedenti insegnamenti di frammenti già tradotti, corretti ed insegnati da-destinazione-a-destinazione immagazzinati nel sistema;
2b) a seguito di un risultato positivo, cambiamento del frammento esistente con il frammento corretto precedentemente insegnato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase 2a);
2c) a seguito di un risultato negativo, completamento del controllo della prima parola interessata ed eventuale disposizione e posizionamento della stessa sul testo di destinazione finale eventualmente adattando corrispondenti parti del testo di destinazione già verificato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase 2a); 2d) ripetizione del processo fino alla terminazione del testo sorgente ed invio dell'intera traduzione automatica.
Il suesposto processo può essere usato in qualsiasi macchina di traduzione ed una macchina di traduzione può avere nel rispettivo motore di traduzione anche i mezzi di post-correzione precedentemente descritti per post-correzione della traduzione automatica.
Quindi, in generale, si fornisce un metodo di traduzione al computer, del tipo utilizzante una memoria di dati di parole, un insieme di memoria di dati di parole, ciascuna dotata di un rispettivo codice di istruzione, in almeno una modalità di:
- parola di testo-sorgente, parola di testo-destinazione, corrispondente codice di istruzione - insieme di parole di testo-sorgente, insieme di parole di testo-destinazione, corrispondente codice di istruzione
caratterizzato dal fatto che comprende ulteriormente dei dati misti strutturati contenenti insiemi di una sequenza di parole mescolata con identificatori che saranno considerati variabili nel contesto di un certo numero di parole, dove:
- detti dati misti strutturati contengono un illimitato numero di:
I) insieme di parole di testo-sorgente contenente uno o più identificatore/i posizionati prima o dopo o tra loro, formando un frammento sorgente a struttura mista, II) insieme di parole di testo-destinazione contenente lo stesso numero di detti identificatore/i ma ulteriormente avente un rispettivo codice di istruzione, detto insieme formante un frammento destinazione a struttura mista,
III) corrispondente codice di istruzione dell'insieme riferito almeno a detto frammento destinazione a struttura mista,
- ciascun identificatore su detto frammento sorgente a struttura mista assolutamente corrispondente soltanto a uno stesso identificatore su detto frammento destinazione a struttura mista;
- detto frammento sorgente a struttura mista contenente almeno una parola del testo sorgente;
e dove un processo di traduzione à ̈ dotato delle seguenti fasi:
a) ricerca e verifica della presenza di precedente insegnamento identico fra insegnamenti di frammenti già tradotti, corretti ed insegnati immagazzinati nel sistema;
b) a seguito di un risultato positivo, traduzione del frammento e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a);
c) a seguito di un risultato negativo, ricerca e verifica della presenza di precedente insegnamento a struttura mista tra frammenti già tradotti, corretti ed insegnati tramite frammenti strutturati misti ed immagazzinati in un altro contenitore del sistema; d) a seguito di un risultato positivo, traduzione del frammento mediante rispettiva traduzione soltanto degli identificatori variabili, loro inserzione ed adattamento seguendo il contesto dei rispettivi codici d'istruzione e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a);
e) a seguito di un risultato negativo completamento della traduzione della prima parola interessata e disposizione e posizionamento della stessa sul testo di destinazione eventualmente adattando corrispondenti parti del testo di destinazione già verificato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a);
f) ripetizione del processo fino alla terminazione del testo sorgente.
II metodo può essere ulteriormente caratterizzato dal fatto che utilizza una modalità di traduzione da-destinazione-a-destinazione usando una memoria di un certo numero di dati di destinazione errati con corrispondente rispettiva correzione di destinazione e rispettivo corrispondente codice di istruzione e dove questa traduzione procede almeno con i seguenti passi:
a) ricerca e verifica della presenza di precedenti insegnamenti identici tra frammenti già tradotti, corretti ed insegnati da-destinazione-a-destinazione immagazzinati nel sistema; b) a seguito di un risultato positivo, cambiamento del frammento esistente con il frammento corretto precedentemente insegnato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a);
c) a seguito di un risultato negativo, completamento del controllo della prima parola interessata ed eventuale disposizione e sostituzione della stessa sul testo di destinazione finale eventualmente adattando corrispondenti parti del testo di destinazione già verificato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a);
d) ripetizione del processo fino alla terminazione del testo sorgente ed invio dell'intera traduzione automatica.
e dove:
I) dopo che si à ̈ effettuata una prima traduzione del testo sorgente con una prima macchina traduttrice con modalità da-sorgente-a-destinazione e/o con modalità dadestinazione-a-destinazione, si effettua una seconda traduzione nella stessa lingua di destinazione con una differente macchina traduttrice, mezzi con campi di scorrimento paralleli essendo forniti nella forma di tre colonne, cioà ̈ una prima colonna (1), una terza colonna (3) ed una seconda colonna (2) in mezzo ad esse, sulle quali vengono messi: detto testo sorgente in detta lingua sorgente nella prima colonna (1), un testo di destinazione della prima traduzione nella seconda colonna (2) ottenuto dalla traduzione di detto testo sorgente con detta prima macchina di traduzione ed un testo di destinazione della seconda traduzione nella terza colonna (3) in cui detto testo di destinazione nella terza colonna (3) à ̈ ottenuto dalla traduzione con una seconda macchina di traduzione differente rispetto a quella relativa alla traduzione posizionata nella seconda colonna (2);
II) si forniscono mezzi di post-correzione allo scopo di permettere all'operatore di vedere e controllare le tre colonne linea per linea sullo stesso livello e, con l'aiuto di detti testi di destinazione della prima e seconda traduzione, effettuare cambiamenti su almeno una delle colonne contenenti i testi di destinazione anche con l'aiuto del testo di destinazione contenuto nell'altra colonna.
La presente invenzione comprende inoltre un sistema di traduzione che comprende:
a) almeno una connessione di rete con un numero di dette macchine di traduzione in cooperazione con mezzi di server di rete;
b) un certo numero di traduttori dell'utilizzatore collegati/collegabili in rete ad almeno una di dette macchine di traduzione, ciascuno di detti traduttori dell'utilizzatore avente almeno un motore di traduzione che lavora in modalità da-destinazione-a-destinazione ed avente i sudescritti mezzi di postcorrezione per postcorrezione della traduzione automatica ricevuta per mezzo di a) al fine di correggerla seguendo il metodo di postcorrezione precedentemente esposto.
In questo modo un utilizzatore collegato in rete sarà servito nel modo migliore consentendogli:
di ottenere una migliore traduzione automatica;
di confrontare immediatamente la traduzione automatica ottenuta con un differente motore di traduzione automatica;
di risistemare una traduzione migliore;
di risparmiare tempo grazie alla memorizzazione di cambiamenti ed insegnamenti (auto-apprendimento interno) direttamente sullo stesso motore operativo di traduzione.
Questo permettere inoltre di migliorare una traduzione automatica proveniente da altre MT esterne poiché il motore da-destinazione-a-destinazione rende migliore qualsiasi brutta traduzione indifferentemente dalla provenienza ed indifferentemente dal linguaggio sorgente. Così il miglioramento può avvenire non soltanto in una coppia di lingue di traduzione, per esempio da-lnglese-a-ltaliano, ma in una serie di traduzioni con differente lingua sorgente aventi in comune la stessa lingua di destinazione, per esempio da-Tedesco-a-ltaliano, da-Francese-a-ltaliano, da-Spagnolo-a-ltaliano, ecc. Il rispettivo codice di istruzione à ̈ in grado di dire al motore di traduzione se:
l'insegnamento deve essere applicato alla lingua di destinazione indipendentemente dalla lingua sorgente. Questo à ̈ un codice di istruzione con direzione mancante, per esempio una qualifica come “soms†senza specificare che à ̈ relativa ad una certa traduzione da-sorgente-a-destinazione
l'insegnamento deve essere applicato alla lingua di destinazione in funzione di una certa lingua sorgente. Questo à ̈ un codice di istruzione con direzione, per esempio una qualifica come “soms.enit†che specifica che à ̈ relativa ad una certa traduzione dasorgente-a-destinazione, in questo caso una traduzione da Inglese a Italiano. Quindi l'insegnamento sarà applicato solo per quelle traduzioni per le quali sono specificate le stesse lingue sorgente-destinazione
l'insegnamento deve essere applicato in funzione di un certo dominio indipendentemente dalla lingua sorgente. Questo à ̈ un codice di istruzione con dominio con direzione mancante, per esempio una qualifica come “5soms†dove il numero “5" prima della qualifica “soms†specifica che l'insegnamento à ̈ relativo ad un certo dominio della traduzione identificato dal numero di riferimento “5", in questo caso un dominio relativo al campo della tecnologia. Quindi l'insegnamento sarà applicato solo per quelle traduzioni per le quali à ̈ specificato il medesimo dominio
l'insegnamento deve essere applicato in funzione di un certo dominio ed una certa lingua sorgente. Questo à ̈ un codice di istruzione con direzione e dominio, per esempio una qualifica come “10soms.enit†che specifica che à ̈ relativa ad una traduzione da Inglese a Italiano e ad un certo dominio della traduzione identificato mediante il numero di riferimento “10". Quindi l'insegnamento sarà applicato solo per quelle traduzioni per le quali à ̈ specificato il medesimo dominio e per le quali sono specificate le stesse lingue sorgente-destinazione
e cosi via in qualsiasi combinazione di codici di istruzione con o senza direzione, con o senza dominio, ecc.
L'insegnamento doppio integrato viene ulteriormente fornito per la ritraduzione da-destinazinoea-destinazione durante la postcorrezione del testo di destinazione mediante selezione non soltanto del frammento di destinazione errato nel secondo campo inferiore (7), correggendolo e applicando la sua qualifica come un codice di istruzione ma aggiungendo anche la corrispondente selezione del frammento sorgente nel primo campo inferiore (5). Per selezione si intende la usuale selezione di un frammento di testo effettuata mediante mezzi di selezione comunemente noti. In questo modo il doppio motore di traduzione immagazzinerà automaticamente due tipi di insegnamenti:
a) il frammento sorgente, il corrispondente frammento della traduzione ben fatta e la sua qualifica come codice di istruzione. Cioà ̈ si forniscono tre elementi di dati al motore di traduzione da-sorgente-a-destinazione, e
b) il frammento di destinazione errato, il frammento di destinazione corretto e la stessa corrispondente qualifica come codice di istruzione, e, se à ̈ richiesta la limitazione dell'insegnamento perché sia usato solamente con il frammento sorgente selezionato, anche detto frammento sorgente. Cioà ̈ si forniscono quattro elementi di dati al motore di traduzione da-destinazinoe-a-destinazione.
Vantaggiosamente il sistema di traduzione della presente invenzione comprende anche mezzi per permettere la comunicazione di una macchina di traduzione con un'altra macchina di traduzione dello stesso tipo, il sistema essendo dotato di almeno due macchine di traduzione identiche, una operante come macchina di traduzione principale e la seconda operante come assistente alla prima.
In questo modo grazie alle caratteristiche multiprocessore dei computer di oggi à ̈ possibile effettuare contemporaneamente due differenti traduzioni.
In conformità con questa invenzione, essendo fornita la disponibilità di tre colonne sullo schermo, à ̈ possibile chiedere al motore di effettuare una seconda traduzione su una lingua di destinazione differente ed applicare la seconda traduzione di destinazione sulla terza colonna. In questo modo un operatore che à ̈ in grado di gestire tre lingue sarà in grado di postcorreggere contemporaneamente due lingue di destinazione alla volta, linea per linea, con il risultato di ottenere migliori qualità ed uniformità della traduzione richiesta come pure di risparmiare molto tempo. Qui si fa particolarmente riferimento ai requisiti di traduzione di rivendicazioni da parte dell'Ufficio Brevetti Europeo per il quale le lingue ufficiali sono Inglese, Tedesco e Francese. Un operatore che à ̈ in grado di gestire tre lingue sarà in grado di tradurre le rivendicazioni scritte in una qualsiasi delle tre lingue nelle altre due lingue contemporaneamente. Per esempio per un brevetto scritto in lingua Tedesca, l'operatore sarà in grado di preparare contemporaneamente la traduzione delle rivendicazioni in Inglese e Francese. Per esempio per un brevetto scritto in lingua Inglese, l'operatore sarà in grado di preparare contemporaneamente la traduzione delle rivendicazioni in Tedesco e Francese. Per esempio per un brevetto scritto in lingua Francese, l'operatore sarà in grado di preparare contemporaneamente la traduzione delle rivendicazioni in Tedesco ed Inglese. Si garantiscono qualità, uniformità tra tutte le rivendicazioni e risparmio di tempo.
Naturalmente, in funzione della macchina traduttrice, à ̈ disponibile qualsiasi combinazione di una lingua sorgente e due lingue di destinazione. Solo come esempio, per una brochure uristica o un manuale tecnico, l'operatore sarà in grado di tradurre contemporaneamente il documento da Italiano a Inglese e Spagnolo, o a Tedesco e Portoghese, e cosi via.
I traduttore a tre colonne può essere ben caricato su un attuale computer multi-core e/o multiprocessore dotato di monitor piatto da 17†a 24†per facilità di correzione a video. La diffusione n modo esteso dei cosiddetti monitor “wide screen†consente l'operatività della presente nvenzione in modo ottimale, la larghezza delle tre colonne essendo sufficiente per permettere all'operatore una facile correzione a video.
Vantaggiosamente il metodo di traduzione computerizzata comprende mezzi di regolazione delle dimensioni delle tre colonne che appaiono sullo schermo, detti mezzi di adattamento regolando la larghezza delle tre colonne che appaiono sullo schermo, la somma della larghezza di tutte e tre le colonne essendo uguale alla larghezza dello schermo, lo schermo essendo riempito in larghezza dalle tre colonne.
Vantaggiosamente la postcorrezione dell'operatore viene fornita sulla colonna centrale delle tre colonne che appaiono sullo schermo, cioà ̈ nel modo migliore secondo un punto di vista ergonomico, questa soluzione inoltre permettendo una azione più veloce da parte dell'operatore poiché risulta immediato il confronto fra il testo sorgente sulla prima colonna e testo modificato sulla seconda colonna come pure il confronto fra testo modificato sulla seconda colonna e seconda traduzione alternativa sulla terza colonna, il processo essendo ulteriormente veloce grazie al funzionamento linea-per-linea.
Un utilizzo molto utile di questa invenzione à ̈ pure relativo alla traduzione delle rivendicazioni di una qualsiasi domanda di brevetto europeo per la quale le lingue ufficiali sono Inglese, Tedesco e Francese. Un operatore che traduce, per esempio, le rivendicazioni da una delle tre lingue ufficiali in un'altra lingua (per esempio da Tedesco a Italiano) sarà in grado di avere sulla prima colonna il testo sorgente in lingua Inglese, sulla seconda colonna la traduzione italiana della prima colonna da-lnglese-a-ltaliano e sulla terza colonna la traduzione dello stesso testo da un'altra lingua verso la stessa lingua di destinazione, per esempio da-Francese-a-ltaliano. Questa soluzione può essere fornita sia usando per la terza colonna la stessa macchina traduttrice usata per la seconda colonna sia usando per la terza colonna una macchina traduttrice differente rispetto a quella usata per la seconda colonna, cioà ̈ una macchina di traduzione esterna. Anche in questo modo l'operatore sarà messo in grado di confrontare due differenti testi per ottenere il migliore risultato di traduzione, i due testi essendo generati da testi sorgente differenti (poiché il linguaggio sorgente à ̈ differente) ma relativi allo stesso significato in una qualsiasi delle tre eventuali lingue sorgenti.
Sarà ovvio che, come forma di realizzazione meno preferita, si può pensare un sistema a quattro o più colonne, per esempio:
la prima colonna essendo relativa al “testo sorgente in Inglese†, la seconda colonna essendo relativa al “testo sorgente in Francese†, la terza colonna essendo relativa alla traduzione dal “testo sorgente in Inglese†ed alla correzione, la quarta colonna essendo relativa alla traduzione dal “testo sorgente in Francese†,
oppure
la prima colonna essendo relativa al “testo sorgente in Inglese†, la seconda colonna essendo relativa alla traduzione dal “testo sorgente in Francese†, la terza colonna essendo relativa alla traduzione dal “testo sorgente in Inglese†ed alla correzione, la quarta colonna essendo relativa alla traduzione dal “testo sorgente in Tedesco†, e cosi via.
L'ultima soluzione à ̈ una forma di realizzazione meno preferita poiché l'operatore deve esaminare un maggiore numero di colonne strette. Usualmente il confronto fra due differenti traduzioni à ̈ sufficiente per ottenere un risultato di traduzione molto buono.
Nomenclatura utilizzata
Con riferimento ai numeri identificativi riportati nelle figure allegate, si à ̈ usata la seguente nomenclatura:
1. Prima colonna
2. Seconda colonna
3. Terza colonna
4. Primo campo superiore
5. Primo campo inferiore
6. Secondo campo superiore
7. Secondo campo inferiore
8. Terzo campo superiore
9. Terzo campo inferiore
10. Linea di divisione
11. Campo dei pulsanti

Claims (1)

  1. RIVENDICAZIONI 1.- Metodo di traduzione al computer del tipo utilizzante una memoria di dati di parole, un insieme di memoria di dati di parole, ciascuna dotata di un rispettivo codice di istruzione, in almeno una modalità di: - parola di testo-sorgente, parola di testo-destinazione, corrispondente codice di istruzione - insieme di parole di testo-sorgente, insieme di parole di testo-destinazione, corrispondente codice di istruzione caratterizzato dal fatto che comprende ulteriormente dei dati misti strutturati contenenti insiemi di una sequenza di parole mescolata con identificatori che saranno considerati variabili nel contesto di un certo numero di parole, dove: - detti dati misti strutturati contengono un illimitato numero di: I) insieme di parole di testo-sorgente contenente uno o più identificatore/i posizionati prima o dopo o tra loro, formando un frammento sorgente a struttura mista, II) insieme di parole di testo-destinazione contenente lo stesso numero di detti identificatore/i ma ulteriormente avente un rispettivo codice di istruzione, detto insieme formante un frammento destinazione a struttura mista, III) corrispondente codice di istruzione dell'insieme riferito almeno a detto frammento destinazione a struttura mista, - ciascun identificatore su detto frammento sorgente a struttura mista corrispondente soltanto a uno stesso identificatore su detto frammento destinazione a struttura mista; - detto frammento sorgente a struttura mista contenente almeno una parola del testo sorgente; e dove un processo di traduzione à ̈ dotato delle seguenti fasi: a) verifica della presenza di precedenti insegnamenti identici di frammenti già tradotti, corretti ed insegnati immagazzinati nel sistema; b) a seguito di un risultato positivo, traduzione del frammento e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a); c) a seguito di un risultato negativo, verifica della presenza di precedenti insegnamenti a struttura mista di frammenti già tradotti, corretti ed insegnati tramite frammenti strutturati misti ed immagazzinati in un altro contenitore del sistema; d) a seguito di un risultato positivo, traduzione del frammento mediante rispettiva traduzione soltanto degli identificatori variabili, loro inserzione ed adattamento seguendo il contesto dei rispettivi codici d'istruzione e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a); e) a seguito di un risultato negativo completamento della traduzione della prima parola interessata e disposizione e posizionamento della stessa sul testo di destinazione eventualmente adattando corrispondenti parti del testo di destinazione già verificato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a); f) ripetizione del processo fino alla terminazione del testo sorgente. 2.- Metodo di traduzione al computer secondo la rivendicazione 1 , caratterizzato dal fatto che utilizza una modalità di traduzione da-destinazione-a-destinazione usando una memoria di un certo numero di dati di destinazione errati con corrispondente rispettiva correzione di destinazione e rispettivo corrispondente codice di istruzione e dove questa traduzione procede almeno con i seguenti passi: a) verifica della presenza di precedenti insegnamenti identici di frammenti già tradotti, corretti ed insegnati da-destinazione-a-destinazione immagazzinati nel sistema; b) a seguito di un risultato positivo, cambiamento del frammento esistente con il frammento corretto precedentemente insegnato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a); c) a seguito di un risultato negativo, completamento del controllo della prima parola interessata ed eventuale disposizione e posizionamento della stessa sul testo di destinazione finale eventualmente adattando corrispondenti parti del testo di destinazione già verificato e prosecuzione alla seguente parola del testo sorgente in corso di elaborazione e ripetizione del processo con la fase a); d) ripetizione del processo fino alla terminazione del testo sorgente ed invio dell'intera traduzione automatica. e dove: I) dopo che si à ̈ effettuata una prima traduzione del testo sorgente con una prima macchina di traduzione con modalità da-sorgente-a-destinazione e/o con modalità da-destinazione-a-destinazione, si effettua una seconda traduzione nella stessa lingua di destinazione con una differente macchina traduttrice, mezzi con campi di scorrimento paralleli essendo forniti nella forma di tre colonne, cioà ̈ una prima colonna (1), una terza colonna (3) ed una seconda colonna (2) in mezzo ad esse, sulle quali vengono messi: detto testo sorgente in detta lingua sorgente nella prima colonna (1), un testo di destinazione della prima traduzione nella seconda colonna (2) ottenuto dalla traduzione di detto testo sorgente con detta prima macchina di traduzione ed un testo di destinazione della seconda traduzione nella terza colonna (3) in cui detto testo di destinazione nella terza colonna (3) à ̈ ottenuto dalla traduzione con una seconda macchina di traduzione differente rispetto a quella relativa alla traduzione posizionata nella seconda colonna (2); II) si forniscono mezzi di postcorrezione allo scopo di permettere all'operatore di vedere e controllare le tre colonne linea per linea sullo stesso livello e, con l'aiuto di detti testi di destinazione della prima e seconda traduzione, effettuare cambiamenti su una delle colonne contenenti i testi di destinazione anche con l'aiuto del testo di destinazione contenuto nell'altra colonna. 3.- Metodo di traduzione al computer secondo la rivendicazione 2 caratterizzato dal fatto che si fornisce un motore di auto-apprendimento al fine di auto-memorizzare le variazioni come insegnamenti per riutilizzo nel testo rimanente e nel seguito della traduzione almeno in modalità da-destinazione-a-destinazione. 4.- Metodo di traduzione computerizzata secondo una qualsiasi delle rivendicazioni da 2 a 3, caratterizzato dal fatto che esso comprende mezzi di regolazione delle dimensioni di tre colonne che appaiono sullo schermo, detti mezzi di regolazione regolanti la larghezza delle tre colonne che appaiono sullo schermo, la somma della larghezza di tutte e tre le colonne essendo uguale alla larghezza dello schermo, lo schermo essendo riempito in larghezza dalle tre colonne. 5.- Metodo di traduzione computerizzata secondo una qualsiasi delle rivendicazioni da 2 a 4, caratterizzato dal fatto che la postcorrezione dell'operatore viene fornita sulla colonna centrale delle tre colonne che appaiono sullo schermo. 6.- Metodo di traduzione computerizzata secondo una qualsiasi delle rivendicazioni da 2 a 5, caratterizzato dal fatto che: - ciascuna di dette tre colonne à ̈ composta da due campi sovrapposti a scorrimento verticale separati da una linea di divisione definente un campo superiore e un campo inferiore, la linea di divisione tra il primo campo superiore (4) ed il primo campo inferiore (5) coincide con la linea di divisione tra il secondo campo superiore (6) ed il secondo campo inferiore (7), la quale a sua volta coincide con la linea di divisione tra il terzo campo superiore (8) ed il terzo campo inferiore (9), le tre linee di divisione formanti una unica linea di divisione (10) tra tutti i campi superiori (4, 6, 8) e tutti i campi inferiori (5, 7, 9), e - il testo sorgente ed i due testi di destinazione sono posti su rispettivi campi inferiori e - si forniscono mezzi di trasferimento permettenti all'operatore di trasferire contemporaneamente tutte le prime linee di ciascun campo inferiore nel corrispondente campo superiore, la prima linea del campo inferiore di una data colonna essendo trasferita sotto l'ultima linea presente nel campo superiore corrispondente al campo inferiore di detta data colonna o viceversa. 7.- Metodo di traduzione computerizzata secondo una qualsiasi delle rivendicazioni da 2 a 6, caratterizzato dal fatto che, dopo il completamento della postcorrezione, si forniscono mezzi di invio automatico tramite e-mail per inviare tutti gli insegnamenti che derivano dai cambiamenti effettuati tramite detta postcorrezione ad un Gestore della traduzione centrale funzionante con il metodo secondo la rivendicazione 1. 8.- Macchina di traduzione del tipo utilizzante una memoria di dati di parole, un insieme di memoria di dati di parole, ciascuna dotata di un rispettivo codice di istruzione, in almeno una modalità di: - parola di testo-sorgente, parola di testo-destinazione, corrispondente codice di istruzione -insieme di parole di testo-sorgente, insieme di parole di testo-destinazione, corrispondente codice di istruzione in grado di funzionare secondo il metodo di traduzione computerizzata secondo la rivendicazione 1 , caratterizzata dall'avere un doppio motore di traduzione, prima funzionante in modalità da-sorgente-a-destinazione e poi funzionante immediatamente dopo in modalità dadestinazione-a-destinazione, il motore di traduzione avente almeno dei dati strutturati misti contenenti insiemi di una sequenza di parole mescolata con identificatori che saranno considerati variabili nel contesto di un certo numero di parole, dove: - detti dati misti strutturati contengono un illimitato numero di: I) insieme di parole di testo-sorgente contenente uno o più identificatore/i posizionati prima o dopo o tra loro, formando un frammento sorgente a struttura mista, II) insieme di parole di testo-destinazione contenente lo stesso numero di detti identificatore/i ma ulteriormente avente un rispettivo codice di istruzione, detto insieme formante un frammento destinazione a struttura mista, Ili) corrispondente codice di istruzione dell'insieme riferito almeno a detto frammento destinazione a struttura mista, - ciascun identificatore su detto frammento sorgente a struttura mista assolutamente corrispondente soltanto a uno stesso identificatore su detto frammento destinazione a struttura mista; - detto frammento sorgente a struttura mista contenente almeno una parola del testo sorgente; - detto doppio motore di traduzione contenente ulteriormente una memoria di un certo numero di dati di destinazione errati con corrispondente rispettiva correzione di destinazione e rispettivo corrispondente codice di istruzione e dove: A) si forniscono mezzi di traduzione esterni in grado di funzionare con una macchina di traduzione differente, mezzi di campi a scorrimento parallelo essendo forniti nella forma di tre colonne sulle quali sono disposti: un testo sorgente, un testo di destinazione della prima traduzione che à ̈ la traduzione di detto testo sorgente ottenuta con la prima macchina di traduzione ed un testo di destinazione della seconda traduzione che à ̈ la traduzione di detto testo sorgente ottenuta con detta seconda macchina di traduzione; B) si forniscono mezzi di postcorrezione allo scopo di permettere all'operatore di vedere e controllare le tre colonne linea per linea sullo stesso livello e, con l'aiuto di detti testi di destinazione della prima e seconda traduzione, effettuare cambiamenti su almeno una delle colonne contenenti i testi di destinazione anche con l'aiuto del testo di destinazione contenuto nell'altra colonna. 9.- Macchina traduttrice secondo la rivendicazione 8 caratterizzata dal fatto che à ̈ strutturata come la precedente con la differenza che: a) manca il motore di traduzione interno da-sorgente-a-destinazione, essendo dotata soltanto del motore da-destinazione-a-destinazione e b) ha mezzi di comunicazione in rete con i quali comunica via rete per ottenere automaticamente una traduzione completa usando sia la modalità da-sorgente-adestinazione che da-destinazione-a-destinazione della macchina di traduzione secondo la precedente rivendicazione e, c) ha mezzi di postcorrezione al fine di utilizzare ulteriormente il suo motore di traduzione da destinazione a destinazione in combinazione con detti ulteriori mezzi per realizzare una seconda traduzione esterna con un differente motore di traduzione da posizionare su una terza colonna delle sue proprie tre colonne, la prima colonna essendo intesa a ricevere il testo sorgente e la seconda colonna essendo intesa a ricevere la prima traduzione per post-correzione. 10.- Sistema di traduzione in cui si fornisce un certo numero di macchine di traduzione secondo le rivendicazioni 8 o 9, in cui si fornisce un metodo di traduzione in conformità con una qualsiasi delle rivendicazioni da 1 a 7, comprendente una serie di server di macchine di traduzione collegati ad internet ed una serie di macchine di traduzione di utilizzatori pure collegate ad internet, caratterizzato dal fatto che: - il server di macchine di traduzione lavora automaticamente con un doppio motore di traduzione, cioà ̈ prima in modalità da-sorgente-a-destinazione e poi effettuante automaticamente una ulteriore ritraduzione del testo di destinazione ottenuto in un ulteriore testo automaticamente revisionato in modalità da-destinazione-a-destinazione; - le macchine di traduzione degli utilizzatori sono dotate soltanto di un motore di traduzione in modalità da-destinazione-a-destinazione e sono dotate di mezzi in grado di aprire automaticamente e richiedere contemporaneamente almeno due traduzioni differenti per mettere i risultati su due rispettive colonne di esse. 11.- Metodo di traduzione usante un sistema secondo la rivendicazione precedente caratterizzato dal fatto che la seconda traduzione richiesta dalla macchina di traduzione dell'utilizzatore si riferisce allo stesso testo sorgente ed alla stessa lingua di destinazione ma effettuata mediante una macchina di traduzione differente rispetto a quella usata per la prima traduzione, la traduzione ottenuta essendo posta su una colonna per aiutare l'operatore ad effettuare in modo migliore la postcorrezione. 12.- Metodo di traduzione usante un sistema secondo la rivendicazione 10 o 11 , caratterizzato dal fatto che la seconda traduzione richiesta dalla macchina di traduzione dell'utilizzatore può alternativamente riferirsi allo stesso testo sorgente e a differenti lingue di destinazione ed essere effettuata con la medesima categoria di macchina di traduzione usata per la prima traduzione, la traduzione ottenuta essendo posta su una terza colonna di destinazione permettendo all'operatore di effettuare la postcorrezione su entrambe le due colonne di destinazione linea per linea.
ITUD2009A000133A 2009-07-13 2009-07-13 "metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor" IT1394813B1 (it)

Priority Applications (3)

Application Number Priority Date Filing Date Title
ITUD2009A000133A IT1394813B1 (it) 2009-07-13 2009-07-13 "metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor"
PCT/EP2009/007790 WO2011006524A1 (en) 2009-07-13 2009-10-30 A method of computer translation and post-editing and respective translation machine with post-editor
EP09751792A EP2454687A1 (en) 2009-07-13 2009-10-30 A method of computer translation and post-editing and respective translation machine with post-editor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ITUD2009A000133A IT1394813B1 (it) 2009-07-13 2009-07-13 "metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor"

Publications (2)

Publication Number Publication Date
ITUD20090133A1 true ITUD20090133A1 (it) 2011-01-14
IT1394813B1 IT1394813B1 (it) 2012-07-13

Family

ID=41582008

Family Applications (1)

Application Number Title Priority Date Filing Date
ITUD2009A000133A IT1394813B1 (it) 2009-07-13 2009-07-13 "metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor"

Country Status (3)

Country Link
EP (1) EP2454687A1 (it)
IT (1) IT1394813B1 (it)
WO (1) WO2011006524A1 (it)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491398B (zh) * 2018-03-26 2021-09-07 深圳市元征科技股份有限公司 一种对更新的软件文本进行翻译的方法及电子设备
CN116992892A (zh) * 2023-07-06 2023-11-03 四川语言桥信息技术有限公司 基于数据增强和多任务训练改善ape模型的方法、系统及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007104492A2 (en) * 2006-03-15 2007-09-20 D'agostini Organizzazione Srl Acceleration method and system for automatic computer translation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007104492A2 (en) * 2006-03-15 2007-09-20 D'agostini Organizzazione Srl Acceleration method and system for automatic computer translation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHRISTOS MALAVAZOS ET AL: "TOWARDS MEMORY AND TEMPLATE BASED TRANSLATION SYNTHESIS", MT 2000 CONFERENCE, EXETER, UK, 19 November 2000 (2000-11-19), XP002520054 *
DOMINIQUE ESTIVAL AND JENNIFER BIGGS: "The Language Translation Interface and automated language translation tools for the Australian Defence Organisation", EIGHTH INTERNATIONAL COMMAND AND CONTROL RESEARCH AND TECHNOLOGY SYMPOSIUM, 17 June 2003 (2003-06-17), Washington, DC, USA, XP002568065, Retrieved from the Internet <URL:http://web.science.mq.edu.au/~destival/ICCRTS-03_Estival-biggs.pdf> [retrieved on 20100211] *

Also Published As

Publication number Publication date
EP2454687A1 (en) 2012-05-23
WO2011006524A1 (en) 2011-01-20
IT1394813B1 (it) 2012-07-13

Similar Documents

Publication Publication Date Title
ITUD20060067A1 (it) Metodo e sistema di velocizzazione della traduzione automatica al computer
CN112560510B (zh) 翻译模型训练方法、装置、设备及存储介质
US11256409B2 (en) Systems, methods, devices, and computer readable media for facilitating distributed processing of documents
Daems et al. On the origin of errors: A fine-grained analysis of MT and PE errors and their relationship.
CN108932233B (zh) 翻译文生成方法、翻译文生成装置以及翻译文生成程序
JP2015060458A (ja) 機械翻訳装置、方法、及びプログラム
Neme A lexicon of Arabic verbs constructed on the basis of Semitic taxonomy and using finite-state transducers
ITUD20090133A1 (it) &#34;metodo di traduzione e postcorrezione al computer e rispettiva macchina traduttrice con post-editor&#34;
Niehues et al. Domain adaptation in statistical machine translation using factored translation models
Ngo et al. Building an English-Vietnamese bilingual corpus for machine translation
CN103257985A (zh) 同时查询插入显示多个跨域名数据库的装置和方法
Zhivotova et al. Improving the quality of scientific articles machine translation while writing original text
CN104050156A (zh) 用于提取最大名词短语的装置、方法以及电子设备
Pirinen Apertium-fin-eng–rule-based shallow machine translation for WMT 2019 shared task
Raulji et al. Bilingual Dictionary for Sanskrit—Gujarati MT Implementation
Habash REMOOV: A tool for online handling of out-of-vocabulary words in machine translation
Neme A fully inflected Arabic verb resource constructed from a lexicon of lemmas by using finite-state transducers
JP6663881B2 (ja) 並列句解析装置、並列句解析モデル学習装置、方法、及びプログラム
Sánchez-Martínez et al. Using alignment templates to infer shallow-transfer machine translation rules
Kovář et al. DMoG: A Data-Based Morphological Guesser
Haralambous et al. Tailoring a controlled language out of a corpus of maintenance reports
Sánchez et al. Obtaining Word Phrases with Stochastic Inversion Translation Grammars for Phrase-based Statistical Machine Translation
JP3353873B2 (ja) 機械翻訳装置
JP6599188B2 (ja) 対訳辞書作成装置、対訳辞書作成方法およびプログラム
JPS6180360A (ja) 翻訳方式