-
Die
Erfindung betrifft ein Verfahren und ein System zum Übersetzen
eines aus einem Satz oder Satzteil bestehenden Textes aus einer
ersten Sprache in zumindest eine weitere Sprache. Weiterhin betrifft
die Erfindung ein Computer-Programm-Produkt mit einem computerlesbaren
Medium mit einer darauf aufgezeichneten Computerprogrammlogik, welches
zum Übersetzen eines Textes verwendet wird, um den Text
von einer ersten Sprache in zumindest eine weitere Sprache zu übersetzen.
-
Das
Konzept einer maschinellen Übersetzung, mit welcher ein
Dokument von einer menschlichen Sprache in eine andere übersetzt
wird, ist umfangreich untersucht worden. Dabei hat sich gezeigt, dass
die Feinheiten der menschlichen Sprache beim Entwickeln von Übersetzungssystemen
beachtet werden müssen. Beispielsweise ist die Bedeutung bestimmter
Worte im Kontext zu berücksichtigen, da spezifische Redewendungen
Bedeutungen haben können, die aus den einzelnen Worten
nicht offensichtlich sind, und einige Worte verschiedene Bedeutungen
in verschiedenen Kontexten haben.
-
Aus
der
DE 28 54 837 A1 ist
es bekannt, die Wörter nach Wortstämmen anzuordnen.
Zu jedem Wortstamm sind zusätzliche Informationen abgespeichert,
beispielsweise ob es sich um ein Substantiv, ein Verb oder dergleichen
handelt, oder ob ein Schlüsselwort für Redewendungen,
ein unregelmäßiges Verb usw. vorliegt. Auch sind
jeweils die Buchstaben des Wortstamms sowie die Adressen der Übersetzungen
abgespeichert. Besonderheiten im Zusammenhang mit Komposita sind
nicht offenbart.
-
Des
Weiteren sind Textübersetzungssysteme bekannt, in denen
ein Computersystem einem Übersetzer Vorschläge
für die Übersetzung der einzelnen Wörter
eines Textes macht. In diesem Fall liest das Computersystem die
zu jedem Wort des Textes abgespeicherte Übersetzung aus
den Speichermitteln aus und zeigt sie dem Übersetzer beispielsweise
auf einem Bildschirm an. Der Übersetzer kann diese vorgeschlagenen Übersetzungen
dann übernehmen, muss aber die einzelnen Übersetzungen
noch zu einem übersetzten Text zusammenfügen.
Das Textübersetzungssystem ist somit ein Werkzeug des Übersetzers
für die Erstellung der Übersetzung.
-
Es
sind jedoch auch Textübersetzungssysteme bekannt, die eine
vollautomatische Übersetzung anstreben. Bei diesen Textübersetzungssystemen wird
auch das Zusammenfügen der aus den Speichermitteln ausgelesenen Übersetzungen
zu dem übersetzten Text nach bestimmten Übersetzungsregeln
von dem Computersystem selbst durchgeführt.
-
In
beiden Fällen ist es erforderlich, dass in den Speichermitteln
des Computersystems sämtliche Wörter der Quellsprache
sowie sämtliche zugehörigen Übersetzungen
der Zielsprache abgespeichert sind.
-
Die
DE 197 09 968 A1 offenbart
bereits ein Verfahren und ein System zum Übersetzen eines
Dokuments aus einer ersten Sprache in eine zweite Sprache, welches
die Schritte aufweist: Eingeben eines Dokuments, welches in einer
ersten Sprache abgefasst ist, Analysieren von Information, die in
dem Dokument enthalten ist, Erzeugen eines Analyseergebnisses, Auswählen
einer Übersetzungsressource entsprechend dem Analyseergebnis,
welche zum Übersetzen des Dokuments verwendet wird, und Übersetzen
des Dokuments aus der ersten Sprache in eine zweite Sprache mit
Hilfe der Übersetzungsressource, welche ausgewählt
worden ist. Das Originaldokument, welches zu übersetzen
ist, enthält Information, welche das Wörterbuch
oder Übersetzungsvorschriften angibt, welche für
die Übersetzung zu benutzen sind. Auf einem Display werden
das Originaldokument und das übersetzte Dokument nebeneinander
dargestellt, um es dem Benutzer zu ermöglichen, das Originaldokument
mit dem übersetzten Dokument zu vergleichen.
-
Bevor
eine Übersetzung durchgeführt werden kann, muss
eine Dokumenten-Typ-Definition (DTD) geschaffen werden, welche die
zulässigen Hinweissymbole und den zulässigen Aufbau
eines Dokuments definiert. Beispielsweise kann ein Dokument, das
eine Vorrichtung, wie einen Scanner beschreibt, größere
Abschnitte, wie einen Überblick, eine Beschreibung der
Hardware des Scanners, eine Beschreibung der in dem Scanner benutzten
Software, und zusätzliche Angaben oder Optionen haben, die
in Verbindung mit dem Scanner benutzt werden können. Der Übersichtsabschnitt
kann den Namen oder die Beschreibung der Vorrichtung, eine Abbildung,
die den Scanner zeigt, und eine Merkmalsliste des Scanners enthalten.
-
Nachdem
die Dokumenten-Typ-Definition festgesetzt worden ist, müssen
das Wörterbuch und die Vorschriften-Datenbasen, welche
bei dem Übersetzungsprozess zu verwenden sind, festgelegt
werden. Eine Art, die Wörterbücher und Vorschriften
zu schaffen, die für das Übersetzen der verschiedenen Abschnitte
des Dokuments verwendet worden sind, besteht darin, Dokumente mit
einer bekannten Übersetzung einzugeben. Auf diese Weise
kann das System automatisch die Wörterbuch- und Übersetzungsvorschriften
bilden, sodass die Übertragung des Dokuments auf eine richtige,
bekannte Übersetzung hinausläuft. Zusätzlich
oder alternativ zu der Übersetzung bekannter Dokumente
kann ein Benutzer ein Dokument selbst übersetzen, wobei
Wörterbücher und Vorschriften basierend auf der
Eingabe eines Benutzers gebildet werden. Ferner kann eine Kombination
von automatischer und ”manueller” Übersetzung durchgeführt
werden, was dem Benutzer ermöglicht, die automatisch durchgeführten Übersetzungen
zu korrigieren, sodass die sich ergebende Übersetzung genauer
ist. Als eine weitere Alternative können die Vorschriften
und Wörterbücher ”manuell” geschaffen werden.
-
Bei
einer bevorzugten Arbeitsweise gemäß dieser vorstehend
genannten Erfindung wird eine gesonderte Datenstruktur für
jeden der verschiedenen Abschnitte des Dokuments benutzt. Die Datenstruktur
speichert Informationen, wie die Namen und Speicherstellen weiterer
Wörterbücher und Vorschriften, welche bei dem
entsprechenden Abschnitt oder anderen Abschnitten des Dokuments
benutzt werden können. Das Benutzen der Datenstruktur,
um die Wörterbücher und Vorschriften zu verfolgen,
erlaubt es, die verschiedenen Wörterbücher und
Vorschriften in einer Hierarchie anzuordnen, welche einer Hierarchie
der Struktur des Dokuments entspricht.
-
Wenn
das Übersetzungssystem ausreichend entwickelt und trainiert
ist, kann der Übersetzungsprozess mit Hilfe der spezifischen
Wörterbuchinformation und der Übersetzungsvorschriften,
welche einem ganz bestimmten Abschnitt des Dokuments entsprechen,
automatisch erfolgen. Durch Verwenden der spezifischen Wörterbuchinformation
und Vorschriften für die verschiedenen Teile des Dokuments wird
die Übersetzung genauer und kommt einer Eins-zu-eins-Entsprechung
zwischen dem Quellendokument und dem übersetzten Dokument
ohne irgendwelche Belastungen oder Schwierigkeiten näher.
-
Die
DE 41 35 261 C1 bezieht
sich auf eine elektronische Vorrichtung und ein entsprechendes Verfahren
zur Übersetzung von Wörtern aus einer ersten in
eine zweite Sprache, bei dem im Speicher eines Computersystems zu
jedem Wort der Quellsprache die Wortart, der semantische Typ, ein
Fugencode, ein Positionscode, ein Transfercode sowie die zugehörige Übersetzung
in die Zielsprache abgespeichert sind. Mit Hilfe des Fugencodes
und des Positionscodes werden Komposita der Quellsprache in diejenigen
Wörter zerlegt, aus denen sie zusammengesetzt sind. Zu
diesen Wörtern werden die zugehörigen Übersetzungen
in die Zielsprache aus dem Speicher ausgelesen. Diese Übersetzungen
werden dann anhand von allgemeinen Übersetzungsregeln zusammengefügt.
Dabei werden mit Hilfe des Transfercodes Besonderheiten bei der Übersetzung
von Komposita berücksichtigt. Es ist nicht mehr erforderlich,
das Kompositum als Ganzes in den Speichermitteln abzuspeichern,
sondern es genügt, die Bestandteile des Kompositums, also
die einzelnen Wörter und deren Übersetzungen,
in den Speichermitteln abzulegen.
-
Ein
weiteres elektronisches Übersetzungsgerät gemäß der
DE 31 15 318 A1 ,
bei dem erste Wörter in einer ersten Sprache eingegeben
werden und das diesen ersten Wörtern entsprechende zweite
Wörter in einer zweiten Sprache wiedergibt, ist mit einer
Tastatur zum Eingeben der ersten Wörter und die zweiten
Wörter speichernden Speichern sowie mit Zugriffseinrichtungen
zum Adressieren der Speicher und zum Wiederauffinden der zweiten
Wörter ausgestattet. Mit den Zugriffseinrichtungen werden die
zweiten Wörter in derselben Reihenfolge wie die der ersten
Wörter wiedergeben und mittels einer Anzeigeeinrichtung
die zweiten Wörter in Abhängigkeit von der Zugriffseinrichtung
in derselben Reihenfolge wie die ersten Wörter angezeigt.
Die Zugriffseinrichtungen hat einen Mikrocomputer mit einer Operationsbefehlsschaltung,
die Mikrobefehle für bestimmte Funktionen des Übersetzers
enthält oder erzeugt, ein mit der Operationsbefehlsschaltung
verbundenes Adressenregister zur Erzeugung aufeinanderfolgender
Mikrobefehle durch die Operationsbefehlsschaltung, eine Zentraleinheit,
welche die ihr zugeführten Mikrobefehle decodiert und bestimmte
Operationen ausführt, und einen Datenspeicher, der in Abhängigkeit
von der Zentraleinheit Daten speichert und bereitstellt.
-
Vor
diesem Hintergrund liegt der Erfindung die Aufgabe zugrunde, eine
Möglichkeit für eine zuverlässige, insbesondere
eineindeutige Übersetzungsmöglichkeit zu schaffen.
Insbesondere soll eine simultane Übersetzung in eine Vielzahl
von Sprachen ermöglicht werden.
-
Diese
Aufgabe wird gelöst, indem bereits zur Zeit der Testerstellung
eine maschinengestützte Prüfung auf Eineindeutigkeit
vorgenommen wird. Insbesondere wird die Aufgabe erfindungsgemäß mit
einem Verfahren zum Übersetzen eines aus einem Satz oder
Satzteil bestehenden Textes aus einer ersten Sprache in zumindest
eine weitere Sprache, insbesondere in eine Vielzahl von Sprachen,
gelöst, wobei nacheinander die folgenden Verfahrensschritte durchgeführt
werden: Auswahl einer dem Satz oder Satzteil entsprechenden Satzstruktur
mit einem in allen Sprachen grammatikalisch korrekten Satzbau aus
einer Datenbank, Darstellung einer Folge von Eingabefeldern in Abhängigkeit
der ausgewählten Satzstrukturen aus einer Datenbank zur
Eingabe oder Auswahl von Worten durch den Benutzer, Prüfung
bei oder unmittelbar nach der Eingabe jedes Wortes auf eine Eineindeutigkeit
in allen Sprachen, wobei vorzugsweise bei einer festgestellten fehlenden
Eineindeutigkeit eine Eingabeaufforderung zur Auswahl aus einer
Datenbank zur näheren Bestimmung des Wortes zur Erzielung
der Eineindeutigkeit in allen Sprachen erfolgt, Übersetzen
des Textes in mehrere Sprachen und Ausgabe des übersetzten Textes.
Die Erfindung geht dabei von der Erkenntnis aus, dass nicht etwa
ein umfangreicher erfahrungsbasierter Datenbankinhalt zu einer eindeutigen Übersetzung
führt, sondern vielmehr eine Eineindeutigkeit lediglich
durch entsprechende Vorgaben, insbesondere also Eingaberegeln für
den Benutzer erreichbar ist. Erfindungsgemäß kann
als der Text nur innerhalb vorgegebener Sprachregeln, die auf allen
hier relevanten Sprachen basieren, erzeugt werden. Nicht eineindeutige
Texte bzw. Wortfolgen führen zu einem Signal und eröffnen
insbesondere ein Auswahlfeld. Vorzugsweise werden die Worte unmittelbar
bei der Eingabe mit dem in der Datenbank abgelegten Vokabular und
der Struktur als Sinneinheiten abgeglichen, sodass für
den Benutzer erkennbar oder aber verborgen grundsätzlich
lediglich eine Auswahl getroffen werden kann. Insbesondere muss
eine Eindeutigkeit bei Homonymen für alle Sprachen gegeben
sein. Somit sind beispielsweise Wortneuschöpfungen grundsätzlich
ausgeschlossen oder werden als Eigenname nicht übersetzt.
Die zuverlässige Übersetzung erfordert darüber
hinaus auch einen grammatikalisch korrekten Satzbau, der ebenfalls
mit hinterlegten Strukturen abgeglichen wird.
-
In
der Praxis nimmt also der Benutzer gemäß dem Verfahren
in einem ersten Schritt eine Auswahl einer Satzstruktur mit einem
in allen Sprachen grammatikalisch korrekten Satzbau umfassend eine
Folge von Eingabefeldern aus einer Datenbank vor, die er in einem
zweiten Schritt mit Worten füllt, wobei bei oder unmittelbar
nach der Eingabe jedes Wortes eine Prüfung auf eine fehlende
Eineindeutigkeit in zumindest einer Sprache erfolgt, und bei einer
festgestellten, fehlenden Eineindeutigkeit eine Eingabeaufforderung
als Auswahl zur näheren Bestimmung des Wortes zur Erzielung
der Eineindeutigkeit in allen Sprachen erfolgt.
-
Dabei
wird eine besonders vorteilhafte Ausgestaltung des erfindungsgemäßen
Verfahrens dann realisiert, wenn die ausgewählten Worte
zusammen mit einer Beschreibung oder Synonymen dargestellt werden.
Hierdurch wird dem Benutzer ein einfaches Werkzeug zur Verbesserung
seiner Wortwahl im Hinblick auf die Eindeutigkeit des Sinngehaltes
zur Verfügung gestellt. Auf diese Weise kann der Benutzer bereits
während der Eingabe seinen Text mit seiner gewollten Aussage
vergleichen, um so eine kritische Prüfung zu ermöglichen.
In Ergänzung einer aus einem kurzen Text bestehenden Beschreibung
oder den jeweils aus einem Einzelwort bestehenden Synonymen sind
auch Abbildungen des betreffenden Gegenstandes zur schnelleren Identifikation
denkbar. Beispielsweise können so Fachbegriffe auch für
den Laien eindeutig bestimmt bzw. bestätigt werden.
-
Eine
andere besonders zweckmäßige Weiterbildung der
Erfindung wird dann geschaffen, wenn bereits aufgrund einzelner
Worte eine Vorauswahl möglicher auszuwählender
Satzstrukturen erfolgt, sodass die Satzstrukturen aufgrund der Eingabe
der Einzelworte des Textes einer Vorauswahl unterworfen sind. Unzulässige
Mehrdeutigkeiten müssen bereits während der Eingabe
erkannt und präzisiert werden. Zugleich wird dem Benutzer
ein Grundgerüst als Eingabehilfsmittel zur Verfügung
gestellt, um so beispielsweise Verkürzungen oder Auslassungen mit
der Folge fehlender Eindeutigkeit ausschließen zu können.
-
Eine
besonders vorteilhafte Abwandlung des erfindungsgemäßen
Verfahrens wird auch dann erreicht, wenn der Text in der Ursprungssprache
und zumindest einer weiteren Sprache zugleich dargestellt wird.
Hierdurch erhält der Benutzer nicht nur eine schnelle Übersicht über
das Ergebnis des Übersetzungsvorganges, sondern kann aufgrund
der unmittelbaren Rückmeldung aus dem Übersetzungsergebnis
seine Texteingabe gegebenenfalls entsprechend anpassen oder variieren.
Somit können auch individuelle Vorgaben schnell umgesetzt
werden.
-
Eine
andere, ebenfalls besonders praxisgerechte Ausgestaltung der Erfindung
wird dadurch erreicht, dass der in zumindest eine weitere Sprache übersetzte
Text zurück in die Ursprungssprache übersetzt
und zusammen mit dem ursprünglichen Text dargestellt wird.
Der Benutzer erhält dadurch Gewissheit und Bestätigung
der erfolgreichen Übersetzung, indem er das Ergebnis der
doppelten Übersetzung in eine Fremdsprache und zurück
in die Ursprungssprache problemlos mit dem Ursprungstextes vergleichen
kann. Insbesondere eine Darstellung des Ursprungstext und des in
die Ursprungssprache zurück übersetzten Textes
in benachbarten Darstellungsfeldern gestattet eine schnelle Kontrolle
des Benutzers, wobei Abweichungen schon allein aufgrund der visuellen
Abweichung erkannt werden. Außerdem können durch
beliebige Änderung der Benutzersprache des Programms auch
mehrere Autoren unterschiedlicher Sprache sequentiell an demselben Text
arbeiten, was insbesondere in internationalen technischen Teams
bei Fehlerlisten und Pflichtenheften von Vorteil ist.
-
Die
erfindungsgemäße Aufgabe wird weiterhin auch gelöst
mit einem System zum Übersetzen eines aus einem Satz oder
Satzteil bestehenden Textes aus einer ersten Sprache in zumindest
eine weitere Sprache, insbesondere in eine Vielzahl von Sprachen,
umfassend ein erstes Auswahlfeld mit Satzstrukturen für
einen in allen Sprachen grammatikalisch korrekten Satzbau, ein Darstellungsfeld
für eine Folge von Eingabefeldern in Abhängigkeit
der ausgewählten Satzstrukturen aus einer Datenbank zur
Eingabe von Wörtern durch den Benutzer, eine Steuereinheit
zur Prüfung bei oder unmittelbar nach der Eingabe jedes
Wortes auf eine Eineindeutigkeit in allen Sprachen, ein zweites
Auswahlfeld in Abhängigkeit einer festgestellten, fehlenden
Eineindeutigkeit zur Auswahl aus einer Datenbank zur näheren Bestimmung
des Wortes zur Erzielung der Eineindeutigkeit in allen Sprachen
und eine Ausgabeeinheit für eine Übersetzung des
Textes in mehreren Sprachen, um so die für die Praxis grundlegende
Eineindeutigkeit der Übersetzung zuverlässig zu
erreichen. Dabei wird durch das System zumindest eine Satzstruktur
zur Auswahl bzw. Bestätigung durch den Benutzer vorgegeben,
die dieser dann entsprechend einem in allen Sprachen grammatikalisch
korrekten Satzbau als eine Folge von Eingabefeldern visualisiert
erhält. Die Eingabefelder sind in Abhängigkeit einer
von dem System vorgegebenen, für den Benutzer erkennbaren
oder nicht erkennbaren Auswahl von diesem auszufüllen.
Dabei ist zwar grundsätzlich nicht auszuschließen,
dass Sprachelemente – wie beispielsweise die Phonetik – aufgrund
der Vorgaben des Systems unberücksichtigt bleiben. Solche
Aspekte treten aber im Hinblick auf die gewünschte Eineindeutigkeit
der Übersetzung zurück.
-
Weiterhin
wird die Aufgabe auch gelöst durch ein Computer-Programm-Produkt
mit einem computerlesbaren Medium mit einer darauf aufgezeichneten
Computerprogrammlogik, welches zum Übersetzen eines Textes
mittels eines Computers verwendet wird, um den Text von einer ersten
Sprache in zumindest eine weitere Sprache zu übersetzen,
mit einer Einrichtung zur Darstellung eines ersten Auswahlfeldes
mit Satzstrukturen für einen in allen Sprachen grammatikalisch
korrekten Satzbau und zum Erzeugen eines Darstellungsfeldes für
eine Folge von Eingabefeldern in Abhängigkeit der ausgewählten
Satzstrukturen aus einer Datenbank zur Eingabe von Wörtern
durch den Benutzer, einer Steuereinheit zur Prüfung bei
oder unmittelbar nach der Eingabe jedes Wortes auf eine Eineindeutigkeit
in allen Sprachen, einem zweiten Auswahlfeld in Abhängigkeit
einer festgestellten, fehlenden Eineindeutigkeit zur Auswahl aus
einer Datenbank zur näheren Bestimmung des Wortes zur Erzielung
der Eineindeutigkeit in allen Sprachen und einer Ausgabeeinheit
für eine Übersetzung des Textes in mehreren Sprachen. Es
gibt also einen eingeschränkten Wort- und Satz-Schatz,
dafür wird aber Eineindeutigkeit der Übersetzung
geboten.
-
Die
Erfindung lässt verschiedene Ausführungsformen
zu. Zur weiteren Verdeutlichung ihres Grundprinzips ist eine davon
in der Zeichnung dargestellt und wird nachfolgend beschrieben. Diese
zeigt in einer Prinzipdarstellung ein System zum Übersetzen
eines aus einem Satz oder Satzteil bestehenden Textes aus einer
ersten Sprache in zumindest eine weitere Sprache auf einer Benutzeroberfläche 1,
beispielsweise einem Computerdisplay. Der Benutzer entwickelt seinen
Text demnach innerhalb der Softwareoberfläche des Systems.
Diese erzeugt Vorgaben hinsichtlich des Vokabulars und der Satzstrukturen,
insbesondere der Sinneinheiten aus einem Sprachvorrart, innerhalb
dessen eindeutige Übersetzungen möglich sind.
Hierzu werden dem Benutzer ein Auswahlfeld 2 mit Satzstrukturen
für einen in allen Sprachen grammatikalisch korrekten Satzbau
sowie ein Satz- und Wortspeicher gestellt. Hieraus ergibt sich ein
graphisches Darstellungsfeld 3 als eine Folge von Eingabefeldern 4 in
Abhängigkeit der ausgewählten Satzstrukturen,
in welcher der Benutzer die ausgewählten Wörter
eingibt oder durch Bestätigung seiner Auswahl aus dem Satz-
und Wortspeicher einfügt. Simultan zu der Eingabe wird
dem Benutzer in mehreren Sprachen, die er individuell bestimmen kann,
in einer Ausgabeeinheit 5 eine Übersetzung des
Textes dargestellt, die zu Kontrollzwecken auch eine Rückübersetzung
in die Ausgangssprache umfasst. Selbstverständlich kann
die Benutzeroberfläche auch weitere, an sich bekannte Funktionen,
beispielsweise Textverarbeitungsfunktionen, umfassen. Vorzugsweise
ist ein Auswahlfeld für die jederzeit änderbare
Benutzersprache 6 vorhanden, sodass der Benutzer das Programm
also in einer beliebigen Sprache aus dem Sprachraum benutzen kann.
Das Programm selbst, also Menüs, Dialoge usw., der Phrasen-,
Satzteil- und Wortschatz und die anzeigbaren Definitionen im Fenster,
erscheinen in dieser gewählten Benutzersprache 6.
Durch das erfindungsgemäße System wird erstmals
ein sprachunabhängiger Metatext erzeugt, der eine Eineindeutigkeit
bei der Übersetzung in beispielsweise alle Sprachen der europäischen
Gemeinschaft sowie weiterer wichtiger Sprachen gestattet und insbesondere
einen missverständnisfreien Text durch hinterlegte, anzeigbare
Definitionen der Wörter und Satzteile in der jeweiligen Zielsprache
ermöglicht.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- - DE 2854837
A1 [0003]
- - DE 19709968 A1 [0007]
- - DE 4135261 C1 [0012]
- - DE 3115318 A1 [0013]