-
Die vorliegende Erfindung betrifft ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache gemäß dem Oberbegriff des Anspruches 1 sowie eine Datenverarbeitungseinrichtung gemäß dem Oberbegriff des Anspruches 12.
-
Bei der Übersetzung eines aus einer Wortfolge oder mehreren Wortfolgen gebildeten Textes einer Quellsprache in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache ist es wesentlich, den Kontext der Wortfolge zu erkennen, um sprachliche Missverständnisse zu vermeiden. Sprachliche Missverständnisse beruhen im Allgemeinen auf einer Fehlinterpretation eines einzelnen Begriffes in einer Wortfolge, welchem in der Quellsprache in Abhängigkeit vom Kontext, in welchem dieser Begriff genutzt wird, verschiedene inhaltliche Bedeutungen zukommen. Man spricht in diesem Zusammenhang von einem homonymen beziehungsweise polysemen Begriff oder auch von einem Begriff mit lexikalischer Mehrdeutigkeit. Beispielhaft sei hierfür der deutsche Begriff „Verletzung“ angeführt, der bei einer Übersetzung ins Englische unterschiedlich interpretierbar ist. So kann der deutsche Begriff „Verletzung“ unter anderem im Englischen mit „injury“ oder „infringement“ übersetzt werden. Während der Begriff „injury“ im medizinischen Kontext als das Vorliegen physischen Verletzung eines Lebewesens verstanden wird, wird der Begriff „infringement“ im juristischen Kontext als eine Rechtsverletzung durch eine Handlung eines Dritten verwendet. Ein Verfahren respektive eine Datenverarbeitungseinrichtung zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache ist, im Gegensatz zu einem Humanübersetzer, nicht oder nur bedingt in der Lage, den Kontext einer Wortfolge in der Quellsprache zu erkennen, in welchem der Begriff verwendet wird, um diesen dem richtigen Begriff in der Zielsprache zuordnen zu können. Entsprechend bedarf eine maschinelle Übersetzung einer Überarbeitung durch einen Humanübersetzer, wenn es gilt, inhaltliche Missverständnisse auszuräumen und zu vermeiden. Dies gilt insbesondere für Übersetzungen in sensiblen Bereichen wie technische Dokumentationen.
-
Aus der
EP 0 737 928 A1 sind ein Verfahren sowie eine Datenverarbeitungseinrichtung der eingangs genannten Art vorbekannt.
-
Aufgabe der vorliegenden Erfindung ist es, das Verfahren sowie die Datenverarbeitungseinrichtung der eingangs genannten Art derart weiterzuentwickeln, dass diese sich durch eine geringere Fehleranfälligkeit und eine höhere Verarbeitungsgeschwindigkeit auszeichnen.
-
Diese Aufgabe wird bezogen auf ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache durch die kennzeichnenden Merkmale des Anspruches 1 und bezüglich einer Datenverarbeitungseinrichtung durch die kennzeichnenden Merkmale des Anspruches 12 gelöst.
-
Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand der Unteransprüche.
-
Gemäß dem Anspruch 1 wird ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache vorgeschlagen, welches durch die nachfolgenden Verfahrensschritte gekennzeichnet ist:
- a) Eingeben der in der Quellsprache abgefassten Wortfolge;
- b) Analysieren der Wortfolge und Identifizieren von Begriffen mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank, denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind;
- c) Auswahl eines Begriffsidentifikators in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge;
- d) Auswahl eines mit dem ausgewählten Begriffsidentifikator korrespondierenden Begriffes in der Zielsprache;
- e) Übersetzen der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache;
- f) Ausgeben der Wortfolge in der Zielsprache.
-
Die zu übersetzende Wortfolge, die sich aus einem einzelnen Begriff oder mehreren Begriffen zusammensetzen kann, wird eingegeben, indem diese beispielsweise als bestehendes elektronisches Dokument zur Verfügung gestellt oder mittels einer Texterkennungssoftware erfasst oder in sonstiger Weise, zum Beispiel Eintippen mittels einer Tastatur, als ein computerlesbarer Text bereitgestellt wird. Der einzelne Begriff oder die Begriffe der eingegebenen Wortfolge werden automatisiert analysiert und das Vorliegen eines oder mehrerer Begriffe mit lexikalischer Mehrdeutigkeit durch einen Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank identifiziert. Den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank sind in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet. Der Begriffsidentifikator kann jeweils als eine fortlaufende Nummerierung ausgeführt sein, die für die Anzahl unterschiedlicher Bedeutungen eines Begriffes mit lexikalischer Mehrdeutigkeit steht. Die Auswahl eines Begriffsidentifikators wird in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge durchgeführt. Basierend auf der Auswahl des ausgewählten Begriffsidentifikators wird der korrespondierende Begriff in der Zielsprache bestimmt. In Kenntnis der inhaltlichen, sich am Kontext orientierenden Bedeutung des Begriffes mit lexikalischer Mehrdeutigkeit in der Zielsprache werden dann die übrigen Begriffe mit lexikalischer Eindeutigkeit der in der Quellsprache abgefassten Wortfolge in die Zielsprache übersetzt. Im Anschluss daran wird die in die Zielsprache transferierte Wortfolge ausgegeben. Der wesentliche Vorteil des Verfahrens besteht darin, dass durch die Zuordnung des Begriffsidentifikators zu dem Begriff mit lexikalischer Mehrdeutigkeit in der Quellsprache eine eindeutige Begriffsdefinition zur Übersetzung der Wortfolge in die Zielsprache zur Verfügung steht. Dadurch wird eine Übersetzung weniger fehleranfällig, was zu einer signifikanten Reduzierung einer Nachbearbeitung führt.
-
Vorteilhafterweise können die in der Quellsprache abgefasste eingegebene Wortfolge und die in der Zielsprache ausgegebene Wortfolge als separate elektronische Dokumente abgespeichert werden. Dies ermöglicht einen einfachen Datenaustausch sowie eine einfache Weiterbe- oder -verarbeitung der abgefassten beziehungsweise erzeugten Wortfolgen.
-
Vorzugsweise kann der jeweilige Begriffsidentifikator dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit als ein maschinenlesbares Label zugeordnet werden. Dies hat den Vorteil, dass bei einer späteren Überprüfung des Quelltextes es ohne weiteres möglich ist, die dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit zugordnete spezifische Bedeutung innerhalb einer Wortfolge nachzuhalten.
-
Insbesondere kann der jeweilige Begriffsidentifikator dem in der Zielsprache als Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit ausgewählten Begriff als ein maschinenlesbares Label zugeordnet werden. Dies hat den Vorteil, dass eine Person, welche die in die Zielsprache transferierte Wortfolge inhaltlich überprüft, in die Lage versetzt wird, die vorgenommene Auswahl des Begriffsidentifikators nachzuvollziehen. Eine mit der Übersetzung der Wortfolge beauftragte Person erhält automatisiert Zusatzinformationen, wodurch sich eine Erhöhung der Qualität der Übersetzung erreichen lässt. Eine Person, welche die in die Zielsprache übersetzte Wortfolge liest, erhält auf diesem Wege eine Zusatzinformation, wodurch die übersetzte Wortfolge verständlicher wird.
-
Weiterhin kann das jeweilige Label in dem abgespeicherten Dokument als eine logische Verknüpfung zu dem in der Terminologiedatenbank hinterlegten Begriff mit lexikalischer Mehrdeutigkeit eingebettet werden. Dies vereinfacht eine Visualisierung der ausgewählten Bedeutung des Begriffes mit lexikalischer Mehrdeutigkeit. So kann durch die logische Verknüpfung ein direkter Zugriff auf den mit dem Begriffsidentifikator korrespondierenden Eintrag der Terminologiedatenbank ermöglicht werden. Insbesondere kann mittels des zugeordneten Begriffsidentifikators die jeweilige Bedeutung in Textform und/oder in grafischer Form dargestellt werden. Die logische Verknüpfung kann beispielsweise in Form eines sogenannten Hyperlinks realisiert werden, der bei Auswahl des Begriffsidentifikators in den Text des elektronischen Dokumentes eingebettet wird.
-
Vorzugsweise kann das jeweilige Label innerhalb des elektronischen Dokumentes mittels einer Filterfunktion ein- und ausgeblendet werden. Hierdurch lässt sich die Lesbarkeit des Textes des elektronischen Dokumentes erhöhen.
-
Des Weiteren kann das abgespeicherte elektronische Dokument zu einer späteren Weiterverarbeitung in unterschiedliche Dateiformate konvertiert werden, wobei die dem jeweiligen Begriff mit lexikalischer Mehrdeutigkeit zugeordneten Label erhalten werden. Dadurch bleibt die Verknüpfung zwischen dem Begriff mit lexikalischer Mehrdeutigkeit, dem Begriffsidentifikator und der in der Terminologiedatenbank hinterlegten Bedeutung erhalten, um die gewählte Zuordnung des Begriffsidentifikators während des Übersetzungsvorganges nachhalten zu können.
-
Vorteilhaft ist es, wenn zur Bestimmung des Kontextes der Wortfolge zumindest ein Schlüsselwort hinterlegt wird. Mit der Eingabe der zu transferierenden Wortfolge kann zumindest ein Schlüsselwort eingegeben oder mit dieser verknüpft werden, welches bei einer automatischen Auswahl des Begriffsidentifikators in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge herangezogen werden kann. Hierdurch kann die Automatisierung des Verfahrens erweitert werden. Das zumindest eine Schlüsselwort kann dabei zu einer Reduzierung der für einen Begriff mit lexikalischer Mehrdeutigkeit zur Verfügung stehenden auswählbaren Begriffsidentifikatoren führen.
-
Alternativ oder zusätzlich kann während der Identifikation eines Begriffes mit lexikalischer Mehrdeutigkeit innerhalb der Wortfolge eine Aufforderung zur manuellen Zuordnung des Labels ausgegeben werden. Eine die in der Quellsprache abgefasste Wortfolge eingebende Person wird mittels eines automatisiert generierten Hinweises auf das Vorhandensein eines Begriffes mit lexikalischer Mehrdeutigkeit aufmerksam gemacht und zu einer entsprechenden Auswahl eines Begriffes aus der Anzahl von Begriffen, die mittels der Terminologiedatenbank bereitgestellt werden, aufgefordert. Hierbei kann während der Eingabe der in der Quellsprache abgefassten Wortfolge dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der dem Kontext entsprechende Begriffsidentifikator zugeordnet werden, welcher als maschinenlesbares Label dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit innerhalb des eingegebenen elektronischen Dokumentes zugewiesen wird.
-
Gemäß einer vorteilhaften Weiterbildung kann vorgesehen sein, dass Begriffe mit lexikalischer Eindeutigkeit der Quellsprache mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Zielsprache umfassenden Terminologiedatenbank abgeglichen werden. Dies ist vor dem Hintergrund sinnvoll, dass ein in der Quellsprache bedeutungsinhaltlich eindeutiger Begriff in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit sein kann, so dass dessen Interpretation beim Lesen des in die Zielsprache übersetzten Textes irreführend sein kann.
-
Dabei kann einem Begriffe mit lexikalischer Eindeutigkeit der Quellsprache ein Begriffsidentifikator zugeordnet werden, wenn der korrespondierende in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit ist. Hierzu kann der Begriffsidentifikator auf die Terminologiedatenbank der Zielsprache referenzieren. Auf diese Weise kann gewährleistet werden, dass den Begriffen mit lexikalischer Eindeutigkeit der Quellsprache, die in der Zielsprache Begriffe mit lexikalischer Mehrdeutigkeit sind, eine in der Zielsprache dem Bedeutungsinhalt des Begriffes entsprechende Übersetzung zugewiesen wird.
-
Vorteilhaft ist, dass mittels der Zuordnung von Begriffsidentifikatoren eine nachträgliche Bearbeitung der elektronischen Dokumente der Quellsprache als auch der Zielsprache möglich ist. Insbesondere können im Nachhinein Begriffsidentifikatoren hinzugefügt werden. Ein weiterer Vorteil besteht darin, dass in einer Wortfolge verwendete Begriffe mit lexikalischer Mehrdeutigkeit maschinell ausgefiltert und exportiert werden können. Somit werden die elektronischen Dokumente der Quell- und Zielsprache auch ohne eine Anbindung an die jeweilige Terminologiedatenbank austauschbar.
-
Weiterhin wird gemäß dem unabhängigen Anspruch 12 eine Datenverarbeitungseinrichtung zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache vorgeschlagen, umfassend:
- – eine Vorrichtung zur Eingabe der in der Quellsprache abgefassten Wortfolge;
- – eine Speichereinrichtung, in der eine Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassende Terminologiedatenbank, denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind, hinterlegt ist;
- – eine Verarbeitungseinrichtung, die zur Analyse der eingegebenen Wortfolge und der Identifikation Begriffe mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank eingerichtet ist,
- – wobei die Verarbeitungseinrichtung zur Auswahl eines Begriffsidentifikators in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge eingerichtet ist,
- – die Verarbeitungseinrichtung zur Auswahl eines mit dem ausgewählten Begriffsidentifikators korrespondierenden Begriffes in der Zielsprache eingerichtet ist, und
- – dass die Verarbeitungseinrichtung zur Übersetzung der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache eingerichtet ist; sowie
- – eine Vorrichtung zur Ausgabe der Wortfolge in der Zielsprache.
-
Die Vorrichtung zur Eingabe der in der Quellsprache abgefassten Wortfolge ist dazu eingerichtet, dass eine unmittelbare oder mittelbare Eingabe der Wortfolge erfolgen kann. Als unmittelbare Eingabe kann die Eingabe mittels einer Tastatur angesehen werden, das heißt eine Bedienperson tippt eine Wortfolge ein. Alternativ kann die Eingabe mittels einer optomechanischen Einrichtung erfolgen, mittels der eine Wortfolge als Grafik erfasst und in maschinenlesbare Daten umgewandelt wird. Durch eine optische Zeichenerkennung wird die Grafik in eine Zeichenfolge umgewandelt, die in einem elektronischen Dokument zusammengeführt wird. Als mittelbare Eingabe kann die Übertragung eines elektronischen Dokumentes von einem Rechner, unabhängig von dessen Entstehungsweise, mittels eines Netzwerkes an die Vorrichtung zur Eingabe der Datenverarbeitungseinrichtung übertragen werden.
-
In der Speichereinrichtung ist eine Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassende Terminologiedatenbank hinterlegt. Den Begriffen mit lexikalischer Mehrdeutigkeit sind in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet. Darüber hinaus dient die Speichereinrichtung unter anderem als Speicher für eingegebene Wortfolgen respektive elektronische Dokumente.
-
Mittels der Verarbeitungseinrichtung, die zur Analyse der eingegebenen Wortfolge und der Identifikation von Begriffen mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank eingerichtet ist, wird die eingegebene Wortfolge hinsichtlich des Vorhandenseins von Begriffen mit lexikalischer Mehrdeutigkeit analysiert. Hierzu greift die Verarbeitungseinrichtung auf die Terminologiedatenbank mit den in der der Quellsprache enthaltenen Begriffen mit lexikalischer Mehrdeutigkeit zurück, um einzelne Begriffe mit lexikalischer Mehrdeutigkeit innerhalb einer Wortfolge zu identifizieren.
-
Die Verarbeitungseinrichtung ist zur Auswahl eines Begriffsidentifikators in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge eingerichtet. In Abhängigkeit von dem Kontext der in der Quellsprache abgefassten Wortfolge wird der entsprechende Begriffsidentifikator ausgewählt, um dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der Wortfolge seine dem Kontext entsprechende Bedeutung zukommen zu lassen. Die Auswahl kann beispielsweise automatisiert anhand eines oder mehrerer Schlüsselworte erfolgen, welche der eingegebenen Wortfolge mitgegeben werden. Alternativ erfolgt eine gezielte Auswahl durch eine die Wortfolge eingebende Person auf eine automatisch generierte Aufforderung hin. Diese Aufforderung wird von der Verarbeitungseinrichtung für jeden identifizierten Begriff mit lexikalischer Mehrdeutigkeit einer Wortfolge ausgegeben.
-
Darüber hinaus ist die Verarbeitungseinrichtung zur Übersetzung von Begriffen mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache eingerichtet.
-
Mittels einer Vorrichtung zur Ausgabe der Wortfolge in der Zielsprache, wird die transferierte Wortfolge zur Verfügung gestellt.
-
Die vorliegende Erfindung wird nachstehend anhand von in den Zeichnungen dargestellten Ausführungsbeispielen näher erläutert.
-
Es zeigen:
-
1 eine schematische Darstellung einer Datenverarbeitungseinrichtung;
-
2 ein vereinfachtes Ablaufdiagramm eines Verfahrens zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache;
-
3 eine Veranschaulichung des Verfahren anhand eines konkreten Beispiels einer Wortfolge.
-
Die Darstellung in 1 zeigt eine schematische Darstellung einer Datenverarbeitungseinrichtung 1, welche zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache eingerichtet ist.
-
Die Datenverarbeitungseinrichtung 1 umfasst eine Vorrichtung zur Eingabe 2 einer in einer Quellsprache abgefassten Wortfolge, eine Speichereinrichtung 3, eine Verarbeitungseinrichtung 4 sowie eine Vorrichtung zur Ausgabe 5 der Wortfolge in einer Zielsprache. Als Vorrichtung zur Eingabe 2 ist eine Programmierschnittstelle (API) vorgesehen, die Zugang zu einem Netzwerk 10, insbesondere dem Internet, hat, um mit einer korrespondieren Anwendung zusammenzuarbeiten oder eine sonstige, der Eingabe von Daten dienende Einrichtung, beispielsweise eine Tastatur, ein Scanner, ein Datenträger oder dergleichen mehr. Die Speichereinrichtung 3 dient der nichtflüchtigen Hinterlegung von einem oder mehreren Anwendungsprogrammen 6, zumindest einer Terminologiedatenbank 7 sowie der Speicherung der in der Quellsprache eingegebenen Wortfolge beziehungsweise der in die Zielsprache transferierten Wortfolge als Datei 8, 9. Die Anzahl der erforderlichen Terminologiedatenbanken 7 orientiert sich an der Anzahl der Quell- und Zielsprachen, in denen Wortfolgen eingegeben werden sollen. Die Verarbeitungseinrichtung 4 weist Prozessoren auf, die zur Ausführung von Anwendungsprogrammen eingerichtet sind. Die Verarbeitungseinrichtung 4 steht im bidirektionalen Datenaustausch mit der Speichereinrichtung 3. Die Vorrichtung zur Ausgabe 5 ist ebenfalls als eine Programmierschnittstelle (API) ausgeführt. Alternativ oder ergänzend kann die Vorrichtung zur Ausgabe 5 beispielsweise als ein Bildschirm, ein Drucker oder eine sonstige der Ausgabe von Daten dienende Einrichtung sein.
-
Die Eingabe einer Wortfolge mittels der als Programmierschnittstelle ausgebildeten Vorrichtung zur Eingabe 2 der Datenverarbeitungseinrichtung 1 erfolgt im dargestellten Ausführungsbeispiel durch eine auf einem dezentral angeordneten Rechner 11 vorgesehene Anwendungssoftware, im einfachsten Fall einem Webbrowser 12.
-
In 2 ist ein vereinfachtes Ablaufdiagramm eines Verfahrens zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache dargestellt. Hierbei kann zumindest die Quellsprache der eingegebenen Wortfolge durch entsprechende Analyse mittels der Verarbeitungseinrichtung automatisch erkannt werden. Im Allgemeinen werden die Quellsprache und die Zielsprache jedoch vorgegeben.
-
In einem Schritt 20 erfolgt die Eingabe einer aus wenigstens einem Wort bestehenden Wortfolge mittels der Vorrichtung zur Eingabe 2. Die in einer Quellsprache eingegebene Wortfolge wird in der Speichereinrichtung 3 als Datei 8 abgelegt.
-
In einem nachfolgenden Schritt 21 erfolgt die semantische und syntaktische Analyse der eingegebenen Wortfolge durch die Verarbeitungseinrichtung 4. Hierzu wird die eingegebene Wortfolge von der Verarbeitungseinrichtung 4 aus der Speichereinrichtung 3 eingelesen. Die Analyse umfasst dabei die Überprüfung der Wortfolge auf das Vorhandensein wenigstens eines Begriffes mit lexikalischer Mehrdeutigkeit. Ein Beispiel für einen Begriff mit lexikalischer Mehrdeutigkeit ist das deutsche Wort „Tau“, das ein Seil, den morgendlichen Niederschlag oder einen Buchstaben des griechischen Alphabets bedeuten kann. Die Abarbeitung der eingegebenen Wortfolge wird sequentiell durchgeführt. Das Analysieren der Wortfolge und des wenigstens einen identifizierten Begriffes mit lexikalischer Mehrdeutigkeit in der Wortfolge wird durch einen Abgleich mit der Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank 7 der Speichereinrichtung 3 durchgeführt.
-
Wird im Schritt 21 zumindest ein Begriff mit lexikalischer Mehrdeutigkeit im Rahmen der Analyse identifiziert, so wird in einem nachfolgenden Schritt 22 ein Hinweis auf ein Vorliegen eines Begriffes mit lexikalischer Mehrdeutigkeit ausgegeben. Dies erfolgt im vorliegenden Ausführungsbeispiel durch eine Ausgabe auf dem Rechner 11, mittels dem die zu transferierende Wortfolge in der Quellsprache eingegeben wird. Hiermit verbunden ist die Aufforderung, den Begriff mit lexikalischer Mehrdeutigkeit hinsichtlich seiner Bedeutung im Kontext der Wortfolge zu definieren.
-
Hierzu wird im Schritt 23 anhand des beim Abgleichen mit der Terminologiedatenbank 7 identifizierten Begriffes mit lexikalischer Mehrdeutigkeit, dem in Abhängigkeit von seiner Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind, eine Auswahl der möglichen Bedeutungen respektive Definitionen des Begriffes mit lexikalischer Mehrdeutigkeit in Abhängigkeit von unterschiedlichen Kontexten angezeigt. Die Anzeige der Auswahl erfolgt auf dem Rechner 11 mittels des Webbrowsers 12. Entsprechend dem weiter oben angeführten Beispiel des deutschen Begriffes „Tau“, der drei unterschiedliche Bedeutungen aufweist, entspräche die Bedeutungsanzahl des Begriffes mit lexikalischer Mehrdeutigkeit „Tau“ dem Wert drei, so dass diesem drei Begriffsidentifikatoren zugeordnet sind. Aus dieser dargestellten Auswahl, die als eine einfache tabellarische Auflistung der unterschiedlichen Bedeutungen erfolgen kann, bis hin zu einer Textausgabe kombiniert mit einer grafischen Veranschaulichung, wird derjenige Begriffsidentifikator ausgewählt, der dem Kontext der eingegebenen Wortfolge entspricht.
-
Im nachfolgenden Schritt 24 wird dieser ausgewählte Begriffsidentifikator dem Begriff mit lexikalischer Mehrdeutigkeit zugeordnet. Diese Zuordnung des spezifischen Begriffsidentifikators wird in der Datei 8, die die Wortfolge in der Quellsprache enthält, abgespeichert. Hierzu wird der jeweilige Begriffsidentifikator dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit als ein maschinenlesbares Label zugeordnet.
-
Im darauffolgenden Schritt 25 findet die Übersetzung der analysierten Wortfolge aus der Quellsprache in die Zielsprache statt. Hierzu erfolgen zum einen die Auswahl eines mit dem ausgewählten Begriffsidentifikator korrespondierenden Begriffes in der Zielsprache und zum anderen das Übersetzen der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache, so dass eine bedeutungsinhaltlich korrespondierende Wortfolge erzeugt wird.
-
Daraufhin erfolgt in einem Schritt 26 die Zuordnung des im Schritt 23 ausgewählten Begriffsidentifikators zu dem mit dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der Quellsprache korrespondierenden Begriff der Zielsprache. Der jeweilige Begriffsidentifikator, mittels dem der Begriff in der Zielsprache ausgewählt wurde, wird dem entsprechenden Begriff der Zielsprache gleichfalls als ein maschinenlesbares Label zugeordnet. Die Übersetzung der Wortfolge in die Zielsprache wird zusammen mit dem oder den zugeordneten Labeln in der Datei 9 gespeichert. Diese Zuordnung erlaubt zu einem späteren Zeitpunkt einen Rückgriff auf die Terminologiedatenbank 7, das heißt den Abruf und die Darstellung des jeweils identifizierten Begriffes mit lexikalischer Mehrdeutigkeit in der Quellsprache sowie dessen Bedeutung und dem aus der Auswahl des Begriffsidentifikators resultierenden Begriffes in der Zielsprache. Auch diese Darstellung kann als eine einfache tabellarische Auflistung erfolgen, bis hin zu einer Textausgabe kombiniert mit einer grafischen Veranschaulichung der Bedeutung.
-
Abschließend wird im Schritt 27 die Wortfolge in der Zielsprache ausgegeben. Die Ausgabe erfolgt gemäß dem gewählten Ausführungsbeispiel durch den Webbrowsers 12.
-
3 veranschaulicht das Verfahren anhand eines konkreten Beispiels einer Wortfolge. Hierbei umfasst eine vom Rechner 11 an die Datenverarbeitungseinrichtung 1 übertragene, in der Quellsprache abgefasste Wortfolge 30 die einzelnen Begriffe „Bitte treten Sie auf die Bremse“. Diese beispielsweise in einem HTML-Format abgefasste Wortfolge wird mittels der Vorrichtung zur Eingabe 3 in die Datenverarbeitungseinrichtung 1 zur weiteren Verarbeitung eingegeben. Im Zuge der Analyse der Wortfolge im Schritt 21 wird neben den Begriffen mit lexikalischer Eindeutigkeit 31 „Bitte treten Sie auf die“ der Begriff mit lexikalischer Mehrdeutigkeit 32 „Bremse“ identifiziert. Die Terminologiedatenbank 7 weist für diesen Begriff mit lexikalischer Mehrdeutigkeit 32 zwei mögliche Bedeutungen 35, 36 aus, so dass zwei Begriffsidentifikatoren 33, 34 vergeben wurden. Die Begriffsidentifikatoren 33, 34 stellen einen Schlüssel der Terminologiedatenbank 7 dar.
-
Aufgrund der Identifikation des Begriffes mit lexikalischer Mehrdeutigkeit 32 wird zur Auswahl eines der Begriffsidentifikatoren 33, 34 in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge 30 aufgefordert. Im vorliegenden Ausführungsbeispiel soll der Begriff mit lexikalischer Mehrdeutigkeit 32 „Bremse“ im Kontext mit einer Baugruppe zum Stoppen einer Bewegung stehen und nicht ein Insekt betreffen. Der Definition des Begriffs mitlexikalischer Mehrdeutigkeit 32 „Bremse“ im Sinne eines Insekts ist der Begriffsidentifikator 33 zugeordnet. Der Definition des Begriffs mitlexikalischer Mehrdeutigkeit 32 „Bremse“ im Sinne einer Baugruppe zum Stoppen einer Bewegung ist der Begriffsidentifikator 34 zugeordnet.
-
Entsprechend wird gemäß dem Kontext der Wortfolge der Begriffsidentifikator 34 ausgewählt. Die Auswahl erfolgt, wie weiter oben bereits beschrieben, manuell durch eine Bedienperson oder automatisiert. Die Zuordnung des ausgewählten Begriffsidentifikators 34 zu dem Begriff mit lexikalischer Mehrdeutigkeit 32 in der Quellsprache erfolgt in dem Schritt 24, wie bereits ausgeführt. Durch die Auswahl des Begriffsidentifikators 34 ist die bedeutungsinhaltlich korrespondierende Wortfolge in der Zielsprache festgelegt. So wird für die Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit 32 „Bremse“ nicht der korrespondierende englischsprachige Begriff 37 „horsefly“ sondern der Begriff 38 „brake“ ausgewählt. Dem ausgewählten Begriff 38 wird der Begriffsidentifikator 34 zugeordnet, welcher in der in der Zielsprache auszugebenen Wortfolge 39 erhalten bleibt. Dies wird in den Schritten 26 und 27 ausgeführt.
-
Bezugszeichenliste
-
- 1
- Datenverarbeitungseinrichtung
- 2
- Vorrichtung zur Eingabe
- 3
- Speichereinrichtung
- 4
- Verarbeitungseinrichtung
- 5
- Vorrichtung zur Ausgabe
- 6
- Anwendungsprogramm
- 7
- Terminologiedatenbank
- 8
- Datei
- 9
- Datei
- 10
- Netzwerk
- 11
- Rechner
- 12
- Webbrowser
- 20
- Schritt
- 21
- Schritt
- 22
- Schritt
- 23
- Schritt
- 24
- Schritt
- 25
- Schritt
- 26
- Schritt
- 27
- Schritt
- 30
- Wortfolge in Quellsprache
- 31
- Begriff mit lexikalischer Eindeutigkeit
- 32
- Begriff mit lexikalischer Mehrdeutigkeit
- 33
- Begriffsidentifikator
- 34
- Begriffsidentifikator
- 35
- Bedeutung von 32
- 36
- Bedeutung von 32
- 37
- englischsprachiger Begriff
- 38
- englischsprachiger Begriff
- 39
- Wortfolge in der Zielsprache
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-