DE102016114265A1 - Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache - Google Patents

Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache Download PDF

Info

Publication number
DE102016114265A1
DE102016114265A1 DE102016114265.4A DE102016114265A DE102016114265A1 DE 102016114265 A1 DE102016114265 A1 DE 102016114265A1 DE 102016114265 A DE102016114265 A DE 102016114265A DE 102016114265 A1 DE102016114265 A1 DE 102016114265A1
Authority
DE
Germany
Prior art keywords
term
word sequence
source language
language
lexical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102016114265.4A
Other languages
English (en)
Inventor
Ute Rummel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Claas Selbstfahrende Erntemaschinen GmbH
Original Assignee
Claas Selbstfahrende Erntemaschinen GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Claas Selbstfahrende Erntemaschinen GmbH filed Critical Claas Selbstfahrende Erntemaschinen GmbH
Priority to DE102016114265.4A priority Critical patent/DE102016114265A1/de
Priority to EP17755228.8A priority patent/EP3494488A1/de
Priority to US16/321,787 priority patent/US11132515B2/en
Priority to PCT/IB2017/000862 priority patent/WO2018073635A1/de
Publication of DE102016114265A1 publication Critical patent/DE102016114265A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Abstract

Die vorliegende Erfindung betrifft ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge (30) in eine bedeutungsinhaltlich korrespondierende Wortfolge (39) einer Zielsprache. Durch das Analysieren der Wortfolge (30) in der Quellsprache und das Identifizieren von Begriffen mit lexikalischer Mehrdeutigkeit (32) in der Wortfolge durch Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank (7), denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren (33, 34) zugeordnet sind, wird durch eine Zuordnung eines Begriffsidentifikators (33, 34) zu dem Begriff mit lexikalischer Mehrdeutigkeit (32) in der Quellsprache eine eindeutige Begriffsdefinition zur Übersetzung der Wortfolge (39) in die Zielsprache zur Verfügung gestellt. Dadurch wird eine insbesondere vollständig maschinelle Übersetzung weniger fehleranfällig.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache gemäß dem Oberbegriff des Anspruches 1 sowie eine Datenverarbeitungseinrichtung gemäß dem Oberbegriff des Anspruches 12.
  • Bei der Übersetzung eines aus einer Wortfolge oder mehreren Wortfolgen gebildeten Textes einer Quellsprache in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache ist es wesentlich, den Kontext der Wortfolge zu erkennen, um sprachliche Missverständnisse zu vermeiden. Sprachliche Missverständnisse beruhen im Allgemeinen auf einer Fehlinterpretation eines einzelnen Begriffes in einer Wortfolge, welchem in der Quellsprache in Abhängigkeit vom Kontext, in welchem dieser Begriff genutzt wird, verschiedene inhaltliche Bedeutungen zukommen. Man spricht in diesem Zusammenhang von einem homonymen beziehungsweise polysemen Begriff oder auch von einem Begriff mit lexikalischer Mehrdeutigkeit. Beispielhaft sei hierfür der deutsche Begriff „Verletzung“ angeführt, der bei einer Übersetzung ins Englische unterschiedlich interpretierbar ist. So kann der deutsche Begriff „Verletzung“ unter anderem im Englischen mit „injury“ oder „infringement“ übersetzt werden. Während der Begriff „injury“ im medizinischen Kontext als das Vorliegen physischen Verletzung eines Lebewesens verstanden wird, wird der Begriff „infringement“ im juristischen Kontext als eine Rechtsverletzung durch eine Handlung eines Dritten verwendet. Ein Verfahren respektive eine Datenverarbeitungseinrichtung zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache ist, im Gegensatz zu einem Humanübersetzer, nicht oder nur bedingt in der Lage, den Kontext einer Wortfolge in der Quellsprache zu erkennen, in welchem der Begriff verwendet wird, um diesen dem richtigen Begriff in der Zielsprache zuordnen zu können. Entsprechend bedarf eine maschinelle Übersetzung einer Überarbeitung durch einen Humanübersetzer, wenn es gilt, inhaltliche Missverständnisse auszuräumen und zu vermeiden. Dies gilt insbesondere für Übersetzungen in sensiblen Bereichen wie technische Dokumentationen.
  • Aus der EP 0 737 928 A1 sind ein Verfahren sowie eine Datenverarbeitungseinrichtung der eingangs genannten Art vorbekannt.
  • Aufgabe der vorliegenden Erfindung ist es, das Verfahren sowie die Datenverarbeitungseinrichtung der eingangs genannten Art derart weiterzuentwickeln, dass diese sich durch eine geringere Fehleranfälligkeit und eine höhere Verarbeitungsgeschwindigkeit auszeichnen.
  • Diese Aufgabe wird bezogen auf ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache durch die kennzeichnenden Merkmale des Anspruches 1 und bezüglich einer Datenverarbeitungseinrichtung durch die kennzeichnenden Merkmale des Anspruches 12 gelöst.
  • Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand der Unteransprüche.
  • Gemäß dem Anspruch 1 wird ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache vorgeschlagen, welches durch die nachfolgenden Verfahrensschritte gekennzeichnet ist:
    • a) Eingeben der in der Quellsprache abgefassten Wortfolge;
    • b) Analysieren der Wortfolge und Identifizieren von Begriffen mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank, denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind;
    • c) Auswahl eines Begriffsidentifikators in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge;
    • d) Auswahl eines mit dem ausgewählten Begriffsidentifikator korrespondierenden Begriffes in der Zielsprache;
    • e) Übersetzen der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache;
    • f) Ausgeben der Wortfolge in der Zielsprache.
  • Die zu übersetzende Wortfolge, die sich aus einem einzelnen Begriff oder mehreren Begriffen zusammensetzen kann, wird eingegeben, indem diese beispielsweise als bestehendes elektronisches Dokument zur Verfügung gestellt oder mittels einer Texterkennungssoftware erfasst oder in sonstiger Weise, zum Beispiel Eintippen mittels einer Tastatur, als ein computerlesbarer Text bereitgestellt wird. Der einzelne Begriff oder die Begriffe der eingegebenen Wortfolge werden automatisiert analysiert und das Vorliegen eines oder mehrerer Begriffe mit lexikalischer Mehrdeutigkeit durch einen Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank identifiziert. Den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank sind in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet. Der Begriffsidentifikator kann jeweils als eine fortlaufende Nummerierung ausgeführt sein, die für die Anzahl unterschiedlicher Bedeutungen eines Begriffes mit lexikalischer Mehrdeutigkeit steht. Die Auswahl eines Begriffsidentifikators wird in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge durchgeführt. Basierend auf der Auswahl des ausgewählten Begriffsidentifikators wird der korrespondierende Begriff in der Zielsprache bestimmt. In Kenntnis der inhaltlichen, sich am Kontext orientierenden Bedeutung des Begriffes mit lexikalischer Mehrdeutigkeit in der Zielsprache werden dann die übrigen Begriffe mit lexikalischer Eindeutigkeit der in der Quellsprache abgefassten Wortfolge in die Zielsprache übersetzt. Im Anschluss daran wird die in die Zielsprache transferierte Wortfolge ausgegeben. Der wesentliche Vorteil des Verfahrens besteht darin, dass durch die Zuordnung des Begriffsidentifikators zu dem Begriff mit lexikalischer Mehrdeutigkeit in der Quellsprache eine eindeutige Begriffsdefinition zur Übersetzung der Wortfolge in die Zielsprache zur Verfügung steht. Dadurch wird eine Übersetzung weniger fehleranfällig, was zu einer signifikanten Reduzierung einer Nachbearbeitung führt.
  • Vorteilhafterweise können die in der Quellsprache abgefasste eingegebene Wortfolge und die in der Zielsprache ausgegebene Wortfolge als separate elektronische Dokumente abgespeichert werden. Dies ermöglicht einen einfachen Datenaustausch sowie eine einfache Weiterbe- oder -verarbeitung der abgefassten beziehungsweise erzeugten Wortfolgen.
  • Vorzugsweise kann der jeweilige Begriffsidentifikator dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit als ein maschinenlesbares Label zugeordnet werden. Dies hat den Vorteil, dass bei einer späteren Überprüfung des Quelltextes es ohne weiteres möglich ist, die dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit zugordnete spezifische Bedeutung innerhalb einer Wortfolge nachzuhalten.
  • Insbesondere kann der jeweilige Begriffsidentifikator dem in der Zielsprache als Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit ausgewählten Begriff als ein maschinenlesbares Label zugeordnet werden. Dies hat den Vorteil, dass eine Person, welche die in die Zielsprache transferierte Wortfolge inhaltlich überprüft, in die Lage versetzt wird, die vorgenommene Auswahl des Begriffsidentifikators nachzuvollziehen. Eine mit der Übersetzung der Wortfolge beauftragte Person erhält automatisiert Zusatzinformationen, wodurch sich eine Erhöhung der Qualität der Übersetzung erreichen lässt. Eine Person, welche die in die Zielsprache übersetzte Wortfolge liest, erhält auf diesem Wege eine Zusatzinformation, wodurch die übersetzte Wortfolge verständlicher wird.
  • Weiterhin kann das jeweilige Label in dem abgespeicherten Dokument als eine logische Verknüpfung zu dem in der Terminologiedatenbank hinterlegten Begriff mit lexikalischer Mehrdeutigkeit eingebettet werden. Dies vereinfacht eine Visualisierung der ausgewählten Bedeutung des Begriffes mit lexikalischer Mehrdeutigkeit. So kann durch die logische Verknüpfung ein direkter Zugriff auf den mit dem Begriffsidentifikator korrespondierenden Eintrag der Terminologiedatenbank ermöglicht werden. Insbesondere kann mittels des zugeordneten Begriffsidentifikators die jeweilige Bedeutung in Textform und/oder in grafischer Form dargestellt werden. Die logische Verknüpfung kann beispielsweise in Form eines sogenannten Hyperlinks realisiert werden, der bei Auswahl des Begriffsidentifikators in den Text des elektronischen Dokumentes eingebettet wird.
  • Vorzugsweise kann das jeweilige Label innerhalb des elektronischen Dokumentes mittels einer Filterfunktion ein- und ausgeblendet werden. Hierdurch lässt sich die Lesbarkeit des Textes des elektronischen Dokumentes erhöhen.
  • Des Weiteren kann das abgespeicherte elektronische Dokument zu einer späteren Weiterverarbeitung in unterschiedliche Dateiformate konvertiert werden, wobei die dem jeweiligen Begriff mit lexikalischer Mehrdeutigkeit zugeordneten Label erhalten werden. Dadurch bleibt die Verknüpfung zwischen dem Begriff mit lexikalischer Mehrdeutigkeit, dem Begriffsidentifikator und der in der Terminologiedatenbank hinterlegten Bedeutung erhalten, um die gewählte Zuordnung des Begriffsidentifikators während des Übersetzungsvorganges nachhalten zu können.
  • Vorteilhaft ist es, wenn zur Bestimmung des Kontextes der Wortfolge zumindest ein Schlüsselwort hinterlegt wird. Mit der Eingabe der zu transferierenden Wortfolge kann zumindest ein Schlüsselwort eingegeben oder mit dieser verknüpft werden, welches bei einer automatischen Auswahl des Begriffsidentifikators in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge herangezogen werden kann. Hierdurch kann die Automatisierung des Verfahrens erweitert werden. Das zumindest eine Schlüsselwort kann dabei zu einer Reduzierung der für einen Begriff mit lexikalischer Mehrdeutigkeit zur Verfügung stehenden auswählbaren Begriffsidentifikatoren führen.
  • Alternativ oder zusätzlich kann während der Identifikation eines Begriffes mit lexikalischer Mehrdeutigkeit innerhalb der Wortfolge eine Aufforderung zur manuellen Zuordnung des Labels ausgegeben werden. Eine die in der Quellsprache abgefasste Wortfolge eingebende Person wird mittels eines automatisiert generierten Hinweises auf das Vorhandensein eines Begriffes mit lexikalischer Mehrdeutigkeit aufmerksam gemacht und zu einer entsprechenden Auswahl eines Begriffes aus der Anzahl von Begriffen, die mittels der Terminologiedatenbank bereitgestellt werden, aufgefordert. Hierbei kann während der Eingabe der in der Quellsprache abgefassten Wortfolge dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der dem Kontext entsprechende Begriffsidentifikator zugeordnet werden, welcher als maschinenlesbares Label dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit innerhalb des eingegebenen elektronischen Dokumentes zugewiesen wird.
  • Gemäß einer vorteilhaften Weiterbildung kann vorgesehen sein, dass Begriffe mit lexikalischer Eindeutigkeit der Quellsprache mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Zielsprache umfassenden Terminologiedatenbank abgeglichen werden. Dies ist vor dem Hintergrund sinnvoll, dass ein in der Quellsprache bedeutungsinhaltlich eindeutiger Begriff in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit sein kann, so dass dessen Interpretation beim Lesen des in die Zielsprache übersetzten Textes irreführend sein kann.
  • Dabei kann einem Begriffe mit lexikalischer Eindeutigkeit der Quellsprache ein Begriffsidentifikator zugeordnet werden, wenn der korrespondierende in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit ist. Hierzu kann der Begriffsidentifikator auf die Terminologiedatenbank der Zielsprache referenzieren. Auf diese Weise kann gewährleistet werden, dass den Begriffen mit lexikalischer Eindeutigkeit der Quellsprache, die in der Zielsprache Begriffe mit lexikalischer Mehrdeutigkeit sind, eine in der Zielsprache dem Bedeutungsinhalt des Begriffes entsprechende Übersetzung zugewiesen wird.
  • Vorteilhaft ist, dass mittels der Zuordnung von Begriffsidentifikatoren eine nachträgliche Bearbeitung der elektronischen Dokumente der Quellsprache als auch der Zielsprache möglich ist. Insbesondere können im Nachhinein Begriffsidentifikatoren hinzugefügt werden. Ein weiterer Vorteil besteht darin, dass in einer Wortfolge verwendete Begriffe mit lexikalischer Mehrdeutigkeit maschinell ausgefiltert und exportiert werden können. Somit werden die elektronischen Dokumente der Quell- und Zielsprache auch ohne eine Anbindung an die jeweilige Terminologiedatenbank austauschbar.
  • Weiterhin wird gemäß dem unabhängigen Anspruch 12 eine Datenverarbeitungseinrichtung zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache vorgeschlagen, umfassend:
    • – eine Vorrichtung zur Eingabe der in der Quellsprache abgefassten Wortfolge;
    • – eine Speichereinrichtung, in der eine Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassende Terminologiedatenbank, denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind, hinterlegt ist;
    • – eine Verarbeitungseinrichtung, die zur Analyse der eingegebenen Wortfolge und der Identifikation Begriffe mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank eingerichtet ist,
    • – wobei die Verarbeitungseinrichtung zur Auswahl eines Begriffsidentifikators in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge eingerichtet ist,
    • – die Verarbeitungseinrichtung zur Auswahl eines mit dem ausgewählten Begriffsidentifikators korrespondierenden Begriffes in der Zielsprache eingerichtet ist, und
    • – dass die Verarbeitungseinrichtung zur Übersetzung der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache eingerichtet ist; sowie
    • – eine Vorrichtung zur Ausgabe der Wortfolge in der Zielsprache.
  • Die Vorrichtung zur Eingabe der in der Quellsprache abgefassten Wortfolge ist dazu eingerichtet, dass eine unmittelbare oder mittelbare Eingabe der Wortfolge erfolgen kann. Als unmittelbare Eingabe kann die Eingabe mittels einer Tastatur angesehen werden, das heißt eine Bedienperson tippt eine Wortfolge ein. Alternativ kann die Eingabe mittels einer optomechanischen Einrichtung erfolgen, mittels der eine Wortfolge als Grafik erfasst und in maschinenlesbare Daten umgewandelt wird. Durch eine optische Zeichenerkennung wird die Grafik in eine Zeichenfolge umgewandelt, die in einem elektronischen Dokument zusammengeführt wird. Als mittelbare Eingabe kann die Übertragung eines elektronischen Dokumentes von einem Rechner, unabhängig von dessen Entstehungsweise, mittels eines Netzwerkes an die Vorrichtung zur Eingabe der Datenverarbeitungseinrichtung übertragen werden.
  • In der Speichereinrichtung ist eine Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassende Terminologiedatenbank hinterlegt. Den Begriffen mit lexikalischer Mehrdeutigkeit sind in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet. Darüber hinaus dient die Speichereinrichtung unter anderem als Speicher für eingegebene Wortfolgen respektive elektronische Dokumente.
  • Mittels der Verarbeitungseinrichtung, die zur Analyse der eingegebenen Wortfolge und der Identifikation von Begriffen mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank eingerichtet ist, wird die eingegebene Wortfolge hinsichtlich des Vorhandenseins von Begriffen mit lexikalischer Mehrdeutigkeit analysiert. Hierzu greift die Verarbeitungseinrichtung auf die Terminologiedatenbank mit den in der der Quellsprache enthaltenen Begriffen mit lexikalischer Mehrdeutigkeit zurück, um einzelne Begriffe mit lexikalischer Mehrdeutigkeit innerhalb einer Wortfolge zu identifizieren.
  • Die Verarbeitungseinrichtung ist zur Auswahl eines Begriffsidentifikators in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge eingerichtet. In Abhängigkeit von dem Kontext der in der Quellsprache abgefassten Wortfolge wird der entsprechende Begriffsidentifikator ausgewählt, um dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der Wortfolge seine dem Kontext entsprechende Bedeutung zukommen zu lassen. Die Auswahl kann beispielsweise automatisiert anhand eines oder mehrerer Schlüsselworte erfolgen, welche der eingegebenen Wortfolge mitgegeben werden. Alternativ erfolgt eine gezielte Auswahl durch eine die Wortfolge eingebende Person auf eine automatisch generierte Aufforderung hin. Diese Aufforderung wird von der Verarbeitungseinrichtung für jeden identifizierten Begriff mit lexikalischer Mehrdeutigkeit einer Wortfolge ausgegeben.
  • Darüber hinaus ist die Verarbeitungseinrichtung zur Übersetzung von Begriffen mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache eingerichtet.
  • Mittels einer Vorrichtung zur Ausgabe der Wortfolge in der Zielsprache, wird die transferierte Wortfolge zur Verfügung gestellt.
  • Die vorliegende Erfindung wird nachstehend anhand von in den Zeichnungen dargestellten Ausführungsbeispielen näher erläutert.
  • Es zeigen:
  • 1 eine schematische Darstellung einer Datenverarbeitungseinrichtung;
  • 2 ein vereinfachtes Ablaufdiagramm eines Verfahrens zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache;
  • 3 eine Veranschaulichung des Verfahren anhand eines konkreten Beispiels einer Wortfolge.
  • Die Darstellung in 1 zeigt eine schematische Darstellung einer Datenverarbeitungseinrichtung 1, welche zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache eingerichtet ist.
  • Die Datenverarbeitungseinrichtung 1 umfasst eine Vorrichtung zur Eingabe 2 einer in einer Quellsprache abgefassten Wortfolge, eine Speichereinrichtung 3, eine Verarbeitungseinrichtung 4 sowie eine Vorrichtung zur Ausgabe 5 der Wortfolge in einer Zielsprache. Als Vorrichtung zur Eingabe 2 ist eine Programmierschnittstelle (API) vorgesehen, die Zugang zu einem Netzwerk 10, insbesondere dem Internet, hat, um mit einer korrespondieren Anwendung zusammenzuarbeiten oder eine sonstige, der Eingabe von Daten dienende Einrichtung, beispielsweise eine Tastatur, ein Scanner, ein Datenträger oder dergleichen mehr. Die Speichereinrichtung 3 dient der nichtflüchtigen Hinterlegung von einem oder mehreren Anwendungsprogrammen 6, zumindest einer Terminologiedatenbank 7 sowie der Speicherung der in der Quellsprache eingegebenen Wortfolge beziehungsweise der in die Zielsprache transferierten Wortfolge als Datei 8, 9. Die Anzahl der erforderlichen Terminologiedatenbanken 7 orientiert sich an der Anzahl der Quell- und Zielsprachen, in denen Wortfolgen eingegeben werden sollen. Die Verarbeitungseinrichtung 4 weist Prozessoren auf, die zur Ausführung von Anwendungsprogrammen eingerichtet sind. Die Verarbeitungseinrichtung 4 steht im bidirektionalen Datenaustausch mit der Speichereinrichtung 3. Die Vorrichtung zur Ausgabe 5 ist ebenfalls als eine Programmierschnittstelle (API) ausgeführt. Alternativ oder ergänzend kann die Vorrichtung zur Ausgabe 5 beispielsweise als ein Bildschirm, ein Drucker oder eine sonstige der Ausgabe von Daten dienende Einrichtung sein.
  • Die Eingabe einer Wortfolge mittels der als Programmierschnittstelle ausgebildeten Vorrichtung zur Eingabe 2 der Datenverarbeitungseinrichtung 1 erfolgt im dargestellten Ausführungsbeispiel durch eine auf einem dezentral angeordneten Rechner 11 vorgesehene Anwendungssoftware, im einfachsten Fall einem Webbrowser 12.
  • In 2 ist ein vereinfachtes Ablaufdiagramm eines Verfahrens zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache dargestellt. Hierbei kann zumindest die Quellsprache der eingegebenen Wortfolge durch entsprechende Analyse mittels der Verarbeitungseinrichtung automatisch erkannt werden. Im Allgemeinen werden die Quellsprache und die Zielsprache jedoch vorgegeben.
  • In einem Schritt 20 erfolgt die Eingabe einer aus wenigstens einem Wort bestehenden Wortfolge mittels der Vorrichtung zur Eingabe 2. Die in einer Quellsprache eingegebene Wortfolge wird in der Speichereinrichtung 3 als Datei 8 abgelegt.
  • In einem nachfolgenden Schritt 21 erfolgt die semantische und syntaktische Analyse der eingegebenen Wortfolge durch die Verarbeitungseinrichtung 4. Hierzu wird die eingegebene Wortfolge von der Verarbeitungseinrichtung 4 aus der Speichereinrichtung 3 eingelesen. Die Analyse umfasst dabei die Überprüfung der Wortfolge auf das Vorhandensein wenigstens eines Begriffes mit lexikalischer Mehrdeutigkeit. Ein Beispiel für einen Begriff mit lexikalischer Mehrdeutigkeit ist das deutsche Wort „Tau“, das ein Seil, den morgendlichen Niederschlag oder einen Buchstaben des griechischen Alphabets bedeuten kann. Die Abarbeitung der eingegebenen Wortfolge wird sequentiell durchgeführt. Das Analysieren der Wortfolge und des wenigstens einen identifizierten Begriffes mit lexikalischer Mehrdeutigkeit in der Wortfolge wird durch einen Abgleich mit der Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank 7 der Speichereinrichtung 3 durchgeführt.
  • Wird im Schritt 21 zumindest ein Begriff mit lexikalischer Mehrdeutigkeit im Rahmen der Analyse identifiziert, so wird in einem nachfolgenden Schritt 22 ein Hinweis auf ein Vorliegen eines Begriffes mit lexikalischer Mehrdeutigkeit ausgegeben. Dies erfolgt im vorliegenden Ausführungsbeispiel durch eine Ausgabe auf dem Rechner 11, mittels dem die zu transferierende Wortfolge in der Quellsprache eingegeben wird. Hiermit verbunden ist die Aufforderung, den Begriff mit lexikalischer Mehrdeutigkeit hinsichtlich seiner Bedeutung im Kontext der Wortfolge zu definieren.
  • Hierzu wird im Schritt 23 anhand des beim Abgleichen mit der Terminologiedatenbank 7 identifizierten Begriffes mit lexikalischer Mehrdeutigkeit, dem in Abhängigkeit von seiner Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind, eine Auswahl der möglichen Bedeutungen respektive Definitionen des Begriffes mit lexikalischer Mehrdeutigkeit in Abhängigkeit von unterschiedlichen Kontexten angezeigt. Die Anzeige der Auswahl erfolgt auf dem Rechner 11 mittels des Webbrowsers 12. Entsprechend dem weiter oben angeführten Beispiel des deutschen Begriffes „Tau“, der drei unterschiedliche Bedeutungen aufweist, entspräche die Bedeutungsanzahl des Begriffes mit lexikalischer Mehrdeutigkeit „Tau“ dem Wert drei, so dass diesem drei Begriffsidentifikatoren zugeordnet sind. Aus dieser dargestellten Auswahl, die als eine einfache tabellarische Auflistung der unterschiedlichen Bedeutungen erfolgen kann, bis hin zu einer Textausgabe kombiniert mit einer grafischen Veranschaulichung, wird derjenige Begriffsidentifikator ausgewählt, der dem Kontext der eingegebenen Wortfolge entspricht.
  • Im nachfolgenden Schritt 24 wird dieser ausgewählte Begriffsidentifikator dem Begriff mit lexikalischer Mehrdeutigkeit zugeordnet. Diese Zuordnung des spezifischen Begriffsidentifikators wird in der Datei 8, die die Wortfolge in der Quellsprache enthält, abgespeichert. Hierzu wird der jeweilige Begriffsidentifikator dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit als ein maschinenlesbares Label zugeordnet.
  • Im darauffolgenden Schritt 25 findet die Übersetzung der analysierten Wortfolge aus der Quellsprache in die Zielsprache statt. Hierzu erfolgen zum einen die Auswahl eines mit dem ausgewählten Begriffsidentifikator korrespondierenden Begriffes in der Zielsprache und zum anderen das Übersetzen der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache, so dass eine bedeutungsinhaltlich korrespondierende Wortfolge erzeugt wird.
  • Daraufhin erfolgt in einem Schritt 26 die Zuordnung des im Schritt 23 ausgewählten Begriffsidentifikators zu dem mit dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der Quellsprache korrespondierenden Begriff der Zielsprache. Der jeweilige Begriffsidentifikator, mittels dem der Begriff in der Zielsprache ausgewählt wurde, wird dem entsprechenden Begriff der Zielsprache gleichfalls als ein maschinenlesbares Label zugeordnet. Die Übersetzung der Wortfolge in die Zielsprache wird zusammen mit dem oder den zugeordneten Labeln in der Datei 9 gespeichert. Diese Zuordnung erlaubt zu einem späteren Zeitpunkt einen Rückgriff auf die Terminologiedatenbank 7, das heißt den Abruf und die Darstellung des jeweils identifizierten Begriffes mit lexikalischer Mehrdeutigkeit in der Quellsprache sowie dessen Bedeutung und dem aus der Auswahl des Begriffsidentifikators resultierenden Begriffes in der Zielsprache. Auch diese Darstellung kann als eine einfache tabellarische Auflistung erfolgen, bis hin zu einer Textausgabe kombiniert mit einer grafischen Veranschaulichung der Bedeutung.
  • Abschließend wird im Schritt 27 die Wortfolge in der Zielsprache ausgegeben. Die Ausgabe erfolgt gemäß dem gewählten Ausführungsbeispiel durch den Webbrowsers 12.
  • 3 veranschaulicht das Verfahren anhand eines konkreten Beispiels einer Wortfolge. Hierbei umfasst eine vom Rechner 11 an die Datenverarbeitungseinrichtung 1 übertragene, in der Quellsprache abgefasste Wortfolge 30 die einzelnen Begriffe „Bitte treten Sie auf die Bremse“. Diese beispielsweise in einem HTML-Format abgefasste Wortfolge wird mittels der Vorrichtung zur Eingabe 3 in die Datenverarbeitungseinrichtung 1 zur weiteren Verarbeitung eingegeben. Im Zuge der Analyse der Wortfolge im Schritt 21 wird neben den Begriffen mit lexikalischer Eindeutigkeit 31 „Bitte treten Sie auf die“ der Begriff mit lexikalischer Mehrdeutigkeit 32 „Bremse“ identifiziert. Die Terminologiedatenbank 7 weist für diesen Begriff mit lexikalischer Mehrdeutigkeit 32 zwei mögliche Bedeutungen 35, 36 aus, so dass zwei Begriffsidentifikatoren 33, 34 vergeben wurden. Die Begriffsidentifikatoren 33, 34 stellen einen Schlüssel der Terminologiedatenbank 7 dar.
  • Aufgrund der Identifikation des Begriffes mit lexikalischer Mehrdeutigkeit 32 wird zur Auswahl eines der Begriffsidentifikatoren 33, 34 in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge 30 aufgefordert. Im vorliegenden Ausführungsbeispiel soll der Begriff mit lexikalischer Mehrdeutigkeit 32 „Bremse“ im Kontext mit einer Baugruppe zum Stoppen einer Bewegung stehen und nicht ein Insekt betreffen. Der Definition des Begriffs mitlexikalischer Mehrdeutigkeit 32 „Bremse“ im Sinne eines Insekts ist der Begriffsidentifikator 33 zugeordnet. Der Definition des Begriffs mitlexikalischer Mehrdeutigkeit 32 „Bremse“ im Sinne einer Baugruppe zum Stoppen einer Bewegung ist der Begriffsidentifikator 34 zugeordnet.
  • Entsprechend wird gemäß dem Kontext der Wortfolge der Begriffsidentifikator 34 ausgewählt. Die Auswahl erfolgt, wie weiter oben bereits beschrieben, manuell durch eine Bedienperson oder automatisiert. Die Zuordnung des ausgewählten Begriffsidentifikators 34 zu dem Begriff mit lexikalischer Mehrdeutigkeit 32 in der Quellsprache erfolgt in dem Schritt 24, wie bereits ausgeführt. Durch die Auswahl des Begriffsidentifikators 34 ist die bedeutungsinhaltlich korrespondierende Wortfolge in der Zielsprache festgelegt. So wird für die Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit 32 „Bremse“ nicht der korrespondierende englischsprachige Begriff 37 „horsefly“ sondern der Begriff 38 „brake“ ausgewählt. Dem ausgewählten Begriff 38 wird der Begriffsidentifikator 34 zugeordnet, welcher in der in der Zielsprache auszugebenen Wortfolge 39 erhalten bleibt. Dies wird in den Schritten 26 und 27 ausgeführt.
  • Bezugszeichenliste
  • 1
    Datenverarbeitungseinrichtung
    2
    Vorrichtung zur Eingabe
    3
    Speichereinrichtung
    4
    Verarbeitungseinrichtung
    5
    Vorrichtung zur Ausgabe
    6
    Anwendungsprogramm
    7
    Terminologiedatenbank
    8
    Datei
    9
    Datei
    10
    Netzwerk
    11
    Rechner
    12
    Webbrowser
    20
    Schritt
    21
    Schritt
    22
    Schritt
    23
    Schritt
    24
    Schritt
    25
    Schritt
    26
    Schritt
    27
    Schritt
    30
    Wortfolge in Quellsprache
    31
    Begriff mit lexikalischer Eindeutigkeit
    32
    Begriff mit lexikalischer Mehrdeutigkeit
    33
    Begriffsidentifikator
    34
    Begriffsidentifikator
    35
    Bedeutung von 32
    36
    Bedeutung von 32
    37
    englischsprachiger Begriff
    38
    englischsprachiger Begriff
    39
    Wortfolge in der Zielsprache
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • EP 0737928 A1 [0003]

Claims (12)

  1. Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge (30) in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache (39), gekennzeichnet durch die Verfahrensschritte: a) Eingeben der in der Quellsprache abgefassten Wortfolge (30); b) Analysieren der Wortfolge (30) und Identifizieren von Begriffen mit lexikalischer Mehrdeutigkeit (32) in der Wortfolge (30) durch Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank (7), denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren (33, 34) zugeordnet sind; c) Auswahl eines Begriffsidentifikators (33, 34) in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge (30); d) Auswahl eines mit dem ausgewählten Begriffsidentifikator (33, 34) korrespondierenden Begriffes (37, 38) in der Zielsprache; e) Übersetzen von Begriffen mit lexikalischer Eindeutigkeit (31) der Wortfolge (30) in die Zielsprache; f) Ausgeben der Wortfolge (39) in der Zielsprache.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in der Quellsprache abgefasste eingegebene Wortfolge (30) und die in der Zielsprache ausgegebene Wortfolge (39) als separate elektronische Dokumente (8, 9) abgespeichert werden.
  3. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass der jeweilige Begriffsidentifikator (33, 34) dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit (32) als ein maschinenlesbares Label zugeordnet wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass der jeweilige Begriffsidentifikator (33, 34) dem in der Zielsprache als Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit (32) ausgewählten Begriff (37, 38) als ein maschinenlesbares Label zugeordnet wird.
  5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass das jeweilige Label in dem abgespeicherten Dokument (8, 9) als eine logische Verknüpfung zu dem in der Terminologiedatenbank (7) hinterlegten Begriff mit lexikalischer Mehrdeutigkeit (32) eingebettet wird.
  6. Verfahren nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass das jeweilige Label innerhalb des elektronischen Dokumentes (8, 9) mittels einer Filterfunktion ein- und ausgeblendet wird.
  7. Verfahren nach einem der Ansprüche 2 bis 6, dadurch gekennzeichnet, dass das abgespeicherte elektronische Dokument (8, 9) zu einer Weiterverarbeitung in unterschiedliche Dateiformate konvertiert wird, wobei die dem jeweiligen Begriff mit lexikalischer Mehrdeutigkeit (32) zugeordneten Label erhalten werden.
  8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass zur Bestimmung des Kontextes der in der Quellsprache abgefassten Wortfolge (30) zumindest ein Schlüsselwort hinterlegt wird.
  9. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass während der Identifikation eines Begriffes mit lexikalischer Mehrdeutigkeit (32) innerhalb der Wortfolge (30) eine Aufforderung zur manuellen Zuordnung des Labels ausgegeben wird.
  10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass Begriffe mit lexikalischer Eindeutigkeit der Quellsprache mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Zielsprache umfassenden Terminologiedatenbank abgeglichen werden.
  11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass einem Begriff mit lexikalischer Eindeutigkeit der Quellsprache ein Begriffsidentifikator zugeordnet wird, wenn der korrespondierende in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit ist.
  12. Datenverarbeitungseinrichtung (1) zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge (30) in eine bedeutungsinhaltlich korrespondierende Wortfolge (39) einer Zielsprache, umfassend: – eine Vorrichtung zur Eingabe (2) der in der Quellsprache abgefassten Wortfolge (30); – eine Speichereinrichtung (3), in der eine Begriffe mit lexikalischer Mehrdeutigkeit (32) der Quellsprache umfassende Terminologiedatenbank (7), denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren (33, 34) zugeordnet sind, hinterlegt ist; – eine Verarbeitungseinrichtung (4), die zur Analyse der eingegebenen Wortfolge (30) und der Identifikation von Begriffen mit lexikalischer Mehrdeutigkeit (32) in der Wortfolge (30) durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank (7) eingerichtet ist, – wobei die Verarbeitungseinrichtung (4) zur Auswahl eines Begriffsidentifikators (33, 34) in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge (30) eingerichtet ist, – wobei die Verarbeitungseinrichtung (4) zur Auswahl eines mit dem ausgewählten Begriffsidentifikators (33, 34) korrespondierenden Begriffes (37, 38) in der Zielsprache eingerichtet ist, und – dass die Verarbeitungseinrichtung (4) zur Übersetzung von Begriffen mit lexikalischer Eindeutigkeit (31) der Wortfolge (30) in die Zielsprache eingerichtet ist; sowie – eine Vorrichtung zur Ausgabe (5) der Wortfolge (39) in der Zielsprache.
DE102016114265.4A 2016-08-02 2016-08-02 Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache Pending DE102016114265A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102016114265.4A DE102016114265A1 (de) 2016-08-02 2016-08-02 Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache
EP17755228.8A EP3494488A1 (de) 2016-08-02 2017-07-24 Verfahren zum zumindest teilweise maschinellen transferieren in einer quellsprache abgefassten wortfolge in eine wortfolge einer zielsprache
US16/321,787 US11132515B2 (en) 2016-08-02 2017-07-24 Method for at least partially automatically transferring a word sequence composed in a source language into a word sequence in a target language
PCT/IB2017/000862 WO2018073635A1 (de) 2016-08-02 2017-07-24 Verfahren zum zumindest teilweise maschinellen transferieren in einer quellsprache abgefassten wortfolge in eine wortfolge einer zielsprache

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016114265.4A DE102016114265A1 (de) 2016-08-02 2016-08-02 Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache

Publications (1)

Publication Number Publication Date
DE102016114265A1 true DE102016114265A1 (de) 2018-02-08

Family

ID=59683607

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016114265.4A Pending DE102016114265A1 (de) 2016-08-02 2016-08-02 Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache

Country Status (4)

Country Link
US (1) US11132515B2 (de)
EP (1) EP3494488A1 (de)
DE (1) DE102016114265A1 (de)
WO (1) WO2018073635A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11836454B2 (en) 2018-05-02 2023-12-05 Language Scientific, Inc. Systems and methods for producing reliable translation in near real-time
JPWO2020149069A1 (ja) * 2019-01-15 2021-11-25 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法およびプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0737928A1 (de) 1995-04-13 1996-10-16 Canon Kabushiki Kaisha Verfahren und Apparat für die Sprachverarbeitung

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8521506B2 (en) * 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9128926B2 (en) * 2006-10-26 2015-09-08 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US8209164B2 (en) * 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
JP5007977B2 (ja) * 2008-02-13 2012-08-22 独立行政法人情報通信研究機構 機械翻訳装置、機械翻訳方法、及びプログラム
US9110890B2 (en) * 2008-02-15 2015-08-18 International Business Machines Corporation Selecting a language encoding of a static communication in a virtual universe
US20110202512A1 (en) * 2010-02-14 2011-08-18 Georges Pierre Pantanelli Method to obtain a better understanding and/or translation of texts by using semantic analysis and/or artificial intelligence and/or connotations and/or rating
CN103370705B (zh) * 2011-01-05 2018-01-02 谷歌公司 用于便利文本输入的方法和系统
KR101870729B1 (ko) * 2011-09-01 2018-07-20 삼성전자주식회사 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법
EP2595143B1 (de) * 2011-11-17 2019-04-24 Svox AG Text-zu-Sprache-Synthese für Texte mit fremdsprachlichen Einfügungen
US9110891B2 (en) * 2011-12-12 2015-08-18 Google Inc. Auto-translation for multi user audio and video
US9483461B2 (en) * 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9043205B2 (en) * 2012-06-21 2015-05-26 Google Inc. Dynamic language model
US10354650B2 (en) * 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US8923829B2 (en) * 2012-12-28 2014-12-30 Verizon Patent And Licensing Inc. Filtering and enhancement of voice calls in a telecommunications network
US9418655B2 (en) * 2013-01-17 2016-08-16 Speech Morphing Systems, Inc. Method and apparatus to model and transfer the prosody of tags across languages
US8996352B2 (en) * 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US20140365200A1 (en) * 2013-06-05 2014-12-11 Lexifone Communication Systems (2010) Ltd. System and method for automatic speech translation
JP2015060095A (ja) * 2013-09-19 2015-03-30 株式会社東芝 音声翻訳装置、音声翻訳方法およびプログラム
US9747897B2 (en) * 2013-12-17 2017-08-29 Google Inc. Identifying substitute pronunciations
JP2017511914A (ja) * 2014-01-28 2017-04-27 ゾモル・ツォルツィン・ゲーエムベーハーSomol Zorzin GmbH テキストの意味を自動検出して一義性を自動測定する方法
US9740687B2 (en) * 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US9864744B2 (en) * 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
GB2533370A (en) * 2014-12-18 2016-06-22 Ibm Orthographic error correction using phonetic transcription
US9477652B2 (en) * 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US10332511B2 (en) * 2015-07-24 2019-06-25 International Business Machines Corporation Processing speech to text queries by optimizing conversion of speech queries to text
US9734142B2 (en) * 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10468016B2 (en) * 2015-11-24 2019-11-05 International Business Machines Corporation System and method for supporting automatic speech recognition of regional accents based on statistical information and user corrections
KR102545764B1 (ko) * 2016-04-01 2023-06-20 삼성전자주식회사 음성 번역을 위한 장치 및 방법
KR101827773B1 (ko) * 2016-08-02 2018-02-09 주식회사 하이퍼커넥트 통역 장치 및 방법
CN117198277A (zh) * 2016-08-12 2023-12-08 奇跃公司 单词流注释
US20180067927A1 (en) * 2016-09-06 2018-03-08 International Business Machines Corporation Customized Translation Comprehension
US20180143956A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc Real-time caption correction by audience
US10311876B2 (en) * 2017-02-14 2019-06-04 Google Llc Server side hotwording
CN107193807B (zh) * 2017-05-12 2021-05-28 北京百度网讯科技有限公司 基于人工智能的语言转换处理方法、装置及终端
CN110892407A (zh) * 2017-07-20 2020-03-17 松下知识产权经营株式会社 翻译装置、翻译方法以及程序
US11450311B2 (en) * 2018-12-13 2022-09-20 i2x GmbH System and methods for accent and dialect modification
US10839788B2 (en) * 2018-12-13 2020-11-17 i2x GmbH Systems and methods for selecting accent and dialect based on context
US20200226327A1 (en) * 2019-01-11 2020-07-16 Applications Technology (Apptek), Llc System and method for direct speech translation system
JP7251181B2 (ja) * 2019-02-05 2023-04-04 富士通株式会社 対訳処理方法および対訳処理プログラム
US11151332B2 (en) * 2019-03-07 2021-10-19 International Business Machines Business Dialog based speech recognition
US11093720B2 (en) * 2019-03-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Apparatus, method, and program product for converting multiple language variations
US11151996B2 (en) * 2019-04-16 2021-10-19 International Business Machines Corporation Vocal recognition using generally available speech-to-text systems and user-defined vocal training
US11501089B2 (en) * 2019-06-05 2022-11-15 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device thereof based on determining intent of a user speech in a first language machine translated into a predefined second language
KR20190080834A (ko) * 2019-06-18 2019-07-08 엘지전자 주식회사 사투리 음소 적응 학습 시스템 및 방법
KR20190113693A (ko) * 2019-09-18 2019-10-08 엘지전자 주식회사 단어 사용 빈도를 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0737928A1 (de) 1995-04-13 1996-10-16 Canon Kabushiki Kaisha Verfahren und Apparat für die Sprachverarbeitung

Also Published As

Publication number Publication date
US11132515B2 (en) 2021-09-28
EP3494488A1 (de) 2019-06-12
US20210081618A1 (en) 2021-03-18
WO2018073635A1 (de) 2018-04-26

Similar Documents

Publication Publication Date Title
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
EP1902407B1 (de) System zum übertragen von daten aus einer dokumentenanwendung in eine datenanwendung
DE10300545B4 (de) Vorrichtung, Verfahren, Speichermedium und Datenstruktur zur Kennzeichnung und Speicherung von Daten
DE102017008430A1 (de) Verfahren und Systeme zum Erzeugen von virtuelle Realität-Umgebungen aus elektronischen Dokumenten
DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
EP1671262B1 (de) Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
DE102016114265A1 (de) Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache
DE102014105666A1 (de) Übersetzungsprüfung
WO2022037818A1 (de) Vorrichtung und verfahren zur interaktion mit einer graphischen benutzeroberfläche und zum testen einer applikation
DE102021108675A1 (de) Schwach überwachte erkennung einer semantischen einheit unter verwendung von allgemeinwissen und zieldomänenkenntnis
DE4311211C2 (de) Computersystem und Verfahren zur automatisierten Analyse eines Textes
DE10033548A1 (de) Verfahren zur Vorschau von Internetseiten und Computerprogramm hierzu
DE2613703C2 (de) Schaltungsanordnung zum Übersetzen von Programmtexten
DE102016217191A1 (de) Verfahren zum Auswählen und Bewerten von einer Vielzahl von Datensätzen aus zumindest einer Datenquelle
DE102022128157A1 (de) Computerimplementiertes Verfahren zur Standardisierung von Teilenamen
DE202022104426U1 (de) System zur Vorbereitung und Untersuchung eines Englisch-Mizo-Korpus durch Auffinden von tonalen Wörtern
DE102008026689B4 (de) System zum Erstellen eines ausführbaren Verweises in einem Ursprungsdatensatz auf ein Verweisziel in einem Zieldatensatz und entsprechendes Verfahren
DE10334260A1 (de) System und Verfahren zur Qualitätssicherung in Übersetzungen
DE10142379B4 (de) Verfahren zum Erstellen von Hyperlinks und deren Verwendung zum Aufruf von Zieldokumenten aus einem Ausgangsdokument
DE19958861C2 (de) Verfahren zum automatischen Registrieren bei einer Suchmaschine eines Computer-Netzwerks
EP3531300A1 (de) Computerimplementiertes verfahren zum beschaffen von informationen
DE102005056713A1 (de) Verfahren und Vorrichtung zur automatischen Überprüfung von Dokumenten

Legal Events

Date Code Title Description
R082 Change of representative

Representative=s name: PATENT- UND RECHTSANWALTSKANZLEI DEKKER PARTGM, DE

Representative=s name: PATENTANWALTSKANZLEI DEKKER, DE

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017280000

Ipc: G06F0040400000

R082 Change of representative

Representative=s name: PATENT- UND RECHTSANWALTSKANZLEI DEKKER PARTGM, DE

R012 Request for examination validly filed