EP3494488A1 - Method for transferring a word sequence written in a source language into a word sequence in a target language at least partly by machine - Google Patents

Method for transferring a word sequence written in a source language into a word sequence in a target language at least partly by machine

Info

Publication number
EP3494488A1
EP3494488A1 EP17755228.8A EP17755228A EP3494488A1 EP 3494488 A1 EP3494488 A1 EP 3494488A1 EP 17755228 A EP17755228 A EP 17755228A EP 3494488 A1 EP3494488 A1 EP 3494488A1
Authority
EP
European Patent Office
Prior art keywords
term
word sequence
source language
language
lexical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP17755228.8A
Other languages
German (de)
French (fr)
Inventor
Ute Rummel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Claas Selbstfahrende Erntemaschinen GmbH
Original Assignee
Claas Selbstfahrende Erntemaschinen GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Claas Selbstfahrende Erntemaschinen GmbH filed Critical Claas Selbstfahrende Erntemaschinen GmbH
Publication of EP3494488A1 publication Critical patent/EP3494488A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Definitions

  • the present invention relates to a method for at least partially mechanically transferring a word sequence written in a source language into a meaning-correspondingly corresponding word sequence of a target language according to the preamble of claim 1 and to a data processing device according to the preamble of claim 12.
  • CONFIRMATION COPY In contrast to a human translator, a word sequence that has been translated into a meaning-corresponding word order of a target language is not or only conditionally able to recognize the context of a word sequence in the source language in which the term is used in order to assign it to the correct term in the target language to be able to assign. Accordingly, a machine translation requires a revision by a human translator when it comes to dispel misunderstandings in terms of content and avoid them. This applies in particular to translations in sensitive areas such as technical documentation.
  • Object of the present invention is to further develop the method and the data processing device of the type mentioned in such a way that they are characterized by a lower error rate and a higher processing speed.
  • a method for at least partially mechanically transferring a word sequence written in a source language into a meaning-correspondingly corresponding word sequence of a target language is proposed, which is characterized by the following method steps: a) entering the word order written in the source language;
  • the word sequence to be translated which may be composed of a single term or terms, is entered by, for example, providing it as an existing electronic document or by means of text recognition software or otherwise, for example typing using a keyboard, as a computer readable Text is provided.
  • the single term or terms of the input word sequence are automatically analyzed and the presence of one or more lexical ambiguity terms identified by comparison with a terminology database lexical ambiguity term dictionary.
  • the terms with lexical ambiguity of the terminology database are several, depending on their meaning number
  • the term identifier may each be implemented as a consecutive numbering representing the number of different meanings of a term with lexical ambiguity.
  • the selection of a term identifier is performed depending on the context of the word order written in the source language. Based on the selection of the selected term identifier, the corresponding term is determined in the target language.
  • contextual- The meaning of the term with lexical ambiguity in the target language is then translated into the target language with the lexical uniqueness of the word sequence written in the source language. Following this, the word sequence transferred to the target language is output.
  • the essential advantage of the method is that the assignment of the term identifier to the term with lexical ambiguity in the source language provides a clear definition of the term for translating the word sequence into the target language. This makes a translation less error prone, resulting in a significant reduction in post processing.
  • the word sequence written in the source language and the word sequence output in the target language can be stored as separate electronic documents. This allows a simple data exchange as well as a simple further processing or processing of the word sequences written or generated.
  • the respective term identifier may be assigned to the identified term with lexical ambiguity worded in the source language as a machine-readable label. This has the advantage that in a later check of the source text, it is readily possible to keep track of the specific meaning assigned to the identified term with lexical ambiguity within a word sequence.
  • the respective term identifier can be assigned to the term selected in the target language as the translation of the term with lexical ambiguity as a machine-readable label.
  • the respective label can be embedded in the stored document as a logical link to the term stored in the terminology database with lexical ambiguity. This simplifies visualization of the selected meaning of the term with lexical ambiguity.
  • the logical link allows direct access to the entry of the terminology database corresponding to the term identifier.
  • the respective meaning can be represented in text form and / or in graphical form by means of the assigned term identifier.
  • the logical link can be realized for example in the form of a so-called hyperlink, which is embedded in the text of the electronic document when selecting the term identifier.
  • the respective label within the electronic document by means of a filter function can be faded in and out. This makes it possible to increase the readability of the text of the electronic document.
  • the stored electronic document can be converted into different file formats for later further processing, the labels associated with the respective term having lexical ambiguity being obtained. This preserves the link between the term with lexical ambiguity, the term identifier and the meaning stored in the terminology database in order to be able to keep track of the selected assignment of the term identifier during the translation process.
  • At least one keyword is stored to determine the context of the word sequence.
  • at least one keyword can be entered or linked to it, which in an automatic selection of the term identifier in Depending on the context of the word sequence written in the source language can be used.
  • the automation of the method can be extended.
  • the at least one keyword can thereby lead to a reduction of the available for a term with lexical ambiguity selectable term identifiers.
  • a request for manual assignment of the label may be issued.
  • a person inputting the word sequence written in the source language is alerted by means of an automatically generated indication of the existence of a term with lexical ambiguity, and is prompted to appropriately select a term from among the number of terms provided by the terminology database.
  • the term corresponding to the identified term with lexical ambiguity can be assigned the term identifier corresponding to the context, which is assigned as a machine-readable label to the identified term with lexical ambiguity within the input electronic document.
  • a term with lexical uniqueness of the source language can be assigned a term identifier if the corresponding one in the target language is a term with lexical ambiguity.
  • the term identifier can refer to the terminology database of the target language.
  • a data processing device for automatically transferring a word sequence written in a source language into a meaning-corresponding word sequence of a target language comprising:
  • a memory device in which a term with lexical ambiguity of the source language comprehensive terminology database, to which a plurality of term identifiers are assigned depending on their meaning number, is deposited;
  • a processing means adapted to analyze the input word sequence and the identification terms with lexical ambiguity in the word sequence by comparison with the terms with lexical ambiguity of the terminology database
  • processing device is set up to select a term identifier in dependence on a context of the word sequence written in the source language, the processing device is set up to select a term corresponding to the selected term identifier in the target language, and
  • processing means is adapted to translate the terms with lexical uniqueness of the word order in the target language; such as
  • the device for entering the word sequence written in the source language is set up so that a direct or indirect input of the word sequence can take place.
  • the input can be viewed by means of a keyboard, that is, an operator type in a word sequence.
  • the input can be made by means of an opto-mechanical device by means of which a word sequence is captured as a graphic and converted into machine-readable data.
  • Optical character recognition transforms the graphic into a string that is merged into an electronic document.
  • the transmission of an electronic document from a computer regardless of its mode of origin, can be transmitted by means of a network to the device for inputting the data processing device.
  • the memory device In the memory device, a term with lexical ambiguity of the source language comprehensive terminology database is deposited. The terms with lexical ambiguity are assigned a number of term identifiers depending on their meaning number.
  • the memory device serves, inter alia, as memory for input word sequences or electronic documents.
  • the processing means By means of the processing means arranged to analyze the input word sequence and to identify lexical ambiguity terms in the word order by matching the lexical ambiguity terms of the terminology database, the input word sequence is analytically analyzed for the presence of lexical ambiguity terms. Siert. To this end, the processing means accesses the terminology database with the terms of lexical ambiguity contained in the source language to identify individual terms with lexical ambiguity within a word order.
  • the processing device is set up to select a term identifier as a function of a context of the word sequence written in the source language.
  • the corresponding term identifier is selected in order to give the identified term with lexical ambiguity of the word sequence its meaning corresponding to the context.
  • the selection can for example be made automatically based on one or more keywords, which are given to the entered word sequence.
  • the processing device is set up to translate terms with lexical uniqueness of the word order into the target language.
  • the transferred word sequence is provided.
  • FIG. 1 is a schematic representation of a data processing device
  • FIG. 2 is a simplified flow diagram of a method for automatically transferring a word sequence written in a source language into a meaning-corresponding word sequence of a target language
  • FIG. 2 is a simplified flow diagram of a method for automatically transferring a word sequence written in a source language into a meaning-corresponding word sequence of a target language
  • FIG. 3 shows an illustration of the method with reference to a concrete example of a word sequence.
  • FIG. 1 shows a schematic representation of a data processing device 1, which is set up for the purpose of mechanically transferring a word sequence written in a source language into a word sequence of a target language corresponding in meaning.
  • the data processing device 1 comprises a device for input 2 of a word sequence written in a source language, a memory device 3, a processing device 4 and a device for outputting the word sequence in a target language.
  • a programming interface is provided which has access to a network 10, in particular the Internet, in order to cooperate with a corresponding application or other inputting device, for example a keyboard, a scanner, a data carrier or the like more.
  • the memory device 3 is used for the non-volatile storage of one or more application programs 6, at least one terminology database 7 and the storage of the word sequence entered in the source language or the transferred into the target language word sequence as a file 8, 9.
  • the number of required terminology databases 7 is based on the Number of source and target languages in which word sequences are to be entered.
  • the processing device 4 has processors that are set up to execute application programs.
  • the processing device 4 is in bidirectional data exchange with the memory device 3.
  • the device for output 5 is also designed as a programming interface (API). Alternatively or additionally, the For example, it may be a device for outputting 5 as a screen, a printer or any other device serving to output data.
  • the input of a word sequence by means of the device designed as a programming interface for input 2 of the data processing device 1 is carried out in the illustrated embodiment by a provided on a decentralized computer 11 application software, in the simplest case a web browser 12th
  • FIG. 2 shows a simplified flowchart of a method for the automatic transfer of a word sequence written in a source language into a word sequence of a target language corresponding in meaning.
  • the source language of the input word sequence can be automatically recognized by appropriate analysis by means of the processing device.
  • the source language and the target language are given.
  • a step 20 the input of a word sequence consisting of at least one word by means of the input device 2 takes place.
  • the word sequence entered in a source language is stored in the memory device 3 as a file 8.
  • the semantic and syntactic analysis of the input word sequence is performed by the processing device 4.
  • the input word sequence is read from the processing device 4 from the memory device 3.
  • the analysis involves checking the word order for the existence of at least one term with lexical ambiguity.
  • An example of a term with lexical ambiguity is the German word "Tau", which may mean a rope, the morning rainfall or a letter of the Greek alphabet
  • the processing of the input word sequence is carried out sequentially Analyzing the word sequence and the at least one identified one
  • the term with lexical ambiguity in the word sequence is performed by matching the terms with lexical ambiguity of the source language comprehensive terminology database 7 of the memory device 3.
  • step 21 If at least one term with lexical ambiguity is identified in the course of the analysis in step 21, then in a subsequent step 22 an indication of the existence of a term with lexical ambiguity is output. This is done in the present embodiment by an output on the computer 1 1, by means of which the word sequence to be transferred is entered in the source language. Related to this is the requirement to define the term with lexical ambiguity in terms of its meaning in the context of the word order.
  • a selection of the possible meanings or definitions of the term with lexical ambiguity as a function of different contexts is displayed in step 23 on the basis of the term with lexical ambiguity identified when matching with the terminology database 7 to which a plurality of term identifiers are assigned depending on its meaning number.
  • the meaning number of the term with lexical ambiguity "Tau" would correspond to the value three, in the above example that this three term identifiers are assigned. From this illustrated selection, which can be done as a simple tabular listing of different meanings, to a text output combined with a graphical illustration, the one term identifier corresponding to the context of the input word sequence is selected.
  • this selected term identifier is assigned to the term with lexical ambiguity.
  • This assignment of the specific term identifier is shown in the file 8, which contains the word sequence in the source contains saved.
  • the respective term identifier is associated with the lexical ambiguity identified in the source language as a machine-readable label.
  • step 25 the translation of the analyzed word sequence from the source language into the target language takes place.
  • the selection of a term corresponding to the selected term identifier in the target language and, on the other hand, the translation of the terms with lexical uniqueness of the word sequence into the target language, so that a meaning sequence corresponding word sequence is generated.
  • a step 26 the assignment of the term identifier selected in step 23 to the term of the target language corresponding to the identified term with lexical ambiguity of the source language takes place.
  • the respective term identifier by means of which the term was selected in the target language, is likewise assigned to the corresponding term of the target language as a machine-readable label.
  • the translation of the word order into the target language is stored in the file 9 together with the associated labell or notes.
  • This assignment allows a later resort to the terminology database 7, that is, the retrieval and representation of the respective identified term with lexical ambiguity in the source language and its meaning and the term resulting from the selection of the term identifier in the target language. Again, this representation can be done as a simple tabular listing, up to a textual output combined with a graphical illustration of the meaning.
  • step 27 the word order is output in the target language.
  • the output is made according to the selected embodiment by the web browser 12.
  • Fig. 3 illustrates the method with reference to a concrete example of a word sequence.
  • one from the computer 11 to the data processing unit comprises Direction 1 transmitted in the source language word sequence 30 the individual terms "Please take the brake.”
  • This word sequence for example, written in an HTML format is entered by means of the input device 3 in the data processing device 1 for further processing
  • Analysis of the word order in step 21 is identified next to the terms with lexical uniqueness 31 "Please refer to” the term lexical ambiguity 32 "brake.”
  • the terminology database 7 for this term with lexical ambiguity 32 has two possible meanings 35, 36 , so that two term identifiers 33, 34 have been assigned.
  • the term identifiers 33, 34 represent a key of the terminology database 7.
  • lexical ambiguity 32 is intended to be in the context of an assembly to stop a movement and not an insect
  • definition of the term “lexical ambiguity” "brake” in the sense of an insect is associated with the term identifier 33.
  • definition of the term “lexical ambiguity” "brake” in the sense of an assembly for stopping a movement is assigned to the term identifier 34.
  • the term identifier 34 is selected according to the context of the word order. The selection is made, as already described above, manually by an operator or automated. The assignment of the selected term identifier 34 to the lexical ambiguity term 32 in the source language occurs in step 24, as already explained. Through the selection of the term identifier 34, the meaning-corresponding word order is defined in the target language. Thus, for the translation of the term with lexical ambiguity 32 "brake” not the corresponding English-language term 37 "horsefly" but the term 38 "brake” is used. chooses. The selected term 38 is assigned the term identifier 34, which is retained in the word sequence 39 to be output in the target language. This is done in steps 26 and 27.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

The present invention relates to a method for transferring a word sequence (30) written in a source language into a word sequence (39) with a corresponding semantic content in a target language at least partly by machine. By analysing the word sequence (30) in the source language and identifying terms having lexical ambiguity (32) in the word sequence by comparison against a terminology database (7) comprising terms having lexical ambiguity in the source language that have multiple associated term indicators (33, 34) depending on their number of meanings, association of a term identifier (33, 34) with the term having lexical ambiguity (32) in the source language provides an unambiguous term definition for translating the word sequence (39) into the target language. This makes an in particular completely machine-generated translation less susceptible to error.

Description

Anmelderin:  applicant:
CLAAS Selbstfahrende Erntemaschinen GmbH  CLAAS self-propelled harvesters GmbH
Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine Wortfolge einer Zielsprache Method for at least partially machine transferring a word sequence written in a source language into a word sequence of a target language
Die vorliegende Erfindung betrifft ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache gemäß dem Oberbegriff des Anspruches 1 sowie eine Datenverarbeitungseinrichtung gemäß dem Oberbegriff des Anspruches 12. The present invention relates to a method for at least partially mechanically transferring a word sequence written in a source language into a meaning-correspondingly corresponding word sequence of a target language according to the preamble of claim 1 and to a data processing device according to the preamble of claim 12.
Bei der Übersetzung eines aus einer Wortfolge oder mehreren Wortfolgen gebildeten Textes einer Quellsprache in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache ist es wesentlich, den Kontext der Wortfolge zu erkennen, um sprachliche Missverständnisse zu vermeiden. Sprachliche Missverständnisse beruhen im Allgemeinen auf einer Fehlinterpretation eines einzelnen Begriffes in einer Wortfolge, welchem in der Quellsprache in Abhängigkeit vom Kontext, in welchem dieser Begriff genutzt wird, verschiedene inhaltliche Bedeutungen zukommen. Man spricht in diesem Zusammenhang von einem homonymen beziehungsweise polysemen Begriff oder auch von einem Begriff mit lexikalischer Mehrdeutigkeit. Beispielhaft sei hierfür der deutsche Begriff„Verletzung" angeführt, der bei einer Übersetzung ins Englische unterschiedlich interpretierbar ist. So kann der deutsche Begriff„Verletzung" unter anderem im Englischen mit„injury" oder„infringement" übersetzt werden. Während der Begriff„injury" im medizinischen Kontext als das Vorliegen physischen Verletzung eines Lebewesens verstanden wird, wird der Begriff„infringement" im juristischen Kontext als eine Rechtsverletzung durch eine Handlung eines Dritten verwendet. Ein Verfahren respektive eine Datenverarbeitungseinrichtung zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache When translating a text of a source language formed from a word sequence or several word sequences into a meaning sequence of a target language that corresponds in meaning, it is essential to recognize the context of the word sequence in order to avoid linguistic misunderstandings. Language misunderstandings are generally based on a misinterpretation of a single term in a word sequence, which in the source language, depending on the context in which this term is used, different substantive meanings. In this context, we speak of a homonymous or polysemous term or of a term with lexical ambiguity. By way of example, the German term "violation" is cited here, which can be interpreted differently with a translation into English, so that the German term "injury" can be translated inter alia in English as "injury" or "infringement". While the term "injury" is understood in the medical context to mean the physical injury of a living being, the term "infringement" is used in a legal context as an infringement of an act of a third party. A method or a data processing device for at least partially machine transferring one in a source language
BESTÄTIGUNGSKOPIE abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolg einer Zielsprache ist, im Gegensatz zu einem Humanübersetzer, nicht oder nur bedingt in der Lage, den Kontext einer Wortfolge in der Quellsprache zu erkennen, in welchem der Begriff verwendet wird, um diesen dem richtigen Begriff in der Zielsprache zuordnen zu können. Entsprechend bedarf eine maschinelle Übersetzung einer Überarbeitung durch einen Humanübersetzer, wenn es gilt, inhaltliche Missverständnisse auszuräumen und zu vermeiden. Dies gilt insbesondere für Übersetzungen in sensiblen Bereichen wie technische Dokumentationen. CONFIRMATION COPY In contrast to a human translator, a word sequence that has been translated into a meaning-corresponding word order of a target language is not or only conditionally able to recognize the context of a word sequence in the source language in which the term is used in order to assign it to the correct term in the target language to be able to assign. Accordingly, a machine translation requires a revision by a human translator when it comes to dispel misunderstandings in terms of content and avoid them. This applies in particular to translations in sensitive areas such as technical documentation.
Aus der EP 0 737 928 A1 sind ein Verfahren sowie eine Datenverarbeitungseinrichtung der eingangs genannten Art vorbekannt. From EP 0 737 928 A1, a method and a data processing device of the type mentioned above are already known.
Aufgabe der vorliegenden Erfindung ist es, das Verfahren sowie die Datenverarbeitungseinrichtung der eingangs genannten Art derart weiterzuentwickeln, dass diese sich durch eine geringere Fehleranfälligkeit und eine höhere Verarbeitungsgeschwindigkeit auszeichnen. Object of the present invention is to further develop the method and the data processing device of the type mentioned in such a way that they are characterized by a lower error rate and a higher processing speed.
Diese Aufgabe wird bezogen auf ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache durch die kennzeichnenden Merkmale des Anspruches 1 und bezüglich einer Datenverarbeitungseinrichtung durch die kennzeichnenden Merkmale des Anspruches 12 gelöst. This object is achieved by the characterizing features of claim 1 and with respect to a data processing device by the characterizing features of claim 12 with respect to a method for at least partially mechanically transferring a word sequence written in a source language into a meaning-correspondingly word order of a target language.
Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand der Unteransprüche. Advantageous developments of the invention are the subject of the dependent claims.
Gemäß dem Anspruch 1 wird ein Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache vorgeschla gen, welches durch die nachfolgenden Verfahrensschritte gekennzeichnet ist: a) Eingeben der in der Quellsprache abgefassten Wortfolge; According to claim 1, a method for at least partially mechanically transferring a word sequence written in a source language into a meaning-correspondingly corresponding word sequence of a target language is proposed, which is characterized by the following method steps: a) entering the word order written in the source language;
b) Analysieren der Wortfolge und Identifizieren von Begriffen mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank, denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifi- katoren zugeordnet sind;  b) analyzing the word order and identifying terms with lexical ambiguity in the word order by matching with a term with lexical ambiguity of the source language comprehensive terminology database, which are assigned depending on their meaning number several term identifiers;
c) Auswahl eines Begriffsidentifikators in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge;  c) selecting a term identifier depending on the context of the word order written in the source language;
d) Auswahl eines mit dem ausgewählten Begriffsidentifikator korrespondierenden Begriffes in der Zielsprache;  d) selecting a term corresponding to the selected term identifier in the target language;
e) Übersetzen der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache;  e) translating the terms with lexical uniqueness of the word order into the target language;
f) Ausgeben der Wortfolge in der Zielsprache.  f) output the word order in the target language.
Die zu übersetzende Wortfolge, die sich aus einem einzelnen Begriff oder mehreren Begriffen zusammensetzen kann, wird eingegeben, indem diese beispielsweise als bestehendes elektronisches Dokument zur Verfügung gestellt oder mittels einer Texterkennungssoftware erfasst oder in sonstiger Weise, zum Beispiel Eintippen mittels einer Tastatur, als ein computerlesbarer Text bereitgestellt wird. Der einzelne Begriff oder die Begriffe der eingegebenen Wortfolge werden automatisiert analysiert und das Vorliegen eines oder mehrerer Begriffe mit lexikalischer Mehrdeutigkeit durch einen Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank identifiziert. Den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank sind in Abhängigkeit von ihrer Bedeutungsanzahl mehrere The word sequence to be translated, which may be composed of a single term or terms, is entered by, for example, providing it as an existing electronic document or by means of text recognition software or otherwise, for example typing using a keyboard, as a computer readable Text is provided. The single term or terms of the input word sequence are automatically analyzed and the presence of one or more lexical ambiguity terms identified by comparison with a terminology database lexical ambiguity term dictionary. The terms with lexical ambiguity of the terminology database are several, depending on their meaning number
Begriffsidentifikatoren zugeordnet. Der Begriffsidentifikator kann jeweils als eine fortlaufende Nummerierung ausgeführt sein, die für die Anzahl unterschiedlicher Bedeutungen eines Begriffes mit lexikalischer Mehrdeutigkeit steht. Die Auswahl eines Begriffsidentifikators wird in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge durchgeführt. Basierend auf der Auswahl des ausgewählten Begriffsidentifikators wird der korrespondierende Begriff in der Zielsprache bestimmt. In Kenntnis der inhaltlichen, sich am Kontext orientieren- den Bedeutung des Begriffes mit lexikalischer Mehrdeutigkeit in der Zielsprache werden dann die übrigen Begriffe mit lexikalischer Eindeutigkeit der in der Quellsprache abgefassten Wortfolge in die Zielsprache übersetzt. Im Anschluss daran wird die in die Zielsprache transferierte Wortfolge ausgegeben. Der wesentliche Vorteil des Verfahrens besteht darin, dass durch die Zuordnung des Begriffsidentifikators zu dem Begriff mit lexikalischer Mehrdeutigkeit in der Quellsprache eine eindeutige Begriffsdefinition zur Übersetzung der Wortfolge in die Zielsprache zur Verfügung steht. Dadurch wird eine Übersetzung weniger fehleranfällig, was zu einer signifikanten Reduzierung einer Nachbearbeitung führt. Associated with term identifiers. The term identifier may each be implemented as a consecutive numbering representing the number of different meanings of a term with lexical ambiguity. The selection of a term identifier is performed depending on the context of the word order written in the source language. Based on the selection of the selected term identifier, the corresponding term is determined in the target language. In knowledge of the contextual, contextual- The meaning of the term with lexical ambiguity in the target language is then translated into the target language with the lexical uniqueness of the word sequence written in the source language. Following this, the word sequence transferred to the target language is output. The essential advantage of the method is that the assignment of the term identifier to the term with lexical ambiguity in the source language provides a clear definition of the term for translating the word sequence into the target language. This makes a translation less error prone, resulting in a significant reduction in post processing.
Vorteilhafterweise können die in der Quellsprache abgefasste eingegebene Wortfolge und die in der Zielsprache ausgegebene Wortfolge als separate elektronische Dokumente abgespeichert werden. Dies ermöglicht einen einfachen Datenaustausch sowie eine einfache Weiterbe- oder -Verarbeitung der abgefassten beziehungsweise erzeugten Wortfolgen. Advantageously, the word sequence written in the source language and the word sequence output in the target language can be stored as separate electronic documents. This allows a simple data exchange as well as a simple further processing or processing of the word sequences written or generated.
Vorzugsweise kann der jeweilige Begriffsidentifikator dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit als ein maschinenlesbares Label zugeordnet werden. Dies hat den Vorteil, dass bei einer späteren Überprüfung des Quelltextes es ohne weiteres möglich ist, die dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit zugordnete spezifische Bedeutung innerhalb einer Wortfolge nachzuhalten. Preferably, the respective term identifier may be assigned to the identified term with lexical ambiguity worded in the source language as a machine-readable label. This has the advantage that in a later check of the source text, it is readily possible to keep track of the specific meaning assigned to the identified term with lexical ambiguity within a word sequence.
Insbesondere kann der jeweilige Begriffsidentifikator dem in der Zielsprache als Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit ausgewählten Begriff als ein maschinenlesbares Label zugeordnet werden. Dies hat den Vorteil, dass eine Person, welche die in die Zielsprache transferierte Wortfolge inhaltlich überprüft, in die Lage versetzt wird, die vorgenommene Auswahl des Begriffsidentifikators nachzuvollziehen. Eine mit der Übersetzung der Wortfolge beauftragte Person erhält automatisiert Zusatzinformationen, wodurch sich eine Erhöhung der Qualität der Übersetzung erreichen lässt. Eine Person, welche die in die Zielsprache übersetzte Wortfolge liest, erhält auf diesem Wege eine Zusatzinformation, wodurch die übersetzte Wortfolge verständlicher wird. In particular, the respective term identifier can be assigned to the term selected in the target language as the translation of the term with lexical ambiguity as a machine-readable label. This has the advantage that a person who checks the content of the word sequence transferred into the target language is enabled to comprehend the selection made of the term identifier. A person commissioned with the translation of the word sequence automatically receives additional information, which can increase the quality of the translation. A person who the read into the target language translated word sequence, receives in this way an additional information, making the translated word sequence is more understandable.
Weiterhin kann das jeweilige Label in dem abgespeicherten Dokument als eine logische Verknüpfung zu dem in der Terminologiedatenbank hinterlegten Begriff mit lexikalischer Mehrdeutigkeit eingebettet werden. Dies vereinfacht eine Visualisierung der ausgewählten Bedeutung des Begriffes mit lexikalischer Mehrdeutigkeit. So kann durch die logische Verknüpfung ein direkter Zugriff auf den mit dem Begriffsidentifikator korrespondierenden Eintrag der Terminologiedatenbank ermöglicht werden. Insbesondere kann mittels des zugeordneten Begriffsidentifikators die jeweilige Bedeutung in Textform und/oder in grafischer Form dargestellt werden. Die logische Verknüpfung kann beispielsweise in Form eines sogenannten Hyperlinks realisiert werden, der bei Auswahl des Begriffsidentifikators in den Text des elektronischen Dokumentes eingebettet wird. Furthermore, the respective label can be embedded in the stored document as a logical link to the term stored in the terminology database with lexical ambiguity. This simplifies visualization of the selected meaning of the term with lexical ambiguity. Thus, the logical link allows direct access to the entry of the terminology database corresponding to the term identifier. In particular, the respective meaning can be represented in text form and / or in graphical form by means of the assigned term identifier. The logical link can be realized for example in the form of a so-called hyperlink, which is embedded in the text of the electronic document when selecting the term identifier.
Vorzugsweise kann das jeweilige Label innerhalb des elektronischen Dokumentes mittels einer Filterfunktion ein- und ausgeblendet werden. Hierdurch lässt sich die Lesbarkeit des Textes des elektronischen Dokumentes erhöhen. Preferably, the respective label within the electronic document by means of a filter function can be faded in and out. This makes it possible to increase the readability of the text of the electronic document.
Des Weiteren kann das abgespeicherte elektronische Dokument zu einer späteren Weiterverarbeitung in unterschiedliche Dateiformate konvertiert werden, wobei die dem jeweiligen Begriff mit lexikalischer Mehrdeutigkeit zugeordneten Label erhalten werden. Dadurch bleibt die Verknüpfung zwischen dem Begriff mit lexikalischer Mehrdeutigkeit, dem Begriffsidentifikator und der in der Terminologiedatenbank hinterlegten Bedeutung erhalten, um die gewählte Zuordnung des Begriffsidentifikators während des Übersetzungsvorganges nachhalten zu können. Furthermore, the stored electronic document can be converted into different file formats for later further processing, the labels associated with the respective term having lexical ambiguity being obtained. This preserves the link between the term with lexical ambiguity, the term identifier and the meaning stored in the terminology database in order to be able to keep track of the selected assignment of the term identifier during the translation process.
Vorteilhaft ist es, wenn zur Bestimmung des Kontextes der Wortfolge zumindest ein Schlüsselwort hinterlegt wird. Mit der Eingabe der zu transferierenden Wortfolge kann zumindest ein Schlüsselwort eingegeben oder mit dieser verknüpft werden, welches bei einer automatischen Auswahl des Begriffsidentifikators in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge herangezogen werden kann. Hierdurch kann die Automatisierung des Verfahrens erweitert werden. Das zumindest eine Schlüsselwort kann dabei zu einer Reduzierung der für einen Begriff mit lexikalischer Mehrdeutigkeit zur Verfügung stehenden auswählbaren Begriffsidentifikatoren führen. It is advantageous if at least one keyword is stored to determine the context of the word sequence. With the input of the word sequence to be transferred, at least one keyword can be entered or linked to it, which in an automatic selection of the term identifier in Depending on the context of the word sequence written in the source language can be used. As a result, the automation of the method can be extended. The at least one keyword can thereby lead to a reduction of the available for a term with lexical ambiguity selectable term identifiers.
Alternativ oder zusätzlich kann während der Identifikation eines Begriffes mit lexikalischer Mehrdeutigkeit innerhalb der Wortfolge eine Aufforderung zur manuellen Zuordnung des Labels ausgegeben werden. Eine die in der Quellsprache abgefasste Wortfolge eingebende Person wird mittels eines automatisiert generierten Hinweises auf das Vorhandensein eines Begriffes mit lexikalischer Mehrdeutigkeit aufmerksam gemacht und zu einer entsprechenden Auswahl eines Begriffes aus der Anzahl von Begriffen, die mittels der Terminologiedatenbank bereitgestellt werden, aufgefordert. Hierbei kann während der Eingabe der in der Quellsprache abgefassten Wortfolge dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der dem Kontext entsprechende Begriffsi- dentifikator zugeordnet werden, welcher als maschinenlesbares Label dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit innerhalb des eingegebenen elektronischen Dokumentes zugewiesen wird. Alternatively or additionally, during the identification of a term with lexical ambiguity within the word sequence, a request for manual assignment of the label may be issued. A person inputting the word sequence written in the source language is alerted by means of an automatically generated indication of the existence of a term with lexical ambiguity, and is prompted to appropriately select a term from among the number of terms provided by the terminology database. In this case, during the entry of the word sequence written in the source language, the term corresponding to the identified term with lexical ambiguity can be assigned the term identifier corresponding to the context, which is assigned as a machine-readable label to the identified term with lexical ambiguity within the input electronic document.
Gemäß einer vorteilhaften Weiterbildung kann vorgesehen sein, dass Begriffe mit lexikalischer Eindeutigkeit der Quellsprache mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Zielsprache umfassenden Terminologiedatenbank abgeglichen werden. Dies ist vor dem Hintergrund sinnvoll, dass ein in der Quellsprache bedeutungsinhaltlich eindeutiger Begriff in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit sein kann, so dass dessen Interpretation beim Lesen des in die Zielsprache übersetzten Textes irreführend sein kann. According to an advantageous development it can be provided that terms with lexical uniqueness of the source language are compared with a term with lexical ambiguity of the terminology comprehensive terminology database. This makes sense against the background that a meaningful term in the source language in the target language can be a term with lexical ambiguity, so that its interpretation when reading the text translated into the target language can be misleading.
Dabei kann einem Begriffe mit lexikalischer Eindeutigkeit der Quellsprache ein Begriffsidentifikator zugeordnet werden, wenn der korrespondierende in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit ist. Hierzu kann der Begriffsidentifikator auf die Terminologiedatenbank der Zielsprache referenzie- ren. Auf diese Weise kann gewährleistet werden, dass den Begriffen mit lexikalischer Eindeutigkeit der Quellsprache, die in der Zielsprache Begriffe mit lexikalischer Mehrdeutigkeit sind, eine in der Zielsprache dem Bedeutungsinhalt des Begriffes entsprechende Übersetzung zugewiesen wird. In this case, a term with lexical uniqueness of the source language can be assigned a term identifier if the corresponding one in the target language is a term with lexical ambiguity. For this purpose, the term identifier can refer to the terminology database of the target language. In this way, it can be ensured that the terms with lexical uniqueness of the source language, which are terms with lexical ambiguity in the target language, are assigned a translation corresponding to the meaning content of the term in the target language.
Vorteilhaft ist, dass mittels der Zuordnung von Begriffsidentifikatoren eine nachträgliche Bearbeitung der elektronischen Dokumente der Quellsprache als auch der Zielsprache möglich ist. Insbesondere können im Nachhinein Begriffsidentifikatoren hinzugefügt werden. Ein weiterer Vorteil besteht darin, dass in einer Wortfolge verwendete Begriffe mit lexikalischer Mehrdeutigkeit maschinell ausgefiltert und exportiert werden können. Somit werden die elektronischen Dokumente der Quell- und Zielsprache auch ohne eine Anbindung an die jeweilige Terminologiedatenbank austauschbar. It is advantageous that by means of the assignment of term identifiers a subsequent processing of the electronic documents of the source language as well as the target language is possible. In particular, term identifiers can be added afterwards. Another advantage is that lexical ambiguity terms used in a word order can be machine-filtered and exported. Thus, the electronic documents of the source and target languages are interchangeable without a connection to the respective terminology database.
Weiterhin wird gemäß dem unabhängigen Anspruch 12 eine Datenverarbeitungseinrichtung zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache vorgeschlagen, umfassend: Furthermore, according to independent claim 12, a data processing device for automatically transferring a word sequence written in a source language into a meaning-corresponding word sequence of a target language is proposed, comprising:
- eine Vorrichtung zur Eingabe der in der Quellsprache abgefassten Wortfolge; a device for inputting the word sequence written in the source language;
- eine Speichereinrichtung, in der eine Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassende Terminologiedatenbank, denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind, hinterlegt ist;  a memory device in which a term with lexical ambiguity of the source language comprehensive terminology database, to which a plurality of term identifiers are assigned depending on their meaning number, is deposited;
- eine Verarbeitungseinrichtung, die zur Analyse der eingegebenen Wortfolge und der Identifikation Begriffe mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank eingerichtet ist,  a processing means adapted to analyze the input word sequence and the identification terms with lexical ambiguity in the word sequence by comparison with the terms with lexical ambiguity of the terminology database,
- wobei die Verarbeitungseinrichtung zur Auswahl eines Begriffsidentifikators in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge eingerichtet ist, - die Verarbeitungseinrichtung zur Auswahl eines mit dem ausgewählten Be- griffsidentifikators korrespondierenden Begriffes in der Zielsprache eingerichtet ist, und wherein the processing device is set up to select a term identifier in dependence on a context of the word sequence written in the source language, the processing device is set up to select a term corresponding to the selected term identifier in the target language, and
- dass die Verarbeitungseinrichtung zur Übersetzung der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache eingerichtet ist; sowie - that the processing means is adapted to translate the terms with lexical uniqueness of the word order in the target language; such as
- eine Vorrichtung zur Ausgabe der Wortfolge in der Zielsprache. a device for outputting the word order in the target language.
Die Vorrichtung zur Eingabe der in der Quellsprache abgefassten Wortfolge ist dazu eingerichtet, dass eine unmittelbare oder mittelbare Eingabe der Wortfolge erfolgen kann. Als unmittelbare Eingabe kann die Eingabe mittels einer Tastatur angesehen werden, das heißt eine Bedienperson tippt eine Wortfolge ein. The device for entering the word sequence written in the source language is set up so that a direct or indirect input of the word sequence can take place. As an immediate input, the input can be viewed by means of a keyboard, that is, an operator type in a word sequence.
Alternativ kann die Eingabe mittels einer optomechanischen Einrichtung erfolgen, mittels der eine Wortfolge als Grafik erfasst und in maschinenlesbare Daten umgewandelt wird. Durch eine optische Zeichenerkennung wird die Grafik in eine Zeichenfolge umgewandelt, die in einem elektronischen Dokument zusammengeführt wird. Als mittelbare Eingabe kann die Übertragung eines elektronischen Dokumentes von einem Rechner, unabhängig von dessen Entstehungsweise, mittels eines Netzwerkes an die Vorrichtung zur Eingabe der Datenverarbeitungseinrichtung übertragen werden. Alternatively, the input can be made by means of an opto-mechanical device by means of which a word sequence is captured as a graphic and converted into machine-readable data. Optical character recognition transforms the graphic into a string that is merged into an electronic document. As an indirect input, the transmission of an electronic document from a computer, regardless of its mode of origin, can be transmitted by means of a network to the device for inputting the data processing device.
In der Speichereinrichtung ist eine Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassende Terminologiedatenbank hinterlegt. Den Begriffen mit lexikalischer Mehrdeutigkeit sind in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet. Darüber hinaus dient die Speichereinrichtung unter anderem als Speicher für eingegebene Wortfolgen respektive elektronische Dokumente. In the memory device, a term with lexical ambiguity of the source language comprehensive terminology database is deposited. The terms with lexical ambiguity are assigned a number of term identifiers depending on their meaning number. In addition, the memory device serves, inter alia, as memory for input word sequences or electronic documents.
Mittels der Verarbeitungseinrichtung, die zur Analyse der eingegebenen Wortfolge und der Identifikation von Begriffen mit lexikalischer Mehrdeutigkeit in der Wortfolge durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank eingerichtet ist, wird die eingegebene Wortfolge hinsichtlich des Vorhandenseins von Begriffen mit lexikalischer Mehrdeutigkeit analy- siert. Hierzu greift die Verarbeitungseinrichtung auf die Terminologiedatenbank mit den in der der Quellsprache enthaltenen Begriffen mit lexikalischer Mehrdeutigkeit zurück, um einzelne Begriffe mit lexikalischer Mehrdeutigkeit innerhalb einer Wortfolge zu identifizieren. By means of the processing means arranged to analyze the input word sequence and to identify lexical ambiguity terms in the word order by matching the lexical ambiguity terms of the terminology database, the input word sequence is analytically analyzed for the presence of lexical ambiguity terms. Siert. To this end, the processing means accesses the terminology database with the terms of lexical ambiguity contained in the source language to identify individual terms with lexical ambiguity within a word order.
Die Verarbeitungseinrichtung ist zur Auswahl eines Begriffsidentifikators in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge eingerichtet. In Abhängigkeit von dem Kontext der in der Quellsprache abgefassten Wortfolge wird der entsprechende Begriffsidentifikator ausgewählt, um dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der Wortfolge seine dem Kontext entsprechende Bedeutung zukommen zu lassen. Die Auswahl kann beispielsweise automatisiert anhand eines oder mehrerer Schlüsselworte erfolgen, welche der eingegebenen Wortfolge mitgegeben werden. Alternativ erfolgt eine gezielte Auswahl durch eine die Wortfolge eingebende Person auf eine automatisch generierte Aufforderung hin. Diese Aufforderung wird von der Verarbeitungseinrichtung für jeden identifizierten Begriff mit lexikalischer Mehrdeutigkeit einer Wortfolge ausgegeben. The processing device is set up to select a term identifier as a function of a context of the word sequence written in the source language. Depending on the context of the word sequence written in the source language, the corresponding term identifier is selected in order to give the identified term with lexical ambiguity of the word sequence its meaning corresponding to the context. The selection can for example be made automatically based on one or more keywords, which are given to the entered word sequence. Alternatively, a targeted selection by a person entering the word sequence on an automatically generated request. This request is issued by the processor for each identified term with lexical ambiguity of a phrase.
Darüber hinaus ist die Verärbeitungseinrichtung zur Übersetzung von Begriffen mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache eingerichtet. In addition, the processing device is set up to translate terms with lexical uniqueness of the word order into the target language.
Mittels einer Vorrichtung zur Ausgabe der Wortfolge in der Zielsprache, wird die transferierte Wortfolge zur Verfügung gestellt. By means of a device for outputting the word sequence in the target language, the transferred word sequence is provided.
Die vorliegende Erfindung wird nachstehend anhand von in den Zeichnungen dargestellten Ausführungsbeispielen näher erläutert. The present invention will be explained below with reference to exemplary embodiments illustrated in the drawings.
Es zeigen: Show it:
Fig. 1 eine schematische Darstellung einer Datenverarbeitungseinrichtung; Fig. 2 ein vereinfachtes Ablaufdiagramm eines Verfahrens zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache; Fig. 1 is a schematic representation of a data processing device; FIG. 2 is a simplified flow diagram of a method for automatically transferring a word sequence written in a source language into a meaning-corresponding word sequence of a target language; FIG.
Fig. 3 eine Veranschaulichung des Verfahren anhand eines konkreten Beispiels einer Wortfolge. 3 shows an illustration of the method with reference to a concrete example of a word sequence.
Die Darstellung in Fig. 1 zeigt eine schematische Darstellung einer Datenverarbeitungseinrichtung 1 , welche zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache eingerichtet ist. The representation in FIG. 1 shows a schematic representation of a data processing device 1, which is set up for the purpose of mechanically transferring a word sequence written in a source language into a word sequence of a target language corresponding in meaning.
Die Datenverarbeitungseinrichtung 1 umfasst eine Vorrichtung zur Eingabe 2 einer in einer Quellsprache abgefassten Wortfolge, eine Speichereinrichtung 3, eine Verarbeitungseinrichtung 4 sowie eine Vorrichtung zur Ausgabe 5 der Wortfolge in einer Zielsprache. Als Vorrichtung zur Eingabe 2 ist eine Programmierschnittstelle (API) vorgesehen, die Zugang zu einem Netzwerk 10, insbesondere dem Internet, hat, um mit einer korrespondieren Anwendung zusammenzuarbeiten oder eine sonstige, der Eingabe von Daten dienende Einrichtung, beispielsweise eine Tastatur, ein Scanner, ein Datenträger oder dergleichen mehr. Die Speichereinrichtung 3 dient der nichtflüchtigen Hinterlegung von einem oder mehreren Anwendungsprogrammen 6, zumindest einer Terminologiedatenbank 7 sowie der Speicherung der in der Quellsprache eingegebenen Wortfolge beziehungsweise der in die Zielsprache transferierten Wortfolge als Datei 8, 9. Die Anzahl der erforderlichen Terminologiedatenbanken 7 orientiert sich an der Anzahl der Quell- und Zielsprachen, in denen Wortfolgen eingegeben werden sollen. Die Verarbeitungseinrichtung 4 weist Prozessoren auf, die zur Ausführung von Anwendungsprogrammen eingerichtet sind. Die Verarbeitungseinrichtung 4 steht im bidirektionalen Datenaustausch mit der Speichereinrichtung 3. Die Vorrichtung zur Ausgabe 5 ist ebenfalls als eine Programmierschnittstelle (API) ausgeführt. Alternativ oder ergänzend kann die Vorrichtung zur Ausgabe 5 beispielsweise als ein Bildschirm, ein Drucker oder eine sonstige der Ausgabe von Daten dienende Einrichtung sein. The data processing device 1 comprises a device for input 2 of a word sequence written in a source language, a memory device 3, a processing device 4 and a device for outputting the word sequence in a target language. As input device 2, a programming interface (API) is provided which has access to a network 10, in particular the Internet, in order to cooperate with a corresponding application or other inputting device, for example a keyboard, a scanner, a data carrier or the like more. The memory device 3 is used for the non-volatile storage of one or more application programs 6, at least one terminology database 7 and the storage of the word sequence entered in the source language or the transferred into the target language word sequence as a file 8, 9. The number of required terminology databases 7 is based on the Number of source and target languages in which word sequences are to be entered. The processing device 4 has processors that are set up to execute application programs. The processing device 4 is in bidirectional data exchange with the memory device 3. The device for output 5 is also designed as a programming interface (API). Alternatively or additionally, the For example, it may be a device for outputting 5 as a screen, a printer or any other device serving to output data.
Die Eingabe einer Wortfolge mittels der als Programmierschnittstelle ausgebildeten Vorrichtung zur Eingabe 2 der Datenverarbeitungseinrichtung 1 erfolgt im dargestellten Ausführungsbeispiel durch eine auf einem dezentral angeordneten Rechner 11 vorgesehene Anwendungssoftware, im einfachsten Fall einem Webbrowser 12. The input of a word sequence by means of the device designed as a programming interface for input 2 of the data processing device 1 is carried out in the illustrated embodiment by a provided on a decentralized computer 11 application software, in the simplest case a web browser 12th
In Fig. 2 ist ein vereinfachtes Ablaufdiagramm eines Verfahrens zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache dargestellt. Hierbei kann zumindest die Quellsprache der eingegebenen Wortfolge durch entsprechende Analyse mittels der Verarbeitungseinrichtung automatisch erkannt werden. Im Allgemeinen werden die Quellsprache und die Zielsprache jedoch vorgegeben. FIG. 2 shows a simplified flowchart of a method for the automatic transfer of a word sequence written in a source language into a word sequence of a target language corresponding in meaning. In this case, at least the source language of the input word sequence can be automatically recognized by appropriate analysis by means of the processing device. In general, however, the source language and the target language are given.
In einem Schritt 20 erfolgt die Eingabe einer aus wenigstens einem Wort bestehenden Wortfolge mittels der Vorrichtung zur Eingabe 2. Die in einer Quellsprache eingegebene Wortfolge wird in der Speichereinrichtung 3 als Datei 8 abgelegt. In a step 20, the input of a word sequence consisting of at least one word by means of the input device 2 takes place. The word sequence entered in a source language is stored in the memory device 3 as a file 8.
In einem nachfolgenden Schritt 21 erfolgt die semantische und syntaktische Analyse der eingegebenen Wortfolge durch die Verarbeitungseinrichtung 4. Hierzu wird die eingegebene Wortfolge von der Verarbeitungseinrichtung 4 aus der Speichereinrichtung 3 eingelesen. Die Analyse umfasst dabei die Überprüfung der Wortfolge auf das Vorhandensein wenigstens eines Begriffes mit lexikalischer Mehrdeutigkeit. Ein Beispiel für einen Begriff mit lexikalischer Mehrdeutigkeit ist das deutsche Wort„Tau", das ein Seil, den morgendlichen Niederschlag oder einen Buchstaben des griechischen Alphabets bedeuten kann. Die Abarbeitung der eingegebenen Wortfolge wird sequentiell durchgeführt. Das Analysieren der Wortfolge und des wenigstens einen identifizierten Begriffes mit lexikalischer Mehrdeutigkeit in der Wortfolge wird durch einen Abgleich mit der Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden Terminologiedatenbank 7 der Speichereinrichtung 3 durchgeführt. In a subsequent step 21, the semantic and syntactic analysis of the input word sequence is performed by the processing device 4. For this purpose, the input word sequence is read from the processing device 4 from the memory device 3. The analysis involves checking the word order for the existence of at least one term with lexical ambiguity. An example of a term with lexical ambiguity is the German word "Tau", which may mean a rope, the morning rainfall or a letter of the Greek alphabet The processing of the input word sequence is carried out sequentially Analyzing the word sequence and the at least one identified one The term with lexical ambiguity in the word sequence is performed by matching the terms with lexical ambiguity of the source language comprehensive terminology database 7 of the memory device 3.
Wird im Schritt 21 zumindest ein Begriff mit lexikalischer Mehrdeutigkeit im Rahmen der Analyse identifiziert, so wird in einem nachfolgenden Schritt 22 ein Hinweis auf ein Vorliegen eines Begriffes mit lexikalischer Mehrdeutigkeit ausgegeben. Dies erfolgt im vorliegenden Ausführungsbeispiel durch eine Ausgabe auf dem Rechner 1 1 , mittels dem die zu transferierende Wortfolge in der Quellsprache eingegeben wird. Hiermit verbunden ist die Aufforderung, den Begriff mit lexikalischer Mehrdeutigkeit hinsichtlich seiner Bedeutung im Kontext der Wortfolge zu definieren. If at least one term with lexical ambiguity is identified in the course of the analysis in step 21, then in a subsequent step 22 an indication of the existence of a term with lexical ambiguity is output. This is done in the present embodiment by an output on the computer 1 1, by means of which the word sequence to be transferred is entered in the source language. Related to this is the requirement to define the term with lexical ambiguity in terms of its meaning in the context of the word order.
Hierzu wird im Schritt 23 anhand des beim Abgleichen mit der Terminologiedatenbank 7 identifizierten Begriffes mit lexikalischer Mehrdeutigkeit, dem in Abhängigkeit von seiner Bedeutungsanzahl mehrere Begriffsidentifikatoren zugeordnet sind, eine Auswahl der möglichen Bedeutungen respektive Definitionen des Begriffes mit lexikalischer Mehrdeutigkeit in Abhängigkeit von unterschiedlichen Kontexten angezeigt. Die Anzeige der Auswahl erfolgt auf dem Rechner 1 1 mittels des Webbrowsers 12. Entsprechend dem weiter oben angeführten Beispiel des deutschen Begriffes„Tau", der drei unterschiedliche Bedeutungen aufweist, entspräche die Bedeutungsanzahl des Begriffes mit lexikalischer Mehrdeutigkeit„Tau" dem Wert drei, so dass diesem drei Begriffsidentifikatoren zugeordnet sind. Aus dieser dargestellten Auswahl, die als eine einfache tabellarische Auflistung der unterschiedlichen Bedeutungen erfolgen kann, bis hin zu einer Textausgabe kombiniert mit einer grafischen Veranschaulichung, wird derjenige Begriffsidentifikator ausgewählt, der dem Kontext der eingegebenen Wortfolge entspricht. For this purpose, a selection of the possible meanings or definitions of the term with lexical ambiguity as a function of different contexts is displayed in step 23 on the basis of the term with lexical ambiguity identified when matching with the terminology database 7 to which a plurality of term identifiers are assigned depending on its meaning number. According to the example of the German term "Tau", which has three different meanings, the meaning number of the term with lexical ambiguity "Tau" would correspond to the value three, in the above example that this three term identifiers are assigned. From this illustrated selection, which can be done as a simple tabular listing of different meanings, to a text output combined with a graphical illustration, the one term identifier corresponding to the context of the input word sequence is selected.
Im nachfolgenden Schritt 24 wird dieser ausgewählte Begriffsidentifikator dem Begriff mit lexikalischer Mehrdeutigkeit zugeordnet. Diese Zuordnung des spezifischen Begriffsidentifikators wird in der Datei 8, die die Wortfolge in der Quell- spräche enthält, abgespeichert. Hierzu wird der jeweilige Begriffsidentifikator dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit als ein maschinenlesbares Label zugeordnet. In the subsequent step 24, this selected term identifier is assigned to the term with lexical ambiguity. This assignment of the specific term identifier is shown in the file 8, which contains the word sequence in the source contains saved. For this purpose, the respective term identifier is associated with the lexical ambiguity identified in the source language as a machine-readable label.
Im darauffolgenden Schritt 25 findet die Übersetzung der analysierten Wortfolge aus der Quellsprache in die Zielsprache statt. Hierzu erfolgen zum einen die Auswahl eines mit dem ausgewählten Begriffsidentifikator korrespondierenden Begriffes in der Zielsprache und zum anderen das Übersetzen der Begriffe mit lexikalischer Eindeutigkeit der Wortfolge in die Zielsprache, so dass eine bedeutungsinhaltlich korrespondierende Wortfolge erzeugt wird. In the following step 25, the translation of the analyzed word sequence from the source language into the target language takes place. For this purpose, on the one hand, the selection of a term corresponding to the selected term identifier in the target language and, on the other hand, the translation of the terms with lexical uniqueness of the word sequence into the target language, so that a meaning sequence corresponding word sequence is generated.
Daraufhin erfolgt in einem Schritt 26 die Zuordnung des im Schritt 23 ausgewählten Begriffsidentifikators zu dem mit dem identifizierten Begriff mit lexikalischer Mehrdeutigkeit der Quellsprache korrespondierenden Begriff der Zielsprache. Der jeweilige Begriffsidentifikator, mittels dem der Begriff in der Zielsprache ausgewählt wurde, wird dem entsprechenden Begriff der Zielsprache gleichfalls als ein maschinenlesbares Label zugeordnet. Die Übersetzung der Wortfolge in die Zielsprache wird zusammen mit dem oder den zugeordneten Labein in der Datei 9 gespeichert. Diese Zuordnung erlaubt zu einem späteren Zeitpunkt einen Rückgriff auf die Terminologiedatenbank 7, das heißt den Abruf und die Darstellung des jeweils identifizierten Begriffes mit lexikalischer Mehrdeutigkeit in der Quellsprache sowie dessen Bedeutung und dem aus der Auswahl des Begriffsidentifikators resultierenden Begriffes in der Zielsprache. Auch diese Darstellung kann als eine einfache tabellarische Auflistung erfolgen, bis hin zu einer Textausgabe kombiniert mit einer grafischen Veranschaulichung der Bedeutung. Thereupon, in a step 26, the assignment of the term identifier selected in step 23 to the term of the target language corresponding to the identified term with lexical ambiguity of the source language takes place. The respective term identifier, by means of which the term was selected in the target language, is likewise assigned to the corresponding term of the target language as a machine-readable label. The translation of the word order into the target language is stored in the file 9 together with the associated labell or notes. This assignment allows a later resort to the terminology database 7, that is, the retrieval and representation of the respective identified term with lexical ambiguity in the source language and its meaning and the term resulting from the selection of the term identifier in the target language. Again, this representation can be done as a simple tabular listing, up to a textual output combined with a graphical illustration of the meaning.
Abschließend wird im Schritt 27 die Wortfolge in der Zielsprache ausgegeben. Die Ausgabe erfolgt gemäß dem gewählten Ausführungsbeispiel durch den Webbrowsers 12. Finally, in step 27, the word order is output in the target language. The output is made according to the selected embodiment by the web browser 12.
Fig. 3 veranschaulicht das Verfahren anhand eines konkreten Beispiels einer Wortfolge. Hierbei umfasst eine vom Rechner 11 an die Datenverarbeitungsein- richtung 1 übertragene, in der Quellsprache abgefasste Wortfolge 30 die einzelnen Begriffe„Bitte treten Sie auf die Bremse". Diese beispielsweise in einem HTML-Format abgefasste Wortfolge wird mittels der Vorrichtung zur Eingabe 3 in die Datenverarbeitungseinrichtung 1 zur weiteren Verarbeitung eingegeben. Im Zuge der Analyse der Wortfolge im Schritt 21 wird neben den Begriffen mit lexikalischer Eindeutigkeit 31„Bitte treten Sie auf die" der Begriff mit lexikalischer Mehrdeutigkeit 32„Bremse" identifiziert. Die Terminologiedatenbank 7 weist für diesen Begriff mit lexikalischer Mehrdeutigkeit 32 zwei mögliche Bedeutungen 35, 36 aus, so dass zwei Begriffsidentifikatoren 33, 34 vergeben wurden. Die Begriffsidentifikatoren 33, 34 stellen einen Schlüssel der Terminologiedatenbank 7 dar. Fig. 3 illustrates the method with reference to a concrete example of a word sequence. In this case, one from the computer 11 to the data processing unit comprises Direction 1 transmitted in the source language word sequence 30 the individual terms "Please take the brake." This word sequence, for example, written in an HTML format is entered by means of the input device 3 in the data processing device 1 for further processing Analysis of the word order in step 21 is identified next to the terms with lexical uniqueness 31 "Please refer to" the term lexical ambiguity 32 "brake." The terminology database 7 for this term with lexical ambiguity 32 has two possible meanings 35, 36 , so that two term identifiers 33, 34 have been assigned. The term identifiers 33, 34 represent a key of the terminology database 7.
Aufgrund der Identifikation des Begriffes mit lexikalischer Mehrdeutigkeit 32 wird zur Auswahl eines der Begriffsidentifikatoren 33, 34 in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge 30 aufgefordert. Im vorliegenden Ausführungsbeispiel soll der Begriff mit lexikalischer Mehrdeutigkeit 32„Bremse" im Kontext mit einer Baugruppe zum Stoppen einer Bewegung stehen und nicht ein Insekt betreffen. Der Definition des Begriffs mitlexikalischer Mehrdeutigkeit 32 „Bremse" im Sinne eines Insekts ist der Begriffsidentifikator 33 zugeordnet. Der Definition des Begriffs mitlexikalischer Mehrdeutigkeit 32 „Bremse" im Sinne einer Baugruppe zum Stoppen einer Bewegung ist der Begriffsidentifikator 34 zugeordnet. Due to the identification of the term with lexical ambiguity 32, the selection of one of the term identifiers 33, 34 is requested depending on the context of the word sequence 30 written in the source language. In the present embodiment, the term "lexical ambiguity" 32 is intended to be in the context of an assembly to stop a movement and not an insect The definition of the term "lexical ambiguity" "brake" in the sense of an insect is associated with the term identifier 33. The definition of the term "lexical ambiguity" "brake" in the sense of an assembly for stopping a movement is assigned to the term identifier 34.
Entsprechend wird gemäß dem Kontext der Wortfolge der Begriffsidentifikator 34 ausgewählt. Die Auswahl erfolgt, wie weiter oben bereits beschrieben, manuell durch eine Bedienperson oder automatisiert. Die Zuordnung des ausgewählten Begriffsidentifikators 34 zu dem Begriff mit lexikalischer Mehrdeutigkeit 32 in der Quellsprache erfolgt in dem Schritt 24, wie bereits ausgeführt. Durch die Auswahl des Begriffsidentifikators 34 ist die bedeutungsinhaltlich korrespondierende Wortfolge in der Zielsprache festgelegt. So wird für die Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit 32 „Bremse" nicht der korrespondierende englischsprachige Begriff 37„horsefly" sondern der Begriff 38„brake" ausge- wählt. Dem ausgewählten Begriff 38 wird der Begriffsidentifikator 34 zugeordnet, welcher in der in der Zielsprache auszugebenen Wortfolge 39 erhalten bleibt. Dies wird in den Schritten 26 und 27 ausgeführt. Accordingly, the term identifier 34 is selected according to the context of the word order. The selection is made, as already described above, manually by an operator or automated. The assignment of the selected term identifier 34 to the lexical ambiguity term 32 in the source language occurs in step 24, as already explained. Through the selection of the term identifier 34, the meaning-corresponding word order is defined in the target language. Thus, for the translation of the term with lexical ambiguity 32 "brake" not the corresponding English-language term 37 "horsefly" but the term 38 "brake" is used. chooses. The selected term 38 is assigned the term identifier 34, which is retained in the word sequence 39 to be output in the target language. This is done in steps 26 and 27.
Bezugszeichenliste LIST OF REFERENCE NUMBERS
1 Datenverarbeitungseinrichtung Bedeutung von 32 1 data processing device Meaning of 32
2 Vorrichtung zur Eingabe englischsprachiger Begriff 2 device for entering English-language term
3 Speichereinrichtung englischsprachiger Begriff3 memory device English word
4 Verarbeitungseinrichtung Wortfolge in der Zielsprache4 processing device word order in the target language
5 Vorrichtung zur Ausgabe 5 device for dispensing
6 Anwendungsprogramm  6 application program
7 Terminologiedatenbank  7 Terminology database
8 Datei  8 file
9 Datei  9 file
10 Netzwerk  10 network
1 1 Rechner  1 1 calculator
12 Webbrowser  12 web browsers
20 Schritt 20 step
21 Schritt  21 step
22 Schritt  22 step
23 Schritt  23 step
24 Schritt  24 step
25 Schritt  25 step
26 Schritt  26 step
27 Schritt  27 step
Wortfolge in Quellsprache Word order in source language
Begriff mit lexikalischer Eindeutigkeit  Term with lexical uniqueness
Begriff mit lexikalischer Mehrdeutigkeit  Term with lexical ambiguity
Begriffsidentifikator  Begriffsidentifikator
Begriffsidentifikator  Begriffsidentifikator
Bedeutung von 32  Meaning of 32

Claims

Patentansprüche  claims
Verfahren zum zumindest teilweise maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge (30) in eine bedeutungsinhaltlich korrespondierende Wortfolge einer Zielsprache (39), gekennzeichnet durch die Verfahrensschritte: a) Eingeben der in der Quellsprache abgefassten Wortfolge (30); Method for at least partially mechanically transferring a word sequence (30) written in a source language into a meaning-correspondingly corresponding word sequence of a target language (39), characterized by the method steps: a) inputting the word sequence (30) written in the source language;
b) Analysieren der Wortfolge (30) und Identifizieren von Begriffen mit lexikalischer Mehrdeutigkeit (32) in der Wortfolge (30) durch Abgleich mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Quellsprache umfassenden  b) analyzing the word sequence (30) and identifying lexical ambiguity terms (32) in the word order (30) by matching with a lexical ambiguity term of the source language
Terminologiedatenbank (7), denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren (33, 34) zugeordnet sind;  Terminology database (7) to which a plurality of term identifiers (33, 34) are assigned, depending on their meaning number;
c) Auswahl eines Begriffsidentifikators (33, 34) in Abhängigkeit vom Kontext der in der Quellsprache abgefassten Wortfolge (30);  c) selecting a term identifier (33, 34) depending on the context of the word order (30) written in the source language;
d) Auswahl eines mit dem ausgewählten Begriffsidentifikator (33, 34) korrespondierenden Begriffes (37, 38) in der Zielsprache;  d) selecting a term (37, 38) corresponding to the selected term identifier (33, 34) in the target language;
e) Übersetzen von Begriffen mit lexikalischer Eindeutigkeit (31) der Wortfolge (30) in die Zielsprache;  e) translating terms with lexical uniqueness (31) of the word order (30) into the target language;
f) Ausgeben der Wortfolge (39) in der Zielsprache.  f) outputting the word sequence (39) in the target language.
Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die in der Quellsprache abgefasste eingegebene Wortfolge (30) und die in der Zielsprache ausgegebene Wortfolge (39) als separate elektronische Dokumente (8, 9) abgespeichert werden. Method according to Claim 1, characterized in that the inputted word sequence (30) written in the source language and the word sequence (39) output in the target language are stored as separate electronic documents (8, 9).
Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass der jeweilige Begriffsidentifikator (33, 34) dem in der Quellsprache abgefassten identifizierten Begriff mit lexikalischer Mehrdeutigkeit (32) als ein maschinenlesbares Label zugeordnet wird. Method according to one of Claims 1 or 2, characterized in that the respective term identifier (33, 34) is assigned to the identified term with lexical ambiguity (32) worded in the source language as a machine-readable label.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass der jeweilige Begriffsidentifikator (33, 34) dem in der Zielsprache als Übersetzung des Begriffes mit lexikalischer Mehrdeutigkeit (32) ausgewählten Begriff (37, 38) als ein maschinenlesbares Label zugeordnet wird. 4. The method according to any one of claims 1 to 3, characterized in that the respective term identifier (33, 34) in the target language as a translation of the term with lexical ambiguity (32) selected term (37, 38) is assigned as a machine-readable label ,
5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass das jeweilige Label in dem abgespeicherten Dokument (8, 9) als eine logische Verknüpfung zu dem in der Terminologiedatenbank (7) hinterlegten Begriff mit lexikalischer Mehrdeutigkeit (32) eingebettet wird. 5. The method according to any one of claims 2 to 4, characterized in that the respective label in the stored document (8, 9) as a logical link to the term in the terminology database (7) stored term with lexical ambiguity (32) is embedded.
6. Verfahren nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass das jeweilige Label innerhalb des elektronischen Dokumentes (8, 9) mittels einer Filterfunktion ein- und ausgeblendet wird. 6. The method according to any one of claims 2 to 5, characterized in that the respective label within the electronic document (8, 9) by means of a filter function and hidden.
7. Verfahren nach einem der Ansprüche 2 bis 6, dadurch gekennzeichnet, dass das abgespeicherte elektronische Dokument (8, 9) zu einer Weiterverarbeitung in unterschiedliche Dateiformate konvertiert wird, wobei die dem jeweiligen Begriff mit lexikalischer Mehrdeutigkeit (32) zugeordneten Label erhalten werden. 7. The method according to any one of claims 2 to 6, characterized in that the stored electronic document (8, 9) is converted to a further processing in different file formats, wherein the respective term with lexical ambiguity (32) associated label are obtained.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass zur Bestimmung des Kontextes der in der Quellsprache abgefassten Wortfolge (30) zumindest ein Schlüsselwort hinterlegt wird. 8. The method according to any one of claims 1 to 7, characterized in that for determining the context of the word sequence written in the source language (30) at least one keyword is deposited.
9. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass während der Identifikation eines Begriffes mit lexikalischer Mehrdeutigkeit (32) innerhalb der Wortfolge (30) eine Aufforderung zur manuellen Zuordnung des Labels ausgegeben wird. 9. The method according to any one of claims 1 to 7, characterized in that during the identification of a term with lexical ambiguity (32) within the word sequence (30) a request for manual assignment of the label is output.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass Begriffe mit lexikalischer Eindeutigkeit der Quellsprache mit einer Begriffe mit lexikalischer Mehrdeutigkeit der Zielsprache umfassenden Terminolo- giedatenbank abgeglichen werden. 10. The method according to any one of claims 1 to 9, characterized in that terms with lexical uniqueness of the source language with a terminology with lexical ambiguity of the target language comprehensive Terminolo- giedatenbank be aligned.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass einem 11. The method according to claim 10, characterized in that a
Begriff mit lexikalischer Eindeutigkeit der Quellsprache ein Begriffsidentifikator zugeordnet wird, wenn der korrespondierende in der Zielsprache ein Begriff mit lexikalischer Mehrdeutigkeit ist.  Term with lexical uniqueness of the source language a term identifier is assigned, if the corresponding in the target language is a term with lexical ambiguity.
12. Datenverarbeitungseinrichtung (1 ) zum maschinellen Transferieren einer in einer Quellsprache abgefassten Wortfolge (30) in eine bedeutungsinhaltlich korrespondierende Wortfolge (39) einer Zielsprache, umfassend: 12. Data processing device (1) for machine-transferring a word sequence (30) written in a source language into a meaning-corresponding word order (39) of a target language, comprising:
- eine Vorrichtung zur Eingabe (2) der in der Quellsprache abgefassten Wortfolge (30);  - a device for inputting (2) the word sequence (30) written in the source language;
- eine Speichereinrichtung (3), in der eine Begriffe mit lexikalischer Mehrdeutigkeit (32) der Quellsprache umfassende Terminologiedatenbank (7), denen in Abhängigkeit von ihrer Bedeutungsanzahl mehrere Begriffsidentifikatoren (33, 34) zugeordnet sind, hinterlegt ist;  - A memory device (3) in which a term with lexical ambiguity (32) of the source language comprehensive terminology database (7), which are assigned depending on their meaning number of a plurality of term identifiers (33, 34) is deposited;
- eine Verarbeitungseinrichtung (4), die zur Analyse der eingegebenen Wortfolge (30) und der Identifikation von Begriffen mit lexikalischer Mehrdeutigkeit (32) in der Wortfolge (30) durch Abgleich mit den Begriffen mit lexikalischer Mehrdeutigkeit der Terminologiedatenbank (7) eingerichtet ist,  - processing means (4) adapted to analyze the input word sequence (30) and identify lexical ambiguity (32) terms in the word string (30) by matching the lexical ambiguity terms of the terminology database (7),
- wobei die Verarbeitungseinrichtung (4) zur Auswahl eines Begriffsidentifika- tors (33, 34) in Abhängigkeit von einem Kontext der in der Quellsprache abgefassten Wortfolge (30) eingerichtet ist,  wherein the processing device (4) is set up to select a term identifier (33, 34) as a function of a context of the word sequence (30) written in the source language,
- wobei die Verarbeitungseinrichtung (4) zur Auswahl eines mit dem ausgewählten Begriffsidentifikators (33, 34) korrespondierenden Begriffes (37, 38) in der Zielsprache eingerichtet ist, und  - wherein the processing means (4) is arranged to select a term (37, 38) corresponding to the selected term identifier (33, 34) in the target language, and
- dass die Verarbeitungseinrichtung (4) zur Übersetzung von Begriffen mit lexikalischer Eindeutigkeit (31 ) der Wortfolge (30) in die Zielsprache eingerichtet ist; sowie  - That the processing means (4) for the translation of terms with lexical uniqueness (31) of the word sequence (30) is set up in the target language; such as
- eine Vorrichtung zur Ausgabe (5) der Wortfolge (39) in der Zielsprache.  - A device for outputting (5) the word sequence (39) in the target language.
EP17755228.8A 2016-08-02 2017-07-24 Method for transferring a word sequence written in a source language into a word sequence in a target language at least partly by machine Pending EP3494488A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102016114265.4A DE102016114265A1 (en) 2016-08-02 2016-08-02 Method for at least partially machine transferring a word sequence written in a source language into a word sequence of a target language
PCT/IB2017/000862 WO2018073635A1 (en) 2016-08-02 2017-07-24 Method for transferring a word sequence written in a source language into a word sequence in a target language at least partly by machine

Publications (1)

Publication Number Publication Date
EP3494488A1 true EP3494488A1 (en) 2019-06-12

Family

ID=59683607

Family Applications (1)

Application Number Title Priority Date Filing Date
EP17755228.8A Pending EP3494488A1 (en) 2016-08-02 2017-07-24 Method for transferring a word sequence written in a source language into a word sequence in a target language at least partly by machine

Country Status (4)

Country Link
US (1) US11132515B2 (en)
EP (1) EP3494488A1 (en)
DE (1) DE102016114265A1 (en)
WO (1) WO2018073635A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11836454B2 (en) 2018-05-02 2023-12-05 Language Scientific, Inc. Systems and methods for producing reliable translation in near real-time
WO2020149069A1 (en) * 2019-01-15 2020-07-23 パナソニックIpマネジメント株式会社 Translation device, translation method, and program

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2300495A (en) 1995-04-13 1996-11-06 Canon Kk Language processing
US8521506B2 (en) * 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9128926B2 (en) * 2006-10-26 2015-09-08 Facebook, Inc. Simultaneous translation of open domain lectures and speeches
US8209164B2 (en) * 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
JP5007977B2 (en) * 2008-02-13 2012-08-22 独立行政法人情報通信研究機構 Machine translation apparatus, machine translation method, and program
US9110890B2 (en) * 2008-02-15 2015-08-18 International Business Machines Corporation Selecting a language encoding of a static communication in a virtual universe
US20110202512A1 (en) 2010-02-14 2011-08-18 Georges Pierre Pantanelli Method to obtain a better understanding and/or translation of texts by using semantic analysis and/or artificial intelligence and/or connotations and/or rating
CN103370705B (en) * 2011-01-05 2018-01-02 谷歌公司 For facilitating the method and system of text input
KR101870729B1 (en) * 2011-09-01 2018-07-20 삼성전자주식회사 Translation apparatas and method for using translation tree structure in a portable terminal
EP2595143B1 (en) * 2011-11-17 2019-04-24 Svox AG Text to speech synthesis for texts with foreign language inclusions
US9110891B2 (en) * 2011-12-12 2015-08-18 Google Inc. Auto-translation for multi user audio and video
US9483461B2 (en) * 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9043205B2 (en) * 2012-06-21 2015-05-26 Google Inc. Dynamic language model
US10354650B2 (en) * 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US8923829B2 (en) * 2012-12-28 2014-12-30 Verizon Patent And Licensing Inc. Filtering and enhancement of voice calls in a telecommunications network
US9418655B2 (en) * 2013-01-17 2016-08-16 Speech Morphing Systems, Inc. Method and apparatus to model and transfer the prosody of tags across languages
US8996352B2 (en) * 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US20140365200A1 (en) * 2013-06-05 2014-12-11 Lexifone Communication Systems (2010) Ltd. System and method for automatic speech translation
JP2015060095A (en) * 2013-09-19 2015-03-30 株式会社東芝 Voice translation device, method and program of voice translation
US9747897B2 (en) * 2013-12-17 2017-08-29 Google Inc. Identifying substitute pronunciations
JP2017511914A (en) 2014-01-28 2017-04-27 ゾモル・ツォルツィン・ゲーエムベーハーSomol Zorzin GmbH A method of automatically detecting the meaning of text and automatically measuring uniqueness
US9740687B2 (en) * 2014-06-11 2017-08-22 Facebook, Inc. Classifying languages for objects and entities
US9864744B2 (en) * 2014-12-03 2018-01-09 Facebook, Inc. Mining multi-lingual data
GB2533370A (en) * 2014-12-18 2016-06-22 Ibm Orthographic error correction using phonetic transcription
US9477652B2 (en) * 2015-02-13 2016-10-25 Facebook, Inc. Machine learning dialect identification
US10332511B2 (en) * 2015-07-24 2019-06-25 International Business Machines Corporation Processing speech to text queries by optimizing conversion of speech queries to text
US9734142B2 (en) * 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
US10468016B2 (en) * 2015-11-24 2019-11-05 International Business Machines Corporation System and method for supporting automatic speech recognition of regional accents based on statistical information and user corrections
KR102545764B1 (en) * 2016-04-01 2023-06-20 삼성전자주식회사 Device and method for voice translation
KR101827773B1 (en) * 2016-08-02 2018-02-09 주식회사 하이퍼커넥트 Device and method of translating a language
CN117198277A (en) * 2016-08-12 2023-12-08 奇跃公司 Word stream annotation
US20180067927A1 (en) * 2016-09-06 2018-03-08 International Business Machines Corporation Customized Translation Comprehension
US20180143956A1 (en) * 2016-11-18 2018-05-24 Microsoft Technology Licensing, Llc Real-time caption correction by audience
US10311876B2 (en) * 2017-02-14 2019-06-04 Google Llc Server side hotwording
CN107193807B (en) * 2017-05-12 2021-05-28 北京百度网讯科技有限公司 Artificial intelligence-based language conversion processing method and device and terminal
CN110892407A (en) * 2017-07-20 2020-03-17 松下知识产权经营株式会社 Translation device, translation method, and program
US11450311B2 (en) * 2018-12-13 2022-09-20 i2x GmbH System and methods for accent and dialect modification
US10839788B2 (en) * 2018-12-13 2020-11-17 i2x GmbH Systems and methods for selecting accent and dialect based on context
WO2020146873A1 (en) * 2019-01-11 2020-07-16 Applications Technology (Apptek), Llc System and method for direct speech translation system
JP7251181B2 (en) * 2019-02-05 2023-04-04 富士通株式会社 Parallel translation processing method and parallel translation processing program
US11151332B2 (en) * 2019-03-07 2021-10-19 International Business Machines Business Dialog based speech recognition
US11093720B2 (en) * 2019-03-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Apparatus, method, and program product for converting multiple language variations
US11151996B2 (en) * 2019-04-16 2021-10-19 International Business Machines Corporation Vocal recognition using generally available speech-to-text systems and user-defined vocal training
US11501089B2 (en) * 2019-06-05 2022-11-15 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device thereof based on determining intent of a user speech in a first language machine translated into a predefined second language
KR20190080834A (en) * 2019-06-18 2019-07-08 엘지전자 주식회사 Dialect phoneme adaptive training system and method
KR20190113693A (en) * 2019-09-18 2019-10-08 엘지전자 주식회사 Artificial intelligence apparatus and method for recognizing speech of user in consideration of word usage frequency

Also Published As

Publication number Publication date
US11132515B2 (en) 2021-09-28
DE102016114265A1 (en) 2018-02-08
US20210081618A1 (en) 2021-03-18
WO2018073635A1 (en) 2018-04-26

Similar Documents

Publication Publication Date Title
DE69911842T2 (en) Method and device for retrieving information and corresponding storage medium
DE69330633T2 (en) Method and apparatus for comparing semantic patterns for retrieving texts
DE69322741T2 (en) Device and method for use in aligning bilingual corpora
DE69424350T2 (en) Context-sensitive method of finding information about a word in an electronic dictionary
DE69829074T2 (en) IDENTIFICATION OF LANGUAGE AND SYMBOLS FROM TEXT-REPRESENTATIVE DATA
EP1902407B1 (en) System for transmitting data from a document application to a data application
DE10300545B4 (en) Device, method, storage medium and data structure for the identification and storage of data
DE102017008430A1 (en) Methods and systems for generating virtual reality environments from electronic documents
DE68928068T2 (en) Method and apparatus for formatting documents
EP1671262B1 (en) Method and system for acquiring data from machine-readable documents
DE112018005272T5 (en) SEARCHING MULTI-LANGUAGE DOCUMENTS BASED ON AN EXTRACTION OF THE DOCUMENT STRUCTURE
DE102007021284A1 (en) Method for computer based protection of manual annotation of characteristics in text body, involves segmenting text body in series of subfields
EP1917588B1 (en) Method and device for the error recovery of a data processing unit
WO2018073635A1 (en) Method for transferring a word sequence written in a source language into a word sequence in a target language at least partly by machine
DE102014105666A1 (en) TRANSLATION TEST
WO2022037818A1 (en) Device and method for interaction with a graphical user interface and for testing an application
WO2010091674A2 (en) Method and a system for translating a text from a first langauge into at least one further language, and a computer program product
DE4311211C2 (en) Computer system and method for automated text analysis
DE2613703C2 (en) Circuit arrangement for translating program texts
DE202015006393U1 (en) System for identifying and marking a mathematical expression in an electronic text document
DE202022104426U1 (en) System for preparing and examining an English-Mizo corpus by finding tonal words
DE10253786B4 (en) Method for the computer-aided determination of a similarity of an electronically registered first identifier to at least one electronically detected second identifier as well as apparatus and computer program for carrying out the same
DE10142379B4 (en) Process for creating hyperlinks and using them to call up target documents from a source document
DE102022115382A1 (en) Analysis of a requirement specification for a technical item
DE102022128157A1 (en) Computer-implemented method for standardizing part names

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20190304

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

17Q First examination report despatched

Effective date: 20211206

P01 Opt-out of the competence of the unified patent court (upc) registered

Effective date: 20230516