DE102008003886A1 - Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language - Google Patents

Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language Download PDF

Info

Publication number
DE102008003886A1
DE102008003886A1 DE102008003886A DE102008003886A DE102008003886A1 DE 102008003886 A1 DE102008003886 A1 DE 102008003886A1 DE 102008003886 A DE102008003886 A DE 102008003886A DE 102008003886 A DE102008003886 A DE 102008003886A DE 102008003886 A1 DE102008003886 A1 DE 102008003886A1
Authority
DE
Germany
Prior art keywords
language
text
target language
points
individual words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102008003886A
Other languages
German (de)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GRUNERT FLORIAN SILVER
Original Assignee
GRUNERT FLORIAN SILVER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GRUNERT FLORIAN SILVER filed Critical GRUNERT FLORIAN SILVER
Priority to DE102008003886A priority Critical patent/DE102008003886A1/en
Publication of DE102008003886A1 publication Critical patent/DE102008003886A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

The method involves dividing a text of a source language into individual words, in accordance with a principle of color ontology, which underlie a correspondence between human character types and colors, and points. The points are modulated in an International Commission on Illuminationluminescence, saturation, hue angle model in a uniform manner. The points are assigned in accordance with principle of the color ontology of individual words in a target language. The individual words in the target language are combined to a text in the target language. An independent claim is also included for a device for translation of a text of source language into a text of target language.

Description

Die Erfindung betrifft ein Verfahren und eine Vorrichtung, basierend auf dem Prinzip einer so genannten Farbontologie, welche insbesondere für die Bearbeitung oder Übersetzung natürlicher Sprache ausgelegt sind.The The invention relates to a method and a device based on the principle of a so-called color ontology, which in particular for editing or translation of natural Language are designed.

Sprache ist die wichtigste Kommunikationsform zwischen den Menschen. Ein großes Problem ist heutzutage die noch immer vorherrschende Sprachenvielfalt unter der Weltbevölkerung. Erschwerend tritt hinzu, dass der Sprachschatz eines einzelnen Menschen je nach Charaktertyp und sozialem Umfeld ganz unterschiedliche Ausprägung findet. Sowohl die Kommunikation innerhalb einer einzigen Sprache als auch die Kommunikation zwischen verschiedenen Sprachen wird hierdurch schwieriger, und es werden beispielsweise der Transfer von Wissen und kultureller Austausch auf diese Weise behindert. Aufgrund der wachsenden Bedeutung des Computers als Kommunikationsmedium ist die maschinelle Verarbeitung natürlicher Sprache zu einem wichtigen Forschungsgebiet geworden. Ein bedeutendes Teilgebiet unter vielen Anwendungen ist die maschinelle Übersetzung. Die folgenden einleitenden Ausführungen sind einem Aufsatz von Ramiro Gomez: „Maschinelle Übersetzung" aus dem Jahr 2003 entlehnt. Bereits in den dreissiger Jahren des 20. Jahrhunderts wurden die ersten Patente für Übersetzungsmaschinen angemeldet. Im ersten Jahrzehnt der intensiven Forschung war der Optimismus noch groß, schnell funktionierende Systeme zu entwickeln. Im Laufe der Zeit stießen die Wissenschaftler aber auf sprachliche Probleme, vor allem im Bereich Semantik, für die es keine Lösung gab. Zu einem wissenschaftlichen Wendepunkt kam es Ende der achtziger Jahre des vergangenen Jahrhunderts, als auch Systeme entwickelt wurden, die nicht regelbasiert waren, sondern statistische Berechnungen und Modelle nutzten oder analogiebasiert waren, das heißt eine Datenbasis von Übersetzungen nutzten. In den neunziger Jahren begann die Kommerzialisierung der maschinellen Übersetzung. Wurden zunächst hauptsächlich professionelle Übersetzer mit oftmals domänenspezifischen Systemen versorgt, sind nunmehr viele Produkte auf dem Markt erhältlich, die auch von privaten Nutzern auf ihren heimischen PC's installiert und benutzt werden können. Auch Internetdienstleister wie Altavista und Google bieten seit einiger Zeit Online-Übersetzungssysteme an. Es gibt diverse Möglichkeiten, maschinelle Übersetzungssysteme zu konzipieren und aufzubauen. Man kann sie in zwei Klassen von Systemarchitekturen einteilen: regelbasierte und datenbasierte Architekturen. Erstere nutzen linguistische Erkenntnisse, um Regeln zu definieren, anhand derer übersetzt wird. Letztere nutzen so genannte Sprachkorpora. Gemeinsam ist den verschiedenen Ansätzen, dass der Satz gewöhnlich die Basiseinheit für die Verarbeitung ist. Der Text muß daher zunächst in Sätze zerlegt werden, was eine nichttriviale Aufgabe ist, da nicht jeder Punkt eine Satzgrenze markiert.Language is the most important form of communication between people. A major problem today is the still prevalent linguistic diversity among the world's population. To make matters worse, the vocabulary of a single person varies greatly depending on the type of character and the social environment. This makes communication within a single language as well as communication between different languages more difficult and, for example, hinders the transfer of knowledge and cultural exchange in this way. Due to the growing importance of the computer as a communication medium, the mechanical processing of natural language has become an important field of research. A significant sub-field among many applications is machine translation. The following introductory remarks are an essay by Ramiro Gomez: "Machine translation" from the year 2003 borrowed. Already in the thirties of the 20th century, the first patents for translation machines were registered. In the first decade of intensive research, optimism was still strong in developing fast-acting systems. Over time, scientists came across language problems, especially in the field of semantics, for which there was no solution. A scientific turning point came in the late 1980s when systems were developed that were not rule-based, but used statistical calculations and models, or were analogy-based, that is, using a database of translations. In the nineties began the commercialization of machine translation. Initially, mainly professional translators were supplied with often domain-specific systems, now many products are available on the market, which can also be installed and used by private users on their home PCs. Internet service providers such as Altavista and Google have been offering online translation systems for some time now. There are various possibilities to design and build machine translation systems. They can be divided into two classes of system architectures: rule-based and data-based architectures. The former use linguistic insights to define rules from which to translate. The latter use so-called Sprachkorpora. Common to the various approaches is that the sentence is usually the base unit for processing. The text must therefore first be broken down into sentences, which is a non-trivial task, since not every point marks a sentence boundary.

In regelbasierten Systemen erfolgt eine sprachliche Analyse des Ausgangstextes. Dabei werden die drei Ansätze direkte Übersetzung, Transfer und Interlingua unterschieden. Direkte Übersetzung heißt, dass die Sätze des Ausgangstextes direkt in Sätze der Zeilsprache transformiert werden. Zunächst wird die sysntaktische Struktur der Ausgangssätze soweit wie möglich vereinfacht und dann jedes Wort einzeln unter Verwendung eines zweisprachigen Wörterbuchs übersetzt. Anhand eines begrenzten Regelapparates wird die Wortart bestimmt, und die Wörter werden gegebenenfalls flektiert. Dann erfolgt die Anordnung der Wörter nach Wortstellungsregeln der Zielsprache. Es erfolgt keine tiefe Analyse der Ausgangswerte, außerdem haben solche Systeme keine detailierten Informationen über die Grammatik der Zielsprache, weshalb die erzeugten Sätze oft ungrammatikalisch und teilweise auch unverständlich sind. Bei Transferarchitekturen wird durch den Analyseschritt eine abstrakte Repräsentation des Ausgangssatzes erzeugt, die von der Grammatik der Ausgangssprache abhängig ist. Aus dieser Repräsentation des Ausgangssatzes wird über eine Transferkomponente eine entsprechende Repräsentation in der Zielsprache bestimmt. Der letzte Schritt ist dann die Erzeugung des Satzes in der Zielsprache aus dessen Repräsentation, wofür wiederum ein Regelsystem existiert. Für jede Sprache benötigt man mindestens eine Grammatik, und für jedes Sprachenpaar wird eine Transferkomponente benötigt, also ist auch die Erweiterung von Transfersystemen sehr aufwändig. Bei Interlinguasystemen wird durch die Analyse eine metasprachliche Repräsentation des Inhalts erzeugt, die unabhängig von einer bestimmten Sprache ist. Diese Zwischestufe wird Interlingua genannt und ist die Basis für die Synthese der Sätze der Zielsprache. Der Vorteil eines solchen Systems ist der im Vergleich zu Transfersystemen geringere Aufwand für die Erweiterung um andere Sprachen, da es keine Transferkomponente gibt. Das große Problem ist aber eine Repräsentation zu finden, die tatsächlich sprachunabhängig ist.In rule-based systems, a linguistic analysis of the source text. The three approaches become direct translation, Transfer and Interlingua distinguished. Direct translation means that sentences the source text directly into sentences the line language to be transformed. First, the sysntaktische structure of the output sentences as far as possible simplified and then each word individually using a bilingual Translated dictionary. On the basis of a limited Rule apparatus is determined the part of speech, and the words may be inflected. Then the arrangement of the Words according to word order rules of the target language. It takes place no deep analysis of the initial values, besides, have such Systems no detailed information about the grammar the target language, which is why the sentences generated are often ungrammatical and partly incomprehensible. In transfer architectures the analysis step becomes an abstract representation of the Original sentence generated by the grammar of the source language is dependent. From this representation of the source sentence becomes a representation via a transfer component determined in the target language. The last step is then the generation of the sentence in the target language from its representation, for what again a rule system exists. Needed for each language at least one grammar, and for each language pair a transfer component is needed, so is the Extension of transfer systems very expensive. For interlingua systems the analysis turns into a metalinguistic representation of the Generates content that is independent of a particular language is. This intermediate stage is called Interlingua and is the base for the synthesis of the sentences of the target language. Of the Advantage of such a system is compared to transfer systems less effort to expand to other languages, because there is no transfer component. The big problem But to find a representation that actually is language-independent.

Datenbasierte Systeme lassen sich in statistische und analogiebasierte Systeme einteilen. Die grundlegende Idee hinter statistischen Systemen ist, dass jeder Satz einer Sprache eine mögliche Übersetzung eines Satzes in eine andere Sprache ist. Um die Wahrscheinlichkeit eines Satzes der Ausgangssprache zu bestimmen, zerlegt man diesen in seine einzelnen Wörter und berechnet das Produkt der Wahrscheinlichekeit des ersten Wortes mit den bedingten Wahrscheinlichkeiten der darauf folgenden Wörter. Zur Berechnung der Wahrscheinlichkeiten benötigt man ein umfassendes einsprachiges Sprachkorpus. Die Genauigkeit und damit die Nutzbarkeit des Sprachmodells hängen von Umfang und Qualität dieser Ressource ab. Die zweite Aufgabe besteht in der Berechnung der Parameter des Übersetzungsmodells. Hierfür benötigt man ein zweisprachiges Register, in dem die einzelnen Sätze paarweise übersetzt sind. Zu einem vorgegebenen Satz sucht man nun den Satz, dessen Wahrscheinlichkeit unter der Bedingung, dass der Ausgangssatz vorgegeben ist, am größten ist. Analogiebasierte Systeme übersetzen indem sie auf eine Datenbank mit Übersetzungspaaren zurückgreifen. Nach der Eingabe sucht ein solches System über Mustervergleiche in der Datenbank nach Beispielen, die der Eingabe ähnlich sind. Das Hauptproblem besteht bei diesem Ansatz in der Definition der Ähnlichkeit.Data-based systems can be divided into statistical and analog-based systems. The basic idea behind statistical systems is that each sentence of a language is a possible translation of a sentence into another language. To determine the probability of a sentence of the source language, break it down into its individual words and calculate the product of the likelihood of the first word with the conditional probabilities of the subsequent words. Calculating the probabilities requires a comprehensive monolingual one Language corpus. The accuracy and thus the usability of the language model depend on the scope and quality of this resource. The second task is to calculate the parameters of the translation model. This requires a bilingual register, in which the individual sentences are translated in pairs. For a given sentence, one now looks for the sentence whose probability is greatest under the condition that the source sentence is given. Translate analog-based systems by relying on a database of translation pairs. After input, such a system searches for pattern comparisons in the database for examples similar to the input. The main problem with this approach is the definition of similarity.

Darüber hinaus existieren Ansätze zur Kombination von regelbasierten und datenbasierten Systemen.About that There are also approaches to the combination of rule-based and data-based systems.

Einen neuen Weg mit erstaunlichen Ergebnissen beschreitet die Firma Microsoft. Dort wird ein neuronales IT-Netz mit einigen hunderttausend Seiten bereits übersetzter Sätze gefüttert. Das IT-Netz lernt diese Texte zweier Sprachen und übersetzt fortan automatisch. Dieses System arbeitet mittels einer Matrix bzw. Synapsen, welche das System über rekursive Algorithmen selbst einrichtet und legt die Lernergebnisse in Sektoren ab. Erhält das System einen unbekannten neuen Text vergleicht es jeden Satz sequentiell mit allen eingerichteten Synapsen, d. h. gespeicherten und gelernten Sätzen. Als praktische Hilfsmittel werden hierbei Datenextraktion zum Beispiel so genannte Hash-Werte, und Wahrscheinlichkeiten eingesetzt, um die mitunter sehr fange Verarbeitungsdauer solcher Systeme zu beschleunigen. Letztlich bleibt der Prozeß rechenaufwändig und ist auf die Kommunikation zwischen zwei Sprachen beschränkt.a The company Microsoft is breaking new ground with amazing results. There will be a neural IT network with several hundred thousand pages fed already translated sentences. The IT network learns these texts of two languages and translates henceforth automatically. This system works by means of a matrix or synapses, which the system uses recursive algorithms sets up its own learning outcomes in sectors. receives the system compares an unknown new text to it every sentence sequential with all established synapses, d. H. stored and learned sentences. As a practical tool will be here data extraction for example so-called hash values, and Probabilities used to the sometimes very long processing time accelerate such systems. Ultimately, the process remains computationally expensive and is limited to communication between two languages.

Aus dem europäischen Patent EP 715 265 ist ein maschinelles Übersetzungssystem bekannt, welches als regelbasiertes System mit Transferarchitektur anzusehen ist. Zusätzlich zur Transferarchitektur ist hier ein so genannter Bewerter zum Bewerten der Struktur in der Zielsprache unter Verwendung grammatikalischer Kriterien vorgesehen, um die in der Zielsprache durch einen Transformator bereits gebildete Struktur weiter zu verbessern. Gleichfalls den regelbasierten Systemen mit Transferarchitektur ist das Maschinenübersetzungssystem TAUM-METEO zuzordnen, das an der Universität von Montreal zur Übersetzung von Wetterberichten vom Englischen ins Französische entwickelt wurde.From the European patent EP 715 265 is a machine translation system is known, which is to be regarded as a rule-based system with transfer architecture. In addition to the transfer architecture, a so-called evaluator is provided for evaluating the structure in the target language using grammatical criteria in order to further improve the structure already formed in the target language by a transformer. Likewise to rule-based systems with transfer architecture, the machine translation system TAUM-METEO, which was developed at the University of Montreal to translate weather reports from English into French, is to be assigned.

Aus den beiden Patenschriften DE 100 15 858 und DE 100 15 859 sind Verfahren bekannt, die auf statistische Systeme zurückgreifen.From the two patent documents DE 100 15 858 and DE 100 15 859 Methods are known which rely on statistical systems.

Das an obiger Stelle beschriebene System der Firma Microsoft ist in diesem Zusammenhang als analogiebasiertes System einzuordnen.The Microsoft system described above is in to classify this relationship as an analogue-based system.

Das europäische Patent EP 610 151 beschreibt ein automatisches Übersetzungssystem mit Hilfe einer Zwischensprache, das als regelbasiertes System, und insbesondere als eine Kombination von Transfersystem und Interlinguasystem angesehen werden kann. Mit Hilfe von baumartigen Strukturen wird hier von einer Ausgangssprache in eine erste Brückensprache, dann in eine Zwischensprache, anschließend in eine zweite Brückensprache und schließlich in die Zielsprache übersetzt. Die Übersetzung in die Brückensprachen und die Zwischensprache wird dadurch ermöglicht, dass den in einer Ausgangssprache verfassten Texten mit einer baumartigen Zuordnung entsprechende morphologische, syntaktische und semantische Merkmale zugeordnet werden.The European patent EP 610 151 describes an automatic translation system using an intermediate language, which can be considered as a rule-based system, and in particular as a combination of transfer system and interlingua system. Tree-like structures are used to translate a source language into a first bridge language, then into an intermediate language, then into a second bridge language and finally into the target language. The translation into the bridge languages and the intermediate language is made possible by the fact that the texts written in a source language with a tree-like assignment are assigned corresponding morphological, syntactic and semantic features.

Allen bisher bekannten Systemen zur Bearbeitung und Übersetzung von Sprachen ist gemein, dass sie bisher noch keine zufrieden stellende Resultate liefern. Insbesondere für regelbasierte Interlinguasysteme wurde bisher noch kein zufrieden stellendes Modell für eine metasprachliche Repräsentation gefunden.all Previously known systems for editing and translation of languages is common that they have not yet been satisfactory Deliver results. Especially for rule-based interlingua systems has not been a satisfactory model for found a metalinguistic representation.

Aufgabe der vorliegenden Erfindung ist es daher, ein Verfahren sowie eine Vorrichtung vorzustellen, die eine verbesserte Sprachbearbeitung und insbesondere Übersetzung von Sprache gewährleisten.task The present invention is therefore a method and a Device that provides improved voice editing and in particular to ensure translation of language.

Die Aufgabe wird erfindungsgemäß gelöst durch ein Verfahren nach dem Anspruch 1 sowie eine entsprechende Vorrichtung.The The object is achieved by a method according to claim 1 and a corresponding device.

Die vorliegende Erfindung macht sich den heutigen Wissenstand auf dem Feld der Typologie, das heißt der Einteilung menschlicher Charaktere gemäß der Lehre von Hippokrates und des Galen zu nutze. Danach gibt es vier grundlegende Charaktertypen, nämlich den Sanguiniker, den Choleriker, den Melancholiker und den Phlegmatiker. In der jüngeren Vergangenheit haben Johann Caspar Lavater (1741–1801) und Carl Huter (1861–1912) die Typologie vertieft und schart gezeichnet. Heute bedient sich beispielsweise das EMNID-Institut der Methode mittels spezifischen Wortgebrauchs eines Menschen auf seinen Charakter zu schließen und vermarktet dieses als „Semiometrie" bezeichnete Verfahren.The The present invention is based on the current state of knowledge on the Field of typology, that is, the classification of human Characters according to the teaching of Hippocrates and of Galen. After that, there are four basic types of characters, namely the sanguine, the choleric, the melancholic and the phlegmatic. In the recent past Johann Caspar Lavater (1741-1801) and Carl Huter (1861-1912) the typology deepened and drawn out. Today, for example, serves the EMNID Institute of Method by means of specific word usage to close and market a person's character this method called "semimetry".

Die Erfindung basiert nun auf einer Zuordnung von Farben zu einem Wort auf der Grundlage der Einteilung der Charaktere nach oben genannter Typologie, über die der Farbkreis gelegt ist. Der Farbkreis wiederum ist eingebettet in ein Modell mit den Achsen (x, y, z), z. B. das CIE-Luv-Modell. Dieses Modell ist ein internationaler Standard in der Farbreproduktion zur allgemeinen Beschreibung einer Farbe und geht zurück auf die Commision International d'Eclairage. Die Farben gemäß CIE-Luv-Modell bestehen aus einer Luminanz- oder Helligkeitskomponente, der L-Komponente, und zwei chromatischen oder farbigen Komponenten: der a-Komponente, die von Grün bis Rot reicht, und der b-Komponente, die von Blau bis Gelb reicht.The invention is now based on an assignment of colors to a word on the basis of the classification of the characters according to the above-mentioned typology, over which the color wheel is laid. The color wheel is in turn embedded in a model with the axes (x, y, z), z. For example, the CIE Luv model. This Model is an international standard in color reproduction for the general description of a color and dates back to the Commision International d'Eclairage. The colors according to CIE-Luv model consist of a luminance or luminance component, the L component, and two chromatic or colored components: the a component, which ranges from green to red, and the b component, that of blue to Yellow is enough.

Anhand dieses dreidimensionalen Modells ist es möglich, einem Wort in einer Sprache einen bestimmten Punkt mit ortsfesten Koordinaten innerhalb dieses Modells zuzordnen. Mit der Positionierung an einem bestimmten Ort kommt gleichzeitig ein bestimmter Charaktertypus zum Ausdruck. Hat ein Wort mehrere Bedeutungen, so werden dem Wort dabei mehrere Punkte in dem Modell zugeordnet. Das bei der Positionierung an einem bestimmten Ort ein Charaktertypus zum Ausdruck kommt, bedeutet, dass dieses Wort bevorzugt von Personen mit dem entsprechendem Charaktertypus benutzt wird.Based This three-dimensional model makes it possible to one Word in a language a certain point with fixed coordinates within this model. With the positioning on one certain place comes at the same time a certain character type to expression. If a word has several meanings, then become the word thereby assigning several points in the model. That in the positioning in a certain place a character type is expressed, means that word prefers people with the appropriate character type is used.

Mit einer 12-Bit-Farbauswahl auf einem Rechner, das heißt 4096 unterschiedlichen Farbwerten, ist jede beliebige Sprache semantisch und gemäß der oben erläuterten Typologie charakterspezifisch, einschließlich aller Flexionsformen, einheitlich abbildbar. Dabei werden jedem Wort vorzugsweise zwei Farbwerte zugeordnet. Bei einer Verkettung von einzelnen Worten zu einem Satz offenbart sich nun ein charakterspezifischer Satzaufbau. Denn nur gewisse Wortkombinationen, das heißt also Farbkombinationen, sind semantisch angemessen und werden erfahrungsgemäß in Abhängigkeit vom Charaktertyp eines Menschen benutzt und kombiniert. Damit ist das im Folgenden als Farbontologie bezeichnete Prinzip, auf dem die Erfindung beruht, ein in sich geschlossenes harmonisches System, welches in natürlicher Weise eine auf die Sprache bezogene Typen- und Naturellzuordnung beinhaltet. Ist dieses System einheitlich für alle heutzutage in einer Datenbank archivierbaren Sprachen eingerichtet, so läßt sich rechnergestützt auf Knopfdruck die Übersetzung beliebiger Texte bereitstellen. Bei den arabischen Sprachen muß lediglich die Bitfolge invertiert werden. Die einheitliche typologische Einordnung von Texten nach dem Prinzip der Farbontologie bietet innerhalb einer Sprache oder sprachübergreifend Recherche-, Such- und Marketingoptionen. Ein vorgegebener Text läßt sich beispielsweise typologisch modulieren, indem man die entsprechenden Punkte im CIE-Luv-Modell hinsichtlich der gegebenen Frequenzen moduliert und anschließend in die Sprache zurücktransformiert. Mit Hilfe der Farbontologie kann jedes elektronische Gerät, wie zum Beispiel ein Computer, ein Handy, ein Palmtop usw., das 12 Bit interpretieren kann, für die beschriebene Bearbeitung oder Übersetzung von Sprache verwendet werden.With a 12-bit color picker on a machine, that is 4096 different color values, any language is semantic and according to the typology explained above Character-specific, including all inflectional forms, uniformly imageable. In this case, each word preferably two Assigned color values. In a concatenation of single words to a sentence now reveals a character-specific sentence structure. Because only certain combinations of words, that is, color combinations, are semantically appropriate and are experienced in Depends on the type of character a person uses and combined. This is the principle referred to below as color ontology, on which the invention is based, a self-contained harmonic System, which is naturally based on the language related type and Naturellzuordnung includes. Is this system uniform for all archivable in a database today Languages set up, so can be computer-aided provide the translation of any text at the touch of a button. For Arabic languages, only the bit sequence has to be used be inverted. The uniform typological classification of Copywriting according to the principle of colorology offers within one Language or cross-language search, search and marketing options. A given text can be, for example Typologically modulate by looking at the corresponding points in the CIE Luv model modulated in terms of the given frequencies and then transformed back into the language. With the help of color ontology can any electronic device, such as a computer, a cell phone, a palmtop etc that can interpret 12 bits for the described editing or translation of speech be used.

Die Erfindung wird im folgenden anhand der Figuren beispielhaft beschrieben.The The invention will be described by way of example with reference to the figures.

Es zeigen:It demonstrate:

1 die Einordnung der menschlichen Charaktertypen, wie sie auf die Lehre des Hippokrates und des Galen zurückgeht, 1 the classification of the human character types, as it goes back to the teachings of Hippocrates and Galen,

2 die Einteilung der vier Charaktertypen, die durch den Farbkreis unterlegt wird. Da die Abbildung in der Veröffentlichung schwarz-weiß ist, wird die farbliche Zuordnung kurz erläutert: Rechts oben in der Figur befindet sich der Farbbereich Gelb, rechts unten der rote Farbbereich, links unten schließt sich der blaue Farbbereich an und links oben befindet sich der Farbbereich Grün, 2 The division of the four character types, which is highlighted by the color wheel. Since the illustration in the publication is black and white, the color assignment is briefly explained: right above in the figure, the color range is yellow, right below the red color range, bottom left is the blue color range and top left is the color range Green,

3 das CIE-Luv-Modell, in dem nun zu den vier Charaktertypen, die mit dem Farbkreis unterlegt sind, zusätzlich die vertikale Achse für die Helligkeit mit Wert L für Grauwerte zwischen Weiß mit L = 100 und Schwarz mit L = 0 hinzutritt. Die Charaktertypen selbst werden repräsentiert durch den Wert +u, Rot/Magenta, für den Choleriker, den Wert –u, Grün/Cyan, für den Melancholiker, den Wert +v, Gelb, für den Phlegmatiker und den Wert –v, Blau, für den Sanguiniker. Durch die zusätzliche senkrechte Achse für die Helligkeit ist für die Repräsentation eines Wortes durch einen Punkt (L, u, v) die Möglichkeit gegeben, anhand eines Wertes L Füllwörter und Intensität eines entsprechenden Charaktertypus mit Werten (u, v). darzustellen. 3 the CIE Luv model, in addition to the four character types, which are underlaid with the color wheel, in addition the vertical axis for the brightness with value L for gray values between white with L = 100 and black with L = 0 added. The character types themselves are represented by the value + u, red / magenta, for the choleric, the value -u, green / cyan, for the melancholic, the value + v, yellow, for the phlegmatic and the value -v, blue, for the sanguine. Due to the additional vertical axis for the brightness, the representation of a word by a point (L, u, v) is given the possibility of filling words and intensity of a corresponding character type with values (u, v). display.

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDE IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list The documents listed by the applicant have been automated generated and is solely for better information recorded by the reader. The list is not part of the German Patent or utility model application. The DPMA takes over no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • - EP 715265 [0007] EP 715265 [0007]
  • - DE 10015858 [0008] - DE 10015858 [0008]
  • - DE 10015859 [0008] - DE 10015859 [0008]
  • - EP 610151 [0010] - EP 610151 [0010]

Zitierte Nicht-PatentliteraturCited non-patent literature

  • - Ramiro Gomez: „Maschinelle Übersetzung" aus dem Jahr 2003 [0002] - Ramiro Gomez: "Machine translation" from 2003 [0002]

Claims (4)

Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache mit den folgenden Schritten: 1.1. Der Text der Ausgangssprache wird in einzelne Wörter zerlegt, 1.2. den einzelnen Wörtern im Text der Ausgangssprache werden gemäß dem Prinzip der Farbontologie, das eine Korrespondenz zwischen menschlichen Charaktertypen und Farben zugrunde legt, Punkte (x, y, z), etwa in einem CIE-Luv-Modell, wo dann die Punkte Punkte (L, u, v) gelten zugeordnet, 1.3. die Punkte (L, u, v) in dem CIE-Luv-Modell werden moduliert, das heißt in einheitlicher Weise einer Abbildung f unterzogen und in die Punkte (f(L), f(u), f(v)) überführt, 1.4. den einzelnen Punkten (f(L), f(u), f(v)) werden gemäß dem Prinzip der Farbontologie Wörter in der Zielsprache zugeordnet, 1.5. die einzelnen Wörter in der Zielsprache werden zu einem Text in der Zeilsprache kombiniert.Method of transmitting a text any source language into a text of any one Target language with the following steps: 1.1. The text of Source language is broken down into individual words, 1.2. the individual words in the text of the source language according to the principle of color ontology, the one Based on correspondence between human character types and colors places points (x, y, z), such as in a CIE Luv model, where then the points Points (L, u, v) apply, 1.3. the points (L, u, v) in the CIE-Luv model are modulated, that is in uniformly subjected to a mapping f and in the points (f (L), f (u), f (v)), 1.4. the single Points (f (L), f (u), f (v)) are calculated according to the principle colorontology associated with words in the target language, 1.5. the individual words in the target language become one Text combined in the line language. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass Ausgangssprache und Zielsprache übereinstimmen, so dass es sich um eine Bearbeitung des Textes innerhalb ein und derselben Sprache handelt.Method according to claim 1, characterized in that that source language and target language match, so that it is a processing of the text within one and the same Language is acting. Verfahren nach Anspruch 1, dadurch gekennzeichnet, das es sich bei der Abbildung f um die identische Abbildung handelt, so dass es sich um eine einfache Übersetzung des Textes der Ausgangssprache in einen Text der Zielsprache handelt.Method according to claim 1, characterized in that that the image f is the identical image, so that it is a simple translation of the text the source language into a text of the target language. Vorrichtung zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache mit 4.1. einer ersten Einrichtung zur Aufnahme des Textes in der Ausgangssprache und seiner Zerlegung in einzelne Wörter, 4.2. einem Prozessor, 4.3. einer zweiten Einrichtung zur Ausgabe der Wörter in der Zielsprache und ihrer Synthese in einen Text in der Zielsprache, dadurch gekennzeichnet, dass 4.4. der Prozessor eine auf dem Prinzip der Farbontologie, das eine Korrespondenz zwischen menschlichen Charaktertypen und Farben zugrunde legt, beruhende Zuordnung zwischen Wörtern einer beliebigen Sprache und Punkten (x, y, z) z. B. in einem CIE-Luv-Modell (L, u, v) vorsieht.Device for transmitting a text any source language into a text of any one Target language with  4.1. a first device for recording the text in the source language and its decomposition into individual words, 4.2. a processor, 4.3. a second Device for outputting the words in the target language and their synthesis into a text in the target language, characterized, that 4.4. the processor one on the principle of color ontology, that is a correspondence between human character types and Colors based, based assignment between words any language and points (x, y, z) z. In a CIE-Luv model (L, u, v).
DE102008003886A 2008-01-10 2008-01-10 Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language Withdrawn DE102008003886A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102008003886A DE102008003886A1 (en) 2008-01-10 2008-01-10 Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102008003886A DE102008003886A1 (en) 2008-01-10 2008-01-10 Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language

Publications (1)

Publication Number Publication Date
DE102008003886A1 true DE102008003886A1 (en) 2009-07-16

Family

ID=40758423

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102008003886A Withdrawn DE102008003886A1 (en) 2008-01-10 2008-01-10 Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language

Country Status (1)

Country Link
DE (1) DE102008003886A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0610151A1 (en) 1993-02-02 1994-08-10 Uribe-Echevarria Diaz De Mendibil, Gregorio Automatic interlingual translation system
EP0715265A2 (en) 1994-11-28 1996-06-05 Sharp Kabushiki Kaisha Machine translation system
DE10015859A1 (en) 2000-03-30 2001-10-11 Gunthard Born Natural language grammatical content communication method during speech recognition involves generating supplementary text for grammar message using permutations of symbols
DE10015858A1 (en) 2000-03-30 2001-10-11 Gunthard Born Natural language translation method for communication of related semantics involves using different declarations and symbols to pass suitable speech terms

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0610151A1 (en) 1993-02-02 1994-08-10 Uribe-Echevarria Diaz De Mendibil, Gregorio Automatic interlingual translation system
EP0715265A2 (en) 1994-11-28 1996-06-05 Sharp Kabushiki Kaisha Machine translation system
DE10015859A1 (en) 2000-03-30 2001-10-11 Gunthard Born Natural language grammatical content communication method during speech recognition involves generating supplementary text for grammar message using permutations of symbols
DE10015858A1 (en) 2000-03-30 2001-10-11 Gunthard Born Natural language translation method for communication of related semantics involves using different declarations and symbols to pass suitable speech terms

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ramiro Gomez: "Maschinelle Übersetzung" aus dem Jahr 2003

Similar Documents

Publication Publication Date Title
DE69829389T2 (en) TEXT NORMALIZATION USING A CONTEXT-FREE GRAMMAR
DE102013003055A1 (en) Method and apparatus for performing natural language searches
CN109544524A (en) A kind of more attribute image aesthetic evaluation systems based on attention mechanism
DE112017006151T5 (en) Customizable processing components
DE112019001533T5 (en) EXTENSION OF TRAINING DATA FOR THE CLASSIFICATION OF NATURAL LANGUAGE
Legrand Issues in the Translatability of Law
DE112021004163T5 (en) CUTTING A COMMUNICATION CONTENT
WO2015113578A1 (en) Method for automatically detecting meaning and measuring the clearness of text
DE112018005244T5 (en) STRUCTURING INCENSE NODES BY OVERLAYING A BASIC KNOWLEDGE
DE202005022113U1 (en) Training for a text-to-text application that uses a string-tree transformation for training and decoding
DE102019004300A1 (en) USE OF A DYNAMIC STORAGE NETWORK TO TRACK DIGITAL DIALOG STATES AND GENERATE ANSWERS
DE102018007165A1 (en) FORECASTING STYLES WITHIN A TEXT CONTENT
DE60202847T2 (en) NATURAL LANGUAGE RECEIVING SYSTEM FOR ACCESSING AN INFORMATION SYSTEM
DE60101668T2 (en) METHOD AND DEVICE FOR GENERATING AN INDEX BASED ON A FORMAT FOR A STRUCTURED DOCUMENT
Das et al. A novel system for generating simple sentences from complex and compound sentences
DE102022003003A1 (en) Automatic photo editing using spoken instructions
DE202023102803U1 (en) System for emotion detection and mood analysis through machine learning
DE202022002901U1 (en) Text-Image Layout Transformer (TILT)
DE112020004925T5 (en) UPDATE AND TRANSFORM A DOCUMENT FROM AN AUDIO ACT
CN108491399A (en) Chinese to English machine translation method based on context iterative analysis
Alonso et al. The impact of technology on the role of the translator in globalized production workflows
Fitsilis et al. Development and validation of a corpus of written parliamentary questions in the hellenic parliament
Gorozhanov et al. Corpus analysis of the grammatical categories’ constituents in fiction texts considering the linguo-regional component
DE102008003886A1 (en) Source language text translating method, involves assigning individual points in accordance with principle of color ontology of individual words in target language, and combined individual words in target language to text in target language
DE102008003572A1 (en) Method for translating text of user defined source language into text of user-defined target language, involves uniformly modulating points in international commission on illumination-luminance saturation hue angle model

Legal Events

Date Code Title Description
8122 Nonbinding interest in granting licences declared
8139 Disposal/non-payment of the annual fee