WO2001039035A1 - Systeme de traduction - Google Patents

Systeme de traduction Download PDF

Info

Publication number
WO2001039035A1
WO2001039035A1 PCT/JP2000/008116 JP0008116W WO0139035A1 WO 2001039035 A1 WO2001039035 A1 WO 2001039035A1 JP 0008116 W JP0008116 W JP 0008116W WO 0139035 A1 WO0139035 A1 WO 0139035A1
Authority
WO
WIPO (PCT)
Prior art keywords
language
universal
expression
natural language
conversion
Prior art date
Application number
PCT/JP2000/008116
Other languages
English (en)
French (fr)
Inventor
Hiroshi Uchida
Meiying Zhu
Original Assignee
United Nations
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Nations filed Critical United Nations
Priority to AU14152/01A priority Critical patent/AU1415201A/en
Priority to US10/130,357 priority patent/US7107206B1/en
Priority to EP00976319A priority patent/EP1233347A4/en
Priority to JP2001540629A priority patent/JP4291532B2/ja
Publication of WO2001039035A1 publication Critical patent/WO2001039035A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Definitions

  • the present invention relates to a technology for solving a linguistic problem in translation, interpretation, and the like that occurs during information exchange and information storage.
  • the present invention relates to a language conversion technology that is suitable for exchanging information and storing information in a network or a network, and can be applied to machine translation, machine interpretation, and the like.
  • BACKGROUND ART In the age of the Internet, people's activities have become international. Communication is of paramount importance when it comes to international activities. Language is an important issue for that. However, at present, there is no universal language in a complete sense. Even the most popular English is not a universal language. In fact, people belong to different linguistic spheres, and each wants to communicate in their own native language.
  • An object of the present invention is to provide a language conversion system that can easily and accurately perform communication between various languages with a small burden.
  • a system for performing language conversion according to the first aspect of the present invention includes:
  • a conversion rule section that stores conversion rules referred to for conversion between a natural language expression and a universal language expression for at least one type of natural language
  • a conversion processing unit that converts a given expression in a natural language into an expression in a universal language with reference to a conversion rule corresponding to the natural language stored in the conversion rule unit;
  • An inverse conversion processing unit that converts an expression in a universal language into an expression in a target natural language with reference to a conversion rule corresponding to a target natural language stored in the conversion rule unit.
  • the conversion rule section includes, as a conversion rule for a corresponding natural language,
  • Natural language elements that make up natural language are defined by universal language elements that make up the universal language, corresponding to the information that each has.
  • the conversion processing unit refers to a universal language dictionary corresponding to the given natural language for a given expression in the natural language, and converts a component configuring the natural language expression into a corresponding universal language in the universal language dictionary.
  • the process of rewriting to language elements, and combining the rewritten plurality of universal language elements by applying rewriting rules corresponding to the target natural language according to the array, and the binary relation According to the rules for notation in, processing for generating an expression in a universal language expressed in a binary relation is performed.
  • the inverse conversion processing unit is configured to refer to a rewriting rule corresponding to a target natural language with respect to an expression in a universal language represented by a binary relation, and to represent the representation in a binary relation included in the rule.
  • the rules the process of decomposing into each universal language element constituting the combination, and referring to the universal language dictionary corresponding to the target natural language, the natural language expression Generate the expression in the natural language of interest by rewriting the constituent elements.
  • a system for performing language conversion according to the second aspect of the present invention is as follows.
  • a conversion rule unit that stores conversion rules referred to for conversion between a natural language expression and a universal language expression for at least one type of natural language;
  • An inverse conversion processing unit that converts an expression in a given universal language into an expression in a natural language with reference to a conversion rule stored in the conversion rule unit.
  • the conversion rule section includes, as a conversion rule for a corresponding natural language,
  • a universal language dictionary defined by the universal language elements that make up universal languages, corresponding to the information that they have,
  • the inverse conversion processing unit is configured to refer to a rewriting rule corresponding to a target natural language with respect to an expression in a universal language represented by a binary relation, and to represent the representation in a binary relation included in the rule.
  • the rules the process of decomposing into each universal language element constituting the combination, and referring to the universal language dictionary corresponding to the target natural language, the natural language expression Rewrite the constituent elements to generate the desired natural language expression.
  • Figure 2 shows the natural language used in this embodiment. It is a block diagram showing the functional configuration of a system that converts expressions into expressions in a universal language.
  • FIG. 3 is an explanatory diagram schematically showing an example of the configuration of the universal language dictionary used in the present invention.
  • FIG. 4 is an explanatory diagram schematically showing an example of a configuration of a conversion rule used in the present invention.
  • Figure 5 is a block diagram that shows an example of the configuration of a language conversion system that generates natural language expressions based on universal language expressions.
  • FIG. 6 is a block diagram showing an example of the configuration of a system capable of performing both conversion and inverse conversion.
  • FIG. 7 is an explanatory diagram showing an example of a model that can be applied to a case where information is exchanged via a network.
  • BEST MODE FOR CARRYING OUT THE INVENTION will be described with reference to the drawings.
  • the present invention will be described by taking as an example a case in which an expression in English is used as an expression in a natural language, and an expression in a universal language is generated based on the expression.
  • a universal language used for generating expressions can be basically handled by a computer and communicated via a network.
  • Can be used Language Therefore, the notation for the universal language is sufficient if it is a symbol such as a number that can be handled on a computer. However, it may be expressed so that people can understand it. This can be done, for example, by mapping universal language codes to specific natural language notations.
  • a case where a universal language is described based on English is taken as an example. This is due to the widespread use of English and the widespread use of computer language.
  • universal language notation can also be based on languages other than English. Also, it may be a notation in an artificial language that can be understood by humans.o
  • FIG. 1 shows a configuration example of a hard-air system that can be used for the configuration of the language conversion system of the present invention.
  • This system is used to generate universal language expressions from natural language expressions (conversion) and to generate natural language expressions from universal language expressions (reverse conversion). it can. Therefore, the system for performing the conversion and the inverse conversion can be configured by the same hard-to-air system. Note that the inverse conversion is to convert an expression in a universal language into an expression in any natural language, and is not limited to returning to the original expression in a natural language.
  • Figure 1 shows a commonly used computer system. That is, the hardware system shown in FIG. 1 includes an arithmetic device 10, an input device 20 having a keyboard 21 and a mouse 22, and an output device 3 having a display device 31 and a printing device 32. 0, a storage device 40 composed of a hard disk device or the like, And a communication control device 50 for connecting to a network.
  • the input device 20 and the output device 30 are generic terms, respectively, and do not mean, for example, that the output device 30 is a device having a display device 31 and a printing device 32. .
  • the arithmetic unit 10 includes a central processing unit (CPU) 11, a read-only memory (ROM) 12, and a random access memory (RAM) 13.
  • the CPU 11 loads the application program installed in the storage device 40 into the RAM 13 and executes the application program, thereby processing various applications. I do .
  • As one of the application programs a program for generating and processing expressions in a universal language used in the present embodiment, and an expression in a universal language to a natural language. There is a program that converts this into an expression.
  • These programs are provided on a recording medium such as a CD-ROM or a flexible disk. It can also be obtained from a server that provides a program by downloading it via a network or the like. In this embodiment, in any case, the data is converted into an executable format and stored in the storage device 40.
  • a conversion rule is used when converting between a natural language and a universal language.
  • This conversion rule is provided in a state recorded on a recording medium, similarly to the program. It can also be obtained via the network. Then, the conversion rules are stored in the storage device 40. These conversion rules are provided for each of the natural languages. In addition, two or more languages that have similarities such as similar structures or common words As for, conversion rules may be established for them and applied.
  • FIG. 2 shows a functional configuration of a system used in the present embodiment that converts a natural language expression into a universal language expression.
  • the conversion preparation processing unit 1000 prepares the data in which the expression in the natural language that is the source of the expression in the universal language is generated.
  • a conversion rule unit 200 that stores at least one type of conversion rule that is referred to in order to convert a language expression into a universal language expression
  • a conversion preparation processing unit A conversion processing unit that converts the expression in natural language given by 100 into an expression in universal language by referring to the conversion rules stored in the conversion rule unit 200.
  • a storage processing unit 400 that performs processing for storing the generated expression in the universal language in the storage device 40, and outputs the generation processing process and the generated expression to the output device 30.
  • an output processing unit 500 for performing the processing.
  • the conversion preparation processing unit 100 performs a process of taking the data expressed in the original natural language into the conversion processing unit 300.
  • the processing to be imported includes, for example, the following processing.
  • the conversion rule unit 200 constructs a universal language corresponding to the information of each of the natural language elements constituting the natural language.
  • the universal language dictionary 210 defined by the universal language elements to be defined and the universal language elements arranged in accordance with the sentence structure of the natural language are defined.
  • the universal language dictionary 210 and the rewriting rules 220 are treated separately in the present embodiment.
  • the present invention is not limited to this. For example, it is possible to make one rewriting rule as a whole without distinguishing between the universal language dictionary 210 and the rewriting rule 220.
  • the universal language dictionary 210 and the rewriting rules 220 can be further subdivided.
  • the universal language dictionary 210 is composed of a set of universal language elements represented by symbols used in universal languages, corresponding to the components of natural language. At least one of the universal language elements is information that specifies the meaning of the corresponding natural language component, and information that specifies the evaluation of the corresponding natural language component. Information is displayed. In addition, each universal language element is accompanied by a sentence element symbol indicating to which of the sentence elements in the corresponding natural language the corresponding universal language element corresponds.
  • Figure 3 schematically shows an example of the configuration of a universal language dictionary. The example shown in Figure 3 shows, of course, only a small portion of the dictionary elements.
  • the universal language dictionary is described as a (". @ In def"), DET ', man ("person”), N, and so on. That is,
  • elements described herein are not limited to discrete words.
  • stems, suffixes, etc. are also included.
  • each element is added as information indicating its property.
  • information indicating a tense, information indicating a plural form, and the like are added.
  • rule-change verbs they are divided into stems and suffixes, and each is defined as an independent element.
  • 'Ask' and 'ed' shown in Fig. 3 correspond to the stem and its suffix.
  • 'E d' is also combined with other verbs.
  • the noun can function as an adjective. In this case, it is defined as a suffix having a property different from the ending of the verb.
  • Y specifies at least one of the information that specifies the meaning of the corresponding natural language component and the information that specifies the evaluation of the corresponding natural language component.
  • the information specifying the meaning is 'person'.
  • verbs, adjectives, etc. can be described, not limited to nouns.
  • '. @ Indef corresponds to the information for specifying the evaluation.
  • the nature of the noun is specified as an indefinite article, and it can be said that the information specifies the meaning. In the present invention, these are referred to as attribute elements.
  • the information specifying the meaning can include information indicating various characteristics such as tense, intention, reason, and nature of the event. Also, depending on the state of the object, multiple types of information can be written together, for example, separated by commas.
  • question ' is defined in a binary relation. That is, 'question ("question (icl>thing)") and g will be posted. This defines that 'question' in English is expressed as 'question' in the universal language. It also defines that the universal word question has the property of (icl> thing). Here, (icl> thing) 5 is a symbol related to a concept.
  • Question define what is included in the concept of thing '.
  • 'thing' indicates the concept of a thing in a universal language.
  • information specifying the meaning and information specifying the evaluation can be written together, for example, separated by commas.
  • the sentence element symbol described above is added to Z.
  • “DET” and “N” correspond to this.
  • the sentence element symbol corresponds to information indicating a part of speech in a natural language, for example.
  • 'DET' means a determinant and is a symbol indicating that it is a sentence element that determines the properties of a target noun, such as an article.
  • 'N' is a symbol indicating that it is a sentence element meaning a noun.
  • VTSTM 5 is a transitive verb It is a symbol indicating that it is the stem of the word.
  • 'ENDING' is a symbol that means it is a suffix element.
  • the rewriting rule 220 defines the associative relationship of the universal language elements arranged corresponding to the sentence structure of the natural language, such as the numbers 1 to 10 shown in FIG.
  • the sentence S has an NP as a main part and a VP as a predicate, and these are connected by a relation called agt. It indicates that there is something.
  • Number 2 indicates that VP has a transitive verb VT and a noun phrase NP, which are connected by a relational object called obj. The relations will be described later.
  • number 3 indicates that NP corresponding to the noun phrase is in a relationship of binding to DET.
  • the number 4 indicates that VT, which is a transitive verb, has a relationship that connects VTSTM and ENDING.
  • DET combines' a (". @ Indef"), with the exception of natural language elements, such as, DET (". @ Indef"). It is shown that. The same applies to numbers 6 and on.
  • the universal language dictionary 210 and the rewriting rules 220 described above are used in the present invention to generate a universal language expression from a natural language expression.
  • the same conversion rules can be used when generating expressions. How to create a universal language expression using the universal language dictionary 210 and rewriting rules 220 will be described later.
  • the conversion processing unit 300 converts the expression in the given natural language. Then, referring to the universal language dictionary, a universal language element rewriting process 310 for rewriting the constituent elements constituting the natural language expression into corresponding universal language elements in the universal language dictionary is written. The rewritten rules are sequentially applied to a plurality of replaced universal language elements in accordance with the arrangement thereof, and the universal language is expressed in a binary relation in accordance with the rule for expressing the binary relation. And a binary relation generation 320 process for generating an expression by the following. This conversion process is mainly performed by executing a program in the arithmetic unit 10.
  • the storage processing unit 400 performs a process of storing the result processed in the arithmetic device 10 in the storage device 40. This processing is performed by the arithmetic unit 10, and the storage device 40 stores the data output from the arithmetic unit in response to this processing. The data is read out as needed.
  • the output processing unit 500 performs a process of displaying input data, a processing result, and the like on the display device 31 and printing on the printing device 32. Display and printing are processed separately.
  • :: means that... is defined as...
  • ⁇ XXX> is a variable name If the above expression is used, various expressions can be accurately performed. For example, an , easily)
  • a compound universal word is a set of binary relations collected to express a compound concept.
  • the compound universal word ID is an identifier for identifying a binary relation belonging to the set of compound universal words. By specifying this identifier, the compound universal language can be used as a universal language.
  • the compound universal word ID is represented by, for example, uppercase alphabet or two digits.
  • a binary relation is an expression in a universal language, that is, a group of sentences.
  • a binary relation is composed of two universal words and a relation.
  • binary relations are predefined and called relational Stipulated by three or fewer characters.
  • the relations between universal languages differ according to the behavior of the universal languages, and the corresponding relations agt, and, aoj, obj, icl, etc. are used. Relationships are predefined. For example:
  • pic A place where an event occurs or a state exists.lf A place where an event starts or a state begins to exist.
  • the universal language used in the present invention will be described.
  • the universal language is defined by the following equation. Note that the promises in the expression are the same as those in Expression 1.
  • ⁇ Heading> is composed of character strings. For example, buy, book, etc. are mentioned. Universal languages need only be able to be handled by a computer, so they need not necessarily be expressed in human-readable form. However, since it is more convenient to define it in a human-readable form, in the present embodiment, the universal language is defined based on English as described above. It can be defined in other languages, such as Japanese.
  • binding list In general, linguistic elements are subject to various constraints. Therefore, in the present embodiment, one or more bindings are shown in parentheses as a binding list. Multiple bindings can be specified. In that case, separate them with commas.
  • the binding list is defined as follows:
  • a universal language has a basic universal language that is not bound and a certain binding There are restricted universal words and special restricted universal words
  • An attribute is information that specifies the above-mentioned properties. This attribute is defined by the following expression:
  • Attributes in the universal language refer to the speaker's perspective on the situation of the speaker, such as past, present, future, etc. These include views, the speaker's focus on the speaker's attention, the strength of the speaker's interest, the speaker's views, and so on. Typically, the following are defined:
  • the universal language ID is used to identify the target, for example, when there is a reference that can be referred to, when there is the same expression, etc. Used for The website is sent as follows.
  • Arithmetic unit 10 fetches “The man asked a question”, which is a sentence to be converted, into RAM 3 via conversion preparation processing unit 100. In the present example, it is assumed that the input is made via the keyboard 21. Now, the CPU 11 of the arithmetic unit 10 searches the universal language dictionary 210 for the first word of the input English sentence. Then,, the (". @ Def"), DET, are found. So, applying the rewrite rule 6 in Figure 4, we get the following result.
  • CPU 11 reads the sentence element symbol from the beginning of the rewriting result, and determines the relationship between adjacent sentence element symbols from the beginning with reference to the rewriting rule shown in FIG. For example, in the case of the rewriting result, the arrangement sentence element symbols are arranged in the order of DET, N, VTSTM, ENDING, DET, N, from the top. First, apply 'Rewrite Rule 3' for 'DET, and N, to get NP ("person. @ Def")'. As a result, the following result is obtained.
  • NP question. @ Indef
  • the PCU 11 determines that there is no object to be rewritten at the tail end.
  • the relation between adjacent sentence element symbols from the beginning is determined with reference to the rewriting rule shown in Fig. 4. For example, in the case of the rewriting result, 'NP,' VT ⁇
  • the placement sentence element symbols are arranged in the order of 'NP', where the rewriting rule cannot be applied to 'NP,, and VT' at the beginning.
  • rewrite rule 2 is applied to 'VT' and 'NP', and the following result is obtained.
  • This universal language expression does not include natural language components, as is evident from the components. Therefore, when a natural language is generated from a once obtained universal language, if there is the above-mentioned conversion rule corresponding to the language to be converted, from or from any language Then, each can be converted.
  • the parts shown about the universal language dictionary and the conversion rules used in the above examples are only a part of the whole.
  • the universal vocabulary has a vocabulary of about 100,000 words. If the present invention is used specifically for a specific application, the number of vocabularies is small.
  • a language conversion system that generates an expression in a natural language based on an expression in a universal language will be described with reference to FIG. 5.
  • the language conversion system shown in FIG. By combining with a language conversion system, it is possible to avoid language differences by taking communication in the form of natural language-universal language—natural language.
  • the language conversion system shown in Fig. 5 stores conversion rules, which are referred to for converting natural language expressions into universal language expressions, for at least one type of natural language.
  • a conversion rule unit 200 that converts a given universal language expression into a natural language expression with reference to the conversion rules stored in the conversion rule unit. 3 5 0 and are provided.
  • the conversion rule section 200 has the same configuration as that shown in FIG. 2 described above. A conversion rule corresponding to the natural language for output is prepared. The conversion rule part 200 has already been described, and thus the description will not be repeated.
  • the inverse transformation processing unit refers to a universal language expression expressed in a binary relation with reference to a rewriting rule corresponding to a target natural language, and expresses the expression in a binary relation included in the rule.
  • the binary relation decomposition processing 360 that decomposes into the universal language elements constituting the combination according to the rules of, and the universal language dictionary corresponding to the target natural language
  • a natural language element conversion process 370 that generates an expression in the target natural language by rewriting the constituent elements of the natural language expression with reference to. This inverse transformation process This is mainly performed by executing the program in the arithmetic unit 10.
  • the storage processing section 400 and the output processing section 500 are the same as those described above. However, the storage processing unit 400 reads the expression in the universal language from the storage device 40 and passes the expression to the inverse transformation processing unit 350.
  • the conversion rules shown in FIGS. 3 and 4 are used for the representation of universal words expressed in a binary relation.
  • the rewriting rules shown in Fig. 4 are applied from left to right. That is, the rule is applied in the direction of the arrow shown in the rewrite rule.
  • the conversion / inverse conversion processing section 390 includes a universal language element conversion processing 3 1 0, a binary relation generation processing 3 2 0, a binary relation decomposition processing 3 6 0, and a natural language element conversion processing 3 7 0 And.
  • the universal language element conversion processing 310, the binary relation generation processing 320, the binary relation decomposition processing 360, and the natural language element conversion processing 370 are described in Figs. The function is the same as that of the system shown in FIG.
  • the conversion rule unit 200 has one or more types of conversion rules corresponding to a natural language. Since the conversion rule part 200 has already been described, a duplicate description will be omitted.
  • the conversion rule section 200 has a conversion rule corresponding to, for example, English, the mutual conversion between English and the universal language can be performed.
  • the same content will be input regardless of which of these languages is used.
  • the sentence is input, a sentence expressed in the same universal language is obtained. And expressed in this one, universal language Based on the sentence, the same sentence expressed in English, German, Chinese, and Japanese is obtained.
  • FIG. 6 shows an example in which language conversion and inverse conversion are performed by the same hardware system.
  • the present invention is not limited to this.
  • the present invention can be applied to a case where information is exchanged via a network.
  • Figure 7 shows one model in that case.
  • the model shown in Fig. 7 accumulates data expressed in the universal language sent via the network N, and converts universal language expression data on demand.
  • the universal language expression data sent to the network—the evening storage S 1 and the natural language expression sent via the network N are expressed in the universal language A language conversion server S2 that converts the data into data overnight and transmits the data to the network N; and converts the data expressed in the universal language transmitted through the network N into the natural language.
  • Language inversion server S3 which converts the data into data expressed in English and sends it to network N, and an English expression which outputs the data expressed in English as a natural language to the network.
  • the system shown in FIG. 2 can be used for terminal S2. Further, the system shown in FIG. 5 can be used for the terminal S3.
  • a server using the system shown in FIG. 6 can be connected.
  • the universal language expression data storage server S1 accumulates data in a state where all the original data is described in any natural language, even if the original data is described in the same universal language. By using the data expressed in this universal language as the original, version management and the like can be performed in one place. In addition, it is efficient as a data server, since there is no need to duplicately store data of various types expressed in multiple languages.
  • the universal language of the present invention can convert it into a natural language
  • the universal language expression accurately conveys the original natural language expression by checking the inversely converted expression. Can be easily checked. Therefore, it is possible to make the representation in the universal language accurate.
  • the universal language is clearly described using binary relations, the conversion from the universal language to the natural language can be performed accurately. As a result, it can be said that using the expression in the universal language as the original is useful for transmitting the same information internationally.
  • natural language is described.
  • the present invention is not strictly a natural language, for example, an artificial language such as Esperanto, a machine language such as a computer language, etc. It is also possible to apply the expression by.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

明 細 書 言語変換シ ス テ ム 技術分野 本発明は、 情報交換、 情報蓄積の際に生 じ る、 翻訳、 通訳等 における言語問題を解決す るための技術に係 り 、 特に、 コ ン ビ ュ一夕、 ネ ッ ト ワーク等において行われる情報交換、 情報蓄積 に好適であ り 、 かつ、 機械翻訳、 機械通訳な どに も適用で き る 言語変換技術に関する。 背景技術 イ ンターネ ッ ト ネ ッ ト 時代の今日、 人々の活動は国際的にな つてい る。 国際的な活動に際 しては、 意志の伝達が何よ り も 重 要な こ とであ る。 そのためには言語が重要な問題 とな る。 しか し、 現在の と こ ろ、 完全な意味での世界共通言語は存在 して い ない。 普及度の高い英語であ って も、 世界共通語 とはいえない 。 実際に、 人々は様々な言語圏に属 してお り 、 それぞれ、 自 身 のネィ テ ィ ブ言語に よ る コ ミ ュニケイ シ ヨ ン を望んでい る。
現在、 異な る言語間でコ ミ ュニケイ シ ヨ ンを取る には、 それ らの言語間での翻訳が必要 と な る。 場合に よ っては、 両者か ら の翻訳が可能な別の言語を介在させての翻訳が必要とな る。 翻 訳に際 しては、 一般的には人力にた よ る こ と とな る。 ま た、 一 部の言語では、 翻訳ソ フ ト ウエアが開発されているので、 機械 翻訳が行われる場合もある。
と こ ろで、 これまでの翻訳ソ フ ト ウェアは、 特定の言語で記 述された文章について、 その構文を解析する と と も に、 意味を 解析し、 翻訳すべき言語の単語を用い、 かつ、 その文法に従つ て、 文の要素を置き換え る という作業を行ってい る。 このため 、 完全な翻訳は非常に困難であ り、 よ く似た言語どう しの翻訳 において も、 1 0 0 %とは言い難い。
また、 人は、 使用する言語の如何によ らず、 報告、 取引、 文 学、 娯楽等の種々の分野での様々な状況において、 言語で表現 される情報を生成している。 これらの言語で記述される情報は 、 通常、 それが最初に記述された言語によ り、 印刷物、 デイ ジ 夕ルデ一夕等の形で、 それぞれ個別的に保存される。 また、 翻 訳された情報については、 翻訳された言語によって表記される 状態でも保存される こ と となる。 従って、 同一内容の情報が、 異なる言語でそれぞれ保存される こ と とな る。 これは、 ネ ッ ト ワーク時代にあっては、 あま り効率的とはいえない。 特に、 内 容に変更が生じる場合には、 原本のみな らず、 すべての翻訳文 についても変更部分の翻訳を必要とする。 従って、 文書の管理 の点においても、 非効率であ る。
さ らに、 一般的には、 あ る言語で記述された情報が他の言語 に翻訳される こ とはそれほど多 く はない。 特に、 多数の言語に 翻訳される こ とは稀である。 このため、 異なる言語を使用する 人々の間での情報の交換には、 自ずと限度がある。
このよう な状況において、 多種多様な言語間でのコ ミ ュニケ ィ シ ョ ンを少ない負担で、 容易かつ正確に行え る システムの開 発が望まれて い る。 ま た、 情報を、 特定の言語に依存せずに蓄 積で き る と 共に、 必要に応 じて、 任意の言語に変換で き る こ と が望まれて い る。 発明の開示 本発明の 目的は、 多種多様な言語間でのコ ミ ュ ニケイ シ ヨ ン を少ない負担で、 容易かつ正確に行え る言語変換シ ス テ ム を提 供する こ と にあ る。
前記目的を達成するため、 本発明の第 1 の態様に よ る言語の 変換を行う シ ス テ ムは、
自然言語に よ る表現と普遍言語に よ る表現と を変換するため に参照される変換規則を、 少な く と も 1 種類の 自然言語対応に 記憶 してい る変換規則部 と、
与え られた 自然言語に よ る表現を、 前記変換規則部に記憶さ れる、 当該自然言語に対応する変換規則を参照 して普遍言語に よ る表現に変換処理する変換処理部 と、
普遍言語に よ る表現を、 前記変換規則部に記憶される、 目的 の 自然言語に対応する変換規則を参照 して、 目的の 自然言語に よ る表現に変換処理する逆変換処理部 と を備え る 。
前記変換規則部は、 対応する 自然言語についての変換規則 と して、
自然言語を構成する 自然言語要素について、 それぞれが有す る情報に対応する、 普遍言語を構成する普遍言語要素で定義 し た普遍語辞書と、
自然言語の文構造に対応 して配列される前記普遍言語要素の 結合関係を規定する と共に、 結合関係を二つの普遍語と それ ら が特定の関係にあ る こ と を示す関係子と を含む二項関係で表記 する ための書替規則 と を有する。
前記変換処理部は、 与え られた 自然言語に よ る表現について 、 当該自然言語に対応する普遍語辞書を参照 して、 当該 自然語 表現を構成する構成要素を、 前記普遍語辞書における対応する 普遍言語要素に書き替え る処理 と、 書き替え られた複数の普遍 言語要素について、 その配列に従っ て、 目 的の 自然言語に対応 する書替規則を適用 して結合させ、 かつ、 前記二項関係で表記 するための規則に従って、 二項関係で表記される普遍言語に よ る表現を生成する処理と を行う 。
前記逆変換処理部は、 二項関係で表記される普遍言語に よ る 表現について、 目的の 自然言語に対応する書替規則を参照 して 、 該規則に含まれる二項関係で表記する ための規則に従って、 結合を構成 してい る各普遍言語要素に分解する処理と、 前記分 解された各普遍言語要素を、 目的の 自然言語に対応する普遍語 辞書を参照 して、 当該自然言語表現を構成する構成要素に書き 替えて、 目 的の 自然言語に よ る表現を生成する。
ま た、 本発明の第 2 の態様に よ る言語の変換を行う シ ス テ ム は、
自然言語に よ る表現と普遍言語に よ る表現と を変換する ため に参照される変換規則を、 少な く と も 1 種類の自然言語対応に 記憶 してい る変換規則部と、 与え られた普遍言語に よ る表現を、 前記変換規則部に記憶さ れる変換規則を参照 して 自然言語に よ る表現に変換処理する逆 変換処理部 と を備え る。
前記変換規則部は、 対応する 自然言語についての変換規則 と して、
自然言語を構成する 自然言語要素について、 それそれが有す る情報に対応する、 普遍言語を構成す る普遍言語要素で定義 し た普遍語辞書と、
自然言語の文構造に対応 して配列される前記普遍言語要素の 結合関係を規定する と共に、 結合関係を二つの普遍語 と それ ら が特定の関係にあ る こ と を示す関係子 と を含む二項関係で表記 する ための書替規則 と を有する。
前記逆変換処理部は、 二項関係で表記される普遍言語に よ る 表現について、 目的の 自然言語に対応する書替規則を参照 して 、 該規則に含まれる二項関係で表記する ための規則に従って、 結合を構成 してい る各普遍言語要素に分解する処理と、 前記分 解された各普遍言語要素を、 目的の 自然言語に対応する普遍語 辞書を参照 して、 当該自然言語表現を構成する構成要素に書 き 替えて、 目的の 自然言語に よ る表現を生成する。 図面の簡単な説明 図 1 は、 本発明において用い られるハー ド ゥエアシステムの 構成の一例を示すプロ ッ ク 図であ る。
図 2 は、 本実施の形態において用い られる、 自然言語に よ る 表現を普遍言語に よ る表現に変換する システムの機能構成を示 すブロ ッ ク 図であ る。
図 3 は、 本発明において用い られる普遍語辞書の構成の一例 を模式的に示す説明図であ る。
図 4 は、 本発明において用い られる変換規則の構成の一例を 模式的に示す説明図であ る。
図 5 は、 普遍言語に よ る表現に基づいて 自然言語に よ る表現 を生成する 言語変換システ ムの構成の一例を示すプロ ッ ク 図で あ る。
図 6 は、 変換および逆変換の両処理が行え る システムの構成 の一例を示すブロ ッ ク 図であ る。
図 7 は、 ネ ッ ト ワーク を介 して情報をや り 取 り する場合に も 適用する こ とがで き るモデルの一例を示す説明図であ る。 発明を実施する ための最良の形態 以下、 本発明の実施形態について、 図面を参照 して説明する 。 本発明は、 自然言語に よ る表現と して英語に よ る表現を用い 、 これに基づいて普遍言語に よ る表現を生成する場合を例 と し て説明する 。 も ち ろん、 種々の言語に基づいて、 普遍言語に よ る表現を生成 し、 ま た、 普遍言語か ら 自然言語に変換する こ と が可能であ る。
本発明において、 表現の生成に用い られる普遍言語は、 基本 的には、 コ ン ピュータ に よ っ て取 り 扱う こ とがで き る と共に、 ネ ッ ト ワーク を介する コ ミ ュニケイ シ ヨ ンに用い る こ と がで き る言語であ る。 従って、 当該普遍言語についての表記は、 コ ン ピュー夕 において取 り 扱い可能な、 数字等の記号であれば足 り る。 しか し、 それを人が理解で き る よ う に表現 して も よ い。 そ れは、 例えば、 普遍語のコ ー ド を特定の 自然言語の表記に対応 付け る こ と で可能とな る。 本実施の形態では、 英語をベース と して普遍語の表記を行う 場合を例 と してい る。 これは、 英語が 広 く 用い られて レ、 る言語であ る こ と、 ま た、 コ ン ピュータ用言 語の表記に も広 く 用レ、 られてい る こ と に よ る。 も ち ろん、 普遍 語の表記は、 英語以外の言語をベース と する こ と も で き る。 ま た、 それ自体を人が理解で き る人工言語に よ る表記と して も よ い o
図 1 に、 本発明の言語変換システムの構成に用い る こ とがで き るハー ド ゥエアシステムの構成例を示す。 このシステムは、 自然言語の表現か ら普遍言語の表現を生成する場合 (変換)、 ま た、 普遍言語の表現か ら 自然言語の表現を生成す る場合 (逆変 換) のいずれについて も使用で き る。 従っ て、 前記変換 と逆変 換と を行う システムを同一のハ一 ド ゥエアシステムで構成する こ とがで き る。 なお、 逆変換は、 普遍言語に よ る表現をいずれ かの 自然言語によ る表現に変換する こ とであ って、 元の 自然言 語に よ る表現に戻すこ と に限定されない。
図 1 では、 一般的に用い られる コ ン ピュータ システム を示 し てい る。 すなわち、 図 1 に示すハー ド ウェアシス テ ムは、 演算 装置 1 0 と、 キーボー ド 2 1 およびマウス 2 2 を有する入力装 置 2 0 と、 表示装置 3 1 および印刷装置 3 2 を有する出力装置 3 0 と、 ハー ドデ ィ ス ク装置等で構成される記憶装置 4 0 と、 ネ ッ ト ワーク との接続を行う ための通信制御装置 5 0 と を有す る。 こ こで、 入力装置 2 0 および出力装置 3 0 は、 それぞれ総 称であ って、 例え ば、 出力装置 3 0 が表示装置 3 1 および印刷 装置 3 2 を備えた装置と い う 意味ではない。
演算装置 1 0 は、 中央処理ユニ ッ ト ( C P U ) 1 1 と、 リ 一 ドオン リ メ モ リ ( R O M ) 1 2 と、 ラ ン ダムアク セ ス メ モ リ ( R A M ) 1 3 と を有する。 C P U 1 1 は、 記憶装置 4 0 にイ ン ス ト ールされたアプ リ ケーシ ョ ン プロ グラ ム を R A M 1 3 に 口 — ド して実行する こ とで、 各種アプ リ ケーシ ョ ンの処理を行う 。 このアプ リ ケーシ ョ ン プロ グラ ムの一つ と して、 本実施の形 態において用い られる普遍言語に よ る表現を生成処理する プロ グラ ム、 および、 普遍言語に よ る表現を 自然言語に よ る表現に 変換する プロ グラ ムがあ る。 これ ら のプロ グラ ム は、 例えば、 C D — R O M、 フ レキシ ブルディ ス ク等の記録媒体に よ り 提供 される。 ま た、 プロ グラ ム を提供す るサーバか ら、 ネ ッ ト ヮ一 ク等を介 して ダウ ン 口一 ド する こ と でも 入手で き る。 本実施の 形態では、 いずれの場合も 、 実行可能な形式に変換 して、 記憶 装置 4 0 に保存 してお く 。
また、 本実施の形態では、 自然言語と普遍言語 との変換を行 う 際に変換規則が用い られる。 この変換規則は、 前記プロ グラ ム と同様に、 記録媒体に記録された状態で提供される。 ま た、 ネ ッ ト ワーク を介 して取得する こ と もで き る。 そ して、 変換規 則は記憶装置 4 0 に保存される。 この変換規則は、 自然言語に 対応 した も のがそれぞれ設け られる。 なお、 構造が類似 してい た り 、 単語に共通部分が多い等の共通性を有する 2 以上の言語 については、 それ ら について、 ま と めて変換規則 を設けて適用 する よ う に して も よい。
図 2 は、 本実施の形態において用い られる、 自然言語に よ る 表現を普遍言語に よ る表現に変換す る システムの機能構成を示 す。 図 2 に示すよ う に、 普遍言語に よ る表現の生成の元 とな る 自然言語に よ る表現がなされたデ一夕 の準備を行う 変換準備処 理部 1 0 0 と、 自然言語に よ る表現を普遍言語に よ る表現に変 換する ために参照される変換規則を、 少な く と も 1 種類の 自然 言語対応に記憶 してい る変換規則部 2 0 0 と、 変換準備処理部 1 0 0 に よ り 与え られた 自然言語に よ る表現を、 変換規則部 2 0 〇 に記憶される変換規則を参照 して普遍言語に よ る表現に変 換処理する変換処理部 3 0 0 と、 生成された普遍言語に よ る表 現を記憶装置 4 0 に記憶させる ための処理を行う 保存処理部 4 0 0 と、 生成処理過程および生成後の表現を出力装置 3 0 に 出 力する処理を行う 出力処理部 5 0 0 と を有する。
変換準備処理部 1 0 0 は、 変換処理部 3 0 0 に対 して元と な る 自然言語に よ り 表現されたデータ を取 り 込む処理を行う 。 取 り 込む処理 と しては、 例えば、 次の処理が挙げられる。 キーボ ー ド 2 1 に よ り 入力された 自然言語に よ る表現を表す文字列デ 一夕 の入力を受け入れる処理があ る。 また、 記憶装置 4 0 に保 持された 自然言語に よ る表現を表す文字列データ を、 記憶装置 4 0 か ら読み出す処理があ る。 さ ら に、 通信制御装置 5 0 を介 して受信 した文字列データ を取 り 込む処理があ る。
前記変換規則部 2 0 0 は、 自然言語を構成する 自然言語要素 について、 それぞれが有する情報に対応す る、 普遍言語を構成 する普遍言語要素で定義 した普遍語辞書 2 1 0 と、 自然言語の 文構造に対応 して配列される前記普遍言語要素の結合関係を規 定す る と共に、 結合関係を二つの普遍語と それ ら が特定の関係 にあ る こ と を示す関係子 と を含む二項関係で表記する ための書 替規則 2 2 0 と を有する。 これ ら は、 いずれも、 記憶装置 4 0 に格納され る。 なお、 普遍語辞書 2 1 0 と書替規則 2 2 0 と は 、 本実施の形態では区別 して扱って い る。 しか し、 本発明は、 それに限ら れない。 例えば、 普遍語辞書 2 1 0 と書替規則 2 2 0 と を区別せずに、 全体と して一つの書替規則 と する こ と も で き る。 また、 普遍語辞書 2 1 0 と書替規則 2 2 0 と をそれぞれ さ ら に細分化する こ と も で き る。
普遍語辞書 2 1 0 は、 自然言語の構成要素対応に、 普遍言語 で用い られる記号で表記された普遍言語要素の集合で構成され る。 普遍言語要素 と しては、 対応す る 自然言語の構成要素が表 す意味を特定する情報、 および、 対応する 自然言語の構成要素 についての評価を特定する情報の う ち、 少な く と も 一方の情報 が表記される。 ま た、 各普遍言語要素には、 それぞれ当該普遍 言語要素が対応する 自然言語におけ る文の要素のいずれに相当 するかを示す文要素記号が付記される。 図 3 に普遍語辞書の構 成の一例を模式的に示す。 図 3 に示す例では、 も ち ろん、 辞書 要素のほんの一部を示すに過ぎない。
普遍語辞書は、 図 3 に示す例では、, a(" .@in def") , D E T '、, m an ("p erson ") , N, のよ う に記載されてい る。 すなわち、
X ( " Υ,,), Ζ
の形式で記載されてい る。 こ こで、 Xには 自然言語の要素、 本 実施の形態では、 英語における要素が記載される。 上述の例で は、, a,、, m a n ' がこれに当たる。
自然言語の要素の多 く は、 単語である。 も ち ろん、 単語以外 の要素についても記載でき る。 例えば、 同 じ綴 り を有する要素 であっても、 意味が異なる場合には、 それぞれについて定義さ れる。 また、 同じ動詞であっても、 不規則変化動詞の場合では 、 原形、 過去および過去分詞をそれぞれ独立の要素 と して扱う ο
さ ら に、 こ こ に記載される要素は、 独立した単語に限られな い。 例えば、 語幹、 接尾辞等の部分も対象となる。 この場合、 それぞれの要素について、 その性質を示す情報と して付加する 。 例えば、 時制を示す情報、 複数形を示す情報等を付加する。 また、 規則変化動詞の場合、 語幹と接尾とに分け、 それぞれを 独立の要素と して定義する。 図 3 に示す ' ask ' と、 ' e d ' とが 、 語幹とその接尾語に相当する。 なお、 ' e d ' は、 他の動詞に ついて も結合される。 また、, e d ' は、 名詞の語尾に付加され るこ とで、 当該名詞を形容詞と して機能させる こ とがで き る。 この場合には、 前記動詞の語尾とは別の性質を有する接尾語と して定義される。
Yには、 対応する 自然言語の構成要素が表す意味を特定する 情報、 および、 対応する 自然言語の構成要素についての評価を 特定する情報のう ち、 少な く と も一方の情報が表記される。
意味を特定する情報と しては、 前述の例では、 ' p erson ' が これに当た る。 も ちろん、 意味を特定する情報であるか ら、 名 詞には限られず、 動詞、 形容詞等が記載で きる。 また、 評価を特定する情報と しては、 上述 した例では、 ' .@ indef がこれに 当 た る。 すなわち、 不定冠詞 と して名詞の性質 を特定 してお り 、 意味を特定する情報と いえ る。 本発明では、 これ ら を属性子と称する こ と と する。
意味を特定する情報には、 時制、 意思、 理由、 事象の性質等 の、 種々の特徴を表す情報が記載で き る。 ま た、 対象の状態に 応 じて複数種の情報が、 例えば、 カ ンマ等で区切る こ とで併記 で き る。 例え ば、 図 3 に示す英語の単語であ る , question ' に つ い て は 、 二項 関 係 で 定義 が な さ れ て い る 。 す な わ ち 、 ' question("question(icl>thing)") と g己載される。 これは、 英 §吾 の ' question ' は普遍語において ' question , と表言己される こ と を定義 してい る 。 ま た、 普遍語の, question , は、, (icl>thing) , と いう性質を持つこ と を定義 して い る。 この, (icl>thing) 5 は、 概念に関する記号であ る。, question , は, thing ' と い う概念に含まれる こ と を定義 してい る。 こ こで、, thing ' は、 普遍語におけ る事物の概念を示す。
また、 Y には、 意味を特定する情報と、 その評価を特定す る 情報と を、 例えば、 カ ンマ等で区切って併記する こ とがで き る
Z には、 前述 した文要素記号が付記される。 上述 した例では 、' DET'、' N' がこれに当た る。 文要素記号は、 自然言語にお け る、 例えば、 品詞を示す情報に相当 する 。 例え ば、 ' DET ' は、 決定詞を意味 し、 冠詞等の、 対象とな る名詞の性質を決定 する文要素であ る こ と を示す記号であ る。' N' は、 名詞を意味 する文要素であ る こ と を示す記号であ る。, VTSTM 5 は他動詞 の語幹であ る こ と を示す記号であ る 。' ENDING' は接尾要素 であ る こ と を意味する記号であ る。
書替規則 2 2 0 は、 図 4 において示す番号 1 〜 1 0 の よ う に 、 自然言語の文構造に対応 して配列される前記普遍言語要素の 結合関係を規定する。 例えば、 同図におけ る番号 1 では、 文 S が、 主部 と な る NPと、 述部とな る VPと を有 し、 これ ら が、 agt と い う 関係子で結合される関係にあ る こ と を示 してい る。 番号 2 では、 VPが、 他動詞 と な る VTと、 名詞句 とな る NPと を有 し 、 これら が objと い う 関係子で結合される 関係にあ る こ と を示 し てい る。 なお、 関係子については後述する。
次に、 番号 3 では、 名詞句に相当する NPが DETと が結合する 関係にあ る こ と を示 してい る。 番号 4 では、 他動詞に相当す る VTが、 VTSTMと ENDINGとが結合す る関係にあ る こ と を示 し てい る。
次に、 番号 5以降では、 番号 1 〜 4 とは規則の規定の仕方が 異な る。 例えば、 番号 5 では、 DETは、 ' a(".@indef"), に対 し て , DET(".@indef"), のよ う に、 自然言語の要素の部分を除い て結合す る こ と を示 してい る。 6番以降も 同様であ る。
上述 した普遍語辞書 2 1 0 および書替規則 2 2 0 は、 本発明 では、 自然言語の表現か ら普遍言語の表現を生成する場合に用 い られるが、 普遍言語の表現か ら 自然言語の表現を生成する場 合にも 同 じ変換規則を用い る こ とがで き る 。 普遍語辞書 2 1 0 および書替規則 2 2 0 を用いて、 普遍語に よ る表現を どのよ う に生成するかに付いては後述する。
変換処理部 3 0 0 は、 与え られた 自然言語に よ る表現につい て、 前記普遍語辞書を参照して、 当該自然語表現を構成する構 成要素を、 前記普遍語辞書における対応する普遍言語要素に書 き替え る普遍言語要素書替処理 3 1 0 と、 書き替え られた複数 の普遍言語要素について、 その配列に従って前記書替規則を適 用 して順次結合させ、 かつ、 前記二項関係で表記するための規 則に従って、 二項関係で表記される普遍言語によ る表現を生成 する二項関係生成 3 2 0処理とを行う 。 この変換処理は、 主と して演算装置 1 0 においてプロ グラ ムを実行する こ とで行われ る。
保存処理部 4 0 0は、 演算装置 1 0 において処理された結果 を記憶装置 4 0 に記憶させる処理を行う 。 この処理は、 演算装 置 1 0 によ り行われ、 記憶装置 4 0がこの処理の応答して演算 装置から出力されるデ一夕 を記憶する。 デ一夕は、 必要に応 じ て読み出される。
出力処理部 5 0 0は、 入力されたデータ、 処理結果等を表示 装置 3 1 に表示させた り、 印刷装置 3 2 において印刷させた り する処理を行う。 表示と印刷とは別個に処理される。
次に、 本発明の特徴点である二項関係について説明する。 本 発明において用い る二項関係は、 次の式で定義される。
【式 1 】
<二項関係 > ::= <関係子 > ["··"<複合普遍語 ID>]
"(" {<普遍語 1〉 I ":" <複合普遍語 ID1>} "," {<普遍語 2> I ":" <複合普遍語 ID2〉} ")"
こ こで、 :: = は、 …が…と定義される こ とを表す
I は、 離接、 "または" を表す [ ] は、 任意的に追加可能な要素を示す
{ } は、 選択要素を示す
" " は、 文字 · 記号が入る こ と を示す
< XXX >は、 変数名 上記式を用い る と、 種々の表現が正確に行え る。 例えば、 an
Figure imgf000017_0001
, easily)
and(Mary (icl>per son) , John (icl>p er son))
な どが簡単な例 と して挙げられる。 前者は、 速 く かつ簡単にの 意味を表す。 後者は、 メ ア リ と ジ ョ ンの意味を表す。 こ こ で、 ( ) の記号は、 要素について ( ) 内に記述される束縛があ る こ と を示す。 これについては、 普遍語に関する説明の際に述 ベる。
複合普遍語は、 複合概念を表すために集め られた二項関係の 集合であ る。 複合普遍語 I D は、 その複合普遍語の集合に属す る二項関係を識別する ための識別子であ る。 この識別子を特定 する こ とで、 複合普遍語を普遍語と して用い る こ と がで き る。 複合普遍語 I D は、 例えば、 大文字アルフ ァベ ッ ト 、 ま たは、 2桁の数値で表すこ と と する。
なお、 普遍語について も、 後述す る式 6 に示すよ う に、 普遍 語 I D を用い る こ とで、 同一内容の表現の参照を行う こ とがで き る o
二項関係は、 普遍言語に よ る表現、 すなわち、 文のかたま り であ る。 二項関係は、 二つの普遍語と関係 とで構成される。 普 遍言語において、 二項関係は、 予め定義され、 関係子と呼ばれ る 3 文字以下の記号で規定される。 普遍言語間の関係は、 それ らの普遍言語の振る舞いに応 じて異な り 、 対応する関係子 agt 、 and, aoj、 obj、 icl等が用い られる。 関係子は、 予め定義さ れている。 例えば、 次のよ う なものがある。
一関係子一
agt 事象を引 き起こすもの
and 概念間の連結関係
aoj 属性を もつもの
bas 比較の基準や程度をあ らわすもの
cag 暗示的な事象を引 き起こすもの
cao 暗示的な属性をもつもの
cnt 等位概念
cob 暗示的な事象の対象
con 焦点の当た っている事象や状態に影響を与え る事 象や状態
COO 焦点のあたっている事象や状態と同時並行に起こ る事象や状態
dur 事象や状態が起こ ってい る時間
fmt 2 つのものの間の範囲
frm ものの原点
gol 対象あるいは対象に関連する ものの最終状態 ins 事象を遂行するための道具
man 事象の遂行の仕方あるいは状態の性質
met 事象を遂行するための手段
mod 焦点の当たっている ものを制限するもの nam ものの名前
obj 事象に よ って直接影響を受ける焦点のあた って い る も の
or 概念間の選択関係
per 基準単位
pic 事象の起こ る場所あ るいは状態が存在する場所 lf 事象が始ま る場所あ るいは状態が存在 し始める場 所
pit 事象が終わ る場所あ るいは状態が存在 しな く な る 場所
pof 全体 · 部分関係
pos も のの所有者
ptn 事象を一緒に引 き起こす焦点のあた っていない も の
pur 事象あ るいはものが存在する 目的
qua も のあ る いは単位の量
r sn 事象あ る いは状態がおこ る理由
sen 事象が起こ る場面
seq 焦点のあた ってい る事象や状態に先立つ事象や状 態
src 対象あ る いは対象に関連する も のの開始状態 tim 事象が起こ るあ る いは状態が成立する時間
tmf 事象が始ま るあいは状態が成立 し始ま る時間 tmt 事象が終わるあ る いは状態が成立し終わ る時間 to ものの終点 via 事象の経由点あ るいは経由状態
次に、 本発明において用 い る普遍語について説明する。 普遍 語は、 次式で定義される。 なお、 式の表記上約束は式 1 と 同 じ であ る。
【式 2 】
<普遍語 > :: = <見出 し > [<束縛 リ ス ト >]
[ ":" <普遍 ID>] [ "." く属性 リ ス ト〉]
<見出 し >は、 文字列で構成される。 例えば、 buy、 book等が 挙げられる 。 普遍語は、 コ ン ピュータ が取 り 扱う こ と がで きれ ば足 り るので、 必ずしも人が読め る形で表現されてい る必要は ない。 しか し、 人が読み得 る形で定義する方が便利であ る ため 、 本実施の形態では、 上述 した よ う に英語をベース と して普遍 語を定義 してい る。 他の言語、 例えば、 日本語で定義 して も 差 し支えない。
ま た、 普遍語は、 定義式の形式か ら も 明 らかな よ う に、 最も 簡単な場合、 見出 しのみで構成される場合があ り 得る。
一般的には、 言語要素は、 種々の束縛を受ける。 そ こで、 本 実施の形態では、 1 以上の束縛を束縛 リ ス ト と して ( ) に表 してい る。 複数の束縛を併記する こ と がで き る。 その場合、 力 ンマで区分する。 束縛 リ ス ト は、 次のよ う に定義される。
【式 3 】
<束縛 リ ス ト > :: = "(" <束縛 > [ "," <束縛 > " ")" こ こで、 …は、 そのも のが 1 以上出現する こ と を意味する 前述した束縛 リ ス ト に挙げられる束縛は、 次の よ う に定義さ れる。
【式 4 】
<束縛〉::= <関係子〉 { ">" I "<" } <普遍語 > [く束縛リス ト >] I
<関係子 > { ">" I "<" }く普遍語 > [<束縛リ ス ト >]
[ { ">" I "<" } <普遍語 > [く束縛リス 卜 >】】 … こ の よ う に 、 普遍語に は、 束縛を受けない基本普遍語と、 何 ら かの束縛を伴う制限普遍語と、 特別の制限普遍語と があ る
。 基本普遍語には、 英語で例示する と、 ' go、 take, house' 等 があ る。 一方、 制限普遍語には、 前述 した定義で表される種々 の普遍語があ る。 その例 と して , state' について、 4 つの異な る束縛を伴う場合を示す。
state ( agt>person,obj>iniorinatioiiリ
state equ>nation )
state ( icl>situationリ
state ( icl>government)
ま た 、 特別 の制限普遍語 と し て は、 例 え ば、 次の よ う な 例が挙げ ら れ る 。
ikeb an a (
Figure imgf000021_0001
flowers)
samba v icl>dance )
さて、 前述した性質を特定する情報と して、 属性があ る。 こ の属性は、 次の式で定義される。
【式 5 】
<属性 リ ス ト > :: = <属性子 > [ "·" <属性子 > " 普遍言語における属性は、 普遍言語では、 過去、 現在、 未来 等の、 話者に関する時間、 急 ぐかどう か等の状況についての話 者の見方、 共通の話題に関するもの等の話者の参考的見解、 話 者が注目する転等に関する話者の焦点、 話者の関心への強度、 話者の見解等に関する ものが挙げられる。 代表的には、 次に挙 げる ものが定義される。
—属性子—
©ability で き る
@ability-p ast で きた
Figure imgf000022_0001
ture で き るだろ う
©afnrniative 冃疋
(^aDoaosis-cona 条件帰結
@apodosis-reai 現実帰結
@apodosis-unreal 非現実帰結
@begin-just
@begin-soon 開始直前
©complete 完了
©conclusion ilip δ冊
©confirmation 確認
©custom 習慣
@def 特定
©emphasis 強調
@end-just 終了直後
@end-soon 終了直前 ©entry 焦点
©exclamation 感嘆
©expectation 期待
©future 未来
©generic 総称
©grant 許諾
@grant-not 不承認
@indef 不特定
©imperative 命令
@inevit ability 必然
©insistence
©intention 意図
©interrogative 質問
©invitation 勧誘
@m ay 許可
@not 否定
©obligation
©obligation - not 義務な し ©ordinal 序数
©past 過去
©politeness 手
@p ossibility 可能 ©present 現在 ©probability 蓋然 ©progress 進行 @qfocus 疑問の焦点
©re eat 反復
©respect 尊敬
©should 当妖
@state 残存状態
©theme ァ一マ
©topic
©unexpectation 予想外
©will 意思
次に、 普遍語 IDは、 例えば、 参照可能な表記があ る場合、 同 一の表現があ る場合等において、 対象を特定する ために、 アル フ ァベ ッ ト 、 数字等で識別する場合に用い られる。 次の よ う に 疋 我 c れる。
【式 6 】
<普遍語 ID> :: = {<アル フ ァ べ ッ ト 大文字 > | <数字 >}
{<アル フ ァ べ ッ ト 小文字 > 1<数字 >} 本実施の形態において用い られる二項関係を示す文字、 数字 、 記号 と しては、 アルフ ァベッ ト 大文字および小文字、 数字の 他、 次のよ う な記号を用い る こ と がで き る 。
【式 7 】
"_" I I "#" I "!" I "$" I "%" I "=" I "Λ" I "-" I Ί" I "@" I
"+,, I "." I "<" I ">" I "?"
次に、 本発明に よ る、 普遍言語に よ る表現の生成の具体例に ついて説明する。 以下の例では、, The man asked a question
' と い う 英語表現 (文) について普遍言語に よ る表現 (文) を 生成す る場合について説明する。 生成には、 図 3 に示す普遍語 辞書と図 4 に示す変換規則 と を用い る。 こ こで、 普遍言語の生 成に際 しては、 図 4 の書替規則を右か ら左に適用する。 すなわ ち、 書替規則に示されてい る→の向 き とは反対の方向に適用す る。 なお、 普遍言語か ら 自然言語への変換は、 矢印の向 きに行
Ό。
演算装置 1 0 は、 変換対象と な る文であ る ' The man asked a question' を変換準備処理部 1 0 0 を介 して R A M I 3 に取 り 込む。 今の例では、 キーボー ド 2 1 を介 して入力された も の と する。 さて、 演算装置 1 0 の C P U 1 1 は、 入力された英文 の最初の単語について普遍語辞書 2 1 0 を検索す る。 そ して、 , the(".@def") , DET, が索出され る。 そ こ で、 図 4 におけ る 書替規則 6 を適用 して、 次の結果を得る。
【式 8 】
DET(". @def") man asked a question 次に、 C P U 1 1 は、 前記英文の次の単語, man, について 普遍語辞書 2 1 0 を検索す る 。 そ して、 ' man("person"), Ν' が索出される。 そ こで、 図 4 におけ る書替規則 8 を適用 して、 次の結果を得る。
【式 9 】
DET(".@def") N /"'person") asked a question 次に、 C P U 1 1 は、 前記英文の次の単語 ' asked' につい て普遍語辞書 2 1 0 を検索す る。 そ して、, ask("ask(icl>do)") , VTSTM ' が索出される。 そ こで、 図 4 におけ る書替規則 9 を 適用 して、 次の結果を得る。
【式 1 0 】
DET(".@def') N("person") VTSTM("ask(icl>do)") ed a question 次に、 C P U 1 1 は、 前記英文の前記単語, asked ' の語尾 ' ed ' に つ い て 普遍語辞書 2 1 0 を 検索 す る 。 そ し て 、 ' ed(".@past"), ENDING' が索出され る 。 そ こ で、 図 4 におけ る書替規則 1 0 を適用 して、 次の結果を得る。
【式 1 1 】
DET(".@def) N("person") VTSTM("ask(icl>do)")
ENDING(".@past") a question 次に、 C P U 1 1 は、 前記英文の次の単語 ' a ' について 普 遍語辞書 2 1 0 を検索する。 そ して、 ' a(".@def"), DET' が索 出される。 そ こで、 図 4 における書替規則 5 を適用 して、 次の 結果を得る。
【式 1 2 】
DET(".@def") N("person") VTSTM("ask(icl>do)")
ENDING(".@past") DET(".@indef") question 次に、 C P U 1 1 は、 前記英文の次の単語の, question' に ついて普遍語辞書 2 1 0 を検索する。 そ して、, question' が索 出される。 そ こで、 図 4 における書替規則 7 を適用 して、 次の 結果を得る。
【式 1 3 】
DET(".@def) N("person") VTSTM("ask(icl>do),,)
ENDING(".@past") DET(".@indef) N("question(icl>thing)") 次に、 C P U 1 1 は、 前記英文について ' question' 後に単 語がない こ と を確認する と、 辞書検索を中止する。 そ して、 書 替結果についてさ ら に書き替え る処理を行う 。 英文における検 索単語が最後とな っ た と判断する ためには、 ピ リ オ ド、 ク エス チ ョ ンマーク、 コ ロ ン等の存在に基づいて行う よ う に して も よ い o
さて、 こ の後、 C P U 1 1 は、 書替規則 1 か ら 4 を用いて書 替をさ ら に進める。
C P U 1 1 は、 前記書替結果の先頭か ら文要素記号を読み出 し、 先頭か ら隣接する文要素記号間の関係を図 4 に示す書替規 則を参照 して決定する。 例えば、 前記書替結果の場合には、 先 頭か ら、, DET、 N、 VTSTM、 ENDING, DET、 N, の順に配置 文要素記号が並ぶ。 そ こで、 ま ず、 ' DET, および, N, につい て、 書替規則 3 を適用 して、, NP("person.@def")' を得 る。 そ の結果、 次の結果を得る。
【式 1 4 】
NP("person.@def) VTSTM("ask(icl>do)") ENDING(".@past") DETf".@indef) N("question(icl>thing)") 次に、 C P U 1 1 は、 ' VTSTM' と ' ENDING' について、 書替規則 4 を適用 して、, VT("ask(icl>do).@past"), を得 る 。 その結果、 次の結果を得る。
【式 1 5 】
NP("person.@def) VT("ask(icl>do).@past") DET(".@indef) N("question(icl>tning)") 次に、 C P U 1 1 は、, DET, と , N, について、 書替規則 3 を適用 して、 ' NP("question.@indef"), を得 る。 その結果、 次 の結果を得 る。
【式 1 6 】
NP("person.@def) VT("ask(icl>do).@past")
NP("question.@indef) 次に、 P C U 1 1 は、 最後尾側には、 書 き替え るべき対象が ない と判断する。 そ こで、 C P U 1 1 は、 文要素記号を読み出 し、 先頭か ら隣接する文要素記号間の関係を図 4 に示す書替規 則を参照 して決定する。 例えば、 前記書替結果の場合には、 先 頭か ら、 ' NP,、' VT\ ' NP' の順に配置文要素記号が並ぶ。 こ こで、 先頭側にあ る ' NP, と , VT' には、 書替規則が適用 で きない。 そ こで、 C P U 1 1 は、 まず、 ' VT ' と ' NP ' につ いて、 書替規則 2 を適用 して、 次の結果を得 る。
【式 1 7 】
NP("person.@def)
VP("ask(icl>do)(obj>question.@indef).@ ast") さ ら に、 C P U 1 1 は、 前記書替結果に含まれる文要素記号 を読み出 して、 これに規則 1 を適用する。 その結果、 次の結果 を得る。
【式 1 8 】
S("ask.@entry(a2't>person.@def,obi>question.@indei ) 以上に よ り 、 普遍言語に よ る表現が生成された こ と と な る。 この普遍言語は、 次のよ う に解釈する こ とがで き る 。 すなわち 、 普遍言語 ' ask' が自然言語 ' ask' の意味を表す と共に、 属 性子, @entry' の存在か ら話者の焦点が, ask, に 向いて い る 。 普遍言語 ' ask ' には束縛があ り 、 その束縛の内容は、 ' ask , と い う 事象を引 き起こ すも の( agt)が特定( .@def) の, person ' であ り 、 事象に よ っ て直接影響 を受け る も のは、 不特定 ( .@indef) の, question' であ る とい う こ と を意味する。
この普遍言語に よ る表現は、 構成要素を見る と 明 ら かな よ う に、 自然言語の構成要素を含んでいない。 従っ て、 一旦得 られ た普遍言語に よ り 、 自然言語を生成する場合に、 変換すべき言 語に対応 した前記変換規則があれば、 任意の言語か らの、 ま た は、 任意の言語に、 それぞれ変換可能とな る。
以上の例で用いた普遍語辞書および変換規則について示 した 部分は、 全体のほんの一部に過ぎない。 例えば、 普遍語辞書は 、 その語彙は、 およそ 1 0 0 万語程度用意される。 なお、 本発 明を特定の用途に特化 して用い る場合には、 語彙数は少な く て すむ。 次に、 普遍言語に よ る表現に基づいて 自然言語に よ る表現を 生成する言語変換システム について、 図 5 を参照 して説明する 前述 した 図 2 に示す言語変換シス テム と、 図 5 に示す言語変 換システ ム と を組み合わせる こ とで、 自然言語一普遍言語— 自 然言語の形式でコ ミ ュニケイ シ ヨ ン を取る こ とで、 言語の相違 を回避する こ とが可能と な る。
図 5 に示す言語変換システムは、 自然言語に よ る表現を普遍 言語に よ る表現に変換する ために参照され る変換規則を、 少な く と も 1 種類の 自 然言語対応に記憶 して い る変換規則部 2 0 0 と、 与え ら れた普遍言語に よ る表現を、 前記変換規則部に記憶 される変換規則を参照 して 自然言語に よ る表現に変換処理す る 逆変換処理部 3 5 0 と を備え る。
前記変換規則部 2 0 0 は、 前述 した図 2 に示すも の と 同様の 構成であ る 。 出力 を 目的と した 自然言語に対応 した変換規則が 用意される 。 変換規則部 2 0 0 については、 既に述べたので説 明を繰 り 返さない。
前記逆変換処理部は、 二項関係で表記される普遍言語によ る 表現について、 目的の自然言語に対応する書替規則を参照 して 、 該規則に含まれ る二項関係で表記する ための規則に従って、 結合を構成 してい る各普遍言語要素に分解する二項関係分解処 理 3 6 0 と、 前記分解された各普遍言語要素を、 目的の 自然言 語に対応す る普遍語辞書を参照 して、 当該 自然言語表現を構成 する構成要素に書 き替えて、 目的の 自然言語に よ る表現を生成 する 自然言語要素変換処理 3 7 0 と を有する。 この逆変換処理 は、 主と して演算装置 1 0 において プロ グラ ム を実行す る こ と に よ り 行われる。
保存処理部 4 0 0 および出力処理部 5 0 0 は、 前述 した も の と同様であ る。 ただ し、 保存処理部 4 0 0 では、 普遍言語に よ る表現を記憶装置 4 0 か ら読み出 して、 逆変換処理部 3 5 0 に 渡す処理を行う 。
次に、 本発明に よ る普遍言語表現を 自然言語に よ る表現に変 換する処理について説明す る。
この逆変換では、 二項関係で表現されて い る普遍語の表現に ついて、 図 3 および図 4 に示す変換規則を用い る 。 こ こ で、 自 然言語表現の生成に際して は、 図 4 に示す書替規則を左か ら 右 に適用する 。 すなわち、 書替規則に示されてい る矢印の向 き に 規則を適用する。
こ こでは、 次の式 1 9 の二項関係で表現されて い る普遍語表 現について 自然言語に よ る表現に逆変換処理する場合について 説明する。 なお、 以下に示す式 1 9 の表現は、 前述 した式 1 8 の表現と 同 じであ る。 も ち ろん、 任意の表現について逆変換可 能であ る。 また、 以下では、 演算装置 1 0 の C P U 1 1 が変換 規則部 2 0 0 の書替規則 2 2 0 および普遍語辞書 2 1 0 のいず れかを検索 してそれぞれ該当する結果を索出する こ とで処理を 進める。 従って、 以下では、 検索過程に関する記述は省略す る
【式 1 9 】
S("ask.@entrv(agt>person.@dei,obj>question.@indef) 演算装置 1 0 の C P U 1 1 は、 次の式 1 9 二項関係で表現さ れて い る普遍語表現について、 規則 1 を適用 して、 ' S' を , NP ' と ' VP ' と に分解 して、 次の結果を得る。
【式 2 0 】
NP("person.@def,)
VP("asK(ici>do)(obj>question.@indef).@ ast") 次に、 C P U 1 1 は、 前記結果について、 規則 3 を適用 して 、 NP("person.@def")を分解 して、 DETと Nに分解 して、 次の結 果を得る。
【式 2 1 】
DET(".@def,) N("person")
VP("ask(icl>do)(obj>question.@indef).@past") 次に、 C P U 1 1 は、 前記結果について、 規則 5 を適用 して 、 ' DET(".@def")' を ' The' に書き替えて、 次の結果を得る 。 【式 2 2 】
The N("person") VP("ask cl>do)(obj>question.@indef).@past") 次に、 C P U 1 1 は、 規則 8 を適用 して、 ' N("person"), を ' man' に書き替えて、 次の結果を得る。
【式 2 3 】
The man VP(' ask(icl>do obj>question.@indef).@past ) 次に、 C P U 1 1 は、 規則 2 を適用 して、, VP5 を , VT, と ' NP' と に分解 して、 次の結果を得る。
【式 2 4 】
The man VT("ask(icl>do).@past") NP("question.@indef) 次に、 C P U 1 1 は、 規則 4 を適用 して、, VT, を, VTSTM , と , ENDING' と に分解 して、 次の結果を得る。
【式 2 5 】
The man VTSTM("ask(icl>do)") ENDING(".@past")
NP("question.@indef) 次に、 C P U 1 1 は、 規則 9 を適用 して、 ついで、 規貝 iJ 1 0 を適用 して、 次の結果を得 る。
【式 2 6 】
The man asked NP( "question. @indef") 次に、 C P U 1 1 は、 規則 3 を適用 して、, NP, を , DET N ' に分解 して、 次の結果を得る。
【式 2 7 】
The man asked DET(".@indef ') N("question(icl>thing)") 次に、 C P U 1 1 は、 規則 5 を適用 して、 ついで、 規則 7 を 適用 して、 次の結果を得る。
【式 2 8 】
The man asked a question 以上に よ り 、 自然言語であ る英語に よ る表現が生成される。 本実施の形態では、 自然言語と して英語の例を挙げたが、 これ に限 られな い。 日 本語、 フ ラ ンス語、 中国語等種々の言語に対 応可能であ る。
次に、 本発明の他の実施形態 と して、 変換および逆変換の両 処理が行え る シス テムの例について説明す る。
本実施の形態では、 前述 した図 2 および図 5 に示すも の とは 異な り 、 図 6 に示すよ う に、 変換お よび逆変換が行え る変換/ 逆変換処理部 3 9 0 を備えてい る。 この変換/逆変換処理部 3 9 0 は、 普遍言語要素変換処理 3 1 0 と、 二項関係生成処理 3 2 0 と、 二項関係分解処理 3 6 0 と、 自然言語要素変換処理 3 7 0 と を有する。 普遍言語要素変換処理 3 1 0 と、 二項関係生 成処理 3 2 0 と、 二項関係分解処理 3 6 0 と、 自然言語要素変 換処理 3 7 0 とは、 それぞれすでに述べた図 2 および図 5 に示 すシステム と 同様に機能するので、 重複する説明は省略する。
変換規則部 2 0 0 は、 自然言語に対応 した 1 種以上の変換規 則を有する。 変換規則部 2 0 0 についてはすでに述べたので、 重複した説明は省略する。
こ こで、 変換規則部 2 0 0 が、 例えば、 英語に対応する変換 規則を有す る場合には、 英語と普遍言語 と の間の相互変換が行 え る こ と にな る。 ま た、 英語、 ドイ ツ語、 中国語および日本語 のそれぞれについての変換規則を有する場合には、 これ らのう ち、 いずれの言語に よ って入力された と して も、 同 じ内容の文 が入力されたのであれば、 同一の普遍言語に よ り 表現される文 が得 られる。 そ して、 この一つの、 普遍言語に よ り 表現される 文を基に、 英語、 ド イ ツ語、 中国語および日本語でそれぞれ表 現される 同一内容の文が得 られる。
上記図 6 に示す例は、 同一のハー ド ウェ アシ ス テ ムに よ り 言 語の変換、 逆変換を行う 例を示 した。 しか し、 本発明は、 これ に限 られな い。 例えば、 ネ ッ ト ワーク を介 して情報をや り 取 り する場合に も適用する こ と がで き る 。 図 7 は、 その場合の一つ のモデルを示す。
図 7 に示すモデルでは、 ネ ッ ト ワーク N を介 して送 られ る普 遍言語で表現されるデ一夕 を蓄積す る と と も に、 要求に応 じて 普遍言語表現データ をネ ッ ト ワーク に送 り 出す普遍言語表現デ —夕蓄積サ S 1 と、 ネ ッ ト ワーク Nを介して送 られる、 自 然言語に よ り 表現されるデ一夕 を普遍言語に よ り 表現される デ 一夕 に変換 して、 ネ ッ ト ワーク Nに送信す る言語変換サーバ S 2 と、 ネ ッ ト ワーク Nを介 して送られる、 普遍言語に よ り 表現 されるデータ を 自然言語に よ り 表現される データ に変換 して、 ネ ッ ト ワーク Nに送信する 言語逆変換サーバ S 3 と、 自然言語 と して英語に よ り 表現されるデータ をネ ッ ト ワーク に出力す る 英語表現出力端末 T 1 と、 自然言語 と して 日本語に よ り 表現さ れるデ一夕 をネ ッ ト ワーク に出力する 日本語表現出力端末 T 1 と、 普遍語表現出力端末 T 3 と が、 ネ ッ ト ワーク Nに接続され てい る。
こ こ で、 端末 S 2 には、 図 2 に示すシ ス テ ム を用い る こ と が で き る。 ま た、 端末 S 3 には、 図 5 に示すシステムを用い る こ と がで き る。 なお、 図 7 のモデルでは、 図示 して いないが、 図 6 に示すシステム を用いたサーバを接続する こ と も で き る。 普遍言語表現データ蓄積サーバ S 1 は、 オ リ ジナルデ一夕 が いかな る 自然言語で記述さ れていて も、 すべて同一形式の普遍 言語で表現される状態でデータ を蓄積する 。 そ して、 この普遍 言語で表現される データ を原本とす る こ と で、 バ一ジ ョ ン管理 等も一箇所で行え る。 ま た、 複数種の言語で表現された種種の デ一夕 を重複 して保存する こ とがないので、 データ サーバと し て も効率的 と いえ る。
一方、 サーバ S 2 および S 3 の存在に よ り 、 普遍言語への変 換に対応 して い る 自然言語を用い る限 り 、 自 国語でコ ミ ュニケ イ シ ヨ ン を と る こ とが可能 とな る。 しかも 、 国際的な協力の下 で、 種々の 自然言語に対応に変換規則を作成する こ とで、 種々 の言語に対応で き る言語変換サーバ S 2 お よび言語逆変換サー ノ S 3 を実現する こ とがで き る。 したがっ て、 あ ま り 翻訳され ない言語を使用す る人々 に対して も 、 種々の言語をオ リ ジナル とする情報に、 母国語で触れる こ と が可能 と な る。 その結果、 国際的交流が円滑に行え る利点があ る。
このよ う に、 以上に述べた各実施の形態に よれば、 それぞれ の 自然言語に対応する変換規則を用意する こ とで、 いずれの 自 然言語について も 、 普遍言語に よ る表現が可能と な る。 しか も 、 普遍言語は、 元にな る 自 然言語の要素、 文法の影響を受けな い形で表記される ため、 あ る言語か ら他の言語に情報を伝達す る とい っ た場合に、 すべて普遍言語に よ る表現と する こ とで、 情報の国際的伝達、 効率的な蓄積が可能と な る。 ま た、 翻訳情 報の少ない言語について も 、 英語と 同様に、 使用言語の異な る 多 く の人々 に、 それが表す内容を、 低いコ ス ト で、 容易に伝達 する こ とが可能と なる。
ま た、 本発明の普遍言語は、 それを 自然言語に変換で き る た め、 逆変換 した表現をチ ェ ッ ク する こ とで、 普遍言語表現が元 の 自然言語表現を正確に伝えてい るかを容易に確認する こ と が で き る。 したがっ て、 普遍言語に よ る表現を正確な もの と す る こ と が可能であ る。 そ して、 普遍言語は、 二項関係を用いて明 確に記述される ため、 普遍言語か ら 自然言語への変換は正確に 行え る。 その結果、 普遍言語に よ る表現を原本と する こ とが、 国際的に同 じ情報を伝達する際に役立つ と いえ る。
なお、 上述した例では、 自然言語について述べたが、 本発明 は、 厳密には 自然言語とはいえない言語、 例えば、 エス ペラ ン ト語等の人工言語、 コ ン ピュータ 言語等の機械用言語に よ る表 現についての適用 も可能であ る。
本発明に よれば、 多種多様な言語間でのコ ミ ュ ニケイ シ ヨ ン を少ない負担で、 容易かつ正確に行え る効果があ る。

Claims

請求の範囲
1 . 言語の変換を行う システムであ っ て、
自然言語に よ る表現と普遍言語に よ る表現と を変換す る ため に参照され る変換規則を、 少な く と も 1 種類の自然言語対応に 記憶 してい る変換規則部 と、
与え られた 自然言語に よ る表現を、 前記変換規則部に記憶さ れる、 当該 自然言語に対応する変換規則を参照 して普遍言語に よ る表現に変換処理する変換処理部 と、
普遍言語に よ る表現を、 前記変換規則部に記憶される、 目 的 の 自然言語に対応する変換規則を参照 して、 目的の 自然言語に よ る表現に変換処理する逆変換処理部 と を備え、
前記変換規則部は、 対応する 自然言語についての変換規則 と して、
自然言語を構成する 自然言語要素について、 それぞれが有す る情報に対応する、 普遍言語を構成する普遍言語要素で定義 し た普遍語辞書 と、
自然言語の文構造に対応 して配列される前記普遍言語要素の 結合関係を規定す る と共に、 結合関係を二つの普遍語と それ ら が特定の関係にあ る こ と を示す関係子 と を含む二項関係で表記 する ための書替規則 と を有 し、
前記変換処理部は、 与え られた 自然言語に よ る表現について 、 当該自然言語に対応する普遍語辞書を参照 して、 当該自然語 表現を構成する構成要素を、 前記普遍語辞書における対応する 普遍言語要素に書 き替え る処理 と、 書き替え られた複数の普遍 言語要素について、 その配列に従っ て、 目 的の 自然言語に対応 する書替規則を適用 して結合させ、 かつ、 前記二項関係で表記 するた めの規則に従って、 二項関係で表記される普遍言語に よ る表現を生成する処理と を行い、
前記逆変換処理部は、 二項関係で表記される普遍言語に よ る 表現について、 目 的の 自然言語に対応する書替規則を参照 して 、 該規則に含まれ る二項関係で表記する ための規則に従って、 結合を構成 してい る各普遍言語要素に分解する処理 と、 前記分 解された各普遍言語要素を、 目的の 自然言語に対応する普遍語 辞書を参照 して、 当該自然言語表現を構成する構成要素に書き 替えて、 目的の自然言語に よ る表現を生成する。
2 . 請求項 1 に記載のシ ス テ ム において、
前記変換規則部は、 複数種の 自然言語に対応 して複数種の変 換規則を記憶 してお り 、
前記変換処理部は、 与え られた 自然言語に対応 した変換規則 を用いて、 普遍言語に よ る表現を生成 し、
前記逆変換処理部は、 前記複数種の変換規則の う ち、 目的の 自然言語に対応 した変換規則を用いて普遍言語に よ る表現か ら 、 目的の 自然言語に よ る表現を生成する。
3 . 請求項 1 に記載のシステム において、
ネ ッ ト ワーク を介 して送 られる 自然言語に よ る表現を受け付 ける処理 と、 普遍言語に よ る表現か ら変換された 自然言語に よ る表現を、 ネ ッ ト ワーク を介 して出力する処理 と を行う 通信制 御部をさ ら に有する。
4 . 言語の変換を行う システムであ っ て、
自然言語に よ る表現と普遍言語に よ る表現と を変換す る ため に参照される変換規則を、 少な く と も 1 種類の 自然言語対応に 記憶 してい る変換規則部 と、
与え られた普遍言語に よ る表現を、 前記変換規則部に記憶さ れる変換規則を参照 して 自然言語に よ る表現に変換処理する逆 変換処理部 と を備え、
前記変換規則部は、 対応する 自然言語についての変換規則 と して、
自然言語を構成する 自然言語要素について、 それぞれが有す る情報に対応する、 普遍言語を構成する普遍言語要素で定義 し た普遍語辞書と、
自然言語の文構造に対応 して配列される前記普遍言語要素の 結合関係を規定す る と共に、 結合関係を二つの普遍語と それ ら が特定の関係にあ る こ と を示す関係子と を含む二項関係で表記 する ための書替規則 と を有 し、
前記逆変換処理部は、 二項関係で表記される普遍言語に よ る 表現について、 目 的の 自然言語に対応する書替規則を参照 して 、 該規則に含まれる二項関係で表記する ための規則に従っ て、 結合を構成 してい る各普遍言語要素に分解する処理 と、 前記分 解された各普遍言語要素を、 目的の 自然言語に対応する普遍語 辞書を参照 して、 当該自然言語表現を構成する構成要素に書 き 替えて、 目的の 自然言語に よ る表現を生成する こ と を特徴と す る言語変換シス テム。
5 . 請求項 4 に記載のシステム において、
ネ ッ ト ワ ーク を介 して送 られる 自然言語に よ る表現を受け付 ける と共に、 変換された普遍言語に よ る表現を、 ネ ッ ト ワーク を介 して 出力する通信制御部をさ ら に有する。
6 . 請求項 1 、 2、 3 、 4 および 5 のいずれか一項に記載 のシステム において、
普遍言語に よ る表現を蓄積する処理を行う 保存処理部 と、 蓄積されてい る普遍言語に よ る表現を特定の 自然言語に変換 して出力する指示を受け付けて、 前記蓄積されて い る普遍言語 によ る表現を読み出す処理を前記保存処理部に行わせる と共に 、 読み出された普遍言語に よ る表現を 目的の 自然言語に変換す る こ と を前記逆変換処理部に行わせる指示を行う 逆変換指示部 をさ ら に備え る。
7 . 請求項 1 、 2、 3 、 4 および 5 のいずれか一項に記載 のシステム において、
前記普遍語辞書は、 自然言語の構成要素対応に、 普遍言語で 用い られる記号で表記された普遍言語要素の集合で構成され、 かつ、 各普遍言語要素には、 それぞれ当該普遍言語要素が対応 する 自然言語における文の要素のいずれに相当す るかを示す文 要素記号が付記され、
前記変換処理部は、 書き替え られた複数の普遍言語要素につ いて、 その配列に従って前記書替規則を適用 して結合させる際 、 前記文要素記号に基づいて行う 。
8 . 請求項 1 、 2 、 3 、 4 および 5 のいずれか一項に記載 のシステム において、
前記普遍語辞書は、 自然言語の構成要素対応に、 普遍言語で 用い られる記号で表記された普遍言語要素の集合で構成され、 各普遍言語要素に は、 それぞれ当該普遍言語要素が対応する 自 然言語における文の要素のいずれに相当するかを示す文要素記 号が付記され、 かつ、 対応する 自然言語の構成要素が表す意味 を特定する情報、 および、 対応する 自然言語の構成要素につい ての評価を特定す る倩報の う ち、 少な く と も一方の情報が表記 され、
前記変換処理部は、 書き替え られた複数の普遍言語要素につ いて、 その配列に従って前記書替規則を適用 して結合させる際
、 前記文要素記号に基づいて行う 。
9 . 予め用意された変換規則を参照 して、 与え られた 自然 言語に よ る表現を、 普遍言語に よ る表現に変換す る処理 と、 普 遍言語に よ る表現を、 前記変換規則 を参照 して、 目的の 自然言 語に よ る表現に逆変換する処理 と を コ ン ピュータ に行わせる コ ン ピュー夕読取可能なプロ グラ ムであ って、
前記対応する 自然言語についての変換規則 と して、 自然言語 を構成する 自然言語要素について、 それぞれが有する情報に対 応する、 普遍言語を構成す る普遍言語要素で定義 した普遍語辞 書と、 自然言語の文構造に対応 して配列される前記普遍言語要 素の結合関係を規定する と共に、 結合関係を二つの普遍語と そ れ らが特定の関係にあ る こ と を示す関係子 と を含む二項関係で 表記す る た めの書替規則 と を参照 し、
前記変換処理を行う場合には、 与え られた 自然言語に よ る表 現について、 当該 自然言語に対応する普遍語辞書を参照 して、 当該自然語表現を構成する構成要素を、 前記普遍語辞書におけ る対応する普遍言語要素に書き替え る処理 と、 書 き替え られた 複数の普遍言語要素について、 その配列に従って、 目的の 自然 言語に対応する書替規則を適用 して結合させ、 かつ、 前記二項 関係で表記するための規則に従って、 二項関係で表記される普 遍言語に よ る表現を生成する処理と をコ ン ピュータ に行わせ、 前記逆変換処理を行う場合には、 二項関係で表記される普遍 言語に よ る表現について、 目的の自然言語に対応する書替規則 を参照 して、 該規則に含まれる二項関係で表記する ための規則 に従っ て、 結合を構成 して い る各普遍言語要素に分解する処理 と、 前記分解された各普遍言語要素を、 目的の 自然言語に対応 する普遍語辞書を参照 して、 当該自然言語表現を構成する構成 要素に書き替えて、 目的の 自然言語に よ る表現を生成する処理 と をコ ン ピ ュータ に行わせ る。
1 0 . 予め用意された変換規則を参照 して、 与え られた普 遍言語に よ る表現を、 前記変換規則を参照 して、 目的の 自然言 語に よ る表現に逆変換する処理をコ ン ピ ュ ータ に行わせる コ ン ピュー夕読取可能なプロ グラ ムであ って、 前記変換規則 と して、 自然言語を構成する 自然言語要素につ いて、 それぞれが有する情報に対応する、 普遍言語を構成する 普遍言語要素で定義 した普遍語辞書 と、 自然言語の文構造に対 応 して配列される前記普遍言語要素の結合関係を規定する と共 に、 結合関係を二つの普遍語と それ ら が特定の関係にあ る こ と を示す関係子と を含む二項関係で表記する ための書替規則 と を 参照 し、
二項関係で表記される普遍言語に よ る表現について、 目的の 自然言語に対応する書替規則を参照 して、 該規則に含まれる二 項関係で表記する ための規則に従っ て、 結合を構成 してい る各 普遍言語要素に分解する処理 と、
前記分解された各普遍言語要素を、 目的の 自然 言語に対応す る普遍語辞書を参照 して、 当該自然言語表現を構成する構成要 素に書き替えて、 目的の 自然言語に よ る表現を生成する処理と をコ ン ピュータ に行わせる。
1 1 . 請求項 9 および 1 0 のいずれか一項に記載のプロ グ ラ ム を記録 したコ ン ピュータ読取可能な記録媒体。
1 2 . 自然言語によ る コ ミ ュニケイ シ ヨ ンを支援す る方法 であって、
自然言語によ る表現を普遍言語に よ る表現に変換する処理を 行う 言語変換サーバと、 普遍言語に よ る表現を 自然言語に よ る 表現に逆変換する処理を行う 言語逆変換サーバ と を、 コ ミ ュ 二 ケイ シ ヨ ンを行う ための端末か ら ネ ッ ト ワーク を介して ァク セ ス可能に設置 し、
前記言語変換サーバは、
自然言語に よ る表現と普遍言語に よ る表現と を変換する ため に参照される変換規則を、 コ ミ ュニケィ シ ヨ ン の支援を予定 し てい る 自然言語に応 じて複数種記憶 してい る変換規則部 と、 自然言語に よ る表現を、 前記変換規則部に記憶される、 当該 自然言語に対応する変換規則を参照 して普遍言語に よ る表現に 変換処理す る変換処理部 と、
ネ ッ ト ワーク を介 して送 られる 自然言語に よ る表現を受け付 け る と共に、 変換された普遍言語に よ る表現を、 ネ ッ ト ワーク を介 して出力する通信制御部と を有 し、
前記言語逆変換サーバは、
自然言語によ る表現と普逦言語に よ る表現と を変換するため に参照される変換規則を、 コ ミ ュニケイ シ ヨ ンの支援を予定 し てい る 自然言語に応 じて複数種記憶 してい る変換規則部 と、 普遍言語に よ る表現を、 前記変換規則部に記憶される 目的の 自然言語に対応す る変換規則を参照 して、 目的の 自然言語に よ る表現に変換処理する逆変換処理部 と、
ネ ッ ト ワーク を介 して送 られる普遍言語に よ る表現を受け付 け る と共に、 逆変換された 自然言語に よ る表現をネ ッ ト ワーク を介して出力する通信制御部 と を有 し、
前記言語変換サーバおよび言語逆変換サーバがそれぞれ有す る前記変換規則部は、 対応する 自然言語についての変換規則 と して、
自然言語を構成する 自然言語要素について、 それぞれが有す る情報に対応する、 普遍言語を構成する普遍言語要素で定義 し た普遍語辞書と、
自然言語の文構造に対応 して配列される前記普遍言語要素の 結合関係を規定す る と共に、 結合関係を二つの普遍語と それ ら が特定の関係にあ る こ と を示す関係子 と を含む二項関係で表記 する ための書替規則 と を有 し、
ネ ッ ト ワ ーク を介 して送 られる 自然言語に よ る表現が前記言 語変換サーバに受け付け ら れる と、 受け ら れた 自 然言語に よ る 表現について、 前記変換処理部に よ り 、 当該自然言語に対応す る普遍語辞書を参照 して、 当該 自然語表現を構成する構成要素 を、 前記普遍語辞書におけ る対応する普遍言語要素に書 き替え 、 書き替え られた複数の普遍言語要素について、 その配列に従 つて、 目的の 自然言語に対応する書替規則を適用 して結合させ 、 かつ、 前記二項関係で表記するための規則に従って、 二項関 係で表記される普遍言語に よ る表現を生成 し、
ネ ッ ト ワーク を介 して送 られる普遍言語に よ る表現が前記言 語逆換サーバに受け付け られる と、 受け ら れた普遍言語に よ る 表現について、 目的の 自然言語に対応する書替規則を参照 して 、 該規則に含まれ る二項関係で表記す る ための規則に従って、 結合を構成 してい る各普遍言語要素に分解する処理と、 前記分 解された各普遍言語要素を、 目的の 自然言語に対応する普遍語 辞書を参照 して、 当該自然言語表現を構成する構成要素に書 き 替えて、 目的の 自然言語に よ る表現を生成する。
1 3 主
脂求項 1 2 に記載の方法において、 前記言語変換サーバ と、 前記言語逆変換サーバ と にネ ッ ト ヮ —ク を介 して接続され、 普遍言語に よ り 表現され るデータ を蓄 積する普遍言語表現データ 蓄積サーバをさ ら に設置 し、
該普遍言語表現データ蓄積サーバに よ り 、 前記言語変換サー バに よ り 変換された普遍言語に よ る表現のデータ を受け入れて 蓄積 し、 かつ、 蓄積 してい る普遍言語に よ る表現のデータ を前 記言語逆変換サーバに出力す る。
PCT/JP2000/008116 1999-11-17 2000-11-17 Systeme de traduction WO2001039035A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
AU14152/01A AU1415201A (en) 1999-11-17 2000-11-17 Language translation system
US10/130,357 US7107206B1 (en) 1999-11-17 2000-11-17 Language conversion system
EP00976319A EP1233347A4 (en) 1999-11-17 2000-11-17 TRANSLATION SYSTEM
JP2001540629A JP4291532B2 (ja) 1999-11-17 2000-11-17 言語変換システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP32752699 1999-11-17
JP11/327526 1999-11-17

Publications (1)

Publication Number Publication Date
WO2001039035A1 true WO2001039035A1 (fr) 2001-05-31

Family

ID=18200098

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/008116 WO2001039035A1 (fr) 1999-11-17 2000-11-17 Systeme de traduction

Country Status (6)

Country Link
US (1) US7107206B1 (ja)
EP (1) EP1233347A4 (ja)
JP (1) JP4291532B2 (ja)
CN (1) CN1271545C (ja)
AU (1) AU1415201A (ja)
WO (1) WO2001039035A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636619A (zh) * 2018-12-07 2019-04-16 北京京东金融科技控股有限公司 量化平台的回测方法、装置、电子设备和可读介质

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963871B1 (en) * 1998-03-25 2005-11-08 Language Analysis Systems, Inc. System and method for adaptive multi-cultural searching and matching of personal names
US8812300B2 (en) 1998-03-25 2014-08-19 International Business Machines Corporation Identifying related names
US8855998B2 (en) 1998-03-25 2014-10-07 International Business Machines Corporation Parsing culturally diverse names
US6424969B1 (en) * 1999-07-20 2002-07-23 Inmentia, Inc. System and method for organizing data
US6944619B2 (en) * 2001-04-12 2005-09-13 Primentia, Inc. System and method for organizing data
ATE330287T1 (de) * 2002-04-12 2006-07-15 Targit As Verfahren zur verarbeitung von mehrsprachigen abfragen
US20040158561A1 (en) * 2003-02-04 2004-08-12 Gruenwald Bjorn J. System and method for translating languages using an intermediate content space
US7475390B2 (en) 2004-01-12 2009-01-06 International Business Machines Corporation System and method for automatic natural language translation during information transfer
US8689125B2 (en) * 2003-10-23 2014-04-01 Google Inc. System and method for automatic information compatibility detection and pasting intervention
EP1692626A4 (en) * 2003-09-17 2008-11-19 Ibm IDENTIFICATION OF RELATED NAMES
US7478336B2 (en) 2003-11-06 2009-01-13 International Business Machines Corporation Intermediate viewer for transferring information elements via a transfer buffer to a plurality of sets of destinations
US7340685B2 (en) 2004-01-12 2008-03-04 International Business Machines Corporation Automatic reference note generator
US20070005586A1 (en) * 2004-03-30 2007-01-04 Shaefer Leonard A Jr Parsing culturally diverse names
JP2007034813A (ja) * 2005-07-28 2007-02-08 National Institute Of Advanced Industrial & Technology 複数自然言語のソフトウェア説明書生成システム
US20080221868A1 (en) * 2005-09-05 2008-09-11 Melnick Einat H Digital universal language
US20080162109A1 (en) * 2006-12-28 2008-07-03 Motorola, Inc. Creating and managing a policy continuum
JP5100445B2 (ja) * 2008-02-28 2012-12-19 株式会社東芝 機械翻訳する装置および方法
US20090300126A1 (en) * 2008-05-30 2009-12-03 International Business Machines Corporation Message Handling
US9535904B2 (en) * 2014-03-26 2017-01-03 Microsoft Technology Licensing, Llc Temporal translation grammar for language translation
CN105338161A (zh) * 2014-06-30 2016-02-17 展讯通信(上海)有限公司 一种语句信息匹配系统及方法以及移动终端
CN105677635A (zh) * 2015-12-29 2016-06-15 聚熵信息技术(上海)有限公司 用于自然语言交互的方法、设备及系统
FR3050843B1 (fr) * 2016-04-29 2022-07-15 Thierry Grenot Procede et plateforme de communication homogene entre humains et objets connectes
US10929617B2 (en) * 2018-07-20 2021-02-23 International Business Machines Corporation Text analysis in unsupported languages using backtranslation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0414175A (ja) * 1990-05-07 1992-01-20 Ricoh Co Ltd 自然言語文解析装置
JPH06325080A (ja) * 1993-02-02 1994-11-25 Diaz De Mendi Uribe-Echebarria 自動言語間翻訳システム
JPH10162007A (ja) * 1996-12-03 1998-06-19 Brother Ind Ltd 多言語対応通信システム及びサーバー装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60238966A (ja) * 1984-05-14 1985-11-27 Fujitsu Ltd 仮名漢字逆変換処理方式
CN1013006B (zh) 1985-04-01 1991-06-26 株式会社日立制作所 自然语言智能指导的方法与装置
US4864503A (en) * 1987-02-05 1989-09-05 Toltran, Ltd. Method of using a created international language as an intermediate pathway in translation between two national languages
JP3114181B2 (ja) * 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム
JP3176059B2 (ja) * 1990-11-15 2001-06-11 キヤノン株式会社 翻訳装置
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5432948A (en) * 1993-04-26 1995-07-11 Taligent, Inc. Object-oriented rule-based text input transliteration system
US5587903A (en) * 1994-06-22 1996-12-24 Yale; Thomas W. Artificial intelligence language program
US5884247A (en) * 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
US6092035A (en) * 1996-12-03 2000-07-18 Brothers Kogyo Kabushiki Kaisha Server device for multilingual transmission system
US6233546B1 (en) * 1998-11-19 2001-05-15 William E. Datig Method and system for machine translation using epistemic moments and stored dictionary entries
US6356866B1 (en) * 1998-10-07 2002-03-12 Microsoft Corporation Method for converting a phonetic character string into the text of an Asian language
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
JP4377096B2 (ja) * 1999-11-17 2009-12-02 国際連合 普遍言語による表現を生成するシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0414175A (ja) * 1990-05-07 1992-01-20 Ricoh Co Ltd 自然言語文解析装置
JPH06325080A (ja) * 1993-02-02 1994-11-25 Diaz De Mendi Uribe-Echebarria 自動言語間翻訳システム
JPH10162007A (ja) * 1996-12-03 1998-06-19 Brother Ind Ltd 多言語対応通信システム及びサーバー装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
See also references of EP1233347A4 *
UCHIDA H., ZHU M.: "Interlingua for multilingual machine translation", THE FOURTH MACHINE TRANSLATION SUMMIT, 1993, pages 157 - 169, XP002937014 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636619A (zh) * 2018-12-07 2019-04-16 北京京东金融科技控股有限公司 量化平台的回测方法、装置、电子设备和可读介质

Also Published As

Publication number Publication date
US7107206B1 (en) 2006-09-12
CN1415096A (zh) 2003-04-30
EP1233347A4 (en) 2006-05-17
CN1271545C (zh) 2006-08-23
EP1233347A1 (en) 2002-08-21
AU1415201A (en) 2001-06-04
JP4291532B2 (ja) 2009-07-08

Similar Documents

Publication Publication Date Title
WO2001039035A1 (fr) Systeme de traduction
US11914954B2 (en) Methods and systems for generating declarative statements given documents with questions and answers
US11250842B2 (en) Multi-dimensional parsing method and system for natural language processing
Ganegedara Natural Language Processing with TensorFlow: Teach language to machines using Python's deep learning library
CN101568918B (zh) 基于web的搭配错误证明
JP5037573B2 (ja) 変換規則とプログラムとを記録した記録媒体、および、普遍言語を生成するシステム
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
CN102567311A (zh) 激励描述集合
JP7287062B2 (ja) 翻訳方法、翻訳プログラム及び学習方法
CN111488742B (zh) 用于翻译的方法和装置
JP7230576B2 (ja) 生成装置、学習装置、生成方法及びプログラム
Thomas Natural language processing with spark NLP: learning to understand text at scale
US5957520A (en) Information processing system for completing or resolving ambiguity of input information and method therefor
JP7103264B2 (ja) 生成装置、学習装置、生成方法及びプログラム
Ali et al. Unl based bangla natural text conversion-predicate preserving parser approach
Ali et al. Analysis and generation of Bengali case structure constructs for universal networking language
Martín Arista Toward a Universal Dependencies Treebank of Old English: Representing the Morphological Relatedness of Un-Derivatives
Aronson HTML Manual of Style: A Clear, Concise Reference for Hypertext Markup Language (including HTML5)
Etuk et al. Development of an English-to-Ebira and Ebira-to-English Machine Translation System
KR100413110B1 (ko) 외국어 학습 시스템 및 방법
Sperberg-McQueen Fault tolerance, error tolerance, diversity tolerance
Xuetao et al. A corpus-based NLP-chain for a web-based Assisting Conversational Agent
Mridha et al. Development of Grammatical Attributes for Bangla Root and Primary Suffix for Universal Networking Language
García Potentialities and limits of fiction: Patricio Pron’s narrative in Argentina’s post-dictatorial period
Choi Intelligent Human Computer Interaction: 15th International Conference, IHCI 2023, Daegu, South Korea, November 8-10, 2023, Revised Selected Papers, Part I

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CR CU CZ DE DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
ENP Entry into the national phase

Ref document number: 2001 540629

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: IN/PCT/2002/783/KOL

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 2000976319

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 008178879

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2000976319

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10130357

Country of ref document: US

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWW Wipo information: withdrawn in national office

Ref document number: 2000976319

Country of ref document: EP