JPH0827799B2 - Free translation dictionary - Google Patents

Free translation dictionary

Info

Publication number
JPH0827799B2
JPH0827799B2 JP61076994A JP7699486A JPH0827799B2 JP H0827799 B2 JPH0827799 B2 JP H0827799B2 JP 61076994 A JP61076994 A JP 61076994A JP 7699486 A JP7699486 A JP 7699486A JP H0827799 B2 JPH0827799 B2 JP H0827799B2
Authority
JP
Japan
Prior art keywords
dictionary
information
meaning
semantic
morphological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61076994A
Other languages
Japanese (ja)
Other versions
JPS62232080A (en
Inventor
隆夫 宮部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61076994A priority Critical patent/JPH0827799B2/en
Publication of JPS62232080A publication Critical patent/JPS62232080A/en
Publication of JPH0827799B2 publication Critical patent/JPH0827799B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、言語処理システムにおいて、形態情報、文
法情報、意味情報、類義語情報という各種言語データを
格納、管理、検索する辞書管理方式に関し、多言語間の
類語検索を実現する意訳用辞書に関する。
The present invention relates to a dictionary management system for storing, managing, and retrieving various language data such as morphological information, grammatical information, semantic information, and synonym information in a language processing system. The present invention relates to a free-translation dictionary that realizes synonym search between multiple languages.

(従来技術とその問題点) 機械翻訳システムのような言語理解システムには、見
出し語(形態素表記あるいは単語表記)、形態情報、構
文情報(文法情報)、意味情報を格納する辞書が必要で
ある。機械翻訳用の辞書として、見出し語と意味シンボ
ルを辞書検索キーとし、形態情報、構文情報、意味情報
をポインタで結んだ辞書方式(特願昭59−148138)が知
られている、ここで形態素表記とは、「構成」「constr
uct」のような文字表記であり、また、形態情報とは
「構成」に対する「2字漢字」といった字種情報であ
り、「construct」に対する「先頭が子音」といった音
韻情報である。さらに、意味シンボルとは、その単語の
概念を表記する記号のことで、単語の活用や構文変化に
対しては不変である。但し、形態や構文の差によって意
味が変化する場合は、各々別のシンボルとなる。また、
意味の変化する慣用句も含まれる。例えば、「goes」は
「go」と同じ意味なので、シンボル「goes」や「goin
g」はなく、シンボル「go」になる。また、「bank(銀
行)」と「bank(土手)」、及び、「interest(利
子)」と「interesting(興味のある)」とではそれぞ
れ表現は等しいか、あるいは、現在分詞の形態である
が、意味が異なるため各々のシンボルが存在する。ま
た、「take」と「take part in」では異なる意味のた
め、各々シンボルが存在する。
(Prior Art and its Problems) A language understanding system such as a machine translation system requires a dictionary for storing headwords (morpheme notation or word notation), morphological information, syntactic information (grammar information), and semantic information. . As a dictionary for machine translation, a dictionary method (Japanese Patent Application No. 59-148138) in which headwords and semantic symbols are used as dictionary search keys and morphological information, syntactic information, and semantic information are linked by pointers is known. The notation is "configuration""constr
The morphological information is character type information such as "two kanji" for "construction" and phonological information such as "starting consonant" for "construct". Furthermore, a semantic symbol is a symbol that expresses the concept of the word and is invariant to the use of the word and the syntactic change. However, if the meaning changes due to the difference in form or syntax, they will be different symbols. Also,
Idioms with varying meanings are also included. For example, "goes" has the same meaning as "go", so the symbols "goes" and "goin"
There is no "g", but the symbol "go". Also, "bank" and "bank", and "interest" and "interesting" have the same expression, or are in the present participle form. , Each symbol exists because the meaning is different. Further, since "take" and "take part in" have different meanings, there are respective symbols.

この方式では、類義語の中の形態や構文情報の差、あ
るいは、ニュアンスレベルの差しかない、ほぼ同語の語
彙同士は、意味シンボルが同一であることにより、関係
づけが可能である。つまり狭義の類義語同士は関係づけ
可能である。しかし、能動態と受動態にみられるような
動作と状態といったアスペクト情報の差、副詞修飾の有
無などによる程度の差、自動詞と他動詞の間にみられる
ようなの関係や焦点に関するの意味相違を含む、広義の
類義語同士は同一の意味シンボルにはできない。同一の
意味シンボルとすることは、意味的な差がないと記述し
たことに相当し、結果として差の意味情報が失われるこ
とになる。これは辞書として不適切である。また、異な
る意味シンボルを関係付ける枠組は存在しない。従っ
て、広義の類義語であっても、狭義の類義語でない場合
に、語同士を関係づけることができない。
In this method, vocabularies of almost the same word, which have no difference in form or syntactic information in synonyms or nuance levels, can be related by having the same meaning symbol. That is, synonyms in a narrow sense can be related to each other. However, in a broad sense, it includes differences in aspect information such as movements and states found in the active and passive voices, differences in the degree of adverb modification, and differences in meaning such as relationships between intransitive and transitive verbs and focus. Synonyms of cannot be the same meaning symbol. Setting the same meaning symbol corresponds to describing that there is no semantic difference, and as a result, the meaning information of the difference is lost. This is inappropriate as a dictionary. Also, there is no framework that associates different semantic symbols. Therefore, even if a synonym in a broad sense is not a synonym in a narrow sense, words cannot be associated with each other.

例えば、表1では、意味シンボル「READ」を介して、
日本語名詞(読書)と英語動詞(READ)が関係づけられ
ているので、名詞「読書」の訳語として名詞句「readin
g」の選択が可能である。また、意味シンボル「SMALL」
を介して日本語「小さい」を英語「little」とも「smal
l」とも訳せる。これらは、それぞれ狭義の類義語であ
り、従って意味シンボルが同一であるからである。
For example, in Table 1, via the semantic symbol "READ",
Because the Japanese noun (reading) and the English verb (READ) are related, the noun phrase "readin" is a translation of the noun "reading".
"g" can be selected. Also, the meaning symbol "SMALL"
Via Japanese to “small” and English to “little” and “smal”
can also be translated as "l". This is because these are synonymous words in a narrow sense and therefore have the same meaning symbols.

しかしながら、表2で示すように日本語「構成」に対
して英語、「construct」と「consist−of」に対して、
意味シンボル「CONSTRUCT」と「CONSIST−OF」が別個に
存在する。というのも「construct」は動作を表現する
のに対して、「consist−of」は状態を表現するので、
意味的に差があるため、両者は狭義の意味では類義語と
はいえないからである。であるから、それぞれの意味シ
ンボルが、日本語の「構成(が、を、から)」と英語
「construct」、および、日本語の「構成(が、を)」
と英語の「cosist−of」に対応する。前者「CONSTRUC
T」が「人々は家を木と土と水から構成する」の「構
成」に対応し、後者の「CONSIST−OF」は「木と土と水
が家を構成する」の「構成」に対応する。両者は、意味
シンボルが異なるため、前述したように関係づけること
ができない。一方、前者「構成(が、を、から)」を受
動態で用いた「家が土と木と水から構成されている」と
いう文が存在する。この文の意味は、「ある対象
(家)」が「ある資源(土と木と水)」を元に「ある状
態(構成」にあることと表現される。また、後者「構成
(が、を)」を能動態で用いた「土と木と水が家を構成
する」という文もあり、この意味は先の文と等しいはず
である。しかし、前述のような意味シンボルの差により
関係づけが不可能なため、意味的に同一であることを表
現できない。従って、機械翻訳等でも両方の文は別の意
味として解釈され、異なる訳文を生成することになる。
However, as shown in Table 2, for Japanese "construction", for English, for "construct" and "consist-of",
Semantic symbols "CONSTRUCT" and "CONSIST-OF" exist separately. Because "construct" expresses a motion, while "consist-of" expresses a state,
Because there is a difference in meaning, the two are not synonymous in a narrow sense. Therefore, the meaning symbols of each are Japanese "composition (ga, o, kara)" and English "construct", and Japanese "composition (ga, o)".
It corresponds to "cosist-of" in English. The former 「CONSTRUC
"T" corresponds to "composition" of "people compose a house from wood, soil, and water", and the latter "CONSIST-OF" becomes "composition" of "wood, soil, and water composes a house." Correspond. Since they have different meaning symbols, they cannot be related to each other as described above. On the other hand, there is a sentence "house is composed of soil, wood, and water" that uses the former "composition (ga, wo, kara)" in the passive voice. The meaning of this sentence is that a certain object (house) is in a certain state (composition) based on a certain resource (soil, tree, and water). There is also a sentence that uses the word ")" in the active voice, "the soil, the tree, and the water make up the house," and this meaning should be the same as the previous sentence. Since it is impossible to express that they are semantically identical, both sentences are interpreted as different meanings even in machine translation, etc., and different translated sentences are generated.

(発明の効果) 本発明は、上述の欠点を解消し、類義語の意味やニュ
アンスの差や、能動態と受動態、自動詞と他動詞の間の
意味や焦点の相違を考慮することができる意訳用辞書を
提案することを目的とする。
(Effects of the Invention) The present invention solves the above-mentioned drawbacks and provides a translation dictionary capable of considering the difference in meaning and nuance of synonyms, the difference between meaning and focus between active and passive verbs, and intransitive and transitive verbs. The purpose is to propose.

(発明の構成) (a)形態素表記や形態情報、およびそれらに対応する
文法情報記述辞書項目へのポインタを有する形態辞書手
段、 (b)前記形態辞書手段内の前記文法情報記述辞書項目
に対応する品詞・文法情報、前記形態辞書手段内の項目
へのポインタ、および前記形態素表記と当該品詞・文法
情報とに対応する意味情報記述辞書項目へのポインタを
保持する構文辞書手段、 (c)意味シンボルや意味情報、それらに対応する前記
構文辞書項目へのポインタ、およびその意味情報の上位
概念を記述するシソーラス項目へのポインタを格納する
意味辞書手段、 (d)前記形態辞書手段内の形態素表記、および前記意
味辞書手段内の意味シンボルを、検索キーとして有する
辞書検索手段、 (e)意味シンボル、当該シソーラス情報に対応する類
義語間に共通する意味情報、その各類義語の格フレーム
を包含する格フレームおよびその各類義語の意味辞書手
段内の意味情報記述辞書項目へのポインタを有するシソ
ーラス手段、 を具備する意訳用辞書が得られる。
(Structure of the Invention) (a) Morphological notation and morphological information, and a morphological dictionary means having a pointer to a grammatical information description dictionary item corresponding to them, (b) Corresponding to the grammatical information description dictionary item in the morphological dictionary means Syntax dictionary means for holding part-of-speech / grammar information, pointers to items in the morphological dictionary means, and pointers to semantic information description dictionary items corresponding to the morpheme notation and the part-of-speech / grammar information, (c) meaning A symbol dictionary and semantic information, a pointer to the syntactic dictionary item corresponding to them, and a semantic dictionary unit that stores a pointer to a thesaurus item that describes a superordinate concept of the semantic information, (d) Morphological notation in the morphological dictionary unit , And a dictionary search means having the meaning symbol in the meaning dictionary means as a search key, (e) meaning symbol, corresponding to the thesaurus information Meaning dictionary common to the synonyms, a case frame including the case frame of each synonym, and a thesaurus means having a pointer to the meaning information description dictionary item in the meaning dictionary means of each synonym, can get.

(実施例) 以下に、図表を参照して、本発明を詳細に説明する。
以下では説明を容易にするために日本語、英語に例をと
る。
(Example) Hereinafter, the present invention will be described in detail with reference to the drawings.
In the following, Japanese and English are taken as examples for ease of explanation.

第1図は、本発明の一実施例を示すブロック図であ
る。また、本発明の辞書検索手段0,4、形態辞書手段
1、構文辞書手段2、意味辞書手段3とについては、特
願昭59−148138号明細書(特開昭61−26176号公報)に
記載されている方式と同様であるので、ここでは簡略し
た説明にとどめる。
FIG. 1 is a block diagram showing an embodiment of the present invention. The dictionary search means 0, 4, the form dictionary means 1, the syntactic dictionary means 2, and the semantic dictionary means 3 of the present invention are described in Japanese Patent Application No. 59-148138 (JP-A 61-26176). Since the method is the same as that described, only a brief description will be given here.

辞書検索手段0は、形態素表記を指定し、対応する形
態情報/品詞・文法情報/意味情報などの情報を出力す
る機能を有する。外部からの形態素表記を入力とし、そ
れに対応する形態辞書項目を形態辞書手段1に出力する
(01)。
The dictionary search means 0 has a function of designating a morpheme notation and outputting information such as corresponding morphological information / part of speech / grammar information / semantic information. The morpheme notation from the outside is input, and the corresponding morphological dictionary item is output to the morphological dictionary means 1 (01).

また、辞書検索手段4からの意味シンボル入力が各種
辞書手段を介した後に形態辞書手段1から対応する形態
情報/品詞・文法情報/意味情報などの情報として本辞
書検索手段0に入力される。
Further, the meaning symbol input from the dictionary search means 4 is input to the main dictionary search means 0 as information such as corresponding morphological information / part of speech / grammatical information / semantic information from the morphological dictionary means 1 through various dictionary means.

形態辞書手段1は、形態素表記/形態情報とその情報
に対応する文法情報記述辞書項目へのポインタとを有す
る形態辞書項目のセットからなり、形態情報を文法情報
に対応付ける機能を有する。辞書検索手段0を介して特
定の形態辞書項目が入力されると、該形態辞書項目内の
形態素表記と形態情報とが対応する全ての文法情報記述
辞書項目を構文辞書手段2に対して出力する(12)。
The morphological dictionary means 1 is composed of a set of morphological dictionary items having morpheme notation / morphological information and a pointer to a grammatical information description dictionary item corresponding to the information, and has a function of associating morphological information with grammatical information. When a specific morphological dictionary item is input via the dictionary search means 0, all grammatical information description dictionary items corresponding to the morpheme notation in the morphological dictionary item and the morphological information are output to the syntax dictionary means 2. (12).

また、構文辞書手段2を介して形態辞書項目が入力さ
れると、付随入力の品詞・文法情報や意味情報と共に対
応する形態素表記/形態辞書を辞書検索手段0に出力す
る。
Further, when a morphological dictionary item is input via the syntactic dictionary means 2, the corresponding morpheme notation / morphological dictionary is output to the dictionary searching means 0 together with the accompanying part-of-speech / grammar information and semantic information.

構文辞書手段2は、品詞・文法情報とそれに対応する
形態辞書項目へのポインタ、及び意味情報記述辞書項目
へのポインタとを有する文法情報記述辞書項目のセット
からなる。品詞・文法情報を形態情報に、あるいは、品
詞・文法情報を意味情報に対応付ける機能を有する。
The syntactic dictionary means 2 is composed of a set of grammatical information description dictionary items having part-of-speech / grammatical information, a pointer to a corresponding morphological dictionary item, and a pointer to a semantic information description dictionary item. It has a function of associating part-of-speech / grammar information with form information or part-of-speech / grammar information with semantic information.

形態辞書手段1を介して特定の文法情報記述辞書項目
が入力されると(12)、付随入力の形態情報と、該文法
情報記述辞書項目内の品詞・文法情報と、対応する全て
の意味情報記述辞書項目を意味辞書手段3に出力する。
When a specific grammatical information description dictionary item is input via the morphological dictionary means 1 (12), the morphological information of the incidental input, the part of speech / grammatical information in the grammatical information description dictionary item, and all corresponding semantic information The description dictionary item is output to the semantic dictionary means 3.

また、意味辞書手段3を介して特定の文法情報記述辞
書項目が入力されると(23)、付随入力の意味情報と文
法情報記述辞書項目内の品詞・文法情報と、対応する全
ての形態辞書項目を形態辞書手段1に出力する(12)。
When a specific grammatical information description dictionary item is input via the semantic dictionary means 3 (23), the associated input semantic information, the part of speech / grammatical information in the grammatical information description dictionary item, and all corresponding form dictionaries. The item is output to the form dictionary means 1 (12).

意味辞書手段3は、意味シンボルや意味情報とそれに
対応する文法情報記述辞書項目へのポインタと、シソー
ラス項目へのポインタとを有する意味情報記述辞書項目
のセットからなる。意味情報をシソーラス上の上位概念
に、あるいは、品詞・文法情報に対応付ける機能を有す
る。
The semantic dictionary means 3 comprises a set of semantic information description dictionary items having semantic symbols and semantic information, pointers to corresponding grammatical information description dictionary items, and pointers to thesaurus items. It has a function of associating the semantic information with a superordinate concept on the thesaurus or with a part of speech / grammar information.

構文辞書手段2を介して特定の意味情報記述辞書項目
が入力されると(23)、付随入力の形態情報/品詞・文
法情報と意味情報記述辞書項目内の意味情報を辞書検索
手段4へ出力する。同時に対応する全てのシソーラス項
目をシソーラス手段5に出力する(35)。
When a specific meaning information description dictionary item is input via the syntactic dictionary means 2 (23), the morphological information / part of speech / grammar information of the accompanying input and the meaning information in the meaning information description dictionary item are output to the dictionary search means 4. To do. At the same time, all corresponding thesaurus items are output to the thesaurus means 5 (35).

また、シソーラス手段5または辞書検索手段4を介し
て特定の意味情報記述辞書項目が入力されると(34、3
5)、意味情報記述辞書項目内の意味シンボルや意味情
報とともに、対応する全ての文法情報記述辞書項目を構
文辞書手段2に出力する(23)。
When a specific semantic information description dictionary item is input via the thesaurus means 5 or the dictionary search means 4 (34, 3
5), outputs all corresponding grammatical information description dictionary items to the syntactic dictionary means 2 together with the semantic symbols and the semantic information in the semantic information description dictionary item (23).

辞書検索手段4は、意味シンボルからそれに対応する
形態情報/品詞・文法情報/意味情報などの情報を出力
する機能を有する。外部からの意味シンボルを入力と
し、対応する意味情報記述辞書項目を意味辞書手段3に
出力する(34)。また、辞書検索手段0からの形態素表
記入力が各種辞書手段を介した後に意味辞書手段3から
対応する形態情報/品詞・文法情報/意味情報などの情
報として本辞書検索手段4にに入力される。
The dictionary search means 4 has a function of outputting information such as morphological information / part of speech / grammar information / semantic information corresponding to the semantic symbol. A semantic symbol from the outside is input, and the corresponding semantic information description dictionary item is output to the semantic dictionary means 3 (34). Further, the morpheme notation input from the dictionary search means 0 is input to the main dictionary search means 4 as information such as corresponding morphological information / part of speech / grammatical information / semantic information from the semantic dictionary means 3 through various dictionary means. .

シソーラス手段5は、意味的な上下関係を基軸とした
階層構造をもち、意味シンボルとともにその下位の意味
情報記述辞書項目の内容を包含する意味情報と格フレー
ム情報を有し、下位の全ての意味情報記述辞書項目への
ポインタを有するシソーラス項目のセットからなる。類
義の意味辞書項目同士を対応付ける機能を有する。
The thesaurus means 5 has a hierarchical structure based on the semantic hierarchical relation, has semantic information including the contents of the semantic information description dictionary items below it, and case frame information along with the semantic symbols, and all subordinate meanings. It consists of a set of thesaurus items with pointers to information description dictionary items. It has a function of associating synonymous meaning dictionary items with each other.

意味辞書手段3を介して特定のシソーラス項目が入力
されると(35)、項目内容とともに対応する全ての意味
情報記述辞書項目を意味辞書検索手段3へ出力する(2
3)。
When a specific thesaurus item is input via the semantic dictionary means 3 (35), all the corresponding semantic information description dictionary items are output to the semantic dictionary search means 3 together with the item contents (2).
3).

ここで、本発明の動作の実施例について、「家が土と
木と水から構成された」及び「very large」が入力デー
タとして入力された場合を例にとり、図表を用いて説明
する。
Here, an embodiment of the operation of the present invention will be described with reference to the drawings, taking as an example the case where "a house is composed of soil, wood, and water" and "very large" are input as input data.

ここで、入力データ「家が土と木と水から構成され
た」について説明する。まず、「構成」に対して、辞書
検索手段0、形態辞書手段1、構文辞書手段2を経て意
味情報記述辞書項目ID1が意味辞書手段3へ出力され
る。形態辞書手段1から形態素表記「構成」や形態情報
(文字:2字漢字)が、また、構文辞書手段2からは、品
詞(動詞)や文法情報(動詞形:が、を、から)などが
求まる。ここで、動詞形とは、その動詞がとりやすい助
詞の集合のことである。更に、意味辞書手段3により、
第2図に示したように、「意味シンボル:S# CONSTRUC
T,意味情報:動作,格フレーム:AGENT,OBJECT,SOURCE」
が求まる。一方「された」から「動作を受動化すると状
態化する」という日本語の特色により意味情報が状態に
変更され、また助詞「が、から」から利用される格は
「OBJECT,SOURCE」のみとなる。なお、本例での意味情
報は動詞のアスペクトであり、また、格フレームはフィ
ルモアの深層格に準拠する。(フィルモアの深層格につ
いては、「格文法の原理 言語の意味と構造」フィルモ
ア著(田中春美、船城道雄 訳)三省堂出版1975年刊に
詳しい。) よって、「構成された」の入力データの意味として
「意味シンボル:S# CONSTRUCT,意味情報:状態,格フ
レーム:OBJECT,SOURCE」が求まる。
Here, the input data “a house is composed of soil, trees, and water” will be described. First, for the “structure”, the meaning information description dictionary item ID1 is output to the meaning dictionary means 3 through the dictionary search means 0, the form dictionary means 1, and the syntax dictionary means 2. From the morphological dictionary means 1, the morpheme notation “structure” and morphological information (characters: 2 kanji), and from the syntactic dictionary means 2, POS (verb) and grammatical information (verb form: ga, kara) etc. I want it. Here, the verb form is a set of particles that the verb easily takes. Furthermore, by the semantic dictionary means 3,
As shown in Fig. 2, "Semantic symbol: S # CONSTRUC
T, semantic information: action, case frame: AGENT, OBJECT, SOURCE "
Is found. On the other hand, the meaning information is changed to the state by the Japanese feature that "was made" and "becomes state when the action is made passive", and the case used from the particle "ga, kara" is only "OBJECT, SOURCE". Become. The semantic information in this example is a verb aspect, and the case frame conforms to Fillmore's deep case. (For Fillmore's deep case, see "Principle of Case Grammar: Meaning and Structure of Language" written by Fillmore (Translated by Harumi Tanaka, Michio Funaki) Sanseido Publishing, 1975.) Therefore, the meaning of "composed" input data “Semantic symbol: S # CONSTRUCT, semantic information: state, case frame: OBJECT, SOURCE” is obtained.

従来の方式ではこのID1に継る訳語「construct」の選
択のみが可能で「beconstructed」のような表現が選択
されていた。本発明では意味辞書手段に従い、ID1とTD1
の上位/下位関係を利用して、上位のシソーラス項目TD
1を得る。更にシソーラス手段に従って、TD1の下位語で
ID1の類義語として項目ID2を参照できる。このID2の意
味情報と格フレームの内容とが、先の入力文からの情報
と一致することにより、この意味情報記述辞書項目が選
択される。
In the conventional method, it is only possible to select the translated word “construct” that succeeds this ID1, and the expression such as “beconstructed” was selected. In the present invention, according to the semantic dictionary means, ID1 and TD1
Upper thesaurus item TD using the upper / lower relation of
Get one. Furthermore, according to the thesaurus means, in the subordinate term of TD1
Item ID2 can be referred to as a synonym for ID1. When the semantic information of this ID2 and the content of the case frame match the information from the previous input sentence, this semantic information description dictionary item is selected.

更に、意味辞書手段、構文辞書手段と形態辞書手段を
介して、ID2からつながる形態素表記「consist of」
が、入力データに対応する訳語となる。
Furthermore, the morpheme notation “consist of” connected from ID2 via the semantic dictionary means, the syntactic dictionary means, and the morphological dictionary means
Is the translated word corresponding to the input data.

同様に入力データ「very large」では、[large]か
ら意味情報記述辞書項目ID4が選択され、[very]から
意味情報が変更される。ここでの意味情報は程度であ
り、入力データの意味は「S#large,意味情報:強」と
なる。この場合も、シソーラス手段により、意味辞書項
目ID3を参照し、意味情報内容が一致することにより、
結果として訳語「巨大」が選択可能となる。
Similarly, in the input data "very large", the meaning information description dictionary item ID4 is selected from [large] and the meaning information is changed from [very]. The meaning information here is a degree, and the meaning of the input data is “S # large, meaning information: strong”. Also in this case, by referring to the meaning dictionary item ID3 by the thesaurus means and the meaning information contents are matched,
As a result, the translated word "huge" can be selected.

また、入力データ「small fish」では、[small]か
ら意味情報記述辞書項目ID5が選択され、[small]から
意味情報が変更される。ここでの意味情報はサイズの大
小であり、入力データの意味は「S#FISH,意味情報:
サイズ小」となる。この場合も、シソーラス手段によ
り、意味辞書項目ID6を参照し、意味情報内容が一致す
ることにより、結果として訳語「小魚」が選択可能とな
る。
In the input data “small fish”, the meaning information description dictionary item ID5 is selected from [small] and the meaning information is changed from [small]. The meaning information here is the size, and the meaning of the input data is "S # FISH, meaning information:
Small size ". In this case as well, the thesaurus means refers to the meaning dictionary item ID6 and the meaning information contents match, so that the translated word "small fish" can be selected.

さらに、入力データ「read thoroughly」では、[rea
d]から意味情報記述辞書項目ID7が選択され、[thorou
ghly]から意味情報が変更される。ここでの意味応報は
詳細度の大小であり、入力データの意味は「S#READ,
意味情報:詳細度大」となる。この場合も、シソーラス
手段により、意味辞書項目ID8を参照し、意味情報内容
が一致することにより、結果として訳語「熟読」が選択
可能となる。
Furthermore, in the input data "read thoroughly", [rea
Semantic information description dictionary item ID7 is selected from [d], and [thorou
Semantic information is changed from [ghly]. The meaning of retribution here is the degree of detail, and the meaning of the input data is "S # READ,
Semantic information: High level of detail ". Also in this case, the thesaurus means refers to the meaning dictionary item ID8, and the meaning information contents match, so that the translated word "deep reading" can be selected.

(発明の効果) 本発明により、類義語間に共通の意味での格フレーム
をシソーラスにもたせて、個々の語の持っている意味の
差がニュアンスの差をそれぞれの意味辞書項目に持たせ
る辞書構成が実現できる。これにより、訳文生成時に原
言語のニュアンスを反映する訳語を選択できる。また、
話題・表現の焦点の差により、他動詞と自動詞の選択、
能動形と受動形の差が生ずるが、その選択も本発明によ
り、言語に応じて行うことができ、原文の意図を保持し
た意訳が可能となる。
(Effects of the Invention) According to the present invention, a dictionary structure is provided in which a thesaurus has a case frame having a common meaning between synonyms, and the difference in meaning between individual words has a difference in nuance between the meaning dictionary items. Can be realized. As a result, a translated word that reflects the nuances of the source language can be selected when the translated sentence is generated. Also,
Selection of transitive verbs and intransitive verbs, depending on the difference in focus of topic / expression,
Although there is a difference between the active form and the passive form, the selection can be made according to the language according to the present invention, and it is possible to carry out free translation while retaining the intent of the original sentence.

また、特願昭59−148138号明細書(特開昭61−26176
号公報)に記載の発明では、共通の意味シンボルを持つ
同義語(類義語)同士の対応づけは可能である。しか
し、アスペクト/モダリティ/程度などの意味情報が異
なる語同士は、同義語ではない。この意味情報が異なる
語同士については、意味の差があるために共通の意味シ
ンボルにすることができない。もし共通化した場合は、
意味的に異なる表現を同一と解釈するため、翻訳などに
利用する場合に誤りを生じる。
Also, Japanese Patent Application No. 59-148138 (JP-A-61-26176)
In the invention described in Japanese Patent Publication No.), synonyms (synonyms) having a common meaning symbol can be associated with each other. However, words having different semantic information such as aspect / modality / degree are not synonymous words. The words having different meaning information cannot be used as a common meaning symbol because of the difference in meaning. If they are shared,
Since the semantically different expressions are interpreted as the same, an error occurs when they are used for translation.

本発明ではシソーラス上の上位のシンボルを介して結
合しており、それぞれの意味シンボルに相当する意味情
報は意味情報記述辞書項目レベルで記載されている。従
って、意味的な異なりとともに上位での対応づけも実現
されており、より広範囲な類義表現間の対応づけが可能
になる。
In the present invention, the symbols are combined via the upper symbols on the thesaurus, and the semantic information corresponding to each semantic symbol is described at the semantic information description dictionary item level. Therefore, it is possible to realize the correspondence between the synonymous expressions in a wider range because the semantic difference and the correspondence in the higher rank are realized.

例えば、特願昭59−148138号明細書(特開昭61−2617
6号公報)記載の類義語検索機能としての「festival,fa
ir,bazar」についてはシンボルの共通化で対応可能であ
る。しかし、「construct,consist of」については、前
者が動作、後者が状態とアスペクト情報が異なるため、
既存の方式では対応づけができない。また、「巨大、ve
ry large」も程度の情報が異なるため意味シンボルが異
なり、対応づけ不可能となる。他方、本方式では、シソ
ーラス項目上の「T# 構成」,「T# 大きい」を介
して結合しているため、単語間の対応づけが可能とな
る。
For example, Japanese Patent Application No. 59-148138 (JP-A-61-2617)
(Publication No. 6) as a synonym search function described in "festival, fa
"ir, bazar" can be handled by standardizing symbols. However, as for "construct, consist of", the former works and the latter has different state and aspect information.
The existing method cannot be associated. Also, "giant, ve
Since “ry large” also has different degree information, the meaning symbols are different and it is impossible to associate them. On the other hand, in this method, the words are associated with each other through “T # composition” and “T # large” on the thesaurus item, so that correspondence between words is possible.

翻訳に例をとると、「構成する」に対して「construc
t」、「大きい」に対して「large」が結合している。こ
こで「構成される」や「very large」という表現の翻訳
については、既存の方式では結合可能な語彙が限定され
ているため、「be constructed」「非常に大きい」とし
か訳せない。他方、本方式はより広範な語から最適な表
現を選択可能なため「consist of」「巨大」という適切
な翻訳が可能となる。
Taking the example of translation, "construc"
“Large” is combined with “t” and “large”. Regarding the translation of the expressions "constructed" and "very large", since the existing methods have a limited vocabulary that can be combined, they can only be translated as "be constructed" and "very large". On the other hand, in this method, an optimal expression can be selected from a wider range of words, so that appropriate translations of "consist of" and "giant" are possible.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例のブロック図、第2図は第1
図中の意味辞書手段と、シソーラス手段との関係を説明
する模式図である。 0,4…辞書検索手段、1…形態辞書手段、2…構文辞書
手段、3…意味辞書手段、5…シソーラス手段、IDi…
意味情報記述辞書項目、TDj…シソーラス項目。
FIG. 1 is a block diagram of an embodiment of the present invention, and FIG.
It is a schematic diagram explaining the relationship between the semantic dictionary means in the figure and the thesaurus means. 0,4 ... Dictionary search means, 1 ... Morphology dictionary means, 2 ... Syntax dictionary means, 3 ... Semantic dictionary means, 5 ... Thesaurus means, IDi ...
Semantic information description dictionary item, TDj ... Thesaurus item.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】形態素表記や形態情報、およびそれらに対
応する文法情報記述辞書項目へのポインタを有する形態
辞書手段と、 前記形態辞書手段内の前記文法情報記述辞書項目に対応
する品詞・文法情報、前記形態辞書手段内の項目へのポ
インタ、および前記形態素表記と当該品詞・文法情報と
に対応する意味情報記述辞書項目へのポインタを保持す
る構文辞書手段と、 意味シンボルや意味情報、それらに対応する前記構文辞
書項目へのポインタ、およびその意味情報の上位概念を
記述するシソーラス項目へのポインタを格納する意味辞
書手段と、 前記形態辞書手段内の形態素表記、および前記意味辞書
手段内の意味シンボルを、検索キーとして有する辞書検
索手段と、 意味シンボル、当該シソーラス情報に対応する類義語間
に共通する意味情報、その各類義語の格フレームを包含
する格フレームおよびその各類義語の意味辞書手段内の
意味情報記述辞書項目へのポインタを有するシソーラス
手段と を有する意訳用辞書。
1. A morphological notation and morphological information, and a morphological dictionary means having pointers to corresponding grammatical information description dictionary items, and part-of-speech / grammatical information corresponding to the grammatical information description dictionary item in the morphological dictionary means. A syntax dictionary means for holding a pointer to an item in the morphological dictionary means, and a pointer to a semantic information description dictionary item corresponding to the morpheme notation and the part-of-speech / grammatical information; A semantic dictionary unit that stores a pointer to the corresponding syntactic dictionary item and a pointer to a thesaurus item that describes a superordinate concept of the semantic information, a morpheme notation in the morphological dictionary unit, and a meaning in the semantic dictionary unit A dictionary search means that has a symbol as a search key, a meaning symbol, and a meaning common to the synonyms corresponding to the thesaurus information. A free-translation dictionary having information, a case frame including the case frame of each synonym thereof, and a thesaurus means having a pointer to a meaning information description dictionary item in the meaning dictionary means of each synonym.
JP61076994A 1986-04-02 1986-04-02 Free translation dictionary Expired - Lifetime JPH0827799B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61076994A JPH0827799B2 (en) 1986-04-02 1986-04-02 Free translation dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61076994A JPH0827799B2 (en) 1986-04-02 1986-04-02 Free translation dictionary

Publications (2)

Publication Number Publication Date
JPS62232080A JPS62232080A (en) 1987-10-12
JPH0827799B2 true JPH0827799B2 (en) 1996-03-21

Family

ID=13621331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61076994A Expired - Lifetime JPH0827799B2 (en) 1986-04-02 1986-04-02 Free translation dictionary

Country Status (1)

Country Link
JP (1) JPH0827799B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6126176A (en) * 1984-07-17 1986-02-05 Nec Corp Dictionary for processing language

Also Published As

Publication number Publication date
JPS62232080A (en) 1987-10-12

Similar Documents

Publication Publication Date Title
JPH03278174A (en) Translation method and system for communication between different language
JPH1074203A (en) Method and system for lexical processing of uppercase and unacented text
JP2006164293A (en) Automatic natural language translation
JP2018195331A (en) Speech sentence generation device, and method and program thereof
Dror et al. Morphological Analysis of the Qur'an
Nguyen et al. Ensuring annotation consistency and accuracy for Vietnamese treebank
Balkan Translation tools
JP2997469B2 (en) Natural language understanding method and information retrieval device
JPH09190453A (en) Database device
Attia Implications of the agreement features in machine translation
Shawar et al. Arabic question-answering via instance based learning from an FAQ corpus
Bharati et al. Paninian framework and its application to Anusaraka
JPH0827799B2 (en) Free translation dictionary
Ahmed et al. English to Urdu translation system
JP3892227B2 (en) Machine translation system
Barker Noun modifier relationship analysis in the TANKA system
JP2819766B2 (en) Foreign language electronic dictionary search method
Bennett The interaction of syntax and morphology in machine translation
Narayan et al. Pre-Neural Approaches
Branner Wenyan Syntax as Context-Free Formal Grammar1
Nijholt Linguistic engineering: a survey
Estigarribia Automatic detection of syntactic patterns from texts with application to Spanish clitic doubling
Alkim Morphological analysis in natural language processing for Turkish language and a new approach for lexicon design
Tufiș et al. LEXICAL SEMANTICS IN TEXT PROCESSING
Sigurd Machine Translation-State of the Art

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term