JPH0410109B2 - - Google Patents
Info
- Publication number
- JPH0410109B2 JPH0410109B2 JP61173059A JP17305986A JPH0410109B2 JP H0410109 B2 JPH0410109 B2 JP H0410109B2 JP 61173059 A JP61173059 A JP 61173059A JP 17305986 A JP17305986 A JP 17305986A JP H0410109 B2 JPH0410109 B2 JP H0410109B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- dictionary
- priority
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000013519 translation Methods 0.000 claims description 33
- 238000004458 analytical method Methods 0.000 claims description 26
- 230000014616 translation Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 210000003746 feather Anatomy 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Description
【発明の詳細な説明】
〔概要〕
機械翻訳において、文意に沿つて最適な訳語を
選択するために、同一の文章中のそれまで翻訳さ
れた結果に基づいて単語の優先度を動的に変更
し、これにより訳語の選択が正しく行い得るよう
にするものである。[Detailed Description of the Invention] [Summary] In machine translation, in order to select the most suitable translation word according to the meaning of the sentence, the priority of words is dynamically set based on the results of previous translations in the same sentence. This will enable the correct selection of translation words.
〔産業上の利用分野〕
本発明は、機械翻訳における訳語の選択に関す
るものである。機械翻訳において、結果の質を左
右する重要な尺度は訳語が正しいか否かである。
このため、正しい訳語を選択するために、同一の
単語に複数の訳語が対応している場合には、その
優先度を翻訳時に動的に変更する必要がある。[Industrial Application Field] The present invention relates to selection of translated words in machine translation. In machine translation, an important measure that determines the quality of the results is whether the translated words are correct.
Therefore, in order to select the correct translation, if multiple translations correspond to the same word, it is necessary to dynamically change the priority during translation.
翻訳装置は、形態素解析及び構文解析や意味解
析等の文解析を行つて概念構造を生成し、概念構
造をもとにして文生成を行つている。
A translation device performs sentence analysis such as morphological analysis, syntactic analysis, and semantic analysis to generate a conceptual structure, and generates a sentence based on the conceptual structure.
形態素解析は、入力された文章からその文章を
構成する形態素を見つけ出すことを目的としてい
る。形態素解析は、単語辞書と、単語間の隣接可
能性を記入した接続表とを用いて行われる。 The purpose of morphological analysis is to find the morphemes that make up an input sentence. Morphological analysis is performed using a word dictionary and a connection table in which the possibility of adjacency between words is entered.
構文解析は、文の要素がどのように結びつき、
どのような役割を果たしているかを明らかにする
ものである。即ち、形態素に分解された文の要素
に対し、文法規則を適用して文節や句の合成、主
語と述語などの修飾関係を決定する。しかし、こ
の段階では文法上は正しい解析であつても、意味
上では正しいとは限らない。そこで、次に述べる
意味解析が必要になる。 Syntactic analysis determines how the elements of a sentence are connected.
This clarifies what role they play. That is, grammatical rules are applied to the elements of a sentence broken down into morphemes to determine the composition of clauses and phrases, and the modification relationships between subjects and predicates. However, at this stage, even if the analysis is grammatically correct, it is not necessarily semantically correct. Therefore, the following semantic analysis is required.
意味解析では、文法的に正しい解析結果から更
に意味上で正しいものを選択する。構文解析で
は、単語の持つ多義性によつて複数個の正しい結
果が存在する。この中には、意味が全くおかしい
ものまで含まれているので、構文解析の途中で意
味解析を行つて、意味上でおかしいものを篩いに
かければ、効率のよい解析を行うことが出来る。 In semantic analysis, the semantically correct one is selected from the grammatically correct analysis results. In syntactic analysis, there are multiple correct results depending on the ambiguity of the word. This includes some sentences that have completely strange meanings, so if you perform a semantic analysis during the syntactic analysis and filter out the words that have strange meanings, you can perform an efficient analysis.
概念構造は、文を表している意味を意味ネツト
ワークの形式で表現したものである。この概念構
造は、翻訳の対象となる言語に依存しないように
作られているため、この概念構造から多国語への
文生成を行うことが出来る。 A conceptual structure is a representation of the meaning of a sentence in the form of a semantic network. This conceptual structure is created so as not to depend on the language to be translated, so it is possible to generate sentences in multiple languages from this conceptual structure.
文生成は、構文生成と形態素生成に分けられ
る。概念構造から目標言語(日英翻訳のときは英
語)の文を生成する過程では、概念を表現する概
念記号をもとに目標言語の辞書から単語を抽出す
る。この際、概念構造レベルでは文法的な情報は
索引しないので、目標言語に合つた品詞を選択す
る必要がある。これらの規則を生成規則と呼んで
いる。生成規則では、概念構造で示される入口点
のアークが入るノードから処理を始め、そのノー
ドは周りのアークやその先のノードと、選択した
単語の文法属性の関係を見ながら構文を決定す
る。構文生成によつて決定した構文に対し、単語
間の言い回しを決定するための共起関係を用い
る。共起関係は、一つの概念に対して複数個の単
語が存在するときに、どの単語を選択するかを決
めるものである。形態素生成では、構文生成と共
起関係によつて決定した単語に対して、時制や人
称、数、格、性などの情報によつて決定できる単
語の語尾変化部分を、単語辞書を参照して意味を
持つ単語に合成する。 Sentence generation is divided into syntactic generation and morpheme generation. In the process of generating sentences in the target language (English in the case of Japanese-English translation) from conceptual structures, words are extracted from the dictionary of the target language based on the conceptual symbols that express the concepts. At this time, since grammatical information is not indexed at the conceptual structure level, it is necessary to select the part of speech that matches the target language. These rules are called production rules. In production rules, processing starts from the node where the arc of the entry point shown in the conceptual structure enters, and the syntax of that node is determined by looking at the relationship between the surrounding arcs, the nodes ahead of it, and the grammatical attributes of the selected word. Co-occurrence relationships are used to determine phrasing between words for the syntax determined by syntax generation. The co-occurrence relationship determines which word to select when multiple words exist for one concept. In morpheme generation, for words determined through syntactic generation and co-occurrence relationships, the inflectional part of the word, which can be determined based on information such as tense, person, number, case, gender, etc., is generated by referring to a word dictionary. Compose words with meaning.
本発明は、概念記号に対応する単語を単語辞書
から選択する手法に関するものである。第3図は
従来の単語選択方法を示すものである。第3図に
おいて、1は単語辞書、2は辞書アクセス装置を
それぞれ示している。単語辞書1には、例えば
“線”と言う概念記号に対応して、line、track、
route、wire、policy、string等の英単語と、こ
れら英単語の優先度が記入されている。図示の例
では、例えばlineの優先度は100、trackの優先度
は50である。辞書アクセス装置2は単語辞書1を
アクセスするものである。各単語に対応する優先
度は固定である。“線”に対応する英単語を検索
せよと言う指示を受け取ると、辞書アクセス装置
2は単語辞書1からline、track、route、wire、
policy、string等の英単語を読出し、これらを優
先度の大きいものから順番に並べて、要求元に渡
す。 The present invention relates to a method of selecting words corresponding to conceptual symbols from a word dictionary. FIG. 3 shows a conventional word selection method. In FIG. 3, 1 indicates a word dictionary, and 2 indicates a dictionary access device. In the word dictionary 1, for example, corresponding to the conceptual symbol "line", line, track,
English words such as route, wire, policy, string, etc. and the priority of these English words are entered. In the illustrated example, the priority of line is 100, and the priority of track is 50, for example. The dictionary access device 2 is for accessing the word dictionary 1. The priority corresponding to each word is fixed. Upon receiving the instruction to search for an English word corresponding to “line,” the dictionary access device 2 searches the word dictionary 1 for line, track, route, wire, etc.
Reads English words such as policy and string, arranges them in descending order of priority, and passes them to the requester.
従来の技術では、一つの概念記号に対応して複
数の訳語が対応している場合、訳語の優先度が入
力テキストに応じて動的に変化しないため、翻訳
結果において正しい訳語が与えられず、人間が修
正する必要があつた。
With conventional technology, when multiple translations correspond to one conceptual symbol, the priority of the translations does not change dynamically according to the input text, so the correct translation is not given in the translation result. It had to be corrected by a human.
本発明は、この点に鑑みて創作されたものであ
つて、訳語の優先度を動的に変更できるようにす
ることを目的としている。 The present invention was created in view of this point, and an object of the present invention is to enable dynamically changing the priority of translated words.
第1図は本発明の原理図である。第1図におい
て、3は翻訳装置、4は優先度変更装置、5はシ
ソーラス辞書、6は除外用語辞書、7は訳語分析
装置、8と9はその他の各種辞書をそれぞれ示し
ている。
FIG. 1 is a diagram showing the principle of the present invention. In FIG. 1, 3 is a translation device, 4 is a priority change device, 5 is a thesaurus dictionary, 6 is an excluded term dictionary, 7 is a translation analysis device, and 8 and 9 are other various dictionaries, respectively.
翻訳装置3は、形態素解析や構文解析、意味ネ
ツトワークの生成、構文の生成、形態素の生成な
どを行うものである。翻訳の過程で使用される訳
語(ユーザが介入して複数の訳語の中から一つを
選択した場合も含む)は、優先度変更装置4に送
られる。優先度変更装置4は、訳語を受け取る
と、これを訳語分析装置7に送る。訳語分析装置
7は、受け取つた文を分析して単語に分解し、分
析結果である単語を優先度変更装置4に返す。優
先度変更装置4は、除外用語辞書6を参照して訳
語分析装置7から送られて来た単語が除外単語で
あるか否かを調べる。除外単語とは、優先度変更
の対象とならない単語を意味している。その単語
が除外単語でない場合には、優先度変更装置4
は、シソーラス辞書を参照して、その単語の上位
語や同義語、関連語、下位語の優先度の上昇分を
決定する。優先度の上昇分情報は、バツフア記憶
域に格納される。この記憶域は辞書アクセス装置
2によつて参照可能である。概念記号に対応する
単語を読み取りたい場合、翻訳装置3は辞書アク
セス装置2に対して単語検索要求を送る。辞書ア
クセス装置2は、翻訳装置3からの単語検索要求
を受け取ると、その概念記号に対応する単語及び
優先度を単語辞書1から読み出す。そして、単語
辞書1から読み出した単語に対応する優先度上昇
分を上記のバツフア記憶域から読み出し、当該単
語の優先度と当該単語の上昇分とを加算し、更新
された優先度に従つて単語辞書1から読み出され
た単語を並びかえ、これらの単語を翻訳装置3に
渡す。辞書8と9はその他の辞書である。その他
の辞書としては、隣接関係辞書や文法規則辞書、
生成規則辞書、共起関係辞書、意味関係辞書など
がある。 The translation device 3 performs morphological analysis, syntactic analysis, generation of a semantic network, generation of syntax, generation of morphemes, and the like. Translated words used in the translation process (including when the user intervenes and selects one of a plurality of translated words) are sent to the priority change device 4. When the priority changing device 4 receives the translated word, it sends it to the translated word analyzing device 7. The translation analysis device 7 analyzes the received sentence, decomposes it into words, and returns the words as the analysis result to the priority change device 4. The priority change device 4 refers to the excluded word dictionary 6 to check whether the word sent from the translated word analysis device 7 is an excluded word. The excluded word means a word that is not subject to priority change. If the word is not an excluded word, the priority change device 4
refers to the thesaurus dictionary and determines the increase in priority of the word's broader terms, synonyms, related words, and narrower terms. Information about the increase in priority is stored in the buffer storage area. This storage area can be referenced by the dictionary access device 2. When it is desired to read a word corresponding to a conceptual symbol, the translation device 3 sends a word search request to the dictionary access device 2. When the dictionary access device 2 receives a word search request from the translation device 3, it reads out the word and priority corresponding to the conceptual symbol from the word dictionary 1. Then, the increase in priority corresponding to the word read from the word dictionary 1 is read from the buffer storage area, the priority of the word and the increase in priority of the word are added, and the word is read out according to the updated priority. The words read out from the dictionary 1 are rearranged and these words are passed to the translation device 3. Dictionaries 8 and 9 are other dictionaries. Other dictionaries include adjacency dictionaries, grammatical rules dictionaries,
There are production rule dictionaries, co-occurrence relation dictionaries, semantic relation dictionaries, etc.
第2図は単語の優先度変更の例を示す図であ
る。入力文は、(a)に示すように「飛行機の発達に
より…はねの構造は…」と言うものである。その
第1文の「飛行機の発達により…」の翻訳結果
は、(b)に示すように、「the development of
airplane…」であるとする。その結果の訳語を分
析した後、除外単語に×を付けたものが、(c)であ
る。この処理は、優先度変更装置4の除外用語辞
書6及び訳語分析装置7によつて行われる。対象
となつている用語airplaneのシソーラス辞書5中
の内容が(d)である。用語airplaneの上位語である
machineの優先度は10だけ上昇し、また用語
airplaneの上位語であるvehicleの優先度は50だ
け上昇し、airplaneの同義語であるaircraftの優
先度は200だけ上昇し、airplaneの関連語である
pilot、airfieldの優先度もそれぞれ200だけ上昇
し、airplaneの下位語であるwing、rudderの優
先度は100だけ上昇する。優先度の上昇により、
はねの訳語の優先度(feather p(100)、plume
(10)、wing(5))は(e)のように変化する。辞書ア
クセス装置2は、この変化後の訳語のリストを翻
訳装置3に渡す。これにより第n文中の“はね”
に対しては、(f)に示すように、はwingの訳語が
選択される。
FIG. 2 is a diagram showing an example of changing the priority of words. The input sentence, as shown in (a), is ``Due to the development of airplanes...the structure of the wings...''. The first sentence, “Due to the development of airplanes…” is translated as “the development of…” as shown in (b).
"airplane..." After analyzing the resulting translations, the excluded words are marked with a cross (c). This process is performed by the excluded term dictionary 6 and translated word analysis device 7 of the priority change device 4. The content of the target term airplane in the thesaurus dictionary 5 is (d). is a hypernym of the term airplane
The priority of machine is increased by 10 and also the term
The priority of vehicle, which is a hypernym of airplane, increases by 50, and the priority of aircraft, which is a synonym of airplane, increases by 200 and is a related word of airplane.
The priorities of pilot and airfield will also increase by 200, and the priorities of wing and rudder, which are hyponyms of airplane, will increase by 100. Due to increased priority,
Priority of translated words for feather (feather p (100), plume
(10), wing(5)) changes as shown in (e). The dictionary access device 2 passes this changed list of translated words to the translation device 3. This causes “splash” in the nth sentence.
As shown in (f), the translated word wing is selected for .
以上の説明から明らかなように、本発明によれ
ば、前後の文を考慮した訳語の選択が行われるこ
とになり、より高品質の翻訳結果が得られる。
As is clear from the above description, according to the present invention, translation words are selected in consideration of the preceding and following sentences, and higher quality translation results can be obtained.
第1図は本発明の原理図、第2図は単語の優先
度変更の例を示す図、第3図は従来の単語選択方
法を示す図である。
1……単語辞書、2……辞書アクセス装置、3
……翻訳装置、4……優先度変更装置、5……シ
ソーラス辞書、6……除外用語辞書、7……訳語
分析装置、8と9……その他の各種辞書。
FIG. 1 is a diagram showing the principle of the present invention, FIG. 2 is a diagram showing an example of changing the priority of words, and FIG. 3 is a diagram showing a conventional word selection method. 1...Word dictionary, 2...Dictionary access device, 3
...Translation device, 4...Priority change device, 5...Thesaurus dictionary, 6...Exclusion word dictionary, 7...Translation analysis device, 8 and 9...Other various dictionaries.
Claims (1)
書などの各種辞書を用いて機械翻訳を行う翻訳装
置において、 翻訳結果文を分析し、単語の並びに分解する訳
語分析装置7と、 優先度変更を行わない除外単語を記憶する除外
用語辞書6と、 単語の上位語や同義語、関連語、下位語などを
記憶するシソーラス辞書5と、 優先度変更装置4と、 単語辞書1と、 辞書アクセス装置2と を具備し、 上記優先度変更装置4は、 入力された翻訳結果文の分析を上記訳語分析装
置7に依頼し、 訳語分析装置7から単語の並びが返された時、
上記除外用語辞書6を参照して、単語の並びを構
成する単語が除外単語か否かを調べ、 除外単語でない単語について、上記シソーラス
辞書5を参照して、これら単語に関する上位語、
同義語、関連語、下位語についての優先度の上昇
分を求め、優先度の上昇分と対応する単語とを上
昇分記憶域に格納するように構成され、 上記辞書アクセス装置2は、 単語検索要求を受け取つたとき、当該単語検索
要求で指定された概念記号に対応する単語及びこ
れに付随する優先度を上記単語辞書1から読み出
し、 上記上昇分記憶域に、読出した単語に対応する
優先度上昇分が格納されている場合には、優先度
上昇分と読出された優先度とを加算し、加算結果
と読出した単語とを単語検索要求元に渡すように
構成されていること、 を特徴とする文脈を用いた翻訳装置。[Scope of Claims] 1. A translation device that performs machine translation using various dictionaries such as a word dictionary, a grammar rule dictionary, and a thesaurus dictionary, comprising: a translated word analysis device 7 that analyzes a translated sentence and breaks down the order of words; an excluded term dictionary 6 that stores excluded words whose degree is not changed; a thesaurus dictionary 5 that stores hypernyms, synonyms, related words, hyponyms, etc. of words; a priority change device 4; a word dictionary 1; The priority change device 4 requests the translated word analysis device 7 to analyze the input translation result sentence, and when the translated word analysis device 7 returns a word sequence,
With reference to the excluded word dictionary 6, it is checked whether or not the words constituting the word sequence are excluded words, and for words that are not excluded words, the thesaurus dictionary 5 is referred to, and the superordinate words related to these words are checked.
The dictionary access device 2 is configured to obtain the increase in priority for synonyms, related words, and subordinate words, and store the increase in priority and the corresponding word in the increase storage area, and the dictionary access device 2 performs a word search. When a request is received, the word corresponding to the conceptual symbol specified in the word search request and its accompanying priority are read from the word dictionary 1, and the priority corresponding to the read word is stored in the increase storage area. If the increase in priority is stored, the increase in priority is added to the read priority, and the addition result and the read word are passed to the word search request source. A translation device using the context.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61173059A JPS6329880A (en) | 1986-07-23 | 1986-07-23 | Translating device using context |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61173059A JPS6329880A (en) | 1986-07-23 | 1986-07-23 | Translating device using context |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6329880A JPS6329880A (en) | 1988-02-08 |
JPH0410109B2 true JPH0410109B2 (en) | 1992-02-24 |
Family
ID=15953453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61173059A Granted JPS6329880A (en) | 1986-07-23 | 1986-07-23 | Translating device using context |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6329880A (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0464171A (en) * | 1990-07-02 | 1992-02-28 | Nippon Telegr & Teleph Corp <Ntt> | Key word association generator |
-
1986
- 1986-07-23 JP JP61173059A patent/JPS6329880A/en active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS6329880A (en) | 1988-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5528491A (en) | Apparatus and method for automated natural language translation | |
US6760695B1 (en) | Automated natural language processing | |
JPS6299865A (en) | Maintenance system for co-occurrence relation dictionary of natural language | |
JP5100770B2 (en) | Word classification method in kanji sentences | |
Uchida | 4• 2 atlas ii: A machine translation system using conceptual structure as an interlingua | |
Abdurakhmonova et al. | Uzbek electronic corpus as a tool for linguistic analysis | |
Mousa | Natural Language Processing (NLP) | |
Jurkiewicz-Rohrbacher et al. | Clitic climbing, finiteness and the Raising-Control distinction. a corpus–based study | |
Bahrani et al. | A computational grammar for Persian based on GPSG | |
Inshakova | An anaphora resolution system for Russian based on ETAP-4 linguistic processor | |
JPH0410109B2 (en) | ||
KR100327115B1 (en) | Device and method for generating translated sentences based on partial translation patterns | |
Kocijan et al. | Recognizing verb-based Croatian idiomatic MWUs | |
Uchida | Atlas | |
Bowers et al. | Cloze, transformational theory and redundancy | |
JP2632806B2 (en) | Language analyzer | |
Hammouda et al. | Arabic NooJ parser: nominal sentence case | |
KR101589948B1 (en) | Machine translation method and apparatus for the same | |
JPH0439705B2 (en) | ||
Taraban et al. | Beyond recursion: critique of Hauser, Chomsky, and Fitch | |
Uchida | ATLAS: Fujitsu machine translation system | |
JP3136973B2 (en) | Language analysis system and method | |
Sonnenhauser et al. | Towards machine translation of Russian aspect | |
AFIFAH | DITRANSITIVE VERBS USED IN THE SELECTED SHORT STORIES BY LUCY MAUD MONTGOMERY | |
JP2011175306A (en) | Information processing device |