JPH07249044A - Machine translation device - Google Patents

Machine translation device

Info

Publication number
JPH07249044A
JPH07249044A JP6068004A JP6800494A JPH07249044A JP H07249044 A JPH07249044 A JP H07249044A JP 6068004 A JP6068004 A JP 6068004A JP 6800494 A JP6800494 A JP 6800494A JP H07249044 A JPH07249044 A JP H07249044A
Authority
JP
Japan
Prior art keywords
sentence
occurrence
dictionary
translation
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6068004A
Other languages
Japanese (ja)
Inventor
Shogo Shibata
昇吾 柴田
Tsuyoshi Yagisawa
津義 八木沢
Kazue Kaneko
和恵 金子
Makoto Hirota
誠 廣田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6068004A priority Critical patent/JPH07249044A/en
Publication of JPH07249044A publication Critical patent/JPH07249044A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To provide a machine translation device which can efficiently and accurately bring cooccurrence relation between words at the time of the translation of a sentence into consideration. CONSTITUTION:An input sentence 12 (a) is analyzed (b) into morphemes and the syntax structure is analyzed to extract words and phrases in cooccurrence relation; and the meanings of the constituent words of the words and phrases, English words corresponding to the semantics the parts of speech and the semantics of the English words, equivalents to the words and phrases are specified (d), equivalents to the words other than the constituent words are determined, and the syntax structure is converted (e) into syntax structure of English to generate a translation (f).

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、原言語の文を目標言語
の文に翻訳する機械翻訳装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device for translating a source language sentence into a target language sentence.

【0002】[0002]

【従来の技術】従来、コンピュータで自然言語を翻訳す
る場合には、自然言語ゆえのあいまい性が翻訳結果の精
度を悪化させる大きな原因となることが広く知られてい
る。
2. Description of the Related Art Conventionally, when a computer translates a natural language, it is widely known that the ambiguity due to the natural language is a major cause of degrading the accuracy of the translation result.

【0003】例えば、日本語の「買う」の語義は、基本
的には、「代金を支払って自分のものにする」ことであ
るが、「高く評価する」ことや「恨みやひんしゅくを受
ける」ことを表現する場合にも用いられる。このような
単語の多義性を原因とする翻訳のあいまい性は、文中の
単語数の増加とともに指数的に増大する。例えば、原言
語(翻訳元言語)の1つの単語の語義数を10として、
そのような単語が2つ並べば、単純に言って、10の自
乗で、100のあいまい性ができる。
For example, in Japanese, the meaning of "buy" is basically to "pay and make it your own", but to "highly appreciate" or "receive a grudge or a loss". It is also used when expressing things. The ambiguity of translation due to such polysemy of words increases exponentially as the number of words in the sentence increases. For example, if the number of meanings of one word in the source language (translation source language) is 10,
If two such words are lined up, simply speaking, 10 squared gives 100 ambiguities.

【0004】ところが、実際には、原言語の複数の単語
が、目標言語(翻訳先言語)の1つの単語に対応する場
合やその逆の場合もあるので、翻訳のあいまい性は更に
増大することになる。また、例えば、日本語と英語のよ
うに、その語彙のみならず言語間の構造の差異が大きな
場合には、その翻訳のあいまい性は更に大きなものとな
る。
However, in reality, a plurality of words in the source language may correspond to one word in the target language (translation target language) and vice versa, so that the ambiguity of translation is further increased. become. Further, for example, when there is a large difference in structure between languages as well as vocabulary such as Japanese and English, the ambiguity of the translation becomes even greater.

【0005】以上のような様々な要因の組み合わせによ
る前記あいまい性の増大に対抗するために、従来の機械
翻訳装置においては、単語間の共起関係を考慮して対訳
を決める手法が用いられている。
In order to counter the increase in ambiguity due to the combination of various factors as described above, a conventional machine translation apparatus uses a method of determining a bilingual translation in consideration of a co-occurrence relation between words. There is.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記従
来の機械翻訳装置においては、翻訳過程が、(1)原言語
の文の解析、(2)原言語から目標言語への変換、および
(3)目標言語の文の生成、の3段階にモジュール化され
ており、通常、前記原言語の文の解析は解析用辞書を用
いて行われ、前記原言語から目標言語への変換は翻訳用
辞書を用いて行われるため、異なった辞書で単語間の共
起を取り扱わざるを得なかった。例えば、「成果をあげ
る」という和文を英文に翻訳する場合には、各単語「成
果」および「上げる」の語義を解析用辞書を用いて決定
した後に、翻訳用辞書(和英辞書)を用いて、前記決定
された日本語語義に対応する英語対訳語義の中から適合
する英単語を選び出さなければならなかった。
However, in the conventional machine translation device described above, the translation process includes (1) analysis of a sentence in the source language, (2) conversion from the source language to the target language, and
(3) Generation of a sentence in the target language is modularized into three stages. Usually, the analysis of the source language sentence is performed using an analysis dictionary, and the conversion from the source language to the target language is translation. Since it is done using a special dictionary, we had to deal with co-occurrence between words in different dictionaries. For example, in the case of translating a Japanese sentence "achieve results" into English, after determining the meaning of each word "result" and "raise" using the analysis dictionary, use the translation dictionary (Japanese-English dictionary). It was necessary to select a matching English word from the English parallel translation meanings corresponding to the determined Japanese meanings.

【0007】このため上述したあいまい性を一挙に解消
することができず、全ての可能性を考慮するために、処
理が複雑且つ非効率的になり、更には、異なった辞書で
共起を扱うために、共起の整合性が取れなくなるおそれ
があった。
Therefore, the above-mentioned ambiguity cannot be resolved at once, and since all the possibilities are taken into consideration, processing becomes complicated and inefficient, and co-occurrence is handled by different dictionaries. Therefore, the co-occurrence may not be consistent.

【0008】本発明は、上記問題点を解決するためにな
されたもので、文を翻訳する際の単語間の共起関係の考
慮が、効率的且つ的確に行える機械翻訳装置を提供する
ことを目的とする。
The present invention has been made to solve the above problems, and it is an object of the present invention to provide a machine translation device capable of efficiently and accurately considering the co-occurrence relationship between words when translating a sentence. To aim.

【0009】[0009]

【課題を解決するための手段】上記目的を達成するため
に、本発明は、原言語の文の構文を解析する構文解析手
段を有し、原言語の文を目標言語の文に翻訳する機械翻
訳装置において、共起条件に関する情報を記憶する共起
条件辞書と、前記構文解析手段における構文解析結果か
ら前記共起条件辞書を用いて共起条件を検索すると共に
共起関係にある原言語の語句の対訳を決定する共起条件
検索手段とを設けたことを特徴とする機械翻訳装置を提
供する。
In order to achieve the above object, the present invention has a parsing means for parsing a syntax of a source language sentence, and a machine for translating a source language sentence into a target language sentence. In the translation device, a co-occurrence condition dictionary that stores information about co-occurrence conditions, and a co-occurrence condition dictionary that is searched from the syntactic analysis result in the syntactic analysis unit using the co-occurrence condition dictionary There is provided a machine translation device characterized by being provided with a co-occurrence condition search means for determining parallel translation of a phrase.

【0010】また、前記共起条件辞書は、共起関係にあ
る各単語の語義と、該各単語に対応する目標言語の単
語、および該目標言語の単語の品詞および語義とを保持
することが好ましい。
Further, the co-occurrence condition dictionary may hold word senses of words having a co-occurrence relationship, target language words corresponding to the respective words, and parts of speech and word senses of the target language words. preferable.

【0011】また、前記共起条件検索手段は、共起関係
にある原言語の単語の語義並びに該単語に対応する目標
言語の対訳の品詞及び語義を決定することが好ましい。
Further, it is preferable that the co-occurrence condition searching means determines a word meaning of a word in a source language having a co-occurrence relationship and a part of speech and a word meaning of a target language corresponding to the word.

【0012】また、同じ目的を達成するために、本発明
は、原言語の文を保持する原文保持手段と、前記原言語
の文の形態素を解析する形態素解析手段と、前記原言語
の文の構文を解析する構文解析手段と、共起条件に関す
る情報を記憶する共起条件辞書と、前記構文解析手段に
おける構文解析結果から前記共起条件辞書を用いて共起
条件を検索すると共に共起関係にある原言語の語句の対
訳を決定する共起条件検索手段と、前記原言語の文の意
味を解析する意味解析手段と、原言語と目標言語との対
訳辞書を格納する翻訳辞書と、前記翻訳辞書から前記原
言語の文の単語に対応する目標言語の単語を取り出す翻
訳辞書検索手段と、前記原言語の文の構文的構造を前記
目標言語の構文的構造に変換する構造変換手段と、前記
構造変換手段における変換結果から目標言語の文を組み
上げる翻訳文生成手段と、前記翻訳文生成手段により生
成された文を保持する翻訳文保持手段とを備えたことを
特徴とする機械翻訳装置を提供する。
In order to achieve the same object, the present invention has an original sentence holding means for holding a sentence in a source language, a morpheme analyzing means for analyzing a morpheme of the sentence in the source language, and a sentence in the source language. A syntactic analysis unit that analyzes a syntactic structure, a co-occurrence condition dictionary that stores information about co-occurrence conditions, a co-occurrence condition that is searched from the syntactic analysis result in the syntactic analysis unit using the co-occurrence condition dictionary, and a co-occurrence relationship. A co-occurrence condition search means for determining a parallel translation of a phrase in the source language, a semantic analysis means for analyzing the meaning of the sentence in the source language, a translation dictionary for storing a parallel translation dictionary for the source language and the target language, A translation dictionary search means for extracting a word in the target language corresponding to a word in the source language sentence from the translation dictionary, and a structure conversion means for converting the syntactic structure of the source language sentence into the syntactic structure of the target language, In the structure conversion means A translation generating means assembling the sentence of the target language from the conversion results that, to provide a machine translation apparatus is characterized in that a translation holding means for holding the generated sentence by the translation generation means.

【0013】[0013]

【作用】請求項1の機械翻訳装置によれば、原言語の文
は、構文構造が解析され、共起条件辞書を用いて共起条
件が検索されると共に共起関係にある原言語の語句の対
訳が決定される。
According to the machine translation device of claim 1, the source language sentence is analyzed for syntactic structure, the co-occurrence condition is searched using the co-occurrence condition dictionary, and the source language phrase in the co-occurrence relation is searched. Will be translated.

【0014】請求項2の機械翻訳装置によれば、共起条
件辞書には、共起関係にある各単語の語義と、該各単語
に対応する目標言語の単語、および該目標言語の単語の
品詞および語義とが保持される。
According to the machine translation apparatus of claim 2, the co-occurrence condition dictionary stores the meaning of each word having a co-occurrence relationship, the target language word corresponding to each word, and the target language word. Part of speech and meaning are retained.

【0015】請求項3の機械翻訳装置によれば、共起関
係にある原言語の単語の語義並びに該単語に対応する目
標言語の対訳の品詞及び語義が決定される。
According to the machine translation apparatus of the third aspect, the word meaning of a word in the source language having a co-occurrence relationship and the part of speech and word meaning of the target translation corresponding to the word are determined.

【0016】請求項4の機械翻訳装置によれば、原言語
の文は、形態素が解析され、構文構造が解析され、共起
条件辞書を用いて共起条件が検索されると共に共起関係
にある原言語の語句の対訳が決定され、意味が解析さ
れ、翻訳辞書から文の単語に対応する目標言語の単語が
取り出され、目標言語の構文的構造に変換され、目標言
語の文に組み上げられる。
According to the machine translation apparatus of claim 4, the source language sentence is analyzed for morphemes, for syntactic structure, for co-occurrence conditions are searched using the co-occurrence condition dictionary, and for co-occurrence relations. A parallel translation of a certain source language phrase is determined, the meaning is analyzed, the target language word corresponding to the sentence word is extracted from the translation dictionary, converted into the target language syntactic structure, and assembled into the target language sentence. .

【0017】[0017]

【実施例】以下、図面を参照して、本発明の実施例を説
明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0018】図1は、本発明の一実施例に係る機械翻訳
装置の概略構成を示すブロック図である。
FIG. 1 is a block diagram showing a schematic configuration of a machine translation device according to an embodiment of the present invention.

【0019】同図において、1は、例えばキーボードや
マウスによって構成され、翻訳しようとする原文を入力
するための入力装置、2は、ROM(リードオンリメモ
リ)、若しくはRAM(ランダムアクセスメモリ)、又
はその組み合わせ、あるいはディスク装置によって構成
される記憶装置、3は、本実施例装置の動作を制御する
CPU(中央制御装置)、4は入力装置1により入力さ
れた原文、あるいはその翻訳文等をディスプレイ上に表
示し、又は前記翻訳文等を印刷して出力する出力装置で
ある。なお、入力装置1としては、ディスクの読み取り
装置や光学式の読み取り装置を用いてもよい。
In the figure, 1 is an input device for inputting an original sentence to be translated, which is composed of, for example, a keyboard and a mouse, 2 is a ROM (read only memory), a RAM (random access memory), or A storage device constituted by a combination thereof, or a disk device, 3 is a CPU (central control unit) for controlling the operation of the apparatus of this embodiment, and 4 is a display of the original text input by the input device 1 or its translated text. It is an output device that displays the above or prints the translated text and outputs it. A disc reader or an optical reader may be used as the input device 1.

【0020】また、図2に示すように、記憶装置2に
は、入力装置1から入力された原文(翻訳元言語である
原言語の文)を保持する原文保持部2a、共起条件に関
する情報を記憶する共起条件辞書2b、原言語と目標言
語との対情報である対訳辞書を格納する翻訳辞書2c、
および翻訳文生成部3gにおいて生成された翻訳文を保
持する翻訳文保持部2dが格納され、CPU3は、原文
保持部2aに保持された原文を形態素に解析する形態素
解析部3a、形態素解析部3aにおける解析結果から、
原文の構文的な構造を解析する構文解析部3b、共起条
件辞書2bを検索して、前記構文解析部3における解析
結果から、共起関係にある単語を抽出する共起条件検索
部3c、原文の意味的な関係を明らかにする意味解析部
3d、翻訳辞書2cを検索して、意味解析部3dにおけ
る解析結果に対訳付けを行う翻訳辞書検索部3e、原言
語の構文構造を、目標言語の構文構造に変換する構造変
換部3f、構造変換部3fにおける変換結果から、翻訳
文を生成する翻訳文生成部3gを構成する。
Further, as shown in FIG. 2, the storage device 2 stores a source sentence (a sentence in the source language which is the source language) input from the input device 1 in the source sentence storage portion 2a, and information on co-occurrence conditions. A co-occurrence condition dictionary 2b, a translation dictionary 2c that stores a bilingual dictionary that is pair information of a source language and a target language,
Also, a translation sentence holding unit 2d that holds the translation sentence generated by the translation sentence generating unit 3g is stored, and the CPU 3 analyzes the original sentence held in the original sentence holding unit 2a into morphemes and the morpheme analyzing unit 3a. From the analysis results in
A co-occurrence condition search unit 3c that searches the syntactic analysis unit 3b that analyzes the syntactic structure of the original sentence and the co-occurrence condition dictionary 2b, and extracts words that have a co-occurrence relationship from the analysis result of the syntactic analysis unit 3. A translation analysis unit 3d that clarifies the semantic relationship of the original sentence, and a translation dictionary search unit 3e that searches the translation dictionary 2c and parallel translates the analysis result in the semantic analysis unit 3d. The structure conversion unit 3f that converts the syntactical structure of the translation conversion unit 3f, and the translation result generation unit 3g that generates a translation sentence from the conversion result in the structure conversion unit 3f.

【0021】なお、図2には図示されていないが、記憶
装置2には、形態素解析部3b、構文解析部3c、およ
び意味解析部3dにおいて用いられる解析用辞書、並び
に英単語の語義を記憶する英語辞書や日本語単語の語義
を記憶する日本語辞書が格納されている。
Although not shown in FIG. 2, the storage device 2 stores an analysis dictionary used in the morphological analysis unit 3b, the syntax analysis unit 3c, and the semantic analysis unit 3d, and the meaning of English words. It stores an English dictionary and a Japanese dictionary that stores the meaning of Japanese words.

【0022】次に、図3乃至図6を参照して、本実施例
装置の動作を説明する。
Next, the operation of the apparatus according to this embodiment will be described with reference to FIGS.

【0023】図3は、本実施例装置が行う翻訳処理手順
を示すフローチャート、図4は、同装置が行う翻訳処理
の過程でディスプレイ(出力装置4)上に表示される表
示例を示す図である。
FIG. 3 is a flow chart showing a translation processing procedure performed by the apparatus of this embodiment, and FIG. 4 is a diagram showing a display example displayed on the display (output device 4) during the translation processing performed by the apparatus. is there.

【0024】まず、ステップS1において、入力装置1
から入力されると、原文保持部2aに保持された「彼が
成果を上げた。」という入力文12がディスプレイ上に
表示される(図4(a))。次に、入力文12は、形態
素解析部3aにおいて、形態素解析されて(ステップS
2)、図4(b)に示すように形態素解析結果13がデ
ィスプレイ上に表示される。次に、該解析結果13を用
いて、構文解析部3bにより、前記入力文12の構文が
解析されて(ステップS3)、図4(c)に示すような
構文解析結果14がディスプレイ上に表示される。この
解析結果14においては、「彼が」および「成果」が、
それぞれ、「上げた」に係っていることが示されてい
る。
First, in step S1, the input device 1
When input from, the input sentence 12 "He made a result." Held in the original sentence holding unit 2a is displayed on the display (FIG. 4A). Next, the input sentence 12 is morphologically analyzed by the morphological analysis unit 3a (step S
2), the morphological analysis result 13 is displayed on the display as shown in FIG. Next, the syntax analysis unit 3b analyzes the syntax of the input sentence 12 using the analysis result 13 (step S3), and a syntax analysis result 14 as shown in FIG. 4C is displayed on the display. To be done. In this analysis result 14, "he is" and "results" are
Each is shown to be associated with "raising."

【0025】次に、共起条件検索部3cは、構文解析結
果14の中に共起関係にある構成要素があるか否かを、
共起条件辞書2bを検索して判定する(ステップS
4)。図5は、共起条件辞書2bの記憶内容の一例を示
す図であり、この記憶内容例15において、各記憶内容
1,2,3は、それぞれ、見出し、日本語語義部、およ
び英語語義部の3つの項目から構成されている。共起条
件検索部3cは、このような共起条件辞書2bを検索し
て、入力文12においては、「彼(が)」と「上げる」
との間には共起関係はなく、「成果(を)」と「上げ
る」が、図3の記憶内容2と一致するので、共起関係に
ある(YES)と判定する。共起関係がないときは、図
4(d)に示す結果15aがディスプレイ上に表示され
る。
Next, the co-occurrence condition search unit 3c determines whether or not the syntactic analysis result 14 includes components having a co-occurrence relationship.
The co-occurrence condition dictionary 2b is searched to determine (step S
4). FIG. 5 is a diagram showing an example of the storage contents of the co-occurrence condition dictionary 2b. In this storage contents example 15, the storage contents 1, 2, and 3 are the heading, the Japanese word meaning part, and the English word meaning part, respectively. It consists of three items. The co-occurrence condition search unit 3c searches such a co-occurrence condition dictionary 2b, and in the input sentence 12, "he (ga)" and "raise".
Since there is no co-occurrence relationship between and, and “result (wa)” and “raise” match the memory content 2 in FIG. 3, it is determined that they have a co-occurrence relationship (YES). When there is no co-occurrence relationship, the result 15a shown in FIG. 4 (d) is displayed on the display.

【0026】一方、共起関係があるときは、共起条件検
索部3cは、前記記憶内容2の日本語語義部に予め格納
されたデータから、入力文12の「成果」は名詞であ
り、図6に示す日本語辞書内に格納された「成果」とい
う見出し語の中で、語義番号「004」が付された「で
きあがった(よい)結果」という語義であることを特定
し、「上げる」は動詞であり、前記見出し語「上げる」
の中で、語義番号「018」が付された「良い結果を得
られる。」という語義であることを特定する(ステップ
S5)。更に、共起条件検索部3cは、前記記憶内容2
の英語語義部に予め格納されたデータから、「上げる」
の対訳語「produce」が他動詞(vt.) であり、前記英語
辞書に格納された見出し語「produce」の中で、語義番
号「005」の語義であることを特定し、「成果」の対
訳語「result」が、名詞(n.)であり、前記英語辞書に格
納された見出し語「result」の中で、語義番号「00
3」の語義であることを特定し、また、上記「result」
は、連体修飾に形容詞(adj.)「good」が必要で、複数
形、無冠詞で用いられることを特定して、「成果を上げ
る」の対訳が、「produce good results」であることを
特定する(ステップS6)。そして、ステップS4〜S
6の処理結果15bが、図4(d)に示すように、ディ
スプレイ上に表示される。
On the other hand, when there is a co-occurrence relation, the co-occurrence condition search unit 3c determines that the "result" of the input sentence 12 is a noun from the data stored in advance in the Japanese word meaning part of the storage content 2. Among the headwords “results” stored in the Japanese dictionary shown in FIG. 6, it is specified that the meaning is “finished (good) result” with the meaning number “004”, and “increase”. ”Is a verb, and the headword“ raise ”
Among the above, it is specified that it has the meaning of “getting good results” with the meaning number “018” (step S5). Furthermore, the co-occurrence condition search unit 3c determines that the storage contents 2
"Increase" from the data stored in English
It is specified that the translation word “produce” of is a transitive verb (vt.), And that it has the meaning of the meaning number “005” in the entry word “produce” stored in the English dictionary. The word "result" is a noun (n.), And the meaning number "00" is included in the headword "result" stored in the English dictionary.
3), and the above "result"
Identifies that the adjective "adj.""Good" is required for adnominal modification, and that it is used in the plural form, no article, and that the parallel translation of "achieve results" is "produce good results" Yes (step S6). Then, steps S4 to S
The processing result 15b of No. 6 is displayed on the display as shown in FIG.

【0027】上述したような、共起条件検索部3cにお
ける処理を終えた後に、意味解析部3dにより原文の意
味解析が行われ(ステップS7)、翻訳辞書検索部3e
により共起関係にある語以外の語の対訳付けが行われ
(ステップS8)、構造変換部3fにより、日本語の構
文構造が、図4(e)に示すような英語の意味表現16
に変換されてディスプレイ上に表示され(ステップS
9)、該意味表現16から、翻訳文生成部3gにより図
4(f)に示すような翻訳文17が生成されてディスプ
レイ上に表示され(ステップS10)、該生成された翻
訳文17が翻訳文保持部2dにおいて保持される。
After the processing in the co-occurrence condition search unit 3c as described above is completed, the semantic analysis unit 3d analyzes the meaning of the original sentence (step S7), and the translation dictionary search unit 3e.
The words other than the words having the co-occurrence relation are translated (step S8), and the structural conversion unit 3f converts the Japanese syntactic structure into English meaning expressions 16 as shown in FIG.
Converted to and displayed on the display (step S
9), the translated sentence generator 3g generates a translated sentence 17 as shown in FIG. 4F from the semantic representation 16 and displays it on the display (step S10). The generated translated sentence 17 is translated. It is held in the sentence holding unit 2d.

【0028】従来の翻訳処理では、ステップS7の意味
解析処理において、例えば、上記「上げる」の語義を、
図6に示す日本語辞書の複数の語義文から特定し、更
に、ステップS8の未決定の対訳決定処理において、前
記特定された語義の対訳を、図7に示す和英辞書の英語
対訳語義の複数の候補の中から選び出さなければならな
い。
In the conventional translation process, in the semantic analysis process of step S7, for example, the meaning of "raise" is
A plurality of word meaning sentences of the Japanese dictionary shown in FIG. 6 are specified, and further, in the undecided parallel translation determination process of step S8, the parallel translation of the specified word meaning is made into a plurality of English parallel translation meanings of the Japanese-English dictionary shown in FIG. Must be selected from among the candidates.

【0029】これに対し、本実施例によれば、ステップ
S4において、構文解析終了直後に原言語の単語の共起
を考慮するので、原文の解析処理を簡略化することがで
きる。また、ステップS5およびS6において、共起関
係にある各単語の語義と、該各単語に対応する目標言語
の単語、および該目標言語の単語の品詞や語義等が格納
された共起条件辞書を用いることにより、原文語義およ
び目標言語の対訳の決定を行うので、訳語抽出処理、お
よび訳語選択処理を簡略化することができ、更に、解析
辞書と翻訳辞書との共起の整合性がとれなくなるという
問題を解消することができる。
On the other hand, according to the present embodiment, in step S4, the co-occurrence of words in the source language is taken into consideration immediately after the completion of the syntax analysis, so that the analysis process of the source sentence can be simplified. Further, in steps S5 and S6, a co-occurrence condition dictionary that stores the meaning of each word having a co-occurrence relationship, the word of the target language corresponding to each word, and the part of speech and word meaning of the word of the target language is stored. By using it, it is possible to determine the source word meaning and the target language bilingual translation, so the translation extraction process and translation selection process can be simplified, and the co-occurrence consistency between the analysis dictionary and the translation dictionary cannot be maintained. The problem can be solved.

【0030】なお、上述した実施例においては、和文か
ら英文への翻訳例を説明したが、単語の共起はあらゆる
言語に共通な現象と考えられるので、本発明は、あらゆ
る言語から他のあらゆる言語への翻訳に適用し得るもの
である。
In the above-described embodiment, an example of translation from Japanese to English has been described. However, since co-occurrence of words is considered to be a phenomenon common to all languages, the present invention is applicable to all languages. It can be applied to translation into a language.

【0031】また、上記実施例においては、共起関係に
ある語が抽出された場合に、自動的に共起条件辞書を用
いての翻訳が行われていたが、該共起条件辞書による翻
訳を行うか、又は逐語的に通常に翻訳するかを、メニュ
ー等を用いて、対話的に制御できるようにしてもよい。
Further, in the above embodiment, when the words having the co-occurrence relation are extracted, the translation is automatically performed using the co-occurrence condition dictionary. It may be possible to interactively control, by using a menu or the like, whether to perform or to normally translate literally.

【0032】また、上記実施例においては、名詞と動詞
とが格助詞を介して接続する共起を扱ったが、これに限
られるものではなく、名詞と名詞、形容詞と名詞、ある
いは副詞と動詞等、あらゆる品詞間の二項関係の共起に
適用してもよいし、更には、2つの単語の間のみなら
ず、3つ以上の単語の共起関係を考慮してもよい。
In the above embodiment, the co-occurrence in which the noun and the verb are connected via the case particle was dealt with, but the invention is not limited to this. The noun and the noun, the adjective and the noun, or the adverb and the verb. Etc. may be applied to co-occurrence of binary relations between all parts of speech, and further, co-occurrence relations of three or more words may be considered as well as between two words.

【0033】また、上記実施例においては、日本語の1
単語が英語の1単語に対応するものとして共起を取り扱
ったが、例えば、「心(に)描く」という2語の日本語
の単語を「imagine」という1語の英単語に置き換える
場合のように、複数の単語が数の異なる単語へと翻訳さ
れるような共起に適用してもよい。
In the above embodiment, the Japanese 1
Although co-occurrence was treated as a word corresponding to one English word, for example, when replacing two Japanese words "drawing a heart" with one English word "imagine" Alternatively, it may be applied to co-occurrence in which multiple words are translated into a different number of words.

【0034】また、上記実施例においては、慣用表現的
な共起関係を扱っていたが、これに限らず、例えば、
「本(を)買う」のような使用頻度の高い表現を予め登
録しておけば、翻訳精度と翻訳速度を向上させることも
できる。
Further, in the above embodiment, the co-occurrence relation in an idiomatic expression was dealt with, but the present invention is not limited to this.
If a frequently used expression such as "buy (book)" is registered in advance, translation accuracy and translation speed can be improved.

【0035】[0035]

【発明の効果】以上詳述したように、請求項1又は4の
機械翻訳装置によれば、原言語の文は、構文構造が解析
され、共起条件辞書を用いて共起条件が検索されると共
に共起関係にある原言語の語句の対訳が決定されるの
で、共起関係を、解析の浅い段階で考慮でき、原文の解
析処理を簡略化することができる。また、共起関係を単
一の辞書で取り扱うことができ、共起の整合性が取れな
くなるという問題を解消することができる。
As described above in detail, according to the machine translation apparatus of the first or fourth aspect, the sentence structure of the source language is analyzed for syntactic structure, and the co-occurrence condition dictionary is searched for using the co-occurrence condition dictionary. In addition, since the bilingual translation of the original language phrase having the co-occurrence relation is determined, the co-occurrence relation can be considered in the shallow analysis stage, and the analysis process of the original sentence can be simplified. Further, the co-occurrence relation can be handled by a single dictionary, and the problem that the co-occurrence consistency cannot be obtained can be solved.

【0036】請求項2の機械翻訳装置によれば、共起条
件辞書には、共起関係にある各単語の語義と、該各単語
に対応する目標言語の単語、および該目標言語の単語の
品詞および語義とが保持されるので、訳語抽出処理、お
よび訳語選択処理を簡略化することができる。
According to the machine translation device of the second aspect, the co-occurrence condition dictionary stores the meaning of each word having a co-occurrence relationship, the target language word corresponding to each word, and the target language word. Since the part of speech and the word meaning are held, the translation word extraction processing and the translation word selection processing can be simplified.

【0037】請求項3の機械翻訳装置によれば、共起関
係にある原言語の単語の語義並びに該単語に対応する目
標言語の対訳の品詞及び語義が決定されるので、簡略化
された処理により、的確な訳語選択を行うことができ
る。
According to the machine translation device of the third aspect, the meaning of a word in the source language having a co-occurrence relationship and the part of speech and the meaning of the target language corresponding to the word are determined. With this, it is possible to select an accurate translated word.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係る機械翻訳装置の概略構
成を示すブロック図である。
FIG. 1 is a block diagram showing a schematic configuration of a machine translation device according to an embodiment of the present invention.

【図2】図1の装置の記憶装置2、およびCPU3の詳
細を示す図である。
FIG. 2 is a diagram showing details of a storage device 2 and a CPU 3 of the device shown in FIG.

【図3】図1の装置による翻訳処理手順を示すフローチ
ャートである。
FIG. 3 is a flowchart showing a translation processing procedure by the apparatus of FIG.

【図4】図1の装置による翻訳処理の一例を示す図であ
る。
FIG. 4 is a diagram showing an example of translation processing by the apparatus of FIG.

【図5】図1の装置の共起条件辞書4の記憶内容の一例
を示す図である。
5 is a diagram showing an example of stored contents of a co-occurrence condition dictionary 4 of the apparatus of FIG.

【図6】図1の装置の日本語辞書の記憶内容の一例を示
す図である。
FIG. 6 is a diagram showing an example of stored contents of a Japanese dictionary of the apparatus of FIG.

【図7】図1の装置の翻訳辞書7の記憶内容の一例を示
す図である。
FIG. 7 is a diagram showing an example of stored contents of a translation dictionary 7 of the apparatus shown in FIG.

【符号の説明】[Explanation of symbols]

1 入力装置 2 記憶装置 2a 原文保持部(原文保持手段) 2b 共起条件辞書 2c 翻訳辞書 2d 翻訳文保持部(翻訳文保持手段) 3 CPU 3a 形態素解析部(形態素解析手段) 3b 構文解析部(構文解析手段) 3c 共起条件検索部(共起条件検索手段) 3d 意味解析部(意味解析手段) 3e 翻訳辞書検索部(翻訳辞書検索手段) 3f 構造変換部(構造変換手段) 3g 翻訳文生成部(翻訳文生成手段) DESCRIPTION OF SYMBOLS 1 input device 2 storage device 2a original sentence holding unit (original sentence holding unit) 2b co-occurrence condition dictionary 2c translation dictionary 2d translation sentence holding unit (translation sentence holding unit) 3 CPU 3a morphological analysis unit (morphological analysis unit) 3b syntax analysis unit ( Syntactic analysis means) 3c co-occurrence condition search section (co-occurrence condition search means) 3d semantic analysis section (semantic analysis means) 3e translation dictionary search section (translation dictionary search means) 3f structure conversion section (structure conversion means) 3g translated sentence generation Department (Translated sentence generation means)

───────────────────────────────────────────────────── フロントページの続き (72)発明者 廣田 誠 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 ─────────────────────────────────────────────────── ─── Continued front page (72) Inventor Makoto Hirota 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Minor Fujita 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Within the corporation

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 原言語の文の構文を解析する構文解析手
段を有し、原言語の文を目標言語の文に翻訳する機械翻
訳装置において、共起条件に関する情報を記憶する共起
条件辞書と、前記構文解析手段における構文解析結果か
ら前記共起条件辞書を用いて共起条件を検索すると共に
共起関係にある原言語の語句の対訳を決定する共起条件
検索手段とを設けたことを特徴とする機械翻訳装置。
1. A co-occurrence condition dictionary that stores information about co-occurrence conditions in a machine translation device that has a syntax analysis unit that analyzes a syntax of a source language sentence and that translates a source language sentence into a target language sentence. And a co-occurrence condition retrieving unit for retrieving a co-occurrence condition from the syntactic analysis result in the syntactic analysis unit using the co-occurrence condition dictionary and determining a bilingual translation of a source language phrase having a co-occurrence relationship. Machine translation device characterized by.
【請求項2】 前記共起条件辞書は、共起関係にある各
単語の語義と、該各単語に対応する目標言語の単語、お
よび該目標言語の単語の品詞および語義とを保持するこ
とを特徴とする請求項1記載の機械翻訳装置。
2. The co-occurrence condition dictionary holds word senses of words having a co-occurrence relationship, target language words corresponding to the respective words, and parts of speech and word senses of the target language words. The machine translation device according to claim 1, which is characterized in that.
【請求項3】 前記共起条件検索手段は、共起関係にあ
る原言語の単語の語義並びに該単語に対応する目標言語
の対訳の品詞及び語義を決定することを特徴とする請求
項2記載の機械翻訳装置。
3. The co-occurrence condition search means determines a word meaning of a source language word having a co-occurrence relationship and a part of speech and a word meaning of a target language corresponding to the word. Machine translation device.
【請求項4】 原言語の文を保持する原文保持手段と、
前記原言語の文の形態素を解析する形態素解析手段と、
前記原言語の文の構文を解析する構文解析手段と、共起
条件に関する情報を記憶する共起条件辞書と、前記構文
解析手段における構文解析結果から前記共起条件辞書を
用いて共起条件を検索すると共に共起関係にある原言語
の語句の対訳を決定する共起条件検索手段と、前記原言
語の文の意味を解析する意味解析手段と、原言語と目標
言語との対訳辞書を格納する翻訳辞書と、前記翻訳辞書
から前記原言語の文の単語に対応する目標言語の単語を
取り出す翻訳辞書検索手段と、前記原言語の文の構文的
構造を前記目標言語の構文的構造に変換する構造変換手
段と、前記構造変換手段における変換結果から目標言語
の文を組み上げる翻訳文生成手段と、前記翻訳文生成手
段により生成された文を保持する翻訳文保持手段とを備
えたことを特徴とする機械翻訳装置。
4. A source sentence holding means for holding a source language sentence,
Morpheme analysis means for analyzing morphemes of the sentence in the source language,
A syntactic analysis unit that analyzes the syntax of the sentence of the source language, a co-occurrence condition dictionary that stores information about co-occurrence conditions, and a co-occurrence condition dictionary that uses the co-occurrence condition dictionary from the syntactic analysis result in the syntactic analysis unit. A co-occurrence condition search means for searching and determining a parallel translation of a source language phrase having a co-occurrence relationship, a semantic analysis means for analyzing the meaning of the source language sentence, and a bilingual dictionary for the source language and the target language are stored. A translation dictionary, a translation dictionary search means for extracting a word in the target language corresponding to a word in the source language sentence from the translation dictionary, and converting the syntactic structure of the source language sentence into the syntactic structure of the target language. And a translated sentence holding unit for holding the sentence generated by the translated sentence generating unit. When That machine translation apparatus.
JP6068004A 1994-03-11 1994-03-11 Machine translation device Pending JPH07249044A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6068004A JPH07249044A (en) 1994-03-11 1994-03-11 Machine translation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6068004A JPH07249044A (en) 1994-03-11 1994-03-11 Machine translation device

Publications (1)

Publication Number Publication Date
JPH07249044A true JPH07249044A (en) 1995-09-26

Family

ID=13361297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6068004A Pending JPH07249044A (en) 1994-03-11 1994-03-11 Machine translation device

Country Status (1)

Country Link
JP (1) JPH07249044A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146961A (en) * 1995-11-24 1997-06-06 Nec Corp Standard document generation system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146961A (en) * 1995-11-24 1997-06-06 Nec Corp Standard document generation system

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
JPH0644296A (en) Machine translating system
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
JPS61163467A (en) Translation method
JPH02308370A (en) Machine translation system
JPH05314166A (en) Electronic dictionary and dictionary retrieval device
JP4304268B2 (en) Third language text generation algorithm, apparatus, and program by inputting bilingual parallel text
JP2815714B2 (en) Translation equipment
JPH05120324A (en) Language processing system
Hirakawa et al. EJ/JE Machine Translation System ASTRANSAC—Extensions toward Personalization
Pinnis et al. Tilde MT platform for developing client specific MT solutions
JPH07249044A (en) Machine translation device
Jolly et al. A broad coverage of corpus for understanding translation divergences
JP2000250913A (en) Example type natural language translation method, production method and device for list of bilingual examples and recording medium recording program of the production method and device
JP4088681B2 (en) Language processing device with multi-language input
JP2521435B2 (en) Japanese generator
JP2002269085A (en) Device and method for machine translation
Zhang et al. Paraphrasing spoken Chinese using a paraphrase corpus
JPH0561902A (en) Mechanical translation system
JP2715875B2 (en) Multilingual summary generator
Chaudhary et al. A Study of Transliteration Approaches
JP2719453B2 (en) Machine translation equipment
JP4023384B2 (en) Natural language translation method and apparatus and natural language translation program
JPH05225232A (en) Automatic text pre-editor
JP3313810B2 (en) Aspect processing device