JPH02281374A - Hyphenated word processing method in machine translation equipment - Google Patents

Hyphenated word processing method in machine translation equipment

Info

Publication number
JPH02281374A
JPH02281374A JP1104237A JP10423789A JPH02281374A JP H02281374 A JPH02281374 A JP H02281374A JP 1104237 A JP1104237 A JP 1104237A JP 10423789 A JP10423789 A JP 10423789A JP H02281374 A JPH02281374 A JP H02281374A
Authority
JP
Japan
Prior art keywords
word
hyphen
dictionary
translation
compound word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1104237A
Other languages
Japanese (ja)
Other versions
JPH0719260B2 (en
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Nakamura
中村 いち子
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1104237A priority Critical patent/JPH0719260B2/en
Priority to US07/513,254 priority patent/US5065318A/en
Priority to EP90304350A priority patent/EP0398513B1/en
Priority to DE69025091T priority patent/DE69025091T2/en
Publication of JPH02281374A publication Critical patent/JPH02281374A/en
Publication of JPH0719260B2 publication Critical patent/JPH0719260B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To obtain a correct translation result of a hyphonated word by translating only the words before and after a hyphen and synthesizing them, in the case of a word before the hyphen is a noun, and a word after the hyphen is a present participle or a past participle. CONSTITUTION:As a result of consulting a dictionary, in the case of a word before a hyphen of a divided composite word is a noun, and also, a word after the hyphen is a present participle or a past participle, a dictionary consulting morpheme analyzing part 11 executes a translation by only the words before and after the hyphen, based on dictionary consulting information which is held in accordance with the composite word. Subsequently, the result of this translation is allowed to correspond to the composite word and held in a memory. Next, a translation generating part 14 outputs a translated word, based on translation result information held in the memory in accordance with this composite word, and generates a translation. In such a way, even if the composite word is not registered in a user dictionary, a correct translation result can be obtained.

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は機械翻訳装置のハイフン合成語処理方法にに関
するものである。
DETAILED DESCRIPTION OF THE INVENTION <Industrial Application Field> The present invention relates to a method for processing hyphen compound words in a machine translation device.

〈従来技術〉 従来の機械翻訳装置において、入力された文章中にハイ
フンで合成された合成語が含まれている場合は、ハイフ
ン合成語が辞書に含まれていないため名詞として処理さ
れ、該合成語をハイフン前後で分割し、ハイフン前とハ
イフン後の単語毎に辞書引きして夫々の訳語を生成し、
該訳語を単に並べて出力していた。
<Prior art> In conventional machine translation devices, when an input sentence contains a compound word composed with a hyphen, the compound word with a hyphen is not included in the dictionary, so it is processed as a noun, and the compound word is processed as a noun. Divide the word before and after the hyphen, look it up in a dictionary for each word before and after the hyphen, and generate translations for each word.
The translated words were simply lined up and output.

又、別の方法として使用者が予めユーザー辞書にハイフ
ン合成語を登録しておき、該合成語を翻訳する際には前
記ユーザー辞書を参照させる方法があった。
Another method is to have the user register a hyphen compound word in a user dictionary in advance, and refer to the user dictionary when translating the compound word.

〈発明が解決しようとする課題〉 上述したように上記機械翻訳装置では入力されたハイフ
ン合成語に対して辞書に含まれていなければ名詞として
処理を行う。それ故、例えばハイフンによって名詞と現
在分詞或いは名詞と過去分詞が合成され、形容詞句とな
るハイフン合成語に対しては、翻訳に失敗して誤まった
結果を出すか、原語のtま出力して正しい翻訳結果が得
られなかった。
<Problems to be Solved by the Invention> As described above, the machine translation device processes the input hyphen compound word as a noun if it is not included in the dictionary. Therefore, for example, if a hyphen is used to combine a noun and a present participle or a noun and a past participle to form an adjective phrase, the translation will either fail and produce an incorrect result, or the original word will not be output. The correct translation result could not be obtained.

一方、ハイフン合成語をユーザー辞書に予め登録してお
けば正しい翻訳結果が得られるものの、この場合使用者
に登録作業の負担がかかり、又出現する合成語の全てを
推測して漏らさずユーザー辞書に登録することは非常に
困難であった。
On the other hand, if hyphen compound words are registered in the user dictionary in advance, correct translation results can be obtained, but in this case, the user is burdened with the registration work, and also the user has to guess all the compound words that appear and do not forget them. It was very difficult to register.

そこで本発明の目的は、機械翻訳装置において予め辞書
登録しなくてもハイフンによって名詞と現在分詞或いは
名詞と過去分詞が合成されたハイフン合成語を正しく翻
訳できるハイフン合成語処理方法を提供することにある
SUMMARY OF THE INVENTION Therefore, an object of the present invention is to provide a hyphen compound word processing method that can correctly translate a hyphen compound word in which a noun and a present participle or a noun and a past participle are compounded by a hyphen without registering the word in a dictionary in advance in a machine translation device. be.

く課題を解決するための手段〉 本発明は、上記目的を達成するために、入力された文章
中の各単語を辞書引きし、該辞書引き情報から前記入力
文章の形態素列を得る辞書引き形態素解析部と、 該形態素解析部によって得られた形態素列の構文を辞書
と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、前記辞書引き形態素解
析部は、入力された文章中にハイフンによって合成され
たハイフン合成語があれば、該合成語をハイフン前後の
単語に分割て岸噂中判保持し、更に前記合成語の分割さ
れたハイフン前の単語が名詞であり、且つハイフン後の
単語が現在分詞又は過去分詞である場合は、辞書引きに
よって得られた情報に従って該ハイフン前後の単語だけ
で翻訳を行い、該翻訳結果を前記合成語に対応させて壽
七≠=#好保持するものである。
Means for Solving the Problems> In order to achieve the above object, the present invention provides a dictionary lookup morpheme system that looks up each word in an input sentence in a dictionary and obtains a morpheme sequence of the input sentence from the dictionary lookup information. an analysis section; a syntactic analysis section that analyzes the syntax of the morpheme sequence obtained by the morphological analysis section using a dictionary and grammar rules; and a syntactic analysis section that converts the syntax obtained by the syntactic analysis section into a syntactic structure in the target language. In a machine translation device comprising a conversion unit and a translated sentence generation unit that generates a translated sentence from the dictionary lookup information according to the syntactic structure of the target language obtained by the conversion unit, the dictionary lookup morphological analysis unit If there is a hyphenated compound word synthesized by a hyphen in the sentence, the compound word is divided into words before and after the hyphen and kept in Kishibanana medium format, and furthermore, the word before the hyphen is a noun, In addition, if the word after the hyphen is a present participle or past participle, translate only the words before and after the hyphen according to the information obtained from the dictionary, match the translation result to the compound word, and write Jusushichi≠= #It is something to keep well.

〈作 用〉 本発明によれば、辞書引き形態素解析部は入力された任
意の文章中にハイフンで合成された合成語があれば該合
成語をハイフン前後の単語に分割して夫々の単語に対し
て辞書引きを行い、得られた情報を前記合成語に対応さ
せて保持する。
<Operation> According to the present invention, if there is a compound word compounded with a hyphen in any input sentence, the dictionary lookup morphological analysis section divides the compound word into words before and after the hyphen, and divides the compound word into words before and after the hyphen. A dictionary search is performed for the compound word, and the obtained information is stored in correspondence with the compound word.

そして、上記辞書引きの結果、前記合成語のハイフン前
の単語が名詞でハイフン後の単語が現在分詞或いは過去
分詞であれば、該ハイフン前後の単語だけで保持した前
記情報を基に翻訳を行い、該翻訳結果を前記合成語に対
応させて保持する。
Then, as a result of the above dictionary lookup, if the word before the hyphen in the compound word is a noun and the word after the hyphen is a present participle or a past participle, translation is performed based on the information held only for the words before and after the hyphen. , the translation result is held in correspondence with the compound word.

翻訳文生成部は前記合成語の訳語を生成する際には前記
辞書引き部が前記合成語に対応して保持する前記翻訳結
果を読み出して訳語を生成する。
When generating a translation of the compound word, the translated sentence generation section reads out the translation result held by the dictionary lookup section corresponding to the compound word and generates the translation.

〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。<Example> Hereinafter, the present invention will be explained in detail with reference to illustrated embodiments.

第1図はこの発明を適用する機械翻訳装置における一実
施例のブロック図である。lはメインCPU(中央処理
装置)、2はメインメモリー3はCRT(カソード・レ
イ・チューブ)、4はキーボード、5は翻訳モジュール
、6は翻訳用の辞書、文法規則および木構造変換規則等
を格納しているメモリーである。
FIG. 1 is a block diagram of an embodiment of a machine translation device to which the present invention is applied. 1 is the main CPU (central processing unit), 2 is the main memory 3 is the CRT (cathode ray tube), 4 is the keyboard, 5 is the translation module, 6 is the dictionary for translation, grammar rules, tree structure conversion rules, etc. This is the memory that stores it.

上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してターゲット言語を出力するものである。
When the source language is input, the translation module 5
It translates it and outputs the target language.

すなわち、キーボード4から入力されたソース言語はメ
インCPUIの制御により翻訳モジュール5に送られる
。翻訳モジュール5は、メモリー6に記憶されている辞
書、文法規則および木構造変換規則等を用いて、後に詳
述するようにして入力されたソース言語をターゲット言
語に翻訳する。その結果は、メインメモリー2に一旦記
憶されると共に、CRT3に表示される。
That is, the source language input from the keyboard 4 is sent to the translation module 5 under the control of the main CPUI. The translation module 5 uses the dictionary, grammar rules, tree structure conversion rules, etc. stored in the memory 6 to translate the input source language into the target language as will be detailed later. The results are temporarily stored in the main memory 2 and displayed on the CRT 3.

翻訳モジュール5で行われる機械翻訳には、−船釣に第
2図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルL1の辞書引き、レ
ベルL2の形態素解析、レベルL3の構文解析、・・・
と、解析が進められる。
The machine translation performed by the translation module 5 has analysis levels as shown in FIG. When the source language is input in the upper left of the figure, dictionary lookup at level L1, morphological analysis at level L2, syntactic analysis at level L3, etc.
The analysis continues.

機械翻訳はこの解析レベルにより、大きく次の2つに分
けられる。1つは、レベルL6のソース言語およびター
ゲット言語のどちらKも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL9の構文生成、レベルL
IOの形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
Machine translation can be broadly divided into the following two types depending on the level of analysis. One is to analyze concepts (called intermediate language) that do not depend on either the source language or the target language at level L6, and from there, generate context at level L7, generate meaning at level L8, generate syntax at level L9, Level L
It is a pivot method that generates the target language by proceeding with morpheme generation and generation of IO.

もう一つは、上述のレベルL2の形態素解析、レベルL
3の構文解析、レベルL4の意味解析およびL5の文脈
解析のいずれかまで解析を行ってソース言語の内部構造
を得、次に、この得られたソース言語の内部構造と同レ
ベルのターゲット言語の内部構造に変換した後、ターゲ
ット言語を生成するトランスファ一方式である。
The other is the above-mentioned level L2 morphological analysis, level L
The internal structure of the source language is obtained by performing any of the syntactic analysis at level 3, the semantic analysis at level 4, and the context analysis at level 5, and then the internal structure of the target language at the same level as the internal structure of the source language obtained is analyzed. It is a transfer method that generates the target language after converting it to the internal structure.

ここで、上記各解析について説明する。Here, each of the above analyzes will be explained.

・辞書引き、形態素解析−第1図に示すメモリー6の辞
書を引き、入力された文章を各形態素列(単語列)に分
割し、この各単語に対する品詞などの文法情報および訳
語を得、さらに、時制・人称・数などを解析する。
・Dictionary lookup, morphological analysis - Look up the dictionary in the memory 6 shown in Figure 1, divide the input sentence into each morpheme string (word string), obtain grammatical information such as part of speech and translation for each word, and further , analyze tense, person, number, etc.

・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造(構造解析木)を決定する。
- Syntactic analysis - Determines the structure of the sentence (structural analysis tree), such as dependencies between words, as will be described later.

・意味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを判別する。
・Semantic analysis - Distinguish between semantically correct and incorrect results from multiple syntactic analysis results.

・文脈解析−話題を理解し、省略やあい昧さを取り去る
・Context analysis – understand the topic and eliminate omissions and ambiguity.

この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構文解析のレベルまでの解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな部分からなる翻訳モジュールを考える。
It is assumed that the translation module 5 used in this invention performs analysis up to at least level L3 parsing. That is, the translation module 5 of this embodiment is considered to be a translation module consisting of parts as shown in FIG.

第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図は[’rhis is a pen
、Jという英文を日本語に翻訳する場合の、第4図に示
す各バッファA−Eの内容を例示する。
FIG. 4 is a block diagram of the translation module 5. Also, Figures 5 to 9 are ['rhis is a pen
, J are to be translated into Japanese, the contents of each buffer A to E shown in FIG. 4 will be exemplified.

以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。
The operation of English-Japanese translation will be explained below using FIGS. 3 to 9.

まず、読み込まれた原文は第5図に示すように第4図の
バッファAK格納される。翻訳プログラム16に基づく
翻訳CPU15の制御の下に、第3図の辞書引き形態素
解析部11により、バッフ7Aに格納された原文に従っ
てメモリー6の辞書を用いて各単語の必要な情報が得ら
れ、第4図のバッファBに格納される。ここで、Th1
sは多品詞語であるが、次の第3図の構文解析部12に
より一意に決定される。構文解析部12ではメモI) 
−6の辞書と文法規則にしたがって、各単語間の係り受
は関係を示す構造解析木が第7図に示すように決定され
て、第4図のバッファCに格納される。
First, the read original text is stored in the buffer AK of FIG. 4, as shown in FIG. Under the control of the translation CPU 15 based on the translation program 16, the dictionary lookup morphological analysis unit 11 shown in FIG. 3 obtains necessary information for each word using the dictionary in the memory 6 according to the original text stored in the buffer 7A, The data is stored in buffer B in FIG. Here, Th1
Although s is a multipart speech word, it is uniquely determined by the syntactic analysis unit 12 shown in FIG. 3 below. In the syntax analysis unit 12, memo I)
In accordance with the dictionary and grammar rules of No.-6, a structural analysis tree showing the relationships between words is determined as shown in FIG. 7, and stored in buffer C in FIG.

この構造解析木は、次のようにして決定される。This structural analysis tree is determined as follows.

すなわち、メモリー6の文法規則から 文→主部、述部 主部→名詞句 述部→動詞、名詞句 名詞句→代名詞 名詞句→冠詞、名詞 の規則が得られる。この規則は、例えば、1つめの規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則にしたがって構造解析木が決定さ
れるのである。
That is, from the grammar rules in the memory 6, the following rules are obtained: sentence → subject, predicate subject → noun phrase predicate → verb, noun phrase noun phrase → pronoun noun phrase → article, and noun. For example, the first rule indicates that "a sentence is made up of a subject and a predicate." Thereafter, a structural analysis tree is determined according to this rule.

第3図の変換部13では、上述の構文解析部同様、メモ
リー6の木構造変換規則を用いて、入力された英文に対
する構文解析木(第7図参照)の構造が、第8図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第4図のバッフIDに格納される。第3図の
翻訳文生成部14は、得られた日本語文字列「これペン
である。」に適切な助詞「は」や助動詞をつけて、第9
図のような日本語の形にして、第4図のバッフIEに格
納する。この日本文「これはペンである。」は、翻訳モ
ジュール5から出力され、メインメモリー2に格納され
ると共に、CRT8に表示される。
In the conversion unit 13 of FIG. 3, the structure of the parse tree (see FIG. 7) for the input English sentence is created as shown in FIG. It is converted into the structure for Japanese sentences like this. Then, the obtained result is stored in the buffer ID shown in FIG. The translated sentence generation unit 14 in FIG.
Store it in the buffer IE shown in Figure 4 in the Japanese format as shown in the figure. This Japanese sentence "This is a pen." is output from the translation module 5, stored in the main memory 2, and displayed on the CRT 8.

次に本発明に係る辞書引き形態素解析部11のハイフン
合成語の処理動作を第10図のフローチャートに示す。
Next, the processing operation of hyphen compound words by the dictionary lookup morphological analysis unit 11 according to the present invention is shown in the flowchart of FIG.

以下このフローチャートに従って辞書引き形態素解析部
11の処理動作を説明する。
The processing operation of the dictionary lookup morphological analysis unit 11 will be explained below according to this flowchart.

ステップS1において入力された単語がハイフンを含ん
でいるか否かを判別する。ハイフンを含んだ合成語であ
ればステップS3に進みそうでなければステップS2に
進む。ステップ53〜ステツプS7においてハイフン合
成語をハイフンの前後の単語に分割し、夫々の単語毎に
辞書引きを行い、得られた結果を前記合成語に対応させ
てバッファBに保持する。
In step S1, it is determined whether the input word includes a hyphen. If the compound word contains a hyphen, the process proceeds to step S3, and if not, the process proceeds to step S2. In steps 53 to S7, the hyphenated compound word is divided into words before and after the hyphen, a dictionary lookup is performed for each word, and the obtained results are stored in buffer B in correspondence with the compound word.

そしてステップS8で上記辞書引きした結果、ハイフン
前の単語が名詞で且つハイフン後の単語が現在分詞或い
は過去分詞であればステップS9に進み、そうでなけれ
ばステップS14に進む。ステップS9では上記辞書引
きの結果を保持したバッファBの内容を別のバッファに
退避させる。ステップSIOで別のバッファに退避させ
た辞書引きの結果に基づいてハイフン前とハイフン後の
単語の順番を置き換えてこの2つの単語だけで翻訳処理
を行い、ステップSllでその翻訳結果を前記合成語に
対応させてバッファBに保持する。更にステップ512
で先に退避させていた辞書引きの結果をバッフIBに戻
す。
Then, as a result of the dictionary lookup in step S8, if the word before the hyphen is a noun and the word after the hyphen is a present participle or a past participle, the process advances to step S9; otherwise, the process advances to step S14. In step S9, the contents of buffer B holding the result of the dictionary lookup are saved to another buffer. Based on the dictionary lookup result saved in another buffer in step SIO, the order of the words before the hyphen and after the hyphen is replaced, translation processing is performed using only these two words, and the translation result is translated into the compound word in step SIO. It is held in buffer B in correspondence with . Further step 512
Returns the dictionary lookup results that were previously saved to the buffer IB.

一方、ステップS2においては通常の辞書引きを行ない
、ステップStaでその結果を単語対応させてバッフ1
Bに保持する。
On the other hand, in step S2, a normal dictionary lookup is performed, and in step Sta, the results are associated with words and stored in buffer 1.
Hold at B.

ステップS14において入力文章中の全ての単語に対し
て上述した処理を終了したかを判別し、終了していなけ
ればステップS1に戻り、終了しておれば辞書引き形態
素解析部11の処理を終了する。そして翻訳文生成部1
4においてハイフン合成語の訳語を生成する際には該合
成語に対応してバッフ7Bに保持されている前記翻訳結
果情報に基づいて訳語を出力し、訳文を生成する。
In step S14, it is determined whether the above-mentioned processing has been completed for all words in the input sentence, and if it has not been completed, the process returns to step S1, and if it has been completed, the processing of the dictionary lookup morphological analysis unit 11 is ended. . And translated sentence generation part 1
When generating a translation of a hyphen compound word in step 4, the translation is output based on the translation result information held in the buffer 7B corresponding to the compound word, and a translated sentence is generated.

第11図は本実施例の機械翻訳装置に入力したハイフン
合成語を含む文章とこの機械翻訳装置から出力された日
本文の例である。
FIG. 11 shows an example of a sentence including a hyphen compound word inputted to the machine translation device of this embodiment and a Japanese sentence outputted from this machine translation device.

入力されたハイフン合成語[stem−mounted
 Jはハイフンの前後で分割されて夫々辞書引きされ、
順番を置き換えてこの2つの単語だけを翻訳して「ステ
ムを搭載する」という訳語を得て、該訳語を合成語「s
tem−mounted Jに対応させてバッファBに
保持する。
The input hyphen compound word [stem-mounted
J is divided before and after the hyphen and looked up in the dictionary,
By transposing the order and translating only these two words, we obtain the translated word "equipped with a stem", and then convert the translated word into the compound word "s
It is held in buffer B in correspondence with tem-mounted J.

翻訳文生成部14では上記翻訳結果情報に従って入力文
の翻訳文を生成し、その結果「ステムを搭載したデバイ
ス」という日本文を得る。
The translated sentence generation unit 14 generates a translated sentence of the input sentence according to the translation result information, and as a result, obtains the Japanese sentence "device equipped with a stem."

〈発明の効果〉 本発明のハイフン合成語処理方法を適用した機械翻訳装
置においては、入力文章中に)・イフンを含む合成語で
且つハイフンによって名詞と現在分詞或いは名詞と過去
分詞が合成されている語を含むものに対してユーザー辞
書に該合成語を登録しなくても正しい翻訳結果が得られ
て効率的な翻訳が実現できる。
<Effects of the Invention> In a machine translation device to which the hyphen compound word processing method of the present invention is applied, the input sentence contains a compound word that contains ) and a hyphen, and a noun and a present participle or a noun and a past participle are compounded by a hyphen. Correct translation results can be obtained and efficient translation can be achieved without registering the compound word in the user dictionary.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明を適用する機械翻訳装置の一実施例の
ブロック図、第2図は自動翻訳における翻訳レベルの説
明図、第3図は上記実施例における翻訳モジュールのブ
ロック図、第5図乃至第9図は第4図における各バッフ
ァの内容例を示す図、第10図はハイフン合成語の処理
の動作を示すフローチャート、第11図は本発明におけ
る機械翻訳装置への入力語例とそれに対する出力語(翻
訳語)例を示す図である。 1・・・メインCPU  2・・・メインメモリー 3
・・・CRT  4・・・キーボード 5・・・翻訳モ
ジュール6・・・メモリ11・・・辞書引き形態素解析
部 12・・・構文解析部 13変換部 14・・・翻
訳文生成部15・・・翻訳CPU  16・・・翻訳プ
ログラム A〜E・・・バッファ 4列文 Th1s S en ・ 、(−/)了A −一−、!文′バ′ツブ了
Figure 1 is a block diagram of an embodiment of a machine translation device to which this invention is applied, Figure 2 is an explanatory diagram of translation levels in automatic translation, Figure 3 is a block diagram of a translation module in the above embodiment, and Figure 5. 9 to 9 are diagrams showing examples of the contents of each buffer in FIG. 4, FIG. 10 is a flowchart showing the operation of processing hyphen compound words, and FIG. 11 is an example of input words to the machine translation device in the present invention and their It is a figure which shows the example of an output word (translation word) for. 1... Main CPU 2... Main memory 3
...CRT 4...Keyboard 5...Translation module 6...Memory 11...Dictionary lookup morphological analysis unit 12...Syntax analysis unit 13 Conversion unit 14...Translated sentence generation unit 15...・Translation CPU 16... Translation program A to E... Buffer 4 string sentence Th1s S en ・ , (-/) Finished A -1-,!文'ba'tsubu ryo

Claims (1)

【特許請求の範囲】 1、入力された文章中の各単語を辞書引きし、該辞書引
き情報から前記入力文章の形態素列を得る辞書引き形態
素解析部と、 該形態素解析部によって得られた形態素列の構文を辞書
と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、 前記辞書引き形態素解析部は、入力された文章中にハイ
フンによって合成されたハイフン合成語があれば、該合
成語をハイフン前後の単語に分割して該分割された2つ
の単語に対して夫々辞書引きを行い、得られた辞書引き
情報を前記合成語に対応させて保持し、 更に前記辞書引きの結果前記合成語の分割されたハイフ
ン前の単語が名詞であり、且つハイフン後の単語が現在
分詞又は過去分詞である場合は、前記合成語に対応させ
て保持した前記辞書引き情報に基づいて前記ハイフン前
後の単語だけで翻訳を行い、該翻訳結果を前記合成語に
対応させて保持し、 前記翻訳文生成部は、当該翻訳結果を前記合成語の訳語
として出力することを特徴とする機械翻訳装置における
ハイフン合成語処理方法。
[Scope of Claims] 1. A dictionary lookup morphological analysis unit that looks up each word in an input sentence in a dictionary and obtains a morpheme sequence of the input sentence from the dictionary lookup information; and morphemes obtained by the morphological analysis unit. a syntax analysis unit that analyzes the syntax of the string using a dictionary and grammar rules; a conversion unit that converts the syntax obtained by the syntax analysis unit into a syntactic structure in a target language; and a target language obtained by the conversion unit. a translated sentence generation unit that generates a translated sentence from the dictionary lookup information according to the syntactic structure of For example, the compound word is divided into words before and after the hyphen, a dictionary lookup is performed for each of the two divided words, the obtained dictionary lookup information is held in correspondence with the compound word, and the dictionary As a result of the lookup, if the word before the hyphen that is divided into the compound word is a noun, and the word after the hyphen is a present participle or a past participle, based on the dictionary lookup information held corresponding to the compound word. to translate only the words before and after the hyphen, and store the translation result in correspondence with the compound word, and the translated sentence generation unit outputs the translation result as a translation of the compound word. Hyphen compound word processing method in machine translation equipment.
JP1104237A 1989-04-24 1989-04-24 Hyphen compound word processing method in machine translation device Expired - Fee Related JPH0719260B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1104237A JPH0719260B2 (en) 1989-04-24 1989-04-24 Hyphen compound word processing method in machine translation device
US07/513,254 US5065318A (en) 1989-04-24 1990-04-20 Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
EP90304350A EP0398513B1 (en) 1989-04-24 1990-04-23 Method and apparatus for translating a sentence including a compound word formed by hyphenation
DE69025091T DE69025091T2 (en) 1989-04-24 1990-04-23 Method and device for translating a sentence with a compound word formed by separation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1104237A JPH0719260B2 (en) 1989-04-24 1989-04-24 Hyphen compound word processing method in machine translation device

Publications (2)

Publication Number Publication Date
JPH02281374A true JPH02281374A (en) 1990-11-19
JPH0719260B2 JPH0719260B2 (en) 1995-03-06

Family

ID=14375355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1104237A Expired - Fee Related JPH0719260B2 (en) 1989-04-24 1989-04-24 Hyphen compound word processing method in machine translation device

Country Status (1)

Country Link
JP (1) JPH0719260B2 (en)

Also Published As

Publication number Publication date
JPH0719260B2 (en) 1995-03-06

Similar Documents

Publication Publication Date Title
JPH0335354A (en) Proper noun processing method with abbreviation for mechanical translation device
JP2004355625A (en) Method and system for training machine translator
JPH0644296A (en) Machine translating system
JPH02281372A (en) Inserted adverbe phrase processing method in machine translation equipment
JPH0261763A (en) Mechanical translation equipment
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH03222065A (en) Machine translation device
JPH02281374A (en) Hyphenated word processing method in machine translation equipment
JP2719453B2 (en) Machine translation equipment
KR102143158B1 (en) Information processing system using Korean parcing
JP2926745B2 (en) Machine translation equipment
JP2004318344A (en) System and method for machine translation and computer program
JP2752025B2 (en) Machine translation equipment
JPH01112368A (en) Machine translator
JPS63136265A (en) Mechanical translating device
JPH02281373A (en) Hyphen generating method in machine translation equipment
JP3255294B2 (en) Machine translation equipment
JPH0332105B2 (en)
JPH01112367A (en) Machine translator
JPH01166258A (en) Mechanical translation device
JPH10320395A (en) Machine translation device and computer readable recording medium recording machine translation processing program
JPH03217971A (en) Machine translation device
JPH04235671A (en) Machine translation device
JPH0566630B2 (en)
JPH1166069A (en) Machine translation device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080306

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090306

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees