JPH02281373A - 機械翻訳装置におけるハイフン生成方法 - Google Patents

機械翻訳装置におけるハイフン生成方法

Info

Publication number
JPH02281373A
JPH02281373A JP1104236A JP10423689A JPH02281373A JP H02281373 A JPH02281373 A JP H02281373A JP 1104236 A JP1104236 A JP 1104236A JP 10423689 A JP10423689 A JP 10423689A JP H02281373 A JPH02281373 A JP H02281373A
Authority
JP
Japan
Prior art keywords
word
hyphen
translated
dictionary
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1104236A
Other languages
English (en)
Inventor
Hidezo Kugimiya
釘宮 秀造
Youji Fukumochi
福持 陽士
Ichiko Nakamura
中村 いち子
Noriyuki Hirai
平井 徳行
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1104236A priority Critical patent/JPH02281373A/ja
Priority to US07/513,254 priority patent/US5065318A/en
Priority to EP90304350A priority patent/EP0398513B1/en
Priority to DE69025091T priority patent/DE69025091T2/de
Publication of JPH02281373A publication Critical patent/JPH02281373A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は機械翻訳装置のハイフン生成方法に関し、特に
ハイフンによって合成された単語を翻訳することに対し
て好適に実施される。
〈従来技術〉 従来、機械翻訳装置によってハイフンで合成された単語
を翻訳する場合、ハイフンの前部分と後ろ部分を分けて
夫々訳語を生成し、第13図に示すように前部分の訳語
と後ろ部分の訳語を並べて連なった形で出力していた。
〈発明が解決しようとする課題〉 上述のように上記従来の機械翻訳装置におけるハイフン
合成語の翻訳処理はハイフンの前後の訳語を単に並べて
連なった形で出力するものであるため、翻訳文をみただ
けでは、この訳語が機械翻訳装置の辞書に登録されてい
る単語の訳語なのか、ハイフン合成語の翻訳処理の結果
得られた訳語なのかが区別がつかず、翻訳文の意味読み
取シに失敗することがあった。
そこで、本発明の目的はハイフンによって合成された単
語を翻訳する場合は、該単語のハイフンの前部分と後ろ
部分の訳語の間にハイフンを挿入し、ハイフン合成語の
訳語であることを明確に示す機械翻訳機を提供すること
にある。
〈課題を解決するための手段〉 本発明は上記目的を達成するために、 入力された文章中の各単語を辞書引きし、該辞書引き情
報から前記入力文章の形態素列を得る辞書引き形態素解
析部と、 該形態素解析部によって得られた形態素列の構文を辞書
と文法規則を用いて解析する構文解析部と− 該構文解析部で得られた構文を目標言語における構文の
構造に変換する変換部と、 #変換部によって得られた目標言語の構文構造に従って
前記辞書引き情報から翻訳文を生成する翻訳文生成部と
を有する機械翻訳装置において、前記辞書引き形態素解
析部は、入力され九文章中の単語にハイフンを含む合成
語があればハイフン合成語であるという合成語情報を前
記単語に対応させてメモリに保持し、 前記翻訳文生成部は、前記メモリを参照して前記合成語
情報が付加されている単語があれば、該単語のハイフン
の前部分の訳語とハイフンの後ろ部分の訳語の間にハイ
フンを生成して出力するものである。
く作用〉 辞書引き形態素解析部において入力された文章中の単語
にハイフン合成語があれば該単語に対応させて合成語情
報をメモリに保持する。
次に上記形態素解析部で得られた形態素例を辞書と文法
規則に基づいて構文解析部で構文解析を行い、該構文解
析部で得られた構文の構造が変換部によって目標言語の
構文の構造に変換される。
そして翻訳文生成部において、前記メモリを参照して前
記合成語情報が付加されている単語があれば、該単語の
ハイフンの前部分と後ろ部分の夫々の訳語の間にハイフ
ンが生成される。
一方、単語に合成語情報が付加されていなければ、対応
する訳語のみが生成される。
以上の処理を各単語毎に行ない、翻訳文生成部において
目標言語の構文の構造に従って翻訳文が生成される。
〈実施例〉 以下、この発明を図示の実施例にニジ詳細に説明する。
第1図社この発明を適用する機械翻訳装置における一実
施例のブロック図である。1はメインCPU(中央処理
装置)、2はメインメモリー3はCRT(カンード・レ
イ・チューブ)、4はキーボード、5は翻訳モジュール
、6は翻訳用の辞書、文法規則および木構造変換規則等
を格納しているメモリーである。
上記翻訳モジュール5は、ソース言語が入力されると、
それを翻訳してターゲート言語を出力するものである。
すなわち、キーボード4から入力されたソース言語はメ
インCPUIの制御によシ翻訳モジュール5に送られる
。翻訳モジュール5は、メモリー6に記憶されている辞
書、文法規則および木構造変換規則等を用いて、後に詳
述するようにして入力されたソース言語をターゲット言
語に翻訳する。その結果は、メインメモリー2に一旦記
憶されると共に、CRT3に表示される。
翻訳モジュール5で行われる機械翻訳には、−殻内に第
2図に示すような解析レベルがある。図中左上において
ソース言語が入力されると、レベルL1の辞書引き、レ
ベルL2の形態素解析、レベルL3の構文解析、・・・
と、解析が進められる。
機械翻訳はこの解析レベルによシ、大キく次ノ2つに分
けられる。1つは、レベルL6のソース言語およびター
ゲット言語のどちらにも依存しない概念(中間言語とよ
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL9の構文生成、レベルL
10の形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
もう一つは、上述のレベルL2の形態素解析、レベルL
3の構文解析、レベルL4の意味解析およびレベルL5
の文脈解析のいずれかまで解析を行ってソース言語の内
部構造を得、次に、この得られたソース言語の内部構造
と同レベルのターゲット言語の内部構造に変換した後、
ターゲット言語を生成するトランスファ一方式である。
ここで、上記各解析について説明する。
・辞書引き、形態素解析 一第1図に示すメモリー6の辞書を弓 き、入力された文章を各形態素列(単 語列)に分割し、この各単語に対す る品詞などの文法情報および訳語を 得、さらに、時制・人称・数などを 解析する。
・構文解析−後述するようにして単語間の係り受けなど
の、文章の構造(構造解析木) を決定する。
・意味解析−複数の構文解析の結果から意味的に正しい
ものとそうでないものを判別 する。
・文脈解析−話題を理解し、省略やあい昧さを取シ去る
この発明で用いる翻訳モジュール5は、少なくともレベ
ルL3の構文解析のレベル筐での解析を行うものとする
。すなわち、本実施例の翻訳モジュール5は第3図のよ
うな部分からなる翻訳モジュールを考える。
第4図は上記翻訳モジュール5のブロック図である。ま
た、第5図〜第9図はrThis is a pen、
Jという英文を日本語に翻訳する場合の、第4図に下す
各バッファA−Hの内容を例示する。
以下、第3図〜第9図を用いて英日翻訳の動作を説明す
る。まず、読み込まれた原文は第5図に示すように第4
図のバッファAに格納される。翻訳プログラム16に基
づく翻訳CPU15の制御の下に、第3図の辞書引き形
態素解析部11にょシ、バッファAに格納された原文に
従ってメモリー6の辞書を用いて各単語の必要な情報が
得られ、第4図のバッファBに格納される。ここで、t
htsは多品詞語であるが、次の第3図の構文解析部1
2によシー意に決定される。構文解析部12ではメモリ
ー6の辞書と文法規則にしたがって、各単語間の係シ受
は関係を示す構造解析木が第7図に示すように決定され
て、第4図のバッファCに格納される。この構造解析木
は、次のようにして決定される。すなわち、メモリー6
の文法規則から文→主部、述部 主部→名詞句 述部→動詞、名詞句 名詞句→代名詞 名詞句→冠詞、名詞 の規則が得られる。この規則は、例えば、1つめの規則
は“文とは、主部と述部からできている”ということを
表す。以下、この規則にしたがって構造解析木が決定さ
れるのである。
第3図の変換部13では、上述の構文解析部同様、メモ
リー6の木構造変換規則を用いて、入力された英文に対
する構文解析木(第7図参照)の構造が、第8図に示す
ように日本文に対する構造に変換される。そして、得ら
れた結果が第4図のバッファDに格納される。第3図の
翻訳文生成部14は、得られた日本語文字列「これ ペ
ンである。」に適切な助詞「は」や助動詞をつけて、第
9図のような日本語の形にして、第4図のバッファEに
格納する。この日本文「これはペンである。」は、翻訳
モジュール5から出力され、メインメモリー2に格納さ
れると共に、CRT3に表示される。
その際に、第3図の辞書引き形態素解析部11ではこの
発明に係る合成語情報付加処理が実行される、この合成
語情報付加処理を、第10図に示す合成語情報付加処理
のフローチャートに従って説明する。
まず、入力された単語がハイフンを含んでいるか否かを
判別しくnl)、ハイフンを含んでいれば、単語をハイ
フンの前後で分割して(na)、夫々辞書引きを行って
その結果をバッファBに保持する(n4〜ny )。更
に合成語情報をバッファBに保持する(n8)。ハイフ
ンを含んでいなければ通常の辞書引きを行い(n2)、
その結果をバッファBに保持する(n9)。これらの処
理を入力文章中の全ての単語に対して行う。
そして翻訳文生成部14では入力された単語に合成語情
報が付加されているか否かをバッファBを参照して判別
し、訳語にハイフンを生成するか否かを決定する〇 第11図はこの発明に係る翻訳文生成部14のハイフン
生成処理動作のフローチャートを示している。以下、第
10図に従って翻訳文生成部14の処理動作について説
明する。
ステップS1で、入力された単語毎に合成語情報が付加
されているか否かが判別される。その結果、合成語情報
が付加されていればステップS3に進み、そうでなけれ
ばステップS2に進む。ステップS3では単語のハイフ
ンの前部分の訳語が生成され、ステップs4でハイフン
を生成しステップS5で単語の後ろ部分の訳語が生成さ
れる。
ステップS2では通常の生成処理、即ち、単語に対応し
た訳語が生成される。ステップS6で入力された全ての
単語に対して上述の処理が終了したか否かを判断する。
その結果、終了でなければステップSlに戻り、終了で
あれば処理を終了する。
第12図は本実施例の機械翻訳装置に入力したハイフン
を含む合成語とこの機械翻訳装置から出力された日本語
の例である。
入力合成語のうちのハイフンの前部分子decisio
nJの訳語「決定」とハイフンの後ろ部分子5uppo
rtJの訳語「サポート」との間にハイフンが挿入され
る。
〈発明の効果〉 以上のように、本発明のハイフン生成処理を適用した機
械翻訳装置は、ハイフンを含む合成語を翻訳する際には
ハイフンの前部分、後ろ部分の訳語の間にハイフンを挿
入するようにしているため、翻訳文を見ただけでこの訳
語が辞書に登録されていた単語の訳語ではなくハイフン
合成語に対する訳語であることが容易に判別でき、ソー
ス言語とターゲット言語の翻訳の対応関係が明確となシ
、翻訳文の意味読み取シがスムーズに行なえる。
【図面の簡単な説明】
第1図はこの発明を適用した機械翻訳装置の一実施例の
ブロック図、第2図は自動翻訳における翻訳レベルの説
明図、第3図は上記実施例における翻訳モジュールのブ
ロック図、第5図乃至第9図は第4図における各バッフ
ァの内容例を示す因、第10図は合成語情報付加処理の
動作を示すフローチャート、第11図はハイフン生成処
理の動作を示すフローチャート、第12図は本発明を適
用した機械翻訳装置への入力語例とそれに対する出力語
(翻訳語)例を示す図、第13図は従来の機械翻訳装置
への入力語例とそれに対する出力語(翻訳語)例を示す
図である0 1・・・メインCPU  2・・・メインメモリー 3
・・・CRT  4・・・キーボード 5・・・翻訳モ
ジュール6・・・メモリー 11・・・辞書引き形態素
解析部12・・・構文解析部 13・・・変換部 14
・・・翻訳文生成部 15・・・翻訳CPU A〜E・・・バッファ 16・・・翻訳プログラム

Claims (1)

  1. 【特許請求の範囲】 1、入力された文章中の各単語を辞書引きし、該辞書引
    き情報から前記入力文章の形態素列を得る辞書引き形態
    素解析部と、 該辞書引き形態素解析部によって得られた形態素列の構
    文を辞書と文法規則を用いて解析する構文解析部と、 該構文解析部で得られた構文を目標言語における構文の
    構造に変換する変換部と、 該変換部によって得られた目標言語の構文構造に従って
    前記辞書引き情報から翻訳文を生成する翻訳文生成部と
    を有する機械翻訳装置において、 前記辞書引き形態素解析部は、入力された文章中の単語
    にハイフンを含む合成語があれば、ハイフン合成語であ
    るという合成語情報を前記単語に対応させてメモリに保
    持し、 前記翻訳文生成部は、前記メモリを参照して前記合成語
    情報が付加されている単語があれば、該単語のハイフン
    の前部分の訳語とハイフンの後ろ部分の訳語の間にハイ
    フンを生成して出力することを特徴とする機械翻訳装置
    におけるハイフン生成方法。
JP1104236A 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン生成方法 Pending JPH02281373A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1104236A JPH02281373A (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン生成方法
US07/513,254 US5065318A (en) 1989-04-24 1990-04-20 Method of translating a sentence including a compound word formed by hyphenation using a translating apparatus
EP90304350A EP0398513B1 (en) 1989-04-24 1990-04-23 Method and apparatus for translating a sentence including a compound word formed by hyphenation
DE69025091T DE69025091T2 (de) 1989-04-24 1990-04-23 Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1104236A JPH02281373A (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン生成方法

Publications (1)

Publication Number Publication Date
JPH02281373A true JPH02281373A (ja) 1990-11-19

Family

ID=14375329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1104236A Pending JPH02281373A (ja) 1989-04-24 1989-04-24 機械翻訳装置におけるハイフン生成方法

Country Status (1)

Country Link
JP (1) JPH02281373A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61260368A (ja) * 1985-05-14 1986-11-18 Sharp Corp 翻訳システム
JPS62267871A (ja) * 1986-05-15 1987-11-20 Ricoh Co Ltd 日本語生成装置
JPS63106074A (ja) * 1986-10-23 1988-05-11 Ricoh Co Ltd 形態素解析における行末ハイフンの処理方式
JPH0348366A (ja) * 1989-04-04 1991-03-01 Ricoh Co Ltd 形態素解析、構文解析及び形態素生成方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61260368A (ja) * 1985-05-14 1986-11-18 Sharp Corp 翻訳システム
JPS62267871A (ja) * 1986-05-15 1987-11-20 Ricoh Co Ltd 日本語生成装置
JPS63106074A (ja) * 1986-10-23 1988-05-11 Ricoh Co Ltd 形態素解析における行末ハイフンの処理方式
JPH0348366A (ja) * 1989-04-04 1991-03-01 Ricoh Co Ltd 形態素解析、構文解析及び形態素生成方式

Similar Documents

Publication Publication Date Title
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
US5023786A (en) Language translator which recognizes and indicates prepositional or indefinite phrases and relative clauses
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JP2815714B2 (ja) 翻訳装置
JPH0261763A (ja) 機械翻訳装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH03222065A (ja) 機械翻訳装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JP2719453B2 (ja) 機械翻訳装置
JP3174664B2 (ja) 機械翻訳装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JP2752025B2 (ja) 機械翻訳装置
JPH01112368A (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JP3255294B2 (ja) 機械翻訳装置
JPH03217971A (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPH04235671A (ja) 機械翻訳装置
JPH01112367A (ja) 機械翻訳装置
JPH10143515A (ja) 機械翻訳装置及び機械翻訳方法
JPH03265972A (ja) 機械翻訳機
JPH05181901A (ja) 機械翻訳装置
JPH06203068A (ja) 機械翻訳装置
JPH1166069A (ja) 機械翻訳装置
JPH05158971A (ja) 機械翻訳装置