JP3353873B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3353873B2
JP3353873B2 JP22295196A JP22295196A JP3353873B2 JP 3353873 B2 JP3353873 B2 JP 3353873B2 JP 22295196 A JP22295196 A JP 22295196A JP 22295196 A JP22295196 A JP 22295196A JP 3353873 B2 JP3353873 B2 JP 3353873B2
Authority
JP
Japan
Prior art keywords
word
translated
unknown
dictionary
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP22295196A
Other languages
English (en)
Other versions
JPH1063663A (ja
Inventor
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP22295196A priority Critical patent/JP3353873B2/ja
Publication of JPH1063663A publication Critical patent/JPH1063663A/ja
Application granted granted Critical
Publication of JP3353873B2 publication Critical patent/JP3353873B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本願発明は、原文テキストを
入力し、該テキストを所望の言語に翻訳を行う機械翻訳
処理に関するものである。
【0002】
【従来の技術】機械翻訳処理とは、キーボードなどの入
力手段から入力されたソース言語を、制御手段の制御に
より翻訳モジュールに入力し、この入力されたソース言
語を、記憶手段に記憶されている辞書、文法規則および
木構造変換規則を利用して、翻訳モジュールによってタ
ーゲット言語に翻訳するものである。
【0003】このような機械翻訳処理の多くのもので
は、辞書に収録されていない単語を含む文を翻訳した際
には、そのような単語は「未知語」として扱われ、その
ような単語を訳文中に原文単語のまま訳出するようにな
っているものがほとんどである。
【0004】例えば、“There is a PHS .”などのよう
に“PHS”は未知語として認識され、“これは PHS で
す。”などのように訳出される。
【0005】また、状況によっては、辞書に収録されて
いる単語であっても、特定の操作を行うことにより、任
意の単語を訳文中に原文単語のまま訳出することが可能
な機械翻訳装置も存在する。また、辞書に収録されてい
ない単語(未知語)についての品詞情報の取得方法につ
いては、例えば特開昭58-175074号公報に開示
されている。
【0006】特開平5-113991号公報には、訳語辞書から
得られた訳語候補に原文の綴りのままの訳語を加えるこ
とにより、翻訳結果を確認して訳語を変更する場合にお
いて、原文の綴りを採用することを可能としている。
【0007】例えば、原文として“POSTSCRIPT as a pa
ge description language” と入力されて、第一次訳と
して “ページ記述言語としての追伸” と訳出された場合、“追伸”の部分を指定して訳語変更
指示を行うと、訳語の候補として、“追伸”“二伸”
“あとがき”“解説”という訳語に加えて、原文の綴り
のままである“POSTSCRIPT”が表示され、所望の訳語
(ここでは“POSTSCRIPT”)を選択することにより、
“ページ記述言語としての POSTSCRIPT ”が得られるこ
とになる。
【0008】特開平5-334345号公報においても、同様に
翻訳結果に対して後処理という形で原文の綴りのままの
表現を用いることを可能としている。
【0009】また、原文単語の綴りを訳語として登録す
ることによっても、原文単語の綴りを翻訳結果として訳
出することは可能である。例えば、上記の例において
は、“POSTSCRIPT”の訳を“POSTSCRIPT”として登録し
ておくことにより、翻訳文でも原文単語の綴りのままの
表現を用いることができる。
【0010】さらには、原文の綴りのまま訳出したい単
語には特定のフラグを付与することにより、同様に原文
単語の綴りのままの表現を用いることが可能である。
【0011】
【発明が解決しようとする課題】上述したように、従来
は、辞書に収録されていない原文単語を訳文中に原文言
語のまま訳出するような機械翻訳処理がある。また、利
用者の意向に応じて、辞書に収録されている単語であっ
ても訳文中に原文言語のまま訳出することが可能な機械
翻訳処理も存在する。
【0012】しかし、このような機械翻訳処理には、そ
のようにして訳文中に原文言語のまま訳出する単語を決
定する操作を利用者が行わなければならず、それ自体が
煩わしいという問題点がある。
【0013】また、同一の単語であっても、状況によっ
て、訳文言語の単語(訳語)として表したほうがよい場
合と、原文言語の単語をそのまま訳文中に出したほうが
適切な場合の両方があるが、従来の機械翻訳処理はこの
ような状況に対応していない。
【0014】たとえば、人名に関して、 “George” 「ジョージ」 “Washington”「ワシントン」 という単語がそれぞれ辞書に収録されていて、 “Lucas” という単語は辞書に収録されていないとする。この場
合、“George Washington”を訳すと「ジョージ ワシ
ントン」と訳出されるが、“Gourge Lucas”を訳すと
「ジョージ Lucas」と訳されてしまう。このように、
一まとまりの人名を表すのに英文表記とカタカナ表記が
混在してしまうのに比べると、訳文中に「George Luca
s」のように一まとまりの人名が英文表記のみで出た方
が、まだ読みやすい。
【0015】だからといって、上記のような、特定の単
語を原文言語のまま訳文中に出すように指定できるよう
な機械翻訳処理で、「George」を原文言語のまま訳文に
出すように指定すると、“George Lucas” は「George
Lucas」になるが、今度は“George Washington”を訳
した際に「George ワシントン」となってしまい、上記
したような読みにくさの問題は解決しない。
【0016】現存するすべての人名を辞書に収録するこ
とはまず不可能であるので、従来の機械翻訳処理で人名
などを辞書に収録して翻訳しようとすると、このような
問題が生じることは避けられない。
【0017】一方、人名以外では、原文言語の単語と訳
文言語の単語とが混在した名詞句が訳出されても、特に
問題とはならない場合も存在する。人名以外で、連語の
中に未知語と辞書収録語とが混在している場合に、辞書
収録語に対応する訳を、その辞書に記載されている訳語
以外の何か特別な訳出の仕方をすると、かえって読みに
くくなる場合もある。
【0018】そこで、本発明は、辞書に収録されている
ある単語を、訳語として訳出するか、あるいは原文言語
の単語のまま訳出するかを、状況に応じて自動的に判断
し、適切に訳出するような機械翻訳処理を提供するもの
である。
【0019】
【課題を解決するための手段】本発明の請求項1によれ
ば、プログラムによって、第1言語からなる原文を入力
し、該原文を所望の第2言語に翻訳した訳文の出力を行
なう機械翻訳装置であって、第1言語の単語とその品詞
情報と、該第1言語の単語に対応する第2言語の訳語を
記述している単語辞書と、前記単語辞書に基づき、入力
された原文を解析し、該原文を構成する各単語毎に、前
記単語辞書に収録されているか否かを示す未知語情報、
品詞情報、訳語を含む形態素解析情報を得る形態素解析
手段と、前記形態素解析情報に基づいて、原文を構成す
る各単語の構文構造を示す構造解析木を得る構文解析手
段と、前記形態解析情報に基づいて、原文を構成する各
単語の訳語内容の選択を行なう際に、前記各単語が未知
語であるか否かを順次チェックするとともに、未知語で
あると判断した場合には、原文中においてチェック中の
単語の1つ前に位置する単語の品詞情報が名詞かつ訳語
がカタカナであり、更に前記構造解析木から1つ前に位
置する単語がチェック中の単語と構文構造上同一のまと
まりにあるかをチェックして、まとまりがあると判断し
たら、チェック中の単語の訳語内容と前記一つ前に位位
置する単語の訳語内容とを原文とし、まとまりがないと
判断したらチェック中の単語の訳語内容を原文とし、未
知語でないと判断した場合には、チェック中の単語の品
詞情報が名詞かつ訳語がカタカナであるとともに、原文
中においてチェック中の単語の1つ前に位置する単語が
未知語であり、更に前記構造解析木からチェック中の単
語が1つ前の位置にある単語と構文構造上同一のまとま
りにあるかをチェックして、まとまりがあると判断した
ら、チェック中の単語の訳語内容を原文とし、まとまり
がないと判断したらチェック中の単語の訳語内容を訳語
とする訳語選択手段とを備え、前記訳語選択手段で選択
された訳語内容に基づいて訳文を出力することを特徴と
する機械翻訳装置により、上記課題を解決するものであ
る。また、本発明の請求項2によれば、第1言語からな
る原文テキストを入力し、該テキストを所望の第2言語
に翻訳して出力を行う装置であって、第1言語による見
出し語と、それに対応する第2言語による訳語を記憶し
ている単語辞書と、前記単語辞書を用いて形態素解析を
行う形態素解析手段と、前記形態素解析の結果から、構
文の解析を行う構文解析手段と、前記形態素解析の結果
に基づいて、原文テキスト内から前記単語辞書の見出し
語にない単語を検出する未知語検出手段と、前記未知語
検出手段によって、原文テキスト内に前記単語辞書の見
出し語にない単語が検出された場合、前記構文解析手段
の結果に基づいて前記単語を含む句を検出し、該句の訳
語を入力単語のままとする訳語選択手段を備えたことを
特徴とする機械翻訳装置により上記課題を解決する。ま
た、本発明の請求項3によれば、第1言語からなる原文
テキストを入力し、該テキストを所望の第2言語に翻訳
して出力を行う装置であって、第1言語による見出し語
と、それに対応する第2言語による訳語を記憶している
単語辞書と、前記単語辞書を用いて形態素解析を行う形
態素解析手段と、前記形態素解析の結果に基づいて、原
文テキスト内から前記単語辞書の見出し語にない未知語
を検出する未知語検出手段と、前記未知語検出手段によ
って検出された未知語の直前または直後の単語が人名で
あるか判断する前後単語種別判断手段と、前記前後単語
種別判断手段によって、前記未知語の直前または直後の
単語が人名であると判断された場合、該単語および前記
未知語の訳語を入力単語のままとする訳語選択手段を備
えたことを特徴とする機械翻訳装置により上記課題を解
決する。また、本発明の請求項4によれば、前記単語辞
書は、第1言語による見出し語と、それに対応する第2
言語による訳語および該単語における意味あるいは語法
上の特定の単語情報を記憶し、前記前後単語種別判断手
段は、前記単語辞書に記憶されている単語情報に基づい
て、前記未知語の直前または直後の単語が人名であるか
判断することを特徴とする請求項3に記載の機械翻訳装
置により上記課題を解決する。また、本発明の請求項5
によれば、前記単語情報は品詞情報を含み、前記前後単
語種別判断手段は、前記単語辞書に記憶されている単語
情報に基づいて、前記未知語検出手段によって検出され
た未知語の直前または直後の単語が名詞であるか判断
し、前記訳語選択手段は、前記前後単語種別判断手段に
よって、前記未知語の直前または直後の単語が名詞であ
ると判断された場合、該単語および前記未知語の訳語を
入力単語のままとすることを特徴とする請求項4に記載
の機械翻訳装置により上記課題を解決する。また、本発
明の請求項6によれば、前記前後単語種別判断手段は、
前記単語辞書に記憶されている訳語に基づいて、前記未
知語検出手段によって検出された未知語の直前または直
後の単語の訳語がカタカナであるか判断し、前記訳語選
択手段は、前記前後単語種別判断手段によって、前記未
知語の直前または直後の単語の訳語がカタカナであると
判断された場合、該単語および前記未知語の訳語を入力
単語のままとすることを特徴とする請求項3に記載の機
械翻訳装置により上記課題を解決する。また、本発明の
請求項7によれば、前記単語辞書は、第1言語による基
本的な見出し語とそれに対応する第2言語による訳語を
記憶している基本辞書と、第1言語による補助的な見出
し語とそれに対応する第2言語による訳語を記憶してい
るオプション辞書から構成され、前記前後単語種別判断
手段は、前記未知語検出手段によって検出された未知語
の直前または直後の単語がオプション辞書に記憶されて
いる単語であるか判断し、前記訳語選択手段は、前記前
後単語種別判断手段によって、前記未知語の直前または
直後の単語がオプション辞書に記憶されている単語であ
ると判断された場合、該単語および前記未知語の訳語を
入力単語のままとすることを特徴とする請求項3に記載
の機械翻訳装置により上記課題を解決する。
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【発明の実施の形態】以下、本発明における機械翻訳処
理を、図示により詳細に説明する。以下の説明では第1
言語(ソース言語)が英語であり、第2言語(ターゲッ
ト言語)が日本語であるような機械翻訳処理を例にとり
説明するが、この言語対は特にこれに限定するものでは
ない。
【0026】図1は本発明の機械翻訳処理における構成
を示すブロック図である。1は動作制御手段であり、実
際の機器構成においては主としてCPU(中央処理装
置)をもってこれを実現する。2は入力手段であり、実
際の機器構成においてはキーボード・マウス・ペン・タ
ブレット・スキャナ・文字認識装置などの入力装置や、
通信回線と接続されている通信装置をもってこれを実現
する。
【0027】3は出力手段であり、実際の機器構成にお
いてはCRT(陰極線管)・LCD(液晶表示装置)な
どの表示装置や、プリンターなどの印字装置、または通
信回線と接続されている通信装置をもってこれを実現す
る。
【0028】4はバスライン、5は翻訳プログラムモジ
ュールである。6は翻訳用の辞書・文法規則その他翻訳
に必要な規則等のデータを格納している記憶手段であ
る。以下の例では、辞書データは複数のまとまりに分か
れて格納されている。その各々のまとまりとはたとえば
「基本辞書データ」と「オプション辞書データ」といっ
たものである。7は動作用メインメモリである。
【0029】一般的な機械翻訳の解析方法について説明
する。一般的に機械翻訳処理では、“辞書引き、形態素
解析”、“構文解析”、“意味解析”、“文脈解析”の
各ステップを備える。
【0030】辞書引き、形態素解析では、辞書を引き、
入力された文章を各形態素列(単語列)に分割し、この
各単語に対する品詞などの文法情報および訳語を得、さ
らに、時制・人称・数などを解析する。
【0031】構文解析では、単語間の係り受けなどの、
文章の構造(構造解析木)を決定する。意味解析では、
複数の構文解析の結果から意味的に正しいものとそうで
ないものを判別する。また、文脈解析では、話題を理解
し、省略や曖昧さを取り去る。
【0032】これらの各ステップをソース言語およびタ
ーゲット言語に対して備えることによって翻訳を行う
が、本発明においては、少なくとも構文解析までを行う
翻訳処理を前提としている。
【0033】この原理による翻訳を実現するため、翻訳
プログラムモジュール5の構成要素には、図1に示すよ
うに、辞書引き・形態素解析手段5b、構文解析手段5
c、構文変換手段5d、訳語選択手段5e、ターゲット
言語生成手段5fがある。さらに、本発明の機械翻訳装
置の翻訳プログラムモジュールは、使用辞書選択手段5
aを備えていて、また、訳語選択手段5eは、その内部
に前訳語種別判定手段5e−1、訳語再決定手段5e−
2、単語付随情報処理手段5e−3、単語ごとの使用辞
書判定手段5e−4を備えている。
【0034】また、動作用メインメモリ7は、翻訳動作
の進行に応じて、その一部が原文バッファ7a、辞書引
きバッファ7b、変換前の構文バッファ7c、変換後の
構文バッファ7d、訳語バッファ7e、出力形式バッフ
ァ7f、使用辞書フラグバッファ7gに、それぞれ割り
当てられる。
【0035】また本発明は、上記した翻訳プログラムモ
ジュール5の各構成を機能させるプログラム、記憶手段
6における内容及びそれを機能させるプログラム、及び
動作用メインメモリ7を各バッファとして機能させるプ
ログラムを記録した媒体として構成することも可能であ
る。
【0036】以下、図面を用いて、本発明の機械翻訳処
理の翻訳の動作を説明する。動作の過程は、図2と図3
のフローチャートに示すようになっている。図2のステ
ップs5「訳語選択」の動作を詳細に示したのが図3で
ある。ここでは、次の3つの文の翻訳動作を通じて、特
に本発明における訳語選択手段5e、訳語種別判定手段
5e−1、訳語再決定手段5e−2の処理を説明する。
【0037】He is George Washington. She is Hiromi Washington. He is George Lucas. これらの文に使われている原文単語のうち、“Hiromi”
と“Lucas”は辞書に収録されていない(未知語であ
る)とする。
【0038】まず、“He is George Washington.”の翻
訳動作を説明する。図2のステップS1で(以下“ステ
ップS〜”を単に“S〜”とする)、入力手段2から原
文が読み込まれ、図4に示すように、単語位置情報とと
もに原文バッファ7aに格納される。次にS2で、バッ
ファ7aに格納された原文に対して辞書引き・形態素解
析が行われ、その結果がバッファ7bに格納される。こ
の結果は図5に示すように、それぞれの原文単語の単語
位置、原文単語そのもの(見出し)、品詞、訳語、その
他の情報から成っている。
【0039】S3で、構造解析木が図6に示すように決
定されて、構文バッファ7cに格納される。そしてS4
で、構文変換手段5dの働きにより、図6の構造解析木
が日本文に対する構造に変換され、得られた結果が構文
バッファ7dに格納される。
【0040】次に、S5で、訳語選択手段5gによっ
て、原文の各単語に対する訳語が決定される。
【0041】以下、図2のs5の「訳語選択」の動作の
詳細を、図3のフローチャートで説明する。
【0042】まず、S501で訳語選択手段5gは単語
位置1に着目し、図7での単語位置1の単語“he”の訳
語選択操作が行われる。図5の辞書引きバッファでは単
語位置1の“he”の「未知語フラグ」欄は空欄である。
よってこの単語は未知語ではなく、S502からS50
3に進み、訳語選択手段5gによって通常の訳語選択操
作がなされ、図5の“he”の「訳語」欄にある訳語の
中からたとえば「彼」が選ばれる。次にS504で、現
在着目している訳語がカタカナでかつ原文単語の品詞が
名詞かどうかがチェックされるが、この場合は訳語がカ
タカナでないので、S509に進み、訳語「彼」が訳語
バッファ7eに格納される。
【0043】そしてS510で、着目する原文単語位置
を次の“is”に移し、S511で着目位置が文末を過ぎ
ていないかどうかがチェックされる。文末を過ぎていな
ければS502に戻る。
【0044】次の単語“is”も、未知語ではなく訳語は
カタカナでないので、同様にS502→S503→S5
04→S509のように処理されて、訳語「は…であ
る」が訳語バッファ7eに格納される。そして着目位置
を次の単語“George”に移してS502に戻る。
【0045】“George”も未知語ではないのでS502
→S503のように進んで、S503で訳語選択動作が
なされ、その結果たとえば「ジョージ」が訳語とされて
S504に進む。「ジョージ」はカタカナであり、かつ
これに対応する原文単語“George”の品詞は名詞なの
で、S504からS505に進む。S505では現在着
目している訳文単語の1つ前の単語の条件が前訳語判定
手段5e−1によりチェックされるが、図7に示すよう
な訳語バッファを参照することにより、「ジョージ」の
前の訳文単語は「は」であり、これに対応する原文単語
は“is”であるとわかる。これは未知語ではなく、また
図6のような構文構造を参照すれば“is”と“George”
とは構文上同一のまとまりにはないということがわかる
ので、S505からS509に進み、“George”の訳語
「ジョージ」が訳語バッファに格納される。そしてS5
10→S511→S502と進み、単語“Washington”
が着目される。
【0046】“Washington”も未知語ではなく、名詞で
あり、そして訳語は「ワシントン」のようにカタカナな
ので、S502→S503→S504→S505のよう
に進み、1つ前の単語が前訳語種別判定手段5e−1に
よりチェックされる。1つ前の訳文単語は「ジョージ」
で、これに対応する原文単語は“George”であり、これ
は“Washington”と構文上同一のまとまりにあることが
図6の構文構造からわかるが、“George”は未知語では
ないので、S505からS509に進み、訳語「ワシン
トン」が訳語バッファに格納される。
【0047】以上で、文末までの訳語決定が終わったの
で、S510→S511から[end]へ進み、訳語選
択の動作が終わる。図2のフローチャートに戻り、S5
からS6に進んで、ターゲット言語生成手段5fにより
日本語文が 「彼は、ジョージ ワシントンである。」 のように生成されて、翻訳が完了する。
【0048】次に、 She is hiromi Washington. という文の翻訳動作を説明する。ここで、”Hiromi"は
未知語である。前述の翻訳動作と同様に、図2のフロー
チャートのS1→S2→S3→S4のように原文入力・
辞書引き形態素解析・構文解析・構文変換の処理が行わ
れる。この結果、原文バッファ7aは図8、辞書引きバ
ッファ7bは図9、構文バッファ7cは図10にそれぞ
れ示すようになる(辞書に収録されていない未知語につ
いての品詞を特定する処理は、上述したように特開昭5
8-175074号公報参照)。そして図3のフローチ
ャートに進む。
【0049】訳語選択の動作では、“She is”までは前
述の“He is George Washington.”の訳語選択と同様の
動作が行われ、「彼女」「は…である」という訳語が選
ばれる。そして次に原文単語“Hiromi”が着目される。
【0050】図9の辞書引きバッファを参照した結果、
“Hiromi”の「未知語フラグ」欄が空欄でないので、
“Hiromi”は未知語であることがわかる。よって、S5
02からS506に進む。S506では現在着目してい
る語の、訳文側における1つ前の単語の条件が前訳語判
定手段5e−1によりチェックされるが、図11の訳語
バッファを参照することにより、“Hiromi”の前の訳文
単語は「は」であり、これに対応する原文単語は“is”
であるとわかる。これは未知語ではなく、また図10の
構文構造を参照すれば“is”と“Hiromi”とは構文上同
一のまとまりにはないということがわかるので、S50
6からS508に進み、原文単語“Hiromi”がそのまま
訳語バッファに格納される。そしてS510→S511
→S502と進み、次に単語“Washington”が着目され
る。
【0051】“Washington”も未知語ではなく、名詞で
あり、そして訳語は「ワシントン」のようにカタカナな
ので、S502→S503→S504→S505のよう
に進み、1つ前の単語が前訳語判定手段5e−1により
チェックされる。1つ前の訳文単語は「Hiromi」で、こ
れに対応する原文単語は“Hiromi”であり、これは“Wa
shington”と構文上同一のまとまりにあることが図10
の構文構造からわかり、そして図9の辞書引きバッファ
を参照した結果、“Hiromi”は未知語であるとわかるの
で、S505からS508に進み、原文単語“Washingt
on”がそのまま訳語バッファに格納され、訳語バッファ
は図11に示すようになる。
【0052】以上で、文末までの訳語決定が終わったの
で、S510→S511から[end]へ進み、訳語選
択の動作が終わる。図2のフローチャートに戻り、S5
からS6に進んで、ターゲット言語生成手段5fにより
日本語文が 「彼女は、Hiromi Washington である。」 のように生成されて、翻訳が完了する。
【0053】次に、 He is George Lucas. という文の翻訳動作を説明する。ここで、“Lucas”は
未知語である。
【0054】前述の翻訳動作と同様に、図2のフローチ
ャートのS1→S2→S3→S4のように原文入力・辞
書引き形態素解析・構文解析・構文変換の処理が行われ
る。この結果、原文バッファ7aは図12、辞書引きバ
ッファ7bは図13、構文バッファ7cは図14にそれ
ぞれ示すようになる。そして図3のフローチャートに進
む。
【0055】訳語選択の動作では、“He is George”ま
では前述の“He is George Washington.”の訳語選択と
同様の動作が行われ、「彼」「は…である」「ジョー
ジ」という訳語が一旦選ばれる。この時点で訳語バッフ
ァは図15に示すようになっている。そして次に原文単
語“Lucas”が着目される。
【0056】図13の辞書引きバッファを参照した結
果、“Lucas”の「未知語フラグ」欄が空欄でないの
で、“Lucas”は未知語であることがわかる。よって、
S502からS506に進む。S506では現在着目し
ている語の、訳文側における1つ前の単語の条件が前訳
語判定手段5e−1によりチェックされる。1つ前の訳
文単語は「ジョージ」で、これに対応する原文単語は
“George”であり、これは“Lucas”と構文上同一のま
とまりにあることが図14の構文構造からわかり、そし
て「ジョージ」はカタカナであり、“George”は名詞で
あるとわかるので、S506からS507に進み、訳語
再決定手段5e−2によって、訳語バッファにおいて訳
語「ジョージ」がそれに対応する原文単語“George”に
置き換えられる。そしてS507からS508に進み、
原文単語“Lucas”がそのまま訳語バッファに格納さ
れ、訳語バッファは図16に示すように変わる。
【0057】以上で、文末までの訳語決定が終わったの
で、S510→S511から[end]へ進み、訳語選
択の動作が終わる。図2のフローチャートに戻り、S5
からS6に進んで、ターゲット言語生成手段5fにより
日本語文が 「彼は、George Lucas である。」 のように生成されて、翻訳が完了する。
【0058】次に、上記の処理に加えて、単語付加情報
処理手段5e−3を加えた処理を説明する。
【0059】原文は、 She is Hiromi Washington. であるとする。
【0060】これらの文に使われている原文単語のう
ち、“Hiromi”は辞書に収録されていないとする。
【0061】図1の記憶手段6に記憶されている辞書デ
ータには、人名を示す単語の「品詞細分類」欄に「人
名」フラグデータが付与されている。上記の文に使われ
ている原文単語のうち、“George”と“Washington”に
は「人名」フラグデータが付与されているとする。
【0062】本実施例による処理動作の過程は、図2と
図17のフローチャートに示すようになっている。図2
のステップs5「訳語選択」の動作を詳細に示したのが
図17である。
【0063】まず“She is Hiromi Washington.”の翻
訳動作を説明する。図2のS1からS4までの動作は、
先に説明した動作と同じである。この結果、原文バッフ
ァ7aは図8、構文バッファ7cは図10のようにな
る。ただし、この処理において、前の処理との相違点と
して、辞書引きバッファ7bは図18に示すように、原
文単語“Washington”の「品詞細分類」欄に「人名」フ
ラグデータが付与されている。そして図17のフローチ
ャートに進む。
【0064】訳語選択の動作では、“She is Hiromi”
までは、前述の処理で“She is Hiromi Washington.”
を訳した場合の訳語選択と同様の動作が行われ、「彼
女」「は…である」「Hiromi」という訳語が一旦選ばれ
る。そして次に原文単語“Washington”が着目される。
【0065】“Washington”は未知語ではなく、名詞で
あり、そして訳語は「ワシントン」のようにカタカナで
あり、そして、辞書引きバッファの「品詞細分類」欄に
「人名」フラグデータが付与されている。よって、S6
02で未知語でないと判定されてS603に進み、一
旦、通常の訳語選択動作がなされ、その結果たとえば
「ワシントン」が訳語とされてS604に進む。「ワシ
ントン」はカタカナであり、かつこれに対応する原文単
語“Washington”の品詞は名詞なので、S604からS
605に進む。
【0066】S605では現在着目している原文単語の
品詞細分類が「人名」であるかどうかが単語付随情報処
理手段5e−3によってチェックされる。「人名」でな
ければS610に進むが、“Washington”の場合人名で
あるので、S606に進む。
【0067】S606では1つ前の訳文単語が前訳語種
別判定手段5e−1によりチェックされる。「ワシント
ン」の1つ前の訳文単語は「Hiromi」で、これに対応す
る原文単語は“Hiromi”であり、これは“Washington”
と構文上同一のまとまりにあることが図10の構文構造
からわかり、そして図18の辞書引きバッファを参照し
た結果、“Hiromi”は未知語であるとわかるので、S6
06からS609に進み、原文単語“Washingon”がそ
のまま訳語バッファに格納され、訳語バッファは図19
に示すようになる。
【0068】以上で、文末までの訳語決定が終わったの
で、S611→S612から[end]へ進み、訳語選
択の動作が終わる。図2のフローチャートに戻り、S5
からS6に進んで、ターゲット言語生成手段5fにより
日本語文が 「彼女は、Hiromi Washington である。」 のように生成されて、翻訳が完了する。
【0069】次に、単語使用辞書判定手段5e−4を用
いた処理を説明する。
【0070】原文は、He is George Lucas.であるとす
る。
【0071】これらの文に使われている原文単語のう
ち、“Lucas”は辞書に収録されていないとする。
【0072】図1の記憶手段6に記憶されている辞書デ
ータには、「基本辞書」と「オプション辞書」という2
個の辞書データのまとまりが存在している。上記の文に
使われている原文単語のうち、“George”は「オプショ
ン辞書」に収録されている語であるとする。
【0073】本実施例による処理動作の過程は、図3と
図20のフローチャートに示すようになっている。図3
のステップs5「訳語選択」の動作を詳細に示したのが
図20である。
【0074】翻訳開始時には、利用者が使用辞書選択手
段5aを動作させることにより、使用辞書フラグバッフ
ァ7gに「オプション辞書」を示す情報が格納される。
【0075】図2のS1からS4までの動作を行った結
果、原文バッファ7aは図12、構文バッファ7cは図
14のようになる。辞書引きバッファ7bは図21に示
すように、原文単語“George”の「辞書種別」欄に「オ
プション」データが格納されている。処理の流れを図2
0のフローチャートに示す。
【0076】訳語選択の動作では、“He is”までは前
述の処理で“He is George Lucas.”を訳した場合の訳
語選択と同様の動作が行われ、「彼」「は…である」と
いう訳語が一旦選ばれる。そして次に原文単語“Georg
e”が着目される。
【0077】“George”は未知語ではなく、名詞であ
り、そして訳語は「ジョージ」のようにカタカナであ
り、辞書引きバッファの「辞書種別」欄に「オプショ
ン」データが格納されている。よって、S702で未知
語でないと判定されてS703に進み、一旦、通常の訳
語選択動作がなされ、その結果たとえば「ジョージ」が
訳語とされてS704に進む。「ジョージ」はカタカナ
であり、かつこれに対応する原文単語“George”の品詞
は名詞なので、S704からS705に進む。
【0078】S705では現在着目している原文単語の
辞書種別が「オプション」であるかどうかが、1単語ご
との使用辞書判定手段5e−4によってチェックされ
る。「オプション」でなければS710に進むが、“Ge
orge”の場合オプション辞書に記憶されている語である
ので、S706に進む。
【0079】S706では前訳語種別判定手段5e−1
により1つ前の訳文単語がチェックされる。「ジョー
ジ」の1つ前の訳文単語は「は」で、これに対応する原
文単語は“is”であるとわかる。これは未知語ではな
く、また図14の構文構造を参照すれば“is”と“Geor
ge”とは構文上同一のまとまりにはないということがわ
かるので、S706からS710に進み、訳語「ジョー
ジ」が訳語バッファ7eに格納される。この時点で訳語
バッファは図22に示すようになっている。そしてS7
11→S712→S702と進み、単語“Lucas”が着
目される。
【0080】図21の辞書引きバッファを参照した結
果、“Lucas”の「未知語フラグ」欄が空欄でないの
で、“Lucas”は未知語であることがわかる。よって、
S702からS707に進む。S707では現在着目し
ている語の、訳文側における1つ前の単語の条件が前訳
語種別判定手段5e−1によりチェックされる。1つ前
の訳文単語は「ジョージ」で、これに対応する原文単語
は“George”であり、これは“Lucas”と構文上同一の
まとまりにあることが図14の構文構造からわかり、そ
して「ジョージ」はカタカナで、“George”は名詞であ
り、かつその辞書種別は「オプション」であるとわかる
ので、S707からS708に進み、訳語再決定手段5
e−2によって、訳語バッファにおいて訳語「ジョー
ジ」がそれに対応する原文単語“George”に置き換えら
れる。そしてS708からS709に進み、原文単語
“Lucas”がそのまま訳語バッファに格納され、訳語バ
ッファは図23に示すように変わる。
【0081】以上で、文末までの訳語決定が終わったの
で、S711→S712から[end]へ進み、訳語選
択の動作が終わる。図2のフローチャートに戻り、S5
からS6に進んで、ターゲット言語生成手段5fにより
日本語文が 「彼は、George Lucas である。」 のように生成されて、翻訳が完了する。
【0082】
【発明の効果】本発明は辞書に収録されていない原文単
語を訳文中に原文言語のまま訳出するような機械翻訳処
理に関して、以下のような効果を奏する。
【0083】訳文において、原文言語の単語とカタカナ
の訳語とが連接した名詞句となるのを防ぎ、すべて原文
言語の単語として訳出することによって、人名などを訳
した場合に、原文言語の単語とカタカナとが混在した見
苦しい訳を出力することを防ぐことができ、特定の単語
を原文単語の単語のまま訳出するように予めユーザが指
定するといった手間を省くことができる。
【0084】さらには、人名などに限って上記処理を行
うことによって、人名以外の名詞などにおいて望ましく
ない処理結果がでることを防ぐことができる。
【0085】また、特定の分野の単語を特定の辞書に収
録することによって、特定の分野の単語を訳した場合
に、同様に原文言語の単語とカタカナとが混在した見苦
しい訳が出力されることを防ぐことができる。
【図面の簡単な説明】
【図1】本発明における機械翻訳処理のブロック図であ
る。
【図2】本発明における翻訳処理の流れを示すフローチ
ャートである。
【図3】本発明における訳語選択処理の流れを示すフロ
ーチャートである。
【図4】本発明における原文バッファの例を示す図であ
る。
【図5】本発明における辞書引きバッファの例を示す図
である。
【図6】本発明における構文バッファの例を示す図であ
る。
【図7】本発明における訳語バッファの例を示す図であ
る。
【図8】本発明における原文バッファの例を示す図であ
る。
【図9】本発明における辞書引きバッファの例を示す図
である。
【図10】本発明における構文バッファの例を示す図で
ある。
【図11】本発明における訳語バッファの例を示す図で
ある。
【図12】本発明における原文バッファの例を示す図で
ある。
【図13】本発明における辞書引きバッファの例を示す
図である。
【図14】本発明における構文バッファの例を示す図で
ある。
【図15】本発明における訳語バッファの例を示す図で
ある。
【図16】本発明における訳語バッファの例を示す図で
ある。
【図17】本発明における訳語選択処理の流れを示すフ
ローチャートである。
【図18】本発明における辞書引きバッファの例を示す
図である。
【図19】本発明における訳語バッファの例を示す図で
ある。
【図20】本発明における訳語選択処理の流れを示すフ
ローチャートである。
【図21】本発明における辞書引きバッファの例を示す
図である。
【図22】本発明における訳語バッファの例を示す図で
ある。
【図23】本発明における訳語バッファの例を示す図で
ある。
【符号の説明】
1 動作制御手段 2 入力手段 3 出力手段 4 バスライン 5 翻訳モジュール 5a 使用辞書選択手段 5b 辞書引き形態素解析手段 5c 構文解析手段 5d 構文変換手段 5e 訳語選択手段 5e−1 前訳語種別判定手段 5e−2 訳語再決定手段 5e−3 単語付随情報処理手段 5e−4 使用辞書判定手段 5f ターゲット言語生成手段 6 記憶手段

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 プログラムによって、第1言語からなる
    原文を入力し、該原文を所望の第2言語に翻訳した訳文
    の出力を行う機械翻訳装置であって、 第1言語の単語とその品詞情報と、該第1言語の単語に
    対応する第2言語の訳語を記述している単語辞書と、 前記単語辞書に基づき、入力された原文を解析し、該原
    文を構成する各単語毎に、前記単語辞書に収録されてい
    るか否かを示す未知語情報、品詞情報、訳語を含む形態
    素解析情報を得る形態素解析手段と、 前記形態素解析情報に基づいて、原文を構成する各単語
    の構文構造を示す構造解析木を得る構文解析手段と、 前記形態素解析情報に基づいて、原文を構成する各単語
    の訳語内容の選択を行う際に、前記各単語が未知語であ
    るか否かを順次チェックするとともに、 未知語であると判断した場合には、 原文中においてチェック中の単語の1つ前に位置する単
    語の品詞情報が名詞かつ訳語がカタカナであり、更に前
    記構造解析木から1つ前に位置する単語がチェック中の
    単語と構文構造上同一のまとまりにあるかをチェックし
    て、まとまりがあると判断したら、チェック中の単語の
    訳語内容と前記一つ前に位置する単語の訳語内容とを原
    文とし、まとまりがないと判断したらチェック中の単語
    の訳語内容を原文とし、 未知語でないと判断した場合には、 チェック中の単語の品詞情報が名詞かつ訳語がカタカナ
    であるとともに、原文中においてチェック中の単語の1
    つ前に位置する単語が未知語であり、更に前記構造解析
    木からチェック中の単語が1つ前の位置にある単語と構
    文構造上同一のまとまりにあるかをチェックして、まと
    まりがあると判断したら、チェック中の単語の訳語内容
    を原文とし、まとまりがないと判断したらチェック中の
    単語の訳語内容を訳語とする訳語選択手段とを備え、 前記訳語選択手段で選択された訳語内容に基づいて訳文
    を出力することを特徴とする機械翻訳装置。
  2. 【請求項2】 第1言語からなる原文テキストを入力
    し、該テキストを所望の第2言語に翻訳して出力を行う
    装置であって、 第1言語による見出し語と、それに対応する第2言語に
    よる訳語を記憶している単語辞書と、 前記単語辞書を用いて形態素解析を行う形態素解析手段
    と、 前記形態素解析の結果から、構文の解析を行う構文解析
    手段と、 前記形態素解析の結果に基づいて、原文テキスト内から
    前記単語辞書の見出し語にない単語を検出する未知語検
    出手段と、 前記未知語検出手段によって、原文テキスト内に前記単
    語辞書の見出し語にない単語が検出された場合、前記構
    文解析手段の結果に基づいて前記単語を含む句を検出
    し、該句の訳語を入力単語のままとする訳語選択手段を
    備えたことを特徴とする機械翻訳装置。
  3. 【請求項3】 第1言語からなる原文テキストを入力
    し、該テキストを所望の第2言語に翻訳して出力を行う
    装置であって、 第1言語による見出し語と、それに対応する第2言語に
    よる訳語を記憶している単語辞書と、 前記単語辞書を用いて形態素解析を行う形態素解析手段
    と、 前記形態素解析の結果に基づいて、原文テキスト内から
    前記単語辞書の見出し語にない未知語を検出する未知語
    検出手段と、 前記未知語検出手段によって検出された未知語の直前ま
    たは直後の単語が人名であるか判断する前後単語種別判
    断手段と、 前記前後単語種別判断手段によって、前記未知語の直前
    または直後の単語が人名であると判断された場合、該単
    語および前記未知語の訳語を入力単語のままとする訳語
    選択手段を備えたことを特徴とする機械翻訳装置。
  4. 【請求項4】 前記単語辞書は、第1言語による見出し
    語と、それに対応する第2言語による訳語および該単語
    における意味あるいは語法上の特定の単語情報を記憶
    し、 前記前後単語種別判断手段は、前記単語辞書に記憶され
    ている単語情報に基づいて、前記未知語の直前または直
    後の単語が人名であるか判断することを特徴とする請求
    項3に記載の機械翻訳装置。
  5. 【請求項5】 前記単語情報は品詞情報を含み、前記前
    後単語種別判断手段は、前記単語辞書に記憶されている
    単語情報に基づいて、前記未知語検出手段によって検出
    された未知語の直前または直後の単語が名詞であるか判
    断し、 前記訳語選択手段は、前記前後単語種別判断手段によっ
    て、前記未知語の直前または直後の単語が名詞であると
    判断された場合、該単語および前記未知語の訳語を入力
    単語のままとすることを特徴とする請求項4に記載の機
    械翻訳装置。
  6. 【請求項6】 前記前後単語種別判断手段は、前記単語
    辞書に記憶されている訳語に基づいて、前記未知語検出
    手段によって検出された未知語の直前または直後の単語
    の訳語がカタカナであるか判断し、 前記訳語選択手段は、前記前後単語種別判断手段によっ
    て、前記未知語の直前または直後の単語の訳語がカタカ
    ナであると判断された場合、該単語および前記未知語の
    訳語を入力単語のままとすることを特徴とする請求項3
    に記載の機械翻訳装置。
  7. 【請求項7】 前記単語辞書は、第1言語による基本的
    な見出し語とそれに対応する第2言語による訳語を記憶
    している基本辞書と、第1言語による補助的な見出し語
    とそれに対応する第2言語による訳語を記憶しているオ
    プション辞書から構成され、 前記前後単語種別判断手段は、前記未知語検出手段によ
    って検出された未知語の直前または直後の単語がオプシ
    ョン辞書に記憶されている単語であるか判断し、 前記訳語選択手段は、前記前後単語種別判断手段によっ
    て、前記未知語の直前または直後の単語がオプション辞
    書に記憶されている単語であると判断された場合、該単
    語および前記未知語の訳語を入力単語のままとすること
    を特徴とする請求項3に記載の機械翻訳装置。
JP22295196A 1996-08-26 1996-08-26 機械翻訳装置 Expired - Lifetime JP3353873B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22295196A JP3353873B2 (ja) 1996-08-26 1996-08-26 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22295196A JP3353873B2 (ja) 1996-08-26 1996-08-26 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH1063663A JPH1063663A (ja) 1998-03-06
JP3353873B2 true JP3353873B2 (ja) 2002-12-03

Family

ID=16790440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22295196A Expired - Lifetime JP3353873B2 (ja) 1996-08-26 1996-08-26 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3353873B2 (ja)

Also Published As

Publication number Publication date
JPH1063663A (ja) 1998-03-06

Similar Documents

Publication Publication Date Title
JP3161942B2 (ja) 訳振り機械翻訳装置
JPS6231467A (ja) 文章作成装置
JPH08190563A (ja) 機械翻訳装置
EP0357344B1 (en) Computer assisted language translating machine
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH05120324A (ja) 言語処理方式
JP3353873B2 (ja) 機械翻訳装置
JPH0332106B2 (ja)
JP2715419B2 (ja) 翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP3244286B2 (ja) 翻訳処理装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JPH0332105B2 (ja)
JPH0635964A (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPH0736885A (ja) 文書作成装置の文字情報変換制御方法及び同装置
JPH07262194A (ja) 機械翻訳装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0383161A (ja) 文書作成処理装置
JPH0887506A (ja) パターン照合併用型翻訳処理装置
JP2000137713A (ja) 機械翻訳装置及び記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110927

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120927

Year of fee payment: 10