JP3233800B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP3233800B2
JP3233800B2 JP29515794A JP29515794A JP3233800B2 JP 3233800 B2 JP3233800 B2 JP 3233800B2 JP 29515794 A JP29515794 A JP 29515794A JP 29515794 A JP29515794 A JP 29515794A JP 3233800 B2 JP3233800 B2 JP 3233800B2
Authority
JP
Japan
Prior art keywords
word
sentence
original sentence
original
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP29515794A
Other languages
English (en)
Other versions
JPH08153107A (ja
Inventor
稔幸 奥西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP29515794A priority Critical patent/JP3233800B2/ja
Publication of JPH08153107A publication Critical patent/JPH08153107A/ja
Application granted granted Critical
Publication of JP3233800B2 publication Critical patent/JP3233800B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳装置に関し、
特に所定の言語で書かれた文書を別の言語に翻訳する機
械翻訳装置に関する。
【0002】
【従来の技術】所定の言語で書かれた文書を別の言語に
翻訳する際に、対象言語の中に最適な訳語がみつからな
い場合がある。最新の専門用語などで共通の訳語がまだ
定着していない場合や、一般の単語でも2つの言語間で
原語と訳語が指す概念が微妙にずれている場合である。
人間が翻訳する場合は、意味的に最も近い訳語を付与し
た上に、原文の意味や雰因気を損なわないために、訳語
の直後に原文を挿入することが多い。例えば、 原文[I'll call it unification.] という英文を日本語に訳す際、もしも、[unification
]という用語にまだ定着した訳語がなければ、人間が
翻訳する場合はとりあえず『同一化』という訳語に原文
を加え、次のように訳すことが多い。
【0003】訳文『それを同一化(unification)と呼
ぶことにする。』 通常、このような訳語に原文を付与する操作は、後編集
操作としてテキストエディタを用いて行なわれる。ま
た、この編集操作を支援する技術として特開平5−24
2141号公報に開示されている機械翻訳装置がある。
【0004】この機械翻訳装置は、英文を翻訳した日本
語文が英語の語が持つ概念と少し異なってしまうことが
あるため、ユーザが挿入の必要性を判断し、訳語を指定
すると、原文の語が訳文の語の後ろに挿入される装置で
ある。
【0005】この機械翻訳装置は、図18に示すよう
に、原文の入力及び後編集のための訳文の変更を指定す
る入力手段101と、入力手段101から入力される原
文を翻訳する翻訳実行手段102と、入力手段101で
入力された原文と翻訳実行手段102で翻訳された結果
の訳文を対応付けて記憶する原文・訳文記憶手段103
と、原文・訳文記憶手段103の内容を表示する表示手
段104と、翻訳実行手段102の過程で得られたポス
トエディトのための原語と訳語が対応付けられた情報を
記憶するポストエディット情報記憶手段105と、ポス
トエディット情報記憶手段105に記憶された情報に基
づいてユーザから指定された語に対応する原文の語を指
定された語の後ろに挿入する原語挿入手段106と、原
語挿入手段106に対応するユーザの語の指定を入力す
る訳語指定手段107とを具備している。
【0006】次に、この従来例の動作について説明す
る。
【0007】例えば、”He goes to college"という英
文が入力手段101によって入力されると、翻訳実行手
段102により翻訳される。表示手段104には、 『He goes to college. 彼は大学ヘ行く。』 のように訳文が表示される。次に、得られた訳文の各訳
語に対して原語挿入の必要性が判定され、必要であれ
ば、マウスなどの訳語指定手段107を用いて、表示手
段104上に表示されたその訳語が指定される。例え
ば、「大学」の後ろに原語を挿入したいとすると、「大
学」という語が指示される。原語挿入手段106が、
「大学」の原語である”college" がポストエディット
情報記憶手段105から見つけ出され、それが括弧で囲
まれ、原文・訳文記憶手段103に格納されている訳文
データの「大学」の後ろに挿入され、表示手段104上
に次のように表示される。
【0008】『He goes to college. 彼は大学(coll
ege)ヘ行く。』
【0009】
【発明が解決しようとする課題】しかしながら、特開平
5−242141に開示されている機械翻訳装置では、
原文を挿入すべき訳語は全て人間が指定する必要があ
り、多量の文に対して処理する時などは使用者にとって
は非常に手間がかかるという問題点がある。また、原文
だけではなく、別の可能な訳語を付与しようと思えば、
テキストエディタで編集する必要があった。更に、原文
を付与すべき単語であっても所定範囲内、例えば同一文
書内などの全ての訳語に原文を振られてしまい、その後
は利用者がテキストエディタで第2番目以降の付与原文
を削除する必要があった。また、原文を付与する基準は
利用者の好みによって違い、そのような利用者はテキス
トエディタで不要な付与原文を1つ1つ削除する必要が
あった。
【0010】本発明は、上記のような課題を解消するた
めになされたもので、原文の付与の必要性を自動的に判
断して原文付与作業を自動的に行える機械翻訳装置を提
供することを第1の目的とする。
【0011】本発明は、別の訳語の付与作業を自動的に
行える機械翻訳装置を提供することを第2の目的とす
る。
【0012】
【課題を解決するための手段】本発明によれば、前述の
第1の目的は、所定の言語で書かれた文書を別の言語に
翻訳する機械翻訳装置であって、どの訳語に原文を挿入
すべきかを示した原文付与知識を記憶する原文付与知識
記憶手段と、前記知識を基に付与すべきと判断した原文
を選択・記憶する付与原文選択手段と、前記付与すべき
と判断した原文を記憶しておく付与原文記憶手段と、翻
訳文生成の際に選択・記憶された原文には訳語の直後に
原文を生成する原文付与手段とを備え、前記付与原文選
択手段が、入力文中の単語が専門辞書、ユーザ辞書また
は基本辞書の内の何れかの辞書から検索した単語である
かによって、原文を付与すべきであると判断する請求項
1の機械翻訳装置によって達成される。
【0013】本発明によれば、前述の第1の目的は、文
書並びに章や節のタイトルを記憶するタイトル記憶手段
を備え、前記付与原文選択手段が、前記タイトル記憶手
段に記憶された文書並びに章や節のタイトルと同じ語句
に対して原文を付与すべきであると判断する請求項
機械翻訳装置によって達成される。
【0014】本発明によれば、前述の第1の目的は、単
語の派生語を記憶した派生語展開テーブルを備え、前記
付与原文選択手段が、原文を付与すべきと判断された語
句または前記派生語展開テーブルに記憶された派生語を
含む複合語に対して原文を付与すべきであると判断する
請求項の機械翻訳装置によって達成される。
【0015】本発明によれば、前述の第2の目的は、前
記付与原文選択手段が、入力文中の単語が専門辞書、ユ
ーザ辞書、基本辞書の複数の辞書から検索できた単語で
あるか、選択した訳語が所定分野特有のものであるかに
よって、原文を付与すべきであると判断した場合に、訳
語に原文だけでなく別の辞書及び所定分野の訳語をも付
与する請求項の機械翻訳装置によって達成される。
【0016】
【作用】請求項1の機械翻訳装置によれば、予め設定さ
れた知識に基づき訳出された語に原文を付与すべきか否
を判定する選択手段を備える。また、選択手段により、
入力文中の単語が専門用語、ユーザ辞書単語または基本
辞書の内の何れかの辞書から検索した単語であるかに
って、原文が付与されるべきであると判断される。これ
により、翻訳文の中に原文を特定の形式で付与でき、利
用者の手を煩わせることなく、原文がもつ微妙な意味を
正確に翻訳結果に残すことができる。
【0017】請求項の機械翻訳装置によれば、選択手
段により、文書並びに章や節のタイトルと同じ語句に対
して原文が付与されるべきであると判断される。これに
より、翻訳文の中に原文を特定の形式で付与でき、利用
者の手を煩わせることなく、原文が持つ微妙な意味を正
確に翻訳結果に残せる。
【0018】請求項の機械翻訳装置によれば、前記選
択手段により、原文を付与すべきと判断された語句また
は派生語を含む複合語に対しても原文が付与されるべき
であると判断される。これにより、翻訳文の中に原文を
特定の形式で付与でき、利用者の手を煩わせることな
く、原文が持つ微妙な意味を正確に翻訳結果に残せる。
【0019】請求項の機械翻訳装置によれば、付与原
文選択手段により、入力文中の単語が専門用語、ユーザ
辞書単語、基本辞書等の複数の辞書から検索できた単語
であるか、選択した訳語が所定分野特有のものであるか
によって、原文が付与されるべきであると判断された場
合に、訳語に原文だけでなく別の辞書及び所定分野の訳
語が付与される。これにより、翻訳文の中に原文と別の
訳語を特定の形式で付与でき、利用者の手を煩わせるこ
となく、原文が持つ微妙な意味を正確に翻訳結果に残せ
る。
【0020】
【実施例】以下、本発明の機械翻訳装置の実施例を図を
参照しながら説明する。
【0021】本実施例の基本構成は、図1に示すよう
に、文字列及び記号を入力する入力手段1と、入力文字
列から下線、ボールド、引用符などの装飾情報を削除・
管理する装飾文字処理手段2と、入力文字列を形態素に
分解し、かつ文法解析を行なう辞書引き・形態素解析手
段3と、構文解析を行う構文解析手段4と、どの訳語に
原文を挿入すべきかを判断する付与原文選択手段5と、
構文変換手段6と、翻訳文を生成する翻訳文生成手段7
と、翻訳文を出力する出力手段8と、翻訳処理に必要な
辞書及び処理結果を記憶する記憶手段9と、原文付与知
識を選択する原文付与知識選択手段10と、翻訳文生成
の際に原文を付与する原文付与手段11とから構成され
ている。また、前記記憶手段9は、入力された文字列の
翻訳を行なうための文法及び訳語情報を持つ辞書メモリ
9aと、訳文生成に至るまでの処理の結果を記憶するバ
ッファメモリ9bと、原文付与選択手段5で用いる原文
付与知識9cと、単語の派生語関係を記した派生語展開
テーブル9dと、文書及び章や節のタイトルを記憶する
タイトル記憶手段9eと、付与原文選択手段5によって
選択された原文を記憶する付与原文記憶手段9fとを具
備している。更に、前記辞書メモリ9aは、専門辞書用
メモリ9a1と、ユーザ辞書用メモリ9a2と、基本辞
書用メモリ9a3とから構成されている。また、前記原
文付与知識9cは、パターン知識9c1と、ヒューリス
ティックス知識9c2とから構成されている。
【0022】次に、機械翻訳装置の実際の構成を図2を
用いて説明する。
【0023】機械翻訳装置は、各部を制御するCPU1
2と、前記記憶手段の構成要素としてのメインメモリ9
と、出力手段としてのCRTまたはLCDからなる表示
手段8と、入力手段としてのキーボード1と、翻訳を行
う翻訳モジュール13と、前記記憶手段の構成要素とし
ての辞書メモリ9aと、各部を接続するバスライン14
とから構成されている。
【0024】翻訳モジュール13は、図3に詳示するよ
うに、バス14を介して入力されるソース言語を、所定
の翻訳プログラムに従って翻訳してターゲット言語とし
てバス14に出力する翻訳CPU15と、翻訳CPU1
5で実行される翻訳プログラムを格納する翻訳プログラ
ムメモリ16と、入力されたソース言語の原文を各単語
ごとに格納するバッファA17と、辞書メモリ9aに含
まれる辞書を参照して得た各単語の品詞、訳語などの情
報を格納するバッファB18と、ソース言語の構造解析
木に関する情報を格納するバッファC19と、構造解析
木から変換されたターゲット言語の構造解析木を格納す
るバッファD20と、ターゲット言語の構造解析木に適
切な付属語、例えば日本語ならば助詞や助動詞などを補
充して、ターゲット言語の形として整えられた文章を格
納するバッファE21とを具備している。なお、翻訳C
PU15は、図1に示したように、装飾文字処理手段2
と、辞書引き・形態素解析手段3と、構文解析手段4
と、付与原文選択手段5と、構文変換手段6と、翻訳文
生成手段7と、原文付与知手段10と、原文付与手段1
1とを具備している。
【0025】ここで、機械翻訳の概念について説明す
る。
【0026】図4に示すような、様々な解析レベルがあ
り、図4の左上においてソース言語が入力されると、レ
ベルL1の辞書引き、レベルL2の形態素解析、レベル
L3の構文解析、…と、解析が進められる。機械翻訳
は、どのレべルの解析処理まで行なうかによって、大き
く次の2つに分けられる。1つは、レベルL6のソース
言語およびターゲット言語のどちらにも依存しない概念
である中間言語まで解析し、そこから、レベルL7の文
脈生成、レベルL3の意味生成、レベルL9の構文生
成、レベルL10の形態素生成と生成を進めて、ターゲ
ット言語を生成していくピボット方式である。もう1つ
は、上述のレベルL2の形態素解析、レべルL3の構文
解析、レベルL4の意味解析およびレべルL5の文脈解
析のいずれかまで解析を行ってソース言語の内部構造を
得、次に、この得られたソース言語の内部構造と同レべ
ルのターゲット言語の内部構造に変換した後、ターゲッ
ト言語を生成するトランスファー方式である。
【0027】辞書引き、形態素解析において、辞書メモ
リ9aの辞書が引かれ、入力された文章が各形態素列
(単語列)に分割され、この各単語に対する品詞などの
文法情報および訳語が得られ、更に時制・人称・数など
が解析される。構文解析においては、単語間の係り受け
などの、文章の構造(構造解析木)が決定される。意味
解析においては、複数の構文解析の結果から意味的に正
しいものとそうでないものが判別される。文脈解析にお
いては、話題が理解され、省略や曖昧さが取り去られ
る。
【0028】以下、図1から図9を用いて英日翻訳の動
作を説明する。ここでは、イディオムを含まない[This
is a pen.]という英文を日本語に翻訳する場合を例に
とり説明する。
【0029】まず、読み込まれた原文は図5に示すよう
にバッファA17に格納される。翻訳プログラムメモリ
16に記憶されたプログラムに基づく翻訳CPU15の
制御にて、辞書引き・形態素解析手段3における処理に
おいて、バッファA17に格納された原文に従って辞書
メモリ9aの辞書を用いて各単語の訳語等の情報が得ら
れ、バッファB18に格納される。例えば、その各情報
の一部である品詞情報は、図6に示すように格納され
る。ここで、”this"は多品詞語であるが、翻訳プログ
ラムのうちの構文解析手段4における処理において一意
に決定される。
【0030】構文解析手段4における処理においては、
辞書メモリ9aに格納された辞書と文法規別に従って、
各単語間の係り受け関係を示す構造解析木が例えば図7
に示すように決定され、バッファC19に格納される。
【0031】構造解析木の決定は、次のようにして決定
される。すなわら、辞書メモリ9aの文法規別から 文 → 主部、述部 主部 → 名詞句 述部 → 動詞、名詞句 名詞句 → 代名詞 名詞句 → 冠詞、名詞 の規則が得られる。この規則は、例えば、1つ目の規則
は”文とは、主部と述部からできている”ということを
表す。以下、この規則に従って構造解析が決定される。
【0032】翻訳プログラムのうち、構文変換手段6に
おける処理では、辞書メモリ9aの木構造変換規則を用
いて、図7に示すように、入力された英文に対する構文
解析木の構造が、図8に示すように、日本文に対する構
文解析木に変換される。そして、得られた結果がバッフ
ァD20に格納される。
【0033】翻訳プログラムの内、翻訳文生成手段7に
おける処理では、得られた日本文字『これペンであ
る。』に適切な助詞『は』や助動詞がつけられて、図9
に示すような日本語の形にして、バッファE21に格納
される。この日本文『これはペンである。』は、翻訳モ
ジュール13から出力され、メインメモリ9に格納され
ると共に、表示装置8に表示される。
【0034】次に、本実施例の動作を図10及び図11
のフローチャートに沿って説明する。なお、本実施例で
は、前後関係がある文法的な特徴を持つ単語に対して、
原文を付与する場合を説明する。
【0035】まず、チェック単語番号が初期化(p=
0)され(ステップS1)、その後、チェック単語番号
がインクリメント(p=1)される(ステップS2)。
そして、pの長さが、 原文[I'll explain correct answer substitution.] の文の長さを越えたか否かが判断され(ステップS
3)、pが文の長さを越えたと判断された場合は処理は
終了される。また、pが文の長さを越えていないと判断
された場合、p番目の単語Wpが装飾単語であるか否か
が判断され(ステップS4)、装飾単語でないと判断さ
れた場合、単語Wpが基本辞書以外の単語か否かが判断
される(ステップS5)。単語Wpが基本辞書以外の単
語でないと判断された場合、単語Wpが後述するパター
ン中の*か否かが判断され(ステップS6)、単語Wp
が図13に示すパターン中の*でないと判断された場
合、単語Wpがヒューリスティックスを満たすか否かが
判断される(ステップS7)。単語Wpがヒューリステ
ィックスを満たすと判断された場合、前述ステップS4
においてp番目の単語Wpが装飾単語であると判断され
た場合、前述ステップS5において単語Wpが基本辞書
以外の単語であると判断された場合、及び前述ステップ
S6において単語Wpが図13に示すパターン中の*で
あると判断された場合、単語WpまたはWpで始まるイ
ディオムの原文付与フラグがオンにされ(ステップS
8)、単語WpまたはWpで始まるイディオムが付与原
文記憶手段9fに格納されていなければ格納され(ステ
ップS9)、上述ステップS2へ戻る。
【0036】また、ステップS7において単語Wpがヒ
ューリスティックスを満たしていないと判断された場
合、単語Wpは名詞句の先頭単語か否かが判断され(ス
テップS10)、単語Wpが名詞句の先頭単語である場
合、単語Wpは付与原文記憶手段9fに格納されている
か否かが判断される(ステップS11)。そして、単語
Wpが付与原文記憶手段9fに格納されている場合、前
述ステップS8以降の動作が行われる。また、単語Wp
が付与原文記憶手段9fに格納されていない場合、派生
語展開テーブル9dより、単語Wpの派生語集合Dpが
取り出される(ステップS12)。それから、派生語集
合Dpは空集合か否かが判断され(ステップS13)、
派生語集合Dpが空集合でない場合、派生語集合Dpか
ら1語Dpiが取り出される(ステップS14)。更
に、派生語Dpiが付与原文記憶手段9fに格納されて
いるか否かが判断され(ステップS15)、派生語Dp
iが付与原文記憶手段9fに格納されている場合、単語
Wp=派生語Dpiであるとされ(ステップS16)、
前述ステップS8以降の動作が行われる。また、派生語
Dpiが付与原文記憶手段9fに格納されていないと判
断された場合、前述ステップS13以降の動作が繰り返
される。なお、上述ステップS10において単語Wpが
名詞句の先頭単語でないと判断された場合及び上述ステ
ップS13において派生語集合Dpが空集合であると判
断された場合、ステップS2へ戻される。
【0037】ここで、処理が進み、単語番号p=3の時
の処理を説明する。
【0038】構文解析手段4で構文解析が行なわれる
と、W3[correct]で始まる単語列[correct answer
substitution] が、後ろから前置詞句や関係節が修飾
しない名詞句であることがわかるので、バッファメモリ
9bに記憶しておく。
【0039】次に、原文付与単語選択手段5に処理が移
り、単語W3[correct]まで処理が進むと、ステップ
S7では、先ほどバッファメモリ9bに記憶しておいた
名詞句の解析結果が図14に示すヒューリスティックス
(知識1)を満たすのが認識できる。通常の翻訳処理だ
と、名詞句全体の訳は個々の要素を組み合わせた訳しか
出力されず、もしその語が何らかの専門用語だった場合
には、読み手には通じない可能性がある。
【0040】そこで、ステップS8に移り、図7に示す
解析バッファC19の[correct]で始まる単語列[cor
rect answer substitution]の箇所の原文付与フラグ
が、図12に示すように、オンにされる。更に、付与原
文記憶手段9fに、図17に示すように、原文が格納さ
れる(ステップS9)。その後、通常の翻訳処理が進
み、翻訳文生成手段7により翻訳文が生成される際、原
文付与手段11が呼ばれる。
【0041】ここで、原文付与手段11による原文付与
処理を図11を用いて説明する。
【0042】最初に、訳語に対応する単語の原文付与フ
ラグがオンかどうかがチェックされ(ステップS2
1)、訳語に対応する単語の原文付与フラグがオンなら
ば、原文付与処理に移る。それから、既に同一文書内で
一度でも出力されているかをチェックするため、付与原
文記憶手段9fの「付与済」フラグが調べられる(ステ
ップS22)。ここではフラグがオンでないので、別訳
付与フラグがチェックされる(ステップS23)。この
別訳付与フラグもオンでないので、訳語の直後に括弧が
つけられて、原文(『訳語(原文)』)が付与される
(ステップS24)。なお、本発明では、原文の表示は
訳語の直後に括弧をつけて出す形式に限定しているわけ
ではない。更に、同一文書の別の文で出現しても訳語に
原文を付与しないように、図17に示すように、付与原
文記憶手段9fの「付与済」フラグがオンにされる(ス
テップS27)。
【0043】その後、翻訳文生成手段7により、その他
の訳語が生成され、翻訳文が以下のように完成される。
【0044】『正しい回答代用(correct answer subst
itution)を説明しよう。』本来は『正解代入』が正し
いが、ユーザ用語にも専門用語にも未登録なため、上記
のような訳が出てしまうが、原文が付与されているの
で、読み手には正しく伝わる。
【0045】次に、請求項の機械翻訳装置の実施例に
ついて説明する。なお、装置構成は図1から図3までと
同一なので説明を省略する。本実施例では、どの辞書
(専門用語、ユーザ辞書単語、基本辞書)から検索した
単語であるか、訳語が何れかの分野特有のものであるか
によって、原文を付与する場合を説明する。
【0046】原文[She graduated at a time of job s
carcity.]を用いて、単語番号p=7の時の処理を説明
する。
【0047】辞書メモリ9aに示すように、同じ辞書と
いっても、専門辞書9a1、ユーザ辞書9a2、基本辞
書9a3と三つに分けて格納されており、辞書引き・形
態素解析手段3による辞書引きの結果に、各単語がどの
辞書から検索されたものかが記憶されている。そこか
ら、単語W7[job] で始まるイディオム[job scarci
ty]はユーザ辞書9a2から検索されたということが分
かる(ステップS5)。『就職難』という訳語は、その
ユーザ個人の判断で割り当てた可能性があり、原文を付
与しないと他の読み手に通じない可能性がある。
【0048】そこで、ステップS5に移り、図7に示す
ように、解析バッファ19の[jobscarcity]の箇所に
原文付与フラグが立てられ、更に、付与原文記憶手段9
fに原文が格納される(ステップS6)。
【0049】最後に、翻訳文生成手段7により翻訳文が
生成される際、原文付与手段11が呼ばれ、前述同様に
原文付与の訳語が生成された後、翻訳文生成手段7によ
り、その他の訳語が生成され、翻訳文が以下のように完
成される。
【0050】『彼女は就職難(job scarcity)の時代に
卒業した。』 次に、本発明と関連のある機械翻訳装置の実施例につい
て説明する。なお、装置構成は図1から図3までと同一
なので説明を省略する。本実施例では、引用符、下線、
装飾文字などで強調された単語に対して原文を付与する
場合を説明する。
【0051】原文[This system can "look-up" the sp
ecified word.]を用いてp=5の時の処理を説明す
る。
【0052】下線や、装飾文字(字体)などの情報はO
CR等の入力手段1で文書を読み込む時に検出され、装
飾文字処理手段3により該当単語列と共にバッファメモ
リ9bに記憶される。引用符記号は、辞書引き・形態素
解析手段3により検出され、バッファメモリ9bに記憶
される。
【0053】その後、構文解析を経て、原文付与単語選
択手段5の処理により、単語W5[look-up] まで処理
が進むと、ステップS4では、先ほど、バッファメモリ
9bに記憶しておいた情報を基に装飾単語であるかが判
定され、ステップS8に移り、解析バッファ19の[lo
ok-up] の箇所の原文付与フラグがオンにされ、更に、
付与原文記憶手段9fに原文が格納される(ステップS
6)。
【0054】最後に、翻訳文生成手段7により翻訳文が
生成される際、原文付与手段11が呼ばれ、前述同様に
原文付与の訳語が生成された後、翻訳文生成手段7によ
りその他の訳語が生成され、翻訳文が次のように完成さ
れる。
【0055】『このシステムは指定された単語を探す
(look-up)ことができる。』 次に、他の本発明と関連のある機械翻訳装置の実施例に
ついて説明する。なお、装置構成は図1から図3までと
同一なので説明を省略する。本実施例では、ある特定の
文パターンに含まれる場合に、原文を付与する場合を説
明する。
【0056】原文[That operation is called unifica
tion.]を用いてp=5の時の処理を説明する。
【0057】構文解析手段4で構文解析が行なわれる
と、入力文が[〜is called …]のパターンであること
がわかるので、バッファメモリ9bに記憶される。次
に、原文付与単語選択手段5に処理が移り、単語W5
[unification]まで処理が進むと、ステップS6で
は、バッファメモリ9bに記憶しておいた入力文のパタ
ーンが図13に示すパターンに含まれ、原文付与マーク
(図13中の*マーク)が付られた語句に相当する[un
ification]であることが認識できる。
【0058】次に、ステップS8に移り、解析バッファ
19の[unification] の箇所の原文付与フラグがオン
にされ、更に、付与原文記憶手段9fに原文が格納され
る(ステップS9)。
【0059】最後に、翻訳文生成手段7により翻訳文が
生成される際、原文付与手段1が呼ばれ、前述同様に原
文付与の訳語が生成された後、翻訳文生成手段7によ
り、その他の訳語が生成され、以下のように翻訳文が完
成される。
【0060】『その操作は単一化(unification)と呼
ばれる。』 次に、請求項の機械翻訳装置の実施例について説明す
る。なお、装置構成は図1から図3までと同一なので説
明を省略する。本実施例では、各種タイトル(文書、章
節、図表など)に含まれる語句を基にして、原文を付与
する場合を説明する。
【0061】 [3.1.1 negation elimination ・・・・・・・・・・・・・・・・・・・・・・・・・・. Negation elimination rule is related with the following rule. ・・・・・・・・・・・・・・・・・・・・・・・・・・. ・・・・・・・・・・・・・・・.] 入力文[Negation elimination rule is … ]に対する
単語書号p=1の時の処理を説明する。この入力文を処
理するまでに、その章のタイトルである[negation eli
mination]が既に翻訳処理されている。その際、図15
に示すように、タイトルとなる原文はタイトル記憶手段
9eに記憶される。
【0062】次に、入力文の単語W1[negation]のス
テップS7では、図14に示すヒューリスティックス
(知識4)より、バッファメモリ9bに記憶されている
タイトル名詞句が一致するので、ステップS8に移り、
解析バッファC19の[negation elimination]の箇所
の原文付与フラグがオンにされ、更に、付与原文記憶手
段9fに原文が格納される(ステップS9)。
【0063】最後に、翻訳文生成手段7により翻訳文が
生成される際、原文付与手段1が呼ばれ、前述同様に原
文付与の訳語が生成された後、翻訳文生成手段7によ
り、その他の訳語が生成され、以下の様に翻訳文が完成
される。
【0064】
【0065】 [3.1.1 否定除去・・・・・・・・・・・・・・・・・・・・・・・・・・ 。
【0066】否定除去(Negation elimination)規則
は、次の規則と関連している。
【0067】・・・・・・・・・・・・・・・・・・・・・・・・・・ 。
【0068】・・・・・・・・・・・・・・・ 。] 次に、請求項の機械翻訳装置の実施例について説明す
る。なお、装置構成は図1から図3までと同一なので説
明を省略する。本実施例では、上述実施例で用いた単語
またはその派生語を含む複合語に対して、原文を付与す
る場合について説明する。
【0069】いま、[procedure ]がここまでの実施例
中の何れかの理由で、付与原文として付与原文記憶手段
9fに格納されていたとする。その後、 [Logic has a procedure interpretation.] という入力文があった時の単語番号p=4の時の処理を
説明する。
【0070】W4[procedure ]はステップS4〜S7
まで全てNOである。また、W4は、名詞句の必要単語
ではあるが(ステップS10)、原文訳語メモリ9eに
格納されていないので(ステップS11)、次に、図1
6に摸式的に示す派生語展開テーブル9dから[proced
ure ]の派生語が取り出される(ステップS12)。
【0071】その内の一つ(ステップS14)に[proc
edure ]があり、これが原文訳語メモリ9eに含まれる
(ステップS15)ので、ステップS8に移り、解析バ
ッファC19の[procedure interpretation]の箇所の
原文付与フラグがオンにされ、更に、付与原文記憶手段
9fに原文が格納される(ステップS9)。
【0072】最後に、翻訳文生成手段7により翻訳文が
生成される際、原文付与手段11が呼ばれ、前述同様に
原文付与の訳語が生成された後、翻訳文生成手段7によ
り、その他の訳語が生成され、以下のように翻訳文が完
成される。
【0073】『論埋には手続き的な解択(procedure in
terpretation)がある。』次に、請求項の機械翻訳装
置の実施例について説明する。なお、装置構成は図1か
ら図3までと同一なので説明を省略する。本実施例で
は、他の可能な訳語も付与する場合を説明する。
【0074】原文[She graduated at a time of job s
carcity.]を用いて、単語番号p=7の時の処理を説明
する。
【0075】辞書メモリ9aに示すように、同じ辞書と
いっても、専門辞書9a1、ユーザ辞書9a2、基本辞
書9a3と三つに分けて格納されており、辞書引き・形
態素解析手段3による辞書引きの結果に、各単語がどの
辞書から検索されたものかが記憶されている。そこか
ら、単語W7[job] で始まるイディオム[job scarci
ty]はユーザ辞書9a2から検索されたということが分
かる(ステップS5)。『就職難』という訳語は、その
ユーザ個人の判断で割り当てた可能性があり、原文を付
与しないと他の読み手に通じない可能性がある。
【0076】そこで、ステップS5に移り、図7に示す
ように、解析バッファC19の[job scarcity]の箇所
の原文付与フラグがオンにされ、更に、付与原文記憶手
段9fに原文が格納される(ステップS6)。
【0077】最後に、翻訳文械手段7により翻訳文が生
成される際、原文付与手段11が呼ばれ、前述同様に原
文付与の訳語が生成される。但し、[job scarcity]の
訳語『就職難』がユーザ辞書の訳語であるので、別訳付
与フラグが付られる。このため、ステップS23ではス
テップS25に分岐され、基本辞書の名詞連続後として
の訳語『仕事不足』も原文の更に後ろに付与される。そ
の後、翻訳文生成手段7により、その他の訳語が生成さ
れ、翻訳文が以下のように完成される。
【0078】『彼女は就職難(job scarcity、仕事不
足)の時代に卒業した。』 次に、機械翻訳装置の他の実施例について説明する。な
お、装置構成は図1から図3までと同一なので説明を省
略する。本実施例では、ある範囲の文章内で2度目の原
文付与が抑制される例を説明する。
【0079】原文[That operation is called unifica
tion. Unification does not always succeed.] を用いてp=5の時の処理を説明する。
【0080】構文解析手段4で構文解析が行なわれる
と、入力文が[〜is called …]のパターンであること
がわかるので、バッファメモリ9bに記憶される。次
に、原文付与単語選択手段5に処理が移り、単語W5
[unification] まで処理が進むと、ステップS6で
は、バッファメモリ9bに記憶しておいた入力文のパタ
ーンが図13に示すパターンに含まれ、原文付与マーク
(図13中の*マーク)が付られた語句に相当する[un
ification] であることが認識できる。
【0081】次に、ステップS8に移り、解析バッファ
C19の[unification] の箇所の原文付与フラグがオ
ンにされ、更に、付与原文記憶手段9fに原文が格納さ
れる(ステップS9)。
【0082】そして、翻訳文生成手段7により第1文の
翻訳文が生成される際、原文付与手段1が呼ばれ、前述
同様に原文付与の訳語が生成された後、翻訳文生成手段
7により、その他の訳語が生成され、以下のように第1
番目の文の翻訳文が完成される。
【0083】『その操作は単一化(unification)と呼
ばれる。』 次に第2番目の文の処理が行われる。この時、原文付与
単語選択手段5では上述した処理と同じ処理が施され、
[unification ]の箇所の原文付与フラグがオンにされ
る。なお、付与原文記憶手段9fには既に格納されてい
るので、格納されない。最後に、翻訳文生成手段7によ
り翻訳文が生成される際、原文付与手段11が呼ばれる
が、付与済フラグがオンなので(ステップS22)、ス
テップS26に移り、『訳語』のみが出力されて終了す
る。その後、翻訳手段7により、その他の訳語が生成さ
れ、以下のように翻訳文が完成される。
【0084】『その操作は単一化(unification)と呼
ばれる。
【0085】単一化は必ず成功するとは限らない。』 次に、機械翻訳装置の他の実施例について説明する。な
お、装置構成は図1から図3までと同一なので説明を省
略する。本実施例では、原文を付与する基準(知識)を
利用者が選択できる場合を説明する。翻訳処時または他
の翻訳環境やモード設定などと同時に呼ばれる原文付与
知識選択手段10では、図13、図14に示したような
原文付与知識と、上述請求項7、8の機械翻訳装置の実
施例で示した「別訳表示」「2度目抑制」のモードが一
覧される。そこでユーザはマウスでクリックすることで
それぞれの知識を使うかどうかを選択する。例えば、図
14の知識3が「使用しない」と選択されると、上述し
た請求項5の機械翻訳装置の実施例の翻訳結果は、 [3.1.1 否定除去・・・・・・・・・・・・・・・・・・・・・・・・・・ 。
【0086】否定除去規則は、次の規則と関連してい
る。
【0087】・・・・・・・・・・・・・・・・・・・・・・・・・・ 。
【0088】・・・・・・・・・・・・・・・ 。] と原文が付与されない形に変わる。
【0089】
【発明の効果】請求項1の機械翻訳装置によれば、予め
設定された知識に基づき訳出された語に原文を付与すべ
きか否を判定する選択手段を備える。また、選択手段に
より、入力文中の単語が専門用語、ユーザ辞書単語また
は基本辞書の内の何れかの辞書から検索した単語である
かによって、原文が付与されるべきであると判断され
る。これにより、翻訳文の中に原文を特定の形式で付与
でき、利用者の手を煩わせることなく、原文がもつ微妙
な意味を正確に翻訳結果に残すことができる。
【0090】請求項の機械翻訳装置によれば、選択手
段により、文書並びに章や節のタイトルと同じ語句に対
して原文が付与されるべきであると判断される。これに
より、翻訳文の中に原文を特定の形式で付与でき、利用
者の手を煩わせることなく、原文が持つ微妙な意味を正
確に翻訳結果に残せる。
【0091】請求項の機械翻訳装置によれば、前記選
択手段により、原文を付与すべきと判断された語句また
は派生語を含む複合語に対しても原文が付与されるべき
であると判断される。これにより、翻訳文の中に原文を
特定の形式で付与でき、利用者の手を煩わせることな
く、原文が持つ微妙な意味を正確に翻訳結果に残せる。
【0092】請求項の機械翻訳装置によれば、付与原
文選択手段により、入力文中の単語が専門用語、ユーザ
辞書単語、基本辞書等の複数の辞書から検索できた単語
であるか、選択した訳語が所定分野特有のものであるか
によって、原文が付与されるべきであると判断された場
合に、訳語に原文だけでなく別の辞書及び所定分野の訳
語が付与される。これにより、翻訳文の中に原文と別の
訳語を特定の形式で付与でき、利用者の手を煩わせるこ
となく、原文が持つ微妙な意味を正確に翻訳結果に残せ
る。
【図面の簡単な説明】
【図1】この発明の機械翻訳装置の構成を示すブロック
図である。
【図2】この発明の機械翻訳装置の構成を示すブロック
図である。
【図3】この発明の機械翻訳装置の翻訳モジュールの構
成を示すブロック図である。
【図4】機械翻訳の概念を模式的に示す図である。
【図5】この発明の機械翻訳装置のバッファAの格納内
容を模式的に示す図である。
【図6】この発明の機械翻訳装置のバッファBの格納内
容を模式的に示す図である。
【図7】この発明の機械翻訳装置のバッファCの格納内
容を摸式的に示す図である。
【図8】この発明の機械翻訳装置のバッファDの格納内
容を摸式的に示す図である。
【図9】この発明の機械翻訳装置のバッファEの格納内
容を模式的に示す図である。
【図10】本発明の付与原文単語選択処理を示すフロー
チャート図である。
【図11】本発明の原文付与処理を示すフローチャート
図である。
【図12】原文付与フラグが振られたバッファCの格納
内容を摸式的に示す図である。
【図13】原文付与知識(パターン)を模式的に示す図
である。
【図14】原文付与知識(ヒューリスティックス)を模
式的に示す図である。
【図15】本発明のタイトル記憶手段を摸式的に示す図
である。
【図16】本発明の派生語語展開テーブルを模式的に示
す図である。
【図17】本発明の付与原文記憶手段を摸式的に示す図
である。
【図18】従来の機械翻訳装置の構成を示すブロック図
である。
【符号の説明】
1 入力手段 2 装飾文字処理手段 3 辞書引き・形態素解析手段 4 構文解析手段 5 付与原文選択手段 6 構文変換手段 7 翻訳文生成手段 8 出力手段 9 記憶手段 9a 辞書メモリ 9a1 専門辞書用メモリ 9a2 ユーザ辞書用メモリ 9a3 基本辞書用メモリ 9b バッファメモリ 9c 原文付与知識 9c1 パターン 9c2 ヒューリスティックス 9d 派生語展開テーブル 9e タイトル記憶手段 9f 付与原文記憶手段 10 原文付与知識選択手段 11 原文付与手段 13 翻訳モジュール

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定の言語で書かれた文書を別の言語に
    翻訳する機械翻訳装置であって、どの訳語に原文を挿入
    すべきかを示した原文付与知識を記憶する原文付与知識
    記憶手段と、前記知識を基に付与すべきと判断した原文
    を選択・記憶する付与原文選択手段と、前記付与すべき
    と判断した原文を記憶しておく付与原文記憶手段と、翻
    訳文生成の際に選択・記憶された原文には訳語の直後に
    原文を生成する原文付与手段とを備え、前記付与原文選
    択手段が、入力文中の単語が専門辞書、ユーザ辞書また
    は基本辞書の内の何れかの辞書から検索した単語である
    かによって、原文を付与すべきであると判断することを
    特徴とする機械翻訳装置。
  2. 【請求項2】 文書並びに章や節のタイトルを記憶する
    タイトル記憶手段を備え、前記付与原文選択手段が、前
    記タイトル記憶手段に記憶された文書並びに章や節のタ
    イトルと同じ語句に対して原文を付与すべきであると判
    断する請求項1に記載の機械翻訳装置。
  3. 【請求項3】 単語の派生語を記憶した派生語展開テー
    ブルを備え、前記付与原文選択手段が、原文を付与すべ
    きと判断された語句または前記派生語展開テーブルに記
    憶された派生語を含む複合語に対して原文を付与すべき
    であると判断する請求項1または請求項2に記載の機械
    翻訳装置。
  4. 【請求項4】 前記付与原文選択手段が、入力文中の単
    語が専門辞書、ユーザ辞書、基本辞書の複数の辞書から
    検索できた単語であるか、選択した訳語が所定分野特有
    のものであるかによって、原文を付与すべきであると判
    断した場合に、訳語に原文だけでなく別の辞書及び所定
    分野の訳語をも付与する請求項1に記載の機械翻訳装
    置。
JP29515794A 1994-11-29 1994-11-29 機械翻訳装置 Expired - Lifetime JP3233800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29515794A JP3233800B2 (ja) 1994-11-29 1994-11-29 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29515794A JP3233800B2 (ja) 1994-11-29 1994-11-29 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH08153107A JPH08153107A (ja) 1996-06-11
JP3233800B2 true JP3233800B2 (ja) 2001-11-26

Family

ID=17816998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29515794A Expired - Lifetime JP3233800B2 (ja) 1994-11-29 1994-11-29 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3233800B2 (ja)

Also Published As

Publication number Publication date
JPH08153107A (ja) 1996-06-11

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
KR900009120B1 (ko) 기계번역장치
JPS63223962A (ja) 翻訳装置
JPH06195373A (ja) 機械翻訳装置
US5608623A (en) Special cooccurrence processing method and apparatus
JPH05120324A (ja) 言語処理方式
JPH0344764A (ja) 機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JPH08190562A (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JPH0410665B2 (ja)
JP2719453B2 (ja) 機械翻訳装置
JP3389313B2 (ja) 機械翻訳装置
JP2839419B2 (ja) イディオム登録機能を持つ機械翻訳装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPS63136265A (ja) 機械翻訳装置
JP4023384B2 (ja) 自然言語翻訳方法及び装置及び自然言語翻訳プログラム
JPH0635964A (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JPH07191995A (ja) 機械翻訳装置
JPH05314172A (ja) 機械翻訳装置
JPH08185405A (ja) 機械翻訳装置
JPH10134055A (ja) 文作成支援装置及び文作成支援プログラムを記憶した媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090921

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090921

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110921

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120921

Year of fee payment: 11