JPH0816596A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH0816596A
JPH0816596A JP6170070A JP17007094A JPH0816596A JP H0816596 A JPH0816596 A JP H0816596A JP 6170070 A JP6170070 A JP 6170070A JP 17007094 A JP17007094 A JP 17007094A JP H0816596 A JPH0816596 A JP H0816596A
Authority
JP
Japan
Prior art keywords
interpretation
translation
analysis
syntactic
ambiguity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6170070A
Other languages
English (en)
Inventor
Kiyoshi Yamahata
潔 山端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6170070A priority Critical patent/JPH0816596A/ja
Publication of JPH0816596A publication Critical patent/JPH0816596A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 利用者に大きな負担を強いることなく十分に
高い精度の翻訳が行える機械翻訳装置を提供する。 【構成】 形態素解析部2による形態素解析後、前処理
部2は品詞の絞り込みや動詞の定型性等の統語的曖昧性
の解消を試みる。曖昧性を明確に解消できないとき、統
語別解釈選択部4はその統語的曖昧性にかかわる互いに
異なる複数の統語解釈を表示装置7に表示して利用者に
選択を促す。翻訳部5は、以後利用者の介入無しに、前
処理部3の処理結果に対し、曖昧性を考慮して文解析の
残りの処理である構文解析,意味解析にかかわる処理と
文生成処理とを実行し、得た翻訳結果を表示装置7に出
力する。また、別解釈翻訳指示部8から別解釈の翻訳が
指示されると、翻訳部5は翻訳部内部で現れた曖昧性に
起因した別解釈に基づく翻訳結果を表示装置7に出力す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は原言語を目的言語に翻訳
する機械翻訳装置に関し、特に、文解析の早い段階で曖
昧性の解消を利用者に求め、以後は利用者による介入無
しに曖昧性を考慮して処理を進めて翻訳結果を出力し、
利用者から別解釈の翻訳が指示された場合に、曖昧性に
起因する別解釈に基づく翻訳結果を出力するようにした
機械翻訳装置に関する。
【0002】
【従来の技術】一般に機械翻訳装置は、原言語による文
を入力し、辞書を参照しながら、文解析(形態素解析,
構文解析,意味解析)を行った後、文生成(構文生成,
形態素生成)を行って、目的言語による文を生成する。
このような機械翻訳装置において正しい翻訳結果を得る
ためには、特に文解析における形態素解析,構文解析,
意味解析の各段階で曖昧性を正しく解消しなければなら
ない。しかし、曖昧性の種類と数は膨大であり、全ての
曖昧性を自動的に正しく解消することは現在の技術では
困難である。この問題に対処するため、従来、以下の2
つのアプローチが試みられている。
【0003】その1つは、別解釈機構を持つ機械翻訳装
置である。例えば特開平1−134570号公報には、
構文,意味の曖昧性を保持したまま構文,意味解析を行
い、その結果得られる複数の解析結果を順次出力すると
いう自然言語処理方式が示されているが、別解釈機構を
持つ機械翻訳装置も基本的には同じであり、利用者が別
解釈を指示すると、装置は、解析,生成の各過程におい
て生ずる複数の解釈を保持したままそれぞれの解釈に対
して独立に処理を進め、訳文を生成する。その結果、お
互いに異なる解釈に基づく複数の翻訳結果が利用者に示
される。利用者はその中から正解を選択する。機械にと
って解消が困難な曖昧性を無理に解消せず、最終的な判
断を利用者に任せることによって、利用者が正解を得る
可能性を高めようとする発想である。
【0004】他のアプローチは、インターエディト式或
いはインタラクティブ式機械翻訳装置と呼ばれる装置で
ある。この装置では、機械翻訳の各段階で曖昧性(品
詞,係り受け,並列構造,省略,語義など)を解消する
ために利用者に質問を出し、利用者が質問に答えると、
次の段階へと進む。このアプローチは、機械にとって解
消が困難な曖昧性をその都度利用者の判断に任せること
によって、翻訳精度を向上しようとする発想である。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来のインターエディト式或いはインタラクティブ機
械翻訳装置では翻訳精度は高めることができるものの、
機械翻訳の各段階で利用者は質問に答えなければならな
いため、利用者の負担が極めて大きくなる。これに対し
て別解釈機構を持つ機械翻訳装置では利用者の負担は軽
減されるが、従来の別解釈機構を持つ機械翻訳装置は利
用者の介入なしに文解析における形態素解析,構文解
析,意味解析の各段階で曖昧性を考慮して処理を進めて
いるため、別解釈中にも正解が含まれないことも多く、
翻訳精度に難がある。
【0006】例えば、別解釈機構を持つ従来の機械翻訳
装置において、 ”Select Save customize fi
le fromthe File menu.” なる入力文を与えた場合、例えば、以下のような別解釈
結果のみが出力される場合がある。 ・選り抜きのSaveはファイルメニューからファイル
を特別仕立する。 ・選り抜きのSaveはファイルメニューからのファイ
ルを特別仕立する。 ・上流のSaveはファイルメニューからファイルを特
別仕立する。 ・選り抜きのSaveは列メニューからファイルを特別
仕立する。 ・上流のSaveはファイルメニューからのファイルを
特別仕立する。 ・選り抜きのSaveは列メニューからのファイルを特
別仕立する。 ・選り抜きのSaveはやすりメニューからファイルを
特別仕立する。 正しくは「Save customize fileを
ファイルメニューから選びなさい。」と訳すべきである
が、上記別解釈のバリエーションは”from”の係り
先、”select”および”file”の訳語の選択
のみについて表れており、”select”を動詞とし
た解釈はない。
【0007】この原因は、文解析の早い段階で誤って”
customize”を動詞と決定してしまったことに
ある。一般に、曖昧性は文解析から文生成に至る全ての
過程において発生し、最終的に可能な解釈の数はそれら
の掛算であるため、真の意味で全ての曖昧性を残して翻
訳処理を進めることは不可能である。処理が組み合わせ
的な爆発を起こすからである。このため、一般に別解釈
機構を持つ機械翻訳装置では、最終出力の数を十個程度
に絞り込むために内部でかなりの数の解釈を切り捨てて
いる。特に、品詞の曖昧性のように文解析の初期に現れ
る曖昧性は、後の解析過程での曖昧性を減らすために早
めに絞り込まれる傾向にある。この為、この段階で誤り
が生じると、上述した例のように別解釈機構があっても
正解を導くことが不可能となる。
【0008】そこで本発明の目的は、従来のインターエ
ディト式或いはインタラクティブ式と呼ばれる機械翻訳
装置の有する長所と従来の別解釈機構を持つ機械翻訳装
置の有する長所とを兼ね備えた機械翻訳装置、すなわち
利用者に大きな負担を強いることなく十分に高い精度の
翻訳が行える機械翻訳装置を提供することにある。
【0009】
【課題を解決するための手段】本発明は上記の目的を達
成するために、原言語を目的言語に翻訳するための辞書
を参照して、入力された原言語による文を目的言語によ
る文に変換する機械翻訳装置において、入力された原言
語の文を形態素解析する形態素解析手段と、統語的曖昧
性にかかわる互いに異なる複数の統語解釈を表示装置に
表示して選択を促す統語別解釈選択手段と、形態素解析
手段による解析結果を入力して自ら統語的曖昧性の解消
を試み、統語的曖昧性を明確に解消できるときは自ら統
語解釈を絞り込み、それ以外のときは前記統語別解釈選
択手段を使用して統語解釈を絞り込む前処理手段と、別
解釈翻訳指示手段と、前処理手段で絞りまれた統語解釈
に対して、以後利用者の介入無しに曖昧性を考慮して文
解析の残りの処理と文生成処理とを実行して翻訳結果を
前記表示装置に出力し、且つ、前記別解釈翻訳指示手段
の指示に応答して曖昧性に起因した別解釈に基づく翻訳
結果を前記表示装置に出力する翻訳手段とを有してい
る。
【0010】
【作用】本発明の機械翻訳装置においては、原言語によ
る文が入力されると、先ず形態素解析手段が辞書を用い
て形態素解析を行い、次いで前処理手段が、形態素解析
手段による解析結果を入力して、自ら統語的曖昧性の解
消を試みて明らかに解消できるときは品詞の決定や動詞
の定型性等の統語解釈を絞り込む。そして、自ら統語的
曖昧性を解消できなかった場合には、その統語的曖昧性
にかかわる互いに異なる複数の統語解釈を統語別解釈選
択手段が表示装置に表示して利用者に選択を促し、利用
者自身に統語的曖昧性を解消してもらう。そして、翻訳
手段が、前処理手段で自ら絞りこまれた統語解釈あるい
は利用者によって絞り込まれた統語解釈に対して、以後
利用者の介入無しに曖昧性を考慮して文解析の残りの処
理である構文解析,意味解析にかかわる処理と文生成処
理とを実行し、得た翻訳結果を表示装置に出力する。ま
た、別解釈翻訳指示手段から別解釈の翻訳が指示される
と、翻訳手段は、翻訳手段内部で現れた曖昧性に起因し
た別解釈に基づく翻訳結果を表示装置に出力する。
【0011】
【実施例】次に本発明の実施例について図面を参照して
詳細に説明する。
【0012】図1は本発明の一実施例の機械翻訳装置の
ブロック図である。この例の機械翻訳装置は、原言語が
英語、目的言語が日本語である英日機械翻訳装置であ
り、辞書1と、形態素解析部2と、前処理部3と、統語
別解釈選択部4と、翻訳部5と、キーボードの如き入力
装置6と、CRTディスプレイの如き表示装置7とで構
成されている。なお、8は別解釈翻訳指示部であり、例
えばキーボード上の特定のキーで構成される。
【0013】辞書1は、英語を日本語に翻訳する際の文
解析や文生成に必要な知識のうち語彙的なものを蓄積し
たものであり、形態素解析および形態素生成のための形
態素レベルの情報,構文解析および構文生成のための構
文レベルの情報,意味解析のための意味レベルの情報,
対訳語に関する情報等を保持する。特に、本実施例で
は、形態素解析のための情報中の各単語の品詞(動詞に
ついては定型動詞,不定型動詞の区別を含む)の各々
に、所定の文例集において当該単語がその品詞として出
現する頻度を反映した相対確率が付与されている。例え
ば、或る単語が二つの品詞を取りうる場合に、前記文例
集において第1の品詞で使われる割合が3割、第2の品
詞で使われる割合が残り7割とすると、第1の品詞に
0.3、第2の品詞に0.7の相対確率がそれぞれ付与され
ている。
【0014】形態素解析部2は、入力装置6から入力さ
れた英文に対して、辞書1を引きながらその英文がどの
ような形態素から構成されているかを明らかにする形態
素解析処理を行う部分である。この形態素解析部2で
は、単語区間を決定し、各々の単語に対して辞書内容を
ロードし、チャートの形式で解析結果を前処理部3に伝
達する。なお、一般に形態素解析では単語の品詞の決定
まで実行するが、本実施例では単語の品詞の決定は前処
理部3で行われるため、形態素解析部2では認定した単
語に対し辞書中の各品詞の情報を付与するだけで品詞の
決定は行わない。
【0015】前処理部3は、形態素解析部2による解析
結果を入力して自ら統語的曖昧性の解消を試み、明らか
に統語的曖昧性を解消できるときは自ら統語解釈を絞り
込み、明らかに統語的曖昧性を解消できないときは統語
別解釈選択部4を使用して統語解釈を絞り込む手段であ
る。この実施例の前処理部3では、統語的曖昧性として
品詞の曖昧性のみを扱っている。
【0016】図2は前処理部3の構成例を示すブロック
図である。この例の前処理部3は、品詞列連接確率知識
ベース31と確率モデル推定部32とで構成されてい
る。
【0017】品詞列連接確率知識ベース31は、品詞列
の連接確率を記憶するもので、例えば図3に示すように
英単語の品詞3つの並びの各々に対して、その出現確率
が表の形で与えられている。図中、Nは名詞、DETは
限定詞、Vは動詞を意味し、特に動詞については定型動
作V(fin)と不定型動詞V(inf)とを区別して
ある。なお、その他の品詞として副詞や形容詞等がある
が図には示されていない。また、toは不定型動作と結
合した場合に特別な作用を果たすために、一種の品詞と
して定めてある。
【0018】確率モデル推定部32は、単語認定と辞書
引きが終了した原文が形態素解析部2からチャートの形
で入力されると、その原文中の各単語の品詞を品詞列連
接確率知識ベース31を用いて推定する。この確率モデ
ル推定部32は、具体的には、入力文の単語数がnであ
るとき、先ず、 i : 位置iにおける単語の統語解釈 s(W): 単語統語解釈Wの品詞 p(W): 単語統語解釈Wの相対確率 tri(s1,s2,s3): 品詞列s1,s2,s
3の出現確率 であり、p(W)は形態素解析部2で辞書1からロード
されて解析結果中に付与された各品詞の相対確率が使用
され、tri(s1,s2,s3)は品詞列連接確率知
識ベース31から与えられる。
【0019】そして、確率モデル推定部32は、上記の
各列{Wi }のPに基づき、明らかに品詞の曖昧性が解
消できると判断できるときは、各単語の品詞を自ら決定
する。ここで、明らかに品詞の曖昧性が解消できる場合
とは、上記Pの値が最大の列と次にPの値が大きな列と
の差が十分に大きい場合等である。なお、本実施例では
品詞の曖昧性について利用者の判断を得る機会が確保さ
れているので、前処理部3において品詞の曖昧性を自ら
解消できるか否かの閾値は従来の別解釈機構を持つ機械
翻訳装置に比べて緩く設定し、無理に自ら品詞の曖昧性
を解消しないようにしてある。
【0020】他方、確率モデル推定部32は、自ら品詞
の曖昧性を解消できないと判断した場合は、上記の各列
{Wi }をその値Pと共に統語別解釈選択部4に通知
し、統語別解釈選択部4から返却される、選択後の列
{Wi }に基づいて品詞を決定する。
【0021】統語別解釈選択部4は、統語的曖昧性にか
かわる互いに異なる複数の統語解釈を表示装置7に表示
して利用者に選択を促す手段である。この統語別解釈選
択部4は、前処理部3から通知された各列{Wi }の内
容をその値Pの大きい順にそのまま表示装置7に表示し
て、利用者に最適な1つの列あるいは2つ以上の列を選
択させ、その選択された列{Wi }を前処理部3に返却
するように構成しても良いし、品詞列中の定型動詞に着
目して選択肢を選ばせるようにしても良く、また動詞,
品詞の曖昧性を持つ単語に着目して訳語選択の形で品詞
選択を行わせるようにしても良い。
【0022】翻訳部5は、前処理部3の出力を入力し、
前処理部3で絞りまれた統語解釈に対して、辞書1を参
照しながら、以後利用者の介入無しに曖昧性を考慮して
文解析の残りの処理と文生成処理とを実行する部分であ
る。この翻訳部5は、例えば図4に示すように、構文解
析手段51と、意味解析手段52と、文生成手段53
と、訳文出力手段54と、記憶手段55〜57とで構成
されている。
【0023】構文解析手段51は、前処理部3までの処
理で決定された入力原文の個々の単語の統語解釈結果に
基づき、曖昧性を考慮して構文解析を実施する手段であ
り、解析の結果得た互いに異なる解析結果55−1〜5
5−mをその妥当性の高い順に記憶手段55に蓄積す
る。意味解析手段52は、構文解析手段51の構文解析
結果55−1〜55−mの各々に対して独立に意味解析
を進め、その各々に対して曖昧性を考慮して得た互いに
異なる意味解析結果を解析結果56−1〜56−nとし
てその妥当性の高い順に記憶手段56に蓄積する。文生
成手段53は、意味解析手段52の意味解析結果56−
1〜56−nの各々に対して独立に文生成処理を進め、
その各々に対して得た互いに異なる訳文結果をその妥当
性の高い順に訳文57−1〜57−oとして記憶手段5
7に蓄積する。訳文出力手段54は、文生成手段53で
生成された訳文57−1〜57−oのうち最も妥当性の
高い訳文57−1を先ず表示装置7に表示し、その後、
利用者が別解釈翻訳指示部8を操作して別解釈翻訳を指
示した場合に残りの訳文57−2〜57−oを表示装置
7に出力する。
【0024】以下、具体的な英文を例にして本実施例の
動作を説明する。
【0025】例えば利用者が入力装置6から、 ”Select Save customize fi
le fromthe File menu.” なる英文を入力した場合、先ず、形態素解析部2は辞書
1を用いて形態素解析を行い、例えば図5に示すような
チャート形式で解析結果を前処理部3に伝達する。な
お、図5において、○から○に延びる線が単語認定され
た各々に対する統語解釈を意味しており、”Selec
t”については、定型動詞,不定型動詞,形容詞(a)
の3つの解釈が為され、その各々に対して該当する辞書
内容が付加されている。同様に、”Save”,”cu
stomize”,”file”,”File”につい
ても3つの統語解釈が、”from”,”the”,”
menu”,”.”については1つの統語解釈が為され
ている。
【0026】前処理部3の確率モデル推定部32は、図
5の如き解析結果に対し、前述の計算式F1により単語
統語解釈の並び(前述した列{Wi }と同じ)に対し確
率値Pを計算する。すなわち、今の例では、”Sele
ct”,”Save”,”customize”,”f
ile”,”File”については各々3つの統語解釈
があり、残りの単語は各々1つの統語解釈を持つので、
3×3×3×3×1×1×3×1×1=243通りの単
語統語解釈の並びに対して確率値Pを計算する。
【0027】そして、品詞の曖昧性について明らかに解
消できると判断したときは、最も確率値Pの大きな単語
統語解釈の並びに現れている各単語の品詞をその単語の
品詞として決定し、翻訳部5に伝達する。
【0028】他方、自ら品詞の曖昧性を解消することが
できない場合、前処理部3は、各単語統語解釈の並びを
その確率値と共に統語別解釈選択部4に通知する。な
お、この際、全ての単語統語解釈を通知するようにして
も良いが、余り確率値Pの小さなものを通知しても無意
味なので、確率値Pが相対的に小さなものを切り捨て、
上位幾つかのものを通知するようにしても良い。
【0029】統語別解釈選択部4は、例えば図6に示す
ように、前処理部3から通知された単語統語解釈の並び
をその確率値Pの大きな順に並べた選択画面を表示装置
7に表示し、利用者にその選択を促す。利用者の選択方
法としては、妥当と思われる1つ或いは複数の単語統語
解釈の並びを入力装置6を構成するキーボードやマウス
で選択する方法以外に、誤ったものを選択して除外する
といった方法が採られる。
【0030】但し、各単語統語解釈の並びをそのまま表
示装置7に表示する構成では、入力文が長文の場合等に
各々の差異を利用者が認識しづらい等の問題が生じるの
で、別の方法で選択を促すようにしても良い。
【0031】例えば単語統語解釈の並び中の定型動詞に
注目し、例えば図7の選択画面に示すように、各々の単
語統語解釈の並びにおける定型動詞と、利用者の選択を
容易にするためにその動詞の典型訳とを表示装置7に表
示し、その何れかを利用者に選択させるようにしても良
い。なお、図7は、候補となる単語統語解釈の並びが合
計3個あり、最も確率値Pの高い単語統語解釈の並び
1)では”customize”が定型動詞として認定
され、次に確率値Pの高い単語統語解釈の並び2)で
は”file”が定型動詞として認定され、次に確率値
Pの高い単語統語解釈の並び3)では”Select”
が定型動作として認定された場合を示している。また、
各定型動詞の典型訳では、「が」格に直前の名詞をその
まま挿入している。
【0032】また、別の方法として、動詞/名詞の曖昧
性を持つ単語に着目して、訳語選択の形で品詞選択を行
わせるようにしても良い。例えば、入力文”Besid
esadd and sub, the langua
ge has manyoperators.”の解析
において、”add”,”sub”をそれぞれ動詞,品
詞として解釈した単語統語解釈の並びが4つあった場
合、例えば図8に示すような選択画面を表示装置7に表
示して、動詞/名詞の曖昧性を持つ”add”,”su
b”に対して、訳語選択の形で品詞選択を行わせ、その
結果に応じて1つの単語統語解釈の並びを選択するよう
にしても良い。
【0033】さて、前処理部3の処理結果は翻訳部5に
伝達され、翻訳部5は、図4に示した構文解析手段5
1,意味解析手段52により曖昧性を考慮して文解析の
残りの処理である構文解析,意味解析を実行すると共
に、文生成手段53により文生成処理を実行し、次いで
訳文出力手段54が、最も妥当と判断された訳文を表示
装置7に表示する。
【0034】この結果、例えば図7の選択画面におい
て、利用者が3)番を選択したとすると、この3)番に
対応する単語統語解釈の並びが前処理部3から翻訳部5
に伝達され、以降、これを基準として曖昧性を考慮して
解析が進められる結果、例えば「ファイルメニューから
セーブカスタマイズファイルを選択しなさい」という訳
が表示されることになる。
【0035】この場合、正解が最初に表示されたので利
用者は別解釈翻訳を得る必要はないが、若し、最初に表
示された訳文が適当でない場合、利用者は別解釈翻訳指
示部8を操作して別解釈翻訳の指示を出せば、翻訳部5
の訳文出力手段54によって記憶手段57から第2順位
以下の訳文が一括して表示装置7に表示されるので、利
用者は曖昧性に起因する別解釈の訳文を得ることができ
る。例えば、前記の例文の場合、前置詞”from”の
かかり先や、各単語の訳語など、翻訳部5内部で生じた
曖昧性に対する別解釈に基づいた例えば以下のような訳
文が表示されることになる。 「ファイルメニューから格納カスタマイズファイルを選
択しなさい」 「ファイルメニューからの格納カスタマイズファイルを
選択しなさい」 「ファイルメニューからのセーブカスタマイズファイル
を選択しなさい」
【0036】以上本発明の実施例について説明したが本
発明は以上の実施例にのみ限定されずその他各種の付加
変更が可能である。例えば、統語的曖昧性として、前述
の品詞や定型動詞の曖昧性以外にも、カンマで囲まれた
区間が並列なのか、挿入なのかといった記号の用法も前
処理部3で決定を試み、曖昧性が解消できない場合に利
用者に選択させることにより、解析精度を上げることが
できる。また、長文に対する適切な文切り位置なども、
前処理部3で解消できない場合に統語別解釈選択部4で
候補を示して利用者に選択してもらうようにしても良
い。これらの場合、前処理部3が持つ知識ベースの内容
もそれに応じて色々と変形される。
【0037】
【発明の効果】以上説明したように本発明の機械翻訳装
置によれば、以下のような効果を得ることができる。
【0038】形態素解析が終了した時点に限って、明ら
かに統語的曖昧性が解消できなかった場合にその解消を
利用者に求めるという限定的なインターエディット方式
を採用しているため、利用者は翻訳処理の早い段階にの
み介入すれば良く、後は翻訳結果が得られた時点で必要
に応じて別解釈翻訳を指示するだけなので、利用者に大
きな負担を強いることがない。
【0039】形態素解析の終了時点という早い段階で人
的介入によって曖昧性を正しく解消し、単語の品詞など
文解析に重要な情報を翻訳処理の早い時点で正しく決定
するため、以後の翻訳処理で利用者の介入無しに曖昧性
を考慮して文解析の残りの処理を続けても、曖昧性を考
慮した処理の組み合わせ数が減少し、切り捨てられる別
解釈も低減することから、最初に提示される翻訳結果が
正解である確率が高まる。更に、それが不正解でも別解
釈中に正解が含まれる可能性が高くなる。すなわち、翻
訳精度が向上する。
【0040】曖昧性を考慮した処理の組み合わせ数が減
少することにより、翻訳処理の高速化が可能となる。
【0041】原文の入力後に速やかに開始される形態素
解析の終了時点という早い段階で利用者に介入の機会が
与えられるため、利用者は原文入力から短時間で選択操
作を行うことができ、翻訳処理の高速化が可能になるこ
と及び利用者の負担が軽減することと相俟って、利用者
に無用なストレスを与えることが少なくなる。
【0042】前処理部がいずれの語が定型動詞かを判断
し、それが曖昧な場合に利用者に選択させることによ
り、誤った場合に従来特に回復が難しかった定型動詞の
決定を精度良く行うことができ、翻訳精度を更に向上す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】前処理部の構成例を示すブロック図である。
【図3】品詞列連接確率知識ベースの内容例の一部を示
す図である。
【図4】翻訳部の構成例を示すブロック図である。
【図5】形態素解析部の解析結果の一例を示す図であ
る。
【図6】統語別解釈選択部の選択画面の一例を示す図で
ある。
【図7】統語別解釈選択部の選択画面の別の例を示す図
である。
【図8】統語別解釈選択部の選択画面の更に別の例を示
す図である。
【符号の説明】
1…辞書 2…形態素解析部 3…前処理部 31…品詞列連接確率知識ベース 32…確率モデル推定部 4…統語別解釈選択部 5…翻訳部 51…構文解析手段 52…意味解析手段 53…文生成手段 54…訳文出力手段 55〜57…記憶手段 6…入力装置 7…表示装置 8…別解釈翻訳指示部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 原言語を目的言語に翻訳するための辞書
    を参照して、入力された原言語による文を目的言語によ
    る文に変換する機械翻訳装置において、 入力された原言語の文を形態素解析する形態素解析手段
    と、 統語的曖昧性にかかわる互いに異なる複数の統語解釈を
    表示装置に表示して選択を促す統語別解釈選択手段と、 前記形態素解析手段による解析結果を入力して自ら統語
    的曖昧性の解消を試み、統語的曖昧性を明確に解消でき
    るときは自ら統語解釈を絞り込み、それ以外のときは前
    記統語別解釈選択手段を使用して統語解釈を絞り込む前
    処理手段と、 別解釈翻訳指示手段と、 前記前処理手段で絞りまれた統語解釈に対して、以後利
    用者の介入無しに曖昧性を考慮して文解析の残りの処理
    と文生成処理とを実行して翻訳結果を前記表示装置に出
    力し、且つ、前記別解釈翻訳指示手段の指示に応答して
    曖昧性に起因した別解釈に基づく翻訳結果を前記表示装
    置に出力する翻訳手段とを備えることを特徴とする機械
    翻訳装置。
  2. 【請求項2】 前記前処理手段で絞り込む統語的曖昧性
    が品詞の曖昧性であることを特徴とする請求項1記載の
    機械翻訳装置。
  3. 【請求項3】 前記辞書として、形態素解析のための情
    報中の各単語の品詞の各々に、所定の文例集において当
    該単語がその品詞として出現する頻度を反映した相対確
    率を保持した辞書を備え、且つ、 前記前処理手段は、品詞列の連接確率を記憶した品詞列
    連接確率知識ベースと、該品詞列連接確率知識ベースの
    内容と前記辞書中の相対確率とに基づいて、前記形態素
    解析手段による解析結果に含まれる各単語の品詞の絞り
    込みを行う確率モデル推定部とを含むことを特徴とする
    請求項2記載の機械翻訳装置。
  4. 【請求項4】 前記品詞は、動詞については定型動詞,
    不定型動詞の区別を含むことを特徴とする請求項3記載
    の機械翻訳装置。
JP6170070A 1994-06-29 1994-06-29 機械翻訳装置 Pending JPH0816596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6170070A JPH0816596A (ja) 1994-06-29 1994-06-29 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6170070A JPH0816596A (ja) 1994-06-29 1994-06-29 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH0816596A true JPH0816596A (ja) 1996-01-19

Family

ID=15898085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6170070A Pending JPH0816596A (ja) 1994-06-29 1994-06-29 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH0816596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301435B2 (en) 2006-02-27 2012-10-30 Nec Corporation Removing ambiguity when analyzing a sentence with a word having multiple meanings

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6277676A (ja) * 1985-10-01 1987-04-09 Toshiba Corp 機械翻訳システム
JPH02302876A (ja) * 1989-05-18 1990-12-14 Ricoh Co Ltd 対話型言語解析装置
JPH05250405A (ja) * 1991-05-10 1993-09-28 Ricoh Co Ltd 構文解析装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6277676A (ja) * 1985-10-01 1987-04-09 Toshiba Corp 機械翻訳システム
JPH02302876A (ja) * 1989-05-18 1990-12-14 Ricoh Co Ltd 対話型言語解析装置
JPH05250405A (ja) * 1991-05-10 1993-09-28 Ricoh Co Ltd 構文解析装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301435B2 (en) 2006-02-27 2012-10-30 Nec Corporation Removing ambiguity when analyzing a sentence with a word having multiple meanings

Similar Documents

Publication Publication Date Title
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US5146406A (en) Computer method for identifying predicate-argument structures in natural language text
JPS62163173A (ja) 機械翻訳方法
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
US4953088A (en) Sentence translator with processing stage indicator
JPH05197747A (ja) 言語処理装置
JP2815714B2 (ja) 翻訳装置
EP0310049B1 (en) Document generator and correction support device
JPS6180362A (ja) 翻訳装置
JPH0816596A (ja) 機械翻訳装置
JPS61260366A (ja) 学習機能付機械翻訳システム
JPS6190269A (ja) 翻訳方式
JP2859661B2 (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPS61260367A (ja) 機械翻訳システム
JPH1031676A (ja) 対訳例文検索装置
JP2595043B2 (ja) 日本文誤り自動検定装置
JPH0350668A (ja) 文字処理装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH11282844A (ja) 文書作成方法および情報処理装置および記録媒体
JPH0836575A (ja) 統語解析装置
JPH11282837A (ja) 日本語形態素解析装置、日本語形態素解析方法および記録媒体
JPS63136266A (ja) 機械翻訳装置
JPH04130577A (ja) 自然言語処理装置
JPH0785057A (ja) 構文解析方法及び装置