JPH05324711A - 自然言語自動翻訳システム - Google Patents

自然言語自動翻訳システム

Info

Publication number
JPH05324711A
JPH05324711A JP4132283A JP13228392A JPH05324711A JP H05324711 A JPH05324711 A JP H05324711A JP 4132283 A JP4132283 A JP 4132283A JP 13228392 A JP13228392 A JP 13228392A JP H05324711 A JPH05324711 A JP H05324711A
Authority
JP
Japan
Prior art keywords
conversion
natural language
unit
sentence
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4132283A
Other languages
English (en)
Inventor
Satoshi Shirai
諭 白井
Akio Yokoo
昭男 横尾
Kentaro Ogura
健太郎 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4132283A priority Critical patent/JPH05324711A/ja
Publication of JPH05324711A publication Critical patent/JPH05324711A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 第1自然言語の表現を第2自然言語の表現へ
柔軟に変換することが可能な自然言語自動翻訳システム
を提供する。 【構成】 変換部で用いられる変換辞書7は、複数の単
位文(格要素・副詞要素と述語から成る表現単位)をま
とまりとして記述した大域変換辞書71と、単位文の述
語と特定の名詞を主要素とする格要素とをまとまりとし
て扱う慣用変換辞書72と、単位文の述語と格要素の名
詞の意味属性との関係をまとまりとして扱うパタン変換
辞書73と、単語ごとに訳語を与える汎用変換辞書74
の4種類の変換辞書によって構成されている。変換部
は、大域変換辞書71、慣用変換辞書72、パタン変換
辞書73、汎用変換辞書74を用いて、解析結果に対し
て大域変換、慣用変換、パタン変換、汎用変換の操作を
順次行ない、第1自然言語から第2自然言語への変換を
行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、第1自然言語の文を読
み込む入力部と、その読み込まれた入力文に対して単語
分割・構文解析を行なう解析部と、解析結果に基づいて
変換辞書を用いて第1自然言語を一定のまとまりごとに
第2自然言語に変換する変換部と、変換結果に基づいて
第1自然言語の文を生成する生成部と、生成された第2
自然言語の文を出力する出力部を有する自然言語自動翻
訳システムに関する。
【0002】
【従来の技術】従来の自然言語自動翻訳方法としては、
いわゆるトランスファー方式を応用した方法が多数知ら
れている。トランスファー方式は、第1自然言語の文の
解析を行ない、その結果を基に第1自然言語の中間表現
を生成し、この中間表現を構成する単語あるいは単位文
ごとに第2自然言語の中間表現に変換(トランスファ
ー)して、この第2自然言語の中間表現に基づいて最終
的に第2自然言語の文を生成する処理ステップにより構
成されるものである。なお、これらに関しては、例え
ば、「機械翻訳システム(MUプロジェクト)」(情報
処理学会自然言語処理研究会資料(84−NL47−1
0(1985))に翻訳システムの具体例が紹介されて
いる。
【0003】
【発明が解決しようとする課題】上述したトランスファ
ー方式において、第1自然言語の入力文を解析した後に
生成される第1自然言語の中間表現は、基本的に入力文
に即した形式を持っているため、単語ごとの変換では第
1自然言語の入力文が直訳可能な表現となっていれば、
第2自然言語の出力文も比較的整ったものが得られる
が、第1自然言語の入力文がある程度以上意訳を必要と
するような表現を含んでいる場合には、得られた第2自
然言語の出力文は、そのままでは不適切な訳文になって
しまうという問題がある。
【0004】この問題に対しては、一般に、第1自然言
語と第2自然言語の両方に通じた操作者が、第2自然言
語の出力文を監視し、必要に応じて第1自然言語の入力
文を書き直し(プリエディット)、再度翻訳させるとい
うステップを適宜繰り返すことにより対処している。
【0005】また、トランスファー方式自体に例外処理
を組み込むことにより、特殊な変換を個別に実現し、上
述の問題に対処しようとする試みも多数行なわれてい
る。すなわち、変換の際に、単語対訳を基本とした変換
では問題となりそうな表現を検出し、あらかじめ用意し
た特別な変換ルールを用いて変換するというものであ
る。これには、問題が生じるたびに例外処理を追加して
いく必要があるばかりか、例外処理を起動するタイミン
グの設定も難しいという問題もある。
【0006】以上のように、従来の技術では単語単位の
変換を基本として、それでは処理しきれないものには人
手介入によるか、または特殊な変換を行なうための例外
処理を追加していくことにより対処していた。
【0007】本発明は上記事情に鑑みてなされたもの
で、従来の技術における上述の問題を解消し、第1自然
言語の表現を第2自然言語の表現へ柔軟に変換すること
が可能な自然言語自動翻訳システムを提供することにあ
る。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明の自然言語自動翻訳システムでは、変換部で
用いられる変換辞書が、第1自然言語と第2自然言語を
対応させる表現のまとまりの単位として、複数の単位文
(格要素・副詞要素と述語から成る表現単位)をまとま
りとして記述した大域変換辞書と、単位文の述語と特定
の名詞を主要素とする格要素とをまとまりとして扱う慣
用変換辞書と、単位文の述語と格要素の名詞の意味属性
との関係をまとまりとして扱うパタン変換辞書と、単語
ごとに訳語を与える汎用変換辞書の4種類の変換辞書で
構成され、変換部は、第1自然言語から第2自然言語へ
の変換を行なう際に、4種類の変換辞書を用いてまとま
りの単位が大きい順に段階的に変換操作を行なう。
【0009】
【作用】本発明は、文の表現構造に関する変換精度を上
げるため、大域変換辞書を用意し、それに合う構造を先
に取るようにしようという狙いである。トランスファー
方式にはいくつかのバリエーションがあるが、多数の機
能を実現したMUプロジェクトにおいても1つの述語を
中心としたまとまり(本発明の慣用変換、パタン変換の
レベル)にとどまり、その後も表現構造を本格的に扱う
技術の発表はない(語尾表現全体に対する対訳を登録し
ておき、それにうまく当たればすばらしい訳を出すシス
テムはたまにある)。
【0010】本発明によれば、第1自然言語と第2自然
言語との対応を、複数の単位文を見なければならないも
のから、単語ごとに対応させれば良いものまで、必要に
応じたレベルで記述することが可能であるので、個別に
例外処理を作成することなく自然言語自動翻訳システム
を実現することが可能となる。また、システムの改良に
関しては、日英翻訳の場合、日本語のパタンと英語のパ
タンを対応づけながら辞書に登録すれば済むため、例外
処理を作成する場合に比べてはるかに容易に行なえるこ
とになる。
【0011】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0012】図1は本発明の一実施例の自然言語自動翻
訳システムのブロック図である。入力部1は翻訳対象の
第1自然言語の文を読み込む。解析部2は読み込まれた
文について解析辞書6を用いて単語の分割や構文の解析
を行なう。変換部3は言語解析結果に基づいて変換辞書
7を用いて第1自然言語を第2自然言語に変換する。生
成部4は言語変換結果に基づいて生成辞書8を用いて第
2自然言語の自然な文として整える。出力部5は整えら
れた文を出力する。
【0013】図2は変換部3の処理と変換辞書7の構成
を示す図である。変換辞書7は大域変換辞書71と慣用
変換辞書72とパタン変換辞書73と汎用変換辞書74
で構成されている。大域変換辞書71は、述語の表現を
見出しとし、対象として扱う主文および複数の従文およ
びそれらの関係の項目を設け、主文または従文の日本語
の表現形式とそれに対応する英語の表現形式の関係とし
て組合わせ方を記述する。慣用表現辞書72とパタン変
換辞書73は述語の表現を見出しとして、日本語の表現
と英語の表現の対応を記述する。この両者の違いは、パ
タン変換辞書73では単語属性によって名詞を示すのに
対し、慣用表現辞書72は単語属性以外に特定の単語そ
のものを用いる点にある。汎用変換辞書74は日本語の
単語を見出しとして、それに対応する英語の訳語および
それを使用する際の条件が備考として記述されている。
変換部3は、解析結果に対して大域変換辞書71を用い
て大域変換を行ない(ステップ31)、未変換の部分が
あるかどうか判定し(ステップ32)、なければ変換結
果を生成部4に出力し、あれば、未変換の部分に対して
慣用変換辞書72を用いて慣用変換を行ない(ステップ
33)、未変換の部分があるかどうか判定し(ステップ
34)、なければ変換結果を生成部4に出力し、あれば
未変換部分に対してパタン変換辞書73を用いてパタン
変換を行ない(ステップ35)、未変換部分があるかど
うか判定し(ステップ36)、なければ変換結果を生成
部4に出力し、あれば未変換部分に対して汎用変換辞書
74を用いて汎用変換を行ない(ステップ37)、変換
結果を生成部4に出力する。
【0014】次に、第1自然言語が日本語、第2自然言
語が英語の場合について、変換部3の動作例を説明す
る。大域変換辞書71の構成例を表1に、慣用変換辞書
72の構成例を表2に、パタン変換辞書73の構成例を
表3に、汎用変換辞書74の構成例を表4にそれぞれ示
す。
【0015】
【表1】
【0016】
【表2】
【0017】
【表3】
【0018】
【表4】 入力日本文が「彼がそこへ行ったのがどうかしたか。」
の場合、解析部2により図3(1)のような解析結果が
得られ、変換部3に入力される。変換部3は図2の流れ
図に従って処理を進める。
【0019】まず、大域変換のステップ31に進み、主
文の述語「どうかする」に着目して大域変換辞書71
(表1)を検索し辞書情報を取り出し、辞書情報と解析
結果を照合し、「どうかする」が主文・従文1(必要に
応じて複数の従文に関する条件が指定されることがあ
る)・関係に記述されている日本語パタンと条件をすべ
て満たすので、主文を "what be the matter with S"
(時制=現在、疑問符付与)と訳出する。同時に、従
文1の時制を完了形にすること、Sの部分には「従文
1主語の所有格形+従文1述部の動名詞形」を代入する
ことが指定される。次に、未変換の部分が残っているか
どうかを調べる(ステップ32)。この例では、従文1
が未変換のまま残っているので、慣用変換のステップ3
3へ進む。このステップ33では、従文1の述語「行
く」に着目して慣用変換辞書72(表2)を検索する
が、辞書情報は得られないので慣用変換は行なわない。
次に、未変換の部分が残っているかどうかを調べる(ス
テップ34)。依然として、従文1が未変換のままであ
るのでパタン変換のステップ35へ進む。ステップ35
では、再び従文1の述語「行く」に着目してパタン変換
辞書73(表3)を検索し辞書情報を取り出す。「彼」
は《人》という単語属性を持ち、「そこ」は《場所》と
いう単語属性を持つので、従文1は辞書情報の日本語パ
タンを満たすことがわかる。そこで従文1を”彼(主
語)go to そこ”のような形式に変換する。次に、未変
換の部分が残っているかどうかを調べる(ステップ3
6)。「彼」と「そこ」が未処理であるので汎用変換の
ステップ37へ進む。ステップ37では汎用変換辞書7
4(表4)を検索し、主語としての「彼」と「そこ」に
対する訳語"he""there"を得る。このとき"there" には
前置詞不要であることが指定される。
【0020】以上のようにして得られた変換結果に基づ
いて、生成部4は生成辞書8を参照しながら英文を整え
る。まず、「彼」と「そこ」に対する訳語を従文1に入
れることにより"he go there" を得る。このとき汎用変
換において「そこ」に対する訳語"there" は前置詞不要
であることが指定されているので"to"は削除される。次
に、大域変換による指定を満たすように文を変形する。
の指定により従文1は"he have gone there"のように
なり、の指定により"with"と従文1の主語である"he"
の所有格形"his" と従文1の述部である"have gone the
re" の動名詞形"having gone there" が組み合わせら
れ、"with his having gone there"が生成され、これが
主文のSの部分に代入され、さらに主文の時制(現在)
に応じた動詞"be"の変形と疑問符の付与により、日本文
「彼がそこへ行ったのがどうかしたか。」に対する英
文"What is the matter with his having gone there?"
が得られる。
【0021】入力日本文が「彼がそこへ行くのは当然
だ。」の場合、解析部2により図3(2)のような解析
結果が得られ、変換部3に入力される。変換部3では、
まず主文の述語「当然だ」に着目して大域変換を行な
い"S be natural"を得るとともに従文1の時制=なし、
Sを仮主語とし末尾に「"for" +従文1主語+従文1述
部のto不定詞形」を指定する。続いて未処理である従文
1に対し、前例と同様に、慣用変換は適用されず、パタ
ン変換と汎用変換が行なわれる。生成部4では、従文1
の訳として"he go there" を得た後、主文の訳のSを仮
主語"it"に置き換え、文末には"for" と従文1の主語と
従文1の述語のto不定詞形を並べ、主文の時制(過去ま
たは未来を表す語が使われていないので現在とする)に
応じた動詞"be"の変形を行なうことにより、日本文「彼
がそこへ行くのは当然だ。」に対する英文"It is natur
al for him to go there" が得られる。
【0022】入力日本文が「彼が油を売っているのは当
然だ。」の場合、解析部2により図3(3)のような解
析結果が得られ、変換部3に入力される。変換部3で
は、まず主文に対して最初の例の場合と同様にして"Wta
t be the matter with S" (時制=現在、疑問符付与)
と訳出し、Sに相当する従文1は時制を完了形にするこ
となどが指定される。続いて未処理である従文1の述語
「売る」に対しては慣用表現辞書72を検索すると辞書
情報が得られるので慣用表現変換を開始する。「彼」は
《人》という単語属性をもち「油」という単語は辞書に
も指定されているので従文1は”彼(主語)idle away
彼's time"とする。続いて汎用変換により「彼」と「て
いる」の訳語を得て"he be idling away his time"を
得、大域変換による指定もみたすように文を変形するこ
とにより従文1は"his having been idling away his t
ime"となる。これを主文のSの部分に代入するなどして
最終的な訳文は"What is the matter with his having
been idling away his time?"が得られる。
【0023】
【発明の効果】以上説明したように、本発明は、変換辞
書を、第1自然言語と第2自然言語を対応させる表現の
まとまりの単位として、複数の単位文(格要素・副詞要
素と述語から成る表現単位)をまとまりとして記述した
大域変換辞書と、単位文の述語と特定の名詞を主要素と
する格要素とをまとまりとして扱う慣用変換辞書と、単
位文の述語と格要素の名詞の意味属性との関係をまとま
りとして扱うパタン変換辞書と、単語ごとに訳語を与え
る汎用変換辞書の4種類の変換辞書で構成し、第1自然
言語から第2自然言語への変換を行なう際に、これら4
種類の辞書を用いてまとまりの単位が大きい順に段階的
に変換操作を適用することにより、単語置き換え的な直
訳では取扱いが難しい英語の動名詞や不定詞への訳出も
可能となり、また、辞書を追加すればシステムの変換機
能を向上させることができるので、例外処理などを組み
込む必要がなく、システムの機能拡張も容易に行なうこ
とができる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の自然言語自動翻訳システム
の構成を示すブロック図である。
【図2】図1中の変換部3の処理と変換辞書7の構成を
示す図である。
【図3】日本語の解析結果の例を示す図である。
【符号の説明】
1 入力部 2 解析部 3 変換部 4 生成部 5 出力部 6 解析辞書 7 変換辞書 8 生成辞書 31〜37 ステップ 71 大域変換辞書 72 慣用変換辞書 73 パタン変換辞書 74 汎用変換辞書

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 第1自然言語の文を読み込む入力部と、
    その読み込まれた入力文に対して単語分割・構文解析を
    行なう解析部と、解析結果に基づいて変換辞書を用いて
    第1自然言語を一定のまとまりごとに第2自然言語に変
    換する変換部と、変換結果に基づいて第2自然言語の文
    を生成する生成部と、生成された第2自然言語の文を出
    力する出力部を有する自然言語自動翻訳システムにおい
    て、 前記変換部で用いられる前記変換辞書が、第1自然言語
    と第2自然言語を対応させる表現のまとまりの単位とし
    て、格要素・副詞要素と述語から成る表現単位である単
    位文の複数をまとまりとして記述した大域変換辞書と、
    単位文の述語と特定の名詞を主要素とする格要素とをま
    とまりとして扱う慣用変換辞書と、単位文の述語と格要
    素の名詞の意味属性との関係をまとまりとして扱うパタ
    ン変換辞書と、単語ごとに訳語を与える汎用変換辞書の
    4種類の変換辞書によって構成され、 前記変換部は、第1自然言語から第2自然言語への変換
    を行なう際に、上述の4種類の変換辞書を用いてまとま
    りの単位が大きい順に段階的に変換操作を行なうことを
    特徴とする自然言語自動翻訳システム。
JP4132283A 1992-05-25 1992-05-25 自然言語自動翻訳システム Pending JPH05324711A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4132283A JPH05324711A (ja) 1992-05-25 1992-05-25 自然言語自動翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4132283A JPH05324711A (ja) 1992-05-25 1992-05-25 自然言語自動翻訳システム

Publications (1)

Publication Number Publication Date
JPH05324711A true JPH05324711A (ja) 1993-12-07

Family

ID=15077665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4132283A Pending JPH05324711A (ja) 1992-05-25 1992-05-25 自然言語自動翻訳システム

Country Status (1)

Country Link
JP (1) JPH05324711A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07295992A (ja) * 1994-04-27 1995-11-10 Canon Inc 機械翻訳装置及びその方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07295992A (ja) * 1994-04-27 1995-11-10 Canon Inc 機械翻訳装置及びその方法

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
EP1349079A1 (en) Machine translation
JP3345763B2 (ja) 自然言語翻訳装置
US5608623A (en) Special cooccurrence processing method and apparatus
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
JPH05324711A (ja) 自然言語自動翻訳システム
JP2007133905A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3206816B2 (ja) 自然言語自動翻訳方法
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JPS6386071A (ja) 自然言語翻訳方式
JPH06236394A (ja) 自然言語自動翻訳装置
JP2687334B2 (ja) 機械翻訳装置
JP2935928B2 (ja) 自然言語翻訳装置
JP2877608B2 (ja) 自然言語自動翻訳装置
JPH11143876A (ja) 双方向機械翻訳装置
JP2967489B2 (ja) 機械翻訳装置
JP2901977B2 (ja) 翻訳装置
JP3132563B2 (ja) 文書作成支援装置
JPS63198162A (ja) 文章生成用文脈処理装置
JPS6180361A (ja) 翻訳表示方式
JPH02208775A (ja) 機械翻訳方式
JPH05120332A (ja) 機械翻訳装置
JPH01112368A (ja) 機械翻訳装置
JPH0481971A (ja) 機械翻訳機