JPS61115171A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPS61115171A
JPS61115171A JP59237066A JP23706684A JPS61115171A JP S61115171 A JPS61115171 A JP S61115171A JP 59237066 A JP59237066 A JP 59237066A JP 23706684 A JP23706684 A JP 23706684A JP S61115171 A JPS61115171 A JP S61115171A
Authority
JP
Japan
Prior art keywords
replacement
polite
dictionary
honorific
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59237066A
Other languages
English (en)
Inventor
Toshiyuki Funabe
舟部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59237066A priority Critical patent/JPS61115171A/ja
Publication of JPS61115171A publication Critical patent/JPS61115171A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、機械翻訳システムに関し、特に、尊敬語、丁
寧語、謙譲語を含む日本語の文章を効率良く外国語に翻
訳するのに好適な機lr!!翻訳システムに関する。
従来技術 日本語から外国語(特に英語)へ、あるいは外国語から
日本語へと文章をコンピュータで翻訳する機械翻訳シス
テムの研究開発が盛んに進められている。技術文書やマ
ニュアルのような特定の分野の文章に限定し、翻訳の途
中で人間が介入したり、出力した文章を人間がチェック
したりすることを前提とすれば、実用化が可能な段階に
きている。
ところで、日本語の文章では、日本語に特有の尊敬語、
丁寧語、謙譲語やそれに類する接辞が多く用いられる。
しかし、これらの語は、外国語に翻訳される場合、外国
語の単語自体に直接反映されることは少ない。
それにもかかわらず、従来は、尊敬語、丁寧語。
謙譲語やそれに類する接辞等を、そのまま構文解析処理
の対象としていた。これでは、構文解析のための文法辞
書、単語辞書にがなりの負担をかけることとなり、また
、メモリ容量も大きくなり。
無駄な処理を行うことになる。
目     的 本発明の目的は、上記のような従来技術の問題点を解決
し、尊敬語、丁寧語、謙譲語等を含む日本語文章を効率
良く外国語に翻訳し得る機械翻訳システムを提供するこ
とにある。
構   成 上記目的を達成するため1本発明は、m語辞書。
文法辞書、形態素解析装置等を有する機械翻訳システム
において、前記形態素解析装置により形態素解析された
日本語文に対し、尊敬語、丁寧語、yIL譲語の接辞を
検出し、該接辞を削除する接辞削除部と、尊敬語、丁寧
語、謙譲語に対応する書換え表現を登録した書換え辞書
と、該書換え辞書を用いて尊敬語、丁寧語、謙譲語を書
換える書換え部を有する語表現変換装置を設けたことに
特徴がある。
以下5本発明の構成を一実施例により詳細に説明する。
第2図は、本発明の一実施例による機械翻訳システムの
概略構成を示すブロック図である。
第2図において、1は入力装置、2は形態素解析装置、
3は単語辞書、4は語表現変換装置、5は構文解析装置
、6は文法辞書、7は意味解析装置、8は意味処理辞書
、9は変換装置、10は構文生成装置、11は形態素生
成装置、12は出力装置である。なお、構文生成装置1
0、形態素生成装置11も、それぞれ文法辞書、単語辞
書を使用するが、第2図においては省略しである。
翻訳の対象となる日本語は、入力装置llから入力され
る。入力された日本語は、形態素解析装置2にて、単語
辞書3を用いて単語単位に区切られ。
それぞれの品詞が判別されることにより形態素解析が行
われる。形態素解析された日本語は、本発明の特徴であ
る語表現変換装置4により、日本語に特有の尊敬1丁寧
、謙譲を意味する接辞が削除されたり、尊敬語、丁寧語
、謙譲語の表現が翻訳に適した表現に変換されたりする
。語表現変換装置4については、後で詳述する。
次に、構文解析装置5は1文法辞書6を用いて。
単語がどのように接続しているか、文章の構造を解析す
る。しかし、構文解析装は5による構文解析では、単語
の品詞情報だけで接続を解析するので、意味的に不自然
な解析をしてしまうことがある。例えば。
r背が高い東京の人」 という文章で、「背が高い」が「東京」に係るのか、ま
たは1人」に係るのかは品詞情報からは分からない。
「屋根が白い家の猫」 という文章と前の「背が高い東京の人」とは、表面的な
文章の構造は同じだが、係り受けの構造は異なる。つま
り、「背が高い」が「東京」に係ることはない、という
ような意味的な処理が必要になる。意味解析装=7は1
以上のような知識を登録した意味処理辞書8を用いて構
文上のあいまい性を解析する。
システムは、上記3つの解析(形態素解析、構文解析、
意味解析)を施した後、日本語中間表現として変換装置
9に出力する。日本語中間表現の形式は、解析木構造、
または格構造(動詞に注目して、それに関する各単語の
格を示したもの)のどちらでも良い。
変換装置9は、日本語中間表現をプロダクション・ルー
ル(IF−THEN形式のルールのことで、入力データ
とIF部のパターン・マツチングがとれると、T I−
I E N部のアクションを実行するルール)により、
目標言語(外国語)の中間表現に変換する。
目標言語の中間表現に対して、構文生成装[10、形態
素生成装置11がそれぞれの処理を行った後。
目標言語による翻訳文が出力装[12により出力される
。なお、各生成処理は、解析処理とは逆の処理である。
第1図は、第2図における語表現変換装置4の構成を詳
細に示すブロック図である。
第1図において、4.aは接辞削除部、4bは書換え部
、4cはプロパティ(属性)付加部、4dは書換え辞書
である。
接辞削除部4aは、形態素解析された入力文をチェック
し、尊敬、丁寧、謙請を意味する接辞を削除する。書換
え部・1bは、尊敬語、丁寧語、謙譲語の書換え表現の
示されている書換え辞書4dを用いて尊敬語、丁寧語、
謙四語を一般的な通常の表現に書換える。プロパティ付
加部4Cは、尊敬、丁寧、謙譲を意味する接辞を削除し
たとき。
または尊敬語1丁寧語、fll話語別の表現に書換えた
ときに、その語の含まれる文に尊敬、丁寧。
謙譲のプロパティを付加する。文のプロパティは、尊敬
1丁寧 i&譲を翻訳文に反映できる場合に対応するた
めのものである。
例えば、入力文を「ご活躍を確信いたします」とする。
この入力文は、形態素解析により、((((ご(接頭、
工事・・・) (活躍(す変名詞・・・) (を(助詞・・・))) ((確信(す変名詞・・・) (いたします(動詞、・・・、工り))のように解析さ
れる。なお、−を施した部分は形態素のプロパティであ
り、−を施した部分は文のプロパティである。もっとも
、形態素解析の段階では、文のプロパティは未だ付加さ
れていない。
このように形態素解析された入力文字列に対し、接辞削
除部4aは、各形態素ごとに尊敬、丁寧、謙譲を意味す
る接辞の有無をチェックする。これら接辞の有無は、プ
ロパティ値により判断する。
上記入力文字列においては、形態素「ご」が丁寧を示す
接頭辞であることがそのプロパティ値から分かる。そこ
で、接辞削除部4aは1丁寧を意味する接頭辞「ご」を
削除し、プロパティ付加部4Cに丁寧を意味する接辞を
削除した旨の信号を送る。
プロパティ付加部4cは、上記信号を受信すると1文の
プロパティに「丁寧」を付加する。
その結果、文全体は。
((((活躍(す変名詞・・・) (を(助詞・・))) ((確信(す変名詞・・・) (いたします(動詞、・・・、1夷))))(工り) のようになる。
次に、接辞削除部4aは、書換え部4bに上記文を送る
。当該文を受信した書換え部4bは、特に動詞のプロパ
ティをチェックする。その結果、形態素「いたします」
は動詞で、かつ丁寧というプロパティ値を持っているこ
とがわかる。
そこで、書換え部4bは、「いたします」で書換え辞書
4dを検索する。
第3図は、書換え辞書4dの内容の一例を示す図である
。第3図に示すように、書換え辞書4dは、「見出し」
欄、「書換え条件」欄、「書換え表現」欄、および「書
換え表現」澗に示された語に関する情報を示す「書換え
表現の情報」瀾を有する。なお、「書換え条件」欄のα
は適当な助詞であり、※印は「見出し」の欄に記載され
た尊敬。
丁寧、謙譲語である。  。
第3図に示したような書換え辞書4dの「見出し」欄を
検索した結果「いたします」を引き当てると、見出し「
いたします」に対応する「書換え条件J&Iを検索する
。「いたします」は、「書換え条件」瀾の書換え条件、
す変名詞(ここでは「確認」)十α(適当な助詞:ここ
では「を」)+※(注目している語:ここでは「いたし
ます」)に合致する。
そこで、書換え部4bは、「いたします」をその書換え
条件に対応する書換え表現「する」に書換える。
次に、書換え部4bは、動詞「いたします」を「する」
に書換えたことを旨をプロパティ付加部4cに伝える。
この文の場合は1丁寧を意味する接辞「ご」を削除した
時点で、すでに「丁寧」という文のプロパティ値が付加
されているので1文に対して新たにプロパティを付加す
ることはしない。したがって、次のような文が出力され
る。
((((活躍(す変名詞・・・) (を(助詞・・))) ((確信(す変名詞・・・) (する(動詞、・・・、))) )(工り) なお、削除された接辞が無くて文のプロパティが未だ付
加されていない場合、または、接辞の削除の段階で付加
された文のプロパティ値が、書換えた語のプロパティ値
と異なる場合は、書換えた語のプロパティ値を付加する
構文解析装置5.および意味解析装置7は、上記のよう
にして簡素化された通常の文に対してそれぞれの解析を
行えば良いので、解析の効率が向上する。
第4図は、本発明の他の実施例による書換え辞書の構成
を示す図である。
本実施例による書換え辞書は、第4図(a)に示した「
見出し」濶、「書換え条件」欄、および「ポインタ」欄
からなる書換え判定辞書4dlと、第4図(b)に示し
た「ポインタ」欄、「書換え表現」瀾、および「書換え
表現の情報」欄からなる書換え表現辞$4d2により構
成されている。
書換え判定辞書4dlと書換え表現辞書4d2とは、「
ポインタ」により接続される。このように。
書換え判定辞書4dlと書換え表現辞書4d2を別ンに
構成し1両者をポインタにより結ぶことにより、書換え
表現の重複記載を回避することができ、書換え辞書のメ
モリ容量を低減することが可能となる。
なお、上記各実施例における中間表現の変換は、プロダ
クション・ルールにより行う方法であったが、例えば、
意味マーカを使用する等、他の方法を使用することも可
能である。
また1本発明は、上記各実施例のような、元の言語(日
本語)をその中間表現に落とし、次に目標言語(外国語
)の中間言語に変換し、これから目標言語の文章を生成
するというトランスファ方式のみならず、単語の置換え
だけで翻訳したり1語順の対応表を用いて翻訳する直接
変換方式や、入力文を言語に依存しない普遍的意味表現
(ピボット言語)に変換するピボット方式にも適用する
ことが可能である。
効   果 以上説明したように1本発明の機械翻訳システムによれ
ば、尊敬語、丁寧語、謙譲語を含む日本語文章を効率良
く外国語に翻訳することが可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例による機械翻訳システムの語
表現変換装置のブロック図、第2図は第1図を適用した
機械翻訳システムの全体ブロック図、第3図、第4図は
第1図における書換え辞書のそれぞれ異なる実施例を示
す図である。 4:語表現変換装置ii、4a:接辞削除部、4b:書
換え部、4cニブロバティ付加部、4d:書換え辞$、
4d、:書換え判定辞書、4d2:書換え表現辞書。 特許出願人 株式会社り  ]   −l  曹、、。 第1図 牛

Claims (1)

    【特許請求の範囲】
  1. (1)単語辞書、文法辞書、形態素解析装置等を有する
    機械翻訳システムにおいて、前記形態素解析装置により
    形態素解析された日本語文に対し、尊敬語、丁寧語、謙
    譲語の接辞を検出し、該接辞を削除する接辞削除部と、
    尊敬語、丁寧語、謙譲語に対応する書換え表現を登録し
    た書換え辞書と、該書換え辞書を用いて尊敬語、丁寧語
    、謙譲語を書換える書換え部を有する語表現変換装置を
    設けたことを特徴とする機械翻訳システム。
JP59237066A 1984-11-10 1984-11-10 機械翻訳システム Pending JPS61115171A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59237066A JPS61115171A (ja) 1984-11-10 1984-11-10 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59237066A JPS61115171A (ja) 1984-11-10 1984-11-10 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPS61115171A true JPS61115171A (ja) 1986-06-02

Family

ID=17009911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59237066A Pending JPS61115171A (ja) 1984-11-10 1984-11-10 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPS61115171A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6318457A (ja) * 1986-07-10 1988-01-26 Nec Corp 感情情報抽出装置
JPS6385973A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 自然言語自動翻訳方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6318457A (ja) * 1986-07-10 1988-01-26 Nec Corp 感情情報抽出装置
JPH0682376B2 (ja) * 1986-07-10 1994-10-19 日本電気株式会社 感情情報抽出装置
JPS6385973A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 自然言語自動翻訳方式

Similar Documents

Publication Publication Date Title
JPH07295986A (ja) イディオム処理機能を持つ機械翻訳装置
JPH0261763A (ja) 機械翻訳装置
JPS58192173A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
JPS61115171A (ja) 機械翻訳システム
JPH03260766A (ja) 括弧生成判定機能付翻訳装置
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JP3236027B2 (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH064573A (ja) 機械翻訳装置
JPH0320866A (ja) テキストベース検索方式
JPH05189492A (ja) 検索式自動生成装置
JP2877608B2 (ja) 自然言語自動翻訳装置
JPH09160920A (ja) 機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JP2004199519A (ja) 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム
JPH0236472A (ja) 日英機械翻訳方法
JP2004086919A (ja) 機械翻訳システム
JPH05225232A (ja) テキスト自動前編集装置
JPH0816910B2 (ja) 言語解析装置
JPH02208775A (ja) 機械翻訳方式
JPH0256066A (ja) 訳語複合名詞化処理方式
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体