JP2901977B2 - 翻訳装置 - Google Patents

翻訳装置

Info

Publication number
JP2901977B2
JP2901977B2 JP63141315A JP14131588A JP2901977B2 JP 2901977 B2 JP2901977 B2 JP 2901977B2 JP 63141315 A JP63141315 A JP 63141315A JP 14131588 A JP14131588 A JP 14131588A JP 2901977 B2 JP2901977 B2 JP 2901977B2
Authority
JP
Japan
Prior art keywords
grammar
sentence
translation
analysis
style
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63141315A
Other languages
English (en)
Other versions
JPH01310469A (ja
Inventor
佐敏 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63141315A priority Critical patent/JP2901977B2/ja
Publication of JPH01310469A publication Critical patent/JPH01310469A/ja
Application granted granted Critical
Publication of JP2901977B2 publication Critical patent/JP2901977B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は、英語−日本語翻訳機等の翻訳装置に関す
る。
従来技術 近年、この種の言語処理装置等の開発・研究が盛んで
あり、例えば「『翻訳コンピユータ』(情報革命と語学
の壁に挑む)」(ブルーバツクスB−144、著者 坂井
利之、発行所 株式会社講談社、発行日 昭和44年9月
20日)に示されるものがある。また、本出願の発明の発
明者提案による「『使い易いプリポストエデイタを装備
したリコー英日機械翻訳システム』(リコーテクニカル
レポートNo.6、1987年1月発行)」に示される翻訳装置
もある。この他、種々のものがある。
ここに、その概要を考えると、原文の構文解析のため
の文法及び単語の品詞単位にウエイト値(重み)を付
し、統語論的に成立し得る構文構造全ての構造のウエイ
ト値を算出し、その値の大小でもっともらしい構造を選
び、訳文の生成を行なうようにしている。
しかし、原文の文体は1つに限られず、種々である。
例えば、新聞、雑誌等で用いられ得るニユース文の文体
や、論文やマニユアル文で用いられる説明文の文体や、
抄録文の文体等では、構文構造の使われ方に片寄りがあ
る。よつて、従来のように構文解析文法にウエイト付け
をしたとしても、種々の文体に対しては対処できず、あ
らゆる原文に対してはカバーできず、翻訳率を向上させ
ることができない。
目的 本発明は、このような点に鑑みなされたもので、文体
等が変わつても効率よく翻訳処理できる翻訳装置を得る
ことを目的とする。
構成 本発明は、原文を入力する入力手段と、原文を解析す
る解析手段と、解析結果に基づき訳文を生成する生成手
段と、訳文を出力する出力手段とを備えた翻訳装置にお
いて、前記解析手段は適用される解析文法の重要度に応
じた係数を対応づけして文法規則を記述した文法規則テ
ーブルを記憶する記憶手段を備え、原文全体に矛盾なく
適用可能な該文法規則の組み合せと、それぞれの文法規
則に対応する該係数を用いて演算した結果から、尤もら
しい文法規則の組み合せを選択する選択手段を設け、前
記文法規則テーブルは入力する原文の文体の特長により
解析文法の重要度に応じた係数群を区別するようにした
ことを特徴とする。
以下、本発明の一実施例を図面に基づいて説明する。
まず、第2図は本実施例の翻訳システムの概略構成を示
すものであり、バスライン1を通して互いに共通接続さ
れたキーボード2、CRT3、フロツピーデイスクドライブ
FDD4、CPU5、メインメモリ6、翻訳モジユール7、更に
は第3図に示すようなOCR8、プリンタ9等が設けられて
いる。
次に、前記翻訳モジユール7内の構成を第3図により
説明する。この内容の基本は前述したリコーテクニカル
レポートNo.6中において示されているものであるが、ま
ず、キーボード2、OCR8、フロツピーデイスク10等から
入力された文書(原文)を一旦格納する入力文章フアイ
ル11が設けられている。この入力文書フアイル11内の文
書は、必要に応じて、単語サーチ誤り指摘手段12や前編
集手段13による処理にかけられ(不要であれば、スキツ
プできる)、翻訳処理部14に送られる。この翻訳処理部
14は、詳細は後述するが、翻訳用の単語辞書15、文法規
則16等を利用し、形態素解析、構文解析、文構造同定、
変換、構文生成、形態素生成という一連の翻訳処理を行
ない訳文を生成する。得られた訳文は必要に応じて、即
ち不要ならばスキツプできる後編集手段17による処理を
経て、翻訳誤りを修正した後、プリンタ9に出力され、
又は出力文書フアイル18に格納される。
ここに、翻訳に必要な解析、変換、訳文生成等におい
て用いられる単語辞書15は、原文の文体や分野別に区別
して用い得るように、基本語辞書15a、分野別辞書15b、
ユーザ辞書15cの如く複数種用意されている。
つぎに、前記翻訳処理部14による機械翻訳アルゴリズ
ムの詳細を第4図を参照して説明する。本例では、英日
翻訳、例えば「Coal has been replaced by petrolou
m.」なる英語原文を「石炭は石油に置き換えられた。」
なる日本語訳文を得る場合で示してある。また、本例は
意味情報を用いた構文変換方式の例である。即ち、英語
原文の解析を行ない、英語の中間構造を作り、それを日
本語の言い回しが表現できる中間構造に変換して、日本
語訳文を生成する方式である。
まず、原文(英文)の形態素解析が単語辞書15から作
成された屈折語形フアイル21、情報フアイル22を用いて
形態素解析実行部23により行なわれる。これは単語単位
の解析である。即ち、単語間の空白、ハイフン、カン
マ、ピリオド等の特殊文字、大文字や小文字の違いを用
いて、単語の同定を行なうと同時に文や特殊な節の推定
を行なう。単語の同定は単語辞書15から作成された屈折
語形フアイル21中の語形と、入力文中の単語を照合して
行なう。また、数字や数表現の解釈、固有名詞や複合名
詞、派生語の推定等、特殊な単語やその前後の情報を用
いた局所的な解析を行なう。文単位では例えば「Pleas
e,Let′s」のような単語や付加疑問文等といった文型
の特徴を捉える処理や、一部のイデイオムを含む局所的
な解析も行なう。
次に、文法規則16から作成した解析ルール24を用いて
構文解析実行部25により構文解析を行なう。これは、文
の構造を知るための統語論的解析である。即ち、どの単
語とどの単語で句を構成しており、どの句がどの句又は
単語を修飾しているか、また、主語がどの単語で述部は
どれか等を知るため、解析ルール24による文法規則を順
次適用し、全ての可能な解釈を取出す。ここで用いる単
語の品詞は一般の英和辞書に記載されているものより細
かく分類されているが、この処理だけでは意味的におか
しな解析を排除できない。そこで、解析のもっともらし
さの順位を付けて次に渡される。
ついで、文法規則16から作成した解析ルール26及び単
語辞書15から作成した情報フアイル27を用いて文構造同
定実行部28により英語構造の同定を行なう。即ち、統語
論的な解析結果から意味的な素性(適応分野的な概念を
含む)を用いて意味的におかしな解析を排除しながら英
語の中間構造を作り上げる。この構造には述語動詞をト
ツプノードにして主語や目的語などがどのような係り関
係で成り立つているかを表現する格依存構造を用いてい
る。解析対象の言語にあまり依存せず、意味が同じなら
似たような構造になり、機械翻訳の中間表現に都合がよ
い。
この後、変換実行部29により変換を行なう。即ち、英
語の言い回しに基づいた中間構造から、日本語の言い回
しを表しやすく中間構造に変換する。単語辞書15から作
成した情報フアイル30が用いられる。そし、構文生成実
行部31及び形態素生成実行部32により日本語を生成す
る。日本語の中間構造から自然な日本語の文を生成する
わけであるが、まず、文節単位で自然な並び順になるよ
うにする構文生成する。次に、単語辞書15から作成した
情報フアイル33を用い、形態素生成で助詞や助動詞の並
び順を整えて用言や助動詞の活用形を決定する。
しかして、このような原文解析部の詳細な構成例を第
1図に示す。まず、形態素解析に関して用いられる屈折
語形フアイル21は名詞の原形、複数形、動詞の原形、過
去形、過去分詞形、現在分詞形等、全語形と、次ステツ
プ以降で使う情報フアイルの対応位置を示すポインタと
からなる。よつて、入力文の単語とのこの屈折語形フア
イル21における語形とを参照して一致したものを取出
す。一方、情報フアイル22には一致した語形の細分類品
詞とその使われ方の確信度が示されている。この確信度
はパーミルで示されており、文体により使われ方が異な
るので、基本だけでなく、各々の文体に対応した確信度
がa,b,…,n欄に各々記入されている。基本なる確信度は
全体の確信度を意味し、文体が指定されない時に用いら
れるものである。より詳細には、第5図に示すように構
成される。
また、情報フアイル27は各単語の意味情報、及び他の
単語との共起情報等が、その使われ方についての確信度
とともに示されている。この場合の確信度もパーミルで
示されもので、情報フアイル22の場合と同様に文体に対
処するため、基本だけでなく、a,b,〜,m種の確信度が記
入されている。
さらに、構文解析に用いられる解析ルール24は、各単
語の隣接の単語間、要素間の細分類品詞、要素名のまと
めの項目(文法項目)と、その使われ方の確信度の情報
を有する。この場合も、異なる各種の文体に対応するた
め、確信度は基本だけでなく、a,b,〜,n毎に記入されて
いる。これは、情報フアイル22内の確信度の分類と対応
するものである。より詳細には、例えば第6図に示すよ
うに構成されている。また、解析ルール26は情報フアイ
ル27の意味情報、共起情報等の文構造のその位置に使わ
れる確信度が示されている。この場合の確信度の分類は
上記のものと同様である。
即ち、第1図中の各フアイル22,27や解析ルール24,26
中に示される確信度が、解析文法の重要度に応じた係数
を意味し、このような係数が、基本文体を始め、a,b,〜
で示す各動文体毎に係数群として選択自在に用意されて
いるものである。そして、原文の文体に合う確信度のも
のが使用される。係数群の選択は、文体に応じてa,b等
を指定し得るようにすればよい。これにより、文体の異
なる場合の対処が容易となり、文体に応じた解析文法よ
り処理でき、翻訳率が向上する。
ここで、例えば「He asked me where I had been.」
なる英文の解析を第1図に示したような構文解析実行部
25により解析した結果例を第7図に示す。なお、原文に
対する形態素解析結果は品詞のみ(例えば、「prm」「V
TI」等)を示す。この場合、同図(a)及び(b)に示
すように2種類の解が得られるが、確信度の合計は
(a)の方が大きいので、(b)に示した解は捨てら
れ、(a)側の解が解析結果として採用されることにな
る。
このように確信度の計算の素データを文体毎に適した
値のものを用いるようにすることにより、文体に適した
構文構造が得られ、翻訳率が向上する。
効果 本発明は、上述したように適用される解析文法の重要
度に応じた係数を原文の文体種類に応じた係数群として
持つ文法規則の解析手段に設けたので、文体の種類に応
じた適正な解析を行ない翻訳に供することができ、よつ
て、翻訳率を向上させることができる。
【図面の簡単な説明】
図面は本発明の一実施例を示すもので、第1図は原文解
析部のブロツク図、第2図は全体の概略ブロツク図、第
3図は翻訳モジユール部分を主体として示すブロツク
図、第4図は機械翻訳アルゴリズムを示す説明図、第5
図は情報フアイルの構成図、第6図は解析ルールの構成
図、第7図は解析結果を示す説明図である。 2…入力手段、8…入力手段、9…出力手段、10…入力
手段、15…単語辞書、16…文法規則、23,25,28…解析手
段、31,32…訳文生成手段

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】原文を入力する入力手段と、原文を解析す
    る解析手段と、解析結果に基づき訳文を生成する生成手
    段と、訳文を出力する出力手段とを備えた翻訳装置にお
    いて、前記解析手段は適用される解析文法の重要度に応
    じた係数を対応づけして文法規則を記述した文法規則テ
    ーブルを記憶する記憶手段を備え、原文全体に矛盾なく
    適用可能な該文法規則の組み合せと、それぞれの文法規
    則に対応する該係数を用いて演算した結果から、尤もら
    しい文法規則の組み合せを選択する選択手段を設け、前
    記文法規則テーブルは入力する原文の文体の特長により
    解析文法の重要度に応じた係数群を区別するようにした
    ことを特徴とする翻訳装置。
JP63141315A 1988-06-08 1988-06-08 翻訳装置 Expired - Fee Related JP2901977B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63141315A JP2901977B2 (ja) 1988-06-08 1988-06-08 翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63141315A JP2901977B2 (ja) 1988-06-08 1988-06-08 翻訳装置

Publications (2)

Publication Number Publication Date
JPH01310469A JPH01310469A (ja) 1989-12-14
JP2901977B2 true JP2901977B2 (ja) 1999-06-07

Family

ID=15289047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63141315A Expired - Fee Related JP2901977B2 (ja) 1988-06-08 1988-06-08 翻訳装置

Country Status (1)

Country Link
JP (1) JP2901977B2 (ja)

Also Published As

Publication number Publication date
JPH01310469A (ja) 1989-12-14

Similar Documents

Publication Publication Date Title
US6289302B1 (en) Chinese generation apparatus for machine translation to convert a dependency structure of a Chinese sentence into a Chinese sentence
Tratz et al. A fast, accurate, non-projective, semantically-enriched parser
US8185377B2 (en) Diagnostic evaluation of machine translators
JP3906356B2 (ja) 構文解析方法及び装置
US9239826B2 (en) Method and system for generating new entries in natural language dictionary
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
US20040254783A1 (en) Third language text generating algorithm by multi-lingual text inputting and device and program therefor
JPH05120324A (ja) 言語処理方式
Lenci et al. Multilingual Summarization by Integrating Linguistic Resources in the MLIS-MUSI Project.
JP2901977B2 (ja) 翻訳装置
JP3300142B2 (ja) 自然言語処理装置
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4039282B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
Muischnek et al. Parsing and beyond: Tools and resources for Estonian
JP2939348B2 (ja) 画像処理装置
JP2719453B2 (ja) 機械翻訳装置
JP3244286B2 (ja) 翻訳処理装置
Zakharov Russian corpus of the 19th century
JP3255294B2 (ja) 機械翻訳装置
JP2000148758A (ja) 対訳文対応付け方法、対訳文対応付け装置及び対訳文対応付けプログラムを記録した記録媒体
JP2001125898A (ja) 言語解析処理の方法、システム
JPH0443462A (ja) 翻訳後校正支援システム
JPH05120329A (ja) 機械翻訳装置
JPH04130577A (ja) 自然言語処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees