JPH01213750A - 機械翻訳用の構文解析におけるサルベージ方法 - Google Patents

機械翻訳用の構文解析におけるサルベージ方法

Info

Publication number
JPH01213750A
JPH01213750A JP63039239A JP3923988A JPH01213750A JP H01213750 A JPH01213750 A JP H01213750A JP 63039239 A JP63039239 A JP 63039239A JP 3923988 A JP3923988 A JP 3923988A JP H01213750 A JPH01213750 A JP H01213750A
Authority
JP
Japan
Prior art keywords
analysis
parts
original text
sentence
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63039239A
Other languages
English (en)
Inventor
Minoru Sakai
稔 境井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63039239A priority Critical patent/JPH01213750A/ja
Publication of JPH01213750A publication Critical patent/JPH01213750A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、英日機械翻訳システム等の機械翻訳用の構文
解析におけるサルベージ方法に関する。
従来技術 従来、例えば機械翻訳システムにおいては、構文トラン
スファ方式等を用いて翻訳を行なうようにしている。即
ち、最初に原文の各単語の形態素を調べ、そのとり得る
品詞を調べる。そして、文法規則に従い、これを例えば
名詞から名詞句へ、そして動詞句を合せて文へとまとめ
上げる手法をとる。つまり、原文の構文解析を行なって
から、翻訳処理を実行するものである。この際、必ずし
も原文の構文解析に成功するとは限らず、現状では失敗
することも多い。
ここに、従来にあっては、構文解析に失敗した場合、何
も解を出力しないものが多く、使い勝手の悪いものとな
っている。
この点、解析失敗時には前方から解析成功部分を拾い出
しを行なうようにしたものもあるが、その解析自体は原
文の文末側から前方に向けて行なうものであり、解析失
敗時のサルベージ方式としては、解析との整合性の点で
問題ある方式である。
目的 本発明は、このような点に鑑みなされたもので、構文解
析失敗時であってもそれらしき解を得て使い勝手を向上
させ得る機械翻訳用の構文解析におけるサルベージ方法
を提供することを目的とする。
構成 本発明は、上記目的を達成するため、原文全体の構文解
析に失敗した時、前記原文中の解析成功部分を抽出し、
これらの解析成功部分をつなぎ合せて前記原文全体を覆
う仮の解を作成することを特徴とする。
以下、本発明の第一の実施例を第1図ないし第3図に基
づいて説明する。まず、第2図により例えば英日機械翻
訳システムの概略構成及び概略処理を説明する。これは
、意味情報を用いた構文トランスファ方式による例であ
る。即ち、原文である英文の解析を行ない、英語の中間
構造を作り、それを日本語の言い回しが表現できる中間
構造に変換して、日本語を生成する方式である。
最初に形態素解析部により入力された原文についての形
態素の解析を行なう。この基本は単語単位の解析である
。即ち、単語間の空白、ハイフン、カンマ、ピリオド等
の特殊文字、大文字・小文字の違いを用いて、単語の同
定を行なうと同時に、文や特殊な節の推定を行なう。単
語の同定は単語辞書から作成された屈折語形ファイル中
の語形と入力文中の単語との照合により行なう。また、
数字や数表現の解釈、固有名詞等を用いた局所的な解析
も、単語辞書から作成された情報ファイル4を用いて行
なわれる。
次に、構文解析部により構文解析が行なわれる。
ここでは、文の構造を知るために統語論的解析を文法規
則から作成された解析ルールを参照して行なう。即ち、
どの単語とどの単語で句をなし、どの句がどの句又は単
語を修飾しているか等を知るために文法規則を順次適用
し、全ての可能な解釈が取出される。もつとも、この処
理だけでは意味的におかしな解析を排除できない。この
ような統語論的解析結果から、英文構造同定部で、意味
的な素性を用いて意味的におかしな解析を排除しながら
英語の中間構造を生成する。この際、単語辞書により作
成された情報ファイル及び文法規則から作成された解析
ルールが用いられる。この構造には、述部動詞をトップ
ノードにして主語や目的語などがどのような係り関係で
成り立っているかを表現する格依存構造を用いている。
この後、情報ファイル及び文法規則を用いて、構造変換
部により、英語の言い回しに基づいた中間構造から、日
本語の言い回しを表しやすい中間構造に変換する。そし
て、情報ファイルや文法規則を用い、構文生成部及び形
態素生成部により日本語を生成する。即ち、日本語の中
間構造から自然な日本語の文を生成するが、この際、ま
ず、文節単位で自然な並び順となるように構文生成した
後、形態素生成として、助詞や助動詞の並び順を整え用
言や助動詞の活用形を決定する。
しかして、本実施例の特徴とするサルベージ方法は構文
解析部の処理に関するものである。即ち、一般にはこの
構文解析においては、解析に成功したもののみを後続の
構造変換部等に送るものであるが、本実施例では構文解
析に失敗した場合であっても、一応のそれらしい仮の解
を生成して出力させるものである。
いま、原文について第3図に示すような解析結果が得ら
れた場合を考える。第3図において、■〜0は原文を構
成する各単語を示し、■〜0−+ま原文について各々文
法規則を適用できた解析成功部分(これをパーツと呼ぶ
)を示す。つまり、原文全体での解析には失敗した場合
である。
このような場合のサルベージは、第1図に示すフローチ
ャートに従い処理される。このサルベージのサブルーチ
ンは、開始語位置0、終了語位置6として呼出される。
まず、既に調べ上げられている■〜0なる解析成功パー
ツの中から、最長、即ち語数の最大のパーツを探す。本
例では、パーツQが該当し、このパーツが選択される。
次に、開始語位置をO1終了語位置を1として、再帰的
にサルベージを呼出す。これにより、パーツ0より文頭
側に残る部分において最長のパーツとして■が選択され
る。その後、パーツ0を出力し、開始語位置6、終了語
位置6として再帰的にサルベージを呼出す。これにより
、パーツ0より文末側に残る部分において最長のパーツ
として■が選択される。このように選択されたパーツ■
0■をつなぎ合せることにより、原文全体を覆うパーツ
列が得られる。本実施例では、このようなパーツ列を原
文全体についての構文解析に関する仮の解として出力さ
せるものである。このような仮の解は、解析成功パーツ
中の最長パーツを中心としてつなぎ合せて生成してなり
、それらしい解であり、解析失敗のまま放置するよりも
有効なるデータとして翻訳に活用されることになる。
つづいて、本発明の第二の実施例を第4図により説明す
る。本実施例は、原文の文末側からサルベージを行なう
例である。即ち、前記実施例では、原文中で最も長い解
析成功パーツを取出した後、その両側に残る部分につい
ても同様に最長の解析成功パーツを取出す処理を繰返す
ものであるが、本実施例では、原文において文末に至る
解析成功パーツ■[相]@中から最長のもの@を取出し
、このパーツ@より文頭側に残る部分についても同様の
処理を繰返すものである。第3図の場合であれば、次に
パーツ■■中からパーツ■が取出され、最後にパーツ■
が取出される。そして、これらのパーツを文頭側からつ
なぎ合せてなる■■@なるパーツ列が、仮の解として出
力される。
また、特に図示しないが、第4図の場合とは逆に、文頭
側から同様の処理を行なうようにしてもよい。即ち、原
文の文頭から始まる解析成功パーツ中から最長のパーツ
を取出し、次に、そのパーツよりも文末側に残る部分に
ついても同様の処理を繰返すものである。第3図の例に
よれば、まず、文頭から始まる解析成功パーツ■■中か
ら最長のパーツ■が選択される。次に、パーツ■より文
末側先頭から始まる解析成功パーツ■Q中から最長のパ
ーツ[株]が選択される。最後にパーツ■が選択される
。これにより、■@■なるパーツ列による仮の解が出力
される。
効果 本発明は、上述したように解析成功部分をつなぎ合せて
原文全体を覆う仮の解を生成するようにしたので、本来
の原文解析によれば原文全体の解析に失敗した場合でも
、それらしい解が出力されることとなり、解析処理を全
く無にすることなく、後の翻訳処理において活用するこ
とができる。
【図面の簡単な説明】
第1図は本発明の第一の実施例を示すフローチャート、
第2図は構文トランスファ方式を示す流れ図、第3図は
原文解析結果を示す説明図、第4図は本発明の第二の実
施例を示す文末側からのサルベージ方式を示すフローチ
ャートである。 出 願 人   株式会社   リ コ −−鳥、3し 、%Uし

Claims (1)

    【特許請求の範囲】
  1. 原文全体の構文解析に失敗した時、前記原文中の解析成
    功部分を抽出し、これらの解析成功部分をつなぎ合せて
    前記原文全体を覆う仮の解を作成することを特徴とする
    機械翻訳用の構文解析におけるサルベージ方法。
JP63039239A 1988-02-22 1988-02-22 機械翻訳用の構文解析におけるサルベージ方法 Pending JPH01213750A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63039239A JPH01213750A (ja) 1988-02-22 1988-02-22 機械翻訳用の構文解析におけるサルベージ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63039239A JPH01213750A (ja) 1988-02-22 1988-02-22 機械翻訳用の構文解析におけるサルベージ方法

Publications (1)

Publication Number Publication Date
JPH01213750A true JPH01213750A (ja) 1989-08-28

Family

ID=12547581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63039239A Pending JPH01213750A (ja) 1988-02-22 1988-02-22 機械翻訳用の構文解析におけるサルベージ方法

Country Status (1)

Country Link
JP (1) JPH01213750A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013011993A (ja) * 2011-06-28 2013-01-17 Toshiba Corp 機械翻訳装置、方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013011993A (ja) * 2011-06-28 2013-01-17 Toshiba Corp 機械翻訳装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
JP3971373B2 (ja) ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置
Vasiu et al. Enhancing tokenization by embedding romanian language specific morphology
WO1997048058A9 (en) Automated translation of annotated text
WO1997048058A1 (en) Automated translation of annotated text
JPH01213750A (ja) 機械翻訳用の構文解析におけるサルベージ方法
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Dione Finite-state tokenization for a deep Wolof LFG grammar
Uchida Atlas
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3892227B2 (ja) 機械翻訳システム
JP2719453B2 (ja) 機械翻訳装置
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Tanev et al. LINGUA: a robust architecture for text processing and anaphora resolution in Bulgarian
JPH1063664A (ja) 自然言語の翻訳方法及び装置
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2004086919A (ja) 機械翻訳システム
KR20120105063A (ko) 문장 자질 정보에 기반한 생략 성분 복원 방법 및 이를 위한 장치
Ting et al. Using a dependency structure parser without any grammar formalism to analyse a software manual corpus
JPH0816910B2 (ja) 言語解析装置
JPH0348366A (ja) 形態素解析、構文解析及び形態素生成方式
Sadigh et al. A rule-based approach to farsi language text-to-phoneme conversion.
Stamatatos et al. 5HOHYDQW: RUN
JPH04262459A (ja) 機械翻訳装置