JP2859661B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2859661B2
JP2859661B2 JP1287200A JP28720089A JP2859661B2 JP 2859661 B2 JP2859661 B2 JP 2859661B2 JP 1287200 A JP1287200 A JP 1287200A JP 28720089 A JP28720089 A JP 28720089A JP 2859661 B2 JP2859661 B2 JP 2859661B2
Authority
JP
Japan
Prior art keywords
analysis
sentence
failure
code
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1287200A
Other languages
English (en)
Other versions
JPH03148760A (ja
Inventor
則和 伊藤
隆 加登岡
佐敏 山内
美和 白石
真澄 成田
秀夫 伊東
良徳 荒井
滋也 千田
慶久 大黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1287200A priority Critical patent/JP2859661B2/ja
Publication of JPH03148760A publication Critical patent/JPH03148760A/ja
Application granted granted Critical
Publication of JP2859661B2 publication Critical patent/JP2859661B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、英日機械翻訳システムのような機械翻訳装
置に関する。
従来の技術 一般に、この種の機械翻訳システムでは入力された原
文について、形態素解析、構文解析、変換、生成等の処
理を経て、訳文を得るようにしている。ここに、現在の
機械翻訳技術ではまだ様々な問題が残っており、例えば
必ず構文解析に成功するとは限らず、解析失敗すること
がある。このような解析失敗時の翻訳処理として特開昭
63−8864号公報に示されるように、部分解析を行い、不
完全ながら訳文を生成するようにしたものがある。この
際、構文解析に失敗した分については、解析失敗である
旨が何んらかの形でユーザに知らされる。
発明が解決しようとする課題 ところが、ユーザは、なぜその文についての解析が失
敗したか分からないままである。よって、再翻訳のため
に原文を手直ししようとしても原文のどこを直せばよい
か分からず、適切な対応ができず、不便である。場合に
よっては、手直しできず、全く翻訳できないこともあ
る。
課題を解決するための手段 第1言語の原文を入力する入力装置と、入力された情
報を表示する表示装置と、入力された情報を処理する翻
訳処理装置と、第2言語の訳文を出力する出力装置とを
備え、構文解析文法規則及び辞書を用いて翻訳処理装置
により原文の構文解析を行った後、構文的に一つのまと
まりに変換して訳文を生成するようにした機械翻訳装置
において、構文解析失敗時の中間コードや品詞分類コー
ドのコード列の状態に応じて解析失敗の原因となる原文
中の語を推定するための規則を設け、解析失敗時にその
原因として推定された原文中の語を知らせる報知手段を
設けた。
作用 原文の解析に失敗するケースを考えると、原文に省略
されている要素があったり、文法的な間違いがある場合
等に生ずる。このような場合、構文解析失敗時の中間コ
ードや品詞分類コードのコード列の状態に反映し、例え
ば構文解析結果に中間コードにならない単独の品詞分類
コードが存在するとか、全て中間コードからなる等のコ
ード列状態となる。よって、このようなコード列に応じ
た原因推定用の規則を用いることにより、解析失敗の原
因となった原文中の語を推定でき、それを報知手段にて
ユーザに知らせることにより、ユーザは適切かつ迅速に
原文の手直しを行い、再翻訳に供することができる。
実施例 本発明の一実施例を図面に基づいて説明する。本実施
例は、入力テキストを英文、出力テキストを日本文とす
る英日機械翻訳システムに適用したもので、第2図にそ
のシステム構成の概要を示す。これは、意味情報を用い
た構文変換方式を翻訳アルゴリズムとするもので、ファ
イル1入力、キーボード2入力又はOCR3入力の何れかに
よって得た原文は、スペルチェック部4によるスペルチ
ェックを受けた後、前編集部5により必要な前編集を受
けて、翻訳本体(翻訳処理装置)6による翻訳処理に供
される。スペルチェックには基本辞書、ユーザ辞書等の
辞書7が参照される。また、翻訳処理にはこの辞書7と
ともに文法規則8が用いられる。翻訳本体6により得ら
れた訳文出力は後編集部9により翻訳情報を利用して適
宜編集処理され、ファイル10に格納される。また、入力
文と出力文とはプリンタ(出力装置)11を用いて印刷可
能である。さらに、これらの処理に際して、入力文や出
力文は表示装置としてのCRT12画面に表示される。
前記翻訳本体6の処理部は大別すると、第3図に示す
ように、形態素解析部13と構文解析部14と変換部15と生
成部16とよりなる。まず、形態素解析部13で入力テキス
トの辞書引きが行われる。ついで、個々の語の情報を得
て構文解析部14では文法規則に従い構文解析(パージン
グ)を行う。この解析結果から木構造が作成される。変
換部15では原文の木構造から出力文の木構造に変形す
る。生成部16では得られた木構造をノード毎に訳出し、
訳文を生成する。
次に、本実施例の対象とする翻訳失敗時の処理につい
て説明する。ここにいう、翻訳失敗とは、構文解析部14
における原文の解析に失敗した時を指す。解析失敗と
は、構文解析文法規則(文法規則8の一部)や語の品詞
情報が欠けており、解析対象テキストの解析を行った結
果、最終的に一つの構文的なまとまり(例えば、文)に
まとめることができないことを意味する。従って、解析
失敗した時の結果は、幾つかの中間コード(ゴールであ
る最終コードに対するもので、品詞分類や、より小さい
中間コードが文法適用されて作成される。ちなみに解析
の最小単位は品詞分類である。)に分かれたまま、とい
うことになる。時には、中間コードにもならず、品詞分
類コードのまま残ることもある。何れにしても、これら
の中間コードを結んで最終ゴールに導く規則が存在しな
いということである。
しかして、本実施例ではこのような解析失敗時のコー
ド列の特徴に着目し、解析失敗の要因となった語を推定
するための規則を設けたものである。
本実施例の規則は、下記の規則1〜規則3からなり、
何れか1つのみが適用される。
規則1.構文解析結果に中間コードにならない単の品詞分
類コードがある時には、それをすべて強調表示する。
規則2.構文解析結果がすべて中間コードからなり、その
中に句読点などの記号や名詞以外の1つの語からなるも
のがある時には、それをすべて強調表示する。
規則3.構文解析結果がすべて中間コードからなり、規則
2に当てはまる中間コードがない時には、すべての中間
コードの中で一番ペナルティの高いものの末尾の2語を
強調表示する。
ここに、ペナルティとは、解析の過程でコードが持つ
重み値をいう。このペナルティが小さければ小さいほど
優先度が高い。1つの中間コードのペナルティはそのコ
ードが含んでいる語のペナルティの総和とそれまでに適
用された文法規則の総和である。語は品詞分類毎にペナ
ルティを持っており、その品詞分類の頻度情報となって
いる。同様に、文法規則も頻度情報として各々ペナルテ
ィを持っている。
このような規則も、文法規則8中の一部に設けられて
いる。これらの規則1〜規則3の内、1つが適用され
て、ある語若しくは複数の語が、解析失敗の原因として
推定された語として、CRT12画面上で強調表示される。
以下、解析失敗の具体例を挙げて説明する。
具体例1 原文 Why spend a lot of money on cars? 解析結果 XX→4:iav 29:VX 1:QU ここに、解析結果の左辺のXXは構文解析失敗した結果
にふるダミーコードである。右辺は、1つの品詞分類と
2つの中間コードからなる。コードの前の数字はペナル
ティである。iavは疑問副詞、VXは述語、QUは疑問符号
である。本具体例にあっては、構文解析結果に品詞分類
がそのまま残っており、規則1によってiavのWhyが失敗
原因の語と推定される。
即ち、 ○iav(Why) VX(spend a lot of money on cars) QU(?) なる推定結果(上の括弧内は各コードが持つ語群)によ
り、例えば、原文において のように推定された語が強調表示される。この強調表示
は報知手段、実際的にはCRT12に対する表示制御手段に
より行われる。
この場合、なぜ、解析に失敗したか考えると、それ
は、省略されている要素があるからである。即ち、Why
の後のdo youなる要素が省略されているからである。よ
って、 Why did you spend a lot of money on cars? が解析に成功する原文といえる。従って、本具体例で
は、Whyの後の要素が欠けていることを示唆する意味
で、Whyを解析失敗要因としたことになり、推定に成功
したといえる。
具体例2 原文 You is a gentleman and she is a lady. 解析結果 XX→4:NQ 1:FX 26:SE ここに、NQは助動詞のbe、SEは文である。NQ,FXが1
つの語からなる中間コードであるが、NQは名詞句である
ため、規則2によってFXのisが失敗原因と推定される。
即ち、 NQ(You) ○FX(is) SE(a gentleman and she is a lady) なる推定結果により、例えば、原文において のように推定された語が強調表示される。
この場合、なぜ、解析に失敗したか考えると、それ
は、間違っている個所があるからである。具体的には、
Youの後のisが間違いで、 You are a gentleman and she is a lady. のようにareとすべきだからである。本具体例の場合、i
sそのものを強調表示により指摘しており、失敗原因の
推定に成功しているといえる。
具体例3 原文 All you have to do is trust me and follow m
e. 解析結果 XX→87:SK 78:SE ここに、SK,SEはともに2つ以上の語からなる中間コ
ードである。ペナルティはSKが大きく、規則3によりSK
の末尾2語をとってdo isが失敗原因と推定される。
即ち、 ○SK(All you have to do is) SE(trust me and follow me.) なる推定結果により、例えば、原文において のように推定された語が強調表示される。
この場合、なぜ、解析に失敗したか考えると、それ
は、省略されている要素があるからである。よって、 All you have to do is to trust me and follow me. が解析に成功する原文といえる。従って、本具体例で
は、do isを強調表示することで、その後の欠けた要素
を示唆しており、失敗原因の推定に成功したといえる。
第1図は、上記の規則1〜規則3が各々適用される場
合の解析失敗要因推定による強調表示処理を示すフロー
チャートである。
ところで、上記規則1〜規則3に代えて、より単純に
した規則を適用するようにしてもよい。具体的には、上
記規則2を止めて2つの規則とするものである。即ち、 規則1.構文解析結果に中間コードにならない単の品詞分
類コードがある時には、それをすべて強調表示する。
規則2.構文解析結果がすべて中間コードからなる時は、
すべての中間コードの中で一番ペナルティの高いものの
末尾の2語を強調表示する。
とすればよい。この2つの規則の内、何れか1つのみを
適用する。これによれば、推定率はやや落ちるが、規則
がすっきりしてきれいになる。
発明の効果 本発明は、上述したように構文解析失敗時に得られる
構文解析結果の中間コードや品詞分類コードのコード列
の状態が、例えば構文解析結果に中間コードにならない
単独の品詞分類コードが存在するとか、全て中間コード
からなるといった特質を持つ点に着目し、構文解析失敗
時の中間コードや品詞分類コードのコード列の状態に応
じて解析失敗の原因となる原文中の語を推定するための
規則を設けて、解析失敗時にはその原因として推定され
た原文中の語を報知手段によりユーザに知らせるように
したので、解析失敗の原因となった原文中の語を推定・
報知させることができ、よって、ユーザは適切かつ迅速
に原文の手直しを行い、再翻訳に供し、より精度の高い
翻訳結果を得ることができる。
【図面の簡単な説明】
図面は本発明の一実施例を示し、第1図は解析失敗要因
推定処理を示すフローチャート、第2図は翻訳システム
のブロック図、第3図は翻訳本体のブロック図である。 1,2,3……入力装置、6……翻訳処理装置、7……辞
書、8……文法規則、11……出力装置、12……表示装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 白石 美和 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (72)発明者 成田 真澄 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (72)発明者 伊東 秀夫 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (72)発明者 荒井 良徳 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (72)発明者 千田 滋也 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (72)発明者 大黒 慶久 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (56)参考文献 特開 昭62−272357(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/27

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】第1言語の原文を入力する入力装置と、入
    力された情報を表示する表示装置と、入力された情報を
    処理する翻訳処理装置と、第2言語の訳文を出力する出
    力装置とを備え、構文解析文法規則及び辞書を用いて翻
    訳処理装置により原文の構文解析を行った後、構文的に
    一つのまとまりに変換して訳文を生成するようにした機
    械翻訳装置において、構文解析失敗時の中間コードや品
    詞分類コードのコード列の状態に応じて解析失敗の原因
    となる原文中の語を推定するための規則を設け、解析失
    敗時にその原因として推定された原文中の語を知らせる
    報知手段を設けたことを特徴とする機械翻訳装置。
JP1287200A 1989-11-02 1989-11-02 機械翻訳装置 Expired - Fee Related JP2859661B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1287200A JP2859661B2 (ja) 1989-11-02 1989-11-02 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1287200A JP2859661B2 (ja) 1989-11-02 1989-11-02 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH03148760A JPH03148760A (ja) 1991-06-25
JP2859661B2 true JP2859661B2 (ja) 1999-02-17

Family

ID=17714364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1287200A Expired - Fee Related JP2859661B2 (ja) 1989-11-02 1989-11-02 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP2859661B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08501166A (ja) * 1992-09-04 1996-02-06 キャタピラー インコーポレイテッド 総合オーサリング及び翻訳システム

Also Published As

Publication number Publication date
JPH03148760A (ja) 1991-06-25

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
JPS62163173A (ja) 機械翻訳方法
JP2004070928A (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JPS638864A (ja) 翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JP2007518164A (ja) 自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体
JP2859661B2 (ja) 機械翻訳装置
JPH0332106B2 (ja)
JPS6190269A (ja) 翻訳方式
JPH0635961A (ja) 文書要約装置
JP3113257B2 (ja) 機械翻訳装置
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JP2938897B2 (ja) 文書作成処理装置
JP2926745B2 (ja) 機械翻訳装置
JP3244286B2 (ja) 翻訳処理装置
JPH0332105B2 (ja)
JP2719453B2 (ja) 機械翻訳装置
JP4092861B2 (ja) 自然言語パターン作成装置及び方法
KR20220050496A (ko) 서술 텍스트로부터 대화 텍스트를 자동으로 만드는 장치 및 그 방법
JP3353873B2 (ja) 機械翻訳装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH03150666A (ja) 機械翻訳装置
JPH05314170A (ja) 機械翻訳装置
JP2655922B2 (ja) 機械翻訳装置
JPS6190268A (ja) 翻訳方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees