JPH03129468A - 英日機械翻訳装置 - Google Patents

英日機械翻訳装置

Info

Publication number
JPH03129468A
JPH03129468A JP2028744A JP2874490A JPH03129468A JP H03129468 A JPH03129468 A JP H03129468A JP 2028744 A JP2028744 A JP 2028744A JP 2874490 A JP2874490 A JP 2874490A JP H03129468 A JPH03129468 A JP H03129468A
Authority
JP
Japan
Prior art keywords
dictionary
word
english
spelling
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2028744A
Other languages
English (en)
Inventor
Yoshitane Nishimura
西村 美苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH03129468A publication Critical patent/JPH03129468A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、英日機械翻訳装置に関する。
従来の技術 従来、英文を日本文に翻訳する機械翻訳システムとして
は、例えば、特開昭62−290965号公報に開示さ
れているものがある。これは、日本語の片仮名表記のゆ
れを統一する日本語校正支援手段の一種である。複数の
表記のある英語の語の辞書検索を可能にし、また、翻訳
対象文の全体を米語式、英語式と区別することにより妥
当な訳語の選択ができるような手段は提供されていなか
った。
発明が解決しようとする課題 一般に、英語の単語には、米語(アメリカ)式と、英語
(イギリス)式などの別により2種類のものが存在し、
これらの種別により同一単語でありながら複数の異なる
綴りをもつものが数多く存在している。従来の翻訳装置
では、翻訳しようとする英文中の語を辞書引きする時に
、その綴りが翻訳装置中の辞書に登録されていない場合
、辞書引きができず、翻訳結果の質を低下させていた。
課題を解決するための手段 そこで、このような問題点を解決するために、本発明は
、入力英文の辞書引きや特別な語の並びを句にまとめる
形態素解析手段を設け、この形態素解析手段により解析
された内容をもとに文構造を決定していく構文解析手段
を設け、この構文解析手段により決定された文構造をも
とに1th詞ノードを親とする木構造が作られる木構造
作成部を備えた英語構造同定手段を設け、前記木構造作
成部により作成された木構造を安易な日本語の言い回し
の中間構造に変換する木構造変換手段を設け、この木構
造変換手段により変換された前記中間構造を分節単位で
日本語を生成する構文生成手段を設け、辞書引き対象語
の綴りを辞書中の綴りに書替える辞書引き検索部と単語
の綴りを判別し適当な訳語を選択する訳語選択部とを備
えた形態素生成手段を設けた。
作用 従って、形態素生成手段の辞書引き検索部により2種類
以上の綴りをもつ同一語について辞書引きをしようとす
る際に辞書登録されていない綴りによる辞書検索が可能
となり、辞書引き実行時に辞書引き対象語の綴りが米語
式か英語式かであるかの区別をして正確な訳語の選択を
行うことができる。
実施例 本発明の一実施例を図面に基づいて説明する。
第1図は英日機械翻訳システムの処理の概要を示したも
のであり、英文解析装置の翻訳処理部1の周囲には辞書
2、文法規則3、屈折語形ファイル4、情報ファイル5
、解析ファイル6等の情報交換用の機器が設けられてい
る。また、第2図は、英文解析装置の主要部をなす翻訳
処理部1の他に、入力部7、出力IJ8、制御部9、表
示部10を含めた全体構成を示したものである。
前記翻訳処理部1は、形態素解析手段としての形態素解
析部11と、構文解析手段としての構文解析部12と、
図示しない木構造作成部を備えた英語構造同定手段とし
ての英語構造同定部13と、木構造変換手段としての木
構造変換部14と、構文生成手段としての構文生成部1
5と、図示しない辞書引き検索部と訳語選択部とを備え
た形態素生成手段としての形態素生成部16とより構成
されている。
以下、各部の構成を順次説明していく。
入力テキストにより英文解析装置に入力された英文は、
まず、形態素解析部11に送られる。そして、ここでは
、辞書引きや、特別の語の並びを句にまとめる(例えば
、  ’ Mr、 5IIIith ’ )などの処理
が行われる。
構文解析部12では、入力英文の構造が解析される。こ
こでは、文末から読取り始めて右から左に、辞書記述内
容と文法ルールを適用することにより文構造を決定して
いく。例えば、前置詞十冠詞十名詞が前置詞句と解析さ
れる。
英語構造同定部13では、木構造作成部により動詞ノー
ドを親とする木構造が作られ、係り受は関係等が明らか
にされる。
木構造変換部14では、木構造作成部により作成された
木構造を安易な日本語の言い回しの中間構造に変換する
構文生成部15では、木構造変換部により変換された中
間構造を分節単位で日本語を生成する。
形態素生成部16では、助詞の並びを決定したり、用語
の活用形を整えたりする。
ここで、形態素解析部1■の辞書引き検索部及び訳語選
択部の働きを以下類を追って説明する。
まず、辞書引き検索部の働きを第3図のフローチャート
に基づいて述べる。今、形態素解析部11中の辞書引き
において、翻訳対象文中の語の綴りが辞書に登録されて
いないものとし、この場合、別の綴りに書替え、この書
替えられた纏りで辞書引きを行うものとする。
スペースやピリオドなどの区切り文字を目印にして翻訳
対象文中の一語一語を切り出し、この切り出した語の先
頭から一字ずつ取って翻訳装置中の辞書の見出しと比較
する(ア、イ)。そして、検索中の語と完全に一致する
文字列が辞書中に登録されているか否かを判断しくつ)
、登録されていればその語に記述しである情報を取り出
して記憶部に記憶し、次の処理でこれを用いる(1)。
もし、一致する語がない場合、その語が綴りの書替えを
行うべき文字、又は、文字列を含むかどうかを異表記テ
ーブルを参照して調べる(オ)。綴りの書替えを行うべ
き文字、又は、文字列を含んでいたら、同テーブルから
その綴りの異表記を採用してもとの綴りと書替えを行い
(力、キ)、その書替えた綴りにより再度辞書検索を行
う(イ)。そして、その検索結果、一致する文字列があ
ればその情報をとり、次の処理で用いるために記憶部に
記憶する(1)。また、検索の結果、一致する語がなけ
れば、その語を未知語であると認定し、その語を記憶部
に保持し、次の語の辞書引きに進む(り)。また、辞書
引き実行時に、辞書引き対象語の綴りが米語式又は英語
式であるという情報が辞書記述又は異表記テーブルにあ
ればその情報を保存し1文体情報として日本語生成部に
送る。従って、このようにして異表記テーブル参照によ
り、辞書登録されていない綴りによる辞書検索を行うこ
とができる。
次に、訳語選択部の働きをを第4図のフローチャートに
基づいて述べる。構文生成部15は、訳語の選択時に、
文体情報の有無を調べる(ケ、コ)。
英語式という文体情報があれば(す)、翻訳対象語が英
語として使われた場合の訳語が記述されているかどうか
辞書を調べる(シ2ス)。記述されていたらその訳語を
とり(セ)、記述されていなければ他の条件に従って最
適な訳語をとる(ソ)。
また、文体情報が米語の場合も同様にして、米語式の訳
語の有無を調べ(夕、チ、ツ)、米語式であればそれを
訳語としくテ)、そうでなげければ他の条件に従って最
適の訳語をとる(ソ)。従って、このようにして語の綴
りを米語式と英語式とに区別することにより、文全体が
米語式であるか英語式であるかを区別して妥当な訳語を
得ることができる。
次に、具体例を上げて説明する。まず、第一の具体例と
して、今、英文を、 The show was cancelled an
d the accident。
which happened at a footb
all field、 wasaired。
とする。なお、文中の’cancelled ’は英語
式である。
ここでは、辞書中にcanceled ’ (米語式)
は登録されているが、’cancelled ’ (英
語式)は登録されておらず、翻訳対象例文中にはアメリ
カ英語とイギリス英語で訳語が異なる語’footba
ll ’  が含まれている場合の処理について考える
まず、スペースやピリオドを区切りとして一語一語を切
り出す。切り出した語の文字を先頭から一字ずつ取って
屈折語形ファイル中の見出しリストと比較する。辞書記
述例1 (第7図参照)で示すような情報が検索の結果
各語について得られ記憶部に保持される。
cancelled ’  の検索をすると(イ)一致
する見出し語がないので(第6図参照)、異表記テーブ
ル(第5図参照)を参照し、テーブル中の文字列のいず
れかがcancelled ’  に含まれるかごうか
を調べる(オ)。テーブル中にあるelle ’がca
ncelled ’  中に含まれるので、テーブルか
らelle ’に対応するele ′を取り、’can
celled ’をcanceled ′  に書替え
る。そして、テーブル中のelle ’には英語式とい
う情報があるのでこれを生成部で用いるために記憶部に
保持する。
そして、’canceled ’  で再び辞書検索を
行う(イ)。”canceled ’  と辞書中の文
字列が一致するのでその記述内容(辞書記述例2.第8
図参照)を取って保持する。 ’canceled ’
  の文体情報(米語式)は破棄し、次の語であるwa
s ’  の辞書検索に進む。すべての語の辞書検索が
終ったら構文解析部に進み文の構造を解析するahいて
、英語構造同定部で係受は関係を示す木構造が生成され
る。
訳語選択時には、形態素解析部11より送られてきた文
体情報を参照してそれに合致した訳語をとる。この文例
には、異表記テーブルからcancelled ’が英
語式であるという情報が送られてきているので、辞書情
報の中に文体情報の記述されている語 ’football’  (辞書記述例1、第7図参照
)については英語式の訳語「サッカー」を選択する。そ
の後、形態素生成部16を経て用言の活用形などが整え
られ最終的に次のような訳文が得られる。
訳ニジヨーがキャンセルされた、そして、サッカー競技
場で起った事故が放送された。
次に、第二の具体例について述べる。今、英文を、 The show was canceled and
 the accfdent。
which happened at a footb
all field、 wasa i red 。
とする。
ここでは、翻訳対象文中に辞書登録されているcanc
eled’  (米語式綴り)という語と、アメリカ英
語とイギリス英語で訳語が異なる語’ footbal
l ’が含まれている場合の処理について考える。
まず、第一の具体例と同様に、スペースやピリオドを区
切りとして一語一語を切り出し辞書引きを行う。
canceled ’の検索をすると(イ)、この纏り
が米語式であるという情報が見出し語リスト中にあるの
で(第゛6図参照)、これを生成部で用いるために記憶
部に保持する。
訳語選択時に、形態素解析部11より送られてきた米語
式という文体情報を参照してそれに合致した訳語をとる
。辞書情報の中の文体情報の記述されている語’foo
tball’  (第7図参照)について米語式の訳語
「アメリカンフットボールJを選択する。
形態素生成部16を経て、用言の活用形などが整えられ
、最終的に次のような訳文が得られる。
訳ニジヨーがキャンセルされた、そして、アメリカンフ
ットボール競技場で起った事故が放送された。
従って、このようにして語の綴りを米語式と英語式とに
区別することにより、文全体が米語式であるか英語式で
あるかを区別して妥当な訳語を得ることができるわけで
ある。
発明の効果 本発明は、形態素解析部の辞書引き検索部により2種類
以上の綴りをもつ同一語について辞書引きをしようとす
る際に辞書登録されていない綴りによる辞書検索が可能
となり、辞書引き実行時に辞書引き対象語の綴りが米語
式か英語式かであるかの区別をすることにより、文全体
が米語式であるか英語式であるかを区別して妥当な訳語
を得ることができるため、これにより正確な訳語の選択
を行うことができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例である英日機械翻訳システム
の処理を様子を示すブロック図、第2図は英日機械翻訳
装置の全体構成の概略を示すブロック図、第3図は異表
記語の辞書検索方式の流れを示すフローチャート、第4
図は訳語選択処理の流れを示すフローチャート、第5図
は異表記テーブルを示す説明図、第6図は辞書見出しリ
ストを示す説明図、第7図及び第8図は辞書記述例を示
す説明図である。 11・・・形態素解析手段、12・・・構文解析手段、
13・・・英語構造同定手段、14・・・木構造変換手
段、15・・・構文生成手段、16・・・形態素解析手
段出 願 人    株式会社 リ コ 、、1%」 図 二も 毘 図 U図 1 8遍

Claims (1)

    【特許請求の範囲】
  1. 入力英文の辞書引きや特別な語の並びを句にまとめる形
    態素解析手段と、この形態素解析手段により解析された
    内容をもとに文構造を決定していく構文解析手段と、こ
    の構文解析手段により決定された文構造をもとに動詞ノ
    ードを親とする木構造が作られる木構造作成部を備えた
    英語構造同定手段と、前記木構造作成部により作成され
    た木構造を安易な日本語の言い回しの中間構造に変換す
    る木構造変換手段と、この木構造変換手段により変換さ
    れた前記中間構造を分節単位で日本語を生成する構文生
    成手段と、辞書引き対象語の綴りを辞書中の綴りに書替
    える辞書引き検索部と単語の綴りを判別し適当な訳語を
    選択する訳語選択部とを備えた形態素生成手段とよりな
    ることを特徴とする英日機械翻訳装置。
JP2028744A 1989-07-28 1990-02-08 英日機械翻訳装置 Pending JPH03129468A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP19574489 1989-07-28
JP1-195744 1989-07-28

Publications (1)

Publication Number Publication Date
JPH03129468A true JPH03129468A (ja) 1991-06-03

Family

ID=16346247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2028744A Pending JPH03129468A (ja) 1989-07-28 1990-02-08 英日機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH03129468A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008870A1 (ja) * 2004-07-21 2006-01-26 Seiko Instruments Inc. 電子辞書

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008870A1 (ja) * 2004-07-21 2006-01-26 Seiko Instruments Inc. 電子辞書

Similar Documents

Publication Publication Date Title
US5644774A (en) Machine translation system having idiom processing function
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
JP2892548B2 (ja) 自動翻訳装置
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JP2001195404A (ja) 句翻訳方法およびシステム
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JP2000315216A (ja) 自然言語検索方法および装置
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP2815714B2 (ja) 翻訳装置
JPH0261763A (ja) 機械翻訳装置
JPH03222065A (ja) 機械翻訳装置
JPH03129468A (ja) 英日機械翻訳装置
KR100374114B1 (ko) 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기
JP2004318344A (ja) 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム
JPH0561902A (ja) 機械翻訳システム
JP2719453B2 (ja) 機械翻訳装置
JP2875100B2 (ja) 翻訳装置
JPS62203266A (ja) 機械翻訳システム
Wouda Similarity between Index Expressions
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JPH05225232A (ja) テキスト自動前編集装置
JPH0320866A (ja) テキストベース検索方式
JPH11282839A (ja) 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05189492A (ja) 検索式自動生成装置
JP2752025B2 (ja) 機械翻訳装置