JP2807586B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JP2807586B2
JP2807586B2 JP3319836A JP31983691A JP2807586B2 JP 2807586 B2 JP2807586 B2 JP 2807586B2 JP 3319836 A JP3319836 A JP 3319836A JP 31983691 A JP31983691 A JP 31983691A JP 2807586 B2 JP2807586 B2 JP 2807586B2
Authority
JP
Japan
Prior art keywords
dictionary
unit
sentence
information
original sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3319836A
Other languages
English (en)
Other versions
JPH05128145A (ja
Inventor
咲子 本間
隆 加登岡
美和 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3319836A priority Critical patent/JP2807586B2/ja
Publication of JPH05128145A publication Critical patent/JPH05128145A/ja
Application granted granted Critical
Publication of JP2807586B2 publication Critical patent/JP2807586B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、機械翻訳装置に関し、より詳細
には、優先順位の異なる複数の辞書を用いる機械翻訳装
置に関する。
【0002】
【従来技術】機械翻訳処理においては、構文的に正確で
かつ翻訳する文書の分野に即した良質な訳文を生成する
ために、通常は、各単語や連語に関する一般的で広範な
知識を格納した辞書(システム辞書)の他に、特定の分
野に即したり、ユーザが直接指定した訳語や用法を格納
した辞書(分野別辞書、ユーザ辞書)を用いる。従来、
複数辞書を検索する場合には、優先順位を設けてその順
番に従って検索し、上位の辞書にエントリがあれば下位
の辞書は検索しない。通例は、ユーザ辞書、分野別辞
書、システム辞書の優先順位で検索する。しかし、ユー
ザ辞書や分野別辞書は品詞の登録に洩れがある場合が多
く、エントリのある語が登録されている以外の品詞で用
いられている原文は、たとえ下位の辞書に正しい品詞が
登録されていても解析に失敗してしまう。
【0003】例えば、図5に示すように優先順位が最上
位のユーザ辞書で‘interrupt’という語が名詞、‘ful
l aft’という語が副詞としてそれぞれ登録されている
場合、図7(a),(c)のように原文中の品詞が登録
されているものであれば正しい翻訳結果が得られるが、
図7(b),(d)のように登録されていない品詞(そ
れぞれ動詞、形容詞)である場合は解析に失敗してしま
う。このような問題を解決する従来技術としては、例え
ば、特開昭62−203273号公報がある。これは品
詞や訳語などの辞書情報の種類に応じて異なる複数辞書
の優先度を設定し、上位辞書での品詞の登録漏れによる
解析失敗を防ぐというものである。しかし、これはある
語に対して上位辞書、下位辞書が共にエントリを持つこ
とを前提としており、ユーザが特殊な語や言い回しを登
録した場合に対応できない。
【0004】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、原文中のある語に関する上位辞書の情報を用い
て解析失敗した場合には、下位辞書の情報を検索し、上
位辞書の登録漏れによる解析失敗をできるだけ避け、更
に下位辞書にエントリがない場合はその語を未知語とし
て処理して原文のまま訳出すること、また、下位辞書を
検索する場合には、上位辞書と重複する情報は用いず、
効率の良い処理を行うこと、更に、上位辞書にエントリ
があるにもかかわらず、下位辞書の情報を用いて翻訳を
行った場合は、原文と訳文の該当部分を強調表示し、ユ
ーザに注意を促すようにした機械翻訳装置を提供するこ
とを目的としてなされたものである。
【0005】
【構成】本発明は、上記目的を達成するために、(1)
少なくとも、原文を入力するための入力部と、該入力部
により入力された原文を記憶する原文記憶部と、前記原
文の翻訳処理に用いる知識情報を格納した翻訳辞書部
と、前記知識情報を用いて前記原文記憶部に記憶された
原文を翻訳処理する翻訳部と、該翻訳部により翻訳処理
されて求められた訳文をその訳文を得た原文に対応させ
て記憶する訳文記憶部と、少なくとも前記原文又は訳文
を表示する表示部と、該表示部による表示形態を制御す
る表示制御部と、前記表示部に表示された原文および訳
文に対する編集処理を制御する編集制御部とを具備する
機械翻訳装置において、前記翻訳辞書部が優先順位の異
なる複数の辞書を有し、原文中の任意の形態素に対する
優先順位が高い辞書の情報を用いて該原文の解析に失敗
した場合は、該辞書情報を棄却して、該形態素に対する
次に優先順位の高い辞書の情報を用いて該原文を再度解
析する解析手段と、優先順位が下位の辞書に該形態素の
エントリがない場合は、該形態素を未知語として処理す
る処理手段とを有すること、更には、(2)前記原文中
の任意の形態素に対して、優先順位が下位である辞書中
の情報を用いて再度解析する際に、優先順位が上位の辞
書と重複する情報を解析に用いない手段を有すること、
更には、(3)前記原文中の任意の形態素に対して、優
先順位が上位である辞書中の情報を棄却して、優先順位
が下位である辞書の情報を用いて解析に成功し、訳文を
得た場合は、前記表示部において該原文および該訳文中
の該形態素に対応する部分を強調表示する表示手段を有
すること特徴としたものである。以下、本発明の実施例
に基づいて説明する。
【0006】まず、図3に基づき、本発明による機械翻
訳装置の一実施例を説明する。図中、101は入力部、
102は原文記憶部、103は編集制御部、104は翻
訳部、105は訳文記憶部、106は表示制御部、10
7は表示部、108は印刷部である。入力部101によ
り原文が入力され、入力された原文を原文記憶部102
に記憶させる。翻訳辞書部には原文の翻訳処理に用いる
知識情報が格納されており、該知識情報を用いて前記原
文記憶部102に記憶された原文を翻訳部104により
翻訳処理される。訳文記憶部105では、翻訳処理され
て求められた訳文をその訳文を得た原文に対応させて記
憶させる。前記原文又は訳文は表示部107に表示さ
れ、該表示部107による表示形態を表示制御部106
により制御する。前記表示部107に表示された原文お
よび訳文に対する編集処理は編集制御部103により制
御される。
【0007】図4は、図3における翻訳部の処理を英日
機械翻訳システムを例に示した構成図で、図中、201
は形態素解析部、202は辞書、203は構文解析部、
204は文法規則、205は変換部、206は生成部で
ある。入力部101から入力された原文は原文記憶部1
02に送られる。翻訳部104は、編集制御部103の
制御下で原文記憶部102の原文を翻訳処理する。翻訳
部104における翻訳処理は、図2に示すような構成で
行なわれる。まず、入力文である英文は、形態素解析部
201で、辞書202の情報をもとに個々の単語に認定
される。次に構文解析部203で文法規則204を適用
して文構造が決定され、係り受け関係等を明らかにした
木構造が作られる。
【0008】次に、変換部205で、この木構造は出力
言語である日本語の構造に即した木に変換され、生成部
206でノード毎に訳出される。得られた訳文は順次訳
文記憶部105に格納される。編集制御部103は表示
制御部106を駆動し、原文記憶部102に格納された
英文と訳文記憶部105に格納された日本語文を対応付
けて表示部107において表示する。ユーザはこの表示
を見ながら後編集処理を行なう。後編集処理は、入力部
101から入力される制御情報に従い、編集制御部10
3で実行される。後編集処理の後、完成した訳文と原文
が印刷部108において出力される。
【0009】図1は、本発明による複数辞書を用いた場
合の翻訳処理のフローチャートである。図2は、複数辞
書の検索優先順位の例である。この例における機械翻訳
装置は3種類の辞書を有し、形態素解析部202におい
てユーザ辞書、分野別辞書、システム辞書の優先順位に
検索される。以下、フローチャートの各ステップに従っ
て順に説明する。
【0010】まず、構文に失敗すると、優先順位が最下
位の辞書からの情報のみを解析に使用したかどうかを判
断し(step3)、そうである場合はそのまま変換・生成
処理を行い(step11,12)、解析失敗の文として結
果を出力する(step15)。優先順位が上位の辞書から
の情報を使用している場合は、該当する語を認定してか
ら(step4,5)次の優先順の辞書を検索し(step
6)、エントリがある場合は、上位の辞書と重複しない
情報を検索して(step8)再度構文解析を行う。下位辞
書にエントリがない場合、あるいは上位辞書と重複しな
い情報がない場合、あるいは再度解析に失敗した場合
は、更に下位の辞書を検索し、優先度が最下位の辞書を
検索するまで繰り返す(step9)。最下位の辞書を検索
しても、当該語のエントリおよび上位辞書と重複しない
情報がない場合は、当該語を未知語処理し(step1
2)、原文のまま訳出する(step15)。下位辞書の情
報を用いて再解析に成功した場合は(step13)、翻訳
結果を出力する際に原文中の当該語とそれに対応する訳
文中の訳語を強調表示する(step14)。
【0011】次に、具体的な例により本発明の機械翻訳
装置の動作を説明する。図5は、本装置における複数辞
書の登録例である。まず、‘Press the key to interru
pt the processing.’という原文を翻訳する場合を考え
る。図2の辞書検索優先順位に従って検索すると‘inte
rrupt’にはまずユーザ辞書の情報に従って名詞が与え
られる。しかし当原文中における‘interrupt’の品詞
は動詞であるため、解析に失敗する(図7(b))。す
ると次に優先順位の高い分野別辞書のエントリを検索す
るが、分野別辞書のエントリにおいても‘interrupt’
には名詞以外の品詞はないため、その次の優先順位であ
るシステム辞書のエントリを検索する。システム辞書に
は名詞以外に動詞が登録されているため、その情報を採
用して再度解析を行い、「処理を中断するためにキーを
押しなさい。」という正しい訳文が得られる。この場
合、上位辞書にエントリがあるにもかかわらず下位辞書
の情報で翻訳したため、翻訳結果を表示する際には原文
中の当該語‘interrupt’と訳文中の当該訳語「中断す
る」を強調して表示する(図6(a))。
【0012】次に‘Hold control column in full aft
position.’という原文を翻訳する場合を考える。‘ful
l aft’はユーザ辞書に副詞として登録されているが
(図5)、原文中では形容詞として用いられているた
め、解析に失敗する(図7(d))。下位の辞書を検索
してもエントリがないため、未知語として処理され、
「コントロールコラムをfullaftポジションに保
ちなさい。」という訳文が得られる(図6(b))。
【0013】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)請求項1に対応する効果;上位辞書の情報を用い
て解析失敗した場合は下位辞書の情報を検索して再解析
を行い、更に下位辞書の情報を使っても解析に失敗した
り、下位辞書にエントリがない場合には、その語を未知
語処理して原文のまま訳出することで、上位辞書の登禄
漏れによる解析失敗をできるだけ避けることができる。 (2)請求項2に対応する効果;下位辞書を検索する場
合には、上位辞書と重複する情報は用いないため、効率
の良い処理を行うことができる。 (3)請求項3に対応する効果;上位辞書にエントリが
あるにもかかわらず、下位辞書の情報を用いて翻訳を行
った場合は、原文と訳文の該当部分を強調表示すること
で、ユーザに上位辞書に登録した情報が適切でない、あ
るいは不十分であることを知らせることができる。
【図面の簡単な説明】
【図1】 本発明による複数辞書を用いた場合の翻訳処
理のフローチャートを示す図である。
【図2】 複数辞書の検索優先順位の例を示す図であ
る。
【図3】 本発明による機械翻訳装置の一実施例を示す
図である。
【図4】 図3における翻訳部の処理を英日機械翻訳シ
ステムを例に示した構成図である。
【図5】 複数辞書の登録例を示す図である。
【図6】 翻訳結果の表示例を示す図である。
【図7】 従来技術による英文から日本文への訳出例で
ある。
【符号の説明】 101…入力部、102…原文記憶部、103…編集制
御部、104…翻訳部、105…訳文記憶部、106…
表示制御部、107…表示部、108…印刷部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−236168(JP,A) 特開 平4−167062(JP,A) 特開 平4−167064(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/27 G06F 17/28

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 少なくとも、原文を入力するための入力
    部と、該入力部により入力された原文を記憶する原文記
    憶部と、前記原文の翻訳処理に用いる知識情報を格納し
    た翻訳辞書部と、前記知識情報を用いて前記原文記憶部
    に記憶された原文を翻訳処理する翻訳部と、該翻訳部に
    より翻訳処理されて求められた訳文をその訳文を得た原
    文に対応させて記憶する訳文記憶部と、少なくとも前記
    原文又は訳文を表示する表示部と、該表示部による表示
    形態を制御する表示制御部と、前記表示部に表示された
    原文および訳文に対する編集処理を制御する編集制御部
    とを具備する機械翻訳装置において、前記翻訳辞書部が
    優先順位の異なる複数の辞書を有し、原文中の任意の形
    態素に対する優先順位が高い辞書の情報を用いて該原文
    の解析に失敗した場合は、該辞書情報を棄却して、該形
    態素に対する次に優先順位の高い辞書の情報を用いて該
    原文を再度解析する解析手段と、優先順位が下位の辞書
    に該形態素のエントリがない場合は、該形態素を未知語
    として処理する処理手段とを有することを特徴とする機
    械翻訳装置。
  2. 【請求項2】 前記原文中の任意の形態素に対して、優
    先順位が下位である辞書中の情報を用いて再度解析する
    際に、優先順位が上位の辞書と重複する情報を解析に用
    いない手段を有することを特徴とする請求項1記載の機
    械翻訳装置。
  3. 【請求項3】 前記原文中の任意の形態素に対して、優
    先順位が上位である辞書中の情報を棄却して、優先順位
    が下位である辞書の情報を用いて解析に成功し、訳文を
    得た場合は、前記表示部において該原文および該訳文中
    の該形態素に対応する部分を強調表示する表示手段を有
    することを特徴とする機械翻訳装置。
JP3319836A 1991-11-06 1991-11-06 機械翻訳装置 Expired - Fee Related JP2807586B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3319836A JP2807586B2 (ja) 1991-11-06 1991-11-06 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3319836A JP2807586B2 (ja) 1991-11-06 1991-11-06 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH05128145A JPH05128145A (ja) 1993-05-25
JP2807586B2 true JP2807586B2 (ja) 1998-10-08

Family

ID=18114761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3319836A Expired - Fee Related JP2807586B2 (ja) 1991-11-06 1991-11-06 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP2807586B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5185343B2 (ja) * 2010-09-03 2013-04-17 株式会社東芝 機械翻訳装置及び機械翻訳プログラム

Also Published As

Publication number Publication date
JPH05128145A (ja) 1993-05-25

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
JP2732563B2 (ja) 機械翻訳方法及び装置
JPS638864A (ja) 翻訳装置
JP2807586B2 (ja) 機械翻訳装置
JP2632806B2 (ja) 言語解析装置
JP3085394B2 (ja) 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3257264B2 (ja) 未知語登録装置
JP2871300B2 (ja) 機械翻訳装置
JP3244286B2 (ja) 翻訳処理装置
JP2719453B2 (ja) 機械翻訳装置
JP2766738B2 (ja) 機械翻訳装置
JPS62203266A (ja) 機械翻訳システム
JPS61260367A (ja) 機械翻訳システム
JP3255294B2 (ja) 機械翻訳装置
JPH04296969A (ja) 機械翻訳装置
JPH07182342A (ja) 機械翻訳装置
JPH0410056A (ja) 機械翻訳システム
JPH04130577A (ja) 自然言語処理装置
JPH05128146A (ja) 英語形態素解析装置
JPH06180713A (ja) 機械翻訳装置
JPH09319751A (ja) 翻訳装置
JPH07295982A (ja) 自然言語処理装置
JPH07152763A (ja) 機械翻訳装置と該装置における翻訳方法
JPH11259473A (ja) 機械翻訳装置及び機械翻訳方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070724

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080724

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees