JPH04235671A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH04235671A
JPH04235671A JP912018A JP201891A JPH04235671A JP H04235671 A JPH04235671 A JP H04235671A JP 912018 A JP912018 A JP 912018A JP 201891 A JP201891 A JP 201891A JP H04235671 A JPH04235671 A JP H04235671A
Authority
JP
Japan
Prior art keywords
dictionary
translation
user
word
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP912018A
Other languages
English (en)
Inventor
Ichiko Sada
いち子 佐田
Youji Fukumochi
福持 陽士
Hidezo Kugimiya
釘宮 秀造
Noriyuki Hirai
平井 徳行
Takeshi Kutsumi
毅 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP912018A priority Critical patent/JPH04235671A/ja
Publication of JPH04235671A publication Critical patent/JPH04235671A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ユ−ザ辞書を有する機
械翻訳装置に関する。
【0002】
【従来の技術】機械翻訳装置は、一般的に、キ−ボ−ド
から入力されたソ−ス言語を、メインCPU(中央処理
装置)の制御によって翻訳モジュ−ルへ入力し、この翻
訳モジュ−ルにおいて、メモリに記憶されている翻訳用
辞書及びユ−ザが登録可能なユ−ザ辞書等の辞書、文法
規則、及び木構造変換規則を利用してタ−ゲット言語に
翻訳するように構成されている。
【0003】このユ−ザ辞書は、基本辞書及び専門辞書
等のあらかじめ設定されている翻訳用辞書に登録されて
いない語句等が原文テキスト中に現れた場合等に、ユ−
ザがその語句の見出し、英品詞、形態素情報、文法情報
、訳語、訳語品詞等を登録しておき、翻訳処理を行う上
で反映させるようにしたものである。
【0004】
【発明が解決しようとする課題】しかしながら上述した
ごとき従来の機械翻訳装置によると、ユ−ザが登録時に
見出し語のスペルを誤って入力した場合、まるで無意味
な登録が行われてしまい翻訳時にその見出し語登録が反
映されないという不都合があった。従って、ユ−ザは見
出し語登録時にそのスペルを誤って入力しないようよう
逐一スペルの確認を行い、必要ならば修正を行わなけれ
ばならなかった。このため、見出し語登録におけるユ−
ザの負担が大きく、また、ユ−ザ辞書構築の効率も非常
に低かった。
【0005】従って本発明は、ユ−ザ辞書登録時の見出
し語の入力ミスに基づく無意味な登録を未然に防止でき
る機械翻訳装置を提供するものである。
【0006】
【課題を解決するための手段】本発明によれば、入力さ
れたソ−ス言語をタ−ゲット言語に翻訳する機械翻訳装
置であって、あらかじめ設定されている翻訳用辞書及び
ユ−ザが登録可能なユ−ザ辞書を記憶するためのメモリ
と、ユ−ザ辞書を構築する際に入力された見出し語を翻
訳用辞書の情報を用いてスペルチェックする手段とを備
えた機械翻訳装置が提供される。
【0007】さらに本発明によれば、このスペルチェッ
クする手段が、ユ−ザ辞書を構築する際に入力された見
出し語を形態素に分割する手段と、この手段によって分
割された形態素を翻訳用辞書の形態素情報に基づいて形
態素解析する手段と、この手段による形態素解析の結果
、分割された各形態素が翻訳用辞書に登録されているか
否かを判別する手段と、その判別結果を入力された見出
し語に付加して表示する手段とを備えた機械翻訳装置が
提供される。
【0008】
【作用】ユ−ザ辞書登録時に見出し語を入力すると、翻
訳用辞書の形態素情報に基づいて見出し語のスペルチェ
ックが自動的に行われ、入力ミスがあったかどうかがユ
−ザに報知される。
【0009】
【実施例】以下図面を用いて本発明の実施例を詳細に説
明する。
【0010】図2は本発明の機械翻訳装置の一実施例の
構成を概略的に示すブロック図である。
【0011】同図において、10は本機械翻訳装置全体
の制御を行うメインCPU、11はメインメモリ、12
は表示装置の一例であるCRT(カソ−ドレイチュ−ブ
)、13はキ−ボ−ド、14はソ−ス言語が入力される
とこれを翻訳してタ−ゲット言語を出力する翻訳モジュ
−ルをそれぞれ示している。これらメインCPU10、
メインメモリ11、CRT12、キ−ボ−ド13、及び
翻訳モジュ−ル14はバス15を介して互いに接続され
ている。翻訳モジュ−ル14には、翻訳用辞書及びユ−
ザが登録可能なユ−ザ辞書等の辞書、文法規則、及び木
構造変換規則を記憶するためのメモリ16が接続されて
いる。なお、本実施例では翻訳モジュ−ル14が本発明
のスペルチェックする手段に対応している。
【0012】キ−ボ−ド13から入力されたソ−ス言語
は、メインCPU10の制御によって翻訳モジュ−ル1
4へ送られる。翻訳モジュ−ル14は、通常の翻訳モ−
ドでの動作時には、メモリ16に記憶されている辞書、
文法規則、及び木構造変換規則等を用いて入力されたソ
−ス言語を後述するようにタ−ゲット言語に翻訳する。 その結果は、メインメモリ11に一旦記憶されると共に
CRT12に表示される。
【0013】この翻訳モジュ−ル14で行われる機械翻
訳には、通常、図3に示すような解析レベルが存在する
。 即ち、同図左上に示すように、ソ−ス言語が入力される
と、レベルL1 の辞書引き、レベルL2 の形態素解
析、レベルL3 の構文解析、レベルL4 の意味解析
、レベルL5 の文脈解析と解析が順次進められる。
【0014】辞書引き及び形態素解析では、メモリ16
の辞書を引いて入力された文章を各形態素列(単語列)
に分割し、これら各単語に対する品詞等の文法情報及び
訳語を得、さらに、時制、人称、数等を解析する。
【0015】構文解析では、後述するように、単語間の
係り受け等の文章構造(構造解析木)を決定する。
【0016】意味解析では、複数の構文解析の結果から
意味的に正しいものとそうでないものとを判別する。
【0017】文脈解析では、話題を理解し、省略や曖昧
さを取り去る。
【0018】機械翻訳は、これらの各解析レベルの進み
方によって大きくは2つの方式に分けられる。一方の方
式は、レベルL1 の辞書引きからレベルL6 の中間
言語、即ちソ−ス言語及びタ−ゲット言語のどちらにも
依存しない概念まで解析し、そこからレベルL7 の文
脈生成、レベルL8 の意味生成、レベルL9 の構文
生成、レベルL10の形態素生成と順次生成を進めてタ
−ゲット言語に翻訳してゆくピボット方式である。他方
の方式は、レベルL2 の形態素解析、レベルL3 の
構文解析、レベルL4 の意味解析、又はレベルL5 
の文脈解析のいずれかまで解析を行ってソ−ス言語の内
部構造を得、ソ−ス言語のこの得られた内部構造と同レ
ベルの内部構造を有するタ−ゲット言語にソ−ス言語を
変換して翻訳を行うトランスファ−方式である。
【0019】本実施例の翻訳モジュ−ル14では、後者
のトランスファ−方式を用いている。即ち、レベルL3
 の構文解析の後、変換して翻訳を行っている。このた
め、図4に示すように、翻訳モジュ−ル14はその機能
的構成として、辞書引き及び形態素解析を行う辞書引き
及び形態素解析部20と、構文解析部21と、メモリ1
6に記憶されている木構造変換規則を用いてソ−ス言語
の構文解析木をこれに対応するタ−ゲット言語の構文解
析木に変換する変換部22と、変換部22で得られたタ
−ゲット言語の構文解析木に肉付けを行って翻訳文を生
成する翻訳文生成部23とを備えている。
【0020】図5はこの翻訳モジュ−ル14の実際の構
成を表すブロック図である。同図において、14a 〜
14e は翻訳の各段階において情報が一時的に格納さ
れるバッファを示しており、14f は翻訳用CPU、
14g は翻訳プログラムの記憶されているメモリを示
している。なお、バッファ14a 〜14e は、同図
に示すようにそれぞれ別個のメモリであってもよいし、
図2に示すメインメモリ11の一部を用いてもよい。図
6〜図10は、バッファ14a 〜14e の内容をそ
れぞれ示す説明図である。
【0021】以下、図4〜図10を用いて、翻訳モジュ
−ル14の一般的な翻訳モ−ドでの動作を具体的な例、
即ち、「This  is  a  pen.」という
英語の例文を日本語に翻訳する場合について説明する。
【0022】読み込まれた原文は、原文バッファ14a
 内に図6に示すような形態で格納される。このバッフ
ァ14a 内の原文は、翻訳プログラムによる翻訳用C
PU14f の制御の下に、図4の辞書引き及び形態素
解析部20で辞書引き及び形態素解析される。即ち、メ
モリ16に記憶されている辞書が引かれて各単語に対す
る品詞等の文法情報及び訳語を得られ、さらに、時制、
人称、数等を解析されてその結果がバッファ14b 内
に格納される。図7は、バッファ14b 内に格納され
た情報の一部である品詞情報を示している。
【0023】次いで、このバッファ14b 内の各単語
は、図4の構文解析部21で構文解析される。即ち、メ
モリ16に記憶されている辞書及び文法規則に従って各
単語間の係り受け関係を示す構文解析木が図8のように
決定されてバッファ14c 内に格納される。この構文
解析木は、次のようにして決定される。
【0024】メモリ16の文法規則から、文    →
  主部、述部 主部  →  名詞句 述部  →  動詞、名詞句 名詞句→  代名詞 名詞句→  冠詞、名詞 という規則が得られる。ここで、「文→主部、述部」と
は、「文とは、主部と述部とから形成されている」とい
う意味である。これらの規則に順次従って図8のように
構文解析木が決定される。図7の段階で「this」と
いう単語は、多品詞語であったが、図8に示すようにこ
の構文解析により一意に決定される。
【0025】このバッファ14c 内の英語の構文解析
木構造は、図4の変換部22で日本語の構文解析木構造
に変換される。即ち、メモリ16に記憶されている木構
造変換規則を用いて図9に示すような日本語に対する構
文解析木構造に変換されてバッファ14d に格納され
る。
【0026】次いで図4の翻訳文生成部23において、
バッファ14d に格納されている日本文「これ  ペ
ン  である」に適切な助詞「は」、助動詞を付加する
ことにより図10に示すような日本文「これはペンであ
る。」が生成され、出力文バッファ14eに格納される
。この日本文が翻訳モジュ−ル14から出力され、メイ
ンメモリ11に一旦記憶されると共にCRT12に表示
される。
【0027】以上述べた翻訳処理を行う場合、あらかじ
め設定された翻訳用辞書の他にこの翻訳用辞書にはない
特殊な単語、文章等を必要に応じてユ−ザが登録可能な
ユ−ザ辞書が用いられる。このユ−ザ辞書に新たな英語
の単語又は文章とこれに対応する日本語の単語又は文章
とをユ−ザが登録する場合には、翻訳用CPU14f 
によってユ−ザ辞書登録処理が実行される。
【0028】図1はこのユ−ザ辞書登録処理プログラム
の一部のフロ−チャ−トを示しており、図11〜図14
はユ−ザ辞書登録処理モ−ドにおける各バッファの内容
を表している。以下これらの図を用いて本発明の要旨に
関連するユ−ザ辞書登録処理モ−ドでの動作説明を行う
【0029】まず図1のステップS1において、ユ−ザ
辞書登録のための見出し語が入力されたか否かを判別す
る。見出し語が入力されてない場合は、以下の処理を全
て飛ばして次の図示しないプログラムへ進む。
【0030】例えば、図11に示すごとき見出し語「I
nfomation  Systems  Labor
atories」が入力された場合は、ステップS2へ
進んで形態素解析が行われる。なお、この入力された見
出し語「Infomation  Systems  
Laboratories」は、図5の原文バッファ1
4a に格納されている。
【0031】この形態素解析により、図12に示すよう
に、入力した見出し語の各単語にその形態素解析結果が
付与され、さらに各単語には先頭の単語を「0」とした
連続の単語NO.(番号)が与えられる。この形態素解
析結果及び単語NO.は、例えば図5のバッファ14b
 に格納される。
【0032】次にステップS3において、翻訳用CPU
14f の単語位置ポインタのセット処理が行われる。 まず最初には、ポインタは「0」にセットされる。
【0033】これによりバッファ14b の先頭の単語
「Infomation」が指定されることとなり、次
のステップS4でこの単語が翻訳用辞書に登録されてい
るかどうかの判別が行われる。先頭の単語「Infom
ation」は、「Infomation」としても「
infomation」としても登録されてないため、
図13に示すように判別結果は「0」となり、この判別
結果が例えばバッファ14c に格納される。
【0034】ステップS5では、次の単語が存在するか
どうか判別する。この例では存在しているため、ステッ
プS3へ戻り、単語位置ポインタが1つインクリメント
される。これにより、次の単語「Systems」が指
定されることとなり、ステップS4でこの単語が翻訳用
辞書に登録されているかどうか判別される。「Syst
ems」は「system」として登録されているため
、判別結果は「1」となり、この判別結果が図13に示
すようにバッファ14c に格納される。
【0035】次いでステップS5で再び次の単語が存在
するかどうか判別して、ステップS3へ戻り、単語位置
ポインタが1つインクリメントされる。これにより、次
の単語「Laboratories」が指定されること
となり、ステップS4でこの単語が翻訳用辞書に登録さ
れているかどうか判別される。「Laboratori
es」は「laboratory」として登録されてい
るため、判別結果は「1」となり、この判別結果が図1
3に示すようにバッファ14c に格納される。
【0036】その後ステップS5が実行されると、次の
単語が存在しないと判別されるため、プログラムはステ
ップS6へ進み、バッファ14c 内の判別結果の出力
処理が行われる。即ち、翻訳用辞書に登録されている単
語「Systems」及び「Laboratories
」のみにアンダ−ラインが付与された図14に示すごと
き出力文が出力文バッファ14e に格納される。この
出力文がスペルチェックの結果として翻訳モジュ−ル1
4から出力されてCRT12に表示される。
【0037】その結果、ユ−ザは単語「Infomat
ion」のスペルに誤りが存在する可能性ありと知るこ
ととなる。即ち、ユ−ザはこの単語のみに着目すればよ
く、「Info」の次に「r」が抜けていることを容易
に発見することができる。
【0038】なお、上述した実施例では、翻訳用辞書に
登録されている単語にアンダ−ラインを付与して見出し
語の入力ミスの可能性をユ−ザに報知しているが、本発
明はこの報知方法に限定されるものではなく他の種々の
報知方法を用いることができる。
【0039】
【発明の効果】以上詳細に説明したように本発明によれ
ば、あらかじめ設定されている翻訳用辞書及びユ−ザが
登録可能なユ−ザ辞書を記憶するためのメモリと、ユ−
ザ辞書を構築する際に入力された見出し語を翻訳用辞書
の情報を用いてスペルチェックする手段とを備えている
ため、ユ−ザ辞書登録時の見出し語の入力ミスに基づく
無意味な登録を未然に防止することができる。しかもそ
の際、ユ−ザの負担の軽減化及びユ−ザ辞書構築の効率
向上を図ることができる。
【図面の簡単な説明】
【図1】本発明の機械翻訳装置の一実施例におけるユ−
ザ辞書登録処理プログラムの一部のフロ−チャ−トであ
る。
【図2】本実施例の電気的構成を概略的に示すブロック
図である。
【図3】翻訳モジュ−ルで行われる機械翻訳の解析レベ
ルを示す説明図である。
【図4】翻訳モジュ−ルの機能的構成を示すブロック図
である。
【図5】翻訳モジュ−ルの実際の電気的構成を示すブロ
ック図である。
【図6】原文バッファの内容の説明図である。
【図7】バッファの内容の説明図である。
【図8】バッファの内容の説明図である。
【図9】バッファの内容の説明図である。
【図10】出力文バッファの内容の説明図である。
【図11】原文バッファに格納されているユ−ザ辞書の
見出し語の入力例の説明図である。
【図12】バッファに格納されている形態素解析結果及
び単語NO.の説明図である。
【図13】バッファに格納されている判別結果の説明図
である。
【図14】出力文バッファに格納されているスペルチェ
ックの結果の説明図である。
【符号の説明】
10  メインCPU 11  メインメモリ 12  CRT 13  キ−ボ−ド 14  翻訳モジュ−ル 14a 〜14e   バッファ 14f   翻訳CPU 14g   翻訳プログラムメモリ 15  バス 16  メモリ 20  辞書引き及び形態素解析部 21  構文解析部 22  変換部 23  翻訳文生成部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  入力されたソ−ス言語をタ−ゲット言
    語に翻訳する機械翻訳装置であって、あらかじめ設定さ
    れている翻訳用辞書及びユ−ザが登録可能なユ−ザ辞書
    を記憶するためのメモリと、該ユ−ザ辞書を構築する際
    に入力された見出し語を前記翻訳用辞書の情報を用いて
    スペルチェックする手段とを備えたことを特徴とする機
    械翻訳装置。
  2. 【請求項2】  前記スペルチェックする手段が、前記
    ユ−ザ辞書を構築する際に入力された見出し語を形態素
    に分割する手段と、該手段によって分割された形態素を
    前記翻訳用辞書の形態素情報に基づいて形態素解析する
    手段と、該手段による形態素解析の結果、分割された各
    形態素が前記翻訳用辞書に登録されているか否かを判別
    する手段と、該判別結果を入力された見出し語に付加し
    て表示する手段とを備えたことを特徴とする請求項1に
    記載の機械翻訳装置。
JP912018A 1991-01-11 1991-01-11 機械翻訳装置 Pending JPH04235671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP912018A JPH04235671A (ja) 1991-01-11 1991-01-11 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP912018A JPH04235671A (ja) 1991-01-11 1991-01-11 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH04235671A true JPH04235671A (ja) 1992-08-24

Family

ID=11517601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP912018A Pending JPH04235671A (ja) 1991-01-11 1991-01-11 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH04235671A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01195576A (ja) * 1988-01-29 1989-08-07 Ricoh Co Ltd 辞書エデイタ装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01195576A (ja) * 1988-01-29 1989-08-07 Ricoh Co Ltd 辞書エデイタ装置

Similar Documents

Publication Publication Date Title
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
US5161105A (en) Machine translation apparatus having a process function for proper nouns with acronyms
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
JP2815714B2 (ja) 翻訳装置
EP0398513B1 (en) Method and apparatus for translating a sentence including a compound word formed by hyphenation
US4860206A (en) Translation system allowing user designation of postpositional words
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH0261763A (ja) 機械翻訳装置
JPH0332106B2 (ja)
JP2632806B2 (ja) 言語解析装置
JPH04235671A (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH0715691B2 (ja) 自動翻訳装置
JP2752025B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JPH07141382A (ja) 外国語文書作成支援装置
JPH02281373A (ja) 機械翻訳装置におけるハイフン生成方法
JPH07182349A (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPH01112367A (ja) 機械翻訳装置
JPH05181854A (ja) 文章校正装置および文章処理装置、ならびに漢字仮名変換装置
JPH02281374A (ja) 機械翻訳装置におけるハイフン合成語処理方法
JPH0836575A (ja) 統語解析装置