JPH04235671A

JPH04235671A - 機械翻訳装置

Info

Publication number: JPH04235671A
Application number: JP912018A
Authority: JP
Inventors: Ichiko Sada; いち子佐田; Youji Fukumochi; 福持　陽士; Hidezo Kugimiya; 釘宮　秀造; Noriyuki Hirai; 平井　徳行; Takeshi Kutsumi; 毅九津見
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1991-01-11
Filing date: 1991-01-11
Publication date: 1992-08-24

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ユ−ザ辞書を有する機
械翻訳装置に関する。

【０００２】

【従来の技術】機械翻訳装置は、一般的に、キ−ボ−ド
から入力されたソ−ス言語を、メインＣＰＵ（中央処理
装置）の制御によって翻訳モジュ−ルへ入力し、この翻
訳モジュ−ルにおいて、メモリに記憶されている翻訳用
辞書及びユ−ザが登録可能なユ−ザ辞書等の辞書、文法
規則、及び木構造変換規則を利用してタ−ゲット言語に
翻訳するように構成されている。

【０００３】このユ−ザ辞書は、基本辞書及び専門辞書
等のあらかじめ設定されている翻訳用辞書に登録されて
いない語句等が原文テキスト中に現れた場合等に、ユ−
ザがその語句の見出し、英品詞、形態素情報、文法情報
、訳語、訳語品詞等を登録しておき、翻訳処理を行う上
で反映させるようにしたものである。

【０００４】

【発明が解決しようとする課題】しかしながら上述した
ごとき従来の機械翻訳装置によると、ユ−ザが登録時に
見出し語のスペルを誤って入力した場合、まるで無意味
な登録が行われてしまい翻訳時にその見出し語登録が反
映されないという不都合があった。従って、ユ−ザは見
出し語登録時にそのスペルを誤って入力しないようよう
逐一スペルの確認を行い、必要ならば修正を行わなけれ
ばならなかった。このため、見出し語登録におけるユ−
ザの負担が大きく、また、ユ−ザ辞書構築の効率も非常
に低かった。

【０００５】従って本発明は、ユ−ザ辞書登録時の見出
し語の入力ミスに基づく無意味な登録を未然に防止でき
る機械翻訳装置を提供するものである。

【０００６】

【課題を解決するための手段】本発明によれば、入力さ
れたソ−ス言語をタ−ゲット言語に翻訳する機械翻訳装
置であって、あらかじめ設定されている翻訳用辞書及び
ユ−ザが登録可能なユ−ザ辞書を記憶するためのメモリ
と、ユ−ザ辞書を構築する際に入力された見出し語を翻
訳用辞書の情報を用いてスペルチェックする手段とを備
えた機械翻訳装置が提供される。

【０００７】さらに本発明によれば、このスペルチェッ
クする手段が、ユ−ザ辞書を構築する際に入力された見
出し語を形態素に分割する手段と、この手段によって分
割された形態素を翻訳用辞書の形態素情報に基づいて形
態素解析する手段と、この手段による形態素解析の結果
、分割された各形態素が翻訳用辞書に登録されているか
否かを判別する手段と、その判別結果を入力された見出
し語に付加して表示する手段とを備えた機械翻訳装置が
提供される。

【０００８】

【作用】ユ−ザ辞書登録時に見出し語を入力すると、翻
訳用辞書の形態素情報に基づいて見出し語のスペルチェ
ックが自動的に行われ、入力ミスがあったかどうかがユ
−ザに報知される。

【０００９】

【実施例】以下図面を用いて本発明の実施例を詳細に説
明する。

【００１０】図２は本発明の機械翻訳装置の一実施例の
構成を概略的に示すブロック図である。

【００１１】同図において、１０は本機械翻訳装置全体
の制御を行うメインＣＰＵ、１１はメインメモリ、１２
は表示装置の一例であるＣＲＴ（カソ−ドレイチュ−ブ
）、１３はキ−ボ−ド、１４はソ−ス言語が入力される
とこれを翻訳してタ−ゲット言語を出力する翻訳モジュ
−ルをそれぞれ示している。これらメインＣＰＵ１０、
メインメモリ１１、ＣＲＴ１２、キ−ボ−ド１３、及び
翻訳モジュ−ル１４はバス１５を介して互いに接続され
ている。翻訳モジュ−ル１４には、翻訳用辞書及びユ−
ザが登録可能なユ−ザ辞書等の辞書、文法規則、及び木
構造変換規則を記憶するためのメモリ１６が接続されて
いる。なお、本実施例では翻訳モジュ−ル１４が本発明
のスペルチェックする手段に対応している。

【００１２】キ−ボ−ド１３から入力されたソ−ス言語
は、メインＣＰＵ１０の制御によって翻訳モジュ−ル１
４へ送られる。翻訳モジュ−ル１４は、通常の翻訳モ−
ドでの動作時には、メモリ１６に記憶されている辞書、
文法規則、及び木構造変換規則等を用いて入力されたソ
−ス言語を後述するようにタ−ゲット言語に翻訳する。その結果は、メインメモリ１１に一旦記憶されると共に
ＣＲＴ１２に表示される。

【００１３】この翻訳モジュ−ル１４で行われる機械翻
訳には、通常、図３に示すような解析レベルが存在する
。即ち、同図左上に示すように、ソ−ス言語が入力される
と、レベルＬ１　の辞書引き、レベルＬ２　の形態素解
析、レベルＬ３　の構文解析、レベルＬ４　の意味解析
、レベルＬ５　の文脈解析と解析が順次進められる。

【００１４】辞書引き及び形態素解析では、メモリ１６
の辞書を引いて入力された文章を各形態素列（単語列）
に分割し、これら各単語に対する品詞等の文法情報及び
訳語を得、さらに、時制、人称、数等を解析する。

【００１５】構文解析では、後述するように、単語間の
係り受け等の文章構造（構造解析木）を決定する。

【００１６】意味解析では、複数の構文解析の結果から
意味的に正しいものとそうでないものとを判別する。

【００１７】文脈解析では、話題を理解し、省略や曖昧
さを取り去る。

【００１８】機械翻訳は、これらの各解析レベルの進み
方によって大きくは２つの方式に分けられる。一方の方
式は、レベルＬ１　の辞書引きからレベルＬ６　の中間
言語、即ちソ−ス言語及びタ−ゲット言語のどちらにも
依存しない概念まで解析し、そこからレベルＬ７　の文
脈生成、レベルＬ８　の意味生成、レベルＬ９　の構文
生成、レベルＬ１０の形態素生成と順次生成を進めてタ
−ゲット言語に翻訳してゆくピボット方式である。他方
の方式は、レベルＬ２　の形態素解析、レベルＬ３　の
構文解析、レベルＬ４　の意味解析、又はレベルＬ５　
の文脈解析のいずれかまで解析を行ってソ−ス言語の内
部構造を得、ソ−ス言語のこの得られた内部構造と同レ
ベルの内部構造を有するタ−ゲット言語にソ−ス言語を
変換して翻訳を行うトランスファ−方式である。

【００１９】本実施例の翻訳モジュ−ル１４では、後者
のトランスファ−方式を用いている。即ち、レベルＬ３
　の構文解析の後、変換して翻訳を行っている。このた
め、図４に示すように、翻訳モジュ−ル１４はその機能
的構成として、辞書引き及び形態素解析を行う辞書引き
及び形態素解析部２０と、構文解析部２１と、メモリ１
６に記憶されている木構造変換規則を用いてソ−ス言語
の構文解析木をこれに対応するタ−ゲット言語の構文解
析木に変換する変換部２２と、変換部２２で得られたタ
−ゲット言語の構文解析木に肉付けを行って翻訳文を生
成する翻訳文生成部２３とを備えている。

【００２０】図５はこの翻訳モジュ−ル１４の実際の構
成を表すブロック図である。同図において、１４ａ　〜
１４ｅ　は翻訳の各段階において情報が一時的に格納さ
れるバッファを示しており、１４ｆ　は翻訳用ＣＰＵ、
１４ｇ　は翻訳プログラムの記憶されているメモリを示
している。なお、バッファ１４ａ　〜１４ｅ　は、同図
に示すようにそれぞれ別個のメモリであってもよいし、
図２に示すメインメモリ１１の一部を用いてもよい。図
６〜図１０は、バッファ１４ａ　〜１４ｅ　の内容をそ
れぞれ示す説明図である。

【００２１】以下、図４〜図１０を用いて、翻訳モジュ
−ル１４の一般的な翻訳モ−ドでの動作を具体的な例、
即ち、「Ｔｈｉｓ　　ｉｓ　　ａ　　ｐｅｎ．」という
英語の例文を日本語に翻訳する場合について説明する。

【００２２】読み込まれた原文は、原文バッファ１４ａ
　内に図６に示すような形態で格納される。このバッフ
ァ１４ａ　内の原文は、翻訳プログラムによる翻訳用Ｃ
ＰＵ１４ｆ　の制御の下に、図４の辞書引き及び形態素
解析部２０で辞書引き及び形態素解析される。即ち、メ
モリ１６に記憶されている辞書が引かれて各単語に対す
る品詞等の文法情報及び訳語を得られ、さらに、時制、
人称、数等を解析されてその結果がバッファ１４ｂ　内
に格納される。図７は、バッファ１４ｂ　内に格納され
た情報の一部である品詞情報を示している。

【００２３】次いで、このバッファ１４ｂ　内の各単語
は、図４の構文解析部２１で構文解析される。即ち、メ
モリ１６に記憶されている辞書及び文法規則に従って各
単語間の係り受け関係を示す構文解析木が図８のように
決定されてバッファ１４ｃ　内に格納される。この構文
解析木は、次のようにして決定される。

【００２４】メモリ１６の文法規則から、文　　　　→
　　主部、述部主部　　→　　名詞句述部　　→　　動詞、名詞句名詞句→　　代名詞名詞句→　　冠詞、名詞という規則が得られる。ここで、「文→主部、述部」と
は、「文とは、主部と述部とから形成されている」とい
う意味である。これらの規則に順次従って図８のように
構文解析木が決定される。図７の段階で「ｔｈｉｓ」と
いう単語は、多品詞語であったが、図８に示すようにこ
の構文解析により一意に決定される。

【００２５】このバッファ１４ｃ　内の英語の構文解析
木構造は、図４の変換部２２で日本語の構文解析木構造
に変換される。即ち、メモリ１６に記憶されている木構
造変換規則を用いて図９に示すような日本語に対する構
文解析木構造に変換されてバッファ１４ｄ　に格納され
る。

【００２６】次いで図４の翻訳文生成部２３において、
バッファ１４ｄ　に格納されている日本文「これ　　ペ
ン　　である」に適切な助詞「は」、助動詞を付加する
ことにより図１０に示すような日本文「これはペンであ
る。」が生成され、出力文バッファ１４ｅに格納される
。この日本文が翻訳モジュ−ル１４から出力され、メイ
ンメモリ１１に一旦記憶されると共にＣＲＴ１２に表示
される。

【００２７】以上述べた翻訳処理を行う場合、あらかじ
め設定された翻訳用辞書の他にこの翻訳用辞書にはない
特殊な単語、文章等を必要に応じてユ−ザが登録可能な
ユ−ザ辞書が用いられる。このユ−ザ辞書に新たな英語
の単語又は文章とこれに対応する日本語の単語又は文章
とをユ−ザが登録する場合には、翻訳用ＣＰＵ１４ｆ　
によってユ−ザ辞書登録処理が実行される。

【００２８】図１はこのユ−ザ辞書登録処理プログラム
の一部のフロ−チャ−トを示しており、図１１〜図１４
はユ−ザ辞書登録処理モ−ドにおける各バッファの内容
を表している。以下これらの図を用いて本発明の要旨に
関連するユ−ザ辞書登録処理モ−ドでの動作説明を行う
。

【００２９】まず図１のステップＳ１において、ユ−ザ
辞書登録のための見出し語が入力されたか否かを判別す
る。見出し語が入力されてない場合は、以下の処理を全
て飛ばして次の図示しないプログラムへ進む。

【００３０】例えば、図１１に示すごとき見出し語「Ｉ
ｎｆｏｍａｔｉｏｎ　　Ｓｙｓｔｅｍｓ　　Ｌａｂｏｒ
ａｔｏｒｉｅｓ」が入力された場合は、ステップＳ２へ
進んで形態素解析が行われる。なお、この入力された見
出し語「Ｉｎｆｏｍａｔｉｏｎ　　Ｓｙｓｔｅｍｓ　　
Ｌａｂｏｒａｔｏｒｉｅｓ」は、図５の原文バッファ１
４ａ　に格納されている。

【００３１】この形態素解析により、図１２に示すよう
に、入力した見出し語の各単語にその形態素解析結果が
付与され、さらに各単語には先頭の単語を「０」とした
連続の単語ＮＯ．（番号）が与えられる。この形態素解
析結果及び単語ＮＯ．は、例えば図５のバッファ１４ｂ
　に格納される。

【００３２】次にステップＳ３において、翻訳用ＣＰＵ
１４ｆ　の単語位置ポインタのセット処理が行われる。まず最初には、ポインタは「０」にセットされる。

【００３３】これによりバッファ１４ｂ　の先頭の単語
「Ｉｎｆｏｍａｔｉｏｎ」が指定されることとなり、次
のステップＳ４でこの単語が翻訳用辞書に登録されてい
るかどうかの判別が行われる。先頭の単語「Ｉｎｆｏｍ
ａｔｉｏｎ」は、「Ｉｎｆｏｍａｔｉｏｎ」としても「
ｉｎｆｏｍａｔｉｏｎ」としても登録されてないため、
図１３に示すように判別結果は「０」となり、この判別
結果が例えばバッファ１４ｃ　に格納される。

【００３４】ステップＳ５では、次の単語が存在するか
どうか判別する。この例では存在しているため、ステッ
プＳ３へ戻り、単語位置ポインタが１つインクリメント
される。これにより、次の単語「Ｓｙｓｔｅｍｓ」が指
定されることとなり、ステップＳ４でこの単語が翻訳用
辞書に登録されているかどうか判別される。「Ｓｙｓｔ
ｅｍｓ」は「ｓｙｓｔｅｍ」として登録されているため
、判別結果は「１」となり、この判別結果が図１３に示
すようにバッファ１４ｃ　に格納される。

【００３５】次いでステップＳ５で再び次の単語が存在
するかどうか判別して、ステップＳ３へ戻り、単語位置
ポインタが１つインクリメントされる。これにより、次
の単語「Ｌａｂｏｒａｔｏｒｉｅｓ」が指定されること
となり、ステップＳ４でこの単語が翻訳用辞書に登録さ
れているかどうか判別される。「Ｌａｂｏｒａｔｏｒｉ
ｅｓ」は「ｌａｂｏｒａｔｏｒｙ」として登録されてい
るため、判別結果は「１」となり、この判別結果が図１
３に示すようにバッファ１４ｃ　に格納される。

【００３６】その後ステップＳ５が実行されると、次の
単語が存在しないと判別されるため、プログラムはステ
ップＳ６へ進み、バッファ１４ｃ　内の判別結果の出力
処理が行われる。即ち、翻訳用辞書に登録されている単
語「Ｓｙｓｔｅｍｓ」及び「Ｌａｂｏｒａｔｏｒｉｅｓ
」のみにアンダ−ラインが付与された図１４に示すごと
き出力文が出力文バッファ１４ｅ　に格納される。この
出力文がスペルチェックの結果として翻訳モジュ−ル１
４から出力されてＣＲＴ１２に表示される。

【００３７】その結果、ユ−ザは単語「Ｉｎｆｏｍａｔ
ｉｏｎ」のスペルに誤りが存在する可能性ありと知るこ
ととなる。即ち、ユ−ザはこの単語のみに着目すればよ
く、「Ｉｎｆｏ」の次に「ｒ」が抜けていることを容易
に発見することができる。

【００３８】なお、上述した実施例では、翻訳用辞書に
登録されている単語にアンダ−ラインを付与して見出し
語の入力ミスの可能性をユ−ザに報知しているが、本発
明はこの報知方法に限定されるものではなく他の種々の
報知方法を用いることができる。

【００３９】

【発明の効果】以上詳細に説明したように本発明によれ
ば、あらかじめ設定されている翻訳用辞書及びユ−ザが
登録可能なユ−ザ辞書を記憶するためのメモリと、ユ−
ザ辞書を構築する際に入力された見出し語を翻訳用辞書
の情報を用いてスペルチェックする手段とを備えている
ため、ユ−ザ辞書登録時の見出し語の入力ミスに基づく
無意味な登録を未然に防止することができる。しかもそ
の際、ユ−ザの負担の軽減化及びユ−ザ辞書構築の効率
向上を図ることができる。

【図面の簡単な説明】

【図１】本発明の機械翻訳装置の一実施例におけるユ−
ザ辞書登録処理プログラムの一部のフロ−チャ−トであ
る。

【図２】本実施例の電気的構成を概略的に示すブロック
図である。

【図３】翻訳モジュ−ルで行われる機械翻訳の解析レベ
ルを示す説明図である。

【図４】翻訳モジュ−ルの機能的構成を示すブロック図
である。

【図５】翻訳モジュ−ルの実際の電気的構成を示すブロ
ック図である。

【図６】原文バッファの内容の説明図である。

【図７】バッファの内容の説明図である。

【図８】バッファの内容の説明図である。

【図９】バッファの内容の説明図である。

【図１０】出力文バッファの内容の説明図である。

【図１１】原文バッファに格納されているユ−ザ辞書の
見出し語の入力例の説明図である。

【図１２】バッファに格納されている形態素解析結果及
び単語ＮＯ．の説明図である。

【図１３】バッファに格納されている判別結果の説明図
である。

【図１４】出力文バッファに格納されているスペルチェ
ックの結果の説明図である。

【符号の説明】

１０　　メインＣＰＵ１１　　メインメモリ１２　　ＣＲＴ１３　　キ−ボ−ド１４　　翻訳モジュ−ル１４ａ　〜１４ｅ　　　バッファ１４ｆ　　　翻訳ＣＰＵ１４ｇ　　　翻訳プログラムメモリ１５　　バス１６　　メモリ２０　　辞書引き及び形態素解析部２１　　構文解析部２２　　変換部２３　　翻訳文生成部

Claims

【特許請求の範囲】

【請求項１】　　入力されたソ−ス言語をタ−ゲット言
語に翻訳する機械翻訳装置であって、あらかじめ設定さ
れている翻訳用辞書及びユ−ザが登録可能なユ−ザ辞書
を記憶するためのメモリと、該ユ−ザ辞書を構築する際
に入力された見出し語を前記翻訳用辞書の情報を用いて
スペルチェックする手段とを備えたことを特徴とする機
械翻訳装置。
【請求項２】　　前記スペルチェックする手段が、前記
ユ−ザ辞書を構築する際に入力された見出し語を形態素
に分割する手段と、該手段によって分割された形態素を
前記翻訳用辞書の形態素情報に基づいて形態素解析する
手段と、該手段による形態素解析の結果、分割された各
形態素が前記翻訳用辞書に登録されているか否かを判別
する手段と、該判別結果を入力された見出し語に付加し
て表示する手段とを備えたことを特徴とする請求項１に
記載の機械翻訳装置。