JPH05314170A

JPH05314170A - 機械翻訳装置

Info

Publication number: JPH05314170A
Application number: JP4120557A
Authority: JP
Inventors: Natsuyuki Ono; 奈津志小野
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1992-05-13
Filing date: 1992-05-13
Publication date: 1993-11-26

Abstract

(57)【要約】【目的】英語等の１つの単語が複数の品詞に対応する
が、これを他の言語に翻訳する際、効率よく高精度に行
なう。【構成】機械翻訳装置に単語辞書３中の品詞の優先度
に関する情報を用いて、入力文に対応する品詞列を正解
の可能性が高いものから優先的に生成する品詞列発生部
６及び品詞列記憶部７を設けるか、ある単語に対して複
数の品詞が考えられる場合には、よく使われる品詞から
順に単語辞書３に格納しておき、この品詞の格納順序か
ら各品詞の優先度を計算して、入力文に対応する品詞列
を正解の可能性が高いものから優先的に生成する品詞列
発生部６及び品詞列記憶部７を設け、効率よく、かつ高
精度に機械翻訳を行なう。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ある言語で入力してあ
るもう一つの言語に変換する際、正解の可能性が高い品
詞列を優先的に発生させ、効率よくかつ、高精度の翻訳
を実現する機械翻訳装置に関するものである。

【０００２】

【従来の技術】近年、機械翻訳装置は、ある言語から他
の言語に翻訳するための装置として広く用いられてい
る。

【０００３】例えば、英日機械翻訳装置の場合は、２つ
のウィンドウを表示し、ユーザが英文編集用のウィンド
ウから“They like books.”を入力して翻訳を指示する
と、翻訳文編集用のウィンドウに「彼らは本が好き
だ。」と翻訳結果を表示する。

【０００４】これは、like に対して、動詞と前置詞の
解釈が存在し、また、book に対して名詞と動詞の解釈
が存在するにも関わらず、様々な品詞の組合せを考慮し
て、全体として「文」として成り立つ解釈を採用してい
るからである。このような、「様々な品詞の組合せ」を
発生させる方法として「バック・トラックによる方法」
がもっとも一般的である。

【０００５】この「バック・トラックによる方法」を上
記文列によって説明する。仮に、like に対して前置詞
と動詞が、また、book に対して名詞と動詞がこの順序
で辞書に登録されていたとする。「バック・トラックに
よる方法」では、入力文の左の単語から辞書の登録順に
品詞を採用し、構文の解析を行っていく。構文解析の過
程で、解析を続行することができないような品詞の組合
せを採用してしまった場合は、その時点で一番最近採用
した品詞を却下し、辞書に登録されている次の品詞で解
析を続行しようと試みる。上記文例では、代名詞(the
y)，前置詞(like)，と品詞列を仮定した時点で「代名詞
の直後に前置詞がくることはない」ということがわかる
ので、この時採用した「前置詞」の解釈を却下し、次の
解釈「動詞」を採用する。次に、book に対して「名
詞」の解釈を採用し、全体として「代名詞＋動詞＋名
詞」の形をした「文」であることが認識できるのでこの
解釈を採用するわけである。

【０００６】この例においては「代名詞，前置詞，名
詞」や「代名詞，前置詞，動詞」などの不適切な品詞の
組合せを試行する前に正解が見つかる。

【０００７】

【発明が解決しようとする課題】しかしながら、以上説
明した従来の機械翻訳装置では、次に例示するような入
力文“The commands sets long part.”に対しては、
「バック・トラック」が頻発し、また、最初に得られた
解では正解とならないことが知られている。

【０００８】上記文例に対して詳細な説明を行う。

【０００９】まず、形態素解析が入力文を以下のような
単語列“the command set long part”に分解したと
し、さらに、各単語に対する品詞情報を以下のように辞
書から読み込んだとする。

【００１０】

【表１】

【００１１】このような例においては、「バック・トラ
ック」が頻発する。以下、「バック・トラック」によっ
て試行される品詞列を順に列挙すると、

【００１２】

【表２】

【００１３】となる。以上から分かるように、正解が
「コマンドは、長い部分をセットする。」という意味で
あるとすれば、10番目にようやく正解の品詞列が出現す
ることになる。

【００１４】しかし、この例では、６番目の品詞列が偶
然、文として解釈できるので、この入力文に対しては
「コマンドセットは幾分切望する。」という翻訳結果を
出力する。

【００１５】以上のように、従来の機械翻訳装置では (1）第１の解が得られるまでの時間が長い。

【００１６】(2）第１の解では、long や part に対し
て優先度の低い品詞を採用している。

【００１７】(3）本来正解のはずの第２の解は、さらに
別解を求めなければ得られない。

【００１８】などの好ましくない点があった。

【００１９】以上説明したように英語等では、しばし
ば、１つの単語が複数の品詞に対応することがある。こ
のような「多品詞性」を持つ言語から他の言語に翻訳を
行う場合、いかにこの多品詞性を解消するかが問題とな
る。従来の機械翻訳装置ではこの多品詞性を解消する処
理に時間がかかり、また、正しい品詞を選択できないこ
とがあったため結果として、翻訳に時間がかかり、ま
た、翻訳の質もよくない。

【００２０】そこで、本発明は単語辞書中の品詞の優先
度に関する情報を用いて、または、ある単語に対して複
数の品詞が考えられる場合には、よく使われる品詞から
順に単語辞書に格納しておき、この品詞の格納順序から
名品詞の優先度を計算し、入力文に対応する品詞列を正
解の可能性が高いものから優先的に生成する品詞列発生
部を設け、効率よく、かつ高精度の機械翻訳装置を実現
することを目的とする。

【００２１】

【課題を解決するための手段】本発明は、原文の入力と
翻訳を指示する手段を有する入力手段と、前記入力手段
により入力された原文と翻訳結果とを対応づけて記憶す
る原文訳文対管理テーブルと、英語等を解析するのに必
要な英単語等に関する品詞などの文法的情報、各品詞毎
の優先度情報、この英単語等に対する訳語、および、訳
語の文法的な情報を格納し、または単語が複数の品詞の
解釈を持つ場合には各品詞の優先度順に品詞を格納した
単語辞書と、前記原文訳文対管理テーブル中の原文を単
語単位に分割し、前記単語辞書を参照して各単語が持つ
文法的な情報や訳語を取り出し、結果を後述する単語情
報記憶部に格納する形態素解析部と、前記形態素解析部
が入力文中の各単語が持つ文法的な情報や訳語とその文
法的な情報を格納する単語情報記憶部と、入力された英
語等を解析するのに必要な英語等の文法を記憶した解析
ルール辞書と、前記解析ルール辞書を参照して前記原文
訳文対管理テーブルに記憶された原文を解析する解析実
行部と、英語等と日本語の構文の対応情報や日本語の文
法を記憶した変換・生成ルール辞書と、前記変換・生成
ルール辞書を参照して前記解析実行部が入力文を解析し
た結果から、対応する訳文を作り出す変換・生成実行部
と、前記原文訳文対管理テーブルに記憶された原文と訳
文を対応づけて表示する表示手段と、翻訳処理の全過程
において、その実行の制御を司る翻訳実行制御部とを備
えた機械翻訳装置に、前記単語辞書中の品詞に対する優
先度情報を参照して、または、前記単語辞書中の品詞の
格納順序から各品詞の優先度を計算して入力文に対応す
る品詞列を優先度の高い順に発生する品詞列発生部と、
前記品詞列発生部が出力した品詞列を記憶する品詞列記
憶部と、を設けたことを特徴とする。

【００２２】

【作用】本発明によれば、辞書中の品詞の優先度に関す
る情報を用いて、品詞列発生部により入力文に対応する
品詞列を正解の可能性の高いものから優先的に生成し、
効率よく、かつ高精度の翻訳を行う。

【００２３】また、ある単語に対して複数の品詞が考え
られる場合には、よく使われる品詞から順に単語辞書に
格納しておき、品詞列発生部により上記品詞の格納順序
から各品詞の優先度を計算して、入力文に対応する品詞
列の正解の可能性の高いものから優先的に生成し、効率
的よく、かつ高精度の翻訳を行う。

【００２４】

【実施例】以下、本発明の一実施例における機械翻訳装
置について図面を参照しながら説明する。

【００２５】図１は本発明の一実施例における機械翻訳
装置の機能ブロック図であり、１は原文の入力と翻訳を
指示する手段を有する入力手段、２は前記入力手段１よ
り入力された原文と翻訳結果とを対応づけて記憶する原
文訳文対管理テーブル、３は英語を解析するのに必要な
英単語に関する品詞などの文法的情報、各品詞毎の優先
度情報、この英単語に対する訳語、および、訳語の文法
的な情報を格納し、または、単語が複数の品詞の解釈を
持つ場合には、優先度の高い品詞から順に格納した単語
辞書、４は前記原文訳文対管理テーブル２中の原文を単
語単位に分割し、前記単語辞書３を参照して各単語が持
つ文法的な情報や訳語を取り出し、結果を後述する単語
情報記憶部５に格納する形態素解析部、５は前記形態素
解析部４が入力文中の各単語が持つ文法的な情報や訳語
とその文法的な情報を格納する単語情報記憶部、６は前
記単語辞書３(単語情報記憶部５)中の品詞に対する優先
度情報を参照して、また前記単語辞書３(単語情報記憶
部５)中の品詞の格納順序から各品詞の優先度を計算し
て入力文に対応する品詞列を優先度の高い順に発生する
品詞列発生部、７は前記品詞列発生部６が出力した品詞
列を記憶する品詞列記憶部、８は入力された英語を解析
するのに必要な英語の文法を記憶した解析ルール辞書、
９は前記解析ルール辞書８を参照して前記原文訳文対管
理テーブル２に記憶された原文を解析する解析実行部、
10は英語と日本語の構文の対応情報や日本語の文法を記
憶した変換・生成ルール辞書、11は前記変換・生成ルー
ル辞書を参照して前記解析実行部が入力文を解析した結
果から、対応する訳文を作り出す変換・生成実行部、12
は前記原文訳文対管理テーブル２に記憶された原文と訳
文を対応づけて表示する表示手段、13は翻訳処理の全過
程において、その実行の制御を司る翻訳実行制御部であ
る。

【００２６】図２は本実施例の機械翻訳装置の回路ブロ
ック図であり、14はキーボード、15は中央処理装置(以
下、ＣＰＵと略称する。)、16は陰極線管ディスプレイ
(以下、ＣＲＴと略称する。)、17はリードオンリーメモ
リ(以下、ＲＯＭと略称する。)、18はランダムアクセス
メモリ(以下、ＲＡＭと略称する。)である。

【００２７】ここで図１に示した入力手段１はキーボー
ド14により、原文訳文対管理テーブル２，単語情報記憶
部５，品詞列記憶部７は、ＲＡＭ18により、単語辞書
３，解析ルール辞書８，変換・生成ルール辞書10は、Ｒ
ＯＭ17により、また、形態素解析部４，品詞列発生部
６，解析実行部９，変換・生成実行部11，翻訳実行制御
部13は、ＣＰＵ15がＲＯＭ17およびＲＡＭ18とデータの
やりとりを行いながらＲＯＭ17に記憶されたプログラム
を実行することにより、さらに表示手段12はＣＲＴ16に
より、夫々実現されている。

【００２８】上記のように構成された本発明の一実施例
における英日機械翻訳装置について、以下この動作を図
３のフローチャートに基づき説明する。

【００２９】まず、ステップ(以下、Ｓと略記する)１
で、ユーザが入力手段１から英文を入力する。入力され
た英文は翻訳実行部制御部13によって原文訳文対管理テ
ーブル２に反映される。この時の原文訳文対管理テーブ
ル２の内容の一例を図４に示す。

【００３０】ここでは、以下の文例“The commands set
s long part.”が入力されたこととして説明する。

【００３１】Ｓ２では、ユーザが翻訳を入力手段１から
翻訳を指示したとする。すると、翻訳実行制御部13が形
態素解析部４に対して「入力文の形態素解析をせよ」と
いう命令を出す。形態素解析部４は原文訳文対管理テー
ブル２を参照し、入力文を単語単位に分割し、さらに各
単語に対する品詞や訳詞などの情報を単語辞書３から取
り出して、単語情報記憶部５に格納する。図５は、この
時の単語情報記憶部の内容の一例である。

【００３２】Ｓ３では、翻訳実行制御部13が品詞列発生
部６に「品詞列を発生せよ」という命令を出す。する
と、品詞列発生部６は各単語に対する品詞の優先度情報
に基づいて優先度の高い品詞列、すなわち、各単語の品
詞毎に持っている優先度情報を各単語に対して加えた合
計値が大きい品詞列から順に発生し、品詞列記憶部７に
格納する。

【００３３】図６は、この時の品詞列記憶部７の内容の
一例を示すものである。

【００３４】またはＳ３では、翻訳実行制御部13が品詞
列発生部６に「品詞列を発生せよ」という命令を出す。
すると、品詞列発生部６はおのおのの単語の各品詞の格
納順序に基づいて優先度の高い品詞列、すなわち、各単
語の品詞毎に格納順序から評価値を計算して、これを入
力文中の全ての単語に対して加えた合計値が大きい品詞
列から順に発生し、品詞列記憶部７に格納する。本実施
例では品詞の評価法として (1）先頭の品詞の評価値は２とする。

【００３５】(2）２番目の品詞の評価値を１とする。

【００３６】(3）最後の品詞の評価値を０とする。

【００３７】(4）上記以外(３番目〜最後−１番目)は評
価値１とする。

【００３８】という方法をとることにする。

【００３９】図７はこの時の品詞列記憶部７の内容の一
例を示すものである。

【００４０】Ｓ４では、翻訳実行制御部13が品詞列を優
先度の高い方から１つ取り出し、解析実行部９に渡す。

【００４１】なお、本実施例では、Ｓ３において、入力
文から考えられる全ての品詞列を発生した上で、優先度
の高い方から品詞列記憶部７に格納していくように説明
しているが、さらに効率的な処理を行うために、評価値
の高い品詞列だけを優先的に発生させ(たとえば、上の
例では評価値10)、優先度の高い品詞列で、解析を行っ
て(上の例では評価値10の品詞列)、全ての品詞列に対し
て解析が失敗した場合、すなわち、Ｓ４において、品詞
列記憶部７が空になった時点で、品詞列発生部６に「次
に評価値の高い品詞列(上の例では評価値９の品詞列)を
発生せよ」という指令を送る方法をとると、品詞列発生
にかかる時間が短縮できるので、より効率的である。な
ぜなら、通常「文」として解釈できる品詞列(上の例で
は評価値10の品詞列)を見つけた時点で、「解」が得ら
れたわけであるから、その品詞列より低い評価値を持つ
品詞列(上の例では評価値９以下の品詞列)は必要なくな
るからである。

【００４２】Ｓ５では、翻訳実行制御部13が解析実行部
９に「いま渡した品詞列で解析を試みよ」という命令を
出す。すると、解析実行部９は解析ルール辞書８を参照
して、いま与えられた品詞列から「文」としての解釈を
組み立てようと試みる。そして、解析が成功すれば、す
なわち「文」としての解釈が成立すれば、そのことを翻
訳実行制御部13に伝えて、Ｓ６に進む。また、解析に失
敗した場合は、そのことを翻訳実行制御部13に伝えて、
Ｓ４に戻る。

【００４３】図８は解析ルール辞書８の内容の一部を示
したものである。いま、第１の品詞列が「冠詞(the)，
名詞(command)，名詞(set)，形容詞(long)，名詞(par
t)」であったとして説明する。この場合、解析実行部９
は「この品詞列では「文」としての解釈はどの様な解析
ルールの組合せによっても得られない」と判断するの
で、「解析失敗」を翻訳実行制御部13を伝え、Ｓ４へ進
む。

【００４４】Ｓ４では、翻訳実行制御部13が再び、いま
記憶されている品詞列の中で優先度の最も高い品詞列を
品詞列記憶部７から取り出し、解析実行部９に渡す。

【００４５】今度は品詞列「冠詞(the)，名詞(comman
d)，動詞(set)，形容詞(long)，名詞(part)」が取り出
される。そして、実行はＳ５に進む。

【００４６】Ｓ５では、解析実行部９が、いま渡された
品詞列で解析を試みる。今度は、この品詞列でうまく
「文」を組み立てることができるので、「解析成功」を
翻訳実行制御部13に伝えて、Ｓ６に進む。この時、同時
に解析結果を翻訳実行制御部13に返すものとする。上の
例では、「the command の部分が主語で、long part の
部分が目的語で、set が述語である文」という解釈を翻
訳実行制御部13に返す。

【００４７】Ｓ６では、翻訳実行制御部13が受け取った
解析結果を変換・生成実行部11に渡す。変換・生成実行
部11は、変換・生成ルール辞書10を参照し、解析結果に
基づいて対応する訳文を生成する。そして、生成した訳
文を翻訳実行制御部13に返して、Ｓ７に進む。上の例で
は、「その命令は長い部分をセットする。」という訳語
を生成して、翻訳実行制御部13に返す。

【００４８】Ｓ８では、翻訳実行制御部13が変換・生成
実行部11から受け取った訳文を表示手段12に表示する。
図９は、この時の原文を翻訳結果を示す画面の様子であ
る。

【００４９】以上、英語を日本語に機械翻訳する場合に
ついて説明したが、その他の外国語についても同様に実
施できることはもちろんである。

【００５０】

【発明の効果】以上説明したように、本発明の機械翻訳
装置は、正解の可能性が高い品詞列を品詞列発生部でも
って優先的に発生させ、不必要な解析を行わずにすむた
め、効率よく、かつ高精度の翻訳を実現できる。

【図面の簡単な説明】

【図１】本発明の一実施例における機械翻訳装置の機能
ブロック図である。

【図２】図１の回路ブロック図である。

【図３】図１の動作を説明するフローチャートである。

【図４】図１の原文訳文対管理テーブルの内容を示す一
例図である。

【図５】図１の単語情報記憶部の内容を示す一例図であ
る。

【図６】図１の品詞列記憶部の内容を示す一例図であ
る。

【図７】図１の品詞列記憶部の内容を示す一例図であ
る。

【図８】図１の解析ルール辞書の内容の一部を示す図で
ある。

【図９】図１の表示画面の様子を示す図である。

【符号の説明】

１…入力手段、２…原文訳文対管理テーブル、３…
単語辞書、４…形態素解析部、５…単語情報記憶
部、６…品詞列発生部、７…品詞列記憶部、８…解
析ルール辞書、９…解析実行部、 10…変換・生成ル
ール辞書、 11…変換・生成実行部、 12…表示手段、
13…翻訳実行制御部。

Claims

【特許請求の範囲】

【請求項１】原文の入力と翻訳を指示する手段を有す
る入力手段と、前記入力手段により入力された原文と翻
訳結果とを対応づけて記憶する原文訳文対管理テーブル
と、英語等を解析するのに必要な英単語等に関する品詞
などの文法的情報、各品詞毎の優先度情報、この英単語
等に対する訳語、および、訳語の文法的な情報を格納
し、または単語が複数の品詞の解釈を持つ場合には各品
詞の優先度順に品詞を格納した単語辞書と、前記原文訳
文対管理テーブル中の原文を単語単位に分割し、前記単
語辞書を参照して各単語が持つ文法的な情報や訳語を取
り出し、結果を後述する単語情報記憶部に格納する形態
素解析部と、前記形態素解析部が入力文中の各単語が持
つ文法的な情報や訳語とその文法的な情報を格納する単
語情報記憶部と、入力された英語等を解析するのに必要
な英語等の文法を記憶した解析ルール辞書と、前記解析
ルール辞書を参照して前記原文訳文対管理テーブルに記
憶された原文を解析する解析実行部と、英語等と日本語
の構文の対応情報や日本語の文法を記憶した変換・生成
ルール辞書と、前記変換・生成ルール辞書を参照して前
記解析実行部が入力文を解析した結果から、対応する訳
文を作り出す変換・生成実行部と、前記原文訳文対管理
テーブルに記憶された原文と訳文を対応づけて表示する
表示手段と、翻訳処理の全過程において、その実行の制
御を司る翻訳実行制御部とを備えた機械翻訳装置に、前
記単語辞書中の品詞に対する優先度情報を参照して、ま
たは、前記単語辞書中の品詞の格納順序から各品詞の優
先度を計算して入力文に対応する品詞列を優先度の高い
順に発生する品詞列発生部と、前記品詞列発生部が出力
した品詞列を記憶する品詞列記憶部と、を設けたことを
特徴とする機械翻訳装置。