JPH05314170A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH05314170A
JPH05314170A JP4120557A JP12055792A JPH05314170A JP H05314170 A JPH05314170 A JP H05314170A JP 4120557 A JP4120557 A JP 4120557A JP 12055792 A JP12055792 A JP 12055792A JP H05314170 A JPH05314170 A JP H05314170A
Authority
JP
Japan
Prior art keywords
speech
word
sentence
translated
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4120557A
Other languages
English (en)
Inventor
Natsuyuki Ono
奈津志 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4120557A priority Critical patent/JPH05314170A/ja
Publication of JPH05314170A publication Critical patent/JPH05314170A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 英語等の1つの単語が複数の品詞に対応する
が、これを他の言語に翻訳する際、効率よく高精度に行
なう。 【構成】 機械翻訳装置に単語辞書3中の品詞の優先度
に関する情報を用いて、入力文に対応する品詞列を正解
の可能性が高いものから優先的に生成する品詞列発生部
6及び品詞列記憶部7を設けるか、ある単語に対して複
数の品詞が考えられる場合には、よく使われる品詞から
順に単語辞書3に格納しておき、この品詞の格納順序か
ら各品詞の優先度を計算して、入力文に対応する品詞列
を正解の可能性が高いものから優先的に生成する品詞列
発生部6及び品詞列記憶部7を設け、効率よく、かつ高
精度に機械翻訳を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ある言語で入力してあ
るもう一つの言語に変換する際、正解の可能性が高い品
詞列を優先的に発生させ、効率よくかつ、高精度の翻訳
を実現する機械翻訳装置に関するものである。
【0002】
【従来の技術】近年、機械翻訳装置は、ある言語から他
の言語に翻訳するための装置として広く用いられてい
る。
【0003】例えば、英日機械翻訳装置の場合は、2つ
のウィンドウを表示し、ユーザが英文編集用のウィンド
ウから“They like books.”を入力して翻訳を指示する
と、翻訳文編集用のウィンドウに「彼らは本が好き
だ。」と翻訳結果を表示する。
【0004】これは、like に対して、動詞と前置詞の
解釈が存在し、また、book に対して名詞と動詞の解釈
が存在するにも関わらず、様々な品詞の組合せを考慮し
て、全体として「文」として成り立つ解釈を採用してい
るからである。このような、「様々な品詞の組合せ」を
発生させる方法として「バック・トラックによる方法」
がもっとも一般的である。
【0005】この「バック・トラックによる方法」を上
記文列によって説明する。仮に、like に対して前置詞
と動詞が、また、book に対して名詞と動詞がこの順序
で辞書に登録されていたとする。「バック・トラックに
よる方法」では、入力文の左の単語から辞書の登録順に
品詞を採用し、構文の解析を行っていく。構文解析の過
程で、解析を続行することができないような品詞の組合
せを採用してしまった場合は、その時点で一番最近採用
した品詞を却下し、辞書に登録されている次の品詞で解
析を続行しようと試みる。上記文例では、代名詞(the
y),前置詞(like),と品詞列を仮定した時点で「代名詞
の直後に前置詞がくることはない」ということがわかる
ので、この時採用した「前置詞」の解釈を却下し、次の
解釈「動詞」を採用する。次に、book に対して「名
詞」の解釈を採用し、全体として「代名詞+動詞+名
詞」の形をした「文」であることが認識できるのでこの
解釈を採用するわけである。
【0006】この例においては「代名詞,前置詞,名
詞」や「代名詞,前置詞,動詞」などの不適切な品詞の
組合せを試行する前に正解が見つかる。
【0007】
【発明が解決しようとする課題】しかしながら、以上説
明した従来の機械翻訳装置では、次に例示するような入
力文“The commands sets long part.”に対しては、
「バック・トラック」が頻発し、また、最初に得られた
解では正解とならないことが知られている。
【0008】上記文例に対して詳細な説明を行う。
【0009】まず、形態素解析が入力文を以下のような
単語列“the command set long part”に分解したと
し、さらに、各単語に対する品詞情報を以下のように辞
書から読み込んだとする。
【0010】
【表1】
【0011】このような例においては、「バック・トラ
ック」が頻発する。以下、「バック・トラック」によっ
て試行される品詞列を順に列挙すると、
【0012】
【表2】
【0013】となる。以上から分かるように、正解が
「コマンドは、長い部分をセットする。」という意味で
あるとすれば、10番目にようやく正解の品詞列が出現す
ることになる。
【0014】しかし、この例では、6番目の品詞列が偶
然、文として解釈できるので、この入力文に対しては
「コマンドセットは幾分切望する。」という翻訳結果を
出力する。
【0015】以上のように、従来の機械翻訳装置では (1)第1の解が得られるまでの時間が長い。
【0016】(2)第1の解では、long や part に対し
て優先度の低い品詞を採用している。
【0017】(3)本来正解のはずの第2の解は、さらに
別解を求めなければ得られない。
【0018】などの好ましくない点があった。
【0019】以上説明したように英語等では、しばし
ば、1つの単語が複数の品詞に対応することがある。こ
のような「多品詞性」を持つ言語から他の言語に翻訳を
行う場合、いかにこの多品詞性を解消するかが問題とな
る。従来の機械翻訳装置ではこの多品詞性を解消する処
理に時間がかかり、また、正しい品詞を選択できないこ
とがあったため結果として、翻訳に時間がかかり、ま
た、翻訳の質もよくない。
【0020】そこで、本発明は単語辞書中の品詞の優先
度に関する情報を用いて、または、ある単語に対して複
数の品詞が考えられる場合には、よく使われる品詞から
順に単語辞書に格納しておき、この品詞の格納順序から
名品詞の優先度を計算し、入力文に対応する品詞列を正
解の可能性が高いものから優先的に生成する品詞列発生
部を設け、効率よく、かつ高精度の機械翻訳装置を実現
することを目的とする。
【0021】
【課題を解決するための手段】本発明は、原文の入力と
翻訳を指示する手段を有する入力手段と、前記入力手段
により入力された原文と翻訳結果とを対応づけて記憶す
る原文訳文対管理テーブルと、英語等を解析するのに必
要な英単語等に関する品詞などの文法的情報、各品詞毎
の優先度情報、この英単語等に対する訳語、および、訳
語の文法的な情報を格納し、または単語が複数の品詞の
解釈を持つ場合には各品詞の優先度順に品詞を格納した
単語辞書と、前記原文訳文対管理テーブル中の原文を単
語単位に分割し、前記単語辞書を参照して各単語が持つ
文法的な情報や訳語を取り出し、結果を後述する単語情
報記憶部に格納する形態素解析部と、前記形態素解析部
が入力文中の各単語が持つ文法的な情報や訳語とその文
法的な情報を格納する単語情報記憶部と、入力された英
語等を解析するのに必要な英語等の文法を記憶した解析
ルール辞書と、前記解析ルール辞書を参照して前記原文
訳文対管理テーブルに記憶された原文を解析する解析実
行部と、英語等と日本語の構文の対応情報や日本語の文
法を記憶した変換・生成ルール辞書と、前記変換・生成
ルール辞書を参照して前記解析実行部が入力文を解析し
た結果から、対応する訳文を作り出す変換・生成実行部
と、前記原文訳文対管理テーブルに記憶された原文と訳
文を対応づけて表示する表示手段と、翻訳処理の全過程
において、その実行の制御を司る翻訳実行制御部とを備
えた機械翻訳装置に、前記単語辞書中の品詞に対する優
先度情報を参照して、または、前記単語辞書中の品詞の
格納順序から各品詞の優先度を計算して入力文に対応す
る品詞列を優先度の高い順に発生する品詞列発生部と、
前記品詞列発生部が出力した品詞列を記憶する品詞列記
憶部と、を設けたことを特徴とする。
【0022】
【作用】本発明によれば、辞書中の品詞の優先度に関す
る情報を用いて、品詞列発生部により入力文に対応する
品詞列を正解の可能性の高いものから優先的に生成し、
効率よく、かつ高精度の翻訳を行う。
【0023】また、ある単語に対して複数の品詞が考え
られる場合には、よく使われる品詞から順に単語辞書に
格納しておき、品詞列発生部により上記品詞の格納順序
から各品詞の優先度を計算して、入力文に対応する品詞
列の正解の可能性の高いものから優先的に生成し、効率
的よく、かつ高精度の翻訳を行う。
【0024】
【実施例】以下、本発明の一実施例における機械翻訳装
置について図面を参照しながら説明する。
【0025】図1は本発明の一実施例における機械翻訳
装置の機能ブロック図であり、1は原文の入力と翻訳を
指示する手段を有する入力手段、2は前記入力手段1よ
り入力された原文と翻訳結果とを対応づけて記憶する原
文訳文対管理テーブル、3は英語を解析するのに必要な
英単語に関する品詞などの文法的情報、各品詞毎の優先
度情報、この英単語に対する訳語、および、訳語の文法
的な情報を格納し、または、単語が複数の品詞の解釈を
持つ場合には、優先度の高い品詞から順に格納した単語
辞書、4は前記原文訳文対管理テーブル2中の原文を単
語単位に分割し、前記単語辞書3を参照して各単語が持
つ文法的な情報や訳語を取り出し、結果を後述する単語
情報記憶部5に格納する形態素解析部、5は前記形態素
解析部4が入力文中の各単語が持つ文法的な情報や訳語
とその文法的な情報を格納する単語情報記憶部、6は前
記単語辞書3(単語情報記憶部5)中の品詞に対する優先
度情報を参照して、また前記単語辞書3(単語情報記憶
部5)中の品詞の格納順序から各品詞の優先度を計算し
て入力文に対応する品詞列を優先度の高い順に発生する
品詞列発生部、7は前記品詞列発生部6が出力した品詞
列を記憶する品詞列記憶部、8は入力された英語を解析
するのに必要な英語の文法を記憶した解析ルール辞書、
9は前記解析ルール辞書8を参照して前記原文訳文対管
理テーブル2に記憶された原文を解析する解析実行部、
10は英語と日本語の構文の対応情報や日本語の文法を記
憶した変換・生成ルール辞書、11は前記変換・生成ルー
ル辞書を参照して前記解析実行部が入力文を解析した結
果から、対応する訳文を作り出す変換・生成実行部、12
は前記原文訳文対管理テーブル2に記憶された原文と訳
文を対応づけて表示する表示手段、13は翻訳処理の全過
程において、その実行の制御を司る翻訳実行制御部であ
る。
【0026】図2は本実施例の機械翻訳装置の回路ブロ
ック図であり、14はキーボード、15は中央処理装置(以
下、CPUと略称する。)、16は陰極線管ディスプレイ
(以下、CRTと略称する。)、17はリードオンリーメモ
リ(以下、ROMと略称する。)、18はランダムアクセス
メモリ(以下、RAMと略称する。)である。
【0027】ここで図1に示した入力手段1はキーボー
ド14により、原文訳文対管理テーブル2,単語情報記憶
部5,品詞列記憶部7は、RAM18により、単語辞書
3,解析ルール辞書8,変換・生成ルール辞書10は、R
OM17により、また、形態素解析部4,品詞列発生部
6,解析実行部9,変換・生成実行部11,翻訳実行制御
部13は、CPU15がROM17およびRAM18とデータの
やりとりを行いながらROM17に記憶されたプログラム
を実行することにより、さらに表示手段12はCRT16に
より、夫々実現されている。
【0028】上記のように構成された本発明の一実施例
における英日機械翻訳装置について、以下この動作を図
3のフローチャートに基づき説明する。
【0029】まず、ステップ(以下、Sと略記する)1
で、ユーザが入力手段1から英文を入力する。入力され
た英文は翻訳実行部制御部13によって原文訳文対管理テ
ーブル2に反映される。この時の原文訳文対管理テーブ
ル2の内容の一例を図4に示す。
【0030】ここでは、以下の文例“The commands set
s long part.”が入力されたこととして説明する。
【0031】S2では、ユーザが翻訳を入力手段1から
翻訳を指示したとする。すると、翻訳実行制御部13が形
態素解析部4に対して「入力文の形態素解析をせよ」と
いう命令を出す。形態素解析部4は原文訳文対管理テー
ブル2を参照し、入力文を単語単位に分割し、さらに各
単語に対する品詞や訳詞などの情報を単語辞書3から取
り出して、単語情報記憶部5に格納する。図5は、この
時の単語情報記憶部の内容の一例である。
【0032】S3では、翻訳実行制御部13が品詞列発生
部6に「品詞列を発生せよ」という命令を出す。する
と、品詞列発生部6は各単語に対する品詞の優先度情報
に基づいて優先度の高い品詞列、すなわち、各単語の品
詞毎に持っている優先度情報を各単語に対して加えた合
計値が大きい品詞列から順に発生し、品詞列記憶部7に
格納する。
【0033】図6は、この時の品詞列記憶部7の内容の
一例を示すものである。
【0034】またはS3では、翻訳実行制御部13が品詞
列発生部6に「品詞列を発生せよ」という命令を出す。
すると、品詞列発生部6はおのおのの単語の各品詞の格
納順序に基づいて優先度の高い品詞列、すなわち、各単
語の品詞毎に格納順序から評価値を計算して、これを入
力文中の全ての単語に対して加えた合計値が大きい品詞
列から順に発生し、品詞列記憶部7に格納する。本実施
例では品詞の評価法として (1)先頭の品詞の評価値は2とする。
【0035】(2)2番目の品詞の評価値を1とする。
【0036】(3)最後の品詞の評価値を0とする。
【0037】(4)上記以外(3番目〜最後−1番目)は評
価値1とする。
【0038】という方法をとることにする。
【0039】図7はこの時の品詞列記憶部7の内容の一
例を示すものである。
【0040】S4では、翻訳実行制御部13が品詞列を優
先度の高い方から1つ取り出し、解析実行部9に渡す。
【0041】なお、本実施例では、S3において、入力
文から考えられる全ての品詞列を発生した上で、優先度
の高い方から品詞列記憶部7に格納していくように説明
しているが、さらに効率的な処理を行うために、評価値
の高い品詞列だけを優先的に発生させ(たとえば、上の
例では評価値10)、優先度の高い品詞列で、解析を行っ
て(上の例では評価値10の品詞列)、全ての品詞列に対し
て解析が失敗した場合、すなわち、S4において、品詞
列記憶部7が空になった時点で、品詞列発生部6に「次
に評価値の高い品詞列(上の例では評価値9の品詞列)を
発生せよ」という指令を送る方法をとると、品詞列発生
にかかる時間が短縮できるので、より効率的である。な
ぜなら、通常「文」として解釈できる品詞列(上の例で
は評価値10の品詞列)を見つけた時点で、「解」が得ら
れたわけであるから、その品詞列より低い評価値を持つ
品詞列(上の例では評価値9以下の品詞列)は必要なくな
るからである。
【0042】S5では、翻訳実行制御部13が解析実行部
9に「いま渡した品詞列で解析を試みよ」という命令を
出す。すると、解析実行部9は解析ルール辞書8を参照
して、いま与えられた品詞列から「文」としての解釈を
組み立てようと試みる。そして、解析が成功すれば、す
なわち「文」としての解釈が成立すれば、そのことを翻
訳実行制御部13に伝えて、S6に進む。また、解析に失
敗した場合は、そのことを翻訳実行制御部13に伝えて、
S4に戻る。
【0043】図8は解析ルール辞書8の内容の一部を示
したものである。いま、第1の品詞列が「冠詞(the),
名詞(command),名詞(set),形容詞(long),名詞(par
t)」であったとして説明する。この場合、解析実行部9
は「この品詞列では「文」としての解釈はどの様な解析
ルールの組合せによっても得られない」と判断するの
で、「解析失敗」を翻訳実行制御部13を伝え、S4へ進
む。
【0044】S4では、翻訳実行制御部13が再び、いま
記憶されている品詞列の中で優先度の最も高い品詞列を
品詞列記憶部7から取り出し、解析実行部9に渡す。
【0045】今度は品詞列「冠詞(the),名詞(comman
d),動詞(set),形容詞(long),名詞(part)」が取り出
される。そして、実行はS5に進む。
【0046】S5では、解析実行部9が、いま渡された
品詞列で解析を試みる。今度は、この品詞列でうまく
「文」を組み立てることができるので、「解析成功」を
翻訳実行制御部13に伝えて、S6に進む。この時、同時
に解析結果を翻訳実行制御部13に返すものとする。上の
例では、「the command の部分が主語で、long part の
部分が目的語で、set が述語である文」という解釈を翻
訳実行制御部13に返す。
【0047】S6では、翻訳実行制御部13が受け取った
解析結果を変換・生成実行部11に渡す。変換・生成実行
部11は、変換・生成ルール辞書10を参照し、解析結果に
基づいて対応する訳文を生成する。そして、生成した訳
文を翻訳実行制御部13に返して、S7に進む。上の例で
は、「その命令は長い部分をセットする。」という訳語
を生成して、翻訳実行制御部13に返す。
【0048】S8では、翻訳実行制御部13が変換・生成
実行部11から受け取った訳文を表示手段12に表示する。
図9は、この時の原文を翻訳結果を示す画面の様子であ
る。
【0049】以上、英語を日本語に機械翻訳する場合に
ついて説明したが、その他の外国語についても同様に実
施できることはもちろんである。
【0050】
【発明の効果】以上説明したように、本発明の機械翻訳
装置は、正解の可能性が高い品詞列を品詞列発生部でも
って優先的に発生させ、不必要な解析を行わずにすむた
め、効率よく、かつ高精度の翻訳を実現できる。
【図面の簡単な説明】
【図1】本発明の一実施例における機械翻訳装置の機能
ブロック図である。
【図2】図1の回路ブロック図である。
【図3】図1の動作を説明するフローチャートである。
【図4】図1の原文訳文対管理テーブルの内容を示す一
例図である。
【図5】図1の単語情報記憶部の内容を示す一例図であ
る。
【図6】図1の品詞列記憶部の内容を示す一例図であ
る。
【図7】図1の品詞列記憶部の内容を示す一例図であ
る。
【図8】図1の解析ルール辞書の内容の一部を示す図で
ある。
【図9】図1の表示画面の様子を示す図である。
【符号の説明】
1…入力手段、 2…原文訳文対管理テーブル、 3…
単語辞書、 4…形態素解析部、 5…単語情報記憶
部、 6…品詞列発生部、 7…品詞列記憶部、8…解
析ルール辞書、 9…解析実行部、 10…変換・生成ル
ール辞書、 11…変換・生成実行部、 12…表示手段、
13…翻訳実行制御部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 原文の入力と翻訳を指示する手段を有す
    る入力手段と、前記入力手段により入力された原文と翻
    訳結果とを対応づけて記憶する原文訳文対管理テーブル
    と、英語等を解析するのに必要な英単語等に関する品詞
    などの文法的情報、各品詞毎の優先度情報、この英単語
    等に対する訳語、および、訳語の文法的な情報を格納
    し、または単語が複数の品詞の解釈を持つ場合には各品
    詞の優先度順に品詞を格納した単語辞書と、前記原文訳
    文対管理テーブル中の原文を単語単位に分割し、前記単
    語辞書を参照して各単語が持つ文法的な情報や訳語を取
    り出し、結果を後述する単語情報記憶部に格納する形態
    素解析部と、前記形態素解析部が入力文中の各単語が持
    つ文法的な情報や訳語とその文法的な情報を格納する単
    語情報記憶部と、入力された英語等を解析するのに必要
    な英語等の文法を記憶した解析ルール辞書と、前記解析
    ルール辞書を参照して前記原文訳文対管理テーブルに記
    憶された原文を解析する解析実行部と、英語等と日本語
    の構文の対応情報や日本語の文法を記憶した変換・生成
    ルール辞書と、前記変換・生成ルール辞書を参照して前
    記解析実行部が入力文を解析した結果から、対応する訳
    文を作り出す変換・生成実行部と、前記原文訳文対管理
    テーブルに記憶された原文と訳文を対応づけて表示する
    表示手段と、翻訳処理の全過程において、その実行の制
    御を司る翻訳実行制御部とを備えた機械翻訳装置に、前
    記単語辞書中の品詞に対する優先度情報を参照して、ま
    たは、前記単語辞書中の品詞の格納順序から各品詞の優
    先度を計算して入力文に対応する品詞列を優先度の高い
    順に発生する品詞列発生部と、前記品詞列発生部が出力
    した品詞列を記憶する品詞列記憶部と、を設けたことを
    特徴とする機械翻訳装置。
JP4120557A 1992-05-13 1992-05-13 機械翻訳装置 Pending JPH05314170A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4120557A JPH05314170A (ja) 1992-05-13 1992-05-13 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4120557A JPH05314170A (ja) 1992-05-13 1992-05-13 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH05314170A true JPH05314170A (ja) 1993-11-26

Family

ID=14789260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4120557A Pending JPH05314170A (ja) 1992-05-13 1992-05-13 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH05314170A (ja)

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
EP0176858B1 (en) Translation system
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPS638864A (ja) 翻訳装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
JPH0332106B2 (ja)
JPH05314170A (ja) 機械翻訳装置
JPS6190269A (ja) 翻訳方式
JPS6337471A (ja) 翻訳方法及び装置
JPS61260366A (ja) 学習機能付機械翻訳システム
JP2859661B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JP3530568B2 (ja) 文章処理装置
JP3244286B2 (ja) 翻訳処理装置
JP2719453B2 (ja) 機械翻訳装置
JPH03244077A (ja) 翻訳支援装置
US20100106480A1 (en) Character data processing method, computer program, and character data processing system
JP2742059B2 (ja) 翻訳用辞書編集装置
JPS61260367A (ja) 機械翻訳システム
JPH0332105B2 (ja)
JPH04296969A (ja) 機械翻訳装置
JPH05165885A (ja) 利用者によるカンマの用法指定機能を備えた英日機械翻訳装置
JPH04130577A (ja) 自然言語処理装置
JPH07141374A (ja) 機械翻訳装置