JPH08161335A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH08161335A JPH08161335A JP6298659A JP29865994A JPH08161335A JP H08161335 A JPH08161335 A JP H08161335A JP 6298659 A JP6298659 A JP 6298659A JP 29865994 A JP29865994 A JP 29865994A JP H08161335 A JPH08161335 A JP H08161335A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- grammar rule
- application probability
- rule
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【構成】 文法規則適用確率メモリ6cに格納された各
文法規則の適用確率に基づいて構文構造の優先度を算出
し、文法規則適用確率算出部5dが、ユーザが最適であ
ると選択した翻訳文の基となった構文構造に適用された
各文法規則の適用回数を、上記文法規則適用確率メモリ
6cに格納された各文法規則の適用確率に反映させる。 【効果】 人間の翻訳者が構文構造の適切さに関して経
験的に持っている知識を装置に学習させることができ、
同一の原文から複数の構文構造が得られる場合に、最適
な構文構造をより適切に選択することが可能となり、翻
訳効率の向上を図ることができる。
文法規則の適用確率に基づいて構文構造の優先度を算出
し、文法規則適用確率算出部5dが、ユーザが最適であ
ると選択した翻訳文の基となった構文構造に適用された
各文法規則の適用回数を、上記文法規則適用確率メモリ
6cに格納された各文法規則の適用確率に反映させる。 【効果】 人間の翻訳者が構文構造の適切さに関して経
験的に持っている知識を装置に学習させることができ、
同一の原文から複数の構文構造が得られる場合に、最適
な構文構造をより適切に選択することが可能となり、翻
訳効率の向上を図ることができる。
Description
【0001】
【産業上の利用分野】本発明は、例えば、入力された英
語の文章を日本語に翻訳して出力するような、自然言語
を翻訳する機械翻訳装置等に関するものである。
語の文章を日本語に翻訳して出力するような、自然言語
を翻訳する機械翻訳装置等に関するものである。
【0002】
【従来の技術】従来、例えば、英語を日本語に翻訳する
翻訳装置のように、ある言語(原言語)で書かれた文書
を別の言語(目標言語)に翻訳するための機械翻訳装置
が知られている。
翻訳装置のように、ある言語(原言語)で書かれた文書
を別の言語(目標言語)に翻訳するための機械翻訳装置
が知られている。
【0003】上記の機械翻訳装置は、入力された原言語
を、内部に記憶している辞書を用いて、単語等の形態素
に分割すると共に、その形態素の品詞情報等を得て、原
言語の文を構成する単語間の係り受けを解析して構文構
造を決定し、上記構文構造を目標言語の構文構造に変換
し、目標言語の構文構造から目標言語の表層文を生成す
ることによって翻訳処理を行うものである。
を、内部に記憶している辞書を用いて、単語等の形態素
に分割すると共に、その形態素の品詞情報等を得て、原
言語の文を構成する単語間の係り受けを解析して構文構
造を決定し、上記構文構造を目標言語の構文構造に変換
し、目標言語の構文構造から目標言語の表層文を生成す
ることによって翻訳処理を行うものである。
【0004】しかし、人間の翻訳者であれば、単語の意
味や前後関係等からほぼ経験的に判断することによっ
て、原文に対する翻訳文を比較的容易に一意に決定する
ことができるが、装置が翻訳を行う際には、ほとんどの
場合において、原文に対する翻訳文は複数種類が作成さ
れ得る。これは、例えば、前記のように、品詞情報に基
づいて単語間の係り受けを解析して原言語の構文構造を
作成する際に、複数の品詞を有する単語が原言語の文中
に存在する場合には、その単語と他の単語との係り受け
を解析するために適用すべき文法規則が複数種類存在
し、ひいては、作成される構文構造も複数種類になるこ
とによる。
味や前後関係等からほぼ経験的に判断することによっ
て、原文に対する翻訳文を比較的容易に一意に決定する
ことができるが、装置が翻訳を行う際には、ほとんどの
場合において、原文に対する翻訳文は複数種類が作成さ
れ得る。これは、例えば、前記のように、品詞情報に基
づいて単語間の係り受けを解析して原言語の構文構造を
作成する際に、複数の品詞を有する単語が原言語の文中
に存在する場合には、その単語と他の単語との係り受け
を解析するために適用すべき文法規則が複数種類存在
し、ひいては、作成される構文構造も複数種類になるこ
とによる。
【0005】このような場合に、原言語の文から作成さ
れ得るすべての構文構造に基づいて翻訳文を生成して出
力することは、適切な翻訳からあまりにもかけ離れた翻
訳文も出力されることとなり、ユーザがこれらの翻訳文
から適切なものを選択する手間を増大させるので、翻訳
効率の点からも好ましいことではない。
れ得るすべての構文構造に基づいて翻訳文を生成して出
力することは、適切な翻訳からあまりにもかけ離れた翻
訳文も出力されることとなり、ユーザがこれらの翻訳文
から適切なものを選択する手間を増大させるので、翻訳
効率の点からも好ましいことではない。
【0006】これに対して、例えば、特開平6−195
377号公報には、同一の原文から複数種類の翻訳文が
得られ、その内の1個の翻訳文を最適な翻訳文としてユ
ーザが選択した場合に、上記の複数種類の翻訳文のそれ
ぞれ基となっている複数種類の構文構造を互いに比較
し、ユーザに選択された翻訳文の基となった構文構造の
特徴点をルール化して記憶手段に記憶することによっ
て、最適とされる構文構造を学習し、同一の原文から複
数の構文構造が得られた場合には、過去に上記のように
学習したルールに基づいて、複数種類の翻訳文の出力順
位等を決定する構成が開示されている。さらに、複数の
構文どうしが競合した場合に、他の構文構造に対してど
の程度の強さで優先するかを示す優先度を各構文構造に
対して定め、この優先度に従って適用すべき構文構造を
決定する方法が提案されている。
377号公報には、同一の原文から複数種類の翻訳文が
得られ、その内の1個の翻訳文を最適な翻訳文としてユ
ーザが選択した場合に、上記の複数種類の翻訳文のそれ
ぞれ基となっている複数種類の構文構造を互いに比較
し、ユーザに選択された翻訳文の基となった構文構造の
特徴点をルール化して記憶手段に記憶することによっ
て、最適とされる構文構造を学習し、同一の原文から複
数の構文構造が得られた場合には、過去に上記のように
学習したルールに基づいて、複数種類の翻訳文の出力順
位等を決定する構成が開示されている。さらに、複数の
構文どうしが競合した場合に、他の構文構造に対してど
の程度の強さで優先するかを示す優先度を各構文構造に
対して定め、この優先度に従って適用すべき構文構造を
決定する方法が提案されている。
【0007】
【発明が解決しようとする課題】しかしながら、上記公
報に開示された構成では、ユーザが最適と考える構文構
造が、ユーザの選択によって記憶手段に一旦記憶される
と、当該構造の出現頻度に関係なく優先すべき構文構造
として学習されてしまうため、学習の内容が一般的なも
のでなかった場合、かえって適切でない翻訳文を出力す
る結果となるという問題点を有している。また、上記公
報に開示された構成では、上記のように優先度を用いた
構文構造決定の方法を提案した段階にとどまり、他の構
文構造に対する優先度を各構文構造に対してどのように
設定するかについては技術的に未解決のままである。
報に開示された構成では、ユーザが最適と考える構文構
造が、ユーザの選択によって記憶手段に一旦記憶される
と、当該構造の出現頻度に関係なく優先すべき構文構造
として学習されてしまうため、学習の内容が一般的なも
のでなかった場合、かえって適切でない翻訳文を出力す
る結果となるという問題点を有している。また、上記公
報に開示された構成では、上記のように優先度を用いた
構文構造決定の方法を提案した段階にとどまり、他の構
文構造に対する優先度を各構文構造に対してどのように
設定するかについては技術的に未解決のままである。
【0008】本発明の目的は、原文から得られる複数の
構文構造に基づいた翻訳文を出力する際に、優先して出
力すべき翻訳文をより適切に決定できる機械翻訳装置を
実現することである。
構文構造に基づいた翻訳文を出力する際に、優先して出
力すべき翻訳文をより適切に決定できる機械翻訳装置を
実現することである。
【0009】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の請求項1記載の機械翻訳装置は、辞書お
よび文法規則に基づいて原言語の文を解析して構文構造
を求める構文解析手段と、上記構文構造から目標言語の
翻訳文を生成する変換・生成手段と、生成された翻訳文
を出力する出力手段とを備え、原言語の文書を目標言語
に翻訳して出力する機械翻訳装置において、各文法規則
の適用確率を格納する記憶手段と、上記構文解析手段が
解析を行う際に適用した文法規則と、上記記憶手段に格
納されている各文法規則の適用確率とに基づいて、各構
文構造の優先度を算出する構文優先度算出手段と、上記
出力手段における翻訳文の出力順位を、各翻訳文の基と
なった構文構造の優先度に基づいて制御する制御手段
と、最も適切な翻訳文としてユーザが選択した翻訳文の
基となった構文構造を上記構文解析手段が求める際に適
用された各文法規則の適用回数を、上記記憶手段に格納
されている各文法規則の適用確率に反映させる適用確率
更新手段とを備えていることを特徴としている。
めに、本発明の請求項1記載の機械翻訳装置は、辞書お
よび文法規則に基づいて原言語の文を解析して構文構造
を求める構文解析手段と、上記構文構造から目標言語の
翻訳文を生成する変換・生成手段と、生成された翻訳文
を出力する出力手段とを備え、原言語の文書を目標言語
に翻訳して出力する機械翻訳装置において、各文法規則
の適用確率を格納する記憶手段と、上記構文解析手段が
解析を行う際に適用した文法規則と、上記記憶手段に格
納されている各文法規則の適用確率とに基づいて、各構
文構造の優先度を算出する構文優先度算出手段と、上記
出力手段における翻訳文の出力順位を、各翻訳文の基と
なった構文構造の優先度に基づいて制御する制御手段
と、最も適切な翻訳文としてユーザが選択した翻訳文の
基となった構文構造を上記構文解析手段が求める際に適
用された各文法規則の適用回数を、上記記憶手段に格納
されている各文法規則の適用確率に反映させる適用確率
更新手段とを備えていることを特徴としている。
【0010】請求項2記載の機械翻訳装置は、請求項1
記載の機械翻訳装置において、ユーザが文書の種類を入
力する文種入力手段をさらに備えていると共に、各文法
規則の適用確率が文書の種類別に設けられて上記記憶手
段に格納されており、上記文種入力手段から入力された
文書の種類に基づいて、上記構文優先度算出手段および
適用確率更新手段が、上記記憶手段に格納されている各
文法規則の適用確率を選択することを特徴としている。
記載の機械翻訳装置において、ユーザが文書の種類を入
力する文種入力手段をさらに備えていると共に、各文法
規則の適用確率が文書の種類別に設けられて上記記憶手
段に格納されており、上記文種入力手段から入力された
文書の種類に基づいて、上記構文優先度算出手段および
適用確率更新手段が、上記記憶手段に格納されている各
文法規則の適用確率を選択することを特徴としている。
【0011】
【作用】請求項1記載の構成によれば、入力された原言
語の文を構文解析手段が解析する際に適用した文法規則
と、記憶手段に格納されている各文法規則の適用確率と
に基づいて、構文優先度算出手段が各構文構造の優先度
を算出し、例えば、複数の構文構造の優先度を互いに比
較して一番優先度が高い構文構造から先に出力する等の
ように、出力手段における翻訳文の出力順位を制御手段
が制御する。さらに、適用確率更新手段が、最も適切な
翻訳文としてユーザが選択した翻訳文の基となった構文
構造を上記構文解析手段が求める際に適用した各文法規
則の適用回数を、記憶手段に格納されている各文法規則
の適用確率に反映させる。
語の文を構文解析手段が解析する際に適用した文法規則
と、記憶手段に格納されている各文法規則の適用確率と
に基づいて、構文優先度算出手段が各構文構造の優先度
を算出し、例えば、複数の構文構造の優先度を互いに比
較して一番優先度が高い構文構造から先に出力する等の
ように、出力手段における翻訳文の出力順位を制御手段
が制御する。さらに、適用確率更新手段が、最も適切な
翻訳文としてユーザが選択した翻訳文の基となった構文
構造を上記構文解析手段が求める際に適用した各文法規
則の適用回数を、記憶手段に格納されている各文法規則
の適用確率に反映させる。
【0012】これにより、1つの原文から得られる複数
種類の翻訳文から最も適切な翻訳文を選択する際のユー
ザの判断が、文法規則の適用確率に反映されて記憶手段
に格納される。このため、翻訳処理を行う度に、構文構
造の適切さに関して人間の翻訳者が経験的に持っている
知識が蓄積的に装置に学習されることとなる。この結
果、複数種類の翻訳文から、最も適切な翻訳文が優先的
に選択されて出力される可能性が高くなり、翻訳処理の
効率の向上を図ることができる。
種類の翻訳文から最も適切な翻訳文を選択する際のユー
ザの判断が、文法規則の適用確率に反映されて記憶手段
に格納される。このため、翻訳処理を行う度に、構文構
造の適切さに関して人間の翻訳者が経験的に持っている
知識が蓄積的に装置に学習されることとなる。この結
果、複数種類の翻訳文から、最も適切な翻訳文が優先的
に選択されて出力される可能性が高くなり、翻訳処理の
効率の向上を図ることができる。
【0013】請求項2記載の構成によれば、構文優先度
算出手段および適用確率更新手段が、文書の種類別に記
憶手段に格納されている各文法規則の適用確率から、文
種入力手段からユーザが入力した文書の種類に対応する
適用確率を選択する。
算出手段および適用確率更新手段が、文書の種類別に記
憶手段に格納されている各文法規則の適用確率から、文
種入力手段からユーザが入力した文書の種類に対応する
適用確率を選択する。
【0014】これにより、例えば、技術マニュアルや新
聞記事等のように、頻繁に使用される構文構造が異なっ
ていると思われる複数種類の文書を同一の翻訳装置で翻
訳する場合においても、各文書の種類に応じて適切な翻
訳文が優先的に出力される可能性が高くなり、翻訳処理
の効率の向上を図ることができる。
聞記事等のように、頻繁に使用される構文構造が異なっ
ていると思われる複数種類の文書を同一の翻訳装置で翻
訳する場合においても、各文書の種類に応じて適切な翻
訳文が優先的に出力される可能性が高くなり、翻訳処理
の効率の向上を図ることができる。
【0015】
〔実施例1〕本発明の一実施例について図1ないし図
9、および図12に基づいて説明すれば、以下の通りで
ある。なお、本実施例では、原言語が英語であり、目的
言語が日本語であるような機械翻訳装置を例にあげて説
明する。
9、および図12に基づいて説明すれば、以下の通りで
ある。なお、本実施例では、原言語が英語であり、目的
言語が日本語であるような機械翻訳装置を例にあげて説
明する。
【0016】本実施例における機械翻訳装置は、図1に
示すように、以下の各部の動作を制御する制御手段とし
てのCPU(中央処理装置)1と、RAM等からなるメ
インメモリ7と、原言語の単語列を入力するためのアル
ファベットキーや各種命令を入力するためのコマンドキ
ー等を備えたキーボード等の入力部2(文種入力手段)
と、入力された単語列を原言語から目的言語へ翻訳する
処理を行う翻訳部5と、辞書および文法規則等を記憶し
ているハードディスク6と、目的言語に翻訳された文等
を出力するための、例えばCRT(陰極線管)やLCD
(液晶表示装置)等で構成される出力部3とを備えてい
る。上記の入力部2、翻訳部5、ハードディスク6、メ
インメモリ7および出力部3は、データや制御信号等を
伝達するバスライン4によって互いに接続されており、
上記CPU1の制御に基づいて動作する。
示すように、以下の各部の動作を制御する制御手段とし
てのCPU(中央処理装置)1と、RAM等からなるメ
インメモリ7と、原言語の単語列を入力するためのアル
ファベットキーや各種命令を入力するためのコマンドキ
ー等を備えたキーボード等の入力部2(文種入力手段)
と、入力された単語列を原言語から目的言語へ翻訳する
処理を行う翻訳部5と、辞書および文法規則等を記憶し
ているハードディスク6と、目的言語に翻訳された文等
を出力するための、例えばCRT(陰極線管)やLCD
(液晶表示装置)等で構成される出力部3とを備えてい
る。上記の入力部2、翻訳部5、ハードディスク6、メ
インメモリ7および出力部3は、データや制御信号等を
伝達するバスライン4によって互いに接続されており、
上記CPU1の制御に基づいて動作する。
【0017】上記ハードディスク6は、辞書を格納して
いる辞書メモリ6aと、原文を解析して構文構造を求め
る際に適用すると、上記文法規則のそれぞれの適用確率
を格納している文法規則適用確率メモリ6c(記憶手
段)と、原文から得られた構文構造を目的言語の構文構
造に変換する際に適用する変換規則を格納している変換
規則メモリ6dと、目的言語の構文構造から目的言語の
文を生成する際に適用する生成規則を格納している生成
規則メモリ6eとを含んでいる。
いる辞書メモリ6aと、原文を解析して構文構造を求め
る際に適用すると、上記文法規則のそれぞれの適用確率
を格納している文法規則適用確率メモリ6c(記憶手
段)と、原文から得られた構文構造を目的言語の構文構
造に変換する際に適用する変換規則を格納している変換
規則メモリ6dと、目的言語の構文構造から目的言語の
文を生成する際に適用する生成規則を格納している生成
規則メモリ6eとを含んでいる。
【0018】上記翻訳部5は、同図に示すように、原言
語の文に含まれる各単語の訳語および品詞情報等を得る
ための辞書引き・形態素解析部5aと、上記品詞情報お
よび文法規則に基づいて、構文構造、すなわち各単語間
の係り受け関係、を示す構文解析木を得るための構文解
析部5bと、入力された原文に対する構文解析木の構造
を目的語に対する構文解析木の構造に変換する変換部5
gと、最終的に目標言語の文を生成する生成部5hと、
上記入力部2に出力された翻訳結果をユーザの指示にし
たがって修正する後編集部5iとを含んでいる。
語の文に含まれる各単語の訳語および品詞情報等を得る
ための辞書引き・形態素解析部5aと、上記品詞情報お
よび文法規則に基づいて、構文構造、すなわち各単語間
の係り受け関係、を示す構文解析木を得るための構文解
析部5bと、入力された原文に対する構文解析木の構造
を目的語に対する構文解析木の構造に変換する変換部5
gと、最終的に目標言語の文を生成する生成部5hと、
上記入力部2に出力された翻訳結果をユーザの指示にし
たがって修正する後編集部5iとを含んでいる。
【0019】上記構文解析部5bは、ハードディスク6
の文法規則適用確率メモリ6cを検索する文法規則適用
確率検索部5cと、文法規則の適用確率を計算する文法
規則適用確率算出部5d(適用確率更新手段)と、算出
された適用確率をハードディスク6の文法規則適用確率
メモリ6cへ格納する文法規則適用確率記録部5eと、
文法規則適用確率に基づいて各構文解析木の優先度、す
なわち各構文解析木の適切さを算出する候補選択部5f
(構文優先度算出手段)とによって構成されている。
の文法規則適用確率メモリ6cを検索する文法規則適用
確率検索部5cと、文法規則の適用確率を計算する文法
規則適用確率算出部5d(適用確率更新手段)と、算出
された適用確率をハードディスク6の文法規則適用確率
メモリ6cへ格納する文法規則適用確率記録部5eと、
文法規則適用確率に基づいて各構文解析木の優先度、す
なわち各構文解析木の適切さを算出する候補選択部5f
(構文優先度算出手段)とによって構成されている。
【0020】ここで、「I have both pens and pencil
s.」という英文を日本語文に翻訳する際の動作につい
て、図1ないし図3を参照しながら説明する。
s.」という英文を日本語文に翻訳する際の動作につい
て、図1ないし図3を参照しながら説明する。
【0021】まず、入力部2から上記の英文が入力さ
れ、CPU1の制御の下でメインメモリ7の原文バッフ
ァ7aへ一旦格納される。翻訳部5は、CPU1の制御
の下で、原文バッファ7aから上記英文を取り出し、辞
書引き・形態素解析部5aによってハードディスク6の
辞書メモリ6aを参照し、各単語の訳語と品詞情報とを
得てメインメモリ7の辞書引きバッファ7bに格納す
る。
れ、CPU1の制御の下でメインメモリ7の原文バッフ
ァ7aへ一旦格納される。翻訳部5は、CPU1の制御
の下で、原文バッファ7aから上記英文を取り出し、辞
書引き・形態素解析部5aによってハードディスク6の
辞書メモリ6aを参照し、各単語の訳語と品詞情報とを
得てメインメモリ7の辞書引きバッファ7bに格納す
る。
【0022】この時、辞書メモリ6aから得られる各単
語に対する品詞情報は、以下の通りとなる。すなわち、
「I 」は名詞(pron)、「have」は動詞(verb)、「 b
oth」は限定詞(det )と接続詞(conj)と名詞(pro
n)との内のいずれかであり、「pens」は名詞(pro
n)、「 and」は接続詞(conj)、「 pencils」は名詞
(pron)、「.」は終止符(end )である。
語に対する品詞情報は、以下の通りとなる。すなわち、
「I 」は名詞(pron)、「have」は動詞(verb)、「 b
oth」は限定詞(det )と接続詞(conj)と名詞(pro
n)との内のいずれかであり、「pens」は名詞(pro
n)、「 and」は接続詞(conj)、「 pencils」は名詞
(pron)、「.」は終止符(end )である。
【0023】次に、翻訳部5の構文解析部5bが、上記
のように得られた品詞情報と、ハードディスク6の解析
規則メモリ6bに格納されている文法規則とに基づい
て、各単語間の係り受け関係を示す構文解析木を求めて
メインメモリ7の構文解析木バッファ7cに格納する。
のように得られた品詞情報と、ハードディスク6の解析
規則メモリ6bに格納されている文法規則とに基づい
て、各単語間の係り受け関係を示す構文解析木を求めて
メインメモリ7の構文解析木バッファ7cに格納する。
【0024】この構文解析木は、次のようにして求めら
れる。すなわち、解析規則メモリ6bには、図2に示す
文法規則が格納されている。同図に示すように、各文法
規則には、1から19までの文法規則番号が付けられて
おり、例えば、一番上の行に示されている文法規則番号
が1の文法規則(以下、規則R1のように表記する)
は、『文章(SS)は、文(S )と終止符(end )とから
成っている。』ということを表わす規則である。
れる。すなわち、解析規則メモリ6bには、図2に示す
文法規則が格納されている。同図に示すように、各文法
規則には、1から19までの文法規則番号が付けられて
おり、例えば、一番上の行に示されている文法規則番号
が1の文法規則(以下、規則R1のように表記する)
は、『文章(SS)は、文(S )と終止符(end )とから
成っている。』ということを表わす規則である。
【0025】なお、同図において、規則R19の下部に
示すように、これらの文法規則中に例えば「NP」、「V
P」等のように大文字で示されている記号は、非終端記
号と呼び、同図中に示す文法規則に従ってさらに解析す
ることが可能な構造であることを示している。一方、例
えば「noun」、「conj」等のように小文字で示されてい
る記号は、終端記号と呼び、これ以上は解析できない品
詞等に対応している。つまり、非終端記号を、同図に示
す文法規則に従って終端記号へと分解していくことによ
り、構文解析木が求められるわけである。
示すように、これらの文法規則中に例えば「NP」、「V
P」等のように大文字で示されている記号は、非終端記
号と呼び、同図中に示す文法規則に従ってさらに解析す
ることが可能な構造であることを示している。一方、例
えば「noun」、「conj」等のように小文字で示されてい
る記号は、終端記号と呼び、これ以上は解析できない品
詞等に対応している。つまり、非終端記号を、同図に示
す文法規則に従って終端記号へと分解していくことによ
り、構文解析木が求められるわけである。
【0026】上記の英文を図2に示す文法規則に従って
解析した結果の構文解析木の一例は、図3に示すように
なる。同図中で大文字で示す非終端記号の横のかっこ内
には、その非終端記号を解析するのに用いた文法規則を
示している。例えば、同図の一番上に示した文章(SS)
は、図2に示す規則R1に従って、文(S )と終止符
(end )とに分解され、上記文章(SS)の左下に示した
文(S )は、規則R2に従って、名詞句(NP)と動詞句
(VP)とにさらに分解されたことを示す。
解析した結果の構文解析木の一例は、図3に示すように
なる。同図中で大文字で示す非終端記号の横のかっこ内
には、その非終端記号を解析するのに用いた文法規則を
示している。例えば、同図の一番上に示した文章(SS)
は、図2に示す規則R1に従って、文(S )と終止符
(end )とに分解され、上記文章(SS)の左下に示した
文(S )は、規則R2に従って、名詞句(NP)と動詞句
(VP)とにさらに分解されたことを示す。
【0027】このようにして、すべての非終端記号が、
図3に略楕円形で囲んで示す終端記号に分解された様子
を示す構文解析木は、構造解析木バッファ7cに一旦格
納される。その後、変換部5gは、構文解析木バッファ
7cから構文解析木を取り出して、取り出した構文解析
木を、日本語の文法規則に従って日本文に対する構文解
析木に変換する。続いて、生成部5hが、適切な助詞
「は」等を補うことにより、図3の下部に示すような、
「私は、両方のペンと鉛筆を持っている。」という翻訳
文を求めて、メインメモリ7の訳文バッファ7fに格納
する。
図3に略楕円形で囲んで示す終端記号に分解された様子
を示す構文解析木は、構造解析木バッファ7cに一旦格
納される。その後、変換部5gは、構文解析木バッファ
7cから構文解析木を取り出して、取り出した構文解析
木を、日本語の文法規則に従って日本文に対する構文解
析木に変換する。続いて、生成部5hが、適切な助詞
「は」等を補うことにより、図3の下部に示すような、
「私は、両方のペンと鉛筆を持っている。」という翻訳
文を求めて、メインメモリ7の訳文バッファ7fに格納
する。
【0028】以上のような動作によって、上記の英文の
翻訳文が求められたわけであるが、「 both 」という単
語が複数の品詞を持つことから、上記の英文に対する構
文解析木として、前記の図3に示した構文解析木の他
に、図4に示すような構文解析木を得ることができる。
このように、原文に対する翻訳文は必ずしも1種類であ
るとは限らず、複数の候補から適切な翻訳文を選択する
ことが必要となる。
翻訳文が求められたわけであるが、「 both 」という単
語が複数の品詞を持つことから、上記の英文に対する構
文解析木として、前記の図3に示した構文解析木の他
に、図4に示すような構文解析木を得ることができる。
このように、原文に対する翻訳文は必ずしも1種類であ
るとは限らず、複数の候補から適切な翻訳文を選択する
ことが必要となる。
【0029】以下に、上記のように複数種類の翻訳文の
候補が存在する場合の、最適な翻訳文を選択するための
動作について、図5のフローチャートを参照しながら説
明する。
候補が存在する場合の、最適な翻訳文を選択するための
動作について、図5のフローチャートを参照しながら説
明する。
【0030】まず、翻訳対象となる原文が入力部2から
入力される(ステップ1、以下、S1と表記する)。あ
るいは、入力されて一旦ハードディスク6へ格納されて
いた原文を読み出してもよい。
入力される(ステップ1、以下、S1と表記する)。あ
るいは、入力されて一旦ハードディスク6へ格納されて
いた原文を読み出してもよい。
【0031】続いて、ハードディスク6の文法規則適用
確率メモリ6cに格納された文法規則適用確率を、メイ
ンメモリ7の文法規則適用確率バッファ7dのバッファ
Aへ読み込む(S2)。
確率メモリ6cに格納された文法規則適用確率を、メイ
ンメモリ7の文法規則適用確率バッファ7dのバッファ
Aへ読み込む(S2)。
【0032】上記の文法規則適用確率とは、非終端記号
を解析する際に、その非終端記号に適用可能な文法規則
すべてに対して、ある文法規則が適用される確率を示す
ものである。すなわち、図2に示すように、例えば、非
終端記号NPに適用される文法規則は、規則R3ないし規
則R8の6種類であるので、図6に示すように、規則R
3ないし規則R8の文法規則適用確率は1÷6≒0.1
6となる。また、非終端記号NP1 に適用される文法規則
である規則R9および規則R10の文法規則適用確率は
それぞれ1÷2=0.50であり、その他の文法規則に
対する確率も同様にして図6に示すように求めることが
できる。
を解析する際に、その非終端記号に適用可能な文法規則
すべてに対して、ある文法規則が適用される確率を示す
ものである。すなわち、図2に示すように、例えば、非
終端記号NPに適用される文法規則は、規則R3ないし規
則R8の6種類であるので、図6に示すように、規則R
3ないし規則R8の文法規則適用確率は1÷6≒0.1
6となる。また、非終端記号NP1 に適用される文法規則
である規則R9および規則R10の文法規則適用確率は
それぞれ1÷2=0.50であり、その他の文法規則に
対する確率も同様にして図6に示すように求めることが
できる。
【0033】ただし、上記の図6に示された文法規則適
用確率は、各文法規則に優先度が付けられていない初期
状態における確率であり、本実施例の文法規則適用確率
は、以降に説明するように、翻訳結果をユーザが選択す
る度にその選択を学習して優先度が付けられるように更
新されてゆく。
用確率は、各文法規則に優先度が付けられていない初期
状態における確率であり、本実施例の文法規則適用確率
は、以降に説明するように、翻訳結果をユーザが選択す
る度にその選択を学習して優先度が付けられるように更
新されてゆく。
【0034】ユーザから翻訳の実行指示が入力されると
(S3)、原文の1文がメインメモリ7の原文バッファ
7aにセットされる(S4)。なお、ここで、上記の原
文の1文として、前記の英文「I have both pens and p
encils.」がセットされたものとする。
(S3)、原文の1文がメインメモリ7の原文バッファ
7aにセットされる(S4)。なお、ここで、上記の原
文の1文として、前記の英文「I have both pens and p
encils.」がセットされたものとする。
【0035】次に、原文バッファ7aに読み込まれた原
文の各単語に対して、辞書引き・形態素解析部5aがハ
ードディスク6の辞書メモリ6aを参照することによ
り、訳語や品詞情報を取得して辞書引きバッファ7bへ
格納する(S5)。
文の各単語に対して、辞書引き・形態素解析部5aがハ
ードディスク6の辞書メモリ6aを参照することによ
り、訳語や品詞情報を取得して辞書引きバッファ7bへ
格納する(S5)。
【0036】上記S5に続く、図5で点線で囲んで示す
S6ないしS10は、図1に示す構文解析部5bにおい
て行われる処理である。まず、前述したように、上記英
文に対する構文解析木を求める処理が行われ、求められ
た図3および図4に示す2種類の構文解析木は、構文解
析木バッファ7cへ格納される(S6)。
S6ないしS10は、図1に示す構文解析部5bにおい
て行われる処理である。まず、前述したように、上記英
文に対する構文解析木を求める処理が行われ、求められ
た図3および図4に示す2種類の構文解析木は、構文解
析木バッファ7cへ格納される(S6)。
【0037】ここで、上記の2種類の構文解析木のどち
らを選択するかを決定するために、文法規則適用確率検
索部5cが、上記S2でバッファAに読み込まれた文法
規則適用確率を検索し、さらに候補選択部5fが、各構
文解析木の優先度を、各構文解析木に適用されている文
法規則の文法規則適用確率に基づいて算出する(S
7)。すなわち、各構文解析木で用いられた文法規則の
文法規則適用確率すべての積を、その構文解析木の優先
度とする。
らを選択するかを決定するために、文法規則適用確率検
索部5cが、上記S2でバッファAに読み込まれた文法
規則適用確率を検索し、さらに候補選択部5fが、各構
文解析木の優先度を、各構文解析木に適用されている文
法規則の文法規則適用確率に基づいて算出する(S
7)。すなわち、各構文解析木で用いられた文法規則の
文法規則適用確率すべての積を、その構文解析木の優先
度とする。
【0038】例えば、図3に示す構文解析木の優先度
は、以下のようにして求めることができる。図3に示す
構文解析木で用いられている文法規則は、同図の非終端
記号の横のかっこ内で示されているように、規則R1、
規則R2、規則R7、規則R12、規則R17、規則R
6、規則R3、規則R9、規則R4および規則R9であ
る。ここで、例えば規則R1の文法規則適用確率をP(R
1) のように表すとすると、上記構文解析木の優先度P
a は、まだユーザによって翻訳結果が選択される前の初
期状態であるので、図6に示す初期状態の文法規則適用
確率から、以下のように算出される。すなわち、 Pa = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R6) × P(R3) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.16 × 0.25 × 0.33 × 0.16 × 0.16 × 0.50 × 0.16 × 0.50 = 0.000013516 となる。
は、以下のようにして求めることができる。図3に示す
構文解析木で用いられている文法規則は、同図の非終端
記号の横のかっこ内で示されているように、規則R1、
規則R2、規則R7、規則R12、規則R17、規則R
6、規則R3、規則R9、規則R4および規則R9であ
る。ここで、例えば規則R1の文法規則適用確率をP(R
1) のように表すとすると、上記構文解析木の優先度P
a は、まだユーザによって翻訳結果が選択される前の初
期状態であるので、図6に示す初期状態の文法規則適用
確率から、以下のように算出される。すなわち、 Pa = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R6) × P(R3) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.16 × 0.25 × 0.33 × 0.16 × 0.16 × 0.50 × 0.16 × 0.50 = 0.000013516 となる。
【0039】同様にして、図4に示す構文解析木の優先
度をPb とすると、 Pb = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R5) × P(R4) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.16 × 0.25 × 0.33 × 0.16 × 0.16 × 0.50 × 0.16 × 0.50 = 0.000013516 となる。
度をPb とすると、 Pb = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R5) × P(R4) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.16 × 0.25 × 0.33 × 0.16 × 0.16 × 0.50 × 0.16 × 0.50 = 0.000013516 となる。
【0040】続くS8において、上記のように求められ
た複数の構文解析木の優先度を比較して、最も優先度が
高い構文解析木を最良候補として選択するが、上記の場
合のように、複数の構文解析木の優先度が同じ値になっ
た場合には、例えば、次のように、品詞の優先度に基づ
いて構文解析木の選択を行ってもよい。つまり、複数の
品詞を有する単語に対して、各品詞間の優先度を数値で
示す品詞優先度を規定して辞書メモリ6aに格納してお
き、文中のすべての単語の品詞優先度の加算合計値が小
さい方の構文解析木を選択する方法である。なお、優先
度が最も高い品詞に対する品詞優先度を1として、以下
優先度が低くなる順に2・3…と規定されるものとす
る。また品詞が1種類しかない単語に対しては、品詞優
先度は1と規定されるものとする。
た複数の構文解析木の優先度を比較して、最も優先度が
高い構文解析木を最良候補として選択するが、上記の場
合のように、複数の構文解析木の優先度が同じ値になっ
た場合には、例えば、次のように、品詞の優先度に基づ
いて構文解析木の選択を行ってもよい。つまり、複数の
品詞を有する単語に対して、各品詞間の優先度を数値で
示す品詞優先度を規定して辞書メモリ6aに格納してお
き、文中のすべての単語の品詞優先度の加算合計値が小
さい方の構文解析木を選択する方法である。なお、優先
度が最も高い品詞に対する品詞優先度を1として、以下
優先度が低くなる順に2・3…と規定されるものとす
る。また品詞が1種類しかない単語に対しては、品詞優
先度は1と規定されるものとする。
【0041】上記英文の場合には、「both」が3種類の
品詞を有しており、限定詞(det )、接続詞(conj)、
名詞(pron)の順に優先度が付けられて、図12に示す
ように、それぞれの品詞優先度が1・2・3と規定され
ているとすると、上記図3の構文解析木においては、
「both」は限定詞(det )であり、この品詞優先度は1
であるため、全単語の品詞優先度の加算合計値は、7と
なる。一方、図4に示す構文解析木においては、「bot
h」は接続詞(conj)であり、品詞優先度は2と規定さ
れているために、全単語の品詞番号の加算合計値は、8
となる。この結果、図3に示す構文解析木の方が優先度
が高いとして、翻訳を行うための最良候補として選択さ
れる。
品詞を有しており、限定詞(det )、接続詞(conj)、
名詞(pron)の順に優先度が付けられて、図12に示す
ように、それぞれの品詞優先度が1・2・3と規定され
ているとすると、上記図3の構文解析木においては、
「both」は限定詞(det )であり、この品詞優先度は1
であるため、全単語の品詞優先度の加算合計値は、7と
なる。一方、図4に示す構文解析木においては、「bot
h」は接続詞(conj)であり、品詞優先度は2と規定さ
れているために、全単語の品詞番号の加算合計値は、8
となる。この結果、図3に示す構文解析木の方が優先度
が高いとして、翻訳を行うための最良候補として選択さ
れる。
【0042】次のS9では、文法規則適用確率算出部5
dにおいて、上記S8で選択された最良候補の構文解析
木における文法規則適用確率が算出される。この場合
に、最良候補として選択された、図3で示す構文解析木
で用いられた文法規則とその回数は、非終端記号SSに対
しては規則R1が1回、非終端記号S に対しては規則R
2が1回、非終端記号NPに対しては、規則R3、規則R
4、規則R6および規則R7が1回ずつで合計4回、非
終端記号NP1 に対しては規則R9が2回、非終端記号VP
に対して規則R12が1回、非終端記号V に対して規則
R17が1回である。
dにおいて、上記S8で選択された最良候補の構文解析
木における文法規則適用確率が算出される。この場合
に、最良候補として選択された、図3で示す構文解析木
で用いられた文法規則とその回数は、非終端記号SSに対
しては規則R1が1回、非終端記号S に対しては規則R
2が1回、非終端記号NPに対しては、規則R3、規則R
4、規則R6および規則R7が1回ずつで合計4回、非
終端記号NP1 に対しては規則R9が2回、非終端記号VP
に対して規則R12が1回、非終端記号V に対して規則
R17が1回である。
【0043】これらから、図7に示すように、各非終端
記号に対して適用された文法規則のそれぞれの文法規則
適用確率が算出される。例えば、非終端記号NPに対して
適用される規則R3ないしR8については、上記で用い
られた規則R3、規則R4、規則R6および規則R7に
対して1÷4=0.25がそれぞれ算出されて設定され
る。また、非終端記号NP1 に対して適用される規則R9
およびR10については、規則R9のみに対して2÷2
=1が算出されて設定される。
記号に対して適用された文法規則のそれぞれの文法規則
適用確率が算出される。例えば、非終端記号NPに対して
適用される規則R3ないしR8については、上記で用い
られた規則R3、規則R4、規則R6および規則R7に
対して1÷4=0.25がそれぞれ算出されて設定され
る。また、非終端記号NP1 に対して適用される規則R9
およびR10については、規則R9のみに対して2÷2
=1が算出されて設定される。
【0044】すなわち、各規則の文法規則適用確率は、
上記S8で選択された構文解析木における各規則の使用
回数を、その規則が適用される非終端記号の出現回数の
総数で割ることによって算出される。
上記S8で選択された構文解析木における各規則の使用
回数を、その規則が適用される非終端記号の出現回数の
総数で割ることによって算出される。
【0045】続くS10では、文法規則適用確率記録部
5eの制御により、上記S9で算出された文法規則適用
確率が、文法規則適用確率バッファ7dにおけるバッフ
ァBに格納される。
5eの制御により、上記S9で算出された文法規則適用
確率が、文法規則適用確率バッファ7dにおけるバッフ
ァBに格納される。
【0046】さらに、次のS11では、上記S8で最良
候補として選択された図3の構文解析木が、日本語の文
法に基づいて、日本語の構文解析木に変換され、さら
に、続くS12で、助詞等が補われて翻訳文が生成され
る。そして、S13で、生成された翻訳文「私は、両方
のペンと鉛筆を持っている。」が出力部3に表示される
こととなる。
候補として選択された図3の構文解析木が、日本語の文
法に基づいて、日本語の構文解析木に変換され、さら
に、続くS12で、助詞等が補われて翻訳文が生成され
る。そして、S13で、生成された翻訳文「私は、両方
のペンと鉛筆を持っている。」が出力部3に表示される
こととなる。
【0047】ユーザは、表示されたこの翻訳文を見て、
正しい翻訳がなされたかどうかを判断し(S14)、こ
の場合は、正しい翻訳ではないので、次候補選択の指示
を入力する(S15)。上記指示が入力されると前記S
8へ再び戻って、さきほど選択した構文解析木の次に優
先度が高い構文解析木を、新たな最良候補として選択す
る。この場合、図4に示す構文解析木が新たな最良候補
として選択されることとなる。
正しい翻訳がなされたかどうかを判断し(S14)、こ
の場合は、正しい翻訳ではないので、次候補選択の指示
を入力する(S15)。上記指示が入力されると前記S
8へ再び戻って、さきほど選択した構文解析木の次に優
先度が高い構文解析木を、新たな最良候補として選択す
る。この場合、図4に示す構文解析木が新たな最良候補
として選択されることとなる。
【0048】再び、S9において、上記の図4に示す構
文解析木に基づいて、文法規則適用確率の算出が行わ
れ、S10でバッファBへの上記文法規則適用確率の格
納が行われる。この時、前回のS9の処理で図3の構文
解析木から求められてバッファBに格納されていた文法
規則適用確率はすべて消去されるか上書きされて、バッ
ファBの内容は、図4の構文解析木から求められた確率
等が、図8に示すとおりに格納されている状態となる。
文解析木に基づいて、文法規則適用確率の算出が行わ
れ、S10でバッファBへの上記文法規則適用確率の格
納が行われる。この時、前回のS9の処理で図3の構文
解析木から求められてバッファBに格納されていた文法
規則適用確率はすべて消去されるか上書きされて、バッ
ファBの内容は、図4の構文解析木から求められた確率
等が、図8に示すとおりに格納されている状態となる。
【0049】さらに、S11ないしS12の処理が行わ
れ、S13において、「私は、ペンと鉛筆との両方を持
っている。」という翻訳文が表示される。この翻訳文は
ユーザが所望の正しい翻訳文であるため、S14からS
16へ移行する。
れ、S13において、「私は、ペンと鉛筆との両方を持
っている。」という翻訳文が表示される。この翻訳文は
ユーザが所望の正しい翻訳文であるため、S14からS
16へ移行する。
【0050】S16では、文法規則適用確率が修正され
る。つまり、最終的にユーザに選択された翻訳文の基と
なった構文解析木を求める際に適用された各文法規則の
使用頻度を、前記S2でバッファAに読み込まれた初期
状態の文法規則適用確率に反映させるために、次のよう
な計算を行う。
る。つまり、最終的にユーザに選択された翻訳文の基と
なった構文解析木を求める際に適用された各文法規則の
使用頻度を、前記S2でバッファAに読み込まれた初期
状態の文法規則適用確率に反映させるために、次のよう
な計算を行う。
【0051】まず、図6に示すようにバッファAに格納
されている初期状態の各文法規則の適用回数(この場合
は、すべて1)に、図8に示すようにバッファBに格納
されている各文法規則の適用回数をそれぞれ加算する。
同様に、図6に示す初期状態における該当非終端記号の
出現回数に、図8に示すバッファBに格納されている該
当非終端記号の出現回数をそれぞれ加算する。
されている初期状態の各文法規則の適用回数(この場合
は、すべて1)に、図8に示すようにバッファBに格納
されている各文法規則の適用回数をそれぞれ加算する。
同様に、図6に示す初期状態における該当非終端記号の
出現回数に、図8に示すバッファBに格納されている該
当非終端記号の出現回数をそれぞれ加算する。
【0052】例えば、規則R4について見ると、図6に
示す初期状態での適用回数は1回であり、図8に示すバ
ッファBに格納されている適用回数は2回である。これ
を加算すると、図9に示すように、適用回数の合計は、
3回になる。また同様に、該当非終端記号の出現回数の
合計は、6+4=10回となる。
示す初期状態での適用回数は1回であり、図8に示すバ
ッファBに格納されている適用回数は2回である。これ
を加算すると、図9に示すように、適用回数の合計は、
3回になる。また同様に、該当非終端記号の出現回数の
合計は、6+4=10回となる。
【0053】このようにして、すべての文法規則につい
て、初期状態の適用回数および該当非終端記号の出現回
数と、バッファBに格納されている適用回数および該当
非終端記号の出現回数とをそれぞれ加算した結果は、図
9に示すようになり、さらに、各文法規則の適用回数
を、該当非終端記号の出現回数で割ることによって、各
文法規則に対する文法規則適用確率が同図に示すとおり
それぞれ算出される。例えば、上記の規則R4について
は、3÷10=0.30となる。
て、初期状態の適用回数および該当非終端記号の出現回
数と、バッファBに格納されている適用回数および該当
非終端記号の出現回数とをそれぞれ加算した結果は、図
9に示すようになり、さらに、各文法規則の適用回数
を、該当非終端記号の出現回数で割ることによって、各
文法規則に対する文法規則適用確率が同図に示すとおり
それぞれ算出される。例えば、上記の規則R4について
は、3÷10=0.30となる。
【0054】この結果、図6に示した初期状態では、同
一の非終端記号に適用させる文法規則の適用確率は、同
図から明らかなようにすべて等しくなっていたが、上記
のように、文法規則適用確率を算出した結果は、図9に
示すように、ユーザが選択した翻訳結果に適用された文
法規則の適用確率が、他の文法規則の適用確率に比較し
て高くなっている。つまり、規則R3ないしR8を見て
みると、ユーザが選択した翻訳結果の基となった、図4
に示す構文解析木で適用された文法規則であるR4、R
5およびR7の文法規則適用確率が高いことは明らかで
ある。さらに、R4、R5およびR7の間でも、適用さ
れた回数が多かったR4が、他の2つの文法規則に比較
して高い適用確率となっていることがわかる。
一の非終端記号に適用させる文法規則の適用確率は、同
図から明らかなようにすべて等しくなっていたが、上記
のように、文法規則適用確率を算出した結果は、図9に
示すように、ユーザが選択した翻訳結果に適用された文
法規則の適用確率が、他の文法規則の適用確率に比較し
て高くなっている。つまり、規則R3ないしR8を見て
みると、ユーザが選択した翻訳結果の基となった、図4
に示す構文解析木で適用された文法規則であるR4、R
5およびR7の文法規則適用確率が高いことは明らかで
ある。さらに、R4、R5およびR7の間でも、適用さ
れた回数が多かったR4が、他の2つの文法規則に比較
して高い適用確率となっていることがわかる。
【0055】上記のように算出された文法規則適用確率
は、バッファAに格納される。なお、この格納の際に、
バッファAに予め格納されていた初期状態の文法規則適
用確率は、格納に先立って消去されるか、あるいは、上
書きされるので、バッファAには更新された文法規則適
用確率のみが格納された状態となる。
は、バッファAに格納される。なお、この格納の際に、
バッファAに予め格納されていた初期状態の文法規則適
用確率は、格納に先立って消去されるか、あるいは、上
書きされるので、バッファAには更新された文法規則適
用確率のみが格納された状態となる。
【0056】続くS17では、入力された原文のすべて
が翻訳されたか否かが判定され、入力された原文のすべ
ての翻訳が終了したと判定された場合には、次のS18
へ移行し、S18において、バッファAに格納されてい
る各文法規則の適用回数、該当非終端記号の出現回数お
よび文法規則適用確率を、ハードディスク6へ格納し、
翻訳処理を終了する。
が翻訳されたか否かが判定され、入力された原文のすべ
ての翻訳が終了したと判定された場合には、次のS18
へ移行し、S18において、バッファAに格納されてい
る各文法規則の適用回数、該当非終端記号の出現回数お
よび文法規則適用確率を、ハードディスク6へ格納し、
翻訳処理を終了する。
【0057】一方、上記S17で、翻訳すべき原文がま
だ残っていると判定された場合は、S4へ戻り、次の文
が原文バッファ7aにセットされて、S5およびS6の
処理が上記と同様に行われる。ここで、上記の英文「I
have both pens and pencils. 」が再び原文バッファ7
aにセットされ、S5およびS6の処理によって、前記
と同様に、図3および図4に示す構文解析木が求められ
たとする。この場合、続くS7で参照されるバッファA
には、前述のように、図9に示すとおりに更新された文
法規則適用確率が格納されており、S7で、この文法規
則適用確率に基づいて各構文解析木の優先度を計算する
と、次のようになる。すなわち、まず、図3に示す構文
解析木の優先度をPa とすると、 Pa = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R6) × P(R3) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.20 × 0.40 × 0.50 × 0.10 × 0.10 × 0.75 × 0.30 × 0.75 = 0.0000675 となり、同様にして、図4に示す構文解析木の優先度を
Pb とすると、 Pb = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R5) × P(R4) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.20 × 0.40 × 0.50 × 0.20 × 0.30 × 0.75 × 0.30 × 0.75 = 0.000405 となる。
だ残っていると判定された場合は、S4へ戻り、次の文
が原文バッファ7aにセットされて、S5およびS6の
処理が上記と同様に行われる。ここで、上記の英文「I
have both pens and pencils. 」が再び原文バッファ7
aにセットされ、S5およびS6の処理によって、前記
と同様に、図3および図4に示す構文解析木が求められ
たとする。この場合、続くS7で参照されるバッファA
には、前述のように、図9に示すとおりに更新された文
法規則適用確率が格納されており、S7で、この文法規
則適用確率に基づいて各構文解析木の優先度を計算する
と、次のようになる。すなわち、まず、図3に示す構文
解析木の優先度をPa とすると、 Pa = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R6) × P(R3) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.20 × 0.40 × 0.50 × 0.10 × 0.10 × 0.75 × 0.30 × 0.75 = 0.0000675 となり、同様にして、図4に示す構文解析木の優先度を
Pb とすると、 Pb = P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R5) × P(R4) × P(R9) × P(R4) × P(R9) = 1 × 1 × 0.20 × 0.40 × 0.50 × 0.20 × 0.30 × 0.75 × 0.30 × 0.75 = 0.000405 となる。
【0058】次のS8でこの結果を比較すると、Pa よ
りもPb の方が大きいため、構文解析木の最良候補とし
て図4に示す構文解析木が選択され、さらにS9ないし
S12の処理を経て、S13で翻訳文「私は、ペンと鉛
筆の両方を持っている。」が出力される。
りもPb の方が大きいため、構文解析木の最良候補とし
て図4に示す構文解析木が選択され、さらにS9ないし
S12の処理を経て、S13で翻訳文「私は、ペンと鉛
筆の両方を持っている。」が出力される。
【0059】上記の説明から明らかなように、本実施例
の翻訳装置は、原文から翻訳文を作成して出力し、最適
な翻訳文をユーザに選択させ、ユーザが選択した翻訳文
の基となった構文解析木に基づいて、各文法規則の適用
確率を算出し、1文の翻訳処理を終了する度に文法規則
適用確率を更新する構成である。これにより、ユーザが
構文構造の適切さに関して経験的に持っている知識が文
法規則適用確率として装置に学習されることとなる。
の翻訳装置は、原文から翻訳文を作成して出力し、最適
な翻訳文をユーザに選択させ、ユーザが選択した翻訳文
の基となった構文解析木に基づいて、各文法規則の適用
確率を算出し、1文の翻訳処理を終了する度に文法規則
適用確率を更新する構成である。これにより、ユーザが
構文構造の適切さに関して経験的に持っている知識が文
法規則適用確率として装置に学習されることとなる。
【0060】この結果、同一の原文から複数の構文構造
が得られた場合に、ユーザの使用状況から学習した優先
度に従って選択された翻訳文が、最良候補の翻訳文とし
て逐次出力されるので、ユーザが所望する翻訳文が迅速
に得られる確率を高めることができる。すなわち、翻訳
効率を向上させることが可能となる。
が得られた場合に、ユーザの使用状況から学習した優先
度に従って選択された翻訳文が、最良候補の翻訳文とし
て逐次出力されるので、ユーザが所望する翻訳文が迅速
に得られる確率を高めることができる。すなわち、翻訳
効率を向上させることが可能となる。
【0061】なお、本実施例では、英語の文書を日本語
に翻訳する装置を例に挙げて説明したが、本発明はこれ
に限定されるものではないことは言うまでもなく、ま
た、文法規則についても本実施例に記載したものに限定
されるものではない。
に翻訳する装置を例に挙げて説明したが、本発明はこれ
に限定されるものではないことは言うまでもなく、ま
た、文法規則についても本実施例に記載したものに限定
されるものではない。
【0062】〔実施例2〕本発明の他の実施例について
図1、図5、図10および図11に基づいて説明すれ
ば、以下の通りである。尚、説明の便宜上、前記の実施
例1で説明した構成と同一の機能を有する構成には、同
一の符号を付記し、その説明を省略する。
図1、図5、図10および図11に基づいて説明すれ
ば、以下の通りである。尚、説明の便宜上、前記の実施
例1で説明した構成と同一の機能を有する構成には、同
一の符号を付記し、その説明を省略する。
【0063】例えば、技術マニュアル、新聞記事あるい
は小説等のように、異なる種類の文書においては比較的
よく使用される文体が異なるために、頻繁に使用される
構文構造がそれぞれ異なるということが考えられる。こ
のため、本実施例の翻訳装置は、翻訳処理の実行指示の
入力に先立って、ユーザに対して、図1に示す入力部2
から文書の種類(以下、文種と表記する)を入力するよ
うに指示を行う。また、同図に示すハードディスク6内
には、文法規則適用確率メモリ6cが、複数種類の文種
に対応するように設けられており、図11に示すよう
に、各文種それぞれに対して、各文法規則の適用回数、
各非終端記号の出現回数および文法規則適用確率が格納
されている。
は小説等のように、異なる種類の文書においては比較的
よく使用される文体が異なるために、頻繁に使用される
構文構造がそれぞれ異なるということが考えられる。こ
のため、本実施例の翻訳装置は、翻訳処理の実行指示の
入力に先立って、ユーザに対して、図1に示す入力部2
から文書の種類(以下、文種と表記する)を入力するよ
うに指示を行う。また、同図に示すハードディスク6内
には、文法規則適用確率メモリ6cが、複数種類の文種
に対応するように設けられており、図11に示すよう
に、各文種それぞれに対して、各文法規則の適用回数、
各非終端記号の出現回数および文法規則適用確率が格納
されている。
【0064】以下、図10に示すフローチャートを参照
しながら、本翻訳装置の動作について説明する。なお、
前記実施例1で説明した図5に示すフローチャートの各
ステップと同じ処理を行うステップについては、同じス
テップ番号を付けて、その詳細な説明を省略する。な
お、図5および図10を比較することで明らかなよう
に、図10に示すフローチャートは、図5におけるS1
の後にS1’を行い、S2の代わりにS2’、S18の
代わりにS18’を行うようになっている。
しながら、本翻訳装置の動作について説明する。なお、
前記実施例1で説明した図5に示すフローチャートの各
ステップと同じ処理を行うステップについては、同じス
テップ番号を付けて、その詳細な説明を省略する。な
お、図5および図10を比較することで明らかなよう
に、図10に示すフローチャートは、図5におけるS1
の後にS1’を行い、S2の代わりにS2’、S18の
代わりにS18’を行うようになっている。
【0065】まず、翻訳すべき原文を入力する(S
1)。次に、文種の指定を行うようにユーザに指示する
メッセージを出力部3へ出力し、入力部2から入力され
た文種を読み込む(S1’)。ここで、例えば、「1.
文種指定なし」、「2.マニュアル」および「3.新
聞」の3種類の文種から選択を行うようにユーザに指示
が出されたとする。なお、「1.文種指定なし」は、特
に文種を指定しない文章を翻訳する場合、「2.マニュ
アル」は、技術マニュアル等を翻訳する場合、「3.新
聞」は、新聞記事を翻訳する場合にそれぞれ選択される
ものとする。
1)。次に、文種の指定を行うようにユーザに指示する
メッセージを出力部3へ出力し、入力部2から入力され
た文種を読み込む(S1’)。ここで、例えば、「1.
文種指定なし」、「2.マニュアル」および「3.新
聞」の3種類の文種から選択を行うようにユーザに指示
が出されたとする。なお、「1.文種指定なし」は、特
に文種を指定しない文章を翻訳する場合、「2.マニュ
アル」は、技術マニュアル等を翻訳する場合、「3.新
聞」は、新聞記事を翻訳する場合にそれぞれ選択される
ものとする。
【0066】上記S1’で文種が指定されると、続くS
2’では、指定された文種に該当する文法規則適用確率
メモリ6cから、各文法規則の適用回数、各非終端記号
の出現回数および文法規則適用確率が読み出されて文法
規則適用確率バッファ7dに格納される。
2’では、指定された文種に該当する文法規則適用確率
メモリ6cから、各文法規則の適用回数、各非終端記号
の出現回数および文法規則適用確率が読み出されて文法
規則適用確率バッファ7dに格納される。
【0067】その後、S3で翻訳処理の実行指示がユー
ザによって入力されると、S4ないしS16の処理が前
記実施例1と同様に行われる。さらに、S17で、翻訳
すべき原文すべての処理が終了したと判定された場合
は、上記S4ないしS16の処理の間に更新されてバッ
ファAに格納されている、各文法規則の適用回数、各非
終端記号の出現回数および文法規則適用確率を、該当す
る文種に対応する文法規則適用確率メモリ6cへ格納す
る。
ザによって入力されると、S4ないしS16の処理が前
記実施例1と同様に行われる。さらに、S17で、翻訳
すべき原文すべての処理が終了したと判定された場合
は、上記S4ないしS16の処理の間に更新されてバッ
ファAに格納されている、各文法規則の適用回数、各非
終端記号の出現回数および文法規則適用確率を、該当す
る文種に対応する文法規則適用確率メモリ6cへ格納す
る。
【0068】上記のように、本実施例の翻訳処理装置
は、複数種類の文種にそれぞれ対応した文法規則適用確
率メモリ6cを備えており、翻訳処理の際に、文種を指
定すると、指定された文種に対応した上記文法規則適用
確率メモリ6cから、文法規則適用確率等を読み出し、
これに基づいて翻訳処理を行い、さらに、翻訳処理を行
う間に、前記実施例1と同様に各文法規則をユーザが適
用する頻度を学習する構成となっている。
は、複数種類の文種にそれぞれ対応した文法規則適用確
率メモリ6cを備えており、翻訳処理の際に、文種を指
定すると、指定された文種に対応した上記文法規則適用
確率メモリ6cから、文法規則適用確率等を読み出し、
これに基づいて翻訳処理を行い、さらに、翻訳処理を行
う間に、前記実施例1と同様に各文法規則をユーザが適
用する頻度を学習する構成となっている。
【0069】これにより、例えば、技術マニュアルや新
聞記事等のように、頻繁に使用される構文構造が異なっ
ていると思われる複数種類の文書を同一の翻訳装置で翻
訳する場合においても、あらかじめ文種を指定すること
によって、指定された文種に対応する文法規則の適用確
率に基づいてより適切な構文構造が決定されて優先的に
出力されるため、翻訳処理の効率の向上を図ることがで
きると共に、文書の種類に応じた適切な翻訳処理を行う
ことができる。
聞記事等のように、頻繁に使用される構文構造が異なっ
ていると思われる複数種類の文書を同一の翻訳装置で翻
訳する場合においても、あらかじめ文種を指定すること
によって、指定された文種に対応する文法規則の適用確
率に基づいてより適切な構文構造が決定されて優先的に
出力されるため、翻訳処理の効率の向上を図ることがで
きると共に、文書の種類に応じた適切な翻訳処理を行う
ことができる。
【0070】なお、本実施例では文章の種類を上記の3
種類としたが、文章の種類はこれに限定されるものでは
なく、例えばユーザの希望に合わせて任意の種類に設定
することが可能である。また、本装置の製作時にあらか
じめ所定の複数種類の文種を設定しておくこともできる
し、装置を購入した後に、ユーザが自分で設定を行う構
成としてもよい。このような構成によれば、ユーザが翻
訳する頻度が高い文種を自分で設定することができるた
め、無駄な設定を省き、装置の操作性を向上させること
ができる。
種類としたが、文章の種類はこれに限定されるものでは
なく、例えばユーザの希望に合わせて任意の種類に設定
することが可能である。また、本装置の製作時にあらか
じめ所定の複数種類の文種を設定しておくこともできる
し、装置を購入した後に、ユーザが自分で設定を行う構
成としてもよい。このような構成によれば、ユーザが翻
訳する頻度が高い文種を自分で設定することができるた
め、無駄な設定を省き、装置の操作性を向上させること
ができる。
【0071】また、上記した各実施例においては、ユー
ザが翻訳文の選択を行って1つの文の翻訳処理が終了す
る度に、文法規則の適用確率が更新される例について説
明したが、本発明はこれに限定されるものではなく、例
えば、上記適用確率を更新するか否かをユーザが設定で
きる構成としてもよい。
ザが翻訳文の選択を行って1つの文の翻訳処理が終了す
る度に、文法規則の適用確率が更新される例について説
明したが、本発明はこれに限定されるものではなく、例
えば、上記適用確率を更新するか否かをユーザが設定で
きる構成としてもよい。
【0072】
【発明の効果】以上のように、本発明の請求項1記載の
機械翻訳装置は、各文法規則の適用確率を格納する記憶
手段と、上記構文解析手段が解析を行う際に適用した文
法規則と、上記記憶手段に格納されている各文法規則の
適用確率とに基づいて、各構文構造の優先度を算出する
構文優先度算出手段と、上記出力手段における翻訳文の
出力順位を、各翻訳文の基となった構文構造の優先度に
基づいて制御する制御手段と、最も適切な翻訳文として
ユーザが選択した翻訳文の基となった構文構造を上記構
文解析手段が求める際に適用された各文法規則の適用回
数を、上記記憶手段に格納されている各文法規則の適用
確率に反映させる適用確率更新手段とを備えている構成
である。
機械翻訳装置は、各文法規則の適用確率を格納する記憶
手段と、上記構文解析手段が解析を行う際に適用した文
法規則と、上記記憶手段に格納されている各文法規則の
適用確率とに基づいて、各構文構造の優先度を算出する
構文優先度算出手段と、上記出力手段における翻訳文の
出力順位を、各翻訳文の基となった構文構造の優先度に
基づいて制御する制御手段と、最も適切な翻訳文として
ユーザが選択した翻訳文の基となった構文構造を上記構
文解析手段が求める際に適用された各文法規則の適用回
数を、上記記憶手段に格納されている各文法規則の適用
確率に反映させる適用確率更新手段とを備えている構成
である。
【0073】これにより、翻訳処理を行う度に、構文構
造の適切さに関してユーザが経験的に持っている知識が
蓄積的に装置に学習されることとなるため、複数種類の
翻訳文から、最も適切な翻訳文が優先的に選択されて出
力される可能性が高くなり、翻訳処理の効率の向上を図
ることができるという効果を奏する。
造の適切さに関してユーザが経験的に持っている知識が
蓄積的に装置に学習されることとなるため、複数種類の
翻訳文から、最も適切な翻訳文が優先的に選択されて出
力される可能性が高くなり、翻訳処理の効率の向上を図
ることができるという効果を奏する。
【0074】請求項2記載の機械翻訳装置は、ユーザが
文書の種類を入力する文種入力手段をさらに備えている
と共に、各文法規則の適用確率が文書の種類別に設けら
れて上記記憶手段に格納されており、上記文種入力手段
から入力された文書の種類に基づいて、上記構文優先度
算出手段および適用確率更新手段が、上記記憶手段に格
納されている各文法規則の適用確率を選択する構成であ
る。
文書の種類を入力する文種入力手段をさらに備えている
と共に、各文法規則の適用確率が文書の種類別に設けら
れて上記記憶手段に格納されており、上記文種入力手段
から入力された文書の種類に基づいて、上記構文優先度
算出手段および適用確率更新手段が、上記記憶手段に格
納されている各文法規則の適用確率を選択する構成であ
る。
【0075】これにより、頻繁に使用される構文構造が
異なっていると思われる複数種類の文書を同一の翻訳装
置で翻訳する場合においても、各文書の種類に応じて適
切な翻訳文が優先的に出力される可能性が高くなり、翻
訳処理の効率の向上を図ることができるという効果を奏
する。
異なっていると思われる複数種類の文書を同一の翻訳装
置で翻訳する場合においても、各文書の種類に応じて適
切な翻訳文が優先的に出力される可能性が高くなり、翻
訳処理の効率の向上を図ることができるという効果を奏
する。
【図1】本発明の一実施例における機械翻訳装置の概略
構成を示すブロック図である。
構成を示すブロック図である。
【図2】上記機械翻訳装置の構文解析部において、構文
解析を行う際に適用される文法規則の組合せの一例を示
す説明図である。
解析を行う際に適用される文法規則の組合せの一例を示
す説明図である。
【図3】原文と、上記原文から求められる構文解析木お
よび翻訳文の対応関係の一例を示す説明図である。
よび翻訳文の対応関係の一例を示す説明図である。
【図4】原文と、上記原文から求められる構文解析木お
よび翻訳文の対応関係の他の例を示す説明図である。
よび翻訳文の対応関係の他の例を示す説明図である。
【図5】上記機械翻訳装置における翻訳処理の流れを示
すフローチャートである。
すフローチャートである。
【図6】初期状態における、上記の文法規則それぞれの
適用回数と、上記文法規則が適用される非終端記号の出
現回数と、文法規則適用確率との対応関係を示す説明図
である。
適用回数と、上記文法規則が適用される非終端記号の出
現回数と、文法規則適用確率との対応関係を示す説明図
である。
【図7】上記図3に示す構文解析木における、上記の文
法規則それぞれの適用回数と、上記文法規則が適用され
る非終端記号の出現回数と、文法規則適用確率との対応
関係を示す説明図である。
法規則それぞれの適用回数と、上記文法規則が適用され
る非終端記号の出現回数と、文法規則適用確率との対応
関係を示す説明図である。
【図8】上記図4に示す構文解析木における、上記の文
法規則それぞれの適用回数と、上記文法規則が適用され
る非終端記号の出現回数と、文法規則適用確率との対応
関係を示す説明図である。
法規則それぞれの適用回数と、上記文法規則が適用され
る非終端記号の出現回数と、文法規則適用確率との対応
関係を示す説明図である。
【図9】学習を行った構文解析木における、上記の文法
規則それぞれの適用回数と、上記文法規則が適用される
非終端記号の出現回数と、文法規則適用確率との対応関
係を示す説明図である。
規則それぞれの適用回数と、上記文法規則が適用される
非終端記号の出現回数と、文法規則適用確率との対応関
係を示す説明図である。
【図10】本発明の他の実施例における機械翻訳装置が
行う翻訳処理の流れを示すフローチャートである。
行う翻訳処理の流れを示すフローチャートである。
【図11】上記機械翻訳装置の構文解析部において適用
される、文種別の文法規則適用確率等を示す説明図であ
る。
される、文種別の文法規則適用確率等を示す説明図であ
る。
【図12】各単語の品詞に付けられる優先度の一例を示
す説明図である。
す説明図である。
1 CPU(制御手段) 2 入力部(文種入力手段) 5f 候補選択部(構文優先度算出部) 5d 文法規則適用確率算出部(適用確率更新手段) 6c 文法規則適用確率メモリ(記憶手段)
Claims (2)
- 【請求項1】辞書および文法規則に基づいて原言語の文
を解析して構文構造を求める構文解析手段と、上記構文
構造から目標言語の翻訳文を生成する変換・生成手段
と、生成された翻訳文を出力する出力手段とを備え、原
言語の文書を目標言語に翻訳して出力する機械翻訳装置
において、 各文法規則の適用確率を格納する記憶手段と、 上記構文解析手段が解析を行う際に適用した文法規則
と、上記記憶手段に格納されている各文法規則の適用確
率とに基づいて、各構文構造の優先度を算出する構文優
先度算出手段と、 上記出力手段における翻訳文の出力順位を、各翻訳文の
基となった構文構造の優先度に基づいて制御する制御手
段と、 最も適切な翻訳文としてユーザが選択した翻訳文の基と
なった構文構造を上記構文解析手段が求める際に適用さ
れた各文法規則の適用回数を、上記記憶手段に格納され
ている各文法規則の適用確率に反映させる適用確率更新
手段とを備えていることを特徴とする機械翻訳装置。 - 【請求項2】ユーザが文書の種類を入力する文種入力手
段をさらに備えていると共に、 各文法規則の適用確率が文書の種類別に設けられて上記
記憶手段に格納されており、上記文種入力手段から入力
された文書の種類に基づいて、上記構文優先度算出手段
および適用確率更新手段が、上記記憶手段に格納されて
いる各文法規則の適用確率を選択することを特徴とする
請求項1記載の機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6298659A JPH08161335A (ja) | 1994-12-01 | 1994-12-01 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6298659A JPH08161335A (ja) | 1994-12-01 | 1994-12-01 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08161335A true JPH08161335A (ja) | 1996-06-21 |
Family
ID=17862607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6298659A Pending JPH08161335A (ja) | 1994-12-01 | 1994-12-01 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08161335A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7024666B1 (en) * | 2002-01-28 | 2006-04-04 | Roy-G-Biv Corporation | Motion control systems and methods |
US7853645B2 (en) | 1997-10-07 | 2010-12-14 | Roy-G-Biv Corporation | Remote generation and distribution of command programs for programmable devices |
US8032605B2 (en) | 1999-10-27 | 2011-10-04 | Roy-G-Biv Corporation | Generation and distribution of motion commands over a distributed network |
-
1994
- 1994-12-01 JP JP6298659A patent/JPH08161335A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7853645B2 (en) | 1997-10-07 | 2010-12-14 | Roy-G-Biv Corporation | Remote generation and distribution of command programs for programmable devices |
US8032605B2 (en) | 1999-10-27 | 2011-10-04 | Roy-G-Biv Corporation | Generation and distribution of motion commands over a distributed network |
US7024666B1 (en) * | 2002-01-28 | 2006-04-04 | Roy-G-Biv Corporation | Motion control systems and methods |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5214583A (en) | Machine language translation system which produces consistent translated words | |
JP2892548B2 (ja) | 自動翻訳装置 | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
JPS63223962A (ja) | 翻訳装置 | |
JPH08161335A (ja) | 機械翻訳装置 | |
KR900008402B1 (ko) | 기계번역장치 | |
JP2638187B2 (ja) | 文章要約装置 | |
JPS61278970A (ja) | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 | |
JP2002123281A (ja) | 音声合成装置 | |
JPH0635961A (ja) | 文書要約装置 | |
JPH09179859A (ja) | 文字列変換装置および文字列変換方法 | |
JP2006012188A (ja) | 文書処理方法及び装置 | |
JPH0410665B2 (ja) | ||
JP2915225B2 (ja) | 文書作成装置 | |
JP3233800B2 (ja) | 機械翻訳装置 | |
JPH0350668A (ja) | 文字処理装置 | |
JPH04305769A (ja) | 機械翻訳装置 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JPH0414168A (ja) | 文書作成装置 | |
JP2802369B2 (ja) | かな漢字変換装置 | |
JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
JPS63316157A (ja) | 文章の類義表現変換装置 | |
JPH0550778B2 (ja) | ||
JPH0567139A (ja) | 通訳装置 | |
JPH1125094A (ja) | 機械翻訳装置およびコンピュータ読取可能な記録媒体 |