JPH08161335A

JPH08161335A - 機械翻訳装置

Info

Publication number: JPH08161335A
Application number: JP6298659A
Authority: JP
Inventors: Youji Fukumochi; 陽士福持
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1994-12-01
Filing date: 1994-12-01
Publication date: 1996-06-21

Abstract

(57)【要約】【構成】文法規則適用確率メモリ６ｃに格納された各
文法規則の適用確率に基づいて構文構造の優先度を算出
し、文法規則適用確率算出部５ｄが、ユーザが最適であ
ると選択した翻訳文の基となった構文構造に適用された
各文法規則の適用回数を、上記文法規則適用確率メモリ
６ｃに格納された各文法規則の適用確率に反映させる。【効果】人間の翻訳者が構文構造の適切さに関して経
験的に持っている知識を装置に学習させることができ、
同一の原文から複数の構文構造が得られる場合に、最適
な構文構造をより適切に選択することが可能となり、翻
訳効率の向上を図ることができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、例えば、入力された英
語の文章を日本語に翻訳して出力するような、自然言語
を翻訳する機械翻訳装置等に関するものである。

【０００２】

【従来の技術】従来、例えば、英語を日本語に翻訳する
翻訳装置のように、ある言語（原言語）で書かれた文書
を別の言語（目標言語）に翻訳するための機械翻訳装置
が知られている。

【０００３】上記の機械翻訳装置は、入力された原言語
を、内部に記憶している辞書を用いて、単語等の形態素
に分割すると共に、その形態素の品詞情報等を得て、原
言語の文を構成する単語間の係り受けを解析して構文構
造を決定し、上記構文構造を目標言語の構文構造に変換
し、目標言語の構文構造から目標言語の表層文を生成す
ることによって翻訳処理を行うものである。

【０００４】しかし、人間の翻訳者であれば、単語の意
味や前後関係等からほぼ経験的に判断することによっ
て、原文に対する翻訳文を比較的容易に一意に決定する
ことができるが、装置が翻訳を行う際には、ほとんどの
場合において、原文に対する翻訳文は複数種類が作成さ
れ得る。これは、例えば、前記のように、品詞情報に基
づいて単語間の係り受けを解析して原言語の構文構造を
作成する際に、複数の品詞を有する単語が原言語の文中
に存在する場合には、その単語と他の単語との係り受け
を解析するために適用すべき文法規則が複数種類存在
し、ひいては、作成される構文構造も複数種類になるこ
とによる。

【０００５】このような場合に、原言語の文から作成さ
れ得るすべての構文構造に基づいて翻訳文を生成して出
力することは、適切な翻訳からあまりにもかけ離れた翻
訳文も出力されることとなり、ユーザがこれらの翻訳文
から適切なものを選択する手間を増大させるので、翻訳
効率の点からも好ましいことではない。

【０００６】これに対して、例えば、特開平６−１９５
３７７号公報には、同一の原文から複数種類の翻訳文が
得られ、その内の１個の翻訳文を最適な翻訳文としてユ
ーザが選択した場合に、上記の複数種類の翻訳文のそれ
ぞれ基となっている複数種類の構文構造を互いに比較
し、ユーザに選択された翻訳文の基となった構文構造の
特徴点をルール化して記憶手段に記憶することによっ
て、最適とされる構文構造を学習し、同一の原文から複
数の構文構造が得られた場合には、過去に上記のように
学習したルールに基づいて、複数種類の翻訳文の出力順
位等を決定する構成が開示されている。さらに、複数の
構文どうしが競合した場合に、他の構文構造に対してど
の程度の強さで優先するかを示す優先度を各構文構造に
対して定め、この優先度に従って適用すべき構文構造を
決定する方法が提案されている。

【０００７】

【発明が解決しようとする課題】しかしながら、上記公
報に開示された構成では、ユーザが最適と考える構文構
造が、ユーザの選択によって記憶手段に一旦記憶される
と、当該構造の出現頻度に関係なく優先すべき構文構造
として学習されてしまうため、学習の内容が一般的なも
のでなかった場合、かえって適切でない翻訳文を出力す
る結果となるという問題点を有している。また、上記公
報に開示された構成では、上記のように優先度を用いた
構文構造決定の方法を提案した段階にとどまり、他の構
文構造に対する優先度を各構文構造に対してどのように
設定するかについては技術的に未解決のままである。

【０００８】本発明の目的は、原文から得られる複数の
構文構造に基づいた翻訳文を出力する際に、優先して出
力すべき翻訳文をより適切に決定できる機械翻訳装置を
実現することである。

【０００９】

【課題を解決するための手段】上記の目的を達成するた
めに、本発明の請求項１記載の機械翻訳装置は、辞書お
よび文法規則に基づいて原言語の文を解析して構文構造
を求める構文解析手段と、上記構文構造から目標言語の
翻訳文を生成する変換・生成手段と、生成された翻訳文
を出力する出力手段とを備え、原言語の文書を目標言語
に翻訳して出力する機械翻訳装置において、各文法規則
の適用確率を格納する記憶手段と、上記構文解析手段が
解析を行う際に適用した文法規則と、上記記憶手段に格
納されている各文法規則の適用確率とに基づいて、各構
文構造の優先度を算出する構文優先度算出手段と、上記
出力手段における翻訳文の出力順位を、各翻訳文の基と
なった構文構造の優先度に基づいて制御する制御手段
と、最も適切な翻訳文としてユーザが選択した翻訳文の
基となった構文構造を上記構文解析手段が求める際に適
用された各文法規則の適用回数を、上記記憶手段に格納
されている各文法規則の適用確率に反映させる適用確率
更新手段とを備えていることを特徴としている。

【００１０】請求項２記載の機械翻訳装置は、請求項１
記載の機械翻訳装置において、ユーザが文書の種類を入
力する文種入力手段をさらに備えていると共に、各文法
規則の適用確率が文書の種類別に設けられて上記記憶手
段に格納されており、上記文種入力手段から入力された
文書の種類に基づいて、上記構文優先度算出手段および
適用確率更新手段が、上記記憶手段に格納されている各
文法規則の適用確率を選択することを特徴としている。

【００１１】

【作用】請求項１記載の構成によれば、入力された原言
語の文を構文解析手段が解析する際に適用した文法規則
と、記憶手段に格納されている各文法規則の適用確率と
に基づいて、構文優先度算出手段が各構文構造の優先度
を算出し、例えば、複数の構文構造の優先度を互いに比
較して一番優先度が高い構文構造から先に出力する等の
ように、出力手段における翻訳文の出力順位を制御手段
が制御する。さらに、適用確率更新手段が、最も適切な
翻訳文としてユーザが選択した翻訳文の基となった構文
構造を上記構文解析手段が求める際に適用した各文法規
則の適用回数を、記憶手段に格納されている各文法規則
の適用確率に反映させる。

【００１２】これにより、１つの原文から得られる複数
種類の翻訳文から最も適切な翻訳文を選択する際のユー
ザの判断が、文法規則の適用確率に反映されて記憶手段
に格納される。このため、翻訳処理を行う度に、構文構
造の適切さに関して人間の翻訳者が経験的に持っている
知識が蓄積的に装置に学習されることとなる。この結
果、複数種類の翻訳文から、最も適切な翻訳文が優先的
に選択されて出力される可能性が高くなり、翻訳処理の
効率の向上を図ることができる。

【００１３】請求項２記載の構成によれば、構文優先度
算出手段および適用確率更新手段が、文書の種類別に記
憶手段に格納されている各文法規則の適用確率から、文
種入力手段からユーザが入力した文書の種類に対応する
適用確率を選択する。

【００１４】これにより、例えば、技術マニュアルや新
聞記事等のように、頻繁に使用される構文構造が異なっ
ていると思われる複数種類の文書を同一の翻訳装置で翻
訳する場合においても、各文書の種類に応じて適切な翻
訳文が優先的に出力される可能性が高くなり、翻訳処理
の効率の向上を図ることができる。

【００１５】

【実施例】

〔実施例１〕本発明の一実施例について図１ないし図
９、および図１２に基づいて説明すれば、以下の通りで
ある。なお、本実施例では、原言語が英語であり、目的
言語が日本語であるような機械翻訳装置を例にあげて説
明する。

【００１６】本実施例における機械翻訳装置は、図１に
示すように、以下の各部の動作を制御する制御手段とし
てのＣＰＵ（中央処理装置）１と、ＲＡＭ等からなるメ
インメモリ７と、原言語の単語列を入力するためのアル
ファベットキーや各種命令を入力するためのコマンドキ
ー等を備えたキーボード等の入力部２（文種入力手段）
と、入力された単語列を原言語から目的言語へ翻訳する
処理を行う翻訳部５と、辞書および文法規則等を記憶し
ているハードディスク６と、目的言語に翻訳された文等
を出力するための、例えばＣＲＴ（陰極線管）やＬＣＤ
（液晶表示装置）等で構成される出力部３とを備えてい
る。上記の入力部２、翻訳部５、ハードディスク６、メ
インメモリ７および出力部３は、データや制御信号等を
伝達するバスライン４によって互いに接続されており、
上記ＣＰＵ１の制御に基づいて動作する。

【００１７】上記ハードディスク６は、辞書を格納して
いる辞書メモリ６ａと、原文を解析して構文構造を求め
る際に適用すると、上記文法規則のそれぞれの適用確率
を格納している文法規則適用確率メモリ６ｃ（記憶手
段）と、原文から得られた構文構造を目的言語の構文構
造に変換する際に適用する変換規則を格納している変換
規則メモリ６ｄと、目的言語の構文構造から目的言語の
文を生成する際に適用する生成規則を格納している生成
規則メモリ６ｅとを含んでいる。

【００１８】上記翻訳部５は、同図に示すように、原言
語の文に含まれる各単語の訳語および品詞情報等を得る
ための辞書引き・形態素解析部５ａと、上記品詞情報お
よび文法規則に基づいて、構文構造、すなわち各単語間
の係り受け関係、を示す構文解析木を得るための構文解
析部５ｂと、入力された原文に対する構文解析木の構造
を目的語に対する構文解析木の構造に変換する変換部５
ｇと、最終的に目標言語の文を生成する生成部５ｈと、
上記入力部２に出力された翻訳結果をユーザの指示にし
たがって修正する後編集部５ｉとを含んでいる。

【００１９】上記構文解析部５ｂは、ハードディスク６
の文法規則適用確率メモリ６ｃを検索する文法規則適用
確率検索部５ｃと、文法規則の適用確率を計算する文法
規則適用確率算出部５ｄ（適用確率更新手段）と、算出
された適用確率をハードディスク６の文法規則適用確率
メモリ６ｃへ格納する文法規則適用確率記録部５ｅと、
文法規則適用確率に基づいて各構文解析木の優先度、す
なわち各構文解析木の適切さを算出する候補選択部５ｆ
（構文優先度算出手段）とによって構成されている。

【００２０】ここで、「I have both pens and pencil
s．」という英文を日本語文に翻訳する際の動作につい
て、図１ないし図３を参照しながら説明する。

【００２１】まず、入力部２から上記の英文が入力さ
れ、ＣＰＵ１の制御の下でメインメモリ７の原文バッフ
ァ７ａへ一旦格納される。翻訳部５は、ＣＰＵ１の制御
の下で、原文バッファ７ａから上記英文を取り出し、辞
書引き・形態素解析部５ａによってハードディスク６の
辞書メモリ６ａを参照し、各単語の訳語と品詞情報とを
得てメインメモリ７の辞書引きバッファ７ｂに格納す
る。

【００２２】この時、辞書メモリ６ａから得られる各単
語に対する品詞情報は、以下の通りとなる。すなわち、
「I 」は名詞（pron）、「have」は動詞（verb）、「 b
oth」は限定詞（det ）と接続詞（conj）と名詞（pro
n）との内のいずれかであり、「pens」は名詞（pro
n）、「 and」は接続詞（conj）、「 pencils」は名詞
（pron）、「．」は終止符（end ）である。

【００２３】次に、翻訳部５の構文解析部５ｂが、上記
のように得られた品詞情報と、ハードディスク６の解析
規則メモリ６ｂに格納されている文法規則とに基づい
て、各単語間の係り受け関係を示す構文解析木を求めて
メインメモリ７の構文解析木バッファ７ｃに格納する。

【００２４】この構文解析木は、次のようにして求めら
れる。すなわち、解析規則メモリ６ｂには、図２に示す
文法規則が格納されている。同図に示すように、各文法
規則には、１から１９までの文法規則番号が付けられて
おり、例えば、一番上の行に示されている文法規則番号
が１の文法規則（以下、規則Ｒ１のように表記する）
は、『文章（SS）は、文（S ）と終止符（end ）とから
成っている。』ということを表わす規則である。

【００２５】なお、同図において、規則Ｒ１９の下部に
示すように、これらの文法規則中に例えば「NP」、「V
P」等のように大文字で示されている記号は、非終端記
号と呼び、同図中に示す文法規則に従ってさらに解析す
ることが可能な構造であることを示している。一方、例
えば「noun」、「conj」等のように小文字で示されてい
る記号は、終端記号と呼び、これ以上は解析できない品
詞等に対応している。つまり、非終端記号を、同図に示
す文法規則に従って終端記号へと分解していくことによ
り、構文解析木が求められるわけである。

【００２６】上記の英文を図２に示す文法規則に従って
解析した結果の構文解析木の一例は、図３に示すように
なる。同図中で大文字で示す非終端記号の横のかっこ内
には、その非終端記号を解析するのに用いた文法規則を
示している。例えば、同図の一番上に示した文章（SS）
は、図２に示す規則Ｒ１に従って、文（S ）と終止符
（end ）とに分解され、上記文章（SS）の左下に示した
文（S ）は、規則Ｒ２に従って、名詞句（NP）と動詞句
（VP）とにさらに分解されたことを示す。

【００２７】このようにして、すべての非終端記号が、
図３に略楕円形で囲んで示す終端記号に分解された様子
を示す構文解析木は、構造解析木バッファ７ｃに一旦格
納される。その後、変換部５ｇは、構文解析木バッファ
７ｃから構文解析木を取り出して、取り出した構文解析
木を、日本語の文法規則に従って日本文に対する構文解
析木に変換する。続いて、生成部５ｈが、適切な助詞
「は」等を補うことにより、図３の下部に示すような、
「私は、両方のペンと鉛筆を持っている。」という翻訳
文を求めて、メインメモリ７の訳文バッファ７ｆに格納
する。

【００２８】以上のような動作によって、上記の英文の
翻訳文が求められたわけであるが、「 both 」という単
語が複数の品詞を持つことから、上記の英文に対する構
文解析木として、前記の図３に示した構文解析木の他
に、図４に示すような構文解析木を得ることができる。
このように、原文に対する翻訳文は必ずしも１種類であ
るとは限らず、複数の候補から適切な翻訳文を選択する
ことが必要となる。

【００２９】以下に、上記のように複数種類の翻訳文の
候補が存在する場合の、最適な翻訳文を選択するための
動作について、図５のフローチャートを参照しながら説
明する。

【００３０】まず、翻訳対象となる原文が入力部２から
入力される（ステップ１、以下、Ｓ１と表記する）。あ
るいは、入力されて一旦ハードディスク６へ格納されて
いた原文を読み出してもよい。

【００３１】続いて、ハードディスク６の文法規則適用
確率メモリ６ｃに格納された文法規則適用確率を、メイ
ンメモリ７の文法規則適用確率バッファ７ｄのバッファ
Ａへ読み込む（Ｓ２）。

【００３２】上記の文法規則適用確率とは、非終端記号
を解析する際に、その非終端記号に適用可能な文法規則
すべてに対して、ある文法規則が適用される確率を示す
ものである。すなわち、図２に示すように、例えば、非
終端記号NPに適用される文法規則は、規則Ｒ３ないし規
則Ｒ８の６種類であるので、図６に示すように、規則Ｒ
３ないし規則Ｒ８の文法規則適用確率は１÷６≒０．１
６となる。また、非終端記号NP1 に適用される文法規則
である規則Ｒ９および規則Ｒ１０の文法規則適用確率は
それぞれ１÷２＝０．５０であり、その他の文法規則に
対する確率も同様にして図６に示すように求めることが
できる。

【００３３】ただし、上記の図６に示された文法規則適
用確率は、各文法規則に優先度が付けられていない初期
状態における確率であり、本実施例の文法規則適用確率
は、以降に説明するように、翻訳結果をユーザが選択す
る度にその選択を学習して優先度が付けられるように更
新されてゆく。

【００３４】ユーザから翻訳の実行指示が入力されると
（Ｓ３）、原文の１文がメインメモリ７の原文バッファ
７ａにセットされる（Ｓ４）。なお、ここで、上記の原
文の１文として、前記の英文「I have both pens and p
encils．」がセットされたものとする。

【００３５】次に、原文バッファ７ａに読み込まれた原
文の各単語に対して、辞書引き・形態素解析部５ａがハ
ードディスク６の辞書メモリ６ａを参照することによ
り、訳語や品詞情報を取得して辞書引きバッファ７ｂへ
格納する（Ｓ５）。

【００３６】上記Ｓ５に続く、図５で点線で囲んで示す
Ｓ６ないしＳ１０は、図１に示す構文解析部５ｂにおい
て行われる処理である。まず、前述したように、上記英
文に対する構文解析木を求める処理が行われ、求められ
た図３および図４に示す２種類の構文解析木は、構文解
析木バッファ７ｃへ格納される（Ｓ６）。

【００３７】ここで、上記の２種類の構文解析木のどち
らを選択するかを決定するために、文法規則適用確率検
索部５ｃが、上記Ｓ２でバッファＡに読み込まれた文法
規則適用確率を検索し、さらに候補選択部５ｆが、各構
文解析木の優先度を、各構文解析木に適用されている文
法規則の文法規則適用確率に基づいて算出する（Ｓ
７）。すなわち、各構文解析木で用いられた文法規則の
文法規則適用確率すべての積を、その構文解析木の優先
度とする。

【００３８】例えば、図３に示す構文解析木の優先度
は、以下のようにして求めることができる。図３に示す
構文解析木で用いられている文法規則は、同図の非終端
記号の横のかっこ内で示されているように、規則Ｒ１、
規則Ｒ２、規則Ｒ７、規則Ｒ１２、規則Ｒ１７、規則Ｒ
６、規則Ｒ３、規則Ｒ９、規則Ｒ４および規則Ｒ９であ
る。ここで、例えば規則Ｒ１の文法規則適用確率をP(R
1) のように表すとすると、上記構文解析木の優先度Ｐ
_aは、まだユーザによって翻訳結果が選択される前の初
期状態であるので、図６に示す初期状態の文法規則適用
確率から、以下のように算出される。すなわち、Ｐ_a＝ P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R6) × P(R3) × P(R9) × P(R4) × P(R9) ＝ 1 × 1 × 0.16 × 0.25 × 0.33 × 0.16 × 0.16 × 0.50 × 0.16 × 0.50 ＝ 0.000013516 となる。

【００３９】同様にして、図４に示す構文解析木の優先
度をＰ_bとすると、Ｐ_b＝ P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R5) × P(R4) × P(R9) × P(R4) × P(R9) ＝ 1 × 1 × 0.16 × 0.25 × 0.33 × 0.16 × 0.16 × 0.50 × 0.16 × 0.50 ＝ 0.000013516 となる。

【００４０】続くＳ８において、上記のように求められ
た複数の構文解析木の優先度を比較して、最も優先度が
高い構文解析木を最良候補として選択するが、上記の場
合のように、複数の構文解析木の優先度が同じ値になっ
た場合には、例えば、次のように、品詞の優先度に基づ
いて構文解析木の選択を行ってもよい。つまり、複数の
品詞を有する単語に対して、各品詞間の優先度を数値で
示す品詞優先度を規定して辞書メモリ６ａに格納してお
き、文中のすべての単語の品詞優先度の加算合計値が小
さい方の構文解析木を選択する方法である。なお、優先
度が最も高い品詞に対する品詞優先度を１として、以下
優先度が低くなる順に２・３…と規定されるものとす
る。また品詞が１種類しかない単語に対しては、品詞優
先度は１と規定されるものとする。

【００４１】上記英文の場合には、「both」が３種類の
品詞を有しており、限定詞（det ）、接続詞（conj）、
名詞（pron）の順に優先度が付けられて、図１２に示す
ように、それぞれの品詞優先度が１・２・３と規定され
ているとすると、上記図３の構文解析木においては、
「both」は限定詞（det ）であり、この品詞優先度は１
であるため、全単語の品詞優先度の加算合計値は、７と
なる。一方、図４に示す構文解析木においては、「bot
h」は接続詞（conj）であり、品詞優先度は２と規定さ
れているために、全単語の品詞番号の加算合計値は、８
となる。この結果、図３に示す構文解析木の方が優先度
が高いとして、翻訳を行うための最良候補として選択さ
れる。

【００４２】次のＳ９では、文法規則適用確率算出部５
ｄにおいて、上記Ｓ８で選択された最良候補の構文解析
木における文法規則適用確率が算出される。この場合
に、最良候補として選択された、図３で示す構文解析木
で用いられた文法規則とその回数は、非終端記号SSに対
しては規則Ｒ１が１回、非終端記号S に対しては規則Ｒ
２が１回、非終端記号NPに対しては、規則Ｒ３、規則Ｒ
４、規則Ｒ６および規則Ｒ７が１回ずつで合計４回、非
終端記号NP1 に対しては規則Ｒ９が２回、非終端記号VP
に対して規則Ｒ１２が１回、非終端記号V に対して規則
Ｒ１７が１回である。

【００４３】これらから、図７に示すように、各非終端
記号に対して適用された文法規則のそれぞれの文法規則
適用確率が算出される。例えば、非終端記号NPに対して
適用される規則Ｒ３ないしＲ８については、上記で用い
られた規則Ｒ３、規則Ｒ４、規則Ｒ６および規則Ｒ７に
対して１÷４＝０．２５がそれぞれ算出されて設定され
る。また、非終端記号NP1 に対して適用される規則Ｒ９
およびＲ１０については、規則Ｒ９のみに対して２÷２
＝１が算出されて設定される。

【００４４】すなわち、各規則の文法規則適用確率は、
上記Ｓ８で選択された構文解析木における各規則の使用
回数を、その規則が適用される非終端記号の出現回数の
総数で割ることによって算出される。

【００４５】続くＳ１０では、文法規則適用確率記録部
５ｅの制御により、上記Ｓ９で算出された文法規則適用
確率が、文法規則適用確率バッファ７ｄにおけるバッフ
ァＢに格納される。

【００４６】さらに、次のＳ１１では、上記Ｓ８で最良
候補として選択された図３の構文解析木が、日本語の文
法に基づいて、日本語の構文解析木に変換され、さら
に、続くＳ１２で、助詞等が補われて翻訳文が生成され
る。そして、Ｓ１３で、生成された翻訳文「私は、両方
のペンと鉛筆を持っている。」が出力部３に表示される
こととなる。

【００４７】ユーザは、表示されたこの翻訳文を見て、
正しい翻訳がなされたかどうかを判断し（Ｓ１４）、こ
の場合は、正しい翻訳ではないので、次候補選択の指示
を入力する（Ｓ１５）。上記指示が入力されると前記Ｓ
８へ再び戻って、さきほど選択した構文解析木の次に優
先度が高い構文解析木を、新たな最良候補として選択す
る。この場合、図４に示す構文解析木が新たな最良候補
として選択されることとなる。

【００４８】再び、Ｓ９において、上記の図４に示す構
文解析木に基づいて、文法規則適用確率の算出が行わ
れ、Ｓ１０でバッファＢへの上記文法規則適用確率の格
納が行われる。この時、前回のＳ９の処理で図３の構文
解析木から求められてバッファＢに格納されていた文法
規則適用確率はすべて消去されるか上書きされて、バッ
ファＢの内容は、図４の構文解析木から求められた確率
等が、図８に示すとおりに格納されている状態となる。

【００４９】さらに、Ｓ１１ないしＳ１２の処理が行わ
れ、Ｓ１３において、「私は、ペンと鉛筆との両方を持
っている。」という翻訳文が表示される。この翻訳文は
ユーザが所望の正しい翻訳文であるため、Ｓ１４からＳ
１６へ移行する。

【００５０】Ｓ１６では、文法規則適用確率が修正され
る。つまり、最終的にユーザに選択された翻訳文の基と
なった構文解析木を求める際に適用された各文法規則の
使用頻度を、前記Ｓ２でバッファＡに読み込まれた初期
状態の文法規則適用確率に反映させるために、次のよう
な計算を行う。

【００５１】まず、図６に示すようにバッファＡに格納
されている初期状態の各文法規則の適用回数（この場合
は、すべて１）に、図８に示すようにバッファＢに格納
されている各文法規則の適用回数をそれぞれ加算する。
同様に、図６に示す初期状態における該当非終端記号の
出現回数に、図８に示すバッファＢに格納されている該
当非終端記号の出現回数をそれぞれ加算する。

【００５２】例えば、規則Ｒ４について見ると、図６に
示す初期状態での適用回数は１回であり、図８に示すバ
ッファＢに格納されている適用回数は２回である。これ
を加算すると、図９に示すように、適用回数の合計は、
３回になる。また同様に、該当非終端記号の出現回数の
合計は、６＋４＝１０回となる。

【００５３】このようにして、すべての文法規則につい
て、初期状態の適用回数および該当非終端記号の出現回
数と、バッファＢに格納されている適用回数および該当
非終端記号の出現回数とをそれぞれ加算した結果は、図
９に示すようになり、さらに、各文法規則の適用回数
を、該当非終端記号の出現回数で割ることによって、各
文法規則に対する文法規則適用確率が同図に示すとおり
それぞれ算出される。例えば、上記の規則Ｒ４について
は、３÷１０＝０．３０となる。

【００５４】この結果、図６に示した初期状態では、同
一の非終端記号に適用させる文法規則の適用確率は、同
図から明らかなようにすべて等しくなっていたが、上記
のように、文法規則適用確率を算出した結果は、図９に
示すように、ユーザが選択した翻訳結果に適用された文
法規則の適用確率が、他の文法規則の適用確率に比較し
て高くなっている。つまり、規則Ｒ３ないしＲ８を見て
みると、ユーザが選択した翻訳結果の基となった、図４
に示す構文解析木で適用された文法規則であるＲ４、Ｒ
５およびＲ７の文法規則適用確率が高いことは明らかで
ある。さらに、Ｒ４、Ｒ５およびＲ７の間でも、適用さ
れた回数が多かったＲ４が、他の２つの文法規則に比較
して高い適用確率となっていることがわかる。

【００５５】上記のように算出された文法規則適用確率
は、バッファＡに格納される。なお、この格納の際に、
バッファＡに予め格納されていた初期状態の文法規則適
用確率は、格納に先立って消去されるか、あるいは、上
書きされるので、バッファＡには更新された文法規則適
用確率のみが格納された状態となる。

【００５６】続くＳ１７では、入力された原文のすべて
が翻訳されたか否かが判定され、入力された原文のすべ
ての翻訳が終了したと判定された場合には、次のＳ１８
へ移行し、Ｓ１８において、バッファＡに格納されてい
る各文法規則の適用回数、該当非終端記号の出現回数お
よび文法規則適用確率を、ハードディスク６へ格納し、
翻訳処理を終了する。

【００５７】一方、上記Ｓ１７で、翻訳すべき原文がま
だ残っていると判定された場合は、Ｓ４へ戻り、次の文
が原文バッファ７ａにセットされて、Ｓ５およびＳ６の
処理が上記と同様に行われる。ここで、上記の英文「I
have both pens and pencils. 」が再び原文バッファ７
ａにセットされ、Ｓ５およびＳ６の処理によって、前記
と同様に、図３および図４に示す構文解析木が求められ
たとする。この場合、続くＳ７で参照されるバッファＡ
には、前述のように、図９に示すとおりに更新された文
法規則適用確率が格納されており、Ｓ７で、この文法規
則適用確率に基づいて各構文解析木の優先度を計算する
と、次のようになる。すなわち、まず、図３に示す構文
解析木の優先度をＰ_aとすると、Ｐ_a＝ P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R6) × P(R3) × P(R9) × P(R4) × P(R9) ＝ 1 × 1 × 0.20 × 0.40 × 0.50 × 0.10 × 0.10 × 0.75 × 0.30 × 0.75 ＝ 0.0000675 となり、同様にして、図４に示す構文解析木の優先度を
Ｐ_bとすると、Ｐ_b＝ P(R1) × P(R2) × P(R7) × P(R12) × P(R17) × P(R5) × P(R4) × P(R9) × P(R4) × P(R9) ＝ 1 × 1 × 0.20 × 0.40 × 0.50 × 0.20 × 0.30 × 0.75 × 0.30 × 0.75 ＝ 0.000405 となる。

【００５８】次のＳ８でこの結果を比較すると、Ｐ_aよ
りもＰ_bの方が大きいため、構文解析木の最良候補とし
て図４に示す構文解析木が選択され、さらにＳ９ないし
Ｓ１２の処理を経て、Ｓ１３で翻訳文「私は、ペンと鉛
筆の両方を持っている。」が出力される。

【００５９】上記の説明から明らかなように、本実施例
の翻訳装置は、原文から翻訳文を作成して出力し、最適
な翻訳文をユーザに選択させ、ユーザが選択した翻訳文
の基となった構文解析木に基づいて、各文法規則の適用
確率を算出し、１文の翻訳処理を終了する度に文法規則
適用確率を更新する構成である。これにより、ユーザが
構文構造の適切さに関して経験的に持っている知識が文
法規則適用確率として装置に学習されることとなる。

【００６０】この結果、同一の原文から複数の構文構造
が得られた場合に、ユーザの使用状況から学習した優先
度に従って選択された翻訳文が、最良候補の翻訳文とし
て逐次出力されるので、ユーザが所望する翻訳文が迅速
に得られる確率を高めることができる。すなわち、翻訳
効率を向上させることが可能となる。

【００６１】なお、本実施例では、英語の文書を日本語
に翻訳する装置を例に挙げて説明したが、本発明はこれ
に限定されるものではないことは言うまでもなく、ま
た、文法規則についても本実施例に記載したものに限定
されるものではない。

【００６２】〔実施例２〕本発明の他の実施例について
図１、図５、図１０および図１１に基づいて説明すれ
ば、以下の通りである。尚、説明の便宜上、前記の実施
例１で説明した構成と同一の機能を有する構成には、同
一の符号を付記し、その説明を省略する。

【００６３】例えば、技術マニュアル、新聞記事あるい
は小説等のように、異なる種類の文書においては比較的
よく使用される文体が異なるために、頻繁に使用される
構文構造がそれぞれ異なるということが考えられる。こ
のため、本実施例の翻訳装置は、翻訳処理の実行指示の
入力に先立って、ユーザに対して、図１に示す入力部２
から文書の種類（以下、文種と表記する）を入力するよ
うに指示を行う。また、同図に示すハードディスク６内
には、文法規則適用確率メモリ６ｃが、複数種類の文種
に対応するように設けられており、図１１に示すよう
に、各文種それぞれに対して、各文法規則の適用回数、
各非終端記号の出現回数および文法規則適用確率が格納
されている。

【００６４】以下、図１０に示すフローチャートを参照
しながら、本翻訳装置の動作について説明する。なお、
前記実施例１で説明した図５に示すフローチャートの各
ステップと同じ処理を行うステップについては、同じス
テップ番号を付けて、その詳細な説明を省略する。な
お、図５および図１０を比較することで明らかなよう
に、図１０に示すフローチャートは、図５におけるＳ１
の後にＳ１’を行い、Ｓ２の代わりにＳ２’、Ｓ１８の
代わりにＳ１８’を行うようになっている。

【００６５】まず、翻訳すべき原文を入力する（Ｓ
１）。次に、文種の指定を行うようにユーザに指示する
メッセージを出力部３へ出力し、入力部２から入力され
た文種を読み込む（Ｓ１’）。ここで、例えば、「１．
文種指定なし」、「２．マニュアル」および「３．新
聞」の３種類の文種から選択を行うようにユーザに指示
が出されたとする。なお、「１．文種指定なし」は、特
に文種を指定しない文章を翻訳する場合、「２．マニュ
アル」は、技術マニュアル等を翻訳する場合、「３．新
聞」は、新聞記事を翻訳する場合にそれぞれ選択される
ものとする。

【００６６】上記Ｓ１’で文種が指定されると、続くＳ
２’では、指定された文種に該当する文法規則適用確率
メモリ６ｃから、各文法規則の適用回数、各非終端記号
の出現回数および文法規則適用確率が読み出されて文法
規則適用確率バッファ７ｄに格納される。

【００６７】その後、Ｓ３で翻訳処理の実行指示がユー
ザによって入力されると、Ｓ４ないしＳ１６の処理が前
記実施例１と同様に行われる。さらに、Ｓ１７で、翻訳
すべき原文すべての処理が終了したと判定された場合
は、上記Ｓ４ないしＳ１６の処理の間に更新されてバッ
ファＡに格納されている、各文法規則の適用回数、各非
終端記号の出現回数および文法規則適用確率を、該当す
る文種に対応する文法規則適用確率メモリ６ｃへ格納す
る。

【００６８】上記のように、本実施例の翻訳処理装置
は、複数種類の文種にそれぞれ対応した文法規則適用確
率メモリ６ｃを備えており、翻訳処理の際に、文種を指
定すると、指定された文種に対応した上記文法規則適用
確率メモリ６ｃから、文法規則適用確率等を読み出し、
これに基づいて翻訳処理を行い、さらに、翻訳処理を行
う間に、前記実施例１と同様に各文法規則をユーザが適
用する頻度を学習する構成となっている。

【００６９】これにより、例えば、技術マニュアルや新
聞記事等のように、頻繁に使用される構文構造が異なっ
ていると思われる複数種類の文書を同一の翻訳装置で翻
訳する場合においても、あらかじめ文種を指定すること
によって、指定された文種に対応する文法規則の適用確
率に基づいてより適切な構文構造が決定されて優先的に
出力されるため、翻訳処理の効率の向上を図ることがで
きると共に、文書の種類に応じた適切な翻訳処理を行う
ことができる。

【００７０】なお、本実施例では文章の種類を上記の３
種類としたが、文章の種類はこれに限定されるものでは
なく、例えばユーザの希望に合わせて任意の種類に設定
することが可能である。また、本装置の製作時にあらか
じめ所定の複数種類の文種を設定しておくこともできる
し、装置を購入した後に、ユーザが自分で設定を行う構
成としてもよい。このような構成によれば、ユーザが翻
訳する頻度が高い文種を自分で設定することができるた
め、無駄な設定を省き、装置の操作性を向上させること
ができる。

【００７１】また、上記した各実施例においては、ユー
ザが翻訳文の選択を行って１つの文の翻訳処理が終了す
る度に、文法規則の適用確率が更新される例について説
明したが、本発明はこれに限定されるものではなく、例
えば、上記適用確率を更新するか否かをユーザが設定で
きる構成としてもよい。

【００７２】

【発明の効果】以上のように、本発明の請求項１記載の
機械翻訳装置は、各文法規則の適用確率を格納する記憶
手段と、上記構文解析手段が解析を行う際に適用した文
法規則と、上記記憶手段に格納されている各文法規則の
適用確率とに基づいて、各構文構造の優先度を算出する
構文優先度算出手段と、上記出力手段における翻訳文の
出力順位を、各翻訳文の基となった構文構造の優先度に
基づいて制御する制御手段と、最も適切な翻訳文として
ユーザが選択した翻訳文の基となった構文構造を上記構
文解析手段が求める際に適用された各文法規則の適用回
数を、上記記憶手段に格納されている各文法規則の適用
確率に反映させる適用確率更新手段とを備えている構成
である。

【００７３】これにより、翻訳処理を行う度に、構文構
造の適切さに関してユーザが経験的に持っている知識が
蓄積的に装置に学習されることとなるため、複数種類の
翻訳文から、最も適切な翻訳文が優先的に選択されて出
力される可能性が高くなり、翻訳処理の効率の向上を図
ることができるという効果を奏する。

【００７４】請求項２記載の機械翻訳装置は、ユーザが
文書の種類を入力する文種入力手段をさらに備えている
と共に、各文法規則の適用確率が文書の種類別に設けら
れて上記記憶手段に格納されており、上記文種入力手段
から入力された文書の種類に基づいて、上記構文優先度
算出手段および適用確率更新手段が、上記記憶手段に格
納されている各文法規則の適用確率を選択する構成であ
る。

【００７５】これにより、頻繁に使用される構文構造が
異なっていると思われる複数種類の文書を同一の翻訳装
置で翻訳する場合においても、各文書の種類に応じて適
切な翻訳文が優先的に出力される可能性が高くなり、翻
訳処理の効率の向上を図ることができるという効果を奏
する。

【図面の簡単な説明】

【図１】本発明の一実施例における機械翻訳装置の概略
構成を示すブロック図である。

【図２】上記機械翻訳装置の構文解析部において、構文
解析を行う際に適用される文法規則の組合せの一例を示
す説明図である。

【図３】原文と、上記原文から求められる構文解析木お
よび翻訳文の対応関係の一例を示す説明図である。

【図４】原文と、上記原文から求められる構文解析木お
よび翻訳文の対応関係の他の例を示す説明図である。

【図５】上記機械翻訳装置における翻訳処理の流れを示
すフローチャートである。

【図６】初期状態における、上記の文法規則それぞれの
適用回数と、上記文法規則が適用される非終端記号の出
現回数と、文法規則適用確率との対応関係を示す説明図
である。

【図７】上記図３に示す構文解析木における、上記の文
法規則それぞれの適用回数と、上記文法規則が適用され
る非終端記号の出現回数と、文法規則適用確率との対応
関係を示す説明図である。

【図８】上記図４に示す構文解析木における、上記の文
法規則それぞれの適用回数と、上記文法規則が適用され
る非終端記号の出現回数と、文法規則適用確率との対応
関係を示す説明図である。

【図９】学習を行った構文解析木における、上記の文法
規則それぞれの適用回数と、上記文法規則が適用される
非終端記号の出現回数と、文法規則適用確率との対応関
係を示す説明図である。

【図１０】本発明の他の実施例における機械翻訳装置が
行う翻訳処理の流れを示すフローチャートである。

【図１１】上記機械翻訳装置の構文解析部において適用
される、文種別の文法規則適用確率等を示す説明図であ
る。

【図１２】各単語の品詞に付けられる優先度の一例を示
す説明図である。

【符号の説明】

１ＣＰＵ（制御手段）２入力部（文種入力手段）５ｆ候補選択部（構文優先度算出部）５ｄ文法規則適用確率算出部（適用確率更新手段）６ｃ文法規則適用確率メモリ（記憶手段）

Claims

【特許請求の範囲】

【請求項１】辞書および文法規則に基づいて原言語の文
を解析して構文構造を求める構文解析手段と、上記構文
構造から目標言語の翻訳文を生成する変換・生成手段
と、生成された翻訳文を出力する出力手段とを備え、原
言語の文書を目標言語に翻訳して出力する機械翻訳装置
において、各文法規則の適用確率を格納する記憶手段と、上記構文解析手段が解析を行う際に適用した文法規則
と、上記記憶手段に格納されている各文法規則の適用確
率とに基づいて、各構文構造の優先度を算出する構文優
先度算出手段と、上記出力手段における翻訳文の出力順位を、各翻訳文の
基となった構文構造の優先度に基づいて制御する制御手
段と、最も適切な翻訳文としてユーザが選択した翻訳文の基と
なった構文構造を上記構文解析手段が求める際に適用さ
れた各文法規則の適用回数を、上記記憶手段に格納され
ている各文法規則の適用確率に反映させる適用確率更新
手段とを備えていることを特徴とする機械翻訳装置。
【請求項２】ユーザが文書の種類を入力する文種入力手
段をさらに備えていると共に、各文法規則の適用確率が文書の種類別に設けられて上記
記憶手段に格納されており、上記文種入力手段から入力
された文書の種類に基づいて、上記構文優先度算出手段
および適用確率更新手段が、上記記憶手段に格納されて
いる各文法規則の適用確率を選択することを特徴とする
請求項１記載の機械翻訳装置。