JPH08235186A

JPH08235186A - 機械翻訳装置

Info

Publication number: JPH08235186A
Application number: JP7041646A
Authority: JP
Inventors: Hiroshi Tanano; 裕氏棚野
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1995-03-01
Filing date: 1995-03-01
Publication date: 1996-09-13
Anticipated expiration: 2017-05-13
Also published as: JP3281746B2

Abstract

(57)【要約】【目的】機械翻訳装置において、一つの入力文に対し
て複数の解析結果を持つ場合に、それぞれの解析結果か
ら生成される翻訳文からユーザが一つ選択することによ
り、構文解析の違いを自動的に抽出し、学習機能とし
て、自動学習や規則の修正を可能とする。【構成】入力部１より入力された文を形態素解析処理
部２、構文解析処理部３で解析を行い、構文構造優先度
記憶部１０のデータに基づいて優先順位を決定し、ユー
ザの選択した結果と解析結果差分抽出部６で差分を抽出
し、学習を行い、出力表示部７に出力を行う。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、第１言語で書かれた入
力文を、所望の第２言語に翻訳して出力する機械翻訳装
置に関する。

【０００２】

【従来の技術】従来、機械翻訳装置において、複数通り
の構文構造が得られた場合、つまり複数通りの翻訳結果
が得られる場合には、それらの間で優先順位を決定する
必要がある。この優先順位を決定する手段としては、（１）意味解析（２）共起関係（３）文法規則の記述順序などがある。

【０００３】（１）の意味解析の具体的な方法として
は、単語辞書に意味カテゴリー情報を書き込んでおき、
構文解析によって単語間の係り受け決定する際、係り受
けをする単語の間で意味カテゴリーが一致しないような
構文構造は採用しない、もしくは優先順位を下げるとい
うものである。

【０００４】（２）の共起関係の利用は、意味関係の一
種とも言えるが、ある単語について係り受けの相手先の
単語を指定して辞書に記述しておき、構文解析によって
単語間の係り受けが決定する際、係り受けの相手先の単
語が辞書記述と一致しないような構文構造は採用しな
い、または優先順位を下げるというものである。

【０００５】（３）の文法規則の記述順序は、構文解析
のための規則を用いる。文法規則をメモリ上に記述する
順序を例えば、優先させたい順に記述するなどして、調
節することによって、個々の文法規則についてそれぞれ
の適用されやすさを変えることができるので、結果とし
て、特定の構文構造を作りやすくすることができるよう
になる。

【０００６】また、構文構造を学習することによって、
機械翻訳の正当率を向上させる技術が存在する。特開平
２−１４８２６１号公報「構文学習機能付機械翻訳装
置」において、装置が出力した解析結果をユーザが修正
し、以後の翻訳指示において、この修正履歴を用いて解
析処理を行うことによって、同一の修正を回避するもの
である。

【０００７】さらに、特開平６−１９５３７７「構文優
先度学習方式の機械翻訳装置」においては、入力文の構
文構造を句構造と捉える解析処理を行い、ユーザが適切
と考える句構造全体を優先すべき構造と考え、以後の翻
訳処理において、この句構造の優先度を用いて解析結果
の優先度解釈を行っている。

【０００８】しかしながら、特開平２−１４８２６１号
公報の技術では、ユーザが解析処理の誤り箇所を適切に
指摘し得ることが前提条件となっており、それが不可能
な場合は機能しないという問題があった。解析処理の誤
りを訂正するという作業は、言語の文法構造に精通して
いる者でない場合は大変労力を要するものになってしま
う。

【０００９】また、特開平６−１９５３７７号公報の技
術では、大局的な構文構造を捉えようとしながら局所構
造まで限定した優先度規則を用いるため、それぞれの学
習結果の適用単位は極めて限定され、汎用的でない。そ
の上、複数の構文解析結果間の優先度に差を生じる本質
的原因となっている局所構造の違いを抽出できないとい
う問題がある。さらに上記のいづれの技術においても、
学習の対象となるのは入力文全体もしくは入力文中で連
続している句に限られており、日本語のように修飾句の
出現位置が必ずしも一意に定まらない言語に対しては、
十分に機能しないものであった。

【００１０】

【発明が解決しようとする課題】一般的に、翻訳処理装
置において、入力文に対して解析処理が行われると、意
味処理等にびょる係り受け候補絞り込みが行われ、１つ
ないしは複数の構文解析結果が得られる。この構文解析
結果として得られる構文構造を句構造で捉えることは少
なくとも日本語に関しては最適とは言えない。

【００１１】例えば、英語文 “Ｉｂｏｕｇｈｔｂｏｏｋｓｙｅｓｔｅｒｄａ
ｙ．” の構文構造を句構造で捉えた場合の解析結果例を図２で
表す。このとき、“Ｉ”“ｂｏｕｇｈｔ”“ｂｏｏｋ
ｓ”“ｙｅｓｔｅｒｄａｙ”“．”の各形態素成分の組
み合わせで同じ意味を表現する文を生成するためには、
一意に図２の句構造を成す文を生成せざるを得ない。よ
って、この構文構造と文意とは一対一に対応していると
いえる。

【００１２】しかし例えば、３つの日本語文「私は昨日
本を買った」「昨日私は本を買った」「私は本を昨日買
った」の構文構造を句構造で捉えると、それぞれ図３の
（ａ）（ｂ）（ｃ）に示すように別の構文構造を持つ文
と解析されるが、これら３つの文の文意はほぼ同じであ
ることから、構文構造と文意が一対一に対応していると
は言えない。

【００１３】そこで、日本語文においては、形態素成分
間の修飾／被修飾関係を修飾後の被修飾語に対する依存
関係とみて構文構造を依存構造で表現する方法がとられ
ることが多い。上記３つの文も構文構造を依存構造で捉
えると、全て図３（ｄ）の形に集約され、構文構造と文
意が一対一に対応させることが可能となり、直感的にも
日本語の構文構造を理解しやすい形態になる。なお、図
２および図３における「名詞句」「動詞句」「主節」
「文」等の用語は、説明図の理解を助けるために便宜上
与えた呼称である。

【００１４】従来の翻訳処理装置においても、複数の解
析結果が得られた場合に、それぞれの解析結果に対して
なんらかの優先度づけを行い、最も適当と思われる解析
結果を用いて翻訳文を生成したり、適当と思われる順番
がユーザに明示できる形で全ての解析結果に基づく翻訳
文を提示する機能や、各形態素成分間の係り受けを明示
的に指定することによって、所望する解析結果を得るこ
とが可能であり、この係り受けの指定内容を記憶してお
くことにより局所構文構造の学習を行うものもあった
が、構文構造の複雑な文では出力された翻訳文が入力文
に対して不適当な出力であるとユーザに理解できても、
その原因を構文解析結果から的確に指摘できないことが
多く、特にユーザが日本語に精通していない場合は係り
受けの指定はほとんど不可能であり、このような学習機
能は利用できないことがあった。

【００１５】また、従来の翻訳処理装置において、構文
構造の学習を行う場合には、必ずどのような単語列に対
して特定の構文構造を優先させるのかをユーザが指定し
なければならなかった上に、連続する単語列が再現しな
ければ学習が反映されないため、入力文が修飾句の挿入
位置に対する制約が少ない日本語の場合は、学習の効果
が現れにくかった。

【００１６】例えば、「私のテニスのラケット」を構文
解析した結果、「私の」が「テニスの」を修飾する解
（図４（ａ））と、「私の」が「ラケット」を修飾する
解（図４（ｂ））が存在するものとし、後者の解析結果
を優先させるようにした場合に、「私の大切なテニスの
ラケット」のように挿入句（この場合は「大切な」）が
存在するだけで、同じ構文構造を含む文であるというこ
とが認識されていないために、学習機能を利用すること
ができなかった。

【００１７】また、構文解析した結果の構文構造を表示
する機能を持つ翻訳処理装置は存在したが、どのような
構文構造を優先させたことによって、その構文解析結果
全体が優先されるに至ったのかを明示的に操作者に提示
する機能は持たなかった。

【００１８】さらに、構文構造の優先度を決定する構文
解析規則の中に、ユーザにとって不適当であると考えら
れるものが存在しても、これを操作者が修正する手段は
存在していなかった。

【００１９】上記の「私のテニスのラケット」の例で
「［名詞１］の［名詞２］の［名詞３］」の形態素列を
［名詞１」と［名詞２］が両方［名詞３］を修飾するよ
うに学習したとする（図４（ｄ））と、文「私のラケッ
トの傷」の場合にもこの学習パターンが誤って適用され
てしまう（図４（ｅ））ため、学習パターンの適用条件
を細かく制御するには「ＡのＢのＣ」のように表層的な
パターンの一致で画一的に処理することは、多様な言語
現象に対応する上で適当ではない。

【００２０】さらに、上記例において、「［名詞１］の
［名詞２］の［名詞３］」の形態素列に対して、「私の
テニスのラケット」が入力の場合に［名詞１］と［名詞
２］が両方［名詞３］を修飾するのが正しいと判断する
ことと、「私のラケットの傷」が入力の場合に［名詞
１］が［名詞２］を［名詞２］が［名詞３］をそれぞれ
修飾するのに正しいと判断することと、「私のラケット
の傷」が入力の場合に［名詞１］が［名詞２］を［名詞
２］が［名詞３］をそれぞれ修飾するのが正しいと判断
することは互いに矛盾した判断であるが、相互に反例と
して存在することを確認する手段は与えられてないなか
ったので、矛盾した学習を行う可能性があった。

【００２１】本発明の目的は、このような課題を解決
し、装置が出力する複数の構文解析結果のうち最適と思
われるもの、あるいはそれらの解析結果に基づく翻訳文
のうち、最適と思われるもののいずれかを操作者が選択
することによって、構文解析結果の誤り箇所を自動的に
抽出し、正しい構造の学習も自動的に行う機能を持ち、
さらに誤りを発生させた原因となったデータをユーザに
提示し、これをユーザが修正可能とする機能や、品詞や
意味などの詳細な適用条件の割り当てが可能な局所構文
構造の学習機能を持ち、学習されたデータがどのような
入力に対応して作成されたものであるかを提示できる、
構文構造学習機能を持つ翻訳処理装置を提供することで
ある。

【００２２】

【課題を解決するための手段】本発明による翻訳処理装
置は、日本語文データを読み込む入力部と、入力部で入
力された日本語文データを形態素成分に分解・解析する
形態素解析処理部と、各形態素成分間の構文構造を解析
する構文解析処理部と、構文解析結果をそれぞれの優先
順位と併せて保持するための構文解析結果記憶部と、す
べての解析結果を元に、それぞれに対して目標言語文へ
の変換生成処理を行う変換生成処理部と、構文解析処理
部を備える。

【００２３】さらに、最優先と判断された解析結果と該
装置のユーザが最も適当であると判断した目標言語文を
生成した解析結果を比較し、それぞれの解析結果から構
造の異なる部分を局所構文構造として抽出する解析結果
差分抽出部と、生成された全ての目標言語文や解析結果
差分抽出部で抽出された構文構造を表示する出力表示部
と、解析結果差分抽出部で抽出された２つの局所構文構
造に対して、該装置のユーザが選択した方を優先させる
ための構文構造学習データを自動生成する学習データ自
動生成部と、その学習データを保持する学習データ記憶
部と直接係り受け関係を成す形態素成分に対して、入力
分における相対位置、あるいはそれぞれの品詞などの属
性条件に応じて、それらの結び付きの深さを数値化した
優先度得点データを、その得点を付与する優先度条件と
併せて保持する構文構造優先度記録部と、そこに保持さ
れる優先度データをユーザの指示に従って修正登録する
構文構造優先度修正部と、局所構文構造を構成する単語
について品詞や意味などの条件を付与した学習データの
作成をするために必要なデータをユーザに提示し、ユー
ザの意図する適用条件を具備した学習データを作成する
学習データ作成支援部を備える。

【００２４】これにより、出力された目標言語文の中か
ら該装置のユーザが最も適切と思われる文を採択するだ
けで、その構文解析結果から修正を要する局所構文構造
を抽出することが可能であり、優先させるべき一方の構
造を以後必ず優先させるための学習データを自動的に作
成することができ、該装置が最も適当と見なした構文解
析結果を優先させた根拠となるデータをユーザに明示で
きる上に、構文構造の優先度を決定するデータを該装置
のユーザが直接変更可能とする機能を備え、ユーザによ
る品詞や意味などの適用条件の自在な割り当てが可能な
局所構文構造の学習データ作成支援機能を備え、学習デ
ータを用いて解析された結果を表示する際に、以前行っ
た学習の根拠を提示するために、その学習データ作成時
にその構文構造を構成していた単語を併せて表示する機
能を備えたものである。

【００２５】

【作用】本発明請求項１および３の構成によれば、翻訳
処理装置が複数の解析結果をもとにそれぞれに対応する
翻訳文を出力した場合に、それらの翻訳文の中に、シス
テムが最優先と判断した翻訳文より適当と思われる翻訳
文が存在し、それをユーザが選択することにより、２つ
の解析結果から自動的に局所構文構造を抽出し、ユーザ
に提示する。

【００２６】請求項２の構成によれば、抽出した局所構
文構造のうち、優先すべき解析結果の学習データを自動
的に生成する。さらに、システムが構文構造の優先度を
決定する根拠としている優先度条件と優先度得点データ
をユーザに提示する。

【００２７】また、請求項４および５の構成によれば、
優先順位を逆転させるために（ユーザの選択した構文構
造を優先させるために）、ユーザは上記データを変更す
ることにより優先度の調整が可能である。さらに優先順
位を入れ替えるための学習データを、品詞や意味などの
適用条件を任意に登録することが可能である。

【００２８】

【実施例】本発明の一実施例として、入力言語として日
本語、目標言語として英語として、日本語から英語への
日英翻訳処理について、図面を用いて詳細に説明する。

【００２９】図１は本発明による機械翻訳装置の構成の
一例である。１は入力部、２は形態素解析処理部、３は
構文解析処理部、４は構文解析結果記憶部、５は変換生
成処理部、６は解析結果差分抽出部、７は出力表示部、
８は学習データ生成部、９は学習データ記憶部、１０は
構文構造優先度記憶部、１１は構文構造優先度修正部、
１２は学習データ作成支援部である。

【００３０】図５のフローチャートを参照しながら、本
発明における機械翻訳装置の動作を具体的に説明する。

【００３１】まず、入力部１において、日本語文データ
１文を取り出し、形態素解析処理部２へ送る（Ｓ５０
１）。次に、形態素解析処理部２では、入力された分か
ら抽出可能な単語を全て抽出し、これらの単語の組み合
わせとしえ構成される文節を可能な限り抽出し、この文
節列で入力文全体を構成できるような文節の組み合わせ
を得る（Ｓ５０２）。次に、形態素解析結果である文節
の集合に対して、構文解析処理部３で構文解析処理を行
う（Ｓ５０３）。構文解析処理については、図６のフロ
ーチャートを参照して説明する。

【００３２】入力文中で前方に存在した構文構造がそれ
より後方に存在した構文構造に係り得るかどうかの判断
を、形態素解析結果として得られた全ての文節の集合を
含む構文解析の中間結果として得られた全ての構文構造
に対して行っているかどうかを確認し（Ｓ６０１）、そ
うでなければ以下の処理を行う。

【００３３】まず、任意の２つの構文構造（形態素解析
結果の文節も含む）について、それぞれの構造を構成す
る依存構造木の最上位に位置する文節を成す語の品詞や
意味などによる係り受け規則に基づいて判断し、係り受
け可能と判断された構文構造対に対しては、構文構造優
先度記憶部１０を参照の上、該当する優先度条件に与え
られる優先度得点をそれぞれの構文構造が持つ優先度得
点（形態素解析結果の文節は得点を持たないとしても良
いし、優先度を持たせるために初期得点を与えておくよ
うにすることも可能）に加算し、２つの構文構造対を包
含する新たな構文構造木を生成する（Ｓ６０２）。

【００３４】続いて、学習データ記憶部９を参照し、生
成された構文構造が学習されている構文構造であるかど
うかを調べ（Ｓ６０３）、学習データがあればその学習
データに与えられている得点をＳ６０２で付与した優先
度得点に加算する（Ｓ６０４）。

【００３５】例文「私が新しい本を彼に貸した」が入力
された場合の構文解析処理の過程を説明する。この文を
形態素解析処理した結果、抽出される文節列の例は図８
（ａ）のようになる。ここで、抽出される文節列、ある
いは「代名詞」「形容詞」等の品詞名や「終止形」等の
活用形名については、根拠とする文法体系等の際により
一義的に定まるものではないが、その不確定要素は本発
明の作用に影響を与えるものではない。

【００３６】形態素解析処理で抽出されたこれらの文節
に対して、構文解析処理が行われ、構文構造に優先度得
点が与えられる過程を図８（ｃ）（ｄ）に示す。例え
ば、文節［私が］が文節［新しい］を修飾可能であると
解析されたら、構文構造優先度記憶部８からこの係り受
け構造に適合する優先度条件を探す。構文構造優先度記
憶部８に記述される優先度条件と優先度得点データの例
を図８（ｂ）に示す。この例の場合は文節距離の近い係
り受けを優先する優先度条件（図８（ｂ）条件１）が該
当し、［“文節距離”×（−１）］に相当する（−１）
点が構文構造［［私が］→［新しい］］に与えられる優
先度得点として加算され、元の［私が］と［新しい］の
得点の和は０点であるので（各単語そのものに得点はな
い）、結局優先度得点は（−１）点となる（図８
（ｃ））。

【００３７】ここで、［［私が］→［新しい］］は、
［私が］が［新しい］を修飾する依存構造［［彼に］→
［貸した］］を修飾する場合にも図８（ｄ）に示すよう
に、元の構文構造の優先度得点の和が０点で、適用され
る優先度条件（図８（ｂ）条件１、４）による得点の加
算が計０点であるので、構文構造［［［新しい］→［本
を］］／［彼に］→［貸した］］に対する優先度得点は
合計０点となる。ここで、［［［新しい］→［本を］］
／［彼に］→［貸した］］は［［新しい］→［本を］］
と［彼に］が［貸した］を修飾するという依存関係を表
すものとする。

【００３８】構文解析結果記憶部４に保管されている構
文解析結果のうち、優先度得点最高の解を変換生成処理
部５に送り、変換生成処理を行い（Ｓ５０４）、変換生
成結果として翻訳文を出力表示部７に出力する（Ｓ５０
５）。

【００３９】ここで、該装置の操作者が次候補の解析結
果による翻訳文（以後、「別解釈」とする）出力を命令
しなければ処理は終了する（Ｓ５０６）。同様に、これ
以上別解釈が存在しない場合も処理は終了する（Ｓ５０
７）。

【００４０】操作者が別解釈出力を指示し、かつ別解釈
が存在する場合は、構文解析結果記憶部４より優先度得
点が次に高い解を変換生成処理部５に送り、変換生成処
理を行い（Ｓ５０８）、翻訳文を最優先解から生成した
翻訳文を併記して出力表示部７に出力する（Ｓ５０
９）。操作者がさらに別解釈の出力を指示した場合は、
Ｓ５０７以降の処理を繰り返す（Ｓ５１０）。また、操
作者が別解釈の翻訳文が正しいと判断した場合に、構文
解析の学習を行わないならば処理は終了する（Ｓ５１
１）。

【００４１】これに対し、操作者が学習を行う場合は、
最優先解の構文解析結果と、操作者が正しいと判断した
翻訳文を生成した構文解析結果を解析結果差分抽出部６
に送り、解析結果差分抽出部６では双方の構文解析結果
を比較した上で差分の局所構文構造（以後、「差分構造
対」とする）を抽出し、出力表示部７に出力する（Ｓ５
１２）。

【００４２】この差分構造対は複数の場合もあるため、
学習処理の済んでいない差分構造対がある間は学習処理
のステップを繰り返す（Ｓ５１４）が、なければ処理を
終了する（Ｓ５１３）。学習処理の詳細は、第７図のフ
ローを参照しながら具体的に説明する。

【００４３】差分構造対から自動的に学習データを作成
する場合は、差分構造対のうち優先すべき方の構文構造
を学習データ自動生成部８に送り（Ｓ７０１）、学習デ
ータ自動生成部８では、送られた構文構造が差分構造対
の他方の構文構造より優先されることを示すのに必要な
データを付与した学習データを生成し、学習データ記憶
部９に保存し、学習処理は終了する（Ｓ７０２）。この
とき、局所構文構造に与える優先度得点の総和が大きい
構文解析結果を優先させる構文解析方式を採る場合であ
れば、差分構造対の他方の構文構造が持っていた得点を
上回るだけの加算得点データが学習データの優先を示す
のに必要なデータに相当する。

【００４４】Ｓ７０１で操作者が自動学習を選択しない
場合は、学習処理の対象となる差分構造対とそれぞれの
構文構造に与えられた優先度得点をその得点を与えてい
る優先度条件とともに出力表示部７に表示する（Ｓ７０
３）。このとき、一方の構文構造が既に学習されたもの
である場合は、学習された時の語と学習により追加され
た優先度得点も表示する。ここで、該差分構造対の優先
度を逆転させるために、構文構造優先度記憶部１０に保
持している優先度条件の修正、或いは削除、もしくはそ
の優先度条件に対する優先度得点を変更する場合には以
下の処理を行い、そうでない場合はＳ７０６へ進む（Ｓ
７０４）。構文構造優先度修正部１１は、操作者の入力
する修正データに従い、構文構造優先度記憶部１０に保
存されている優先度条件もしくは優先度得点データを書
き換え、学習処理は終了する（Ｓ７０５）。

【００４５】Ｓ７０４で優先度条件や優先度得点の修正
を行わず、以下の学習処理も行わない場合は処理を終了
する（Ｓ７０６）。学習の適用範囲を該差分構造対の場
合に限定はするが、操作者が優先させたい方の局所構文
構造を形成している該入力単語そのものの組合せに限ら
ず、その単語が属する品詞や意味区分にまで適用範囲を
拡大する学習処理を行うため、差分構造対のうち優先す
べき方の構文構造を学習データ作成支援部１２に送り、
学習データ作成支援部１２は、学習データ作成のための
初期データとして構文構造そのものと構文構造を構成す
る各文節の品詞や意味区分等の属性情報を抽出し、出力
表示部７に表示する（Ｓ７０７）。操作者による各属性
に対する条件付与によって学習の適用範囲の具体的な指
示が行われ、さらに学習データに対する加算得点が与え
られたら、これに従って学習データ作成支援部１２は各
文節に対する学習データの適用条件と該入力単語を併記
し、これに優先度得点の加算得点を付加した学習データ
を作成し、学習データ記憶部９に保存した後、学習処理
を終了する（Ｓ７０８）。

【００４６】例えば、図９（ａ）の解析結果に基づく翻
訳結果の例を図９（ｂ）に示す。このとき該装置の操作
者が解析結果２に対する翻訳文の方を適当と判断して構
文解析結果を学習させる過程を説明する。まず、該装置
が最優先とした解析結果の構文構造と操作者が選択した
方との差分構造対を得るために、依存構造木の枝分かれ
部分を解き、一致する枝を削除した残りを依存構造木に
再構築する。これにより、操作者が構文構造の誤り箇所
を指摘できない場合でも図９（ｃ）に示すように差分構
造対が抽出される。

【００４７】構文構造の学習を自動的に行う場合は、学
習の適用条件を該入力単語に限定した学習データが自動
生成される、このとき、学習データ自動生成部８は図１
１の構文構造１と２の間の優先度得点の差（１点）を逆
転させるのに必要な得点（２点）を与えた学習データを
図１２のように生成する。図１２に示した学習データの
適用範囲は、「私が」「新しい」「本を」「貸した」の
４文節から成る構文構造に限定されるが、「私が昨日彼
に新しい本を２冊貸した」のように他の修飾語が存在し
ても学習データは適用される。

【００４８】また、操作者が定義されている優先度得点
そのものを修正する場合は、差分構造対とそれぞれの構
文構造に対する優先度得点をその得点を与える優先度条
件とともに操作者に提示し、操作者はこの優先度条件の
修正や削除、或はその条件に応じた優先度得点を変更す
ることができる。図１０においては、これらの表示例
と、操作者が名詞又は代名詞が動詞を修飾しているとき
という条件に対する優先度得点をそれぞれ２点から１０
点に引き上げることによって構文構造全体の優先度得点
が逆転する様子を示している。このように優先度得点を
変更させることは、特定の構文構造に限らず極めて広範
囲の入力に対して作用を及ぼす。

【００４９】さらに、このような優先度得点の変更を行
わずに適用範囲の明確な構文構造の学習を行う場合は、
学習対象となる構文構造とそこに属する各文節を構成す
る語の属性情報を格納した学習用初期データを作成し、
図１１に示すように操作者に提示する。操作者は、提示
された各属性情報を元に学習適用条件の設定を行う。

【００５０】操作者が学習データを作成した例として図
１３を挙げる。図中の記号＊（アスタリスク）はその項
目に任意の要素を許すことを表しており、例えば［中心
語＝＊］，［付属語＝を］，［品詞＝名詞］，［意味＝
＊］の条件は、「付属語『を』を伴う任意の名詞」であ
ることを表している。図１３に示す学習データは入力文
「私が新しい本を彼に貸した」に対して、以後操作者の
指定した構文構造を必ず優先させる効果を持つが、操作
者が適用範囲を拡大した図１３の例の学習データの方
が、該装置が自動生成した例の図１２の学習データに比
較して、より多様な入力文に対応できる。例えば、文
「彼が難しい英語の本をすらすら読むのを見ていると私
は羨ましく思う」を解析処理した結果のいくつかの依存
構造木の中で、図１４に示す構造は図１３の学習データ
の構造を含んでいるため学習処理による構文構造の指定
が反映され、学習効果が得られる。

【００５１】次に、操作者が過去の学習と矛盾した学習
を行うことを防ぐ例を説明する。文「彼女が欲しい服を
あげた」を解析処理する際に、図１３の学習データが適
用されたものとすると、［彼女が］が［あげた］を修飾
する解釈が優先されるが、ここで操作者が［彼女が］が
［欲しい］を修飾する解釈を優先させるべきであると考
えて学習データを取り消してしまうことのないように、
学習を行った際に実際に登録されている学習データの適
用が適切であった場合の単語を図１５のように提示す
る。この画面でユーザは今回の解釈を優先させるべく、
さらに要素の限定をして登録を行う。図１６の例では、
中心語を［欲しい］に限定し、また、動詞を連用形であ
り、授行為の意味をもち付属語「た」を持つものに限定
している。これにより、過去の学習効果を失うことなく
［彼女が］が［欲しい］を修飾するように学習データを
追加することができる。

【００５２】

【発明の効果】以上詳述したように、この発明によれ
ば、１つの入力文から複数提示された翻訳文の内、装置
が最優先と見なした解析結果から変換生成された翻訳文
が適切でなかった場合に、その解析結果と操作者が最も
適当であると判断した目標言語文を生成した解析結果を
比較し、それぞれの解析結果から構造の異なる部分を局
所構文構造として抽出する解析結果差分抽出部を備える
ことにより構文解析処理結果から適当でないと思われる
箇所を自動的に抽出できることから、操作者が翻訳文の
適不適は判断できるが構文解析結果の不適当な箇所を指
摘するのが困難であるという場合にも、付与される優先
度が適当でない局所構文構造を提示することができる。

【００５３】さらに、抽出された構文解析処理の誤りが
繰り返されることを防ぐ手段として、操作者が適当と考
える翻訳結果を以後優先させるための構文構造学習デー
タを自動生成する学習データ自動生成部とその学習デー
タを保持する学習データ記憶部を備えることにより、操
作者が学習させたい構造に関する複雑な登録作業を行わ
なくても、優先させたい構文構造の学習データを該装置
が自動的に作成して、同一単語による同一構文構造の再
現に対しては、再び修正を行わなくても操作者の望む翻
訳結果が最優先に出力されるようになる。

【００５４】また、各々の局所構文構造に対して与える
優先度の大きさを決定するための優先度得点データを、
その得点を付与する優先度条件と併せて保持する構文構
造優先度記憶部とこれらを提示する出力表示部を備える
ことにより、該装置が構文構造に与えた優先度の根拠を
具体的に操作者に示すことができる。

【００５５】さらに、構文構造優先度記憶部に保持され
る優先度データを操作者の指示に従って修正登録する構
文構造優先度修正部を備えることにより、経験的知識と
して与えられる構文構造の持つ一般的優先度を変更する
ことが可能となり、操作者は該装置の行う構文解析処理
に対して、特定の語により構成される構文構造に限定し
ない汎用的な調整を及ぼすことが可能になる。

【００５６】また、優先度を変更したい局所構文構造を
構成する単語について、品詞や意味等の条件を付与した
学習データの作成をするために必要なデータを操作者に
提示し、操作者の意図する適用条件を具備した学習デー
タを作成する学習データ作成支援部とその学習データを
保持する学習データ記憶部を備えることにより、学習デ
ータ作成支援部から提示される入力語の属性情報を基
に、優先させたい構文構造の構成要素を操作者が詳細に
指示できる場合に、その細かい意図を十分に反映でき、
適用範囲の広い学習データを作成することが可能とな
る。

【００５７】さらに、上記学習データ記憶部に、学習時
に構文構造の構成要素であった単語を併記しておくこと
により、過去に作成した学習データの根拠が提示でき、
矛盾した学習データの作成を防ぎ、作業効率を向上させ
ることができる。

【００５８】このように、操作者の嗜好や用途あるいは
言語に対する習熟度等に応じた学習手段を選択できる
上、翻訳結果の修正や学習データ作成のための操作者の
作業効率を向上させるという効果がある。

【図面の簡単な説明】

【図１】本発明の一実施例を示すブロック図である。

【図２】英語文の構文構造を句構造木で表現した例の構
造図である。

【図３】日本語文の構文構造を句構造木と依存構造木で
表現した例の構造図である。

【図４】複数の解析結果があり、互いに矛盾した学習を
繰り返す場合を説明する図である。

【図５】本発明の一実施例の動作を示すフローチャート
である。

【図６】構文解析処理（図５のＳ５０３）における処理
を示すフローチャートである。

【図７】学習処理（図５のＳ５１４）における処理を示
すフローチャートである。

【図８】構文構造に与える優先度得点を説明する図であ
る。

【図９】構文構造の差分抽出を説明する図である。

【図１０】構文解析で優先度付けに使用する規則に対す
る優先度得点変更を説明する図である。

【図１１】学習のための初期データを説明する図であ
る。

【図１２】自動生成された学習データの例を説明する図
である。

【図１３】操作者が指定した学習データの例を説明する
図である。

【図１４】学習データが他の文に適用される場合を説明
する図である。

【図１５】学習データの修正を要する場合に、過去の学
習の根拠を提示する例を説明する図である。

【図１６】過去の学習と矛盾しない学習データの作成を
説明する図である。

【符合の説明】

１入力部２形態素解析処理部３構文解析処理部４構文解析結果記憶部５変換生成処理部６解析結果差分抽出部７出力表示部８学習データ自動生成部９学習データ記憶部１０構文構造優先度記憶部１１構文構造優先度修正部１２学習データ作成支援部

Claims

【特許請求の範囲】

【請求項１】入力文として第１言語で記述された文を読
み込む入力部と、前記入力部によって入力された入力文を形態素に分解
し、解析を行う形態素解析処理部と、前記形態素解析処理部によって、形態素解析された各形
態素間の構文構造を解析する構文解析処理部と、前記構文解析処理部の処理結果を保持する構文解析結果
記憶部と、前記構文解析処理部の解析結果から第２言語に変換生成
処理を行う変換生成処理部と、前記構文解析処理部および変換生成処理部の処理結果を
出力する出力部とを備えた機械翻訳装置において、前記構文解析処理部において、最優先と判断された解析
結果と、ユーザが最も適当であると判断した解析結果を
比較し、それぞれの解析結果の構文構造において、異な
る部分を局所構文構造として抽出する解析結果差分抽出
部を備え、前記出力部より併せて出力することを特徴と
する機械翻訳装置。
【請求項２】前記解析結果差分抽出部で抽出された局所
構文構造に対して、ユーザが選択した結果を以後優先さ
せるための構文構造学習データを自動的に作成する学習
データ自動生成部と、該学習データを保持する学習デー
タ記憶部を備え、前記学習データに基づいて、構文構造
の優先度を変更することを特徴とする請求項１記載の機
械翻訳装置。
【請求項３】前記構文解析処理部の処理結果において、
係り受け関係をなす形態素成分において、入力文におけ
る相対位置、品詞の属性条件などの優先度条件に応じ
て、係り受け関係の結び付きの深さを数値化した優先度
得点データを、優先度条件と併せて保持する構文構造優
先度記憶部を備え、前記構文解析処理部における優先順
位を該構文構造の優先度得点の総和の大小で決定し、前
記出力部より優先度得点データと優先度条件を併せて出
力することを特徴とする請求項１記載の機械翻訳装置。
【請求項４】前記解析結果差分抽出部で抽出された局所
構文構造に対して、該構文構造に対する優先度条件と該
優先度得点を前記出力部に出力し、優先度条件に対する
優先度得点をユーザに修正させる構文構造優先度修正部
を備えることを特徴とする請求項３記載の機械翻訳装
置。
【請求項５】前記解析結果差分抽出部で抽出された局所
構文構造に対して、該構文構造に対する優先度得点、お
よび局所構文構造を構成する単語についての品詞、意味
などの学習データを前記出力部より出力し、ユーザに修
正、変更させる学習データ作成支援部を備えることを特
徴とする請求項３記載の機械翻訳装置。