JPH08235186A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH08235186A
JPH08235186A JP7041646A JP4164695A JPH08235186A JP H08235186 A JPH08235186 A JP H08235186A JP 7041646 A JP7041646 A JP 7041646A JP 4164695 A JP4164695 A JP 4164695A JP H08235186 A JPH08235186 A JP H08235186A
Authority
JP
Japan
Prior art keywords
priority
unit
analysis
result
syntactic structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7041646A
Other languages
English (en)
Other versions
JP3281746B2 (ja
Inventor
Hiroshi Tanano
裕氏 棚野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04164695A priority Critical patent/JP3281746B2/ja
Publication of JPH08235186A publication Critical patent/JPH08235186A/ja
Application granted granted Critical
Publication of JP3281746B2 publication Critical patent/JP3281746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 機械翻訳装置において、一つの入力文に対し
て複数の解析結果を持つ場合に、それぞれの解析結果か
ら生成される翻訳文からユーザが一つ選択することによ
り、構文解析の違いを自動的に抽出し、学習機能とし
て、自動学習や規則の修正を可能とする。 【構成】 入力部1より入力された文を形態素解析処理
部2、構文解析処理部3で解析を行い、構文構造優先度
記憶部10のデータに基づいて優先順位を決定し、ユー
ザの選択した結果と解析結果差分抽出部6で差分を抽出
し、学習を行い、出力表示部7に出力を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、第1言語で書かれた入
力文を、所望の第2言語に翻訳して出力する機械翻訳装
置に関する。
【0002】
【従来の技術】従来、機械翻訳装置において、複数通り
の構文構造が得られた場合、つまり複数通りの翻訳結果
が得られる場合には、それらの間で優先順位を決定する
必要がある。この優先順位を決定する手段としては、 (1)意味解析 (2)共起関係 (3)文法規則の記述順序 などがある。
【0003】(1)の意味解析の具体的な方法として
は、単語辞書に意味カテゴリー情報を書き込んでおき、
構文解析によって単語間の係り受け決定する際、係り受
けをする単語の間で意味カテゴリーが一致しないような
構文構造は採用しない、もしくは優先順位を下げるとい
うものである。
【0004】(2)の共起関係の利用は、意味関係の一
種とも言えるが、ある単語について係り受けの相手先の
単語を指定して辞書に記述しておき、構文解析によって
単語間の係り受けが決定する際、係り受けの相手先の単
語が辞書記述と一致しないような構文構造は採用しな
い、または優先順位を下げるというものである。
【0005】(3)の文法規則の記述順序は、構文解析
のための規則を用いる。文法規則をメモリ上に記述する
順序を例えば、優先させたい順に記述するなどして、調
節することによって、個々の文法規則についてそれぞれ
の適用されやすさを変えることができるので、結果とし
て、特定の構文構造を作りやすくすることができるよう
になる。
【0006】また、構文構造を学習することによって、
機械翻訳の正当率を向上させる技術が存在する。特開平
2−148261号公報「構文学習機能付機械翻訳装
置」において、装置が出力した解析結果をユーザが修正
し、以後の翻訳指示において、この修正履歴を用いて解
析処理を行うことによって、同一の修正を回避するもの
である。
【0007】さらに、特開平6−195377「構文優
先度学習方式の機械翻訳装置」においては、入力文の構
文構造を句構造と捉える解析処理を行い、ユーザが適切
と考える句構造全体を優先すべき構造と考え、以後の翻
訳処理において、この句構造の優先度を用いて解析結果
の優先度解釈を行っている。
【0008】しかしながら、特開平2−148261号
公報の技術では、ユーザが解析処理の誤り箇所を適切に
指摘し得ることが前提条件となっており、それが不可能
な場合は機能しないという問題があった。解析処理の誤
りを訂正するという作業は、言語の文法構造に精通して
いる者でない場合は大変労力を要するものになってしま
う。
【0009】また、特開平6−195377号公報の技
術では、大局的な構文構造を捉えようとしながら局所構
造まで限定した優先度規則を用いるため、それぞれの学
習結果の適用単位は極めて限定され、汎用的でない。そ
の上、複数の構文解析結果間の優先度に差を生じる本質
的原因となっている局所構造の違いを抽出できないとい
う問題がある。さらに上記のいづれの技術においても、
学習の対象となるのは入力文全体もしくは入力文中で連
続している句に限られており、日本語のように修飾句の
出現位置が必ずしも一意に定まらない言語に対しては、
十分に機能しないものであった。
【0010】
【発明が解決しようとする課題】一般的に、翻訳処理装
置において、入力文に対して解析処理が行われると、意
味処理等にびょる係り受け候補絞り込みが行われ、1つ
ないしは複数の構文解析結果が得られる。この構文解析
結果として得られる構文構造を句構造で捉えることは少
なくとも日本語に関しては最適とは言えない。
【0011】例えば、英語文 “I bought books yesterda
y.” の構文構造を句構造で捉えた場合の解析結果例を図2で
表す。このとき、“I”“bought”“book
s”“yesterday”“.”の各形態素成分の組
み合わせで同じ意味を表現する文を生成するためには、
一意に図2の句構造を成す文を生成せざるを得ない。よ
って、この構文構造と文意とは一対一に対応していると
いえる。
【0012】しかし例えば、3つの日本語文「私は昨日
本を買った」「昨日私は本を買った」「私は本を昨日買
った」の構文構造を句構造で捉えると、それぞれ図3の
(a)(b)(c)に示すように別の構文構造を持つ文
と解析されるが、これら3つの文の文意はほぼ同じであ
ることから、構文構造と文意が一対一に対応していると
は言えない。
【0013】そこで、日本語文においては、形態素成分
間の修飾/被修飾関係を修飾後の被修飾語に対する依存
関係とみて構文構造を依存構造で表現する方法がとられ
ることが多い。上記3つの文も構文構造を依存構造で捉
えると、全て図3(d)の形に集約され、構文構造と文
意が一対一に対応させることが可能となり、直感的にも
日本語の構文構造を理解しやすい形態になる。なお、図
2および図3における「名詞句」「動詞句」「主節」
「文」等の用語は、説明図の理解を助けるために便宜上
与えた呼称である。
【0014】従来の翻訳処理装置においても、複数の解
析結果が得られた場合に、それぞれの解析結果に対して
なんらかの優先度づけを行い、最も適当と思われる解析
結果を用いて翻訳文を生成したり、適当と思われる順番
がユーザに明示できる形で全ての解析結果に基づく翻訳
文を提示する機能や、各形態素成分間の係り受けを明示
的に指定することによって、所望する解析結果を得るこ
とが可能であり、この係り受けの指定内容を記憶してお
くことにより局所構文構造の学習を行うものもあった
が、構文構造の複雑な文では出力された翻訳文が入力文
に対して不適当な出力であるとユーザに理解できても、
その原因を構文解析結果から的確に指摘できないことが
多く、特にユーザが日本語に精通していない場合は係り
受けの指定はほとんど不可能であり、このような学習機
能は利用できないことがあった。
【0015】また、従来の翻訳処理装置において、構文
構造の学習を行う場合には、必ずどのような単語列に対
して特定の構文構造を優先させるのかをユーザが指定し
なければならなかった上に、連続する単語列が再現しな
ければ学習が反映されないため、入力文が修飾句の挿入
位置に対する制約が少ない日本語の場合は、学習の効果
が現れにくかった。
【0016】例えば、「私のテニスのラケット」を構文
解析した結果、「私の」が「テニスの」を修飾する解
(図4(a))と、「私の」が「ラケット」を修飾する
解(図4(b))が存在するものとし、後者の解析結果
を優先させるようにした場合に、「私の大切なテニスの
ラケット」のように挿入句(この場合は「大切な」)が
存在するだけで、同じ構文構造を含む文であるというこ
とが認識されていないために、学習機能を利用すること
ができなかった。
【0017】また、構文解析した結果の構文構造を表示
する機能を持つ翻訳処理装置は存在したが、どのような
構文構造を優先させたことによって、その構文解析結果
全体が優先されるに至ったのかを明示的に操作者に提示
する機能は持たなかった。
【0018】さらに、構文構造の優先度を決定する構文
解析規則の中に、ユーザにとって不適当であると考えら
れるものが存在しても、これを操作者が修正する手段は
存在していなかった。
【0019】上記の「私のテニスのラケット」の例で
「[名詞1]の[名詞2]の[名詞3]」の形態素列を
[名詞1」と[名詞2]が両方[名詞3]を修飾するよ
うに学習したとする(図4(d))と、文「私のラケッ
トの傷」の場合にもこの学習パターンが誤って適用され
てしまう(図4(e))ため、学習パターンの適用条件
を細かく制御するには「AのBのC」のように表層的な
パターンの一致で画一的に処理することは、多様な言語
現象に対応する上で適当ではない。
【0020】さらに、上記例において、「[名詞1]の
[名詞2]の[名詞3]」の形態素列に対して、「私の
テニスのラケット」が入力の場合に[名詞1]と[名詞
2]が両方[名詞3]を修飾するのが正しいと判断する
ことと、「私のラケットの傷」が入力の場合に[名詞
1]が[名詞2]を[名詞2]が[名詞3]をそれぞれ
修飾するのに正しいと判断することと、「私のラケット
の傷」が入力の場合に[名詞1]が[名詞2]を[名詞
2]が[名詞3]をそれぞれ修飾するのが正しいと判断
することは互いに矛盾した判断であるが、相互に反例と
して存在することを確認する手段は与えられてないなか
ったので、矛盾した学習を行う可能性があった。
【0021】本発明の目的は、このような課題を解決
し、装置が出力する複数の構文解析結果のうち最適と思
われるもの、あるいはそれらの解析結果に基づく翻訳文
のうち、最適と思われるもののいずれかを操作者が選択
することによって、構文解析結果の誤り箇所を自動的に
抽出し、正しい構造の学習も自動的に行う機能を持ち、
さらに誤りを発生させた原因となったデータをユーザに
提示し、これをユーザが修正可能とする機能や、品詞や
意味などの詳細な適用条件の割り当てが可能な局所構文
構造の学習機能を持ち、学習されたデータがどのような
入力に対応して作成されたものであるかを提示できる、
構文構造学習機能を持つ翻訳処理装置を提供することで
ある。
【0022】
【課題を解決するための手段】本発明による翻訳処理装
置は、日本語文データを読み込む入力部と、入力部で入
力された日本語文データを形態素成分に分解・解析する
形態素解析処理部と、各形態素成分間の構文構造を解析
する構文解析処理部と、構文解析結果をそれぞれの優先
順位と併せて保持するための構文解析結果記憶部と、す
べての解析結果を元に、それぞれに対して目標言語文へ
の変換生成処理を行う変換生成処理部と、構文解析処理
部を備える。
【0023】さらに、最優先と判断された解析結果と該
装置のユーザが最も適当であると判断した目標言語文を
生成した解析結果を比較し、それぞれの解析結果から構
造の異なる部分を局所構文構造として抽出する解析結果
差分抽出部と、生成された全ての目標言語文や解析結果
差分抽出部で抽出された構文構造を表示する出力表示部
と、解析結果差分抽出部で抽出された2つの局所構文構
造に対して、該装置のユーザが選択した方を優先させる
ための構文構造学習データを自動生成する学習データ自
動生成部と、その学習データを保持する学習データ記憶
部と直接係り受け関係を成す形態素成分に対して、入力
分における相対位置、あるいはそれぞれの品詞などの属
性条件に応じて、それらの結び付きの深さを数値化した
優先度得点データを、その得点を付与する優先度条件と
併せて保持する構文構造優先度記録部と、そこに保持さ
れる優先度データをユーザの指示に従って修正登録する
構文構造優先度修正部と、局所構文構造を構成する単語
について品詞や意味などの条件を付与した学習データの
作成をするために必要なデータをユーザに提示し、ユー
ザの意図する適用条件を具備した学習データを作成する
学習データ作成支援部を備える。
【0024】これにより、出力された目標言語文の中か
ら該装置のユーザが最も適切と思われる文を採択するだ
けで、その構文解析結果から修正を要する局所構文構造
を抽出することが可能であり、優先させるべき一方の構
造を以後必ず優先させるための学習データを自動的に作
成することができ、該装置が最も適当と見なした構文解
析結果を優先させた根拠となるデータをユーザに明示で
きる上に、構文構造の優先度を決定するデータを該装置
のユーザが直接変更可能とする機能を備え、ユーザによ
る品詞や意味などの適用条件の自在な割り当てが可能な
局所構文構造の学習データ作成支援機能を備え、学習デ
ータを用いて解析された結果を表示する際に、以前行っ
た学習の根拠を提示するために、その学習データ作成時
にその構文構造を構成していた単語を併せて表示する機
能を備えたものである。
【0025】
【作用】本発明請求項1および3の構成によれば、翻訳
処理装置が複数の解析結果をもとにそれぞれに対応する
翻訳文を出力した場合に、それらの翻訳文の中に、シス
テムが最優先と判断した翻訳文より適当と思われる翻訳
文が存在し、それをユーザが選択することにより、2つ
の解析結果から自動的に局所構文構造を抽出し、ユーザ
に提示する。
【0026】請求項2の構成によれば、抽出した局所構
文構造のうち、優先すべき解析結果の学習データを自動
的に生成する。さらに、システムが構文構造の優先度を
決定する根拠としている優先度条件と優先度得点データ
をユーザに提示する。
【0027】また、請求項4および5の構成によれば、
優先順位を逆転させるために(ユーザの選択した構文構
造を優先させるために)、ユーザは上記データを変更す
ることにより優先度の調整が可能である。さらに優先順
位を入れ替えるための学習データを、品詞や意味などの
適用条件を任意に登録することが可能である。
【0028】
【実施例】本発明の一実施例として、入力言語として日
本語、目標言語として英語として、日本語から英語への
日英翻訳処理について、図面を用いて詳細に説明する。
【0029】図1は本発明による機械翻訳装置の構成の
一例である。1は入力部、2は形態素解析処理部、3は
構文解析処理部、4は構文解析結果記憶部、5は変換生
成処理部、6は解析結果差分抽出部、7は出力表示部、
8は学習データ生成部、9は学習データ記憶部、10は
構文構造優先度記憶部、11は構文構造優先度修正部、
12は学習データ作成支援部である。
【0030】図5のフローチャートを参照しながら、本
発明における機械翻訳装置の動作を具体的に説明する。
【0031】まず、入力部1において、日本語文データ
1文を取り出し、形態素解析処理部2へ送る(S50
1)。次に、形態素解析処理部2では、入力された分か
ら抽出可能な単語を全て抽出し、これらの単語の組み合
わせとしえ構成される文節を可能な限り抽出し、この文
節列で入力文全体を構成できるような文節の組み合わせ
を得る(S502)。次に、形態素解析結果である文節
の集合に対して、構文解析処理部3で構文解析処理を行
う(S503)。構文解析処理については、図6のフロ
ーチャートを参照して説明する。
【0032】入力文中で前方に存在した構文構造がそれ
より後方に存在した構文構造に係り得るかどうかの判断
を、形態素解析結果として得られた全ての文節の集合を
含む構文解析の中間結果として得られた全ての構文構造
に対して行っているかどうかを確認し(S601)、そ
うでなければ以下の処理を行う。
【0033】まず、任意の2つの構文構造(形態素解析
結果の文節も含む)について、それぞれの構造を構成す
る依存構造木の最上位に位置する文節を成す語の品詞や
意味などによる係り受け規則に基づいて判断し、係り受
け可能と判断された構文構造対に対しては、構文構造優
先度記憶部10を参照の上、該当する優先度条件に与え
られる優先度得点をそれぞれの構文構造が持つ優先度得
点(形態素解析結果の文節は得点を持たないとしても良
いし、優先度を持たせるために初期得点を与えておくよ
うにすることも可能)に加算し、2つの構文構造対を包
含する新たな構文構造木を生成する(S602)。
【0034】続いて、学習データ記憶部9を参照し、生
成された構文構造が学習されている構文構造であるかど
うかを調べ(S603)、学習データがあればその学習
データに与えられている得点をS602で付与した優先
度得点に加算する(S604)。
【0035】例文「私が新しい本を彼に貸した」が入力
された場合の構文解析処理の過程を説明する。この文を
形態素解析処理した結果、抽出される文節列の例は図8
(a)のようになる。ここで、抽出される文節列、ある
いは「代名詞」「形容詞」等の品詞名や「終止形」等の
活用形名については、根拠とする文法体系等の際により
一義的に定まるものではないが、その不確定要素は本発
明の作用に影響を与えるものではない。
【0036】形態素解析処理で抽出されたこれらの文節
に対して、構文解析処理が行われ、構文構造に優先度得
点が与えられる過程を図8(c)(d)に示す。例え
ば、文節[私が]が文節[新しい]を修飾可能であると
解析されたら、構文構造優先度記憶部8からこの係り受
け構造に適合する優先度条件を探す。構文構造優先度記
憶部8に記述される優先度条件と優先度得点データの例
を図8(b)に示す。この例の場合は文節距離の近い係
り受けを優先する優先度条件(図8(b)条件1)が該
当し、[“文節距離”×(−1)]に相当する(−1)
点が構文構造[[私が]→[新しい]]に与えられる優
先度得点として加算され、元の[私が]と[新しい]の
得点の和は0点であるので(各単語そのものに得点はな
い)、結局優先度得点は(−1)点となる(図8
(c))。
【0037】ここで、[[私が]→[新しい]]は、
[私が]が[新しい]を修飾する依存構造[[彼に]→
[貸した]]を修飾する場合にも図8(d)に示すよう
に、元の構文構造の優先度得点の和が0点で、適用され
る優先度条件(図8(b)条件1、4)による得点の加
算が計0点であるので、構文構造[[[新しい]→[本
を]]/[彼に]→[貸した]]に対する優先度得点は
合計0点となる。ここで、[[[新しい]→[本を]]
/[彼に]→[貸した]]は[[新しい]→[本を]]
と[彼に]が[貸した]を修飾するという依存関係を表
すものとする。
【0038】構文解析結果記憶部4に保管されている構
文解析結果のうち、優先度得点最高の解を変換生成処理
部5に送り、変換生成処理を行い(S504)、変換生
成結果として翻訳文を出力表示部7に出力する(S50
5)。
【0039】ここで、該装置の操作者が次候補の解析結
果による翻訳文(以後、「別解釈」とする)出力を命令
しなければ処理は終了する(S506)。同様に、これ
以上別解釈が存在しない場合も処理は終了する(S50
7)。
【0040】操作者が別解釈出力を指示し、かつ別解釈
が存在する場合は、構文解析結果記憶部4より優先度得
点が次に高い解を変換生成処理部5に送り、変換生成処
理を行い(S508)、翻訳文を最優先解から生成した
翻訳文を併記して出力表示部7に出力する(S50
9)。操作者がさらに別解釈の出力を指示した場合は、
S507以降の処理を繰り返す(S510)。また、操
作者が別解釈の翻訳文が正しいと判断した場合に、構文
解析の学習を行わないならば処理は終了する(S51
1)。
【0041】これに対し、操作者が学習を行う場合は、
最優先解の構文解析結果と、操作者が正しいと判断した
翻訳文を生成した構文解析結果を解析結果差分抽出部6
に送り、解析結果差分抽出部6では双方の構文解析結果
を比較した上で差分の局所構文構造(以後、「差分構造
対」とする)を抽出し、出力表示部7に出力する(S5
12)。
【0042】この差分構造対は複数の場合もあるため、
学習処理の済んでいない差分構造対がある間は学習処理
のステップを繰り返す(S514)が、なければ処理を
終了する(S513)。学習処理の詳細は、第7図のフ
ローを参照しながら具体的に説明する。
【0043】差分構造対から自動的に学習データを作成
する場合は、差分構造対のうち優先すべき方の構文構造
を学習データ自動生成部8に送り(S701)、学習デ
ータ自動生成部8では、送られた構文構造が差分構造対
の他方の構文構造より優先されることを示すのに必要な
データを付与した学習データを生成し、学習データ記憶
部9に保存し、学習処理は終了する(S702)。この
とき、局所構文構造に与える優先度得点の総和が大きい
構文解析結果を優先させる構文解析方式を採る場合であ
れば、差分構造対の他方の構文構造が持っていた得点を
上回るだけの加算得点データが学習データの優先を示す
のに必要なデータに相当する。
【0044】S701で操作者が自動学習を選択しない
場合は、学習処理の対象となる差分構造対とそれぞれの
構文構造に与えられた優先度得点をその得点を与えてい
る優先度条件とともに出力表示部7に表示する(S70
3)。このとき、一方の構文構造が既に学習されたもの
である場合は、学習された時の語と学習により追加され
た優先度得点も表示する。ここで、該差分構造対の優先
度を逆転させるために、構文構造優先度記憶部10に保
持している優先度条件の修正、或いは削除、もしくはそ
の優先度条件に対する優先度得点を変更する場合には以
下の処理を行い、そうでない場合はS706へ進む(S
704)。構文構造優先度修正部11は、操作者の入力
する修正データに従い、構文構造優先度記憶部10に保
存されている優先度条件もしくは優先度得点データを書
き換え、学習処理は終了する(S705)。
【0045】S704で優先度条件や優先度得点の修正
を行わず、以下の学習処理も行わない場合は処理を終了
する(S706)。学習の適用範囲を該差分構造対の場
合に限定はするが、操作者が優先させたい方の局所構文
構造を形成している該入力単語そのものの組合せに限ら
ず、その単語が属する品詞や意味区分にまで適用範囲を
拡大する学習処理を行うため、差分構造対のうち優先す
べき方の構文構造を学習データ作成支援部12に送り、
学習データ作成支援部12は、学習データ作成のための
初期データとして構文構造そのものと構文構造を構成す
る各文節の品詞や意味区分等の属性情報を抽出し、出力
表示部7に表示する(S707)。操作者による各属性
に対する条件付与によって学習の適用範囲の具体的な指
示が行われ、さらに学習データに対する加算得点が与え
られたら、これに従って学習データ作成支援部12は各
文節に対する学習データの適用条件と該入力単語を併記
し、これに優先度得点の加算得点を付加した学習データ
を作成し、学習データ記憶部9に保存した後、学習処理
を終了する(S708)。
【0046】例えば、図9(a)の解析結果に基づく翻
訳結果の例を図9(b)に示す。このとき該装置の操作
者が解析結果2に対する翻訳文の方を適当と判断して構
文解析結果を学習させる過程を説明する。まず、該装置
が最優先とした解析結果の構文構造と操作者が選択した
方との差分構造対を得るために、依存構造木の枝分かれ
部分を解き、一致する枝を削除した残りを依存構造木に
再構築する。これにより、操作者が構文構造の誤り箇所
を指摘できない場合でも図9(c)に示すように差分構
造対が抽出される。
【0047】構文構造の学習を自動的に行う場合は、学
習の適用条件を該入力単語に限定した学習データが自動
生成される、このとき、学習データ自動生成部8は図1
1の構文構造1と2の間の優先度得点の差(1点)を逆
転させるのに必要な得点(2点)を与えた学習データを
図12のように生成する。図12に示した学習データの
適用範囲は、「私が」「新しい」「本を」「貸した」の
4文節から成る構文構造に限定されるが、「私が昨日彼
に新しい本を2冊貸した」のように他の修飾語が存在し
ても学習データは適用される。
【0048】また、操作者が定義されている優先度得点
そのものを修正する場合は、差分構造対とそれぞれの構
文構造に対する優先度得点をその得点を与える優先度条
件とともに操作者に提示し、操作者はこの優先度条件の
修正や削除、或はその条件に応じた優先度得点を変更す
ることができる。図10においては、これらの表示例
と、操作者が名詞又は代名詞が動詞を修飾しているとき
という条件に対する優先度得点をそれぞれ2点から10
点に引き上げることによって構文構造全体の優先度得点
が逆転する様子を示している。このように優先度得点を
変更させることは、特定の構文構造に限らず極めて広範
囲の入力に対して作用を及ぼす。
【0049】さらに、このような優先度得点の変更を行
わずに適用範囲の明確な構文構造の学習を行う場合は、
学習対象となる構文構造とそこに属する各文節を構成す
る語の属性情報を格納した学習用初期データを作成し、
図11に示すように操作者に提示する。操作者は、提示
された各属性情報を元に学習適用条件の設定を行う。
【0050】操作者が学習データを作成した例として図
13を挙げる。図中の記号*(アスタリスク)はその項
目に任意の要素を許すことを表しており、例えば[中心
語=*],[付属語=を],[品詞=名詞],[意味=
*]の条件は、「付属語『を』を伴う任意の名詞」であ
ることを表している。図13に示す学習データは入力文
「私が新しい本を彼に貸した」に対して、以後操作者の
指定した構文構造を必ず優先させる効果を持つが、操作
者が適用範囲を拡大した図13の例の学習データの方
が、該装置が自動生成した例の図12の学習データに比
較して、より多様な入力文に対応できる。例えば、文
「彼が難しい英語の本をすらすら読むのを見ていると私
は羨ましく思う」を解析処理した結果のいくつかの依存
構造木の中で、図14に示す構造は図13の学習データ
の構造を含んでいるため学習処理による構文構造の指定
が反映され、学習効果が得られる。
【0051】次に、操作者が過去の学習と矛盾した学習
を行うことを防ぐ例を説明する。文「彼女が欲しい服を
あげた」を解析処理する際に、図13の学習データが適
用されたものとすると、[彼女が]が[あげた]を修飾
する解釈が優先されるが、ここで操作者が[彼女が]が
[欲しい]を修飾する解釈を優先させるべきであると考
えて学習データを取り消してしまうことのないように、
学習を行った際に実際に登録されている学習データの適
用が適切であった場合の単語を図15のように提示す
る。この画面でユーザは今回の解釈を優先させるべく、
さらに要素の限定をして登録を行う。図16の例では、
中心語を[欲しい]に限定し、また、動詞を連用形であ
り、授行為の意味をもち付属語「た」を持つものに限定
している。これにより、過去の学習効果を失うことなく
[彼女が]が[欲しい]を修飾するように学習データを
追加することができる。
【0052】
【発明の効果】以上詳述したように、この発明によれ
ば、1つの入力文から複数提示された翻訳文の内、装置
が最優先と見なした解析結果から変換生成された翻訳文
が適切でなかった場合に、その解析結果と操作者が最も
適当であると判断した目標言語文を生成した解析結果を
比較し、それぞれの解析結果から構造の異なる部分を局
所構文構造として抽出する解析結果差分抽出部を備える
ことにより構文解析処理結果から適当でないと思われる
箇所を自動的に抽出できることから、操作者が翻訳文の
適不適は判断できるが構文解析結果の不適当な箇所を指
摘するのが困難であるという場合にも、付与される優先
度が適当でない局所構文構造を提示することができる。
【0053】さらに、抽出された構文解析処理の誤りが
繰り返されることを防ぐ手段として、操作者が適当と考
える翻訳結果を以後優先させるための構文構造学習デー
タを自動生成する学習データ自動生成部とその学習デー
タを保持する学習データ記憶部を備えることにより、操
作者が学習させたい構造に関する複雑な登録作業を行わ
なくても、優先させたい構文構造の学習データを該装置
が自動的に作成して、同一単語による同一構文構造の再
現に対しては、再び修正を行わなくても操作者の望む翻
訳結果が最優先に出力されるようになる。
【0054】また、各々の局所構文構造に対して与える
優先度の大きさを決定するための優先度得点データを、
その得点を付与する優先度条件と併せて保持する構文構
造優先度記憶部とこれらを提示する出力表示部を備える
ことにより、該装置が構文構造に与えた優先度の根拠を
具体的に操作者に示すことができる。
【0055】さらに、構文構造優先度記憶部に保持され
る優先度データを操作者の指示に従って修正登録する構
文構造優先度修正部を備えることにより、経験的知識と
して与えられる構文構造の持つ一般的優先度を変更する
ことが可能となり、操作者は該装置の行う構文解析処理
に対して、特定の語により構成される構文構造に限定し
ない汎用的な調整を及ぼすことが可能になる。
【0056】また、優先度を変更したい局所構文構造を
構成する単語について、品詞や意味等の条件を付与した
学習データの作成をするために必要なデータを操作者に
提示し、操作者の意図する適用条件を具備した学習デー
タを作成する学習データ作成支援部とその学習データを
保持する学習データ記憶部を備えることにより、学習デ
ータ作成支援部から提示される入力語の属性情報を基
に、優先させたい構文構造の構成要素を操作者が詳細に
指示できる場合に、その細かい意図を十分に反映でき、
適用範囲の広い学習データを作成することが可能とな
る。
【0057】さらに、上記学習データ記憶部に、学習時
に構文構造の構成要素であった単語を併記しておくこと
により、過去に作成した学習データの根拠が提示でき、
矛盾した学習データの作成を防ぎ、作業効率を向上させ
ることができる。
【0058】このように、操作者の嗜好や用途あるいは
言語に対する習熟度等に応じた学習手段を選択できる
上、翻訳結果の修正や学習データ作成のための操作者の
作業効率を向上させるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】英語文の構文構造を句構造木で表現した例の構
造図である。
【図3】日本語文の構文構造を句構造木と依存構造木で
表現した例の構造図である。
【図4】複数の解析結果があり、互いに矛盾した学習を
繰り返す場合を説明する図である。
【図5】本発明の一実施例の動作を示すフローチャート
である。
【図6】構文解析処理(図5のS503)における処理
を示すフローチャートである。
【図7】学習処理(図5のS514)における処理を示
すフローチャートである。
【図8】構文構造に与える優先度得点を説明する図であ
る。
【図9】構文構造の差分抽出を説明する図である。
【図10】構文解析で優先度付けに使用する規則に対す
る優先度得点変更を説明する図である。
【図11】学習のための初期データを説明する図であ
る。
【図12】自動生成された学習データの例を説明する図
である。
【図13】操作者が指定した学習データの例を説明する
図である。
【図14】学習データが他の文に適用される場合を説明
する図である。
【図15】学習データの修正を要する場合に、過去の学
習の根拠を提示する例を説明する図である。
【図16】過去の学習と矛盾しない学習データの作成を
説明する図である。
【符合の説明】
1 入力部 2 形態素解析処理部 3 構文解析処理部 4 構文解析結果記憶部 5 変換生成処理部 6 解析結果差分抽出部 7 出力表示部 8 学習データ自動生成部 9 学習データ記憶部 10 構文構造優先度記憶部 11 構文構造優先度修正部 12 学習データ作成支援部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】入力文として第1言語で記述された文を読
    み込む入力部と、 前記入力部によって入力された入力文を形態素に分解
    し、解析を行う形態素解析処理部と、 前記形態素解析処理部によって、形態素解析された各形
    態素間の構文構造を解析する構文解析処理部と、 前記構文解析処理部の処理結果を保持する構文解析結果
    記憶部と、 前記構文解析処理部の解析結果から第2言語に変換生成
    処理を行う変換生成処理部と、 前記構文解析処理部および変換生成処理部の処理結果を
    出力する出力部とを備えた機械翻訳装置において、 前記構文解析処理部において、最優先と判断された解析
    結果と、ユーザが最も適当であると判断した解析結果を
    比較し、それぞれの解析結果の構文構造において、異な
    る部分を局所構文構造として抽出する解析結果差分抽出
    部を備え、前記出力部より併せて出力することを特徴と
    する機械翻訳装置。
  2. 【請求項2】前記解析結果差分抽出部で抽出された局所
    構文構造に対して、ユーザが選択した結果を以後優先さ
    せるための構文構造学習データを自動的に作成する学習
    データ自動生成部と、該学習データを保持する学習デー
    タ記憶部を備え、前記学習データに基づいて、構文構造
    の優先度を変更することを特徴とする請求項1記載の機
    械翻訳装置。
  3. 【請求項3】前記構文解析処理部の処理結果において、
    係り受け関係をなす形態素成分において、入力文におけ
    る相対位置、品詞の属性条件などの優先度条件に応じ
    て、係り受け関係の結び付きの深さを数値化した優先度
    得点データを、優先度条件と併せて保持する構文構造優
    先度記憶部を備え、前記構文解析処理部における優先順
    位を該構文構造の優先度得点の総和の大小で決定し、前
    記出力部より優先度得点データと優先度条件を併せて出
    力することを特徴とする請求項1記載の機械翻訳装置。
  4. 【請求項4】前記解析結果差分抽出部で抽出された局所
    構文構造に対して、該構文構造に対する優先度条件と該
    優先度得点を前記出力部に出力し、優先度条件に対する
    優先度得点をユーザに修正させる構文構造優先度修正部
    を備えることを特徴とする請求項3記載の機械翻訳装
    置。
  5. 【請求項5】前記解析結果差分抽出部で抽出された局所
    構文構造に対して、該構文構造に対する優先度得点、お
    よび局所構文構造を構成する単語についての品詞、意味
    などの学習データを前記出力部より出力し、ユーザに修
    正、変更させる学習データ作成支援部を備えることを特
    徴とする請求項3記載の機械翻訳装置。
JP04164695A 1995-03-01 1995-03-01 機械翻訳装置 Expired - Fee Related JP3281746B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04164695A JP3281746B2 (ja) 1995-03-01 1995-03-01 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04164695A JP3281746B2 (ja) 1995-03-01 1995-03-01 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPH08235186A true JPH08235186A (ja) 1996-09-13
JP3281746B2 JP3281746B2 (ja) 2002-05-13

Family

ID=12614114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04164695A Expired - Fee Related JP3281746B2 (ja) 1995-03-01 1995-03-01 機械翻訳装置

Country Status (1)

Country Link
JP (1) JP3281746B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012203586A (ja) * 2011-03-24 2012-10-22 Toshiba Corp 文書処理装置およびプログラム
US9547645B2 (en) 2014-01-22 2017-01-17 Fujitsu Limited Machine translation apparatus, translation method, and translation system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012203586A (ja) * 2011-03-24 2012-10-22 Toshiba Corp 文書処理装置およびプログラム
US9547645B2 (en) 2014-01-22 2017-01-17 Fujitsu Limited Machine translation apparatus, translation method, and translation system

Also Published As

Publication number Publication date
JP3281746B2 (ja) 2002-05-13

Similar Documents

Publication Publication Date Title
Black et al. Statistically-driven computer grammars of English: The IBM/Lancaster approach
Desagulier et al. Corpus linguistics and statistics with R
US7076732B2 (en) Document processing apparatus having an authoring capability for describing a document structure
JP4790119B2 (ja) テキストプロセッサ
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US7234942B2 (en) Summarisation representation apparatus
US6243670B1 (en) Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
US5864788A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
JPH02297188A (ja) 文書作成支援装置
CN102272755A (zh) 使用图形国际语对自然语言进行语义处理的方法
JP2003050797A (ja) スケーラブル機械翻訳システム
JP2003248676A (ja) 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
Prinsloo et al. Interactive, dynamic electronic dictionaries for text production
JPH0721183A (ja) 機械翻訳装置
JPH08235186A (ja) 機械翻訳装置
JPH08329108A (ja) テキストのハイパーテキスト化方法
Androutsopoulos et al. Symbolic authoring for multilingual natural language generation
KR950013129B1 (ko) 기계번역장치 및 방법
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JP3734101B2 (ja) ハイパーメディア構築支援装置
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees