JPH04372061A - 機械翻訳用自動学習装置 - Google Patents

機械翻訳用自動学習装置

Info

Publication number
JPH04372061A
JPH04372061A JP3149100A JP14910091A JPH04372061A JP H04372061 A JPH04372061 A JP H04372061A JP 3149100 A JP3149100 A JP 3149100A JP 14910091 A JP14910091 A JP 14910091A JP H04372061 A JPH04372061 A JP H04372061A
Authority
JP
Japan
Prior art keywords
translated
sentence
text
machine translation
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3149100A
Other languages
English (en)
Other versions
JP3015509B2 (ja
Inventor
Yuki Nagase
友樹 長瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3149100A priority Critical patent/JP3015509B2/ja
Publication of JPH04372061A publication Critical patent/JPH04372061A/ja
Application granted granted Critical
Publication of JP3015509B2 publication Critical patent/JP3015509B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳された訳文の
修正操作に伴なって多義語選択や関係子選択に使用する
データを自動的に生成する機械翻訳用自動学習装置に関
する。機械翻訳システムを使用して自動的に例えば日本
文から英文に翻訳する機械翻訳する際の多義語の選択に
ついては、適切な訳を学習する機能が設けられている。
【0002】しかし、従来の多義語選択の学習機能はユ
ーザが翻訳英文の中の誤っている語の位置と正しい訳語
を指示したり、直接に多義語選択に使用する意味関係の
データを追加する必要があり、ユーザの負担が大きく、
この点の改善が望まれる。
【0003】
【従来の技術】従来の機械翻訳システムにおいては、多
義語の適切な訳を学習する機能が設けられており、多義
語の学習時にはユーザが誤っている語の位置と正しい訳
語を明に指定する必要がある。例えば、
【0004】
【数1】
【0005】と訳すシステムに「切る」の訳し分け(多
義語選択)を学習させるためには、訳文中の「cut」
を指定し、正しい訳が「shuffle」であることを
指示する必要がある。このようなユーザの指示による多
義語の学習が行われると、原文の構造解析によって多義
語選択のための意味関係データが生成されて意味関係辞
書に登録される。このため学習後に翻訳を行うと作成さ
れた意味関係辞書の内容を参照することで、
【0006
【数2】
【0007】と訳され、適切な多義語選択ができる。
【0008】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の機械翻訳システムの多義語学習機能にあって
は、学習モードの設定状態でユーザが機械翻訳された訳
文の中から誤って選択された多義語を見つけ、正しい訳
語を指示するという学習操作を繰り返さなければならず
、学習に要するユーザの負担が大きいという問題がある
【0009】また適切な学習対象となる訳文がない場合
には、ユーザが直接に多義語選択のための意味関係デー
タを追加しなければならず、依然としてユーザ負担が大
きいという問題がある。同様な問題は係り関係の意味知
識データを生成する学習についても同様に生ずる。
【0010】本発明は、このような従来の問題点に鑑み
てなされたもので、機械翻訳システムにあっては、ユー
ザが誤った訳を正しく修正する作業を必ず行う点に着目
し、ユーザの修正作業に伴って自動的に多義語選択や係
り関係の選択に使用する意味知識データを生成してユー
ザ負担を大きく軽減するようにした機械翻訳用自動学習
装置を提供することを目的とする。
【0011】
【課題を解決するための手段】図1は本発明の原理説明
図である。まず本発明は、日本文等の原文を機械翻訳し
て訳文、例えば翻訳英文を出力する機械翻訳システムを
対象とする。このような機械翻訳システムを対象とした
機械翻訳用自動学習装置として本発明にあっては、機械
翻訳された訳文の修正操作を行った際に、修正対象とな
った原文の構造を解析して概念構造を生成する原文構造
解析部1と、原文に対する修正された正しい訳文の構造
を解析して概念構造を生成する訳文構造解析部2と、原
文構造解析部1と訳文構造解析部2で解析された結果を
比較し、原文と訳文の概念構造の相違に基づいて意味関
係データを生成して機械翻訳に使用する意味関係辞書4
に登録する構造比較部3とを設けたことを特徴とする。
【0012】例えば多義語選択のための学習にあっては
、構造比較部3は原文構造解析部1により解析された原
文と訳文構造解析部2で解析された修正訳文の概念構造
の相違に基づいて機械翻訳時に多義語の選択に使用する
意味関係データを生成する。日本文から英文への翻訳す
る際の多義語選択を例にとると、構造比較部3は原文構
造解析部1により解析された日本文と訳文構造解析部2
で解析された修正翻訳英文の概念構造の相違に基づいて
機械翻訳時に多義語の選択に使用する意味関係データを
生成する。
【0013】また係り関係の学習にあっては、構造比較
部3は、原文構造解析部1により解析された原文の関係
子と訳文構造解析部2により解析された修正訳文の関係
子との相違に基づいて係り関係の意味関係データを生成
する。例えば日本文から英文への翻訳を例にとると、構
造比較部3は解析された日本文の関係子と修正翻訳英文
の関係子との相違に基づいて係り関係の意味関係データ
を生成する。
【0014】
【作用】このような構成を備えた本発明の機械翻訳用自
動学習装置によれば、機械翻訳された訳文の修正操作を
ユーザが行うと、修正された正しい訳文と原文の組に対
しそれぞれ構造解析が行なわれ、解析結果として得られ
た構造概念の比較により、利用できると判断された相違
から多義語選択或いは係り関係選択の意味関係知識(意
味関係データ)を生成して意味関係辞書に登録する処理
が自動的に行われる。
【0015】このような訳文の修正操作に伴なう原文と
正しい訳文との双方向解析に基づく意味関係データの自
動生成により、ユーザは全く学習操作を意識することな
く、多義語選択や係り関係を決める意味関係データの学
習による登録ができ、しかも日常的な修正操作を通じて
学習が行われるため、機械翻訳システムを使うほど能力
を向上させることができる。
【0016】
【実施例】図2は本発明の一実施例を示した実施例構成
図である。図2において、10は原言語形態素解析部で
あり、また12は原言語構文解析部であり、原文として
の原言語の概念構造を解析するために設けられる。一方
、14は目標言語形態素解析部であり、また16は目標
言語構文解析部であり、修正された正しい訳文としての
目的言語の概念構造を解析するために設けられる。
【0017】原言語形態素解析部10及び目標言語形態
素解析部14に対する入力は、機械翻訳システムで機械
翻訳された訳文の修正操作を行った際に、「原文」 「修正された正しい訳文」 の組として入力される。勿論、この「原文−修正訳文」
の組をリアルタイムで入力せずに、学習データを格納す
るメモリに記憶し、訳文修正操作が終了した後の学習モ
ードの指定で読出して学習するようにしてもよい。
【0018】原言語形態素解析部10及び目標言語形態
素解析部14による各言語の形態素解析は、文を構成す
る単語を1つの形態素とし、形態素毎に例えば図3に示
すデータ形式をもつ中間言語に変換する。図3の中間言
語のデータ形式は、例えば「切る」、「cut」等の表
記と、概念記号で構成され、更に必要に応じて属性情報
が設けられる。
【0019】ここで概念記号とは、どのような言語でも
共通に意味を表現できる言語であり、例えば日本語の「
切る」と英語の「cut」が同じ概念であれば、同じ概
念記号(コード)が割り当てられる。以下の構造解析に
あっては、全て概念記号を用いた中間言語を使用して処
理される。原言語構文解析部12及び目標言語構文解析
部16は、原言語形態素解析部10及び目標言語形態素
解析部14から得られた形態素を使用して構文解析を行
い、原言語及び目的言語の概念構造に変換する。
【0020】図4は原文となる日本文「私は教室でトラ
ンプを切る。」の原言語と目的言語の概念構造を示した
もので、機械翻訳により 「I cut cards in the class
room. 」が出力され、これを正しい訳文 「I shuffle cards in the c
lassroom. 」に修正した場合の構文解析結果
を示している。勿論、いずれも各言語に対応した中間言
語(概念記号)で表現されている。
【0021】図4に示す原側(原言語側)は、日本文の
構文解析でも修正前の原文の構文解析でも同じ概念構造
となることから、翻訳原文について示している。また目
標側(目標言語側)は修正済み訳文の概念構造を示す。 この概念構造は、動詞「cut」、「shuffle」
をfromノードとして、他の形態素をtoノードとし
ており、各ノード間には意味関係を示す関係子が示され
ている。
【0022】再び図2を参照するに、原言語構文解析部
12及び目標言語構文解析部16の解析結果は概念構造
差異解析部18に送られ、例えば図4に示した原文の概
念構造と修正済み訳文の概念構造を比較し、差異があれ
ば次の意味関係知識構成部20に通知する。図4の場合
、fromノードを構成する「cut」と「shuff
le」が相違している。
【0023】意味関係知識構成部20では原言語と目的
言語の概念構造の差異を解析して意味関係知識を抽出し
、抽出できた知識があれば辞書の形式に構成し、意味関
係辞書登録部22において意味関係辞書に登録する。 更に登録情報問合せ部24が設けられ、意味関係辞書登
録部22で登録した意味関係データをユーザに示し、間
違ったデータがあればユーザがそれを指摘し、削除でき
るようにする。
【0024】意味関係知識構成部20による解析処理を
図5のフローチャートを参照して説明すると次のように
なる。尚、図5の処理は図6に示す原側と目標側の概念
構造の一般形を例にとっている。図5において、まずス
テップS1で焦点を目標側動詞のノード(A)に置く。 次にステップS2で焦点を任意の必須格の先、例えばノ
ード(B)へ置く。
【0025】続いてステップS3で原側で目標側の焦点
となったノード(B)と同じノード(C)を探す。この
場合、同じノードがあることからステップS4からステ
ップS5に進み、目標側のfromノード(A)の動詞
V1と目標側のfromノード(D)の動詞V2が相違
し、且つ関係子α、βが同じか否かチェックする。即ち
【0026】
【数3】
【0027】が成立するか否かチェックする。図6の場
合、この条件が成立しているのでステップS6に進み、
焦点を他の必須格の先となるノード(E)に置く。続い
てステップS7で他の必須格のノードがあるか否かチェ
ックし、この場合ノード(E)があるのでステップS3
に戻り、ノード(E)と同じ原側のノード(F)を探し
、ステップS4、ステップS5を介してステップS6に
進むが、このとき残りノードはないのでステップS7か
らステップS10に進んで意味関係データを1組生成す
る。
【0028】更にステップS8で他の動詞ノードを探す
が図6の場合はないのでステップS9を介して一連の処
理を終了する。図7は図4の概念構造について図6の処
理を通じて作成された多義語選択のための意味関係デー
タの説明図であり、目的言語についてfromノードを
「SHUFFLE」としてtoノード「I」、「CAR
D」、「CLASSROOM」が設けられ、更にfro
mノードとtoノードとの関係子<agent>、<o
bj>、<place>が登録される。
【0029】次に本発明で作成された意味関係データを
使用した機械翻訳システムにおける多義語選択の処理を
簡単に説明すると次のようになる。図8は、日本語「切
る」に関係する機械翻訳システムの日本語辞書と意味関
係辞書の内容を示す。まず日本語辞書には、日本号表記
「切る」に対応した図3に示したデータ形式によって英
語の「cut」、「shuffle」及び「turn」
と同じ意味の概念記号が登録され、更に優先度が設定さ
れている。
【0030】この日本語辞書のみでは、優先度による多
義語選択が行われるため、「切る」は「cut」に訳さ
れる。一方、意味関係辞書には、fromノードを「s
huffle」としてtoノードに「card」をもつ
意味関係データが関係子<obj>と共に登録されてい
る。fromノードの「turn」についてもtoノー
ドに「steering  wheel」をもつ意味関
係データが関係子<obj>と共に登録されている。
【0031】図9は図8の日本語辞書及び意味関係辞書
を使用して「紙を切る」を翻訳した場合の多義語選択を
示す。まず原文を構造解析して「切る」対象が「pap
er」であることを知り、意味関係辞書を参照すると、
該当する意味関係がない。この場合には、日本語辞書の
「切る」の多義語のうちの優先度が最も高い「cut」
が選ばれる。
【0032】図10は図8の日本語辞書及び意味関係辞
書を使用して「トランプを切る」を翻訳した場合の多義
語選択を示す。まず原文を構造解析して「切る」対象が
「card」であることを知り、意味関係辞書を参照す
ると、
【0033】
【数4】
【0034】があるので、「shuffle」が正しい
訳として選ばれる。図9及び図10では多義語選択の基
準、即ち訳し分けの基準となる関係子として<obj>
を例にとっているが、これ以外に訳し訳の基準となる関
係子には、<inst>、<goal>、<manne
r>及び<role>等が多く、<subj>や<pl
ace>等が基準となることは少ない。従って機械翻訳
システムが訳し分けのために本発明で生成する意味関係
知識は、<obj>、<inst>、<goal>、<
manner>及び<role>等に限定する。
【0035】次に本発明による係り関係の意味関係デー
タの学習処理を説明する。図11は原文「製造の費用」
に対し正しい訳文 「Cost  for  manufacture」の
組を対象に係り関係の意味関係知識を得るための構文解
析結果を示す。尚、構文解析では訳文と同じ概念記号の
中間語で表現されることから、原文についてもCOST
、MANUFACTUREと表わしているこの構文解析
において原文「製造の費用」における「COST」と「
MANUFACTURE」の係り関係を示す関係子は修
飾関係を示す<MOD>であり、一方、正しい訳文での
関係子は目的関係を示す<PURPOSE>となってい
る。
【0036】この場合には、図12に示す係り関係の意
味関係データが生成される。図12において、from
ノードには「COST」が格納され、toノードには「
MANUFACTURE」が格納され、更に関係子には
正しい訳文の構文解析で得られた関係子<PURPOS
E>が格納される。即ち、原文の日本語を構文解析した
概念構造と、正しい訳文である英語を構文解析した概念
構造を比較した際に、同じ位置にあるfromノードと
toノードの管の関係子が異なっている場合には、正解
を英語解析により得られた関係子に置き代えれば正しい
訳が出る可能性が高くなる。
【0037】図13は図2に示した概念構造差異解析部
18及び意味関係知識構成部20による係り関係の意味
関係データを生成する処理を示したフロチャートである
。図13において、まずステップS1で目標側(正解訳
側)の任意の関係子をαとする。次にステップS2で関
係子αのfromノードをF、toノードをTとする。 さらにステップS3で原側(原文側)で
【0038】
【数5】
【0039】という構造を探す。この構造が原側にある
ことがステップS4で判別されるとステップS5に進ん
で原側の目標側の関係子αとβが等しいか否かチェック
する。両者の関係子が相違すればステップS6に進んで
意味関係データを作成する。1つの係り関係の意味知識
データの作成が済むとステップS7で次の関係子がある
か否かチェックし、次の関係子があればステップS8で
αとしてステップS2に戻り、同様な処理を繰り返す。 全ての関係子の処理が済めば、これがステップS7で判
別され、一連の処理を終了する。
【0040】尚、上記の実施例は日本文から英文への翻
訳を例にとるものであったが、この逆でもよいし、任意
の言語間での翻訳でもそのまま適用できる。
【0041】
【発明の効果】以上説明したように本発明によれば、機
械翻訳された訳文をユーザが修正すると、原文と修正さ
れた正しい訳文の組を対象に双方向の構造解析が行われ
、概念構造の相違点に基づいて多義語選択の意味関係デ
ータ及び係り関係の意味関係データが自動的に生成され
て意味関係辞書に登録され、ユーザに学習操作を意識さ
せることなく自動学習ができ、ユーザの負担を大きく軽
減することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の実施例構成図
【図3】本発明で中間言語として使用する概念記号のデ
ータ形式の説明図
【図4】本発明の多義語選択の意味関係データの生成に
使用される原文と修正訳文の構文解析結果を示した説明
【図5】図2の実施例で多義語選択を対象に行われる概
念構造の差異解析と意味関係知識の生成処理を示したフ
ローチャート
【図6】図5の処理対象となる原側と目標側の概念構造
の一般形を示した説明図
【図7】図4の構文解析結果の相違に基づいて生成され
た意味関係データの説明図
【図8】機械翻訳システムで使用される日本語辞書及び
本発明で生成した意味関係辞書の内容の一例を示した説
明図
【図9】「紙を切る」の翻訳における多義語選択を示し
た説明図
【図10】「トランプを切る」の翻訳における多義語選
択を示した説明図
【図11】本発明の係り関係の自動学習に使用される原
文と正解訳の構文解析による概念構造の例を示した説明
【図12】図11の概念構造における関係子の相違から
作成された係り関係の意味関係データの説明図
【図13
】図2の実施例で係り関係を対象に行われる概念構造の
差異解析と意味関係知識の生成処理を示したフローチャ
ート
【符号の説明】
1:原文構造解析部 2:訳文構造解析部 3:構造比較部 4:意味関係辞書 10:原言語形態素解析部 12:原言語構文解析部 14:目標言語形態素解析部 16:目標言語構文解析部 18:概念構造差異解析部 20:意味関係知識構成部 22:意味関係辞書登録部 24:登録情報問合せ部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】原文を機械翻訳して訳文を出力する機械翻
    訳システムに於いて、機械翻訳された訳文の修正操作を
    行った際に、修正対象となった原文の構造を解析して概
    念構造を生成する原文構造解析部1と、前記原文に対す
    る修正された正しい訳文の構造を解析して概念構造を生
    成する訳文構造解析部2と、前記原文構造解析部1と訳
    文構造解析部2で解析された結果を比較し、原文と訳文
    の概念構造の相違に基づいて意味関係データを生成して
    機械翻訳に使用する意味関係辞書4に登録する構造比較
    部3と、を設けたことを特徴とする機械翻訳用自動学習
    装置。
  2. 【請求項2】請求項1記載の機械翻訳用自動学習装置に
    於いて、前記構造比較部3は前記原文と修正訳文との概
    念構造の相違に基づいて機械翻訳時に多義語の選択に使
    用する意味関係データを生成することを特徴とする機械
    翻訳用自動学習装置。
  3. 【請求項3】請求項1記載の機械翻訳用自動学習装置に
    於いて、前記構造比較部3は前記原文の関係子と修正訳
    文の関係子との相違に基づいて係り関係の意味関係デー
    タを生成することを特徴とする機械翻訳用自動学習装置
  4. 【請求項4】請求項3記載の機械翻訳用自動学習装置に
    於いて、前記構造比較部3は前記原文構造解析部1によ
    り解析された原文の関係子と前記訳文構造解析部2で解
    析された修正訳文の関係子との相違に基づいて係り関係
    の意味関係データを生成することを特徴とする機械翻訳
    用自動学習装置。
JP3149100A 1991-06-21 1991-06-21 機械翻訳用自動学習装置 Expired - Fee Related JP3015509B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3149100A JP3015509B2 (ja) 1991-06-21 1991-06-21 機械翻訳用自動学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3149100A JP3015509B2 (ja) 1991-06-21 1991-06-21 機械翻訳用自動学習装置

Publications (2)

Publication Number Publication Date
JPH04372061A true JPH04372061A (ja) 1992-12-25
JP3015509B2 JP3015509B2 (ja) 2000-03-06

Family

ID=15467701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3149100A Expired - Fee Related JP3015509B2 (ja) 1991-06-21 1991-06-21 機械翻訳用自動学習装置

Country Status (1)

Country Link
JP (1) JP3015509B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298701B2 (en) 2012-03-29 2016-03-29 Fujitsu Limited Machine translation device, machine translation method, and recording medium storing machine translation program
JP2018077688A (ja) * 2016-11-09 2018-05-17 株式会社ぐるなび メニュー生成システム、メニュー生成方法及びメニュー生成プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298701B2 (en) 2012-03-29 2016-03-29 Fujitsu Limited Machine translation device, machine translation method, and recording medium storing machine translation program
JP2018077688A (ja) * 2016-11-09 2018-05-17 株式会社ぐるなび メニュー生成システム、メニュー生成方法及びメニュー生成プログラム

Also Published As

Publication number Publication date
JP3015509B2 (ja) 2000-03-06

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH0782498B2 (ja) 機械翻訳システム
JPH0261763A (ja) 機械翻訳装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH04372061A (ja) 機械翻訳用自動学習装置
JPH0332106B2 (ja)
JP4007630B2 (ja) 対訳例文登録装置
Nouar et al. Deep Semantic Parsing Method to Capture the Structure of Multi-Relation Questions over Linked Data.
JPH0410665B2 (ja)
JPH0287273A (ja) 自動翻訳装置
JP2723886B2 (ja) 機械翻訳装置及びその翻訳規則作成方法
JP3233800B2 (ja) 機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH04105171A (ja) 機械翻訳システム
JP3255294B2 (ja) 機械翻訳装置
JP2608384B2 (ja) 機械翻訳装置及びその方法
JPH0734198B2 (ja) 翻訳装置
JPH05225232A (ja) テキスト自動前編集装置
JP2004086919A (ja) 機械翻訳システム
JPH09231226A (ja) 機械翻訳用辞書メンテナンス装置
JPH0229858A (ja) 機械翻訳処理方法
JPH04191969A (ja) 文書作成装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991130

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071217

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081217

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091217

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees