JP2888525B2 - 機械翻訳システムの辞書保守方法 - Google Patents

機械翻訳システムの辞書保守方法

Info

Publication number
JP2888525B2
JP2888525B2 JP63263934A JP26393488A JP2888525B2 JP 2888525 B2 JP2888525 B2 JP 2888525B2 JP 63263934 A JP63263934 A JP 63263934A JP 26393488 A JP26393488 A JP 26393488A JP 2888525 B2 JP2888525 B2 JP 2888525B2
Authority
JP
Japan
Prior art keywords
dictionary
language
tree structure
words
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63263934A
Other languages
English (en)
Other versions
JPH02112065A (ja
Inventor
弘之 中島
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63263934A priority Critical patent/JP2888525B2/ja
Publication of JPH02112065A publication Critical patent/JPH02112065A/ja
Application granted granted Critical
Publication of JP2888525B2 publication Critical patent/JP2888525B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は機械翻訳システムなどの自然言語処理システ
ムに係り、特に翻訳用辞書の保守方式に関する。
〔従来の技術〕
機械翻訳システムに用いる知識の自動学習方式につい
ては、いくつかの方式が提案されている。たとえば、特
願昭63−192751号は、入力文解析結果である中間表現か
ら曖昧性のないものを抽出することにより、語と語の共
起関係知識を獲得し、利用する方式である。また、特開
昭62−219165号は、定型文を入力することにより、共起
関係やイデイオムなどの訳語選択用の知識を獲得する方
式である。
〔発明が解決しようとする課題〕
しかしながら、特願昭63−192751号の方法は、獲得で
きる共起関係知識が原言語に関するもののみである。ま
た、特開昭62−219165は、定型文を入力することによ
り、訳語選択用の共起関係知識や、イデイオムを学習す
る方式であるが、大量の定型文のセツトを用意しておく
必要があり、共起関係の学習は事実上不可能であると言
える。
本発明の目的は、一般の形式の対訳例文を入力するだ
けで、語と語の対訳関係、イデイオム,語と語の共起関
係など、2言語間の解析・変換・生成に用いる知識を自
動的に獲得することを可能にすることである。
〔課題を解決するための手段〕
上記目的は、第一言語文の解析結果である木構造グラ
フと、第二言語文の解析結果である木構造グラフとのパ
ターンマツチングを行なうステップと、パターンのマツ
チしたノードの表わす概念構造に基づいて、獲得すべき
知識が、語と語の対訳関係であるか、イデイオムである
か、語と語の共起関係であるかを判定するステツプと、
獲得した知識を辞書に登録するステツプを設けることに
より、達成される。
〔作用〕
対訳例文を入力し、第一言語および第二言語の解析を
行なう。解析結果は、ノードが単語の表す概念を表現
し、アークが概念間の意味的関係を表現する木構造グラ
フで表現する。複数の解析が可能な場合は、すべての解
を求める。
次に、第一言語の解と、第二言語の解のすべての組み
合わせに対して、次のような、アークの一致に基づいた
パターンマツチングを行なう。
まず、第一言語文の1つの解析結果のトツプノード
(木の根になるノード)をTαとし、第二言語文の1つ
の解析結果のトツプノードをTβとする。Tαとその子
ノードを連結するアークの集合Aαと、Tβとその子ノ
ードを連結するアークの集合Aβが一致すれば、Tα
と、Tβはマツチすると判定する。AαとAβが一致し
なければ、Aαに含まれるアークでAβに一致するもの
のなかつたアークと、そのアークの子孫になるすべての
アークとノード、およびTαで構成される部分木をTα
に圧縮する。また、Aβに含まれるアークでAαに一致
するもののなかつたアークと、そのアークの子孫になる
すべてのアークとノード、およびTβで構成される部分
木をTβに圧縮する。
すなわち、Tαの表す単語とTβの表す単語は対訳関
係にはないが、Tαを含む部分木の表す概念(このよう
な概念間の関係を表現したグラフで表される概念を、以
下、概念構造と呼ぶ)とTβを含む部分木の表す概念は
対訳関係にあると判定し、TαとTβがこのような概念
構造を表現したノードになるようグラフを変換して、ノ
ードをマツチさせるわけである。さらに、一致したアー
クの数をグラフの一致度としてカウントする。次に、ア
ークの一致した子ノード同士のあいだで、同様のパター
ンマツチを繰返し、子ノードがなくなれば、終了する。
以上のパターンマツチングの結果、一致度の最も大き
い解析結果の組み合わせを、正しい解析結果の組み合わ
せと判定する。
次に、正しい解析結果の組み合わせについて、対応し
ている2つのノードがともに単語を表現していれば、ノ
ードが表現する2つの単語は対訳関係にあると判定す
る。また2つのノードの少なくとも一方が単語ではな
く、語と語の意味的関係を表す部分木を圧縮した概念構
造を表現していれば、2つのノードの表す概念構造が対
訳関係にあると判定する。すなわち、イデイオムとして
対訳関係にあると考える。また、単語を表すノードが隣
接していれば、隣接する2語は、その2語を表す2ノー
ドを結ぶアークの表す意味的関係で共起していると判定
する。
以上のようにして獲得した、語と語の対訳関係,イデ
イオム,語と語の共起関係を辞書に登録する。
〔実施例〕
以下本発明を、日英・英日双方向機械翻訳システムに
実施した例を用いて説明する。
第2図は、本実施例のハードウエア構成図で、処理装
置1,入力装置2,出力装置3,日本語辞書記憶装置4,英語辞
書記憶装置5,日本語格フレーム記憶装置6,英語格フレー
ム記憶装置7,日英・英日変換辞書記憶装置8,日本語共起
関係辞書記憶装置9,英語共起関係辞書記憶装置10から成
る。
日本語辞書記憶装置4内の日本語辞書は、第3図に示
すようなレコードで構成される。レコードは、日本語見
出し41、品詞42,意味コード43,日本語格フレームコード
44から成る。レコードは日本語見出し41をキーとして検
索できる。
英語辞書記憶装置5内の英語辞書は、第4図に示すよ
うなレコードで構成される。レコードは、英語見出し5
1,品詞52,意味レコード53,英語格フレームコード54から
成る。レコードは英語見出し51をキーとして検索でき
る。
日本語格フレーム記憶装置6内の日本語格フレーム
は、第5図に示すようなレコードで構成される。レコー
ドは、日本語格フレームコード名61,深層格62,表層格6
3,格要素の意味コード64から成る。深層格62はコードで
表わす。コードA,O,I,Gはそれぞれ、動作主格,対象,
道具格,終点格を表わしている。表層格63は深層格62に
対応する日本語の助詞を表わしている。格要素の意味コ
ード64は、格要素の持つべき意味的特徴を表すコードで
あり、HUM,OBJはそれぞれ、人間,動作の対象となる物
を表す。レコードは日本語格フレームコード名61をキー
として検索できる。
英語格フレーム記憶装置7内の英語格フレームは、第
6図に示すようなレコードで構成される。レコードは、
英語格フレームコード名71,深層格72,表層格73,格要素
の意味コード74から成る。深層格72は日本語フレームの
場合と同じコードで表わす。表層格73は深層格に対応す
る英語の構文的役割または前置詞を表わしており、Sは
主語,DOは直接目的語を表す。格要素の意味コード74は
日本語格フレームの場合と同じコードで表す。INSTは道
具である。レコードは英語格フレームコード名71をキー
として検索できる。
日英・英日変換辞書記憶装置8内の日英・英日変換辞
書は第7図に示すようなレコードで構成される。レコー
ドは、日本語概念構造81,英語概念構造82から成る。同
一レコード内の日本語概念構造81と英語概念構造82は対
訳関係にある。
各概念構造は、単一の単語の場合もあれば、2つの単
語とその間の意味的関係(深層格コードで表現する)の
集合で構成される場合もある。たとえば、第7図では、
「彼」と「he」,「飛行機」と「plane」などは単語同
士で対訳関係にあり、(かける!O!アイロン)と「iro
n」は、日本語の「アイロンをかける」という概念構造
が英語の単語「iron」と対訳関係にあることを示してい
る。すなわち、単一の単語でない概念構造の対訳関係は
イデイオムを表わしている。レコードは日本語概念構造
81と英語概念構造82の何れをキーとしても検索すること
ができる。
日本語共起関係辞書記憶装置9内の日本語共起関係辞
書は、第8図に示すようなレコードで構成される。レコ
ードは、日本語動詞91,日本語名詞92,深層格93から成
る。レコードは日本語動詞91と日本語名詞92の連接をキ
ーとして検索できる。
英語共起関係辞書記憶装置10内の英語共起関係辞書
は、第9図に示すようなレコードで構成される。レコー
ドは、英語動詞101,英語名詞102,深層格103から成る。
レコードは英語動詞101と英語名詞102の連接キーとして
検索できる。
日本語共起関係辞書および英語共起関係辞書は,格フ
レームでは表現できない動詞固有の共起関係を、動詞,
名詞,深層格の3項関係として登録しており、解析・生
成処理においては格フレームに優先して使用される。
次に処理装置1で実行される翻訳処理について、第1
図によつて説明する。
まず、入力装置2から対訳関係にある日本文と英文を
入力する(1101)。日本語辞書と日本語格フレームと日
本語共起関係辞書を参照して日本語文の構文解析を行な
う。また、英語辞書と英語格フレームと英語共起関係辞
書を参照して英文の構文解析を行なう。
解析結果は、ノードが内容語を表わし、意味的に関係
を持つ語の対を結ぶアークでその意味的関係(深層格コ
ード)を表わす木構造グラフで表現する。複数の解析が
可能な場合は、すべての解を求める。日本文解析結果の
集合を{N(1),…,N(m)}で表わし、英文解析結
果の集合{E(1),…,E(n)}で表わす(1102)。
次に、i=1〜m,j=1〜nのすべての組み合わせ
(i,j)について、N(i)とE(j)のパターンマツ
チングを、以下のステツプ1103〜ステツプ1105で行な
う。
N(i)とE(j)の一致度を表わす変数MATC(i,
j)を0に初期化し、また一致度計算用のグローバル変
数MATCH(以下に述べるサブルーチンMATでも同じ値をと
る変数)を0に初期化する。またN(i)とE(j)の
内容を、それぞれ、作業用変数NW(i)とEW(j)に代
入する(1103)。NW(i)とEW(j)を引数として、サ
ブルーチンMAT(NW(i),EW(j))をコール(call)
する。サブルーチンMAT(α,β)ではグラフαとグラ
フβの一致度の算出(変数MATCHで表わす)および、マ
ツチしない部分木の概念構造の圧縮を行なう。サブルー
チンMATの処理については後述する(1104)。変数MATCH
の値を変数MATC(i,j)に代入する(1105)。
次に一致度MATC(i,j)が最大のNW(i),EW(j)の
組を求めて、それぞれ、Nm,Emとする(1106)。
NmとEmノードを、それぞれ、Nmn(1)〜Nmn(1),E
mn(1)〜Emn(1)とする(サブルーチンMATでは、グ
ラフの圧縮を行なつているので、NmとEmのノード数1は
一致する)。そこで、i=1〜1について、以下のステ
ツプ1107〜ステツプ1111を繰り返す。
ノードNmn(i)とEmn(i)はともに単語かどうかを
判定する。ともに単語であれば、ステツプ1108に進む。
少なくとも一方が単語でなければ,ステツプ1110に飛ぶ
(1107)。
日英・英日変換辞書を検索し、Nmn(i)の表わす単
語とEmn(i)の表わす単語との組が登録されているか
どうかを判定する。Nmn(i)の表わす単語Emn(i)の
表わす単語の組が登録されていなければ、ステツプ1109
に進み、登録されていれば、iを1つ増やして次の処理
に進む(1108)。Nmn(i)の表わす単語とEmn(i)の
表わす単語の組を日英・英日変換辞書に登録する(110
9)。日英・英日変換辞書を検索し、Nmn(i)の表わす
概念構造とEmn(i)の表わす概念構造の組がイデイオ
ムとして登録されているかどうかを判定する。Nmn
(i)の表わす概念構造とEmn(i)の表わす概念構造
の組が登録されていなければ、ステツプ1111に進み、登
録されていれば、iを1つ増やして次の処理に進む(11
10)。Nmn(i)の表わす概念構造とEmn(i)の表わす
概念構造の組を日英・英日変換辞書に登録する(111
1)。
次に、i=1〜1について、以下のステツプ1112〜ス
テツプ1117を繰り返す。
Nmn(i)が単語でかつ名詞を表わし、かつ、Nmn
(i)の親ノードが単語でかつ動詞を表わすかどうかを
判定する。
Nmn(i)が単語でかつ名詞を表わし、かつNmn(i)
の親ノードが単語でかつ動詞を表わしていればステツプ
1113へ進み、いなければ、ステツプ1115へ飛ぶ(111
2)。日本語共起関係辞書を検索し、Nmn(i)と、Nmn
(i)の親ノードと、該2ノードを結ぶアークの表わす
深層格の組が登録されていなければ、ステツプ1114に進
み、登録されていればステツプ1115に飛ぶ(1113)。Nm
n(i)と、Nmn(i)の親ノードと、該2ノードを結ぶ
アークの表わす深層格の組を、日本語共起関係辞書に登
録する(1114)。
Emn(i)が単語でかつ名詞を表わし、かつ、Emn
(i)の親ノードが単語でかつ動詞を表わすかどうかを
判定する。Emn(i)が単語でかつ名詞を表わし、か
つ、Emn(i)の親ノードが単語でかつ動詞を表わして
いればステツプ1116へ進み、いなければ、iを1つ増や
して次の処理に進む(1115)。英語共起関係辞書を検索
し、Emn(i)と、Emn(i)の親ノードと、該2ノード
を結ぶアークの表わす深層格の組が登録されていなけれ
ば、ステツプ1117に進み、登録されていれば、iを1増
やして次の処理に進む(1116)・Emn(i)と、Emn
(i)の親ノードと、該2ノードを結ぶアークの表わす
深層格の組を、英語共起関係辞書に登録する(1117)。
最後に、辞書登録結果を出力装置03に出力する(111
8)。
次に、木構造グラフのパターンマツチング用のサブル
ーチンMAT(α,β)の処理について、第10図によつて
説明する。
まず、木α,βのトツプノードをそれぞれ、Tα,Tβ
とし、Tα,Tβにつながるアークの集合をそれぞれ、A
α,Aβとして、AαとAβのマツチングを見る(104
1)。変数MATCHの値を、マツチしたアークの数だけ増や
す(1042)。AαとAβのすべてのアークがマツチした
かどうかを判定する。AαとAβのすべてのアークがマ
ツチしていれば、ステツプ1045に飛ぶ。AαとAβの少
なくとも一方に、マツチしないアークが含まれていれ
ば、ステツプ1044に進む(1043)。Aγに含まれるマツ
チしなかつたすべてのアークと、そのアークの子孫にな
るすべてアークとノード、およびTγで構成されるγの
部分木をTγに圧縮する。すなわち、Tγの表わす概念
構造を、該部分木の表わす概念構造に変換し、該部分木
をTγを残して消去する(γ=α,β)(1044)。Tα
とTβはマツチしたとする(1045)。
次に、Aαの中のマツチした1つのアークの子孫で構
成されるαの部分木と、対応するβの部分木を、それぞ
れ、α(k),β(k)(k=1〜K)として、k=1
〜Kについて、ステツプ1046を繰り返す(K=0になる
ば、終了)。
α(k)β(k)を引数としてサブルーチンMAT(α
(k),β(k))をCallする(1046)。
次に、第3図の日本語辞書、第4図の英語辞書、第5
図の日本語格フレーム,第6図の英語格フレーム、第7
図の日英・英日変換辞書、第8図の日本語共起関係辞
書、第9図の英語共起関係辞書を用いた場合の、辞書保
守の過程を、例をあげて詳しく説明する。
まず、日本文「彼は望遠鏡で飛行機を見た。」と、該
日本文と対訳関係にある英文「He saw a plane with te
lescope.」を入力した場合を考える。
日本語解析では、内容語「彼」,「望遠鏡」,「飛行
機」、「見る」で日本語辞書を検索し、さらに、動詞
「見る」の格フレームコードN1で格フレームを検索し
て、格フレームと他の内容語に付く助詞とのパターンマ
ツチングにより、第11図の解析結果を得る。動詞「見
る」の持つ格フレームはN1のみであり、かつ、N1とマツ
チするのは、第11図の解のみである。
英文解析も、同様に、内容詞「he」,「see」,「pla
ne」,「telescope」で英語辞書を検索し、動詞「see」
の格フレームコードE1およびE2で格フレームを検索し
て、格フレームと他の内容語の構文的役割または内容語
に付く前置詞とのパターンマツチングにより、第12図
(a),(b)の解析結果を得る。格フレームE1を用い
た場合は、他の内容語がすべてマツチして、第12図
(a)の解となるが、格フレームE2を用いた場合は、
「telescope」の前置詞withはマツチする深層格がな
く、planeの修飾語と判定され、第12図(b)の解とな
る。
次に、第11図のグラフ(N(1)とする)と第12図
(a)のグラフ(E(1)とする)、およびN(1)と
第12図(b)のグラフ(E(2)とする)を引数とし
て、サブルーチンMATをCallしてパターンマツチを行な
う。
N(1)とE(1)では、N(1)のトツプノード
「見る」につながるアークの集合{A,O,I}と、E
(1)のトツプノード「see」につながるアークの集合
{A,O,I}が一致するので、「見る」と「see」は単語と
してマツチする。また、トツプノードの各子ノードは、
どれも子ノードを持たないので、すべて単語としてマツ
チする。また、グラフの一致度MATC(1,1)は、一致し
たアークの数、3となる。
N(1)とE(2)の場合は、N(1)のアークIに
一致するアークがE(2)にないので、N(1)のトツ
プノードは、その子孫のグラフが圧縮され、アークIお
よび子ノード「望遠鏡」とを含む概念構造(見る,I,望
遠鏡)を持つことになり、N(1)は、第13図のような
グラフになる。また、E(2)のノード「plane」と、
対応するN(1)のノード「飛行機」を比較すると、
「plane」を修飾する子ノード「telescope」に対応する
子ノードを「飛行機」が持たないので、「plane」を表
わしていたノードは、その子孫のグラフが圧縮され、概
念構造(plane,M,telescope)を持つことになり、E
(2)は第14図のグラフになる。また、N(1)とE
(2)の一致度MATC(1,2)は、マツチしたアークの
数、2となる。
以上の結果より、最も一致度の高い組み合わせは、N
(1)とE(1)であることがわかる。
次に、この2つのグラフを比較して対訳関係を抽出す
る。ノードはすべて単語を表わしているので、単語同士
の対訳関係が抽出され、このうち、日英・英日変換辞書
に登録されていない[望遠鏡,telescope]が登録され
る。また、共起関係は、「見る,飛行機,O]と「見る,
望遠鏡,I]とが日本語共起関係辞書に、「see,plane,
O]と[see,telescope,I]とが英語共起関係辞書に登録
される。
次に、日本文「彼は彼女に電話をかける。」と、対訳
になつた英文「He telephones her.」が入力された場合
を考える。前と同様の解析により第15図の日本解析結果
および第16図の英文解析結果を得る。解はそれぞれ1通
りずつになる。この2つのグラフのパターンマツチング
により、日本文解析結果は、第17図のように変形され、
[(かける!O!電話)、telephone]というイデイオムと
しての対訳関係が抽出され、日英・英日変換辞書に登録
される。また、第17図では、単語を表すノードが隣接し
ていないので、日本語共起関係は抽出されない。英語共
起関係は、第16図より[telephone,he,A]、[telephon
e,she,G]が抽出され、英語共起関係辞書に登録され
る。
以上、本発明の一実施例を示した。
上記実施例によれば、対訳例文を入力するだけで、日
英の単語としての対訳関係,イデイオムとしての対訳関
係および共起関係を自動的かつ適切に抽出し、辞書登録
することができる。このため、翻訳用辞書の保守を効率
良く行なうことができる。
[拡張例1] 上記実施例の拡張例として、対訳関係の抽出された単
語の間で、意味コードを共有させることにより、意味コ
ードを自動的に学習させる方法も考えられる。すなわ
ち、対訳関係の定まつた2つの単語について、一方の単
語にのみ付けられている意味コードがあれば、他方の語
にもその意味コードを付けるステツプを設ける。たとえ
ば、上記実施例の例文では、「望遠鏡」と「telescop
e」の対訳関係が定まつたとき、英語辞書において、「t
elescope」に付けられている意味コードINSTを「望遠
鏡」にも付ける。このようにして、「望遠鏡」の持つ意
味的性質を自動的に学習することが可能になる。
[拡張例2] 上記実施例において、対訳関係の定まつた2語のう
ち、一方の語aが未知語(日本語辞書または英語辞書に
登録されていない語)であり、他方の語bが未知語でな
ければ、aの品詞と意味コードをbと同一のものにし
て、aの辞書レコードを作成し、辞書に登録するステツ
プを追加することにより、未知語の辞書登録を自動的に
行なうことが可能になる。
たとえば、日本文「彼は星を見た。」と「He saw the
star.」が入力された場合を考える。動詞「見る」と
「see」の格フレームに基づく解析により、「星」と「s
tar」の対訳関係が抽出される。このとき、「星」は第
3図の日本語辞書に登録されているが、「star」は第4
図の英語辞書に登録されていないので、「star」の品詞
と意味コードをそれぞれ、「星」の品詞と意味コードで
ある、「動詞」と「OBJ」として、第18図のようなレコ
ードを作成し、英語辞書に登録する。
[拡張例3] 上記実施例において、対訳関係の定まつた2つの概念
構造について、一方が名詞であり、かつ他方が2つの名
詞の単純な結合(名詞連鎖と呼び、2つの名詞の間の深
層格関係の深層格コードNで表す)であるかどうかを判
定するステツプと、一方が名詞であり、他方が名詞連鎖
である場合は、名詞連鎖を構成する2語を1つの複合語
と判定し、複合語として、対訳辞書および英語または日
本語辞書に登録するステツプと設けることにより、複合
語の自動抽出を行なうことが可能になる。
たとえば、対訳例文「彼は制御装置を見た。」、「He
saw a controller.」の解析の結果、対訳関係[(装置
!N!制御)、controller]が抽出されたとする。このと
き、「制御装置」は1つの複合語と判定され、[制御装
置、controller]という対訳関係が日英・英日変換辞書
に登録される。また、複合語「制御装置]を見出しとす
るレコードが、日本語辞書に登録される。「制御装置」
を見出しとするレコードの品詞と意味コードは、前記拡
張例2と同様、「controller」のものと同じ「名詞」お
よび「INST」とする。
[拡張例4] 上記実施例において、対訳関係の定まつた2つの概念
構造が、両方とも入力文の解析結果と一致するかどうか
を判定するステツプと、対訳関係の定まつた2つの概念
構造が、両方とも入力文の解析結果と一致した場合は、
入力文同士を対訳関係として登録するステツプを設ける
ことにより、格言のような1文単位でのイデイオムを文
単位で日英・英日変換辞書に登録できるため、翻訳時の
無駄な解析処理を省くことができる。たとえば、対訳例
文「光陰矢の如し。」、「Time flieslike anarrow.」
が入力された場合、解析結果は、それぞれ、第19図,第
20図のようになり、パターンマツチを行なうと、解析結
果全体が1つのノードに圧縮され、解析結果そのものが
対訳関係にある概念構造として抽出される。このとき、
日英・英日変換辞書には、第21図のように、入力文同士
が対訳関係として登録される。
[拡張例5] 上記実施例のグラフのパターンマツチングを行う処理
において、アークが一致しない場合、その子ノードの表
わす単語の対が日英・英日変換辞書に対訳関係として既
に登録されているようなアークの対があるかどうかを判
定するステツプと、該対訳関係が登録されているアーク
の対がある場合は、アークの不一致は言語間の深層格の
ずれによるものと判定し、一致しなかつたアークと親ノ
ードのみを圧縮して、一致した子ノードの部分を変数と
したグラフを対訳関係として登録するステツプを追加す
る。これにより、一般性の低いイデイオムの登録を回避
し、言語間の発想の違いを考慮した高品質の変換規則を
学習することが可能になる。
たとえば、対訳例文「言語学の発展により機械翻訳へ
の道が開けた。」、「Development of linguistics ope
ned a way to the machine translation.」を入力した
場合を考える。解析結果は第22図のようになり、上記実
施例の方法でパターンマツチングを行うと、誤つてはい
ないが一般性の低い対訳関係[(開ける!W!(発展!M!言
語学))、(open!A!(development!M!linguistic
s))]が抽出される。しかし、本拡張例では、アーク
WとアークAは一致しないが、その子ノード「発展」と
「development」の対訳関係が日英・英日変換辞書に登
録されていれば、抽出される対訳関係は[(開ける!W!X
j)、(open!A!Xe)]となり(Xj,Xeは変数であり、Xj
とXeが対訳関係にあれば、この変換規則が適用できると
する)、より一般性の高い変換規則を抽出することがで
きる。
〔発明の効果〕
本発明によれば、機械翻訳システムにおいて、対訳例
文を入力し、双方向の解析を行ない、その解析結果であ
る木構造グラフのパターンマツチングを行ない、パター
ンマツチングの結果に基づいて、単語間の対訳関係,イ
デイオムとしての対訳関係,共起関係および語のもつ意
味的性質を抽出し、辞書に登録することができるので、
翻訳用辞書に種々のレベルの知識を自動的かつ適切に登
録していくことができ、辞書の精度を自動的に向上させ
ることができる。
【図面の簡単な説明】
第1図は本発明の実施例の日英・英日機械翻訳システム
の辞書保守の処理の概略を示すPADである。第2図は日
英機械翻訳システムのハードウエア構成図、第3図は日
本語辞書のレコード内容の例を示す図、第4図,第18図
は英語辞書レコード内容の例を示す図、第5図は日本語
格フレームのレコード内容の例を示す図、第6図は英語
格フレームのレコード内容の例を示す図、第7図,第21
図は日英・英日変換辞書のレコード内容の例を示す図、
第8図は日本語共起関係辞書のレコード内容の例を示す
図、第9図は、英語共起関係辞書のレコード内容の例を
示す図、第10図は木構造グラフのパターンマツチングを
行うサブルーチンMATの処理を示すPAD、第11図〜第17
図,第19図,第20図,第22図は、日本文および英文の解
析結果を表す木構造グラフの例を示す図である。 1……入力装置、2……処理装置、3……出力装置、4
……日本語辞書記憶装置、5……英語辞書記憶装置、6
……日本語格フレーム記憶装置、7……英語格フレーム
記憶装置、8……日英・英日変換辞書記憶装置、9……
日本語共起関係辞書記憶装置、10……英語共起関係辞書
記憶装置。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭59−165178(JP,A) 特開 昭62−297972(JP,A) 特開 平2−90364(JP,A) 特開 昭63−5470(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】第1言語の辞書、第2言語の辞書、第1言
    語と第2言語の間の変換辞書、第1言語文の解析機能、
    及び第2言語文の解析機能を有する機械翻訳システムの
    辞書保守方法において、 第1言語文を解析して、ノードが語を表し、ノードの対
    を結ぶアークが該アークで結ばれたノードに対応する語
    の間の意味的関係を表す第1の木構造グラフによって前
    記第1言語文を表現する第1のステップと、 前記第1言語文と対訳関係にある第2言語文を解析し
    て、ノードが語を表し、ノードの対を結ぶアークが該ア
    ークで結ばれたノードに対応する語の間の意味的関係を
    表す第2の木構造グラフによって前記第2言語文を表現
    する第2のステップと、 親ノードとその子ノードを結ぶアークが一致するかどう
    か判定する処理を木構造グラフの上方から下方に向かっ
    て繰り返すことによって、前記第1の木構造グラフと前
    記第2の木構造グラフとのパターンマッチングを行う第
    3のステップと、 前記第3のステップで対応づけられた前記第1の木構造
    グラフのノードと前記第2の木構造グラフのノードの組
    が表す語の組を対訳関係として前記変換辞書に登録する
    第4のステップと、 を含む機械翻訳システムの辞書保守方法。
  2. 【請求項2】前記第1言語文及び/又は前記第2言語文
    に含まれる曖昧性を前記第1のステップ及び/又は第2
    のステップで解消することができず前記第1の木構造グ
    ラフ及び/又は前記第2の木構造グラフが複数出力され
    る場合は、第1の木構造グラフと第2の木構造グラフの
    全ての組み合わせについてパターンの一致度を計算し、
    一致度が最も高い第1の木構造グラフと第2の木構造グ
    ラフの組み合わせについて前記第3のステップ及び第4
    のステップを実行する請求項1記載の機械翻訳システム
    の辞書保守方法。
  3. 【請求項3】前記変換辞書は、語と語の組、複数の語と
    それらの語の間の意味的関係からなる概念構造と語の
    組、及び概念構造と概念構造の組を含み、 前記第3のステップは、前記第1の木構造グラフと前記
    第2の木構造グラフの対応する親ノードとその子ノード
    を結ぶアークが一致するかどうかを判定する第1のサブ
    ステップと、一致しなかったアークの子孫と親ノードか
    ら構成される概念構造を1つの擬似的なノードで表し、
    前記親ノードを該擬似的なノードで置き換える第2のサ
    ブステップを有し、前記第2のサブステップにより木構
    造グラフが変形されたときは該変形された木構造グラフ
    に対してパターンマッチング処理を続け、 前記第4のステップは、前記第3のステップで対応づけ
    られたノードと擬似的なノードの組、あるいは擬似的な
    ノードと擬似的なノードの組を対訳関係として前記変換
    辞書に登録する請求項1又は2に記載の機械翻訳システ
    ムの辞書保守方法。
  4. 【請求項4】前記第4のステップは、前記第3のステッ
    プで対応づけられた擬似的なノードが表す概念構造が名
    詞連鎖であれば、該名詞連鎖を1つの複合語として前記
    変換辞書に登録する請求項3に記載の機械翻訳システム
    の辞書保守方法。
  5. 【請求項5】前記第4のステップは、前記第3のステッ
    プで対応づけられた擬似的なノードが両方とも入力文の
    解析結果の全体と一致した場合は、前記第1言語文と第
    2言語文同士を対訳関係として前記変換辞書に登録する
    請求項3に記載の機械翻訳システムの辞書保守方法。
  6. 【請求項6】前記第3のステップにおいて、対応する親
    ノードが一致する相手のないアークを持つ場合、その子
    ノードの表す単語の対が前記変換辞書に対訳関係として
    既に登録されているようなアークの対があるかどうかを
    判定する第3のサブステップと、該対訳関係が登録され
    ている子ノードをもつアークの対がある場合は、一致し
    た子ノードの部分を変数とし、該アークと親ノードを1
    つの擬似的なノードで置き換える第4のサブステップを
    設けた請求項3に記載の機械翻訳システムの辞書保守方
    法。
  7. 【請求項7】前記第3のステップで対応づけられたノー
    ドの組が表す語の組について、一方の語のみについてい
    る意味素性があれば、他方の語にもその意味素性を付け
    る第5のステップを設けた請求項1乃至6のいずれかに
    記載の機械翻訳システムの辞書保守方法。
  8. 【請求項8】前記第3のステップで対応づけられたノー
    ドの組が表す第1言語の語aと第2言語の語bの組につ
    いて、一方の語aが前記第1言語の辞書に未登録であ
    り、他方の語bが前記第2言語の辞書に登録されていれ
    ば、語bと同じ品詞と意味素性を持つ語aの辞書レコー
    ドを作成し、前記第1言語の辞書に登録する第6のステ
    ップを設けた請求項1乃至7のいずれかに記載の機械翻
    訳システムの辞書保守方法。
  9. 【請求項9】第1言語の語と語の共起関係を記憶する第
    1言語共起関係辞書、第1言語文の解析機能、及び第2
    言語文の解析機能を有する機械翻訳システムの辞書保守
    方法において、 第1言語文を解析して、ノードが語を表し、ノードの対
    を結ぶアークが該アークで結ばれたノードに対応する語
    の間の意味的関係を表す第1の木構造グラフによって前
    記第1言語文を表現する第1のステップと、 前記第1言語文と対訳関係にある第2言語文を解析し
    て、ノードが語を表し、ノードの対を結ぶアークが該ア
    ークで結ばれたノードに対応する語の間の意味的関係を
    表す第2の木構造グラフによって前記第2言語文を表現
    する第2のステップと、 前記第1言語文及び/又は前記第2言語文に含まれる曖
    昧性を前記第1のステップ及び/又は第2のステップで
    解消することができず前記第1の木構造グラフ及び/又
    は前記第2の木構造グラフが複数出力される場合は、第
    1の木構造グラフと第2の木構造グラフの全ての組み合
    わせについてパターンマッチングを行うと共にパターン
    の一致度を計算する第3のステップと、 一致度が最も高い第1の木構造グラフと第2の木構造グ
    ラフの組み合わせを選択する第4のステップと、 前記第4のステップで選択された第1の木構造グラフに
    おいて、アークで結ばれたノードの組が表す語の組を、
    該アークが表す意味的関係とともに前記第1言語共起関
    係辞書に登録する第5のステップと、 を含む機械翻訳システムの辞書保守方法。
  10. 【請求項10】前記語と語の共起関係を、動詞と、その
    格要素である名詞と、深層格の3項関係で表現する請求
    項9に記載の機械翻訳システムの辞書保守方法。
JP63263934A 1988-10-21 1988-10-21 機械翻訳システムの辞書保守方法 Expired - Fee Related JP2888525B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63263934A JP2888525B2 (ja) 1988-10-21 1988-10-21 機械翻訳システムの辞書保守方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63263934A JP2888525B2 (ja) 1988-10-21 1988-10-21 機械翻訳システムの辞書保守方法

Publications (2)

Publication Number Publication Date
JPH02112065A JPH02112065A (ja) 1990-04-24
JP2888525B2 true JP2888525B2 (ja) 1999-05-10

Family

ID=17396294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63263934A Expired - Fee Related JP2888525B2 (ja) 1988-10-21 1988-10-21 機械翻訳システムの辞書保守方法

Country Status (1)

Country Link
JP (1) JP2888525B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05266069A (ja) * 1992-03-23 1993-10-15 Nec Corp 中国語と日本語との間の双方向機械翻訳方式

Also Published As

Publication number Publication date
JPH02112065A (ja) 1990-04-24

Similar Documents

Publication Publication Date Title
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US5267156A (en) Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPS62163173A (ja) 機械翻訳方法
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPH06251057A (ja) 機械翻訳方法及び機械翻訳装置
WO2003083708A2 (en) Machine translation
JP2609173B2 (ja) 用例主導型機械翻訳方法
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPH0261763A (ja) 機械翻訳装置
Garje et al. Transmuter: an approach to rule-based English to Marathi machine translation
JP2888525B2 (ja) 機械翻訳システムの辞書保守方法
KR102143158B1 (ko) 한국어 구문 분석을 활용한 정보 처리 시스템
Cheikhrouhou The automatic translation of French verbal tenses to Arabic using the platform NooJ
Angelov Multiword expressions in multilingual applications within the Grammatical Framework
Wintner et al. Syntactic analysis of Hebrew sentences
JP3919732B2 (ja) 機械翻訳装置及び機械翻訳プログラム
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP3892227B2 (ja) 機械翻訳システム
JPH0256066A (ja) 訳語複合名詞化処理方式
JP3255294B2 (ja) 機械翻訳装置
JPH02294779A (ja) 機械翻訳システム
Trujillo et al. Other Approaches to MT

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees