JPH0922413A - 属性とクラスの関係を一般化する方法と装置 - Google Patents

属性とクラスの関係を一般化する方法と装置

Info

Publication number
JPH0922413A
JPH0922413A JP7171770A JP17177095A JPH0922413A JP H0922413 A JPH0922413 A JP H0922413A JP 7171770 A JP7171770 A JP 7171770A JP 17177095 A JP17177095 A JP 17177095A JP H0922413 A JPH0922413 A JP H0922413A
Authority
JP
Japan
Prior art keywords
node
nodes
tree
forest
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7171770A
Other languages
English (en)
Other versions
JP3333802B2 (ja
Inventor
Hideki Tanaka
英輝 田中
Terumasa Ebara
暉将 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP17177095A priority Critical patent/JP3333802B2/ja
Publication of JPH0922413A publication Critical patent/JPH0922413A/ja
Application granted granted Critical
Publication of JP3333802B2 publication Critical patent/JP3333802B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 リーフを一意かつ完全に支配しさらに評価値
が最もよいノードの集合を求める方法を提供する。 【構成】 属性とクラスの関係を一般化するにあたり、
属性およびクラスの関係を示す関係表のデータと木また
は森を結合し(1)、結合結果の木または森の各ノード
にあらかじめ与えられた評価関数に従って評価値を付与
し(2)、前記木または森の各ノードが支配する最左リ
ーフの位置番号と最右リーフの位置番号とを各ノードに
付与し(3)、前記各ノードが支配する支配関係とそれ
らの接続条件に従って、別に設けた開始ノードと前記各
ノードとさらに別に設けた終了ノードとの間に辺をはり
グラフを作成する(4)とともに、前記開始ノードから
前記グラフの辺を介して前記終了ノードにいたる経路上
のノードの集合で、それらノードがすべてのリーフを一
意かつ完全に支配し、それらノードの評価値の合計が最
小になる経路を求める(5)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、属性の属性値が決ま
るとそのクラスが決まるような関係を表す(属性、属性
値、クラス)の関係表が与えられたときに、木または森
(以後、森も含めて木と称する)で表された概念体系上
の上位概念ノードで属性値を置換することにより、属性
とクラスの関係を一般化する方法および装置に係り、特
に最適な置換ノードの組合せを求めて属性とクラスの関
係を一般化する方法および装置に関するものである。
【0002】
【従来の技術】現在、例えば英日機械翻訳システムで利
用するための動詞の訳し分け規則を大量の言語データか
ら抽出することが試みられている。この時次の問題が生
じる。“I take X to the building”という文型をコー
パスで調査した結果、Xの単語と“take”の訳語の関係
が表1のように得られたとする。この表1をそのまま
“take”の訳し分けのルールとして利用するには以下の
問題がある。すなわち、表にないXの単語に対する“ta
ke”の訳語を決めようがない(未知語の問題)。ここで
属性とは、X、属性値とは英語の名詞、クラスとはtake
の訳語である。この問題を解決するにはX(属性)と訳
語(クラス)の関係を一般化する必要がある。
【0003】
【表1】
【0004】名詞は通常、上位下位の包含関係を示した
シソーラスにまとめられている。そこでこれを利用する
ことでこの問題の解決を図る。これにはまず、表1の英
語の名詞をシソーラスで検索して、これらの英語の名詞
の上位下位の関係を抽出する。これと表1を組合わせて
図9のようなデータを作成する。この図9には表1の情
報に加えて英語の名詞の上位下位の関係が明示されてい
る。いわば、部分的なシソーラスが表1に付加されたと
考えられる。
【0005】ここで、訳し分けの関係を記述するのに、
英語の名詞(図9のリーフノード、すなわち表1の英語
の名詞と同じ)の代わりに図9のシソーラス上の上位ノ
ードを利用することを考える。例えば、リーフの“him
”“her ”“boy ”の代わりにその上位ノードの“人
間(human)”をXの属性値に使い、そのときの“take”
の訳語を「連れていく」とする。この場合、「人間」の
下の訳語はすべて「連れていく」であるから表1と矛盾
しない。
【0006】この3単語を上位概念である「人間」で一
般化する利点は、未知語の問題を解決できるところにあ
る。すなわちこれによって、“him ”“her ”“boy ”
以外の単語であっても、「人間」に属する単語であれば
訳語を「連れていく」に決めることが可能になる。
【0007】未知語を減らすには上位ノードほど有効で
ある。それでは、さらに一般化を進めて「人間」の上位
ノードの「生物」を利用した場合はどうであろうか。こ
の場合ノード「生物」の下の訳語は「連れていく」と
「持っていく」の二通りとなる。このため、どちらの訳
語を選ぶにしても表1と矛盾してしまう。すなわち、ノ
ード「生物」による一般化はデータとの矛盾を生じる過
度な一般化であり好ましくない。未知語を減らすために
は名詞をできるだけ一般化したいが、データとの矛盾も
できるだけ避けたい。求めるのは適度な一般化である。
【0008】上述の例は組み合わせを考えに入れていな
いが、リーフノードの英語の名詞の全体を置換するため
のシソーラス上のノードの組合せは膨大となるため、単
純な枚挙法では解決できないことが多い。しかもこれを
克服する最適なノードの組合せを求める方法は未だ知ら
れていない。
【0009】
【発明が解決しようとする課題】これに代わる準最適な
ノードの組合せを求める方法としては、例えば文献、李
航,安倍直樹「シソーラスとMDL原理を用いた格フレ
ームの一般化」,自然言語処理における学習シンポジウ
ム予稿,1994 の手法が知られている。これは、属性値
をその上位ノードで置換するときの評価関数の変化量
を、各ノード毎に局所的に計算して、評価関数が良くな
る方向に変化する場合には置換を行い、そうでない場合
には置換を行わない手法である。この手法はノードの組
合せを考慮したものではないため、最適なノードの組合
せを求めることは保証できない。
【0010】そこで本発明の目的は、属性を置換するノ
ードの組合せの中で、従来技術で求めることのできなか
った、評価関数を最適にする組合せを求めることのでき
る属性とクラスの関係を一般化する方法および装置を提
供せんとするものである。
【0011】
【課題を解決するための手段】この目的を達成するた
め、本発明属性とクラスの関係を一般化する方法は、各
ノードに評価値が与えられた木または森に対して、すべ
てのリーフを一意かつ完全に支配し、さらにノードの評
価値の合計が最もよいノードの集合を求めるにあたり、
属性およびクラスの関係を示す関係表のデータと木また
は森を結合し、結合結果の木または森の各ノードにあら
かじめ与えられた評価関数に従って評価値を付与し、前
記木または森の各ノードが支配する最左リーフの位置番
号と最右リーフの位置番号とを各ノードに付与し、前記
各ノードが支配する支配関係とそれらの接続条件に従っ
て、別に設けた開始ノードと前記各ノードとさらに別に
設けた終了ノードとの間に辺をはりグラフを作成すると
ともに、前記開始ノードから前記グラフの辺を介して前
記終了ノードにいたる経路上のノードの集合で、それら
ノードがすべてのリーフを一意かつ完全に支配し、それ
らノードの評価値の合計が最小になる経路を求めること
を特徴とするものである。
【0012】また、本発明属性とクラスの関係を一般化
する装置は、各ノードに評価値を与える木または森のす
べてのリーフを一意かつ完全に支配し、さらに評価値が
最もよいノードの集合を求める属性とクラスの関係を一
般化する装置において、当該装置が、属性およびクラス
の関係を示す関係表のデータと木または森とを結合する
結合器と、結合結果の木または森の各ノードにあらかじ
め与えられた評価関数に従った評価値を付与する評価値
計算器と、前記木または森の各ノードが支配する最左リ
ーフの位置番号と最右リーフの位置番号とを各ノードに
付与するノード支配関係計算器と、当該ノード支配関係
計算器の出力を入力とし、接続条件に従って、別に設け
た開始ノードと前記各ノードとさらに別に設けた終了ノ
ードとの間に辺をはりグラフを作成するグラフ作成器
と、前記開始ノードから前記グラフの辺を介して前記終
了ノードにいたる経路上のノードの集合で、それらノー
ドがすべてのリーフを一意かつ完全に支配し、それらノ
ードの評価値の合計が最小になる経路を求める最短経路
探索器とを具備することを特徴とするものである。
【0013】
【実施例】以下添付図面を参照し実施例により本発明を
詳細に説明する。図1に本発明方法を実施するための装
置の略構成ブロック線図を示す。図1において、結合器
1は木と関係表の2つのデータを結合する(関係表のデ
ータを木の各リーフノードに割り当てる)作用をする。
評価値計算器2は与えられた評価関数に従って結合器1
の出力の各ノードに評価値を付与する。ノード支配関係
計算器3は計算器2の出力の木の各ノードが支配する最
左リーフの位置番号と最右リーフの位置番号を各ノード
に付与する。グラフ作成器4は計算器3の出力を入力と
して接続条件に従って入力の上にグラフの辺を作成す
る。さらに、最短経路探索器5は作成器4によって出力
されたグラフ上の最短経路を求める。以下上記結合器
1、計算器2,3、作成器4、探索器5の動作をさらに
詳細に説明する。
【0014】○結合器1の動作は以下の通りである。 動作開始 ・開始ノードSを生成する。 ・終了ノードEを生成する。 ・関係表(図2参照)の属性のクラスを、属性に対応す
る木(図3参照)のリーフの値としてリーフに付与する
(図4参照)。 ・開始ノードSに番号0を付与する。 ・木のリーフに左から順に番号を与える(1からmとす
る)。 ・終了ノードEに番号m+1を与える。 動作終了
【0015】○評価値計算器2の動作は以下の通りであ
る。 動作開始 ・すべてのノードに対して、入力の評価関数に従って評
価値を計算してその値をノードに付与する。ただし、開
始ノードSと終了ノードEには値ゼロを与える(図5参
照)。これが詳細については後に説明される。 動作終了
【0016】○ノード支配関係計算器3の動作は以下の
通りである。 動作開始 ・すべてのノードに対して、当該ノードが支配する一番
左のリーフの番号と一番右のリーフの番号を計算して、
この二つの値をノードに付与する。尚リーフでのこれら
の二つの値は、リーフ自身の番号である(図6参照)。
例えば図6においてノードn8の最左リーフノード番号
は1、最右リーフノード番号は3であるからn8には
(1,3)が与えられる。 動作終了
【0017】○グラフ作成器4は本発明の中心部分であ
り、動作は以下の通りである。 動作開始 ・すべてのノードに対して、当該ノードが接続すること
を許された接続可能ノードを規定する接続条件に従っ
て、当該ノードから接続可能ノードに有効辺を張る。接
続条件とは次の条件である。ノードtから接続可能なノ
ードは、tの最右支配リーフの番号+1=ノードXの最
左支配リーフ番号、となるすべてのXである。 動作終了
【0018】この条件に従うと、開始ノードSから終了
ノードEに向かう閉路のない有効グラフが作成される
(図7参照)。この有効グラフ上の開始ノードSから終
了ノードEへ向かう各経路上のノードは、リーフを一意
かつ完全に支配するノードの集合となっている。
【0019】このグラフが生成されると、この経路上の
ノードの得点合計を最適(最大もしくは最小)にする経
路を求めることによって、リーフを一意かつ完全に支配
する最適なノードが求められる。このような経路を求め
るには既存の手法、例えばM.Gondran and M. Minoux,
“Graphs and Algorithms ”,JOHN WILEY & SONS, 198
4, pp.54, あるいは「演習グラフ理論」,伊理,白
川,コロナ社,昭和58年,pp.88 が適用できる。最短経
路探索器5はこのような手法に基づいた装置である。
【0020】以下、具体的な例を利用して上述の動作を
より具体的に説明する。ここでは図2の関係表の属性が
図3で示す木のリーフに対応している場合に、図2の属
性を木のノードの最適な組合せで置換する問題を考え
る。図3の木のノードには、n1からn9までの名前を
付与している。これらの入力が与えられたときに結合器
1はその動作に従って図4を出力する。ここではS,E
ノードの作成、リーフへのクラスの付与、リーフとS,
Eノードへの番号付与が実施されている。
【0021】次に図4の出力を入力として評価値計算器
2は各ノードに評価値を付与する。ここでは評価関数と
して、 S(t)=−L(t)+E(t) (tはノードを表す) を利用する。
【0022】S(t)の右辺第1項L(t)は、ノード
tが支配しているリーフの数から1を減じた量である。
これはtがリーフのいくつ分に相当するかを表した量で
あり、tの一般化の度合いを示す量である。E(t)
は、ノードtの支配するリーフの持つクラスに着目し、
tの支配下のリーフの数からtの支配するクラスの中の
最大数のクラスの数を減じた量である。この量はtの支
配するリーフすべてを、tの支配する最大数のクラスで
置換したときに発生する誤りの数である。S(t)の右
辺第1項は一般化の度合いが大きな上位ノードを使うほ
ど小さな値となり、右辺第2項は誤りが少ないノードほ
ど小さくなる。すなわち、この評価関数は、評価関数の
値が小さくなるノードほど好ましいノードであることを
示している。このため、最適な置換ノードを求める問題
は、評価値の合計を最小化するノードの組合せを求める
問題となる。評価値計算器2の作用の結果図5が得られ
る。この図では、クラス、属性は省略している。
【0023】次に図5を入力としてノード支配関係計算
器3が動作する。この結果、図6の結果が得られる。こ
の図では、クラス、属性は省略している。さらに図6を
入力としてグラフ作成器4は接続条件に従ってノード間
を辺で結ぶ。例えば、ノードn8から有効辺を張るノー
ドを求めよう。n8の最右支配リーフ番号は図6から3
であることが判明する。そして、最左支配リーフの番号
が3+1=4であるようなノードを検索すると、n4,
n7があることが判明する。これよりn8からはn4と
n7に向かって有効辺を張る。この操作をすべてのノー
ドに対して実施すると図7のグラフが得られる。この図
では、クラス、属性は省略している。先に述べたよう
に、この開始ノードSから終了ノードEに向かう経路上
のノードの集合は、リーフを一意かつ完全に支配してい
る。そこでこの経路の中でノードの評価値の合計を最小
にする経路を求め、その経路上のノードの集合を求める
と目的の最適なノード集合が得られる。
【0024】このような評価値の合計が最小になるよう
な経路を求めるには、既存の手法(前述の参考文献「演
習グラフ理論」)が利用できる。この手法を最短経路探
索器5として実現しており、図7のグラフを入力する
と、{S→n8→n7→E}の経路が求められ、一般化
に利用する最適なノードの組合せが{n8,n7}であ
ることが求められる。これによって、図2の属性の
{a,b,c}の代わりにn8を、{d,e}の代わり
にn7を利用した図8に示す一般化された関係表が求め
られる。
【0025】以上本発明を実施例により詳細に説明して
きたが、本発明はこの実施例に限定されることなく、特
許請求の範囲に規定した発明の要旨内で各種の変形、変
更の可能なことは自明であろう。例えば、評価関数はS
(t)に限らず、第1項としてノードの下のクラスの混
ざり具合を表すエントロピーを利用したり、第2項とし
て一般化の度合いに応じた定数を用いるなど他の関数を
使うことも可能である。また、グラフの辺に評価値を追
加するような評価関数も利用可能である。また、S,E
ノード(開始、終了ノード)を使わなくとも、本発明は
実現できる。
【0026】
【発明の効果】以上説明してきたように、本発明は関係
表の属性を、属性が所属する木の上位ノードで最適に置
換する問題のように、各ノードに評価値が与えられた木
において、リーフを一意かつ完全に支配し評価値を最適
にするノードの組合せを求める問題を、前述した条件に
よって木をグラフに変換することにより、グラフの最短
経路問題に変換している。これによって従来困難とされ
た最適な置換ノードの組合せを求める問題が既存の手法
によって高速に求められることになった。
【図面の簡単な説明】
【図1】本発明を実施するのに必要な装置の略構成ブロ
ック線図である。
【図2】実施例を説明するのに利用する関係表である。
【図3】実施例を説明するのに利用する木である。
【図4】図1図示の結合器の動作結果を示す図である。
【図5】図1図示の評価値計算器の動作結果を示す図で
ある。
【図6】図1図示のノード支配関係計算器の動作結果を
示す図である。
【図7】図1図示のグラフ作成器の動作結果を示す図で
ある。
【図8】実施例によって得られた一般化された関係表で
ある。
【図9】シソーラスで一般化したデータを示す図であ
る。
【符号の説明】
1 結合器 2 評価値計算器 3 ノード支配関係計算器 4 グラフ作成器 5 最短経路探索器
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成7年7月11日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0025
【補正方法】変更
【補正内容】
【0025】以上本発明を実施例により詳細に説明して
きたが、本発明はこの実施例に限定されることなく、特
許請求の範囲に規定した発明の要旨内で各種の変形、変
更の可能なことは自明であろう。例えば、評価関数はS
(t)に限らず、第1項としてノードの下のクラスの混
ざり具合を表すエントロピーを利用したり、第2項とし
て一般化の度合いに応じた定数を用いるなど他の関数を
使うことも可能である。また、グラフの辺に評価値を追
加するような評価関数も利用可能である。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 各ノードに評価値が与えられた木または
    森に対して、すべてのリーフを一意かつ完全に支配し、
    さらにノードの評価値の合計が最もよいノードの集合を
    求めるにあたり、属性およびクラスの関係を示す関係表
    のデータと木または森を結合し、結合結果の木または森
    の各ノードにあらかじめ与えられた評価関数に従って評
    価値を付与し、前記木または森の各ノードが支配する最
    左リーフの位置番号と最右リーフの位置番号とを各ノー
    ドに付与し、前記各ノードが支配する支配関係とそれら
    の接続条件に従って、別に設けた開始ノードと前記各ノ
    ードとさらに別に設けた終了ノードとの間に辺をはりグ
    ラフを作成するとともに、前記開始ノードから前記グラ
    フの辺を介して前記終了ノードにいたる経路上のノード
    の集合で、それらノードがすべてのリーフを一意かつ完
    全に支配し、それらノードの評価値の合計が最小になる
    経路を求めることを特徴とする属性とクラスの関係を一
    般化する方法。
  2. 【請求項2】 請求項1記載の方法において、前記木ま
    たは森の各ノードが支配するリーフの位置番号をもとに
    した前記接続条件に従って、木または森のノード間に辺
    をはりグラフを作成することを特徴とする属性とクラス
    の関係を一般化する方法。
  3. 【請求項3】 各ノードに評価値を与える木または森の
    すべてのリーフを一意かつ完全に支配し、さらにノード
    の評価値の合計が最もよいノードの集合を求める属性と
    クラスの関係を一般化する装置において、当該装置が、
    属性およびクラスの関係を示す関係表のデータと木また
    は森とを結合する結合器と、結合結果の木または森の各
    ノードにあらかじめ与えられた評価関数に従った評価値
    を付与する評価値計算器と、前記木または森の各ノード
    が支配する最左リーフの位置番号と最右リーフの位置番
    号とを各ノードに付与するノード支配関係計算器と、当
    該ノード支配関係計算器の出力を入力とし、接続条件に
    従って、別に設けた開始ノードと前記各ノードとさらに
    別に設けた終了ノードとの間に辺をはりグラフを作成す
    るグラフ作成器と、前記開始ノードから前記グラフの辺
    を介して前記終了ノードにいたる経路上のノードの集合
    で、それらノードがすべてのリーフを一意かつ完全に支
    配し、それらノードの評価値の合計が最小になる経路を
    求める最短経路探索器とを具備することを特徴とする属
    性とクラスの関係を一般化する装置。
JP17177095A 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置 Expired - Fee Related JP3333802B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17177095A JP3333802B2 (ja) 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17177095A JP3333802B2 (ja) 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置

Publications (2)

Publication Number Publication Date
JPH0922413A true JPH0922413A (ja) 1997-01-21
JP3333802B2 JP3333802B2 (ja) 2002-10-15

Family

ID=15929362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17177095A Expired - Fee Related JP3333802B2 (ja) 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置

Country Status (1)

Country Link
JP (1) JP3333802B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG100613A1 (en) * 2000-02-23 2003-12-26 Hitachi Ltd Data processing method and system, program for realizing the method, and computer readable storage medium storing the program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG100613A1 (en) * 2000-02-23 2003-12-26 Hitachi Ltd Data processing method and system, program for realizing the method, and computer readable storage medium storing the program

Also Published As

Publication number Publication date
JP3333802B2 (ja) 2002-10-15

Similar Documents

Publication Publication Date Title
US7565281B2 (en) Machine translation
US5311429A (en) Maintenance support method and apparatus for natural language processing system
US5267156A (en) Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
JP3345763B2 (ja) 自然言語翻訳装置
US20040254781A1 (en) Machine translation
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH07295986A (ja) イディオム処理機能を持つ機械翻訳装置
JPS61255469A (ja) 言語生成装置
Kaplan Lexical resource reconciliation in the Xerox Linguistic Environment
JPH10312382A (ja) 類似用例翻訳システム
JPH0922413A (ja) 属性とクラスの関係を一般化する方法と装置
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
Hutchins A new era in machine translation research
JPS61123947A (ja) 知識編集方式
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JP2935928B2 (ja) 自然言語翻訳装置
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3892227B2 (ja) 機械翻訳システム
JPS6386071A (ja) 自然言語翻訳方式
JP3014409B2 (ja) 自然言語自動翻訳装置
Friedman et al. Evaluating English Sentences in a Logical Model
JPH04105171A (ja) 機械翻訳システム
JPH0439706B2 (ja)
JPH05324711A (ja) 自然言語自動翻訳システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees