JP3333802B2 - 属性とクラスの関係を一般化する装置 - Google Patents

属性とクラスの関係を一般化する装置

Info

Publication number
JP3333802B2
JP3333802B2 JP17177095A JP17177095A JP3333802B2 JP 3333802 B2 JP3333802 B2 JP 3333802B2 JP 17177095 A JP17177095 A JP 17177095A JP 17177095 A JP17177095 A JP 17177095A JP 3333802 B2 JP3333802 B2 JP 3333802B2
Authority
JP
Japan
Prior art keywords
node
nodes
tree
class
leaf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP17177095A
Other languages
English (en)
Other versions
JPH0922413A (ja
Inventor
英輝 田中
暉将 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP17177095A priority Critical patent/JP3333802B2/ja
Publication of JPH0922413A publication Critical patent/JPH0922413A/ja
Application granted granted Critical
Publication of JP3333802B2 publication Critical patent/JP3333802B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、属性の属性値が決ま
るとそのクラスが決まるような関係を表す(属性、属性
値、クラス)の関係表が与えられたときに、木または森
(以後、森も含めて木と称する)で表された概念体系上
の上位概念ノードで属性値を置換することにより、属性
とクラスの関係を一般化する装置に係り、特に、最適な
置換ノードの組合せを求めて属性とクラスの関係を一般
化する装置に関するものである。
【0002】
【従来の技術】現在、例えば英日機械翻訳システムで利
用するための動詞の訳し分け規則を大量の言語データか
ら抽出することが試みられている。この時次の問題が生
じる。“I take X to the building”という文型をコー
パスで調査した結果、Xの単語と“take”の訳語の関係
が表1のように得られたとする。この表1をそのまま
“take”の訳し分けのルールとして利用するには以下の
問題がある。すなわち、表にないXの単語に対する“ta
ke”の訳語を決めようがない(未知語の問題)。ここで
属性とは、X、属性値とは英語の名詞、クラスとはtake
の訳語である。この問題を解決するにはX(属性)と訳
語(クラス)の関係を一般化する必要がある。
【0003】
【表1】
【0004】名詞は通常、上位下位の包含関係を示した
シソーラスにまとめられている。そこでこれを利用する
ことでこの問題の解決を図る。これにはまず、表1の英
語の名詞をシソーラスで検索して、これらの英語の名詞
の上位下位の関係を抽出する。これと表1を組合わせて
図9のようなデータを作成する。この図9には表1の情
報に加えて英語の名詞の上位下位の関係が明示されてい
る。いわば、部分的なシソーラスが表1に付加されたと
考えられる。
【0005】ここで、訳し分けの関係を記述するのに、
英語の名詞(図9のリーフノード、すなわち表1の英語
の名詞と同じ)の代わりに図9のシソーラス上の上位ノ
ードを利用することを考える。例えば、リーフの“him
”“her ”“boy ”の代わりにその上位ノードの“人
間(human)”をXの属性値に使い、そのときの“take”
の訳語を「連れていく」とする。この場合、「人間」の
下の訳語はすべて「連れていく」であるから表1と矛盾
しない。
【0006】この3単語を上位概念である「人間」で一
般化する利点は、未知語の問題を解決できるところにあ
る。すなわちこれによって、“him ”“her ”“boy ”
以外の単語であっても、「人間」に属する単語であれば
訳語を「連れていく」に決めることが可能になる。
【0007】未知語を減らすには上位ノードほど有効で
ある。それでは、さらに一般化を進めて「人間」の上位
ノードの「生物」を利用した場合はどうであろうか。こ
の場合ノード「生物」の下の訳語は「連れていく」と
「持っていく」の二通りとなる。このため、どちらの訳
語を選ぶにしても表1と矛盾してしまう。すなわち、ノ
ード「生物」による一般化はデータとの矛盾を生じる過
度な一般化であり好ましくない。未知語を減らすために
は名詞をできるだけ一般化したいが、データとの矛盾も
できるだけ避けたい。求めるのは適度な一般化である。
【0008】上述の例は組み合わせを考えに入れていな
いが、リーフノードの英語の名詞の全体を置換するため
のシソーラス上のノードの組合せは膨大となるため、単
純な枚挙法では解決できないことが多い。しかもこれを
克服する最適なノードの組合せを求める方法は未だ知ら
れていない。
【0009】
【発明が解決しようとする課題】これに代わる準最適な
ノードの組合せを求める方法としては、例えば文献、李
航,安倍直樹「シソーラスとMDL原理を用いた格フレ
ームの一般化」,自然言語処理における学習シンポジウ
ム予稿,1994年の手法が知られている。これは、属性値
をその上位ノードで置換するときの評価関数の変化量
を、各ノード毎に局所的に計算して、評価関数が良くな
る方向に変化する場合には置換を行い、そうでない場合
には置換を行わない手法である。この手法はノードの組
合せを考慮したものではないため、最適なノードの組合
せを求めることは保証できない。
【0010】そこで本発明の目的は、属性を置換するノ
ードの組合せの中で、従来技術で求めることのできなか
った、評価関数を最適にする組合せを求めることのでき
る属性とクラスの関係を一般化する装置を提供せんとす
るものである。
【0011】
【課題を解決するための手段】この目的を達成するた
め、本発明属性とクラスの関係を一般化する装置は、各
ノードに評価値を与える木または森のすべてのリーフを
一意かつ完全に支配し、さらにノードの評価値の合計が
最もよいノードの集合を求める属性とクラスの関係を一
般化する装置において、当該装置が、属性およびクラス
の関係を示す関係表のデータと木または森とを結合する
結合器と、結合結果の木または森の各ノードに、 S(t)=−L(t)+E(t) ここに、tはノード、L(t)は、ノードtが支配して
いるリーフの数から1を減じた量、そしてE(t)は、
ノードtの支配するリーフの持つクラスに着目し、tの
支配下のリーフの数からtの支配するクラスの中の最大
数のクラスの数を減じた量であらかじめ与えられた評価
関数S(t)に従った評価値を付与する評価値計算器
と、前記木または森の各ノードが支配する最左リーフの
位置番号と最右リーフの位置番号とを各ノードに付与す
るノード支配関係計算器と、当該ノード支配関係計算器
の出力を入力とし、接続条件に従って、別に設けた開始
ノードと前記各ノードとさらに別に設けた終了ノードと
の間に辺をはりグラフを作成するグラフ作成器と、前記
開始ノードから前記グラフの辺を介して前記終了ノード
にいたる経路上のノードの集合で、それらノードがすべ
てのリーフを一意かつ完全に支配し、それらノードの評
価値の合計が最小になる経路を求める最短経路探索器と
を具備することを特徴とするものである。
【0012】
【実施例】以下添付図面を参照し実施例により本発明を
詳細に説明する。図1に本発明装置の略構成ブロック線
図を示す。図1において、結合器1は木と関係表の2つ
のデータを結合する(関係表のデータを木の各リーフノ
ードに割り当てる)作用をする。評価値計算器2は与え
られた評価関数に従って結合器1の出力の各ノードに評
価値を付与する。ノード支配関係計算器3は計算器2の
出力の木の各ノードが支配する最左リーフの位置番号と
最右リーフの位置番号を各ノードに付与する。グラフ作
成器4は計算器3の出力を入力として接続条件に従って
入力の上にグラフの辺を作成する。さらに、最短経路探
索器5は作成器4によって出力されたグラフ上の最短経
路を求める。以下上記結合器1、計算器2,3、作成器
4、探索器5の動作をさらに詳細に説明する。
【0013】○結合器1の動作は以下の通りである。 動作開始 ・開始ノードSを生成する。 ・終了ノードEを生成する。 ・関係表(図2参照)の属性のクラスを、属性に対応す
る木(図3参照) のリーフの値としてリーフに付与す
る(図4参照)。 ・開始ノードSに番号0を付与する。 ・木のリーフに左から順に番号を与える(1からmとす
る)。 ・終了ノードEに番号m+1を与える。 動作終了
【0014】○評価値計算器2の動作は以下の通りであ
る。 動作開始 ・すべてのノードに対して、入力の評価関数に従って評
価値を計算してその値をノードに付与する。ただし、開
始ノードSと終了ノードEには値ゼロを与える(図5参
照)。これが詳細については後に説明される。 動作終了
【0015】○ノード支配関係計算器3の動作は以下の
通りである。 動作開始 ・すべてのノードに対して、当該ノードが支配する一番
左のリーフの番号と一番右のリーフの番号を計算して、
この二つの値をノードに付与する。尚リーフでのこれら
の二つの値は、リーフ自身の番号である(図6参照)。
例えば図6においてノードn8の最左リーフノード番号
は1、最右リーフノード番号は3であるからn8には
(1,3)が与えられる。 動作終了
【0016】○グラフ作成器4は本発明の中心部分であ
り、動作は以下の通りである。 動作開始 ・すべてのノードに対して、当該ノードが接続すること
を許された接続可能ノードを規定する接続条件に従っ
て、当該ノードから接続可能ノードに有効辺を張る。接
続条件とは次の条件である。ノードtから接続可能なノ
ードは、tの最右支配リーフの番号+1=ノードXの最
左支配リーフ番号、となるすべてのXである。 動作終了
【0017】この条件に従うと、開始ノードSから終了
ノードEに向かう閉路のない有効グラフが作成される
(図7参照)。この有効グラフ上の開始ノードSから終
了ノードEへ向かう各経路上のノードは、リーフを一意
かつ完全に支配するノードの集合となっている。
【0018】このグラフが生成されると、この経路上の
ノードの得点合計を最適(最大もしくは最小)にする経
路を求めることによって、リーフを一意かつ完全に支配
する最適なノードが求められる。このような経路を求め
るには既存の手法、例えばM.Gondran and M. Minoux,
“Graphs and Algorithms ”,JOHN WILEY & SONS, 198
4, pp.54, あるいは「演習グラフ理論」,伊理,白
川,コロナ社,昭和58年,pp.88 が適用できる。最短経
路探索器5はこのような手法に基づいた装置である。
【0019】以下、具体的な例を利用して上述の動作を
より具体的に説明する。ここでは図2の関係表の属性が
図3で示す木のリーフに対応している場合に、図2の属
性を木のノードの最適な組合せで置換する問題を考え
る。図3の木のノードには、n1からn9までの名前を
付与している。これらの入力が与えられたときに結合器
1はその動作に従って図4を出力する。ここではS,E
ノードの作成、リーフへのクラスの付与、リーフとS,
Eノードへの番号付与が実施されている。
【0020】次に図4の出力を入力として評価値計算器
2は各ノードに評価値を付与する。ここでは評価関数と
して、 S(t)=−L(t)+E(t) (tはノードを表す) を利用する。
【0021】S(t)の右辺第1項L(t)は、ノード
tが支配しているリーフの数から1を減じた量である。
これはtがリーフのいくつ分に相当するかを表した量で
あり、tの一般化の度合いを示す量である。E(t)
は、ノードtの支配するリーフの持つクラスに着目し、
tの支配下のリーフの数からtの支配するクラスの中の
最大数のクラスの数を減じた量である。この量はtの支
配するリーフすべてを、tの支配する最大数のクラスで
置換したときに発生する誤りの数である。S(t)の右
辺第1項は一般化の度合いが大きな上位ノードを使うほ
ど小さな値となり、右辺第2項は誤りが少ないノードほ
ど小さくなる。すなわち、この評価関数は、評価関数の
値が小さくなるノードほど好ましいノードであることを
示している。このため、最適な置換ノードを求める問題
は、評価値の合計を最小化するノードの組合せを求める
問題となる。評価値計算器2の作用の結果図5が得られ
る。この図では、クラス、属性は省略している。
【0022】次に図5を入力としてノード支配関係計算
器3が動作する。この結果、図6の結果が得られる。こ
の図では、クラス、属性は省略している。さらに図6を
入力としてグラフ作成器4は接続条件に従ってノード間
を辺で結ぶ。例えば、ノードn8から有効辺を張るノー
ドを求めよう。n8の最右支配リーフ番号は図6から3
であることが判明する。そして、最左支配リーフの番号
が3+1=4であるようなノードを検索すると、n4,
n7があることが判明する。これよりn8からはn4と
n7に向かって有効辺を張る。この操作をすべてのノー
ドに対して実施すると図7のグラフが得られる。この図
では、クラス、属性は省略している。先に述べたよう
に、この開始ノードSから終了ノードEに向かう経路上
のノードの集合は、リーフを一意かつ完全に支配してい
る。そこでこの経路の中でノードの評価値の合計を最小
にする経路を求め、その経路上のノードの集合を求める
と目的の最適なノード集合が得られる。
【0023】このような評価値の合計が最小になるよう
な経路を求めるには、既存の手法(前述の参考文献「演
習グラフ理論」)が利用できる。この手法を最短経路探
索器5として実現しており、図7のグラフを入力する
と、{S→n8→n7→E}の経路が求められ、一般化
に利用する最適なノードの組合せが{n8,n7}であ
ることが求められる。これによって、図2の属性の
{a,b,c}の代わりにn8を、{d,e}の代わり
にn7を利用した図8に示す一般化された関係表が求め
られる。
【0024】以上本発明を実施例により詳細に説明して
きたが、本発明はこの実施例に限定されることなく、特
許請求の範囲に規定した発明の要旨内で各種の変形、変
更の可能なことは自明であろう。例えば、評価関数はS
(t)に限らず、第1項としてノードの下のクラスの混
ざり具合を表すエントロピーを利用したり、第2項とし
て一般化の度合いに応じた定数を用いるなど他の関数を
使うことも可能である。また、グラフの辺に評価値を追
加するような評価関数も利用可能である。
【0025】
【発明の効果】以上説明してきたように、本発明は関係
表の属性を、属性が所属する木の上位ノードで最適に置
換する問題のように、各ノードに評価値が与えられた木
において、リーフを一意かつ完全に支配し評価値を最適
にするノードの組合せを求める問題を、前述した条件に
よって木をグラフに変換することにより、グラフの最短
経路問題に変換している。これによって従来困難とされ
た最適な置換ノードの組合せを求める問題が既存の手法
によって高速に求められることになった。
【図面の簡単な説明】
【図1】 本発明装置の略構成ブロック線図である。
【図2】 実施例を説明するのに利用する関係表であ
る。
【図3】 実施例を説明するのに利用する木である。
【図4】 図1図示の結合器の動作結果を示す図であ
る。
【図5】 図1図示の評価値計算器の動作結果を示す図
である。
【図6】 図1図示のノード支配関係計算器の動作結果
を示す図である。
【図7】 図1図示のグラフ作成器の動作結果を示す図
である。
【図8】 実施例によって得られた一般化された関係表
である。
【図9】 シソーラスで一般化したデータを示す図であ
る。
【符号の説明】
1 結合器 2 評価値計算器 3 ノード支配関係計算器 4 グラフ作成器 5 最短経路探索器
フロントページの続き (56)参考文献 田中英輝,木構造上の最適一般化を求 める線形時間アルゴリズム,1995年度人 工知能学会全国大会(第9回)論文集, 日本,1995年 7月24日,p.85−p. 88 田中英輝,シソーラスを利用した言語 データ最適一般化アルゴリズム,電子情 報通信学会技術研究報告NLC−95− 20,日本,1995年 7月21日,Vol. 95,No.169,p.9−p.14 田中英輝,シソーラスを利用した言語 データ最適一般化アルゴリズム,情報処 理学会研究報告NL−108−14,日本, 1995年 7月20日,Vol.95,No. 69,p.89−p.94 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/30 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 各ノードに評価値を与える木または森の
    すべてのリーフを一意かつ完全に支配し、さらにノード
    の評価値の合計が最もよいノードの集合を求める属性と
    クラスの関係を一般化する装置において、当該装置が、 属性およびクラスの関係を示す関係表のデータと木また
    は森とを結合する結合器と、 結合結果の木または森の各ノードに S(t)=−L(t)+E(t) ここに、tはノード、 L(t)は、ノードtが支配しているリーフの数から1
    を減じた量 、そして E(t)は、ノードtの支配するリ
    ーフの持つクラスに着目し、t の支配下のリーフの数か
    らtの支配するクラスの中の最大数のクラ スの数を減じ
    た量で あらかじめ与えられた評価関数S(t)に従った
    評価値を付与する評価値計算器と、 前記木または森の各ノードが支配する最左リーフの位置
    番号と最右リーフの位置番号とを各ノードに付与するノ
    ード支配関係計算器と、 当該ノード支配関係計算器の出力を入力とし、接続条件
    に従って、別に設けた開始ノードと前記各ノードとさら
    に別に設けた終了ノードとの間に辺をはりグラフを作成
    するグラフ作成器と、 前記開始ノードから前記グラフの辺を介して前記終了ノ
    ードにいたる経路上のノードの集合で、それらノードが
    すべてのリーフを一意かつ完全に支配し、それらノード
    の評価値の合計が最小になる経路を求める最短経路探索
    器とを具備することを特徴とする属性とクラスの関係を
    一般化する装置。
JP17177095A 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置 Expired - Fee Related JP3333802B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17177095A JP3333802B2 (ja) 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17177095A JP3333802B2 (ja) 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置

Publications (2)

Publication Number Publication Date
JPH0922413A JPH0922413A (ja) 1997-01-21
JP3333802B2 true JP3333802B2 (ja) 2002-10-15

Family

ID=15929362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17177095A Expired - Fee Related JP3333802B2 (ja) 1995-07-07 1995-07-07 属性とクラスの関係を一般化する装置

Country Status (1)

Country Link
JP (1) JP3333802B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100372582B1 (ko) * 2000-02-23 2003-02-17 가부시키가이샤 히타치세이사쿠쇼 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
田中英輝,シソーラスを利用した言語データ最適一般化アルゴリズム,情報処理学会研究報告NL−108−14,日本,1995年 7月20日,Vol.95,No.69,p.89−p.94
田中英輝,シソーラスを利用した言語データ最適一般化アルゴリズム,電子情報通信学会技術研究報告NLC−95−20,日本,1995年 7月21日,Vol.95,No.169,p.9−p.14
田中英輝,木構造上の最適一般化を求める線形時間アルゴリズム,1995年度人工知能学会全国大会(第9回)論文集,日本,1995年 7月24日,p.85−p.88

Also Published As

Publication number Publication date
JPH0922413A (ja) 1997-01-21

Similar Documents

Publication Publication Date Title
US5267156A (en) Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor
US4635199A (en) Pivot-type machine translating system comprising a pragmatic table for checking semantic structures, a pivot representation, and a result of translation
JP3345763B2 (ja) 自然言語翻訳装置
JP3333802B2 (ja) 属性とクラスの関係を一般化する装置
JPH03260766A (ja) 括弧生成判定機能付翻訳装置
KR100278095B1 (ko) 원문의복잡도에따라융통성을갖는기계번역시스템
White Characteristics of the METAL machine translation system at production stage
JP3390471B2 (ja) 仕様書自動生成装置
Finin et al. Augmenting ATNs
JP3014409B2 (ja) 自然言語自動翻訳装置
JPH05120332A (ja) 機械翻訳装置
JP2888525B2 (ja) 機械翻訳システムの辞書保守方法
JP3011273B2 (ja) 翻訳結果管理方法及び機械翻訳システム
Nagao Outline of the machine translation project of the Japanese government
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
JPH05324711A (ja) 自然言語自動翻訳システム
JP2000029878A (ja) 翻訳知識学習方法および装置、機械翻訳方法および装置
JP2935928B2 (ja) 自然言語翻訳装置
Shiino et al. Japanese-English Machine Translation System Implemented in The Personal Computer
JPH096789A (ja) 分野別シソーラス生成装置
JPH05108709A (ja) 自然言語変換方法
JPH06236394A (ja) 自然言語自動翻訳装置
JPS6386071A (ja) 自然言語翻訳方式
JPH05120334A (ja) 機械翻訳装置
JPH04111167A (ja) 電子化辞書のメンテナンスシステム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees