JPH04281568A - Retrieving device - Google Patents

Retrieving device

Info

Publication number
JPH04281568A
JPH04281568A JP3069413A JP6941391A JPH04281568A JP H04281568 A JPH04281568 A JP H04281568A JP 3069413 A JP3069413 A JP 3069413A JP 6941391 A JP6941391 A JP 6941391A JP H04281568 A JPH04281568 A JP H04281568A
Authority
JP
Japan
Prior art keywords
information
pair
predicate
similarity
correspondence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3069413A
Other languages
Japanese (ja)
Inventor
Taro Morishita
森下 太朗
Kazuhiro Tsubaki
椿 和弘
Takahiro Yamaji
山路 孝浩
Shigeki Kuga
空閑 茂起
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP3069413A priority Critical patent/JPH04281568A/en
Publication of JPH04281568A publication Critical patent/JPH04281568A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To obtain the combination of partial structure with high similarity by finding the set of the correspondence relation of the tree structure of a retrieval request and data expressed in the tree structure and structural similarity between them. CONSTITUTION:When the retrieval request described according to specific syntax is inputted by an input means 1, the syntax is interpreted by an interpreter means 4 for relational structure, and the retrieval request is converted to internal structure. Storage information provided with structural similarity in memory is calculated by a calculation means 6 for structural correspondence relation and a means 7 for structural similarity. Plural pieces of information covering the retrieval request are extracted by combining only the partial structure with high similarity by a partial structure combination means 8, and they are displayed with correspondence relation with the retrieval request by a display means 3. As a result, the plural pieces of information with different inscription and same relational structure can be displayed including the correspondence relation.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、単なる文字列や記号列
の完全マッチングによる検索ではなく、情報間の関係構
造の類似性を参照し、文字列や記号列が表記上異なって
いてもそれらの背景にある関係が一致していれば部分マ
ッチングにより検索する、「類似情報」の検索システム
に関するものである。
[Industrial Application Field] The present invention is not a simple search based on complete matching of character strings or symbol strings, but refers to the similarity of the relational structure between information, and even if the character strings or symbol strings are different in notation, This relates to a search system for "similar information" that searches by partial matching if the underlying relationships match.

【0002】利用分野としては、各分野における検索シ
ステム、過去の事例を活用するタイプのエキスパートシ
ステム、自然言語処理システム、発想支援システム、V
E支援システム、プログラム再利用システム等を挙げる
ことができる。
[0002] Application fields include search systems in various fields, expert systems that utilize past examples, natural language processing systems, ideation support systems, and V.
Examples include E-support systems and program reuse systems.

【0003】0003

【従来の技術】現在までに、多数の情報検索システムが
開発されているが、その大部分は、基本的には、固定的
なデータベースに記憶された情報を、インデックスと検
索要求入力の記号列の完全マッチングに基づいて抽出す
るタイプのシステムである。これを拡張した多少柔軟な
検索システムとしては、分野毎にシソーラスを用意し、
概念の上位下位を参照することにより、同様の概念に属
するものを検索するタイプのものも存在するが、妥当な
シソーラスを用意することは難しい。
[Prior Art] To date, a large number of information retrieval systems have been developed, but most of them basically use information stored in a fixed database as an index and a symbol string for inputting a retrieval request. This is a type of system that extracts data based on perfect matching. As a somewhat flexible search system that extends this, a thesaurus is prepared for each field,
There is a type of search that searches for items belonging to similar concepts by referring to the upper and lower levels of the concept, but it is difficult to prepare a valid thesaurus.

【0004】一方、類推研究の分野において、与えられ
た2つの系に対して構造的に類似したものの対応関係を
取るための手段として「構造写像エンジン」という名の
プログラムが開発されている。しかし、このプログラム
は類推用のエンジンとして作成されており、検索や問題
解決のための枠組みは備えていない。
On the other hand, in the field of analogical reasoning research, a program called a "structural mapping engine" has been developed as a means for determining the correspondence between structurally similar systems between two given systems. However, this program was created as an analogy engine and does not have a framework for searching or problem solving.

【0005】[0005]

【発明が解決しようとする問題点】■完全に一致してい
なくとも、構造的に一致しているような「類似」情報の
検索が困難である。
[Problems to be Solved by the Invention] - It is difficult to search for "similar" information that is structurally consistent even if it is not a complete match.

【0006】■構造的に完全に一致していなくとも、部
分的に構造が一致している複数のデータを組み  合わ
せて、全体として検索要求を満たしているものを検索す
ることは更に困難である。
[0006] Even if the structure does not completely match, it is even more difficult to combine multiple pieces of data that partially match the structure and search for something that satisfies the search request as a whole. .

【0007】■厳密な検索要求の記述が必要である。[0007] ■ It is necessary to accurately describe the search request.

【0008】■関係が類似しているものを分野にまたが
って検索できないために、不足していた知識を他の系の
関係から補えたり、問題解決のヒントとして参照できた
りする機能がない。
[0008] Since it is not possible to search for similar relationships across fields, there is no function to supplement missing knowledge from relationships in other systems or to refer to them as hints for problem solving.

【0009】[0009]

【問題点を解決するための手段】上記目的を達成するた
め、本発明に係る「検索装置」においては、従来の検索
システムにおいて利用されている手段である検索情報の
入力手段、情報の記憶手段、情報間のマッチングを取る
手段、検索情報の表示手段、及び一連の検索処理の制御
手段をもととして、構造的な対応関係の計算手段、構造
的類似度の計算手段、関係構造の解釈手段、及び関係構
造の記憶手段、類似の部分構造の組み合わせ手段が必要
である。
[Means for Solving the Problems] In order to achieve the above object, the "search device" according to the present invention includes search information input means and information storage means, which are the means used in conventional search systems. , a means for matching information, a means for displaying search information, and a means for controlling a series of search processes, a means for calculating structural correspondence, a means for calculating structural similarity, and a means for interpreting relational structures. , a storage means for relational structures, and a means for combining similar substructures.

【0010】0010

【作用】入力手段によって、特定のシンタックスに従っ
て記述した検索要求を入力すると、関係構造の解釈手段
により、シンタックスが解釈され、検索要求が内部構造
に変換される。変換された検索要求に対して、構造的な
類似性を持つ、メモリ内の記憶情報が、構造的な対応関
係の計算手段と、構造的類似度の計算手段によって検索
される。検索された複数の記憶情報に対して、部分構造
組み合わせ手段により、類似度の高い部分構造だけを組
み合わせて検索要求をカバーする複数の情報を抽出し、
表示手段により、検索要求との対応関係とともに表示さ
れる。
[Operation] When a search request written according to a specific syntax is inputted by the input means, the syntax is interpreted by the relational structure interpretation means and the search request is converted into an internal structure. In response to the converted search request, stored information in the memory that has structural similarity is searched by a structural correspondence calculation means and a structural similarity calculation means. For the plurality of searched stored information, the substructure combination means combines only the substructures with a high degree of similarity to extract a plurality of pieces of information that cover the search request,
The display means displays the information along with the correspondence with the search request.

【0011】本装置により、表記は異なるが部分的な関
係構造が同一である複数の情報を対応関係込みで取り出
し表示するように作用する。
[0011] The present device functions to extract and display a plurality of pieces of information, including their correspondence, which have different notations but have the same partial relational structure.

【0012】0012

【実施例】以下、図面を用いて本発明の一実施例を詳細
に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below in detail with reference to the drawings.

【0013】図1は本発明装置の構成例を示す図である
FIG. 1 is a diagram showing an example of the configuration of the apparatus of the present invention.

【0014】入力手段1は、計算機のキーボード、マウ
ス、ファイルシステムなどの入力機器に相当する。問題
、データ、等の必要情報を入力する。
The input means 1 corresponds to input devices such as a computer keyboard, mouse, and file system. Enter necessary information such as questions, data, etc.

【0015】記憶手段2は、計算機のメモリに相当する
。構造化されたデータが保持され必要に応じて呼び出さ
れる。
The storage means 2 corresponds to the memory of a computer. Structured data is maintained and recalled as needed.

【0016】表示手段3は、CRT等の表示装置に相当
する。解釈手段4は、特定のシンタクスに従って、標準
入力やファイルから入力されたデータを内部構造化して
記憶するインタプリタ等のプログラムに相当する。
The display means 3 corresponds to a display device such as a CRT. The interpretation means 4 corresponds to a program such as an interpreter that internally structures and stores data input from standard input or files according to a specific syntax.

【0017】マッチング手段5は、通常のプログラミン
グ言語等で提供されているメモリセルの値のマッチング
を行うためのプログラムに相当する。対応関係計算手段
6は、検索要求(以降ターゲットと呼ぶ)と構造的に部
分マッチする構造データをデータベース(以降ベースと
呼ぶ)から抽出し、ターゲットのどの部分とどの部分が
対応するかのペアを計算するための処理手順(プログラ
ム)を表している。この手段により、検索要求を部分的
に満たす可能性のあるデータの集合がデータベースから
検索される。  類似度計算手段7は対応計算の結果抽
出されたターゲットとベースのペアの構造的な類似度を
計算するための処理手順(プログラム)を表している。 この手段により、検索要求に最も類似した検索結果が1
つ取り出される。
The matching means 5 corresponds to a program for matching memory cell values provided in a normal programming language or the like. The correspondence calculation means 6 extracts structural data that partially matches the search request (hereinafter referred to as target) from the database (hereinafter referred to as base), and calculates pairs of which part of the target corresponds to which part. It represents the processing procedure (program) for calculation. By this means, a collection of data that may partially satisfy the search request is retrieved from the database. The similarity calculation means 7 represents a processing procedure (program) for calculating the structural similarity of the target-base pair extracted as a result of the correspondence calculation. By this means, the search results most similar to the search request are
one is taken out.

【0018】以下の図で説明する対応関係計算手段及び
類似度計算手段は前述の「構造写像エンジン」において
与えられている手段とほぼ同一である。
The correspondence calculation means and similarity calculation means explained in the following figures are almost the same as the means provided in the above-mentioned "structure mapping engine".

【0019】部分構造組み合わせ手段8は、検索要求を
満たす、最も類似した部分構造の集合を取り出すための
処理手順(プログラム)を表している。この手段により
検索要求に最も類似した部分構造の組み合わせが1つ取
り出される。
The substructure combination means 8 represents a processing procedure (program) for extracting a set of most similar substructures that satisfy the search request. By this means, one combination of substructures that is most similar to the search request is extracted.

【0020】制御手段9は、1〜8の各手段を結合し、
一連の動作を可能とするものであり、実行プログラム、
計算機のOS、あるいは計算機の制御を司るハードの部
分に相当する。
[0020] The control means 9 connects each of the means 1 to 8,
It enables a series of operations, and includes execution programs,
It corresponds to the computer's OS or the hardware part that controls the computer.

【0021】以下、発明の本質的な部分である対応関係
計算手段6、類似度計算手段7、部分構造組み合わせ手
段8の関連部分の実現方法の一例を示す。
An example of a method for realizing the related parts of the correspondence calculation means 6, similarity calculation means 7, and substructure combination means 8, which are the essential parts of the invention, will be described below.

【0022】図2は、本発明装置に対する情報の表現の
仕方を表している。図2(a)はベースあるいはターゲ
ットを記述するのに必要な表現要素を分類図示したもの
である。図2(b)は各表現要素の宣言方法とそのシン
タックスを表している。図2(c)はベース、ターゲッ
トの表現方法を表している。図に示されるように、ベー
ス、ターゲットのデータは、図2(b)の宣言方法によ
り記述された個々の表現対象を要素とする述語の集合と
して表現される。この例は電気回路の仕様を対象とした
もので、ベースのデータは「水温が設定温度よりも高け
ればデジタルアラームのブザーを鳴らす」、「ボタンを
押せばアナログランプが点灯する」という2つの仕様が
、ターゲットのデータは「部屋の照度が設定照度よりも
明るければデジタルアラームのLEDを点灯する」とい
う仕様がそれぞれ記述されている。
FIG. 2 shows how information is represented for the apparatus of the present invention. FIG. 2(a) is a classification diagram of the expression elements necessary to describe the base or target. FIG. 2(b) shows the declaration method of each expression element and its syntax. FIG. 2(c) shows how the base and target are expressed. As shown in the figure, the base and target data are expressed as a set of predicates whose elements are individual expression objects described by the declaration method shown in FIG. 2(b). This example is for electrical circuit specifications, and the base data consists of two specifications: ``If the water temperature is higher than the set temperature, a digital alarm buzzer will sound'' and ``When a button is pressed, an analog lamp will light up.'' However, each target data has a specification that states, ``If the illuminance of the room is brighter than the set illuminance, the LED of the digital alarm will be turned on.''

【0023】図3は、本発明装置の対応計算手段の実現
方法の一例を表している。図3は、図2の形式でデータ
が与えられることを前提とした場合の一般的な処理手順
を表している。ここでは、説明の便宜上、下記定義用語
を用いて処理手順が記述されている。用語の定義は下記
のとおり。
FIG. 3 shows an example of a method for implementing the correspondence calculation means of the apparatus of the present invention. FIG. 3 shows a general processing procedure on the premise that data is provided in the format shown in FIG. Here, for convenience of explanation, the processing procedure is described using the following defined terms. Definitions of terms are as follows.

【0024】paraent(N) : 木構造上で、
ノードNの親ノードを表す acestor(N) : 木構造上で、ノードNの祖
先ノードの集合を表す children(N) : 木構造上で、ノードNの
子ノードの集合を表す decendant(N) : 木構造上で、ノードN
の子孫ノードの集合を表す rootN : 木構造上のノードNが木のルートであ
ることを表す fn(P) : 述語Pのファンクタ(述語名)を表す
order(P) : 述語Pの引数の深さを表す(正
整数)述語ペア : ベースとターゲットの述語の組み
Pb : 述語ペアP=(Pb,Pt)のベース述語P
bを表すPt : 述語ペアP=(Pb,Pt)のター
ゲット述語Ptを表す同一述語名ペアSP : fn(
SPb) = fn(SPt)を満たす述語ペアを表す 引数対応ペアArg(P) : P=(Pb,Pt)に
対して、PbとPtの引数を左から順にペアアップした
述語ペアの集合         Pb(Arg1b,
Arg2b,…,ArgNb), Pt(Arg1t,
Arg2t,…,ArgMt),  (N≧M)   
      Arg((Pb,Pt)) ={(Arg
1b,Arg1t),(Arg2b,Arg2t),…
,(ArgMb,ArgMt)} 引数対応では、引数の数が異なる場合は小さいほうに合
わせる。 引数対応展開 : 述語ペアPに対してArg(P)を
求める操作を表す ただし、Arg(P) ∈ Entity であればそ
れ以上は展開不能 P−Tree : Pに対する引数対応展開操作を可能
な限り施した場合、PとP以下の引 数対応ペアが作る木構造を表す Argij(P) : P−Tree上の深さ(i+1
)段目、左からの位置j番目に位置する引数対応ペアを
表す Md(P) : 述語ペアPの引数対応の最大の深さを
表すMd(P) = min( order(Pb),
 order(Pt) )  …  式1an(P) 
: 述語Pの引数の個数を表すPnum(P) : P
の引数対応ペアの要素数を表すPnum(P) = m
in( an(Pb), order(Pc) ) …
  式2Anum(i) : P−Tree上の第(i
+1)段目のノード(述語ペア)の総数 Anum(i) = ΣPnum(Argi−1j(P
)) …  式3ただし、(Arg01(P) = P
)とする全同一述語ペアSP : 対象としているベー
スとターゲットのすべての同一名述語ペア 全引数述語ペアAP(P) : Pより下の全引数対応
ペアの集合 全対応述語ペアP(P) : P(P) = {P, 
AP(P)}全ペア集合AP : 対象としているベー
スとターゲットのすべての対応述語ペア   エンティティ・ペアE(P) : { (Pb,P
t) | Pb,Pt∈Entity,(Pb,Pt)
∈AP(P) }   競合集合Cnf(P) : { (P0,Pt) 
∈ AP | P0 ≠ Pb } ∪ { (Pb,
P1) ∈ AP |P1 ≠ Pt }      
行先または出所のどちらかのみが異なる別の対応関係の
集合競合階層C(P) : Cnf(P) ∪ C(A
P(P))  P以下述語ペアに対する競合集合の集合 consist(P) ⇔ E(P) ∩ C(P) 
= φ述語ペアP以下が構造的に一貫しているとはエン
ティティレベルの対応関係が1対1に取れる場合であり
かつその場合に限る。 GMP : consistであるrootPに対して
、 GMP = P(P)NGM : 現在、対象とし
ているすべてのGMの数consist(GMP) ⇔
  consist(P)GM ={ GMP,GMQ
 }が consist ⇔  { E(P)∪E(Q
) } ∩ { C(P)∪C(Q) } = φco
m(Pb,Qb) : GMP,GMQであるP,Qに
対して定義される。 PbとQbの共有ベース述語を表
す    com(Pb,Qb)={ CPb∈BP 
| CPb∈ancestor(Pb), CPb∈a
ncestor(Qb) } …式4 parents(P) : 複数の木構造に現れる述語
ペアPに対して、それぞれの木のPの親parent(
P)の集合Ev(P) : 述語ペアPに対する評価値
の集合を表すV(P) : 述語ペアPに対する評価値
を表すV(GM) : GMに対する評価値を表すAn
ij(P) : 述語PのP−Treeで、i段j番目
の引数の個数を表す。 f(P) : 述語PをルートとするターゲットのP−
Treeに対して、最も類似度の高いベースを構造検索
する(対応関係を求める)操作を表す F(P) : 構造検索された結果である、述語ペアP
をルートとする、P−Treeに対する部分構造組み合
わせ操作を表すd(P) : 述語PをルートとするT
reeの最大深さを表す。 図3(a)は、対応関係計算の全体フローを表している
。図3(b)は、図3(a)の全体フロー中のペア集合
の計算(ア)の部分を表している。ベースとターゲット
から同一の名前をもつ述語のペアの集合を、通常のマッ
チング手段5により算出し(ア)、各ペアに対してベー
ス側、ターゲット側の各述語の引数の対応を、可能な限
り展開しながら、名前の一致、不一致にかかわらずに取
ることによって、新たな対応ペアを抽出する(イ、ウ)
。引数の展開をどこまで行えばよいかは上記の式1〜3
により定義された値を計算すれば良い(カ)。新たに求
めペアの和集合(エ、オ)を取ればペア集合が求められ
る。これは木構造間で対応可能な述語の組みを計算して
いることになる。
parent(N): On the tree structure,
acestor(N) representing the parent node of node N: children(N) representing the set of ancestor nodes of node N on the tree structure: descendant(N) representing the set of child nodes of node N on the tree structure: On the tree structure, node N
rootN represents a set of descendant nodes of: fn(P) represents that node N on the tree structure is the root of the tree: order(P) represents the functor (predicate name) of predicate P: depth of arguments of predicate P Predicate pair (positive integer) that represents: Base and target predicate pair Pb: Base predicate P of predicate pair P=(Pb, Pt)
Pt representing b: Same predicate name pair SP representing target predicate Pt of predicate pair P=(Pb, Pt): fn(
Argument correspondence pair Arg(P) representing a predicate pair satisfying SPb) = fn(SPt): For P=(Pb, Pt), a set of predicate pairs Pb( Arg1b,
Arg2b,..., ArgNb), Pt(Arg1t,
Arg2t,…, ArgMt), (N≧M)
Arg ((Pb, Pt)) = {(Arg
1b, Arg1t), (Arg2b, Arg2t),...
, (ArgMb, ArgMt)} In argument correspondence, if the number of arguments is different, match the smaller one. Argument correspondence expansion: Represents the operation to obtain Arg(P) for predicate pair P. However, if Arg(P) ∈ Entity, no further expansion is possible P-Tree: Argument correspondence expansion operation for P is performed as much as possible. In this case, Argij(P) represents the tree structure created by P and argument correspondence pairs below P: Depth on P-Tree (i+1
) row, Md(P) representing the argument correspondence pair located at position j from the left: Md(P) representing the maximum depth of argument correspondence of predicate pair P = min( order(Pb),
order(Pt) )...Formula 1an(P)
: Pnum(P) representing the number of arguments of predicate P : P
Pnum(P) = m representing the number of elements in the argument correspondence pair of
in(an(Pb), order(Pc))...
Formula 2Anum(i): The (i-th
+1) Total number of nodes (predicate pairs) Anum(i) = ΣPnum(Argi-1j(P
)) ... Formula 3 However, (Arg01(P) = P
) All identical predicate pairs SP: All identical name predicate pairs of target base and target All argument predicate pairs AP(P): Set of all argument corresponding pairs below P All corresponding predicate pairs P(P): P(P) = {P,
AP(P)} All pair set AP: All corresponding predicate pairs of target base and target Entity pair E(P): { (Pb,P
t) | Pb, Pt∈Entity, (Pb, Pt)
∈AP(P) } Competitive set Cnf(P) : { (P0, Pt)
∈ AP | P0 ≠ Pb } ∪ { (Pb,
P1) ∈ AP | P1 ≠ Pt }
A set competition hierarchy C(P) of another correspondence that differs only in either the destination or the source: Cnf(P) ∪ C(A
P(P)) Set of competitive sets for predicate pairs less than or equal to P consist(P) ⇔ E(P) ∩ C(P)
= φ Predicate pair P and the following are structurally consistent if and only if there is a one-to-one correspondence relationship at the entity level. GMP: For rootP, which is consistent, GMP = P (P) NGM: Number of all GMs currently targeted, consistent (GMP) ⇔
consist(P)GM ={ GMP,GMQ
} is consistent ⇔ { E(P)∪E(Q
) } ∩ { C(P)∪C(Q) } = φco
m(Pb, Qb): Defined for P and Q which are GMP and GMQ. Representing the shared base predicate of Pb and Qb com(Pb, Qb)={ CPb∈BP
| CPb∈ancestor(Pb), CPb∈a
ncestor(Qb) } ...Formula 4 parents(P): For a predicate pair P appearing in multiple tree structures, the parent parent(
P) set Ev(P) : Represents a set of evaluation values for predicate pair P V(P) : Represents an evaluation value for predicate pair P V(GM) : An represents an evaluation value for GM
ij(P): represents the number of arguments in the i-th stage of the P-Tree of the predicate P. f(P): target P- with predicate P as the root
F(P), which represents the operation of structurally searching for the base with the highest degree of similarity (finding correspondence) for Tree: Predicate pair P, which is the result of structural searching
d(P) representing a substructure combination operation on P-Tree whose root is d(P): T whose root is predicate P
Represents the maximum depth of the ree. FIG. 3(a) shows the overall flow of correspondence calculation. FIG. 3(b) shows the calculation of pair sets (a) in the overall flow of FIG. 3(a). A set of pairs of predicates with the same name from the base and target is calculated by the usual matching means 5 (a), and for each pair, the correspondence of the arguments of each predicate on the base side and the target side is determined as much as possible. While expanding, extract new corresponding pairs by taking names regardless of whether they match or do not match (B, C)
. To determine how far to expand the argument, use equations 1 to 3 above.
All you have to do is calculate the value defined by (f). By taking the new union of the sought pairs (E, O), the pair set can be found. This means calculating a set of predicates that can be matched between tree structures.

【0025】図3(c)は図3(a)の全体フロー中の
ペア集合を分類して、一対一の対応関係になるような構
造的に一貫したいくつかのペア集合のまとまりを作るた
めの処理手順(イ)を表している。図3(b)で求めた
ペア集合中の各ペアに対して、まずエンティティ・レベ
ルまで展開した場合の、エンティティレベルのペア集合
と、展開過程において競合するペア集合とを計算してお
く(ア)。ペア集合のルートとなるペアに関して、末端
レベルまで構造的に一貫した、すなわち、エンティティ
・レベルのペアと競合するペアの共通ペアが存在しない
、ペアであるかどうかを判断し(イ、エ)、もし一貫し
ておればそのペア以下の展開ペアを1つのまとまりとす
る(オ、カ)。もし一貫していなければそのペアの各子
ノードをルートとみなして、一貫性の判断以下の処理を
くり返す(キ)。これらの過程を繰り返し、対象となる
ルートペアがもはや存在しなくなった時点におけるペア
のまとまりが、求めるべき分類されたペア集合である。
FIG. 3(c) is a method for classifying pair sets in the overall flow of FIG. 3(a) to create a group of several structurally consistent pair sets that have a one-to-one correspondence relationship. This represents the processing procedure (a). For each pair in the pair set obtained in Figure 3(b), first calculate the entity-level pair set when expanded to the entity level and the pair set that competes in the expansion process. ). Regarding the pair that is the root of the pair set, determine whether it is a pair that is structurally consistent down to the terminal level, that is, there is no common pair of pairs that conflict with pairs at the entity level (a, d); If it is consistent, the expansion pairs below that pair are treated as one group (O, F). If it is not consistent, each child node of the pair is regarded as the root, and the process following consistency determination is repeated (K). By repeating these processes, the group of pairs at the point when the target root pair no longer exists is the classified pair set to be obtained.

【0026】図3(d)は、図3(a)の全体フロー中
の、分類されたペア集合まとまりを結合して最終的なペ
ア集合のまとまりを作成するための処理手順を表してい
る(ウ)。図3(c)で求めたペア集合各まとまりに対
して、まず、ターゲットには不足している上位関係がベ
ースに存在する場合、下位関係同士のまとまりはより大
きなまとまりとしてまとめる。すなわち、ターゲットに
は現れない述語を同じ祖先として持つようなベースの述
語同士が、ペアのまとまりのルートになっている場合、
それらのペアのまとまりの和集合を取る(イ)。この和
集合のまとまりが構造的に一貫しておれば(エ)、それ
らのまとまりをそれらの和集合で置き換えることにより
、まとまりの集合を新たなまとまりの集合に更新する(
オ)。置き換えられるまとまり同士がなくなるまでこの
操作を繰り返す(ウ)。
FIG. 3(d) shows the processing procedure for creating a final pair set by combining the classified pair sets in the overall flow of FIG. 3(a). cormorant). For each group of pair sets obtained in FIG. 3(c), first, if the target has a missing higher-level relationship in the base, groups of lower-level relationships are grouped together as a larger group. In other words, if base predicates that have the same ancestor as a predicate that does not appear in the target are the roots of a group of pairs,
Take the union of those pairs (a). If this set of unions is structurally consistent (d), update the set of unions to a new set of unions by replacing them with their union (d).
e). Repeat this operation until there are no more groups to replace (c).

【0027】次に、更新された各まとまりの中で、独立
な木構造のもの同士が和集合を取った場合一貫しておれ
ばそれらをより大きなまとまりとしてまとめる。この手
順は最初の結合手順と酷似している(カ〜コ)。
Next, in each updated group, when the independent tree structures are unioned, if they are consistent, they are combined into a larger group. This step is very similar to the first bonding step.

【0028】図4は、本発明装置の類似度計算手段の実
現方法の一例を表している。図4も、上記の定義用語を
用いて記述され、図2の形式でデータが与えられること
を前提としている。図4(a)はペア集合の各ペアに対
して、評価値を求めるためのいくつかの指標となる値の
集合を計算する手順の一例を示している。
FIG. 4 shows an example of a method for implementing the similarity calculation means of the apparatus of the present invention. FIG. 4 is also written using the above defined terms and assumes that data is given in the format of FIG. FIG. 4A shows an example of a procedure for calculating a set of values that serve as several indicators for obtaining an evaluation value for each pair in a pair set.

【0029】評価値の指標の一例は次の通りである。An example of an evaluation value index is as follows.

【0030】・同一の述語のペアに対して、述語がfu
nctionなら、(0.0,1.0)の一定の小数を
、relationならそれよりかなり高い(0.0,
1.0)の一定の小数をそれぞれ指標として与える(イ
、ウ)。
・For the same pair of predicates, the predicate is fu
nction is a fixed decimal number of (0.0, 1.0), and relation is a much higher number (0.0, 1.0).
1.0) are given as indicators (A, C).

【0031】・述語ペアの引数が述語ペアである場合、
すなわち構造の親である場合(0.0,1.0)の一定
の小数を指標として与える(エ、オ)。
・If the argument of a predicate pair is a predicate pair,
In other words, when the structure is a parent, a certain decimal number (0.0, 1.0) is given as an index (E, E).

【0032】・述語ペアに対して、引数の深さが一致し
ていれば(0.0,1.0)の一定の小数を、引数の深
さの差が1ならばそれより小さい(0.0,1.0)の
一定の小数をそれぞれ指標として与える(カ、キ、ク、
ケ)。
- For a predicate pair, if the argument depths match, a constant decimal number (0.0, 1.0) is used, and if the difference in argument depth is 1, a smaller number (0.0, 1.0) is used. .0, 1.0) are given as indicators (ka, ki, ku,
ke).

【0033】・子孫の述語ペアには、それが現れる各木
構造上の各親の評価値の数割をそれぞれ指標として与え
る(コ、サ)。
- A percentage of the evaluation value of each parent on each tree structure in which the descendant predicate pair appears is given as an index (ko, sa).

【0034】これらの基準を満たす指標の集合が、求め
る評価値集合である(ア以下)。図4(b)は、検索さ
れた各まとまりに対する評価値すなわち類似度を計算す
る手順を表している。この手順は、まず図4(a)で求
めた評価値指標に対して良く知られた確率計算を行って
、1つのペアに対する評価値を求め(ア、イ、ウ)、次
に1つのまとまりに属するすべてのペアに対する評価値
の和を取る(エ)。
[0034] A set of indicators that satisfy these criteria is a set of evaluation values to be obtained (see below). FIG. 4(b) shows a procedure for calculating the evaluation value, that is, the degree of similarity for each searched group. This procedure first performs a well-known probability calculation on the evaluation value index obtained in Figure 4(a) to obtain the evaluation value for one pair (A, B, C), and then calculates the evaluation value for one group. Find the sum of the evaluation values for all pairs belonging to (d).

【0035】図5は部分構造組み合わせ法の一例を示し
ている。一般に(6)、(7)のような手段による構造
マッチングだけでは、部分構造(下位構造)が不一致で
あっても、全体構造(上位構造)が一致しておれば、計
算上の類似度が高くなるため、下位構造に対する類似度
の高いデータがターゲットに存在するにもかかわらず、
そのような下位構造まで検索されない場合がでてくる。 この問題に対処するために、上位構造の一致を考慮しつ
つ、部分構造毎に最も類似した情報をターゲットから抽
出して、その組み合わせを示すことにより検索要求を満
たす機能を追加したものが図5に示す方式である。以下
図5に沿って説明する。
FIG. 5 shows an example of the substructure combination method. In general, with structure matching using methods such as (6) and (7) alone, even if the substructures (lower-level structures) do not match, if the overall structure (upper-level structure) matches, the calculated similarity can be calculated. Even though the target has data with high similarity to the substructure,
There may be cases where such substructures are not searched. To deal with this problem, we added a function that satisfies the search request by extracting the most similar information for each substructure from the target while taking into account the matching of the upper structure, and showing the combinations shown in Figure 5. This is the method shown in . This will be explained below with reference to FIG.

【0036】手段(6)(7)により構造検索された、
最も類似度の高い述語ペアGMpに対して、木のルート
から出発して左から右の方向に木の子ノードをサーチ(
セ)して、 1)ターゲットのツリーには存在するが、ペアのツリー
には存在しないノードがある場合、すなわち、検索結果
のベースがターゲットの部分構造に対応しきれていない
場合(ウ)、 2)ターゲットのツリーに存在する述語ノードがペアの
ツリーにも存在しているが、ベースと述語名が異なって
いる場合(エ、オ)、をそれぞれ検出し、どちらかの場
合に当てはまれば、該当するノード以下の部分木に対し
て(カ)、手段(6)、(7)を適用し、部分的により
類似している構造として検索する(キ)。検索された部
分対応ペアに関して、更に下位構造が部分的に構造マッ
チングする場合を考慮して、この部分構造組み合わせ手
続きを再帰的に適用する(ク)。子ノードに対する処理
が終了(イ)すれば、孫ノードにより類似度の高い部分
構造が存在する場合を考慮して、まだ部分検索されてい
ない(ケ、サ)子ノード以下に対して(ス)同様の処理
操作を適用する。このようにノード上から下へ部分構造
組み合わせ処理を適用して、もはや部分構造が作れない
レベル、すなわち木のリーフに達した(コ)ならば、処
理を終了する。この処理の間に新たに作成された構造ペ
アの集合が、求めるべき、より類似度の高い部分構造の
組み合わせとなる。この手順で求めた部分構造のペアの
集合には、より高次の関係構造から、詳細な部分構造ま
で、最適なペアが組み合わされていることになる。
Structure searched by means (6) and (7),
For the predicate pair GMp with the highest similarity, search child nodes of the tree from left to right starting from the root of the tree (
1) If there is a node that exists in the target tree but not in the paired tree, that is, if the base of the search result does not fully correspond to the target substructure (c), 2) Detect cases where a predicate node that exists in the target tree also exists in the paired tree, but the base and predicate names are different (e, e), and if either case is true, (f), means (6) and (7) are applied to the subtree below the corresponding node, and a structure that is partially more similar is searched (g). Regarding the retrieved partial correspondence pairs, this partial structure combination procedure is applied recursively, taking into consideration the case where the lower structures are partially structurally matched (H). When the processing for the child node is completed (B), considering the case where there is a substructure with a higher degree of similarity than the grandchild node, search is performed for the child node and below (S) that have not yet been partially searched (K, S). Apply similar processing operations. In this way, the substructure combination process is applied from the top to the bottom of the nodes, and when the level at which no substructures can be created, that is, the leaf of the tree is reached (k), the process is terminated. The set of structure pairs newly created during this process becomes the combination of substructures with higher similarity to be found. The set of pairs of substructures obtained through this procedure is a combination of optimal pairs from higher-order relational structures to detailed substructures.

【0037】図6は、図2(c)の電気回路の仕様記述
例に対して、対応関係の計算と構造類似度を求める計算
の途中結果、及び部分構造組み合わせ計算結果を表す。
FIG. 6 shows intermediate results of correspondence calculation and structural similarity calculation, and partial structure combination calculation results for the electric circuit specification description example shown in FIG. 2(c).

【0038】本知識処理支援装置の機能を実現するには
以上のような内容のプログラム・モジュールを作成し、
チップ化すれば良い。
[0038] In order to realize the functions of this knowledge processing support device, a program module with the above contents is created,
It would be better to make it into a chip.

【0039】[0039]

【発明の効果】本発明装置を実現することにより次のよ
うな効果が得られる。■完全に一致していなくとも、構
造的に一致しているような「類似」情報の検索ができる
。■構造的に完全に一致していなくとも、部分的に構造
が一致している複数のデータを組み合わせて、全体とし
て検索要求を満たしているものを検索することができる
。■厳密な検索要求の記述は必要ない。■関係が類似し
ているものを分野にまたがって検索できるために、不足
していた知識を他の系の関係から補えたり、問題解決の
ヒントとして参  照しおたりすることができる。
[Effects of the Invention] By implementing the device of the present invention, the following effects can be obtained. ■You can search for "similar" information that is structurally consistent, even if it is not an exact match. ■Even if the structure does not completely match, it is possible to combine multiple pieces of data that partially match the structure and search for the data that satisfies the search request as a whole. ■There is no need to describe a precise search request. ■Since you can search for similar relationships across fields, you can supplement missing knowledge from relationships in other systems, or refer back to them as hints for problem-solving.

【0040】従って、本発明は複雑な構造情報のデータ
ベース化とその類似検索、類推、シミュレーションとい
った機能が要求される各種の研究分野、情報処理分野に
おいて有効に利用出来るものである。そのうち特に有効
である分野は、部分構造が階層的に定義され、それらが
部品として存在するような機械設計、回路設計等の領域
であると考えられる。
Therefore, the present invention can be effectively used in various research fields and information processing fields that require functions such as creating a database of complex structural information and its similarity search, analogy, and simulation. Among these fields, it is thought to be particularly effective in areas such as mechanical design and circuit design where substructures are hierarchically defined and exist as parts.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明装置の一構成例を示す図、FIG. 1 is a diagram showing an example of the configuration of the device of the present invention;

【図2】本装
置に対する情報表現法の一例を示す図、
FIG. 2 is a diagram showing an example of an information representation method for this device;

【図3】本装置
の対応関係計算法の一例を示す図、
FIG. 3 is a diagram showing an example of the correspondence calculation method of this device,

【図4】本装置の類
似度計算法の一例を示す図、
FIG. 4 is a diagram showing an example of the similarity calculation method of this device,

【図5】本装置の部分構造
組み合わせ法の一例を示す計算フロー図、
FIG. 5 is a calculation flow diagram showing an example of the substructure combination method of this device;

【図6】計算例を示す図[Figure 6] Diagram showing a calculation example

【符号の説明】[Explanation of symbols]

1  入力手段 2  記憶手段 3  表示手段 4  解釈手段 5  マッチング手段 6  対応関係計算手段 7  類似度計算手段 8  部分構造組み合わせ手段 9  制御手段 1 Input means 2. Storage means 3 Display means 4 Interpretation means 5 Matching means 6 Correspondence calculation means 7 Similarity calculation means 8 Partial structure combination means 9 Control means

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】検索情報の入力手段と、情報の記憶手段と
、情報間のマッチングを取る手段と、構造的に類似して
いる情報を検索する手段と、検索情報の表示手段と、一
連の検索処理の制御手段を有する情報検索装置において
、構造的に類似した情報を部分的に検索し、類似度の高
い部分構造を組み合わせることによって、全体として検
索要求をカバーする情報を抽出することを特徴とする情
報検索装置。
Claim 1: A means for inputting search information, a means for storing information, a means for matching information, a means for searching for structurally similar information, a means for displaying search information; An information retrieval device having a control means for retrieval processing is characterized by partially retrieving structurally similar information and combining highly similar partial structures to extract information that covers the retrieval request as a whole. Information retrieval device.
JP3069413A 1991-03-11 1991-03-11 Retrieving device Pending JPH04281568A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3069413A JPH04281568A (en) 1991-03-11 1991-03-11 Retrieving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3069413A JPH04281568A (en) 1991-03-11 1991-03-11 Retrieving device

Publications (1)

Publication Number Publication Date
JPH04281568A true JPH04281568A (en) 1992-10-07

Family

ID=13401898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3069413A Pending JPH04281568A (en) 1991-03-11 1991-03-11 Retrieving device

Country Status (1)

Country Link
JP (1) JPH04281568A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6019303B1 (en) * 2015-12-21 2016-11-02 ジャパンモード株式会社 Problem solving support system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61220027A (en) * 1985-03-27 1986-09-30 Hitachi Ltd Information memory system
JPS62196726A (en) * 1986-02-24 1987-08-31 Nippon Telegr & Teleph Corp <Ntt> Semantic collating device
JPS63291117A (en) * 1987-05-22 1988-11-29 Matsushita Electric Ind Co Ltd Data processor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61220027A (en) * 1985-03-27 1986-09-30 Hitachi Ltd Information memory system
JPS62196726A (en) * 1986-02-24 1987-08-31 Nippon Telegr & Teleph Corp <Ntt> Semantic collating device
JPS63291117A (en) * 1987-05-22 1988-11-29 Matsushita Electric Ind Co Ltd Data processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6019303B1 (en) * 2015-12-21 2016-11-02 ジャパンモード株式会社 Problem solving support system

Similar Documents

Publication Publication Date Title
US7668847B2 (en) Semi-structured data storage schema selection
JPS61220027A (en) Information memory system
Shi et al. Mining interesting meta-paths from complex heterogeneous information networks
JP3908634B2 (en) Search support method and search support device
JPH04281568A (en) Retrieving device
Giguere Towards designing an expert system to map mathematics classificatory structures
Spärck Jones Document retrieval: Shallow data, deep theories; historical reflections, potential directions
Zellweger The branching data model, the foundation for automated tree visualization
Maurer et al. Broadening the scope of hypermedia principles
JPH04281567A (en) Retrieving device
Nagel et al. Bisociative discovery of interesting relations between domains
JP2008269106A (en) Schema extraction method, information processor, computer program, and recording medium
JP2008129943A (en) Structured document generation method and apparatus and program
JP2001331490A (en) Structured document storage device, structured document retrieval device, structured document storage and retrieval device and program and program recording medium
JPH05174066A (en) Retrieval system and screen display method for retrieval
Seo et al. Discovery of schema information from a forest of selectively labeled ordered trees
Järvelin et al. Integration of complex objects and transitive relationships for information retrieval
JP2861453B2 (en) Hypertext model creation device
EP0466878A1 (en) Method and apparatus for graphical interrogation of a database.
JP6971929B2 (en) Inquiry statement output device and inquiry statement output method
JPH05135054A (en) Document processing method
JPH11109843A (en) Learning supporting method using computer
Triaji et al. Building a Knowledge Graph on Video Transcript Text Data
JPH0922415A (en) Knowledge storage method and device and re-recognition method and device for knowledge data base
Unal et al. Interoperability in collaborative network of biodiversity organizations