JPH07225770A

JPH07225770A - データ検索装置

Info

Publication number: JPH07225770A
Application number: JP6036346A
Authority: JP
Inventors: Kenichi Numata; 賢一沼田
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1994-02-10
Filing date: 1994-02-10
Publication date: 1995-08-22

Abstract

(57)【要約】【目的】ノード間の関係が木あるいは木の集合で表現
されるノードの集合から、第１の条件を満たすノードに
対して祖孫関係を持ちかつ第２の条件を満たすノードを
検索するデータ検索装置を提供する。【構成】入力手段が第１の条件，第２の条件およびそ
の間の祖孫関係を入力する。ノード検索手段が第１の条
件および第２の条件を受け取り、索引保持手段の索引か
ら第１の条件を満たすノードに対応するレコードの集合
と、第２の条件を満たすノードに対応するレコードの集
合とを抽出する。接続関係検索手段は、祖孫関係を受け
取り、前記ノード検索手段の抽出した一方のレコードの
指す部分木索引の中に、他方のレコードの指すノードが
存在するか否かを検索し、該当するノードが存在し、か
つ前記祖孫関係を満足する場合に、該当ノードを第２の
条件を満たすノードとして出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データ検索装置に関
し、特に、ノード間の関係が木あるいは木の集合で表現
されるノードの集合から、ノードの条件とノード間の接
続関係の条件を利用して検索を行う場合に、検索の処理
を高速化するデータ検索装置に関する。

【０００２】

【従来の技術】従来から、データ内容に応じてデータ処
理の取扱いを容易とするため、データを構造化し、木構
造で表現されるデータ構造として扱うデータ処理装置が
開発されている。例えば、文書処理装置で扱う文書デー
タは、文書内容がその概念構造から章，節，項などの階
層を有する論理構造で表現されるので、木構造で表現さ
れるデータ構造として扱うことができる。

【０００３】このように、木構造で表現されるデータ構
造の一例として文書の論理構造がある。文書の論理構造
は、図８に示すように、一般に有向順序木により表現す
ることができる。図８は、文書の論理構造を木構造で表
現している一例を示す図である。図８に示す文書の論理
構造の例では、報告書という文書は、「報告書」という
根ノードに結びついて、標題，著者名，第１章の内容，
第２章の内容，第３章の内容が、第１階層のノードとな
る論理構造で構成されている。そのノードの第１章の内
容は「見出し」と３つの「段落」からなる第２階層のノ
ードから構成されている。第２章の内容は「見出し」と
「図」と２つの「段落」からなる第２階層のノードから
構成されている。同様に、第３章の内容は「見出し」と
「図」と２つの「段落」からなる第２階層のノードから
構成されている。このような文書の論理構造となってい
る。

【０００４】木構造で表現された文書の論理構造のデー
タの検索においては、木構造データの要素の個々のノー
ドの条件のみでなく、ノード間の親子関係あるいは祖孫
関係も条件として利用して、条件検索を行うデータ検索
処理が行われる。例えば、図８に示すような報告書とい
う文書の論理構造において、「直下の見出しに“データ
ベース”という文字列を含み、かつ、図を含む章を見つ
けよ」というような条件検索である。

【０００５】この場合、「“データベース”という文字
列を含む見出し」，「章」，「図」などの条件がノード
自体に対する条件であり、「直下」と「含む」がそれぞ
れ親子関係と祖孫関係などのノード間の関係を規定する
条件となる。したがって、ここでは「“データベース”
という文字列を含む見出し」，「章」，「図」などのノ
ード自体に対する条件を満たすノードは、それぞれ複数
あるが、親子関係あるいは祖孫関係のノード間の関係の
条件を満たすノードは、第２章のノードだけとなる。こ
のように、ノード自体に対する条件に、更にノード間の
関係の条件までを含めて条件検索を行うことによって、
データ検索では、より絞り込まれた回答が得られる。図
８に示す例では、「第２章」だけが条件を満たすノード
として検索される。

【０００６】また、上記の条件検索の例では、「“デー
タベース”という文字列を含む見出しを直下に持つ章」
の第１の集合と「下位に図を含む章」の第２集合の積集
合を取ることによって、その検索結果が回答として得ら
れる。この場合においては、第１の集合を求める検索
と、第２の集合を求める検索では、それぞれの条件検索
が、個々のノードの条件とノード間の親子関係あるいは
祖孫関係の条件を用いた検索となっている。

【０００７】一般に、木構造で表現されるデータ構造の
データにおいて、個々のノードの条件のみでなく、ノー
ド間の親子関係あるいは祖孫関係の条件も用いた検索を
行う検索処理では、第１の条件を満たすノードと親子関
係あるいは祖孫関係を持ち、かつ、第２の条件を満たす
ノードを検索するというデータ検索になる。

【０００８】そこで、木構造で表現されるデータ構造の
各々のデータに対して、第１の条件を満たすノードと親
子関係あるいは祖孫関係を持ち、かつ第２の条件を満た
すノードを検索する検索処理を高速に行う場合には、次
のような検索処理方法を用いることになる。

【０００９】すなわち、データ構造として木構造が用い
られる場合、一般的には、データの要素の各ノードをレ
コード型のデータで表し、各データの間のリンク状態を
ポインタで表すようにデータ形式を定めている。このた
め、上記のデータ検索処理の方法は、最も簡易な処理手
順によると、木構造のデータ構造から定められる順番
（先行順や幅優先順など）に従って、各レコードのリン
ク状態を示すポインタを順次に辿っていき、各レコード
（ノード）が第１の条件を満たすかどうかを調べて、も
し、第１の条件を満たしていれば、そのレコードを起点
として、ポインタを辿って親子関係あるいは祖孫関係に
あるレコードを探し、第２の条件を満たすかどうかを調
べる方法が利用される。

【００１０】このような検索処理の方法を高速化する場
合、第１の条件を満たすノードの検索を行う第１の処理
と、第１の条件を満たすノードを起点として、そのノー
ドと親子関係あるいは祖孫関係を持ち、第２の条件を満
たすノードの第２の処理との２つの処理に分けて、各々
の検索を高速化することになる。

【００１１】したがって、このようなデータ検索処理の
方法では、例えば、第１の処理においては、逆参照が可
能となる転置ファイルを設けることにより、木構造の中
の全ノードに対して、ノードの属性値から該当するノー
ドを検索し、これにより、第１の条件を満たすノードの
検索を高速に処理する。

【００１２】また、第２の処理を高速化するには、例え
ば「Chris Clifton and Hector Garcia-Molina, “Inde
xing in a Hypertext Database", Proceedings of 16th
International Conference on VLDB, pp.36-49, 199
0」に論じられているような検索方法が利用できる。こ
の方法は、木構造データの葉ノードを除く全てのノード
に対して、そのノードを根とする部分木のための転置フ
ァイルを設けるという方法である。

【００１３】図９は、ノードの親子関係あるいは祖孫関
係の条件を用いる検索処理を、部分木に対する転置ファ
イルを用いて行う場合の検索方法を説明する図である。
この場合の検索方法では、図９に示すように、木構造を
構成するノードの各ノードデータに対し、根ノード９
０，Ａノード９１，Ｂノード９２のそれぞれに転置ファ
イル９０ａ，９１ａ，９２ａを設ける。ここで設ける転
置ファイル９０ａ，９１ａ，９２ａにおいては、各ノー
ドの属性値からの逆参照が可能なように、ノードの属性
値とその属性値を持つノードへのポインタ、およびその
ノードと転置ファイルを設けたノード（部分木の根）と
の接続関係（親子関係あるいは祖孫関係）の対応関係の
データが保持される。

【００１４】例えば、Ａノード９１に設ける転置ファイ
ル９１ａにおいては、当該Ａノード９１を根とする部分
木の各ノードの属性値（bird, dog, fish)と、この属性
値を持つノードへのポインタ情報（Ｃノード，Ｆノー
ド，Ｅノード）と、その接続関係の情報（子，子孫の関
係）の対応関係との各データを保持している。この接続
関係の情報は、親子関係（ｃ）と祖孫関係（ｄ）を区別
するために用いられる。

【００１５】図９に示すような部分木に対する転置ファ
イルを用いて検索処理を行う方法ににより、上記の検索
処理における第２の処理を高速化できる。すなわち、第
１の条件を満たすノードを起点とし、その子あるいは子
孫の関係にある第２の条件を満たすノードの検索処理
が、起点となるノードに対応して設けられた転置ファイ
ルを用いて、そこに保持しているノードの属性値を検索
することにより、第２の条件を満たすノードを容易にし
かも高速に検索することができる。これにより、子ある
いは子孫ノードを順次に全て探索するよりも、はるかに
高速に処理を行うことができる。

【００１６】一方、上記の検索処理における第２の処理
に関連して、第１の条件を満たすノードを起点とし、そ
の親あるいは先祖である第２の条件を満たすノードの検
索処理を行う場合、例えば、「第２の条件を満たすノー
ドであり、かつ子あるいは子孫に第１の条件を満たすノ
ードを持つもの」というように、第２の条件を満たすノ
ードを先に検索するようにすれば、図９に示す検索処理
方法でも、同様に検索が可能である。

【００１７】また、第１の条件を満たすノードを起点と
し、その親あるいは先祖である第２の条件を満たすノー
ドの検索処理は、図９に示すように、各部分木に対して
転置ファイルを設ける方法の他に、例えば、図１０に示
すように、各ノードに自分の親ノードへのポインタを持
たせることにより行う方法がある。このため、木構造を
構成する場合のデータ構造では、双方向リンクで関係づ
けられた構造とする。

【００１８】図１０は、一つのノードからその先祖ノー
ドを辿るために必要なパスを有するデータ構造の一例を
示す図である。図１０に示すように、このデータ構造で
は、木構造を構成する場合に、双方向リンクで接続され
ており、あるノードを起点とし、その親あるいは先祖で
あるノードを辿ることもできる。また、この場合、各々
のノードにおける情報が２次記憶上でどのように割り付
けられているかによって、更に２つの態様に分けること
ができる。そこで、まず、ノード情報を２次記憶上へ割
り付ける場合の２つの異なる態様を説明する。

【００１９】第１の態様は、図１１に示すように、１つ
のノードにかかる情報を２次記憶上の連続した領域に割
り付ける態様であり、また、第２の態様は、図１２に示
すように、一つのノードの情報を２次記憶上で複数の領
域に分割して割り付ける態様である。

【００２０】第１の態様によるデータ構造では、１つの
ノードにかかる情報は、２次記憶上の連続した領域に割
り付けられる。つまり、図１１に示すように、１つのノ
ードの情報１１０は、親ノードへのポインタ１１１と、
複数の子ノードへのポインタ１１２と、ｍ個の属性１１
３から構成される。これらは２次記憶上の連続する領域
に割り付けられる。属性のフィールドにはそれぞれのノ
ードで保持される実際の値が格納される。

【００２１】また、第２の態様によるデータ構造では、
１つのノードの情報を２次記憶上で複数の領域に分割し
て割り付ける態様である。この場合、１つのノードにか
かる一群の情報の分割の仕方は様々であるが、例えば、
図１２に示すように、ノード間のリンク情報とノードの
内容の情報とに分離することによって、木構造中のリン
クを辿る操作は、リンク情報のみを２次記憶から読み出
して処理できるので、アクセス処理を高速に処理できる
ことになる。すなわち、図１２に示すようなデータ構造
においては、１つのノードのノード情報はノード間のリ
ンク情報１２１のみから構成される。リンク情報１２１
は、親ノードへのポインタ１２１ａと、子ノードの集合
へのポインタ１２１ｂと、属性集合へのポインタ１２１
ｃを持っている。ここでのポインタ１２１ｂによって、
指示される子ノードの集合１２２と、ポインタ１２１ｃ
により指示される属性の集合１２３は、ノード間のリン
ク情報１２１とは分割されて別の２次記憶の領域に割り
付けられる。

【００２２】次に、このような２つの態様で構成された
データ構造のノードのそれぞれについて、あるノードか
ら、与えられた条件を満たすその親あるいは先祖ノード
を検索する場合の処理について説明する。その処理は次
のように行われる。

【００２３】第１の態様のデータ構造（図１１）では、
あるノードの情報１１０を２次記憶から主記憶に読み込
み、そのノードの中の１つのフィールドである親ノード
へのポインタ１１１を調べ、次に、その親ノードの情報
を２次記憶から主記憶に読み込む。そして、読み込んだ
ノードの属性１１３の部分の情報を調べて、与えられた
条件を満たしているかどうかを調べる。先祖ノードを検
索する場合は、このような操作を順次に繰り返すことに
なる。

【００２４】第２の態様のデータ構造（図１２）では、
同じく、あるノード情報１２０を２次記憶から主記憶に
読み込むが、この場合には、ノード間のリンク情報１２
１のみを読み込む。そして、そのノード間のリンク情報
１２１の中の１つのフィールドである親ノードへのポイ
ンタ１２１ａを調べ、親ノードの情報を２次記憶から主
記憶に読み込む。そして、読み込んだ親ノードのノード
間のリンク情報の１つのフィールドである属性集合への
ポインタ１２１ｃを調べ、対応する属性集合を２次記憶
から主記憶に読み込み、次に、読み込んだ属性集合の中
の属性の情報を調べて、与えられた条件を満たすかどう
か調べる。先祖ノードを検索する場合は、上記の操作を
順次に繰り返す。

【００２５】

【発明が解決しようとする課題】ところで、図９に示す
ように、葉ノードを除く全てのノードに対して、そのノ
ードを根とする部分木のための転置ファイルを設ける方
法では、各転置ファイルにノードの重複があり、転置フ
ァイルの合計サイズが増大し、必要なメモリ量が増大す
るという問題点がある。例えば、木をノード数ｎの平衡
木とすると、転置ファイルのレコード数は、爆発的（ｎ
ｌｏｇｎ）に増大する。

【００２６】また、各ノードに自分の親ノードへのポイ
ンタを持たせ、そのポインタをもとに親あるいは先祖ノ
ードへアクセスして、条件を満たすかどうかを調べると
いう方法では、順次に各々のノードをアクセスして検索
して行くので、最終的に条件に適合するノードに辿りつ
くまでに無駄なノードのアクセスがあり、検索時間コス
トが大きいという問題がある。また、１つのノードが、
図１１に示すように、第１の態様で２次記憶上に割り付
けられている場合、特に、１つのノードの情報のサイズ
が大きくなると、ノードを２次記憶から主記憶へ読み込
むのに時間がかかり、更に検索時間コストが大きくなる
という問題がある。

【００２７】一方、一つのノードの情報が、図１２に示
すように、第２の態様によってノード間のリンク情報が
区別されて別に２次記憶上に割り付けられている場合で
あっても、あるノードの親ノードが与えられた条件を満
たすかどうかを調べるためには、あるノードから親ノー
ドへのポインタを辿って親ノードを得る操作と、得られ
た親ノードから更に属性集合へのポインタを辿ってノー
ドの内容の情報を得る操作とが必要である。したがっ
て、この場合、２次記憶から主記憶へのデータの読み込
みを２回行う必要があり、全体として、その検索時間コ
ストがあまり低下しないという問題もある。

【００２８】したがって、本発明の目的は、ノード間の
関係が木あるいは木の集合で表現されるノードの集合か
ら、第１の条件を満たすノードに対して祖孫関係を持ち
かつ第２の条件を満たす第２のノードを高速に検索する
ことができるデータ検索装置を提供することにある。

【００２９】また、本発明の第２の目的は、第１の条件
を満たすノードを起点として、そのノードと親子関係あ
るいは祖孫関係を持つ第２の条件を満たすノードの検索
を行うための転置ファイルをノードの属性値の情報を除
いた部分木索引に置き換え、索引を行う場合の記憶容量
を低減し、処理速度を向上させることができるデータ検
索装置を提供することにある。

【００３０】また、本発明の第３の目的は、第１の条件
を満たすノードを起点として、その親あるいは先祖であ
る第２の条件を満たすノードを検索する場合に、２次記
憶から主記憶へのデータの読み込み回数を極力減らし、
高速に親あるいは先祖ノードへアクセスすることができ
るようにしたデータ検索装置を提供することにある。

【００３１】

【問題点を解決するための手段】上記の目的を達成する
ため、本発明のデータ検索装置（請求項１）は、ノード
間の関係が木あるいは木の集合で表現されるノードの集
合から、第１の条件を満たすノードに対して祖孫関係を
持ちかつ第２の条件を満たすノードを検索するデータ検
索装置であって、第１の条件，第２の条件およびその間
の祖孫関係を入力する入力手段（１，２）と、ノード，
ノード間の関係およびノードの属性値を格納したデータ
記憶手段（１０）と、前記データ記憶手段に格納された
葉ノード以外の各ノードごとに設けられ、当該ノードを
根ノードとする部分木を構成する各ノードへのポインタ
から成る部分木索引を保持する部分木索引記憶手段
（９）と、前記データ記憶手段に格納された各ノードご
とに設けられ、当該ノードへのポインタと前記部分木索
引へのポインタとから成るレコードの集合を保持するレ
コード集合保持手段（１４）と、前記データ記憶手段に
格納されたノードの属性値と該属性値を持つノードに対
応する前記レコードへのポインタから成る索引を保持す
る索引保持手段（１２）と、前記入力手段から入力され
た第１の条件および第２の条件を受け取り、前記索引保
持手段の索引から第１の条件を満たすノードに対応する
レコードの集合と、第２の条件を満たすノードに対応す
るレコードの集合とを抽出するノード検索手段（３，
４）と、前記入力手段から入力された第１の条件と第２
の条件の間の祖孫関係を受け取り、前記ノード検索手段
の抽出した一方のレコードの指す部分木索引の中に、他
方のレコードの指すノードが存在するか否かを検索し、
該当するノードが存在し、かつ前記祖孫関係を満足する
場合に、該当ノードを第２の条件を満たすノードとして
出力する接続関係検索手段（４，５）と、該接続関係検
索手段の出力する該当ノードの持つ情報を前記データ記
憶手段から抽出して表示する表示処理手段（６，７）と
を備えることを特徴とする。

【００３２】更に、本発明のデータ検索装置（請求項
２）は、上記の構成に加え、前記部分木索引記憶手段
は、更に、前記部分木索引のポインタの指す各ノード
が、該部分木索引の根ノードとなるノードの子であるか
子以外の子孫であるかを区別するデータを含むことを特
徴とする。

【００３３】また、本発明のデータ検索装置（請求項
３）は、ノード間の関係が木あるいは木の集合で表現さ
れるノードの集合から、第１の条件を満たすノードに対
して祖孫関係を持ちかつ第２の条件を満たすノードを検
索するデータ検索装置であって、第１の条件，第２の条
件およびその間の祖孫関係を入力する入力手段（１，
２）と、ノード，ノード間の関係およびノードの属性値
を格納したデータ記憶手段（１０）と、前記データ記憶
手段に格納された各ノードごとに設けられ、当該ノード
へのノードポインタと当該ノードの親ノードへのノード
ポインタを保持するレコードを指す親ポインタとから成
るレコードの集合を保持するレコード集合保持手段（１
４）と、前記データ記憶手段に格納されたノードの属性
値と該属性値を持つノードに対応する前記レコードへの
ポインタから成る索引を保持する索引保持手段（１２）
と、前記入力手段から入力された第１の条件および第２
の条件を受け取り、前記索引保持手段の索引から第１の
条件を満たすノードに対応するレコードの集合と、第２
の条件を満たすノードに対応するレコードの集合とを抽
出するノード検索手段（３，４）と、前記入力手段から
入力された第１の条件と第２の条件の間の祖孫関係を受
け取り、前記ノード検索手段の抽出した一方のレコード
の内、子孫である一方のレコードの親ポインタを根ノー
ドまで辿り、辿った経路上のレコードのノードポインタ
の集合と、第２の条件を満たすレコードのノードポイン
タの集合との積集合を計算して得られるノードポインタ
の指すノードを該当ノードとして出力する接続関係検索
手段（４，５）と、該接続関係検索手段の出力する該当
ノードの持つ情報を前記データ記憶手段から抽出して表
示する表示処理手段（６，７）とを備えることを特徴と
する。

【００３４】

【作用】本発明のデータ検索装置（請求項１）において
は、ノード間の関係が木あるいは木の集合で表現される
ノードの集合から、第１の条件を満たすノードに対して
祖孫関係を持ち、かつ第２の条件を満たす第２のノード
を検索する場合、まず、入力手段（１，２）が、第１の
条件，第２の条件およびその間の祖孫関係を入力する。
データ記憶手段（１０）は、ノード，ノード間の関係お
よびノードの属性値を格納している。部分木索引記憶手
段（９）は、ここでのデータ記憶手段（１０）に格納さ
れた葉ノード以外の各ノードごとに設けられており、当
該ノードを根ノードとする部分木を構成するノードへの
ポインタから成る部分木索引を保持する。

【００３５】また、レコード集合保持手段（１４）は、
データ記憶手段（１０）に格納された各ノードごとに設
けられたレコードの集合を保持する。各レコードは、対
応するノードへのポインタと前記部分木索引へのポイン
タとから構成される。索引保持手段（１２）は、前記デ
ータ記憶手段に格納されたノードの属性値と該属性値を
持つノードに対応する前記レコードへのポインタから成
る索引を保持する。

【００３６】そして、ノード検索手段（３，４）が、入
力手段から入力された第１の条件および第２の条件を受
け取り、前記索引保持手段の索引から第１の条件を満た
すノードに対応するレコードの集合と、第２の条件を満
たすノードに対応するレコードの集合とを抽出すると、
接続関係検索手段（５，４）が、入力手段から入力され
た第１の条件と第２の条件の間の祖孫関係を受け取り、
前記ノード検索手段の抽出した一方のレコードの指す部
分木索引の中に、他方のレコードの指すノードが存在す
るか否かを検索する。該当するノードが存在し、かつ前
記祖孫関係を満足する場合に、該当ノードを第２の条件
を満たすノードとして出力する。出力された結果によ
り、表示処理手段（６，７）は、該接続関係検索手段の
出力する該当ノードの持つ情報を前記データ記憶手段か
ら抽出して表示する。ここでは、部分木索引中にノード
の属性値を保持しなくてもよく、索引の記憶容量を低減
できる。

【００３７】また、本発明のデータ検索装置（請求項
２）においては、前記部分木索引記憶手段に保持される
部分木索引のポインタの指す各ノードが、該部分木索引
の根ノードとなるノードの子であるか子以外の子孫であ
るかを区別するデータを含む。これにより、ノードの検
索では、子であるか、または子以外の子孫下であるかを
区別した検索を行うことができる。

【００３８】また、本発明のデータ検索装置（請求項
３）においては、ノード間の関係が木あるいは木の集合
で表現されるノードの集合から、第１の条件を満たすノ
ードに対して祖孫関係を持ちかつ第２の条件を満たす第
２のノードを検索する場合、入力手段（１，２）が、第
１の条件，第２の条件およびその間の祖孫関係を入力す
る。データ記憶手段（１０）は、ノード，ノード間の関
係およびノードの属性値を格納しており、レコード集合
保持手段（１４）は、該データ記憶手段に格納された各
ノードごとに設けられたレコードの集合を保持してい
る。ここでのレコードは、当該ノードへのノードポイン
タと当該ノードの親ノードへのノードポインタを保持す
るレコードを指す親ポインタとから構成されている。

【００３９】索引保持手段（１２）は、前記データ記憶
手段に格納された各ノードの属性値と該属性値を持つノ
ードに対応する前記レコードへのポインタから成る索引
を保持しているので、ノード検索手段（３，４）が、入
力手段から入力された第１の条件および第２の条件を受
け取り、前記索引保持手段の索引から第１の条件を満た
すノードに対応するレコードの集合と第２の条件を満た
すノードに対応するレコードの集合とを抽出する。ま
た、ここでの接続関係検索手段（５，４）は、前記入力
手段から入力された第１の条件と第２の条件の間の祖孫
関係を受け取り、前記ノード検索手段の抽出した一方の
レコードの内で、子孫である一方のレコードの親ポイン
タを根ノードまで辿り、辿った経路上のレコードのノー
ドポインタの集合と、第２の条件を満たすレコードのノ
ードポインタの集合との積集合を計算して得られるノー
ドポインタの指すノードを該当ノードとして出力する。
ここで出力された結果により、表示処理手段（６，７）
が、接続関係検索手段の出力する該当ノードの持つ情報
を前記データ記憶手段から抽出して表示する。

【００４０】このように、本発明のデータ検索装置（請
求項１）においては、第１の条件を満たすノードまたは
第２の条件を満たすノードの一方が、他方を根ノードと
する部分木に存在するかどうかを照合する部分木索引を
設けて、第１の条件および第２の条件を満たすノードの
検索を行う。このため、図９に示したような従来の転置
ファイルではノードの属性値のデータを含むが、この部
分木索引は、索引中にノードの属性値のデータを含む必
要がなくなり、それにより、索引の記憶容量を低減でき
ることになる。

【００４１】また、本発明のデータ検索装置（請求項
３）においては、ノードへのポインタとそのノードを根
とする部分木の索引へのポインタの組からなるレコード
に、そのレコードに対応するノードの親ノードに対応す
るレコードへのポインタを持たせている。これにより、
あるノードの親あるいは先祖ノードを検索する場合に、
レコードの集合上での走査だけで済むようになり、先祖
ノードの検索時間コストを小さくできる。また、１つの
レコードの大きさは予じめ設定して決められており、か
つ十分小さいので、図１１および図１２に示すような従
来のデータの管理方法よりは、読み込み処理を速くでき
る。

【００４２】

【実施例】以下、本発明の一実施例を図面を参照して具
体的に説明する。図１は、本発明の一実施例にかかるデ
ータ検索装置の要部の要成を示すブロック図である。図
１において、１はキーボードなどの入力部、２は条件解
析部、３はノード検索部、４はレコード記憶部、５は接
続関係検索部、６は表示処理部、７はディスプレイ装置
などの表示部、８はノード索引ファイル、９は部分木索
引ファィル、１０はデータファイルである。

【００４３】ここでのノード索引ファイル８は、与えら
れた条件を満たすノードを検索するための索引を保持し
ており、部分木索引ファイル９は、各ノードを根とする
部分木に対する索引を保持する。データファイル１０は
木構造で表現されるデータの集合を保持している。

【００４４】入力部１が、検索のための条件（第１の条
件，第２の条件，および親子関係あるいは祖孫関係の条
件）を指定すると、条件解析部２が、入力部１によって
指定された条件を解析する。ノード検索部３は、条件解
析部２によって解析された条件に基づき、ノード索引フ
ァイル８を読み込み、該当する条件を満たすノードの検
索を行う。そして、レコード記憶部４において、ノード
検索部３および接続関係検索部５によって検索されたレ
コードの集合を記憶する。また、接続関係検索部５は、
部分木索引ファイル９から部分木索引を読み込んで、レ
コード記憶部４に保持されたレコード集合から親子関係
あるいは祖孫関係を検索する。表示処理部６は、レコー
ド記憶部４に保持された検索結果を基に、該当するノー
ドをデータファイル１０から読み込んで、表示部７に表
示させる表示処理を行う。この結果、表示部７において
検索された結果が表示される。

【００４５】次に、ノード索引ファイル８，部分木索引
ファイル９，およびデータファイル１０におけるデータ
構造の詳細を説明する。図２は、ノード索引ファイル，
部分木索引ファイル，およびデータファイルにおけるデ
ータ構造とその関係を説明する図である。図２に示すよ
うに、ノード索引ファイル８は、索引１２およびレコー
ド集合１４から構成される。索引１２はレコード集合１
４中で、与えられた条件を満たすノードへのポインタを
持つレコードを検索するための索引となっており、この
索引１２により、一つのノードについて複数の条件を指
定して検索することができる。

【００４６】レコード集合１４を構成している個々のレ
コード１３は、親レコードへのポインタ１５と、部分木
索引へのポインタ１６と、ノードへのポインタ１７とか
ら構成されており、親レコード，部分木索引，およびノ
ードの間を関係付けている。このレコード１３における
ポインタの指すノードが親ノードを持たない場合、つま
り、該当のノードが根ノードの場合には、親レコードへ
のポインタ１５は空ポインタとなっている。また、同様
に、このレコード１３におけるポインタの指すノードが
葉ノードの場合、部分木索引へのポインタ１６は空ポイ
ンタとなっている。

【００４７】部分木索引ファイル９においては、各ノー
ドを根とする部分木に対する部分木索引１１を保持して
いる。部分木索引１１は、レコード１３の中のノードへ
のポインタ１７が指すノードを根とする部分木に対する
索引となっており、接続関係１８とノードへのポインタ
１９とが組になって構成されている。この部分木索引１
１により、あるレコード中のノードへのポインタをキー
として、接続関係１８とノードへのポインタ１９の組か
ら接続関係１８を検索する。接続関係１８を表わすデー
タにおいては、該当するレコードに対するノードの接続
関係を、記号コードのデータにより、子を“Ｃ”とし、
子でない子孫を“Ｄ”として区別して保持している。

【００４８】また、データファイル１０は、木構造で表
現されるデータの集合であるノードデータ２１の集合を
保持している。このノードデータ２１は、ノードとして
の木構造のリンク状態の示すポインタおよびその属性と
なる本体部のデータから構成されている（図１１および
図１２を参照）。

【００４９】次に、このようなデータ構造を有するノー
ド索引ファイル８，部分木索引ファイル９，およびデー
タファイル１０におけるレコードのデータを用いて、第
１の条件を満たすノードの子あるいは子孫である第２の
条件を満たすノードを検索する処理について説明する。
図３は、第１の条件を満たすノードの子あるいは子孫で
ある第２の条件を満たすノードを検索するデータ検索処
理の一例を示すフローチャートである。

【００５０】図１，図２，および図３を参照して、デー
タ検索処理を説明する。処理を開始すると、まず、ステ
ップ２０１において、入力部１からノードに対する第１
の条件，第２の条件，および接続関係の条件の各々の条
件を読み込む。次に、ステップ２０２において、入力部
１によって読み込まれたノードに対する第１の条件，第
２の条件，および接続関係の条件を、条件解析部２によ
り解析する。次に、ステップ２０３において、ノード検
索部３はノード索引ファイル８から索引１２を読み込
み、ステップ２０４において、ノード検索部３が、条件
解析部２により解析された条件から、第１の条件を満た
すノードを、索引１２を用いて検索する。その結果、得
られたレコードの集合をレコード記憶部４に保持する。

【００５１】次に、ステップ２０５において、同じく、
ノード検索部３は、条件解析部２によって解析された条
件から、第２の条件を満たすノードを、索引１２を用い
て検索し、その結果、得られたレコードの集合をレコー
ド記憶部４に保持する。そして、次のステップ２０６に
おいて、子孫側のノードへのポインタを先祖側のノード
の部分木索引の中で照合する。すなわち、接続関係検索
部５が、前のステップ２０５の処理により、レコード記
憶部４に保持された第２の条件を満たすレコード集合の
中のレコードについて、そのレコード中のノードへのポ
インタを、前のステップ２０４の処理によりレコード記
憶部４に保持された第１の条件を満たすレコード集合の
中のレコードが指す部分木索引中で検索する。

【００５２】そして、ステップ２０７において、該当す
るノードが見つかったか否かを判定する。ノードが見つ
からなければ、ステップ２１１に進み、全てのレコード
での検索が終了したか否かを判定し、未処理のノードが
残っている場合に、次のノードに対する処理に進む。ま
た、この判定で、該当するノードが見つかった場合、次
のステップ２０８に進み、更に、当該ノードにおいて接
続関係が満たされているか否かを判定する。この判定
で、接続関係が満たされていない場合に、前のステップ
２０７と同様に、ステップ２１１に進み、全てのレコー
ドでの検索が終了したか否かを判定し、未処理のノード
が残っている場合に、次のノードに対する処理に進む。
つまり、接続関係検索部５は、ノードへのポインタが部
分木索引の中で見つかり、更に、指定された接続関係を
満たしていることを検査する。

【００５３】これらの判定により、ノードへのポインタ
が部分木索引の中で見つかり、更に指定された接続関係
を満たしていると、次に、ステップ２０９に進んで、該
当するノードの情報をデータファイルから読み込み、次
のステップ２１０において、ノードの内容情報を表示部
に表示する。そして、ステップ２１１に進み、全てのレ
コードでの検索が終了した否かを判定し、未処理のノー
ドが残っている場合には、ステップ２０６に戻り、ステ
ップ２０６からの処理により、次のノードに対する処理
を行う。一方、ステップ２１１の判定において、全ての
レコードでの検索が終了していることが判定できると、
一連の処理を終了する。

【００５４】このように、ここでのデータ検索処理で
は、第１の条件を満たすノードおよび第２の条件を満た
すノードに対して、その一方が、他方を根とする部分木
に存在するかどうかを、部分木索引により照合し、第１
の条件および第２の条件を満たすノードの検索を行う。
部分木索引は、索引中にノードの属性値のデータを含む
必要がなくなり、それにより、索引のための記憶容量を
低減して、データ検索ができるようになる。

【００５５】ところで、本実施例のデータ検索装置にお
いては、図２に示すように、レコード集合１４における
個々のレコード１３には、ノードへのポインタ１７とそ
のノードを根とする部分木索引へのポインタ１６との組
に対し、更に、この各々のレコード１３に対応して、当
該レコードに対応するノードの親ノードに対応するレコ
ードへのポインタ１５を有している。これにより、ある
ノードの親あるいは先祖ノードを検索する場合には、レ
コード集合上で走査だけで済むようになっている。

【００５６】次に、このような各々のレコード１３の中
の親レコードへのポインタ１５を用いた場合のデータ検
索処理について説明する。図４は、第１の条件を満たす
ノードの親あるいは先祖である第２の条件を満たすノー
ドを検索するデータ検索処理を、各々のレコード１３の
中の親レコードへのポインタ１５を用いて行う場合の処
理手順を示すフローチャートである。

【００５７】次に、前述の場合と同様に、図１，図２，
および図４を参照して、データ検索をレコード集合上の
走査のみで行う場合のデータ検索処理について説明す
る。処理を開始すると、ステップ３０１において、入力
部１からノードに対する第１の条件，第２の条件，およ
び接続関係の条件の各々の条件を読み込む。次に、ステ
ップ３０２において、入力部１によって読み込まれたノ
ードに対する第１の条件，第２の条件，および接続関係
の条件を、条件解析部２により解析する。次に、ステッ
プ３０３において、ノード検索部３はノード索引ファイ
ル８から索引１２を読み込み、ステップ３０４におい
て、ノード検索手段３が、条件解析部２により解析され
た条件から、第１の条件を満たすノードを、索引１２を
用いて検索する。その結果、得られたレコードの集合を
レコード記憶部４に保持する。

【００５８】次に、ステップ３０５において、同じく、
ノード検索部３は、条件解析部２によって解析された条
件から、第２の条件を満たすノードを、索引１２を用い
て検索し、その結果、得られたレコードの集合をレコー
ド記憶部４に保持する。そして、次のステップ３０６に
おいて、子孫側のノードへのポインタを持つレコードか
ら、親レコードのポインタを辿る。すなわち、ノード検
索部３は、前のステップ３０４の処理により、レコード
記憶部４に保持された第１の条件を満たすレコード集合
中のひとつのレコードについて、その親レコードへのポ
インタを辿り、得られた親レコードをレコード記憶部４
に保持する。

【００５９】そして、次のステップ３０７において、指
定された接続関係は親子関係であるか否かを判定する。
つまり、条件解析部２によって解析された接続関係の条
件を参照して、親子関係かまたは祖孫関係かを判断す
る。この判定の結果、親子関係であれば、それで良いの
で、ステップ３１０に進み、全てのレコードでの検索が
終了した否かを判定し、未処理のノードが残っている場
合に、次のノードに対するレコードの処理に進む。

【００６０】また、このステップ３０７の判定で、親子
関係でない場合、つまり、指定された接続関係が祖孫関
係である場合、ステップ３０８に進み、ルートノードに
辿り着いたか否かを判定し、ルートノードに辿り着いて
いない場合、更に、ステップ３０９において、親ノード
へのポインタを辿り、得られた親レコードをレコード記
憶部４に保持し、続いて、ステップ３０８に戻り、ルー
トノードに辿り着いたか否かを判定する処理を繰り返
す。ルートノードに辿り着いたことが判定できると、そ
れで良いので、ステップ３１０に進み、全てのレコード
での検索が終了した否かを判定し、未処理のノードが残
っている場合に、次のノードに対するレコードの処理に
進む。

【００６１】すなわち、ノード検索部３により、レコー
ドのポインタにより辿られた親レコードがルートレコー
ド（ルートノードへのポインタを持つレコード）かどう
か判断し、辿られた親レコードがルートレコードでない
とき、ノード検索部３は親レコードの親レコードへのポ
インタを辿り、得られた親レコードをレコード記憶部４
に保持する操作を繰り返し行う。この結果、レコード記
憶部４には順次に辿られた親レコードが保持される。

【００６２】そして、指定された接続関係が親子関係の
場合に、または親レコードがルートレコードである場合
に、次のステップ３１０において、レコード記憶部４に
保持された第１の条件を満たすレコード集合中の全ての
レコードについて処理を終了したか否かを判定する。こ
の判定で、未処理のレコードが残っていると判定される
場合には、ステップ３０６に戻って、残りのレコードに
対する処理を同様に繰り返し行う。また、全てのレコー
ドについて処理を終了したことが確認できると、次に、
ステップ３１１において、レコード記憶部４に保持され
た第２の条件を満たすレコードのノードへのポインタの
集合と、親（先祖）レコードの持つノードへのポインタ
の集合との積集合を計算する。この集合の計算結果は、
条件として与えられた各々の条件を満たしていることに
なるので、次に、ステップ３１２において、該当レコー
ド内のノードへのポインタを辿って、条件に該当するノ
ード情報をデータファイルから読み込み、次に、ステッ
プ３１３において、読み込まれたノードの情報を表示部
７に表示して、一連の処理を終了する。

【００６３】次に、このようなデータ検索処理を木構造
を有する検索対象データに対して行う場合の具体例につ
いて説明する。図５は、検索対象データの一例を示す説
明図である。ここでは、木構造を有する検索対象データ
としては、木構造の論理構造を有する文書データを例に
して説明する。図５に示すように、検索対象データの文
書データは、有向順序木によって表現されており、文書
名の「報告書」を根ノードとして、各ノードは、例え
ば、章，節，段落などのタイプを有している。各ノード
は他の属性を持っているが、図５においては、ノードの
タイプのみを示している。

【００６４】図５に示すような検索対象データに対し
て、図３に示したようなデータ検索処理の手順により、
「図を含む章」を条件として検索する場合、次のように
して、ここでのデータ検索処理が行なわれる。図６は、
図３に示す処理フローによりデータ検索処理を行う場合
の各々のレコードの集合のデータの参照関係を示す図で
ある。図６を参照して説明を続けると、図６において
は、右側に検索対象データのうちの関連部分のみ示して
おり、ハッチングしたブロックのノード６１が条件を満
たすノードとなっている。この場合に、それぞれ参照さ
れるレコードの集合を左側に示している。

【００６５】この場合のデータ検索処理において、「図
を含む章」という条件は、ノードに関する第１の条件が
「タイプが章である」という条件であり、ノードに関す
る第２の条件は「タイプが図である」という条件であ
る。また、接続関係の条件は「祖孫関係」という条件で
ある。

【００６６】このようなデータ検索処理では、まず、ノ
ード検索部３によって、ノードに関する第１の条件の
「タイプが章である」という条件を満たすノードへのポ
インタを持つレコード群（６０１〜６０４）と、同じく
ノードに関する第２の条件となっている「タイプが図で
ある」という条件を満たすノードへのポインタを持つレ
コード群（６０５，６０６）とが得られる。

【００６７】次に、接続関係検索部５によって、第２の
条件を満たすレコード６０５におけるノードへのポイン
タ６０７と、同じく第２の条件を満たすレコード６０６
におけるノードへのポインタ６０８とにより指示されて
いるノードの中に対して、更に、第１の条件を満たすレ
コード群（６０１〜６０４）における部分木索引の中で
の探索を行う。

【００６８】この場合には、レコード群（６０１〜６０
４）の部分木索引ポインタ（６１０〜６１３）が指示し
ている部分木索引６２において、接続関係６２ａを参照
し、更に、ノードへのポインタ６２ｂを参照して、共通
に指示されているノードを探索する。その結果、ここで
は、部分木索引ポインタ６１３が指示する部分木索引６
２の中で、ポインタ６０９が指示するノードが、前述の
レコード６０６のポインタ６０８が指示するノードと一
致する。したがって、条件に適合する求められるベきノ
ードは、レコード６０４中のノードへのポインタ６１４
が指すノードとなる。

【００６９】次に、図４に示したようなデータ検索処理
の手順により、同様にして「表を含む章」を条件として
検索する場合について、その具体的なレコードのデータ
参照について説明する。この場合にも、前述の場合と同
様に検索対象データは、図５に示したような木構造を有
する文書データとする。

【００７０】図７は、図４に示す処理フローによりデー
タ検索処理を行う場合の各々のレコードの集合のデータ
参照関係を説明する図である。この場合のデータ検索の
条件としては「表を含む章」を条件として、該当するノ
ードのデータ検索する。図７に基づいて説明する。図７
においては、右側に検索対象データのうちの関連部分の
み示しており、ここで、ハッチングしたブロックのノー
ド（７１，７２）が、条件を満たすノードとなってい
る。そして、この場合にそれぞれに参照されるレコード
の集合を左側に示している。

【００７１】この場合のデータ検索処理において、「表
を含む章」という条件は、第１の条件が「タイプが章で
ある」という条件であり、また、第２の条件が「タイプ
が表である」という条件となっている。接続関係の条件
は「祖孫関係」という条件である。

【００７２】したがって、このようなデータ検索処理で
は、まず、ノード検索部３により、ノードに関する第１
の条件の「タイプが章である」という条件を満たすノー
ドへのポインタを持つレコード群（７０１〜７０４）
と、同じくノードに関する第２の条件となっている「タ
イプが表である」という条件を満たすノードへのポイン
タを持つレコード群（７０６，７０７）とが得られる。
次に、これらのレコード群の間のポインタを辿る操作を
行い、レコード７０６およびレコード７０７の親レコー
ドへのポインタを辿り、レコード７０１およびレコード
７０５をそれぞれに得る。

【００７３】ここで指定された接続関係の条件は「祖孫
関係」であり、また、得られたレコード７０１およびレ
コード７０５は、共にルートレコードではないので、更
に、親レコードへのポインタを辿る操作を行い、次に、
レコード７００およびレコード７０２をそれぞれに得
る。レコード７００はルートレコードであるが、レコー
ド７０２はルートレコードではないので、レコード７０
２から更に親レコードへのポインタを辿り、最終的にレ
コード７００を得る。

【００７４】このポインタを辿る操作処理の結果、第１
の条件の「タイプが章である」条件を満たすレコードか
ら対応のノードへのポインタ（７０９〜７１２）と、親
レコードを順次辿って得られたレコード群（７００，７
０１，７０２，７０５）の中の各々のノードへのポイン
タ（７０８，７０９，７１０，７１３）との積集合の計
算を行う。この積集合の計算の結果、与えられた条件を
満たすノードへのポインタとして、ポインタ７０９およ
びポインタ７１０が得られる。したがって、条件に適合
する求められるベきノードは、ポインタ７０９およびポ
インタ７１０が指示するノード７１およびノード７２と
なる。

【００７５】

【発明の効果】以上説明したように、本発明のデータ検
索装置によれば、木構造で表現されるデータの集合の中
で、第１の条件を満たすノードと親子関係あるいは祖孫
関係を持ち、かつ第２の条件を満たすノードを検索する
場合、この検索の際に用いられる部分木索引では、ノー
ドの属性値の情報を含む必要がなくなり、転置ファイル
よりも小さくできるようになる。このため、索引の記憶
容量を低減することができる。また、第１の条件を満た
すノードの親あるいは先祖である第２の条件を満たすノ
ードの検索の場合にも、例えば、レコードの集合の中で
走査だけで済むので、２次記憶から主記憶へのデータの
読み込み回数を減らすことができ、全体としてデータ検
索の処理のスループットを向上させることができる。

【図面の簡単な説明】

【図１】図１は本発明の一実施例にかかるデータ検索
装置の要部の要成を示すブロック図、

【図２】図２はノード索引ファイル，部分木索引ファ
イル，およびデータファイルにおけるデータ構造とその
関係を説明する図、

【図３】図３は第１の条件を満たすノードの子あるい
は子孫である第２の条件を満たすノードを検索するデー
タ検索処理の一例を示すフローチャート、

【図４】図４は第１の条件を満たすノードの親あるい
は先祖である第２の条件を満たすノードを検索するデー
タ検索処理を各々のレコードの中の親レコードへのポイ
ンタ１５を用いて行う場合の処理手順を示すフローチャ
ート、

【図５】図５は検索対象データの一例を示す説明図、

【図６】図６は図３に示す処理フローによりデータ検
索処理を行う場合の各々のレコードの集合のデータの参
照関係を示す図、

【図７】図７は図４に示す処理フローによりデータ検
索処理を行う場合の各々のレコードの集合のデータ参照
関係を説明する図、

【図８】図８は文書の論理構造を木構造で表現してい
る一例を示す図、

【図９】図９はノードの親子関係あるいは祖孫関係の
条件を用いる検索処理を部分木に対する転置ファイルを
用いて行う場合の検索方法を説明する図、

【図１０】図１０は一つのノードからその先祖ノード
を辿るために必要なパスを有するデータ構造の一例を示
す図、

【図１１】図１１はノードの情報を２次記憶上に連続
に割り付ける第１の態様を示す図、

【図１２】図１２はノードの情報を２次記憶上に分割
して割り付ける第２の態様を示す図である。

【符号の説明】

１…入力部、２…条件解析部、３…ノード検索部、４…
レコード記憶部、５…接続関係検索部、６…表示処理
部、７…表示部、８…ノード索引ファイル、９…部分木
索引ファイル、１０…データファイル、１１…部分木索
引、１２…索引、１３…レコード、１４…レコード集
合、１５…親レコードへのポインタ、１６…部分木索引
へのポインタ、１７…ノードへのポインタ、１８…接続
関係、１９…ノードへのポインタ、２１…ノードデー
タ、６１…検索されるベきノード、６２…部分木索引、
６２ａ…接続関係、６２ｂ…ノードへのポインタ、７
１，７２…検索されるベきノード、９０…根ノード、９
１…Ａノード、９２…Ｂノード、９０ａ…根ノードの転
置ファイル、９１ａ…Ａノードの転置ファイル、９２ａ
…Ｂノードの転置ファイル、１１０…ノードの情報、１
１１…親ノードへのポインタ、１１２…子ノードへのポ
インタ、１１３…ノードの属性、１２１…リンク情報、
１２１ａ…親ノードへのポインタ、１２１ｂ…子ノード
集合へポインタ、１２１ｃ…属性集合へのポインタ、１
２２…子ノード集合、１２３…属性集合、６０１〜６０
６…レコード、６０７〜６０９…ノードへのポインタ、
６１０〜６１３…部分木索引へのポインタ、６１４…ノ
ードへのポインタ、７００〜７０７…レコード、７０８
〜７１５…ノードへのポインタ。

Claims

【特許請求の範囲】

【請求項１】ノード間の関係が木あるいは木の集合で
表現されるノードの集合から、第１の条件を満たすノー
ドに対して祖孫関係を持ちかつ第２の条件を満たすノー
ドを検索するデータ検索装置であって、第１の条件，第２の条件およびその間の祖孫関係を入力
する入力手段と、ノード，ノード間の関係およびノードの属性値を格納し
たデータ記憶手段と、前記データ記憶手段に格納された葉ノード以外の各ノー
ドごとに設けられ、当該ノードを根ノードとする部分木
を構成する各ノードへのポインタから成る部分木索引を
保持する部分木索引記憶手段と、前記データ記憶手段に格納された各ノードごとに設けら
れ、当該ノードへのポインタと前記部分木索引へのポイ
ンタとから成るレコードの集合を保持するレコード集合
保持手段と、前記データ記憶手段に格納されたノードの属性値と該属
性値を持つノードに対応する前記レコードへのポインタ
から成る索引を保持する索引保持手段と、前記入力手段から入力された第１の条件および第２の条
件を受け取り、前記索引保持手段の索引から第１の条件
を満たすノードに対応するレコードの集合と、第２の条
件を満たすノードに対応するレコードの集合とを抽出す
るノード検索手段と、前記入力手段から入力された第１の条件と第２の条件の
間の祖孫関係を受け取り、前記ノード検索手段の抽出し
た一方のレコードの指す部分木索引の中に、他方のレコ
ードの指すノードが存在するか否かを検索し、該当ノー
ドが存在し、かつ前記祖孫関係を満足する場合に、該当
ノードを第２の条件を満たすノードとして出力する接続
関係検索手段と、該接続関係検索手段の出力する該当ノードの持つ情報を
前記データ記憶手段から抽出して表示する表示処理手段
とを備えることを特徴とするデータ検索装置。
【請求項２】請求項１に記載のデータ検索装置におい
て、前記部分木索引記憶手段は、更に、前記部分木索引のポ
インタの指す各ノードが、該部分木索引の根ノードとな
るノードの子であるか子以外の子孫であるかを区別する
データを含むことを特徴とするデータ検索装置。
【請求項３】ノード間の関係が木あるいは木の集合で
表現されるノードの集合から、第１の条件を満たすノー
ドに対して祖孫関係を持ちかつ第２の条件を満たすノー
ドを検索するデータ検索装置であって、第１の条件，第２の条件およびその間の祖孫関係を入力
する入力手段と、ノード，ノード間の関係およびノードの属性値を格納し
たデータ記憶手段と、前記データ記憶手段に格納された各ノードごとに設けら
れ、当該ノードへのノードポインタと当該ノードの親ノ
ードへのノードポインタを保持するレコードを指す親ポ
インタとから成るレコードの集合を保持するレコード集
合保持手段と、前記データ記憶手段に格納されたノードの属性値と該属
性値を持つノードに対応する前記レコードへのポインタ
から成る索引を保持する索引保持手段と、前記入力手段から入力された第１の条件および第２の条
件を受け取り、前記索引保持手段の索引から第１の条件
を満たすノードに対応するレコードの集合と、第２の条
件を満たすノードに対応するレコードの集合とを抽出す
るノード検索手段と、前記入力手段から入力された第１の条件と第２の条件の
間の祖孫関係を受け取り、前記ノード検索手段の抽出し
た一方のレコードの内、子孫である一方のレコードの親
ポインタを根ノードまで辿り、辿った経路上のレコード
のノードポインタの集合と、第２の条件を満たすレコー
ドのノードポインタの集合との積集合を計算して得られ
るノードポインタの指すノードを該当ノードとして出力
する接続関係検索手段と、該接続関係検索手段の出力する該当ノードの持つ情報を
前記データ記憶手段から抽出して表示する表示処理手段
とを備えることを特徴とするデータ検索装置。