WO2006054506A1

WO2006054506A1 - ツリーデータの検索・集計・ソート方法及びプログラム

Info

Publication number: WO2006054506A1
Application number: PCT/JP2005/020808
Authority: WO
Inventors: Shinji Furusho
Original assignee: Turbo Data Laboratories Inc.
Priority date: 2004-11-17
Filing date: 2005-11-14
Publication date: 2006-05-26
Also published as: JPWO2006054506A1; JP4796970B2

Abstract

　効率的にツリー型データ構造のデータを検索、集計、ソートする。本発明は、ツリー型データ構造を構成するノード間の親子関係を、ツリー型データ構造のノード間の親子関係を、子ノードのノード識別子に親ノードのノード識別子を対応付ける「子→親」関係によって表現する。各ノードはデータを表す少なくとも一つの実体情報が関連付けられる。条件指定部は、実体情報や処理対象範囲に関する条件を指定し、ツリーデータ処理部は、条件指定部によって指定された条件に基づいて、検索、集計、ソートを実行する。

Description

明細書

ツリーデータの検索.集計 ·ソート方法及びプログラム技術分野

[0001] 本発明はツリー型データ構造を取り扱う方法、特に、ツリー型データ構造のデータを検索 '集計'ソートする方法に関する。また、本発明は、このような方法を実施する情報処理装置に関する。更に、本発明は、このような方法を実行するためのプロダラム、及び、このプログラムを記録した記録媒体に関する。

背景技術

[0002] データベースは種々の用途に用いられている力中規模ないし大規模システムにおいては、論理的な矛盾が排除できるリレーショナルデータベース (RDB)の使用が主流となっている。たとえば、 RDBは飛行機の座席予約等のシステムに利用されている。この場合、キー項目を指定することにより、（多くの場合 1件の)ターゲットを迅速に検索することもでき、或いは、予約の確定、キャンセル或いは変更などを行うことができる。また、各便の座席数はせいぜい数百であるため、特定の航空便の空席数を求めることも可能である。

[0003] このような RDBは、表形式データの取り扱いに適している力ツリー形式データの取り扱いには適していないことが知られている（例えば、非特許文献 1を参照。 ) o

[0004] 更に、アプリケーションの中には、表形式による表現よりもツリー形式による表現の方が適しているものが存在する。特に、近年、イントラネットやインターネットのアプリケーシヨンのデータ標準として、ツリー型データ構造を採用する XMLが普及している（ XMLの詳細については、例えば、非特許文献 2を参照。 )₀

[0005] しかし、ツリー型データ構造の取り扱い、例えば、ツリー形式データの検索は、一般に、大変効率が悪い。この効率の悪さの第 1の理由は、データが各所のノードに分散して存在するため、データの存在すべき場所を直ちに特定することが困難である点にある。 RDBでは、例えば、「年齢」というデータは、あるテーブルの「年齢」という項目だけに格納されている。しかし、ツリー型データ構造では、「年齢」というデータを保持するノードが各所に散在しているので、一般的には、ツリー型データ構造の全体を調べなければ、該当するデータを検索することができない。

[0006] 効率の悪さの第 2の理由は、検索の結果を表現するために時間が力かるという点にある。検索にヒットしたノード群を表現しょうとすると、屡々、そのノードの子孫にあたるノードも表現しなければならな、が、 RDBMSとは異なりデータ構造が非定型であるため、子孫ノードを表現するために時間が力かる。

[0007] そこで、データベースの主流である RDBの利点をいかすため、従来、ツリー型データ構造をデータベース化するとき、ツリー形式データを RDB化する方法 (例えば、特許文献 1を参照。）が提案されている。 RDBでは、データはテーブル (表）に分解して保持される。そのため、実際のツリー形式データを RDB化するには、ツリー形式データをテーブルに押し込める必要がある。しかし、様々のツリー型データ構造を取り扱うためには、その構造毎に個別にデータをテーブルに押し込め、システム設計を行わなければならない。したがって、 RDBに基づくシステム構築は非常に手間の力かる作業である。

[0008] これに対して、ツリー形式データ、特に、 XMLデータをそのままの形でデータべ一ス化する方法も提案されている。ツリー型データ構造の場合、一つのノードに子孫ノードをぶら下げることができ、多様な表現が可能であるため、システム設計の手間を大幅に削減することができる。したがって、 XMLのようなツリー構造を取り扱える技術を核として、ツリー形式データを処理することへのニーズが高まって、る。

[0009] XMLデータをそのままの形でデータベース化する方法の一例のアプローチは、ッリー構造に記入されているデータのコピーを取り出し、例えば、「年齢」という項目であれば、「年齢」の検索用インデックスデータを別途保持する（例えば、特許文献 2を参照。；)。これにより、データ自身に属性を付加できるという XMLデータのメリットを十分に活用すると共に、タグを用いて表現された各項目の関係構造をそのまま記憶できるようにしている。

[0010] また、 XML文書をツリー構造でメモリ上に展開するための DOMと呼ばれるォブジエタトモデルのインタフェースが公開されている（例えば、非特許文献 3を参照。）。特許文献 1 :特開 2003— 248615号公報

特許文献 2：特開 2001— 195406号公報非特許文献 1 :株式会社セック、 "Karearea White Paper", [online], [平成 16年 2月 1 9日検索」、インターネット < URL:http://www.sec. co.jp/products/karearea/ 非特許文献 2 :W3C、 "Extensible Markup Language (XML) 1.0 (ThirdEdition)", [onli ne]、 2004年 2月 4日、 [平成 16年 2月 19日検索]、インターネットく URL:http：〃 www .w3.org/TR/2004/REC-xml-20040204/ >

非特許文献 3 :R. ァランヮイク、ブラッドルーペン、サルタンルーマン、「プログラミング XML」、日経 DPソフトプレス、 2002年、 p. 59— 84

発明の開示

発明が解決しょうとする課題

[0011] しかし、上記の検索用インデックスデータを別途保持するようなアプローチでは、少なくともデータは二重に保持され、かつ、インデックスを作成するコスト及びインデックスを格納するためのデータ領域が必要となり、大規模なデータを保持する上で不利である。

[0012] このようなメカニズムによって、実際に検索を行い、ノードを特定したとしても、そのノードを表現するためには時間がかかる。また、このメカニズムは、ノード間の関係を問題とする検索 (例えば、祖先に「60歳」、う「年齢」を含み、子孫に「1歳」、う「年齢」を含むツリーの抽出）には利用できない。

[0013] このような従来技術の根本的な問題点は、個々のデータのみに着目し、データを蓄えたノード間をポインタで接続することによりツリー型データ構造が表現されているため、データ間の関係、例えば、親子、祖先、子孫、兄弟 (シブリング)、世代などの関係を効率的にトレースすることができないことにある。換言すると、ポインタは、その値が一定しないため、データの格納アドレスを示すという用途にし力使用できず、ノード間の関係を直接的に表現することができない。その結果として、従来技術では、ッリ一型データ構造のデータを検索、集計、ソートすることが困難であった。また、上記の DOMは、ツリー型データ構造のトポロジーを編集する操作のインタフェースを規定するだけであり、操作の具体的手法を規定するものではな、。

[0014] そこで、本発明は、効率的にツリー型データ構造のデータを検索、集計、ソートすることができる方法、情報処理装置、プログラム、および、プログラムを記録した記録媒体の提供を目的とする。

課題を解決するための手段

[0015] 上記目的を達成するため、本発明は、ツリー型データ構造を構成するノード間の親子関係を、親ノードに子ノードを対応付ける「親→子」関係ではなぐ子ノードに親ノードを対応付ける「子→親」関係によって表現すると!、う親子関係表現に基づ!、て、ツリー型データ構造のデータを検索、集計、ソートする。

[0016] したがって、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法は、請求項 1に記載されるように、

ルート ·ノードを含む全ノードに固有のノード識別子が付与され、非ルート ·ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子が関連付けられ、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、

各ノードはデータを表す少なくとも一つの実体情報が関連付けられ、

実体情報に関する検索条件を指定する条件指定ステップと、

各ノードについて、当該ノードに関連付けられた実体情報が前記検索条件と一致するかどうかを判定し、一致した場合に当該ノードに検索ヒット情報を関連付け、前記ノード間の親子関係を迪つて当該ノードの祖先ノードに検索ヒット情報を関連付ける検索ステップと、

を有する。これにより、実体情報を指定して、全ツリーを検査し、条件に合致するノードを検出することができる。

[0017] 従来力知られている「親→子」関係によって親子関係を表現する場合、一つの親ノードに複数の子ノードが対応する場合があるので、親ノードと子ノードの二つの要素を特定しなければ親子関係を定義できない。即ち、親ノードを特定しても、その親ノードと親子関係にある子ノードを特定することができない。これに対して、本発明のように「子→親」関係によって親子関係を表現する場合、一つの子ノードには必ず唯一の親ノードが対応するので、子ノードを特定することによって、この子ノードに対応する唯一の親ノードを直ちに特定することができる。これにより、ツリー型データ構造のデータを高速に検索できるようになる。

[0018] 特に、ノード識別子を整数により定義すると、親子関係を定義する際に、子ノードの識別子を収容する配列が不要になるので (すなわち、ツリー型データ構造のトポロジ一は一つの配列で記述できるので）、メモリ使用量が削減され、処理速度が高速ィ匕する。好ましくは、ノード識別子は整数連番にされる。

[0019] また、本発明は、請求項 2に記載されるように、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

条件指定ステップは、検索範囲を表す少なくとも一つの部分ツリーを指定するステップを含み、

検索ステップの後に、検索ヒット情報が関連付けられたノードを含む部分ツリーを表す識別子を検索結果として保存するステップをさらに有する。これにより、検索結果が部分ツリーを表す識別子のリストとして得られる。

[0020] このように、特定のノードとその特定のノードの子孫ノードは部分ツリーという形でまとめて取り扱うと、この部分ツリーを用いて検索の範囲を指定したり、検索の結果を表したりすることができるので、非常に便利である。

[0021] また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法は、請求項 3に記載されるように、

少なくとも一つの実体情報に関する検索条件を指定し、検索範囲を表す少なくとも一つの部分ツリーを指定するステップと、各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群に関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付けるステップと、を有する。これにより、指定された部分ツリーを検査し、ヒットしたノードを検索結果として得ることができる。

[0022] また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法は、請求項 4に記載されるように、

少なくとも一つの実体情報に関する検索条件を指定し、検索範囲を表す少なくとも一つの部分ツリーを指定するステップと、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存するステップと、

を有する。これにより、実体情報を検索条件として指定し、部分ツリーを検査し、部分ツリーの識別子を検索結果として得ることができる。

[0023] また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法は、請求項 5に記載されるように、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付けるステップと、

を有する。これにより、実体情報を検索条件として指定し、祖先ノードを検査して、検索条件に合致したノードを検索結果として得ることができる。

また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法は、請求項 6に記載されるように、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存するステツプと、

を有する。これにより、検索条件として実体情報を指定し、祖先ノードを検査し、検索にヒットした祖先ノードを有する部分ツリーの識別子を検索結果として得ることができる。

また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを第 1の検索条件と第 2の検索条件を論理的に組み合わせて検索する方法は、請求項 7に記載されるように、

検索範囲を表す少なくとも一つの部分ツリーが指定され、

少なくとも一つの実体情報を指定する第 1の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属する部分ツリーを表す識別子を第 1の検索結果として保存するステップと、

少なくとも一つの実体情報を指定する第 2の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属する部分ツリーを表す識別子を第 2の検索結果として保存するステップと、

第 1の検索条件と第 2の検索条件の論理的な関係に対応した論理演算を第 1の検索結果と第 2の検索結果に実行することにより、第 1の検索条件と第 2の検索条件を論理的に組み合わせた検索結果を生成するステップと、

を有する。これにより、検索条件を組み合わせた検索が、個別の検索条件による検索と、個別の検索の検索結果の論理演算として実現される。 [0026] また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを集計する方法は、請求項 8に記載されるように、

集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ッリーを指定するステップと、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたノードが存在するかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を集計するステップと、

を有する。この方法は、各部分ツリーを明示的に指定することにより、次元を指定しない集計、すなわち、部分ツリー内の測度の集計を実現する。

[0027] また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを集計する方法は、請求項 9に記載されるように、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、集計の分類対象を表す実体情報を指定し、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定するステップと、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたノードが存在するかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を、当該部分ツリーに属するノード群に関係した集計の分類対象を表す実体情報毎に集計するステップと、

を有する。この方法は、集計の対象 =測度、集計の範囲 =カテゴリ、及び、集計の分類対象 =次元を指定して、部分ツリー内の測度^^計することができる。

また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータの少なくとも二つのノード群に順序を付ける方法は、請求項 10に記載されるように、

部分ツリーはツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも二つの部分ッリーを指定するステップと、

部分ツリー毎に集計された項目値情報の順序関係に従って当該少なくとも二つの部分ツリーに順序を付けるステップと、

を有する。この方法は、集計結果を利用して、部分ツリーをソートすることができる。 [0029] また、本発明によれば、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータの少なくとも二つのノード群に順序を付ける方法は、

順序付けの対象となる少なくとも二つの部分ツリーを指定し、順序付けの指標となる実体情報を指定するステップと、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中で、順序付けの指標となる実体情報が関連付けられたノードに関連付けられた実体情報を取得するステップと、

部分ツリー毎に取得された実体情報の順序関係に従って当該少なくとも二つの部分ツリーに順序を付けるステップと、

を有する。この方法は、実体情報を利用して部分ツリーをソートすることができる。

[0030] 本発明の好ましい実施の形態によれば、請求項 12に記載されるように、各実体情報はデータの項目を表す項目名情報又はデータの項目値を表す項目値情報である

[0031] また、本発明の好ましい実施の形態によれば、請求項 13に記載されるように、特定のノード及び当該特定のノードの子孫ノードを含む部分ツリーは当該特定のノードのノード識別子によって表される。これにより、一つの頂点ノードで部分ツリーを代表させることができる。検索の結果や、検索や集計の対象範囲をこの頂点ノードで記述することが可能になる。

[0032] また、本発明の一部の好ましい実施の形態では、請求項 14に記載されるように、ルート 'ノードを含む全ノードに付与された固有のノード識別子は同じ世代のノードよりも子ノードを優先して付与される。このような深さ優先の親子表現を利用すると、あるノードの子孫ノードが親子表現の連続領域に出現するという優れた性質が得られ、検索、集計、ソートの処理を高速ィ匕することが可能である。

[0033] 本発明の別の実施の形態では、請求項 15に記載されるように、ツリー型データ構造のデータはツリー識別子が付与された複数のツリーデータを含む。これにより、複数のツリーデータを検索、集計、ソートの対象として処理することが可能になる。

[0034] 請求項 1乃至 15に記載された方法を実施する情報処理装置は請求項 16乃至 30 に記載されている。本発明の情報処理装置は、請求項 16に記載されるように、ルート •ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

ルート'ノードを含む全ノードに固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係を表現し、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造を記憶装置上に構築するデータ展開手段と、

少なくとも一つの実体情報に関する検索条件を指定する条件指定手段と、各ノードについて、当該ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致した場合に当該ノードに検索ヒット情報を関連付け、前記ノード間の親子関係を迪つて当該ノードの祖先ノードに検索ヒット情報を関連付ける検索手段と、

を有する。

[0035] この情報処理装置において、請求項 17に記載されるように、

条件指定手段は、検索範囲を表す少なくとも一つの部分ツリーを指定する手段を含み、

検索手段は、検索ヒット情報が関連付けられたノードを含む部分ツリーを表す識別子を検索結果として保存する手段を含む。

[0036] また、請求項 18に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート' ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造を記憶装置上に構築するデータ展開手段と、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、少なくとも一つの実体情報に関する検索条件を指定し、検索範囲を表す少なくとも一つの部分ツリーを指定する条件指定手段と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群に関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付ける検索手段と、

を有する。

[0037] 請求項 19に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート' ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造を記憶装置上に構築するデータ展開手段と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群に関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存する検索手段と、

を有する。

[0038] 請求項 20に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

ルート'ノードを含む全ノードに固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造を記憶装置上に構築するデータ展開手段と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付ける検索手段と、

を有する。

[0039] 請求項 21に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存する検索手段と、

を有する。

請求項 22に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、第 1の検索条件と第 2の検索条件を論理的に組み合わせて検索する情報処理装置であって、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、検索範囲を表す少なくとも一つの部分ツリーを指定する条件指定手段と、

少なくとも一つの実体情報を指定する第 1の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属する部分ツリーを表す識別子を第 1の検索結果として保存し、少なくとも一つの実体情報を指定する第 2の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが部分ツリーを表す識別子を第 2の検索結果として保存する検索手段と、第 1の検索条件と第 2の検索条件の論理的な関係に対応した論理演算を第 1の検索結果と第 2の検索結果に実行することにより、第 1の検索条件と第 2の検索条件を論理的に組み合わせた検索結果を生成する組み合わせ手段と、

を有する。

[0041] 請求項 23に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを集計する情報処理装置であって、

ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート' ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造を記憶装置上に展開するデータ展開手段と、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定する条件指定手段と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を集計する集計手段と、

を有する。

[0042] 請求項 24に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを集計する情報処理装置であって、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、集計の分類対象を表す実体情報を指定し、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定する条件指定手段と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたノードが存在するかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を、当該部分ツリーに属するノード群に関係した集計の分類対象を表す実体情報毎に集計する集計手段と、

を有する。

請求項 25に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータの少なくとも二つのノード群に順序を付ける情報処理装置であって、

部分ツリーはツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫を含むノード群であり、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも二つの部分ツリーを指定する条件指定手段と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたノードが存在するかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を集計する集計手段と、

部分ツリー毎に集計された項目値情報の順序関係に従って当該少なくとも二つの部分ツリーに順序を付ける順序付け手段と、

を有する。

[0044] 請求項 26に記載された情報処理装置は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータの少なくとも二つのノード群に順序を付ける情報処理装置であって、

ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート' ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造のデータを記憶装置上に展開するデータ展開手段と、

部分ツリーはツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、順序付けの対象となる少なくとも二つの部分ツリーを指定し、順序付けの指標となる実体情報を指定する条件指定手段と、

各ツリーデータに属する各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中で、順序付けの指標となる実体情報が関連付けられたノードに関連付けられた実体情報を取得する指標取得手段と、

部分ツリー毎に取得された項目値情報の順序関係に従って当該少なくとも二つの部分ツリーに順序を付ける順序付け手段と、

を有する。

[0045] また、本発明によれば、請求項 31乃至 45に記載されているように、請求項 1乃至 1

5に係る方法を実行するためのプログラムが提供される。

[0046] 更に、本発明によれば、請求項 31乃至 45に記載されたプログラムを記録した記録媒体が提供される。

発明の効果

[0047] 本発明によれば、ツリー型データ構造のノード間の親子関係は、「子→親」表現に基づ!/ヽて表現されて!ヽるので、ツリー型データ構造を操作する際にアクセスされるメモリの量が低減し、これにより、検索、集計、ソートを高速に実現することが可能となる

発明を実施するための最良の形態

[0048] 以下、添付図面を参照して、本発明の実施の形態につき説明を加える。

[0049] [コンピュータシステム構成]

図 1は、本発明の実施の形態に力かるツリー型データ構造のデータを検索、集計、ソートするコンピュータシステムのハードウェア構成を示すブロックダイヤグラムである

。図 1に示すように、このコンピュータシステム 10は、通常のものと同様の構成であり、プログラムを実行することによりシステム全体および個々の構成部分を制御する CPU 12、ワークデータなどを記憶する RAM(Random Access Memory) 14,プログラム等を記憶する ROM(Read Only Memory) 16,ハードディスク等の固定記憶媒体 18、 CD —ROM19をアクセスするための CD— ROMドライバ 20、 CD— ROMドライバ 20や外部ネットワーク（図示せず)と接続された外部端子との間に設けられたインタフエ一ス (IZF) 22、キーボードやマウス力なる入力装置 24、 CRT表示装置 26を備えている。 CPU12、 RAM14、 ROM16、外部記憶媒体 18、 I/F22,入力装置 24および表示装置 26は、バス 28を介して相互に接続されている。

[0050] 本実施の形態にかかる、ツリー型データ構造のデータを検索、集計、ソートするプログラム、及び、ツリー型データ構造を記憶装置上で変換するプログラムは、 CD—RO M19に収容され、 CD— ROMドライバ 20に読取られても良いし、 ROM16に予め記憶されていても良い。また、いったん CD— ROM19から読み出したものを、外部記憶媒体 18の所定の領域に記憶しておいても良い。或いは、上記プログラムは、ネットヮーク（図示せず)、外部端子および IZF22を経て外部力供給されるものであっても良い。

[0051] また、本発明の実施の形態に力かる情報処理装置は、コンピュータシステム 10にッリー型データ構造のデータを検索、集計、ソートするプログラムを実行させること〖こより実現される。

[0052] [ツリー型データ構造]

図 2A、 Bは、ツリー形式データの一例である POSデータの説明図であり、図 2Aは、このツリー形式データのデータ構造 (即ち、トポロジー)及びデータ値を視覚的に表現した一例である。図 2Bは、同じツリー形式データを XML形式で表現した一例である。同図に示されるようにツリー型データ構造は、ルート'ノード (本例では、 POSデータ）から始めて、各ノードで枝分かれしてリーフ'ノード (端点）に至るノードとアークの組み合わせによって表現される。各ノードには、項目名情報、すなわち、ノードのタイプと、項目値情報、すなわち、ノードの値が関連付けられ、図 2A、 Bの例では、 XML 形式の

く shopName〉フランス店く/ shopName〉

に対応したノードは、「shopName ( =店名）」と、うノードタイプと「フランス店」と、ぅノード値が関連付けられている。この関連付けは、例えば、ノードタイプ及びノード値を記述する情報が格納されたノード情報格納領域へのポインタを、ノード識別子に随伴させること〖こよって実現することができる。しかし、本発明は、ツリー型データ構造の実体的な値の取り扱い方によって限定されないことに注意する必要がある。

[0053] これに対して、ツリー型データ構造のデータの検索、集計、ソートを効率的に実行するためには、ツリー型データ構造のトポロジーを表現する手法、すなわち、記憶装置に展開する手法が非常に重要な役割を果たす。そこで、以下では、主として、ッリ一型データ構造のトポロジーに関して説明する。

[0054] 従来、このようなツリー型データ構造は、データを蓄えたノード間をポインタで接続すること〖こよって表現されている。しかし、ポインタ表現は、ポインタ値に必然性がないという欠点がある。即ち、ある場合には特定のノード Aがある番地 (例えば、 100番地）に格納され、別の場合には同じノード Aが別の番地 (例えば、 200番地）に格納されるので、ポインタ値が一定ではなぐポインタ値は、本質的にノードの格納アドレスを表現するに過ぎない。そのため、例えば、ノードが深さ優先の規則に従ってポインタで接続されてヽる場合、これらのノードを幅優先の規則に従ってポインタで再接続することは困難である。

[0055] これに対して、本発明者は、ツリー型データ構造のトポロジーがアークリストによって記述可能であることに着目した。アークリストとは、ノード間の親子関係を表すアークのリストである。図 3A〜Cは、アークリストを用いたツリー型データ構造の表現形式の一例の説明図である。同図の例では、 0、 10、 20、 30、 40、 50、 60、 70、 80、 90、 1 00及び 110のノード識別子 (ID)が付与された 12個のノード力もなるツリー型データ構造が示されている。図 3Aはツリー型データ構造の全体を示している。図 3Aにおいて、（ノードのタイプを表している）丸形、ハート形などの図形の中央に記載された数字は、ノード IDを表し、矢印と矢印の側に記載されたく 0, 10 >などの数字の対は、アークを表している。尚、ノード IDは、文字列には限られず、数値、特に、整数でもよい。図 3Bは、親ノード（From— ID)から子ノード (To— ID)へのアークリストを示し、図 3Cは、ノード IDとノード Typeの対のリストからなるノードリストを示す。尚、ツリー型データ構造を表現するだけの目的のためにはノードリストが無くても構わない。原理的には、このようなアークリストを用いることによって、ノード間の関係をポインタによらずに直接的に記述することが可能である。

[0056] [「子→親」関係に基づく表現]

図 3A〜Cの例では、アークリストは、親ノードに子ノードを対応付ける「親→子」関係に基づいて記述されている。そのため、一つの親ノード、例えば、ルート'ノード 0には、 3個の子ノード 10、 60及び 80が存在するため、アークリストの From— IDには、同じノード IDの 0が 3回出現している。つまり、親ノードを特定しても子ノードを特定することができないので、アークリストは、要素 From— IDの配列と要素 To— IDの配列により構成される。アークリストを使用する場合、あるノードは、 From— IDの配列と、 To— IDの配列の両方の配列に出現する。

[0057] これに対して、親子関係は、「子→親」関係によっても表現することが可能である。この場合、ノード間の親子関係は、ルート'ノード以外のノードである非ルート'ノードの各々と、関連付けられた親ノードと、の組の配列によって表現される。この「子→親」関係によって親子関係を表現する場合、「親→子」関係の場合には得られな力つた重要な性質がある。即ち、一つの子ノードには必ず唯一の親ノードが対応するので、子ノードを特定することによって、この子ノードに対応する唯一の親ノードを直ちに特定することができる。つまり、アークリストは、実際には、要素 To— IDの配列だけを準備すればよい。この結果として、アークリストを格納するための記憶容量が削減される。この記憶容量の削減は、メモリへのアクセス回数が低減するという効果があるので、結果的に、処理の高速ィ匕が実現できる。

[0058] 図 4A〜Dは、「子→親」関係に基づくツリー型データ構造の表現方法の説明図である。図 4Aはツリー全体の説明図であり、図 4Bは「子→親」関係に基づくアークリストである。図 4Bのアークリストは、ルート'ノードに対する親ノードの格納領域を含んでいるので、ルート'ノードの親ノードとして、便宜的に〃—〃が設定されている。但し、ルート 'ノードに対応する親ノードは存在しないので、図 4Cに示されるように、「子→親」関係に基づくアークリストからルート'ノードに対する親ノードの格納領域を除いても構わない。このように、ルート'ノード以外のノードである非ルート'ノードの各々に対して、非ルート'ノードの親ノードを関連付けることによりノード間の親子関係を表現する。そして、「子→親」表現された子のノードから親のノードのリストを迪ることでツリーのトポロジーを表現することができる。

[0059] このような「子→親」関係に基づくツリー型データ構造は、本発明の一実施例によれば、図 5に示されるように、図 1に示されたコンピュータシステム 10に、ルート'ノードを含むノードに固有のノード識別子を付与するノード定義ステップ 501と、前記ルート' ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子に、前記非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付ける親子関係定義ステップ 502と、を実行させることによって RAM14上に構築される。このように、最初に、文字列、浮動小数、整数などの任意の識別情報によってノードにノード識別子を付与し、次に、「子→親」表現に基づいて親子関係を定義することによって、子ノードのノード識別子力親ノードのノード識別子を引く (ルックアップする)ことでツリーのトポロジーを表現することができる。

[0060] [ノード識別子]

好ましくは、ノード定義ステップはノード識別子として数値を使用し、より好ましくは、連続する整数を使用し、更に好ましくは、 0又は 1からの整数連番を使用する。これにより、ノード識別子から、そのノードに対応する親ノードのノード識別子が格納されて V、るアドレスを簡単に取得することができるので、子ノードのノード識別子力も親ノードのノード識別子を引く処理を高速ィ匕することができる。

[0061] ツリー型データ構造のノードにノード識別子として順序付きの番号を付与してノード間の親子関係を表現する場合、番号の付与順序に規則を定めることによって、その後のツリー型データ構造の取り扱、が容易になると、う利点がある。この番号の付与順序の規則として、同じ世代のノードよりも子ノードを優先する深さ優先モードと、子ノードよりも同じ世代のノードを優先する幅優先モードが利用される。

[0062] 図 6A〜Cは、 ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。図 6Aには、各ノードに ID番号が付与されたツリー構造型データが示されている。図 6Bには、変換規則が示され、図 6Cには、各ノードに整数連番が付与されたツリー構造型データが示されて!/ヽる。本例の変換規則は、深さ優先で連続番号を付与する規則であり、具体的には、複数の子ノードが存在する場合、長子 (一番上の兄)ノードに最小番号を付与し、末子 (一番下の弟)ノードに大きい番号を付与し、かつ、兄弟ノードよりも子ノードを優先して番号を付与する。本例では、昇順に番号付けをしている力降順に番号付けをしてもよい。

[0063] また、図 7A〜Cは、 ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。図 7Aには、各ノードに ID番号が付与されたツリー構造型データが示されている。図 7Bには、変換規則が示され、図 7Cには、各ノードに整数連番が付与されたツリー構造型データが示されている。本例の変換規則は、幅優先で連続番号を付与する規則であり、具体的には、複数の子ノードが存在する場合、長子 (一番上の兄)ノードに最小番号を付与し、末子 (一番下の弟)ノードに大きい番号を付与し、かつ、子ノードよりも兄弟ノードを優先して番号を付与する。本例では、昇順に番号付けをしているが、降順に番号付けをしてもよい。

[0064] このようにノード識別子として番号を使用すると、ノード番号から直ちに、即ち、 0 (1 )のオーダーで、そのノードに関する格納値が格納されているアドレスを引くことができる。また、親子関係を「子→親」表現することによって、子ノードから親ノードを直ちに、即ち、 O (l)のオーダーで引くことができる。 [0065] [深さ優先モード]

図 6Cに示されるような深さ優先に基づくツリー型データ構造は、図 1に示されたコンピュータシステム 10に、

同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数を付与するノード定義ステップと、

ルート ·ノード以外のノードである非ルート ·ノードの各々に付与された整数の順に、非ルート'ノードの各々の親ノードに付与された整数を並べることにより形成される配列を前記記憶装置に格納する親子関係定義ステップと、

を実行させることによって、記憶装置上に構築される。これにより、ノードは深さ優先で連続整数が付与され、ノード間の親子関係は「子→親」関係の配列によって表現される。

[0066] 図 8は、深さ優先に基づくノード定義処理のフローチャートである。このノード定義処理は、コンピュータシステム 10に

最初にルート'ノードに番号を付与するステップ 801と、

既に番号が付与されたあるノードに唯一の子ノードが存在する場合には、当該子ノードに当該あるノードに付与された前記番号の次の番号を付与するステップ 802と、既に番号が付与されたあるノードに複数の子ノードが存在する場合には、当該複数の子ノードの間の兄弟関係に従って、弟ノードは直上の兄ノードの全ての子孫ノードに番号が付与された後に次の番号が付与されるように、一番上の兄ノードから一番下の弟ノードまで番号を付与するステップ 803と、

を実行させる。これにより、深さ優先モードで同一の親ノードから派生した複数の子ノードの間に兄弟関係が定義される。

[0067] 図 9は、図 6Cに示された深さ優先のツリー型データ構造から作成された「子→親」表現に基づく親子関係の配列の説明図である。同図にサブツリー 1又はサブツリー 2 として示されてヽるように、深さ優先で連続番号が付与されたノードの親子関係を「子 →親」関係に基づいて配列表現すると、あるノードの子孫ノードが連続領域に出現すると!/ヽぅ優れた性質が得られる。

[0068] 一例として、深さ優先モードの優れた性質を利用することにより、前記配列から、あるノードに付与された整数以上の値が格納されている連続領域を抽出することにより、前記あるノードの全ての子孫ノードを特定することができる。これにより、あるノードの子孫ノードを表すノード群が前記配列内の連続ブロックとして獲得できる。例えば、連続ブロックのサイズを mとすると、あるノードの全ての子孫ノードを特定するための処理速度は、 O (m)のオーダーになる。

[0069] 既に説明したように、ノード間の親子関係は、「子→親」関係の配列の他に、「親→ 子」関係の配列によっても表現できる。図 10は、図 6Cに示された深さ優先のツリー型データ構造力作成された「親→子」表現に基づく親子関係の配列の説明図である。一つの親ノードに対して複数の子ノードが存在し得るので、親子関係の配列は、各ノードに対する子ノードの番号が格納されて、る領域を示すための配列 Aggrと、子ノードの番号が格納されている配列 P→Cの二つの配列により構成される。例えば、配列 Aggrの先頭から 2番目の要素 Aggr [1]の値は" 3"であり、これは、ノード [1]に対する子ノードの番号は、配列 P→Cの要素 P→C [3]以降に格納されていることを表している。これにより、ノード [0]、即ち、ルート'ノードに対する子ノードは、配列 P→C の先頭から 3個の要素、 P→C[0]の 1、 P→C[1]の 6、及び P→C [2]の 8であることがわカゝる。

[0070] この「親→子」表現に基づく親子関係の配列の求め方を説明する。

(1)ノードの番号が配列 P→Cの最大の添字（ = 11)と一致する場合、このノードに属する子ノードは存在しない。したがって、処理は継続されない。

(2)同図に太字で表された親ノードの番号力も Aggr値を求める。この Aggr値は、配列 P→Cの開始点を表す。

(3)太字で表された親ノード番号 + 1に対応する Aggr値を求める。この Aggr値 1 が配列 P→Cの終了点である。

[0071] 例えば、ノード 0の子ノードの開始点は、 Aggr[0]、即ち、 0であり、終了点は、 Agg r[l]— 1、即ち、 3— 1 = 2である。したがって、ノード 0の子ノードは、配列 P→Cの 0 〜2番目の要素、即ち、 1、 6及び 8である。

[0072] 或いは、「親→子」表現に基づく親子関係は、より単純に、親ノード番号の配列と、対応する子ノード番号の配列と、の二つの配列により表現することも可能である。しかし、この配列を利用して親子関係を見つけるためには、親ノードの番号を検索しなければならないので、即ち、 log (n)のアクセス時間を要するので効率が悪い。

[0073] [幅優先モード]

さらに、図 7Cに示されるような幅優先に基づくツリー型データ構造は、図 1に示されたコンピュータシステム 10に、

子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数を付与するノード定義ステップと、

前記ルート'ノード以外のノードである非ルート'ノードの各々に付与された整数の順に、前記非ルート'ノードの各々の親ノードに付与された整数を並べることにより形成される配列を前記記憶装置に格納する親子関係定義ステップと、

を実行させることによって、記憶装置上に構築される。これにより、ノードは幅優先モードで連続整数が付与され、ノード間の親子関係は「子→親」関係の配列によって表現される。

[0074] 図 11は、幅優先に基づくノード定義処理のフローチャートである。このノード定義処理は、コンピュータシステム 10に、

各ノードが前記ルート'ノードから何世代目のノードである力及び、各世代に含まれるノード数を算出するステップ 1101と、

最初に前記ルート ·ノードに番号を付与するステップ 1102と、

ある世代に含まれる全てのノードに番号が付与されたならば、当該ある世代の次の世代にノードが存在しなくなるまで、当該次の世代に含まれる全てのノードに対して、親ノードが異なる場合には、当該親ノードに番号が付与された順番に当該ノードに番号を付与し、当該親ノードが同一である場合には、当該親ノードから派生した複数の子ノードの間に兄弟関係を定義し、一番上の兄ノードから一番下の弟ノードまで直前に付与された番号の次の番号から連続的に変化する固有の整数を順に付与するステツプ 1013と、

を実行させる。これにより、幅優先モードで同一の親ノードから派生した複数の子ノードの間に兄弟関係が定義される。

[0075] 図 12は、図 7Cに示された幅優先のツリー型データ構造から作成された「子→親」表現に基づく親子関係の配列の説明図である。同図に示されているように、幅優先で連続番号が付与されたノードの親子関係を「子→親」関係に基づいて配列表現すると、あるノードの子ノードは連続領域に出現するという優れた性質が得られる。これは、幅優先モードで連続番号が付与されたノードの親子関係を「子→親」関係に基づ、て配列表現すると、親ノードに付与された番号が前記配列中に順序付き (昇順又は降順)で出現すること〖こよる。

[0076] したがって、幅優先モードの優れた性質を利用することにより、前記配列から、あるノードに付与された整数と同じ値が格納されている連続領域を抽出することにより、前記あるノードの全ての子ノードを特定する。これにより、あるノードの子ノードを、例えば、二分探索などの手法を用いて検索することが可能であり、即ち、 0 (log (n) )のォーダ一で検索することが可能になる。

[0077] 既に説明したように、ノード間の親子関係は、「子→親」関係の配列の他に、「親→ 子」関係の配列によっても表現できる。図 13は、図 7Cに示された幅優先のツリー型データ構造力作成された「親→子」表現に基づく親子関係の配列の説明図である。図 13—つの親ノードに対して複数の子ノードが存在し得るので、親子関係の配列は、各ノードに対する子ノードの番号が格納されて、る領域を示すための配列 Aggrと、子ノードの番号が格納されている配列 P→Cの二つの配列により構成される。例えば、配列 Aggrの先頭から 2番目の要素 Aggr [1]の値は" 3"であり、これは、ノード [1] に対する子ノードの番号は、配列 P→Cの要素 P→C [3]以降に格納されて!、ることを表している。これにより、ノード [0]、即ち、ルート'ノードに対する子ノードは、配列 P →Cの先頭から 3個の要素、 P→C[0]の 1、 P→C[1]の 2、及び、 P→C[2]の 3であることがゎカゝる。

[0078] この「親→子」表現に基づく親子関係の配列の求め方を説明する。

[0079] 例えば、ノード 0の子ノードの開始点は、 Aggr [0]、即ち、 0であり、終了点は、 Agg r[l]— 1、即ち、 3— 1 = 2である。したがって、ノード 0の子ノードは、配列 P→Cの 0 〜2番目の要素、即ち、 1、 2及び 3である。

[0080] [ツリー型データ構造の表現形式の相互変換]

上述のように、ノードに連続番号を付与するための深さ優先モード及び幅優先モードは、それぞれ、固有の優れた性質を備えている。また、一つのツリー型データ構造は、深さ優先に基づく「子→親」表現形式と、幅優先に基づく「子→親」表現形式と、「親→子」表現形式の何れの表現形式でも表現可能である。したがって、深さ優先に基づく「子→親」表現形式と、幅優先に基づく「子→親」表現形式と、「親→子」表現形式は、適宜に相互変換可能であることに注意する必要がある。

[0081] [頂点ノードおよび部分ツリー群]

ツリー型データ構造のデータを検索、集計、ソートする際に、ツリーデータの全体の中で特定の部分を処理の対象、例えば、検索の対象範囲とする場合がある。本発明者は、複数のノードを含む特定の部分を代表する一つのノードを導入することにより、種々の処理を効率化する手法を提案した。次に、この手法について詳述する。

[0082] ツリー型データ構造をもつツリーデータにおいて、ルート'ノードに最も近いノードの値で、当該ノードおよびそのノードから枝分かれしてリーフ'ノード (端点）に至るまでの全てのノードを表現することを考える。ここで、あるノードおよびそのノード力も枝分かれしてリーフ'ノードに至るまでのノード群を、部分ツリーと称する。また、上記ノード (ルート ·ノード）に最も近ソードを頂点ノードと称する。

[0083] 図 14Aは、前述した幅優先モードに基づくツリー型データ構造、図 14Bは、当該ッリー型データ構造を、「子→親」表現に基づく親子関係の配列を示す図である。たとえば、頂点ノード [4]は、ノード識別子 {4, 8, 9}を含み、頂点ノード [6]は、ノード識別子 {6}を含み、また、頂点ノード [3]は、ノード識別子 {3, 7, 10, 11 }を含む。このような、複数の頂点ノードからなる配列を、頂点ノードリストと称する。頂点ノードリストにより複数の部分ツリーを指定でき、指定された複数の部分ツリーを部分ツリー群と称する。 [0084] 以下、頂点ノードリストを、 [a, b, · · ·]と表す。ここに、「a」、」、 · · ·は、頂点ノードに対応するノード識別子である。頂点ノードリストを構成する頂点ノードの各々を展開して、当該頂点ノードを頂点とする部分ツリーに含まれるすべてのノードのノード識別子を求めることを考える。求められたノード識別子のリストにおいて、あるノード識別子は 1つしか存在しない場合、すなわち、ノード識別子が重複して出現しない場合、このような部分ツリー群を、「正規部分ツリー群」と称する。そうでないような部分ツリー群を、「非正規部分ツリー群」と称する。

[0085] 尚、部分ツリー群は正規部分ツリー群へ変換することが可能であり、この処理を「正規化」と称する。正規化は、集合演算を効率的に実施する上で重要になる。正規化された部分ツリー群では、どのノードも高々 1つの頂点ノードに属するのみであるため、各ノードが所属する頂点ノードのリストは、高々頂点ノードの数に等しいサイズの配列で記述することができる。このため、正規化された状態では、論理積や論理和に代表される集合演算を効率的に実施することができる。

[0086] 正規部分ツリー群であっても、非正規部分ツリー群であっても、頂点ノードリストによつて、頂点ノードおよびその子孫ノードからなる部分ツリー群を特定することができる。たとえば、図 15Aに示すように、頂点ノードリスト [4, 6, 3]により、図 15Bに示すような部分ツリー群 (部分ツリー {4, 8, 9}、 {6}、 {3, 7, 10, 11 })が特定される。

[0087] 頂点ノードリストにより特定される部分ツリー群は、検索、集計、ソート、集合演算の対象とすることができる。

[0088] たとえば、図 15A、 Bの例で、「ハート形」のノードを含む部分ツリーを検索すると、図 16Bに示すような部分ツリー群が得られる。図 16Aは、この部分ツリー群を表わす頂点ノードリストである。

[0089] また、各部分ツリーに属するノード数魏計すると、図 17Bに示すようになる。図 17 Aにおいて、配列 1701は頂点ノードリスト、配列 1702は、各頂点ノードにより特定される部分ツリーに属するノード数を示す配列である。

[0090] たとえば、ソートとして、各部分ツリーに属するノード数によるソートを考えることができる。図 18A中、配列 1801は、ソートされた頂点ノードリスト、配列 1802は、頂点ノ一ドリストにより特定される部分ツリーに属するノード数を示す配列である。また、図 1 8Bは、部分ツリーがノード数にしたがってソートされた状態を示す。

[0091] さらに、複数の部分ツリー群の間の集合演算として、論理積について説明する。図 14A、 Bに示すツリーにおいて、図 19Bに示す部分ツリー群 (対応する頂点ノードリストを図 19Aに示す）と、図 19Dに示す部分ッリ一群 (対応する頂点ノードリストを図 19 Cに示す）との論理積を考える。

[0092] 図 19Bにおける、ノード識別子「4」の頂点ノードにて特定される部分ツリー 1901と、図 19Dにおける、ノード識別子「1」の頂点ノード識別子にて特定される部分ツリー 1 911とを比較すると、部分ツリー 1901は、部分ツリー 1902に包含される。図 19Bにおける部分ツリー 1902と包含関係をもつような部分ツリーは、図 19Dに示す部分ッリ一群には存在しない。また、図 19Bにおけるノード識別子「3」の頂点ノードにて特定される部分ツリー 1903と、図 19Dにおける、ノード識別子「7」にて特定される部分ッリー 1913とを比較すると、部分ツリー 1913は、部分ツリー 1903に包含される。その結果、論理積演算の結果を示す頂点ノードリストは、図 20Aに示すように、 [4, 7]となる。図 20Bは、論理積演算の結果に対応する部分ツリー群である。

[0093] 図 16A、 B〜図 20A、 Bにより理解できるように、頂点ノードリスト (集計においては、これに加えて、頂点ノードリストと同一サイズの、集計結果 (ノード数)を格納する配列 )によって、それぞれの処理や演算の結果を表わすことができる。

[0094] [集合演算]

本実施の形態に力かる正規部分ツリー群の間では、論理積 (AND)や論理輪 (OR )、否定 (NOT)、減算 (SUB)、排他的論理和 (XOR)を定義することができる。このような演算の結果も正規部分ツリー群にて表わす。以下、これら演算について説明する。以下、図 21A、 Bに示す例において、それぞれの演算について説明する。

(1)論理和（OR)

たとえば、正規部分ツリー群 [2]、 [3]の論理和を考える。

[0095] 正規部分ツリー群 [2] : { 2, 6}

正規部分ツリー群 [3] : {3, 7, 10, 11 }

これらの論理和 [2]OR[3] = [2, 3]

( [2, 3] : {2, 6} , {3, 7, 10, 11 }) となる。

[0096] 同様に、正規部分ツリー群 [3]、「7」の論理和を考える。

[0097] 正規部分ツリー群 [3] : {3, 7, 10, 11 }

正規部分ツリー群 [7] : {7, 10, 11 }

したがって、これらの論理和 [3]OR[7] = [3]となる。

(2)論理積 (AND)

正規部分ツリー群 [2, 3]、 [7]の論理積を考える。

[0098] 正規部分ツリー群 [2, 3] : {2, 6, 3, 7, 10, 11 }

正規部分ツリー群 [7] : [7, 10, 11]

したがって、これらの論理積 [2, 3]AND[7] = [7]となる。

[0099] 演算のうち、これらの演算において実行される処理について以下に説明する。

[0100] [論理積演算]

まず、論理積演算の原理について説明する。図 22Aに示すように、 2つの正規部分ツリー群 2201および 2202を考える。 2つの正規部分ツリー群は、以下に述べるような関係を有する。

[0101] たとえば、正規部分ツリー群 2201が正規部分ツリー群 2202を含む場合（図 22B 参照）には、 2つの正規部分ツリー群の論理積は、正規部分ツリー群 2202となる。その一方、正規部分ツリー群 2202が正規部分ツリー群 2201を含む場合（図 22C参照 )には、 2つの正規部分ツリー群の論理積は、正規部分ツリー群 2201となる。さらに、図示しないが、双方の正規部分ツリー群が包含関係を持たない場合には、これらの間の論理積は空集合となる。

[0102] 図 23は、論理積演算の際にシステムにて実行される処理を示すフローチャートである。図 23に示すように、論理積演算の対象となる正規部分ツリー群のそれぞれについて、マーキング配列を生成する (ステップ 2301)。マーキング配列は、正規化演算にて生成されたフラグ配列および所属ノード配列と等価である。すなわち、正規化演算の第 1の手法および第 2の手法と同様の処理を実施することでマーキング配列を取得することができる。

[0103] 次、で、システム 10は、双方のマーキング配列の対応する値を比較する（ステップ 2302)。より詳細には、システム 10は、 2つのマーキング配列中の対応する値を特定するためのポインタを初期化し (ステップ 2311)、ポインタが示すマーキング配列の双方の値を取り出す (ステップ 2312)。双方の値或いは一方の値力初期値「― 1」であつた場合には (ステップ 2313でノー (No))、システム 10は、ポインタが配列の末尾を指して、なければ (ステップ 2315でノー (No))、ポインタを移動して（ステップ 2316)、ステップ 2312に戻る。

[0104] マーキング配列の双方の値が初期値「一 1」以外の値であった場合には (ステップ 2 312でイエス (Yes))、マーキング配列の値のうち大きいほうの値力格納番地、つまり、対応するノード識別子と等しいか否かが判断される (ステップ 2313)。ステップ 231 3でイエス (Yes)と判断された場合には、システム 10は、当該一致する値を、論理積演算の結果を示す頂点ノード配列の値として、当該頂点ノード配列に格納する (ステツプ 2314)。その後、ポインタが配列の末尾を指していなければ (ステップ 2315でノー (No))、ポインタを移動して（ステップ 2316)、ステップ 2312に戻る。

[0105] ステップ 2312でノー (No)と判断された場合には、ポインタが配列の末尾を指していなければ (ステップ 2315でノー (No))、ポインタを移動して（ステップ 2316)、ステップ 2312に戻る。

[0106] 以下、正規部分ツリー群 [3, 6]と、正規部分ツリー群 [2, 7]の AND演算の例について説明する。図 24は、正規部分ツリー群 [3, 6]および正規部分ツリー群 [2, 7]のそれぞれのマーキング配列が生成された状態を示す。図 24において、符号 2401が、正規部分ツリー群 [3, 6]のマーキング配列（第 1のマーキング配列）を示し、符号 2 402力正規部分ツリー群 [2, 7]のマーキング配列（第 2のマーキング配列）を示す

[0107] 図 25に示すように、ポインタがノード識別子「6」を示すときに (符号 2501参照）、第 1のマーキング配列の値は「6」であり、かつ、第 2のマーキング配列の値力「2」である。大きい方の値は「6」であり、ノード識別子に一致する。したがって、値「6」は、論理積演算の結果を格納するための頂点ノードリストに格納される。

[0108] また、ポインタがノード識別子「7」を示すときに (符号 2502参照）、第 1のマーキング配列の値は「3」であり、かつ、第 2のマーキング配列の値力「7」である。大きいほうの値は「7」であり、ノード識別子に一致する。したがって、値「7」は、論理積演算の結果を格納するための頂点ノードリストに格納される。このような処理の結果、 [3, 6] AN D[2, 7] = [6, 7]を得ることができる。

[0109] [論理和演算]

論理和演算は、以下のように記述することができる。

[0110] [al, a2, · · · , an]OR[bl, b2, · · · , bn]

=NORM[al, a2, · · · , an, bl, b2, · · · , bn]

つまり、上述した正規化の手法を用いれば、論理和演算の結果を示す頂点ノードリストを得ることができる。

[0111] たとえば、図 24に示す例において、 [3, 6]OR[2, 7] =NORM[3, 6, 2, 7] = [2

, 3]となる。

[0112] [減算]

上述した論理和演算および論理積演算を利用して、正規部分ツリー群の減算は、以下のように定義することができる。なお、以下において、減算は「一（マイナス）」で表わす。

[0113] A, Β, C, Dをそれぞれ正規部分ツリー群とする。

[0114] (A-B)AND (C-D) = (A AND C)一（B OR D) (式 1)

(A— B) OR (C— D) = (A OR C)AND (B AND D) (式 2)

A— B— C=A— (B OR C) (式 3)

つまり、ブール代数と同じ演算規則が成立する。

[0115] 正規ィ匕演算などで説明したように、正規部分ツリー群は、頂点ノードリストで表わすことができる。

[0116] 本例においては、たとえば、（式 1)は、 2つの頂点ノードリスト (A、 Cの論理積演算結果を示す頂点ノードリスト、および、 B、 Dの論理和演算結果を示す頂点ノードリスト )と、その間の「減算」という演算子とで表わすことができる。つまり、本来であれば、正規部分ツリー群 A〜Cのそれぞれの 4つの頂点ノードリストおよびそれらの間の演算子にて表わすべきところ、 2つの頂点リストおよびその間の演算子で表わすことができる。つまり、被減数の頂点ノードリストと、減数の頂点ノードリスト（除外頂点ノードリスト )とで表わすことが可能となる。

[0117] (式 2)や (式 3)についても同様である。

[0118] [否定、排他的論理和等]

また、正規部分ツリー群の否定 (NOT)も、除外頂点ノードリストとして表わすことができる。つまり、 ΓΝΟΤ Aj (Aは正規部分ツリー群）は、除外頂点ノードリストにリストされた頂点ノードおよびその子孫のノードを除いた全てのノード力正規部分ツリー群 Aの否定となる。

[0119] 同様に、排他的論理和も、頂点ノードリストおよび除外頂点ノードリストで表わすことが可能である。

[0120] [ツリーデータ検索の概要]

ツリーデータ検索は、パスの検索とノード格納値の検索の二つの側面がある。パスの検索とは、図 2A、 Bにおいて、例えば、 7shop/shopName"というパス条件を満たすノードを抽出することである。また、ノード格納値の検索とは、図 2A、 Bにおいて、 " shopName=フランス店"であるノードを抽出することである。

[0121] そして、一般的なツリーデータ検索は、パスの検索とノード格納値の検索の組み合わせであり、上記の例では、 7shop/shopName=フランス店〃を満たすノードを抽出することに相当する。すなわち、一般的なツリーデータ検索は、パスの条件とノード格納値の条件を同時に満たす AND条件による検索である。ある頂点ノード力この AND 条件を満たす力どうかは、パスの条件を調べ、パスの条件を満たすノードのノード格納値の条件を調べることにより判定することが可能である。また、この AND条件指定による検索は、パス条件による検索の結果集合とノード格納値条件による検索の結果集合の AND (論理積)演算を実行することにより実現できる。

[0122] さらに、ツリーデータ検索は、上記のパス条件とノード格納値条件の AND条件指定による検索に限られない。例えば、パス条件とノード格納値条件の何れかを満たすノードを抽出する OR条件指定による検索がある。この OR条件指定による検索は、パス条件による検索の結果集合とノード格納値条件による検索の結果集合の OR (論理和)演算を実行することにより実現できる。

[0123] [ノードの実体的な値の取り扱い方] ツリーデータ検索では、検索条件として、パスを表すためのノードの項目名情報 (例えば、ノードタイプ）と、ノード格納値を表すためのノードの項目値情報（例えば、ノード値)のような実体情報が利用される。これらの実体情報は、例えば、図 26に示されるように、ノードタイプ及びノード値を記述する情報が格納されたノード情報格納領域へのポインタを、ノード識別子に随伴させることによって特定することができる。

[0124] 尚、すべてのノードのノードタイプが同じである場合には、ノード情報格納領域にはノード値だけを格納するように構成することが可能である。

[0125] [子孫のパス条件による検索]

次に、本発明の実施の形態に力かる子孫のパス条件による検索方法を説明する。子孫のパス条件による検索とは、指定されたノードタイプを有するノードを子孫ノードとして含む頂点ノードを抽出する処理である。図 27A、 Bは、本発明の一実施例にかかる子孫のパス条件による検索の対象となるツリー型データ構造と、ノードの親子関係の「子→親」表現の説明図である。本例では、各ノードの項目名情報であるノードタィプは、シンボル番号によって表され、図 27Aでは、各ノードのノード識別子（例えば、ノード番号）力そのノードのシンボル番号に対応した図形と共に表されている。例えば、ルート'ノードは、丸型シンボルである。また、頂点ノードは黒塗りの星印（★)で示されている。図 27Bは、シンボル番号と表示図形とシンボル名の対応関係を表す図である。

[0126] 本例では、頂点ノードの子孫ノードの条件を検索条件としてノード抽出を行う。より具体的には、子孫ノードにボタン型のノードを含む頂点ノードを抽出する。

[0127] 子孫のパス条件による検索においては、子ノード力親ノードの順番にチェックする方法 1と、親ノードから子ノードの順番にチェックする方法 2の 2通りの方法がある。方法 1は、「子→親」表現の先頭力順にチェックする方法であって、頂点ノードの個数が多い場合に効果的である。一方、方法 2は、頂点ノードから始めて親力も子へ順にチェックするので、頂点ノード数が少ない場合に効果的である。アプリケーションに応じて、方法 1と方法 2を選択的に実行してもよい。

[0128] [子孫のパス条件検索の方法 1：子→親でチェックする方法]

本発明の実施の形態にかかるパス条件検索方法 1を実行するコンピュータシステム 10の RAM14には、図 27Aに示されるように、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータが展開されている。より具体的には、ルート'ノードを含む全ノードに固有のノード識別子であるノード番号が付与され、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子が関連付けられ、これにより、ツリー型データ構造を構成するノード間の親子関係、すなわち、深さ優先の「子→親」による親子関係が表現されている。しかし、パス条件検索の方法 1は、幅優先の「子→親」による表現形式でも同様に適用できることに注意する必要がある。各ノードは、例えば、図 2 6に示されるように、項目名情報であるノードタイプ (又は、シンボル番号）と、項目値情報であるノード値とが関連付けられて、る。

[0129] コンピュータシステム 10は、検索条件として、ノードのシンボル番号 = 1 (シンボル番号 1はボタン型を表す）という条件を設定する。この条件は、例えば、ユーザがコンビユータシステム 10の入力装置 24を介して入力してもよぐ又は、外部記憶媒体 18から読み出してもよぐ或いは、 IZF22を介して外部力も設定してもよい。

[0130] コンピュータシステム 10は、次に、各ノードについて、当該ノードに関連付けられたノードタイプがボタン型と一致するかどうかを判定し、一致した場合に当該ノードに検索ヒット情報を関連付け、「子→親」表現形式の親子関係を迪つて当該ノードの祖先ノードに検索ヒット情報を関連付ける。検索ヒット情報は、例えば、各ノード識別子に対応したフラグ情報領域を準備し、検索がヒットした場合に、そのフラグ情報をセットすることによってノード識別子に関連付けることができる。

[0131] 図 28は、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法のフロ一チャートである。また、図 29A〜図 33Cは、本発明の一実施例にかかる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[0132] システム 10は、最初に、図 29Aに示されるように、フラグ領域 Flagを初期化し、シンボル番号読み出しアドレスを初期化する (ステップ 2801)。本例では、フラグ領域は値 0で初期化され、シンボル番号読み出しアドレスは先頭のアドレス 0で初期化され、また、シンボル番号 (Symbol

No.)は配列の形で格納されている力この例に限定されるものではない。次に、システム 10は、このシンボル番号読み出しアドレスに対応したシンボル番号 (Symbol No.)を読み出し (ステップ 2802)、このシンボル番号が 1であるかどうかをチェックする (ステップ 2803)。図中、チェック場所を示すポインタは太い矢印で示されている。先頭アドレス 0に対応するシンボル番号は 2であるため、ステップ 2803のチェック結果は Noであり、次のアドレスがあるかどうかをチェックすると (ステップ 2808)、次のアドレス 1が存在するので (Yes)、シンボル番号読み出しアドレスを次のアドレス 1に移動し (ステップ 2805)、ステップ 2802へ戻る。図 29B〖こ示されるよう〖こ、読み出されたシンボル番号が 1に合致するか、又は、次のシンボル番号読み出しアドレスがなくなるまで、ステップ 2802、 2803、 2804、 2805力 S繰り返される。本 f列で ίま、ドレス 0力らアドレス 6までは、シンボル番号が 1に合致しない。図 29Cに示されるように、シンボル番号読み出しアドレスが 7まで進むと、シンボル番号は 1に合致する（ステップ 2803)

[0133] システム 10は、ステップ 2803で 1に合致するシンボル番号を見出すと（Yes)、図 3 OAに示されるように、見出したアドレス 7のノードのフラグにマークを付け (ステップ 28 06)、親子関係表現 C→Pを利用して、アドレス 7の親ノードのアドレス、すなわち、ァドレス 6を見つけ、着目ノードを親ノードへ移動する (ステップ 2807)。以下では、簡単のため、アドレス 7のノードをノード 7と称し、一般に、アドレス nのノードをノード nと称する。次に、システム 10は、図 30Bに示されるように、移動先の親ノード 6がマーキングされているかどうかをチェックすると（ステップ 2808)、ノード 6のフラグはマーキングされていないため（No)、親ノード 6のフラグにマークを付け（ステップ 2809)、さらに親ノードがあるかどうかを調べるためステップ 2807へ戻る。図 30Cに示されるように、ノード 6の親ノードはノード 0であり、このノード 0のフラグはマーキングされていないので (ステップ 2808、 No)、ノード 0のフラグにマークを付け（ステップ 2809)、親ノードがあるかどうかをチェックすると (ステップ 2807)、親ノードが存在しないため（No )、システム 10はステップ 2804へ進む。

[0134] システム 10は、図 31Aに示されるように、シンボル番号読み出しアドレスを次のアドレス 8へ移動し (ステップ 2805)、図 31Bに示されるように、読み出されたシンボル番号が 1に合致するか、又は、次のシンボル番号読み出しアドレスがなくなるまで、ステップ 2802、 2803、 2804、 2805を繰り返す。図 31C【こ示されるよう【こ、シンポノレ番号読み出しアドレス 11まで進むと、シンボル番号は 1に合致する（ステップ 2803)。

[0135] システム 10は、ステップ 2803で 1に合致するシンボル番号を見出したので (Yes)、図 32Aに示されるように、見出したノード 11のフラグにマークを付け (ステップ 2806) 、親子関係表現 C→Pを利用して、ノード 11の親ノードであるノード 9へ移動する (ステツプ 2807)。次に、システム 10は、図 32Bに示されるように、移動先の親ノード 9がマーキングされているかどうかをチェックすると（ステップ 2808)、ノード 9のフラグはマ一キングされていないため（No)、ノード 9のフラグにマークを付け (ステップ 2809)、さらに親ノードがあるかどうかを調べるためステップ 2807へ戻る。図 32Cに示されるように、ノード 9の親ノードはノード 8であり、ノード 8のフラグはマーキングされていないため（No)、ノード 8のフラグにマークを付け (ステップ 2809)、さらに親ノードがあるかどうかを調べるためステップ 2807へ戻る。ノード 8の親ノードはノード 0であり、図 32D に示されるように、ノード 0が既にマーキングされているかどうかを調べると (ステップ 2 808)、既にマーキングされているので (Yes)、ステップ 2804へ進む。現在のシンポル番号読み出しアドレス 11の次のアドレスがあるかどうかをチェックすると (ステップ 2 804)と、これ以上のアドレスは存在しないため（No)、マーキングが終了する。

[0136] フラグ領域の結果は、ノードの全数検索の結果としてそのまま利用することができる

[0137] さらに、システム 10は、図 33Aに示されるように、検索範囲として、検索前の頂点ノ一ドリストが指定されている場合、マーキングの終了後に、頂点ノードリストの各頂点ノードのフラグがマークされて!/、るかどうかをチェックし、マークされて!/、る頂点ノードを検索結果として、検索後の頂点ノードリストに格納する。頂点ノード 1は、図 33Aに示されるように、対応するフラグが 0であるため、ノード 1を頂点とする部分ツリーはボタン型ノードを含まないが、頂点ノード 6は、図 33Bに示されるように、対応するフラグが 1 であるため（すなわち、マークされているため）、ノード 6を頂点とする部分ツリーはボタン型ノードを含む。頂点ノード 8も同様にして、ボタン型ノードを含む部分ツリーの頂点ノードであることがわかる。したがって、図 33Cに示されるように、頂点ノード 6及び 8を含む頂点ノードリストが検索結果として生成される。 [0138] 上記の例では、シンボル番号が 1に合致するノードが検出されたとき、そのノードのすべての親ノードを迪つて、親ノードをマーキングしている力検索範囲として、子孫の段数が指定されている場合、例えば、直下の子ノードまで、孫ノードまでなどの条件が指定されて、る場合、「子→親」表現による親子関係を迪る段数が制約される。

[0139] さらに、ノード数が膨大になると、フラグ領域の初期化のために要する時間も増加するので、この初期化の時間を短縮するテクニックを提案する。システム立ち上げ直後のような初期化時には、整数要素からなるフラグ配列のすべてを 0で初期化する。システム動作時には、フラグ配列の要素がオーバーフローして 0に戻るまで初期化を行わない。例えば、フラグ配列を格納する領域が 32ビット整数であるならば、 2³²— 1回までの検索回数の範囲内では再度初期化をする必要がない。このとき、ヒットしたノードは、未使用の最小整数でマーキングする。すなわち、初回は 1であり、以降、 2、 3、 4のように増加する。したがって、頂点ノードリストが検索条件に合致しているかどうかのチェックは、マーキングに使用した値に一致するかどうかをチェックすればよい。

[0140] 尚、上記の例では、初期値は 0とした力 0以外の値でも構わな、。また、マーキングに使用する整数は、未使用であれば、最小の整数に限定されない。

[0141] [子孫のパス条件検索の方法 2：親→子でチェックする方法]

次に、親→子の順にチヱックを行う本発明の実施の形態にかかるパス条件検索方法 2について説明する。ノス条件検索方法 2を実行するコンピュータシステム 10の R AM14には、図 27Aに示されるように、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータが展開されている。ツリー型データ構造を構成するノード間の親子関係は、深さ優先の「子→親」による表現形式で構築される。パス条件検索方法 2は、深さ優先で連続番号が付与されたノードの親子関係を「子→親」関係に基づいて配列表現すると、あるノードの子孫ノードが連続領域に出現するという上述の優れた性質を利用する。また、各ノードは、例えば、図 2 6に示されるように、項目名情報であるノードタイプ (又は、シンボル番号）と、項目値情報であるノード値とが関連付けられて、る。

[0142] コンピュータシステム 10は、検索条件として、ノードのシンボル番号 = 1 (シンボル番号 1はボタン型を表す）という条件を設定する。さらに、システム 10は、検索範囲を表す少なくとも一つの部分ツリーを設定する。本例では、頂点ノード 1、 6、 8を含む頂点ノードリスト [1, 6, 8]が指定される。この検索条件と検索範囲は、例えば、ユーザがコンピュータシステム 10の入力装置 24を介して入力してもよぐ又は、外部記憶媒体 18から読み出してもよぐ或いは、 IZF22を介して外部力も設定してもよい。頂点ノードはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群を代表するノードである。

[0143] コンピュータシステム 10は、次に、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード及び Z又は当該頂点ノードの子孫ノードに関連付けられたノードタイプがボタン型と一致するかどうかを判定し、一致したノードが存在する場合に、当該頂点ノードに付与されたノード識別子を検索結果として保存する。

[0144] 図 34は、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法のフロ一チャートである。また、図 35A〜図 37Cは、本発明の一実施例にかかる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[0145] システム 10は、最初に、図 35Aに示されるように、頂点ノードリストから頂点ノードを読み出すためのアドレスを示すポインタを頂点ノードリストの先頭アドレスで初期化し ( ステップ 3401)、頂点ノードリストから先頭の頂点ノード 1を取り出す (ステップ 3402) 。次に、システム 10は、深さ優先の「子→親」による親子関係の表現を参照して、頂点ノード 1の子孫ノードを特定する (ステップ 3403)。一般に、深さ優先の「子→親」による親子関係の表現は上記の優れた性質を備えて!/、るので、特定ノードの子孫ノードは、この特定ノードに付与されたノード識別子が格納されて、る位置の次の位置から、この特定ノードに付与されたノード識別子の値以上の値が格納されて、る連続領域を抽出することにより特定することができる。本例では、 C→Pにおいて、ノード 1に付与されたノード識別子 0が格納されている次の位置から、このノード 1のノード識別子 1以上の値が格納されている位置までの連続領域、すなわち、ノード識別子 1、 2、 2、 1が格納されている領域力 Sノード 1の子孫ノードの範囲である。この領域は、ノード 2、ノード 3、ノード 4及びノード 5に付与されたノード識別子を格納する領域であるため、ノード 1の子孫ノードは、ノード 2、ノード 3、ノード 4及びノード 5であることがわかる [0146] 次に、システム 10は、特定された子孫ノードの中に、検索条件に合致するノード、すなわち、ノードタイプがボタン型であるノードが存在するかどうかをチェックする（ステツプ 3404)。本例の場合、図 35Bに示されるように、頂点ノード 1の子孫ノードの範囲にボタン型のノードは存在しないので、図 35Cに示されるように、検索結果の頂点ノードリストには何も登録せずに、システム 10はステップ 3405へ進む。本例の場合、頂点ノードリストに次の頂点ノード 6が存在するので (ステップ 3405で Yes)、システム 10はポインタを頂点ノード 6へ移動して（ステップ 3406)、ステップ 3402へ戻る。

[0147] 次に、システム 10は、図 36Aに示されるように、頂点ノードリストから頂点ノード 6を取り出し (ステップ 3402)、既に説明した子孫ノードの特定手法を用いて頂点ノード 6 の子孫ノードとしてノード 7を特定する（ステップ 3403)。続いて、システム 10は、図 3 6Bに示されるように、子孫ノード 7のノードタイプがボタン型であるかどうかをチェックし (ステップ 3404)、子孫ノード 7が検索条件に合致することを判定する (Yes)。したがって、システム 10は、図 36Cに示されるように、頂点ノード 6を検索結果である検索後の頂点ノードリストに登録し (ステップ 3407)、ステップ 3405へ進む。

[0148] 本例の場合、頂点ノードリストに次の頂点ノード 8が存在するので (ステップ 3405で Yes)、システム 10はポインタを頂点ノード 6へ移動して（ステップ 3406)、ステップ 34 02へ戻る。

[0149] 次に、システム 10は、図 37Aに示されるように、頂点ノードリストから頂点ノード 8を取り出し (ステップ 3402)、既に説明した子孫ノードの特定手法を用いて頂点ノード 8 の子孫ノードとしてノード 9、ノード 10及びノード 11を特定する（ステップ 3403)。続いて、システム 10は、図 37Bに示されるように、子孫ノードの中にノードタイプがボタン型であるかどうかをチェックし (ステップ 3404)、子孫ノード 11が検索条件に合致することを判定する（Yes)。したがって、システム 10は、図 37Cに示されるように、頂点ノード 8を検索結果である検索後の頂点ノードリストに登録し (ステップ 3407)、ステップ 3405へ進む。本例では、頂点ノードリストに次の頂点ノードが存在しないので、システム 10は検索処理を終了する。

[0150] 以上の検索処理によって、検索後の頂点ノードリスト [6, 8]が得られる。 [0151] 上記の説明では、頂点ノードの子孫ノードを特定する際に、すべての子孫ノードを特定している力例えば、例えば、子ノードまで、孫ノードまでのように、子孫の世代数を限定することによって検索範囲を限定することも可能である。

[0152] また、上記の例では、検索結果として頂点ノードリストを生成しているが、例えば、図 29A〜Cを参照して説明したようなフラグ領域を準備し、検索条件にヒットしたすべての子孫ノードのノード識別子を検索結果として生成することも可能である。

[0153] [祖先のパス条件による検索]

次に、本発明の実施の形態に力かる祖先のパス条件による検索方法を説明する。祖先のパス条件による検索とは、指定されたノードタイプを有するノードを祖先ノードとしてもつ頂点ノードを抽出する処理である。図 38A〜Cは、パス条件による検索の対象となるツリー型データ構造と、ノードの親子関係の「子→親」表現の説明図である。本例では、頂点ノードは、ノード 2、ノード 7及びノード 9であり、頂点ノードは黒塗りの星印（★)で示されてヽる。シンボル番号と表示図形とシンボル名の対応関係は、図 27Bに関して説明した通りである。本例では、頂点ノードの祖先ノードの条件を検索条件としてノード抽出を行う。より具体的には、祖先ノードにハート型のノードを含む頂点ノードを抽出する。

[0154] 本例では、親子関係は、深さ優先の「子→親」による表現形式で表されているが、幅優先の「子→親」による表現形式でも構わない。また、各ノードは、例えば、図 26に示されるように、項目名情報であるノードタイプ (又は、シンボル番号）と、項目値情報であるノード値とが関連付けられている。

[0155] コンピュータシステム 10は、検索条件として、ノードのシンボル番号 =3 (シンボル番号 3はハート形を表す）という条件を設定する。さらに、システム 10は、検索範囲を表す少なくとも一つの部分ツリーを設定する。本例では、頂点ノード 2、 7、 9を含む頂点ノードリスト [2, 7, 9]が指定される。この検索条件と検索範囲は、例えば、ユーザがコンピュータシステム 10の入力装置 24を介して入力してもよぐ又は、外部記憶媒体 18から読み出してもよぐ或いは、 IZF22を介して外部力も設定してもよい。頂点ノードはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群を代表するノードである。 [0156] コンピュータシステム 10は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの祖先ノードを特定し、当該頂点ノード又は当該頂点ノードの祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該頂点ノードに付与されたノード識別子を検索結果として保存する。

[0157] 図 39は、本発明の一実施例に力かる祖先のパス条件によるツリー検索方法のフロ一チャートである。また、図 40A〜図 42Cは、本発明の一実施例に力かる祖先のパス条件によるツリー検索方法の動作状態を説明する図である。

[0158] システム 10は、最初に、図 40Aに示されるように、頂点ノードリストから頂点ノードを読み出すためのアドレスを示すポインタを頂点ノードリストの先頭アドレスで初期化し ( ステップ 3901)、頂点ノードリストから先頭の頂点ノード 2を取り出す (ステップ 3902) 。次に、システム 10は、この頂点ノード 2に対応したシンボル番号 (Symbol No.)を読み出し (ステップ 3903)、このシンボル番号が 3であるかどうかをチェックする（ステップ 3 904)。頂点ノード 2のシンボル番号は 3ではないため（No)、システム 10はステップ 3 905へ進み、深さ優先の「子→親」による親子関係の表現を参照して、頂点ノード 2の親ノードがあるかどうかを判定し、この場合、図 40Bに示されるように、親ノード 1が存在するので (Yes)、システム 10は、親ノード 1に対応したシンボル番号を読み出す（ステップ 3906)。ノード 1に関連付けられたシンボル番号は 5であり、検索条件に合致しないので (ステップ 3907, No)、システム 10は、ステップ 3905へ戻り、ノード 1の親ノードが存在するかどうかをチェックする。この場合、図 40Cに示されるように、ノード 1 の親ノード 0が存在し (Yes)、システム 10は、ノード 0に対応したシンボル番号を読み出す (ステップ 3906)。ノード 0に関連付けられたシンボル番号は 2であり、検索条件に合致しないので (ステップ 3907, No)、システム 10は、ステップ 3905へ戻り、ノード 0の親ノードが存在するかどうかをチェックする。ノード 0はルート'ノードであり、親ノードが存在しないため（No)、システム 10はステップ 3909へ進む。

[0159] 頂点ノードリストには次の頂点ノード 7が存在するので、システム 10は、図 41Aに示されるように、頂点ノードリストから頂点ノードを読み出すためのアドレスを示すポインタを頂点ノードリストの次のアドレスへ移動し (ステップ 3910)、頂点ノードリストから 2 番目の頂点ノード 7を取り出す (ステップ 3902)。次に、システム 10は、この頂点ノード 7に対応したシンボル番号を読み出し (ステップ 3903)、このシンボル番号が 3であるかどうかをチェックする（ステップ 3904)。頂点ノード 7のシンボル番号は 3ではないため（No)、システム 10はステップ 3905へ進み、深さ優先の「子→親」による親子関係の表現を参照して、頂点ノード 7の親ノードがあるかどうかを判定し、この場合、図 4 1Bに示されるように、親ノード 6が存在するので (Yes)、システム 10は、親ノード 6に対応したシンボル番号を読み出す (ステップ 3906)。ノード 6に関連付けられたシンボル番号は 3であり、検索条件に合致するので (ステップ 3907, Yes)、システム 10は、ステップ 3908へ進み、図 41Cに示されるように、現在のポインタが指し示す頂点ノード 7を検索結果として検索後の頂点ノードリストに登録する。頂点ノード 7が登録されたため、これ以上親ノードを迪る必要がないので、システム 10はステップ 3909へ進む。

頂点ノードリストには次の頂点ノード 9が存在するので、システム 10は、図 42Aに示されるように、頂点ノードリストから頂点ノードを読み出すためのアドレスを示すポインタを頂点ノードリストの次のアドレスへ移動し (ステップ 3910)、頂点ノードリストから 3 番目の頂点ノード 9を取り出す (ステップ 3902)。次に、システム 10は、この頂点ノード 9に対応したシンボル番号を読み出し (ステップ 3903)、このシンボル番号が 3であるかどうかをチェックする（ステップ 3904)。頂点ノード 9のシンボル番号は 3ではないため（No)、システム 10はステップ 3905へ進み、深さ優先の「子→親」による親子関係の表現を参照して、頂点ノード 9の親ノードがあるかどうかを判定し、この場合、図 4 2Bに示されるように、親ノード 8が存在するので (Yes)、システム 10は、親ノード 8に対応したシンボル番号を読み出す (ステップ 3906)。ノード 8に関連付けられたシンボル番号は 3であり、検索条件に合致するので (ステップ 3907, Yes)、システム 10は、ステップ 3908へ進み、図 42Cに示されるように、現在のポインタが指し示す頂点ノード 9を検索結果として検索後の頂点ノードリストに登録する。頂点ノード 9が登録されたため、これ以上親ノードを迪る必要がないので、システム 10はステップ 3909へ進む。頂点ノードリストには次の頂点ノードが存在しないため（ステップ 3909, No)、システム 10は検索処理を終了する。 [0161] 以上の検索処理によって、検索後の頂点ノードリスト [7, 9]が得られる。

[0162] 上記の説明では、頂点ノードの祖先ノードを迪る際に、すべての祖先ノードを探索しているが、祖先の世代数を限定することによって検索範囲を限定することも可能である。

[0163] また、上記の例では、検索結果として頂点ノードリストを生成しているが、例えば、図 29A〜Cを参照して説明したようなフラグ領域を準備し、検索条件にヒットしたすべての子孫ノードのノード識別子を検索結果として生成することも可能である。

[0164] [値条件による検索]

ここまでは、パス条件による検索について説明したが、本発明は値条件による検索を実施することが可能である。値条件による検索とは、指定された項目値情報 (例えば、ノード値）が関連付けられたノードを抽出する処理である。例えば、図 26に示されるように、項目名情報 (例えば、ノードタイプ）と項目値情報 (例えば、ノード値）は、ノードに対して同じように関連付けられているので、パス条件による検索、すなわち、ノードタイプを条件とする検索のアルゴリズムは、値条件による検索、すなわち、ノード値を条件とする検索に適用できることが明らかである。

[0165] さらに、アプリケーションによっては、すべてのノードが同じノードタイプに関連付けられる場合がある。このようなケースでは、各ノードにノードタイプを関連付ける必要がなくなるので、ノードにはノード値だけが関連付けられ、値条件による検索だけが行われる。例えば、本発明のツリー型データ構造が、プログラミング言語の構文解析に適用される場合、ノードの実体的な値は、分離されたトークン文字列だけであるため、ノードには、この文字列だけが関連付けられ、ノードタイプは使用されない。

[0166] [組み合わせ検索]

既に説明したように、検索でヒットしたノードを頂点ノードで代表させることが可能であり、検索の結果をこの頂点ノードのリスト、すなわち、頂点ノードリストで表現することができる。例えば、あるツリー型データ構造のデータを独立した第 1の検索条件と第 2 の検索条件の二つの検索条件で検索した結果をそれぞれ第 1の頂点ノードリストと第 2の頂点ノードリストで表す場合を考える。このとき、第 1の頂点ノードリストと第 2の頂点ノードリストとの間で上記論理積 (AND)集合演算を実行すると、第 1の検索条件と第 2の検索条件の両方を満たす検索結果を表す頂点ノードリストが得られる。

[0167] より具体的に、図 27Aのツリー型データ構造のデータに対して、頂点ノードリスト [1 , 6, 8]を検索範囲として、検索条件 1 =「子孫にボタン型 (シンボル番号 = 1)のノードが存在する頂点ノード」及び検索条件 2=「子孫に変形四角型 (シンボル番号 =4) のノードが存在する頂点ノード」を検索条件として、検索を実行する例を考える。

[0168] 検索条件 1による検索の結果は、図 28乃至 33を参照して説明したように、頂点ノードリスト 1 = [6, 8]である。また、検索条件 2についても検索条件 1と同様の検索を実行すると、検索の結果は、頂点ノードリスト 2= [1, 8]であることがわかる。さらに、検索条件 3= (検索条件 1)AND (検索条件 2)を検索条件として、すなわち、検索条件 3=「子孫にボタン型のノードと変形四角型のノードが存在する頂点ノード」を検索条件として、同様に検索を実行すると、検索の結果は、頂点ノードリスト 3= [8]である。

[0169] 一方、頂点ノードリスト 1 = [6, 8]と頂点ノードリスト 2= [1, 8]の論理積演算を実行すると、頂点ノードリスト 1と頂点ノードリスト 2は共に正規部分ツリー群であるので、（頂点ノードリスト 1) AND (頂点ノードリスト 2) = [8] =頂点ノードリスト 3であることがわかる。

[0170] このように、本発明によれば、複数の検索条件の論理積を検索条件とする検索の結果は、各検索条件による検索の結果の頂点ノードリストの論理積演算によって得られる。さらに、論理積の代わりに論理和を用いても同様に、複数の検索条件の論理和を検索条件とする検索の結果は、各検索条件による検索の結果の頂点ノードリストの論理和演算によって得られる。

[0171] [ツリーデータ集計の概要]

ツリーデータの集計は、一般に、ツリーのある範囲のノードに関連付けられた項目値情報を項目名情報ごとに分類して集計する。集計には、集計の測度である項目値情報の個数のカウント、或いは、合計値、平均値、最大値、最小値などの計算のように様々な処理が含まれる。集計の対象である測度は、例えば、ノードに関連付けられた特定のノードタイプに対応したノード値である。集計の範囲は、例えば、部分ツリー群であり、部分ツリーの頂点ノードのリスト、すなわち、頂点ノードリストによって指定できる。集計の分類対象である次元は、例えば、ノードに関連付けられた特定のノードタイプに対応したノード値である。

[0172] 図 43A、 Bは、本発明の一実施例に力かる集計を説明するための図であり、図 43A は集計の対象となるツリー型データ構造とノードの親子関係の「子→親」表現の説明図であり、図 43Bはシンボル番号と表示図形とシンボル名の対応関係を表す図である。図 43A、 Bに示された例を参照して、 2種類のツリーデータ集計を説明する。

[0173] 第 1のツリーデータ集計とは、例えば、メーカ名（次元)ごとに、重量 (測度）の件数と合計を算出することである。そして、集計の範囲を指定するために、この例では、頂点ノードリスト = [1, 6, 8]が使用される。勿論、集計の範囲は、ツリー全体でも構わない。

[0174] 上記の例では、次元を指定して!/、るが、ツリーデータ集計では次元を指定しな、集計、すなわち、第 2のツリーデータ集計も考えられる。例えば、頂点ノードリストを指定し、頂点ノードごとに測度を集計することができる。第 2のツリーデータ集計は、この頂点ノード、すなわち、部分ツリーを明示的に指定するタイプの集計である。第 2のッリ一データ集計は、図 43A、 Bの例では、頂点ノードリスト = [1, 6, 8]を指定し、頂点ノード 1、頂点ノード 6及び頂点ノード 8のそれぞれについて、頂点ノードで表された部分ツリーに含まれるノードに関連付けられた重量 (測度)の件数と合計を算出する。

[0175] [第 1のツリーデータ集計]

次に、第 1のツリーデータ集計を詳細に説明する。この集計は、集計の対象 =測度、集計の範囲 =カテゴリ、集計の分類対象 =次元を指定して集計を行う。

[0176] ツリー型データ構造のデータは、図 43Aに示されるように、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含み、集計を行うコンピュータシステム 10の記憶装置、例えば、 RAM14に展開されている。ノード間の親子関係は、ルート'ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付けることにより定義される。各ノードはデータを表す少なくとも一つの実体情報が関連付けられている。また、頂点ノードはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群を代表するノードである。 [0177] コンピュータシステム 10は、集計の分類対象を表す項目名情報を指定し、集計の対象を表す項目名情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定する。集計の分類対象、集計の対象、及び、集計の範囲は、例えば、ユーザがコンピュータシステム 10の入力装置 24を介して入力してもよぐ又は、外部記憶媒体 18から読み出してもよぐ或いは、 IZF22を介して外部力も設定してもよい。

[0178] 次に、コンピュータシステム 10は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード又は当該頂点ノードの子孫ノードに関連付けられた項目名情報が集計の対象を表す項目名情報と一致するかどうかを判定し、一致したノードに関連付けられた項目値情報を、当該頂点ノードによって代表されたノード群に関係した集計の分類対象を表す項目名情報に関連付けられた項目値情報毎に集計する。

[0179] 第 1のツリーデータ集計の一実施例では、頂点ノードリストと次元と測度を指定して、頂点ノードリストで指定される範囲のノードに存在している次元値、測度を集計する。この場合、ある頂点ノードで指定される範囲（すなわち、部分ツリー）に同じ次元の次元値が関連付けられたノードが複数個存在する場合、測度がどの次元値に属するかを別途指定する必要がある。そこで、以下の例では、簡単のため、「部分ツリー内に同じ次元の次元値が関連付けられた複数のノードが存在する場合には集計を行わな、」 t 、う規則を適用することにする。

[0180] 図 43Aに示された例を参照して、次元と集計実施可能性との関係を詳述する。図 4 4A〜Dは、図 43Aの各頂点ノードによって代表される部分ツリーの説明図である。ここで、メーカ名（次元)ごとに、重量 (測度)の件数と合計を算出する集計を行うことを考える。

[0181] 図 44Aは、頂点ノード 1によって代表される部分ツリー 1を表し、ノード 2とノード 5の二つのノードに次元であるメーカ名が関連付けられて、るので、ノード 1とノード 3に関連付けられた重量がどのメーカ名に属しているかを特定できない。したがって、部分ツリー 1に対する集計は実施しな、。

[0182] 図 44Bは、頂点ノード 6によって代表される部分ツリー 2を表している。この部分ッリ一 2には、次元であるメーカ名が関連付けられたノードは存在しないが、測度である重量が関連付けられたノード 7が存在する。このように、次元が存在しない場合には、次元値が NULL値であるとして、集計を実施することにする。

[0183] 図 44Cは、頂点ノード 8によって代表される部分ツリー 3を表している。この部分ッリ一 3には、次元であるメーカ名が関連付けられたノード 10が存在し、測度である重量が関連付けられたノード 9及びノード 11が存在する。このように、次元が 1個だけ存在し、 1個以上の測度が存在する部分ツリーの場合、各測度がどの次元値に属するかを特定できるので、唯一の次元値について、 1個以上の測度を集計する。

[0184] 以上の規則に従って、メーカ名（次元)ごとに、重量 (測度)の件数と合計を集計すると、図 44Dに示されるような集計結果が得られる。すなわち、メーカ名 =「NULL」に対応した重量は、ノード 7に関連付けられた重量 1件であり、その重量の合計 =「ノード 7に関連付けられたノード値」である。また、メーカ名 =「ノード 10に関連付けられたノード値」に対応した重量は、ノード 9とノード 11に関連付けられた重量 2件であり、その重量の合計 =「ノード 9に関連付けられたノード値 +ノード 11に関連付けられたノード値」である。

[0185] 図 45は、本発明の一実施例に力かる第 1のツリーデータ集計方法のフローチャートである。また、図 46乃至 48は、本発明の一実施例に力かる第 1のツリーデータ集計方法の動作状態を説明する図である。

[0186] システム 10は、最初に、図 46に示されるように、頂点ノードリストから頂点ノードを読み出すためのアドレスを示すポインタを頂点ノードリストの先頭アドレスで初期化し (ステツプ 4501)、頂点ノードリストから先頭の頂点ノード 1を取り出す (ステップ 4502)。次に、システム 10は、深さ優先の「子→親」による親子関係の表現を参照して、頂点ノード 1の部分ツリーを特定する (ステップ 4504)。一般に、深さ優先の「子→親」による親子関係の表現は上記の優れた性質を備えているので、部分ツリーは、頂点ノードに付与されたノード識別子が格納されて、る位置の次の位置から、この頂点ノードに付与されたノード識別子の値以上の値が格納されている連続領域を抽出することにより特定することができる。本例では、 C→Pにおいて、ノード 1に付与されたノード識別子 0が格納されている位置から、このノード 1のノード識別子 1以上の値が格納されている位置までの連続領域、すなわち、ノード識別子 0, 1、 2、 2、 1が格納されている領域が頂点ノード 1によって表される部分ツリーである。この領域は、ノード 1、ノード 2、ノード 3、ノード 4及びノード 5に付与されたノード識別子を格納する領域であるため、部分ツリーは、ノード 1、ノード 2、ノード 3、ノード 4及びノード 5であることがわかる（図 46の※ 1)。

[0187] 次に、システム 10は、特定された部分ツリーの中で、測度（=重量）と次元（=メ一力名）に関連付けられているノードを特定する (ステップ 4504)。本例では、ノード 1のノードタイプは重量であり、ノード 2のノードタイプはメーカ名であり、ノード 3のノードタィプは重量であり、ノード 4のノードタイプは価格であり、ノード 5のノードタイプはメー力名である（図 46の※ 2)。したがって、本例では、測度が 2個存在し、次元も 2個存在する。システム 10は、測度の個数力 ^個であるかどうかを判定すると (ステップ 450

5)、測度の個数は 0個ではないことがわ力り（No)、次に、次元の個数が 2個以上であるかどうかを判定する（ステップ 4506)。次元の個数は 2個以上であり（Yes)、この部分ツリーは集計の対象外であるため、システム 10は、次の頂点ノードが存在するかどうかを判定する (ステップ 4511)。本例の場合、頂点ノードリストに次の頂点ノード 6 が存在するので (Yes)、システム 10はポインタを頂点ノード 6へ移動して (ステップ 45 12)、ステップ 4502へ戻る。

[0188] 次に、システム 10は、図 47に示されるように、頂点ノードリストから頂点ノード 6を取り出し (ステップ 4502)、既に説明した方法と同様に頂点ノード 6で代表される部分ッリーを特定すると (ステップ 4503)、この部分ツリーにノード 6及びノード 7が属していることわかる（図 47の※ 1)。

[0189] 次に、システム 10は、特定された部分ツリーの中で、測度（=重量）と次元（=メ一力名）に関連付けられているノードを特定する (ステップ 4504)。本例では、ノード 6のノードタイプは価格であり、ノード 7のノードタイプは重量である（図 47の※ 2)。したがつて、本例では、測度が 1個存在し、次元は 0個である。システム 10は、測度の個数力 SO個であるかどうかを判定すると (ステップ 4505)、測度の個数は 0個ではないことがわかり（No)、次に、次元の個数が 2個以上であるかどうかを判定する（ステップ 45

06)。次元の個数は 2個以上ではなく（No)、次元の個数が 1個であるかどうかを判定すると (ステップ 4507)、次元の個数が 1個ではないため（No)、次元値を NULL値とみなし (ステップ 4508)、測度を集計する (ステップ 4510)。本例では、頂点ノード 6 で代表される部分ツリーの重量の件数は 1件であり、重量の合計は、ノード 7に関連付けられたノード値の値である（図示されない)。さらに、システム 10は、次の頂点ノードが存在するかどうかを判定する (ステップ 4511)。本例の場合、頂点ノードリストに次の頂点ノード 8が存在するので (Yes)、システム 10はポインタを頂点ノード 8へ移動して（ステップ 4512)ゝステップ 4502へ戻る。

[0190] 次に、システム 10は、図 48に示されるように、頂点ノードリストから頂点ノード 8を取り出し (ステップ 4502)、既に説明した方法と同様に頂点ノード 8で代表される部分ッリーを特定すると (ステップ 4503)、この部分ツリーにノード 8、ノード 9、ノード 10及びノード 11が属して、ることわかる（図 48の※ 1)。

[0191] 次に、システム 10は、特定された部分ツリーの中で、測度（=重量）と次元（=メ一力名）に関連付けられているノードを特定する (ステップ 4504)。本例では、ノード 8のノードタイプは価格であり、ノード 9のノードタイプは重量であり、ノード 10のノードタイプはメーカ名であり、ノード 11のノードタイプは重量である（図 48の※ 2)。したがって、本例では、測度が 2個存在し、次元が 1個存在する。システム 10は、測度の個数が 0個であるかどうかを判定すると (ステップ 4505)、測度の個数は 0個ではないことがわかり（No)、次に、次元の個数が 2個以上であるかどうかを判定する（ステップ 4506 )。次元の個数は 2個以上ではなく（No)、次元の個数が 1個であるかどうかを判定すると (ステップ 4507)、次元の個数が 1個であるため（Yes)、ノード 10に関連付けられたノード値を次元値として (ステップ 4509)、測度^^計する（ステップ 4510)。本例では、頂点ノード 8で代表される部分ツリーの重量の件数は 2件であり、重量の合計は、ノード 9に関連付けられたノード値の値と、ノード 11に割り当てられたノード値の値との合計である（図示されない)。

[0192] さらに、システム 10は、次の頂点ノードが存在するかどうかを判定する（ステップ 45 11)。本例の場合、頂点ノードリストにこれ以上頂点ノードが存在しないため（No)、システム 10は、部分ツリー毎に得られた集計結果を統合する (ステップ 4513)。本例では、集計の次元値は、 NULL値と、ノード 10に割り当てられたメーカ名（ノード 10に関連付けられたノード値)であり、 NULL値に対応する重量の件数は 1件であり、重量の合計は、ノード 7〖こ割り当てられた重量 (ノード 7〖こ関連付けられたノード値)であり、ノード 10に割り当てられたメーカ名に対応する重量の件数は 2件であり、重量の合計は、ノード 9〖こ関連付けられたノード値の値と、ノード 11に割り当てられたノード値の値との合計である。以上の処理により、本発明の一実施例による第 1のッリーデータ集計方法が終了する。

[0193] 上記の説明では、頂点ノードによって代表される部分ツリーを特定する際に、すべての子孫ノードを特定している力例えば、例えば、子ノードまで、孫ノードまでのように、子孫の世代数を限定することによって集計範囲を限定することも可能である。

[0194] また、上記の例では、ノード間の親子関係が深さ優先モードで表現されているが、幅優先モードで表現し、そこ力部分ツリーを特定しても構わな、。

[0195] [第 2のツリーデータ集計]

次に、次元を指定しない第 2のツリーデータ集計方法をより詳しく説明する。

[0196] ツリー型データ構造のデータは、図 43Aに示されるように、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含み、集計を行うコンピュータシステム 10の記憶装置、例えば、 RAM14に展開されている。ノード間の親子関係は、ルート'ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付けることにより定義される。各ノードはデータを表す少なくとも一つの実体情報が関連付けられている。また、頂点ノードはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群を代表するノードである。

[0197] コンピュータシステム 10は、集計の分類対象を表す項目名情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定する。集計の分類対象、及び、集計の範囲は、例えば、ユーザがコンピュータシステム 10の入力装置 24を介して入力してもよぐ又は、外部記憶媒体 18から読み出してもよぐ或いは、 IZF22を介して外部力も設定してもよい。

[0198] 次に、コンピュータシステム 10は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード及び Z又は当該頂点ノードの子孫ノードに関連付けられた項目名情報が集計の対象と一致するかどうかを判定し、一致したノードに関連付けられた項目値情報を集計する。

[0199] 図 43A、 Bの例では、第 2のツリーデータ集計方法は、頂点ノードリスト = [1, 6, 8] を指定し、頂点ノード 1、頂点ノード 6及び頂点ノード 8のそれぞれについて、頂点ノードで表された部分ツリーに含まれるノードに関連付けられた重量 (測度)の件数と合計を算出する。図 49は本発明の一実施例に力かる第 2のツリーデータ集計方法のフローチャートであり、図 50A〜Dはこの第 2のツリーデータ集計方法の動作状態の説明図である。

[0200] 図 49に示されるように、第 2のツリーデータ集計方法は、図 45に示された第 1のッリ一データ集計方法と類似した動作を実行するが、次元を定義しないため、次元についての処理は省略され、また、部分ツリー毎の集計結果を統合する処理も省かれている。

[0201] システム 10は、頂点ノードリストから頂点ノードを取り出し、その部分ツリーを特定すること〖こより（図 49のステップ 4902、ステップ 4903)、図 50A、 B及び Cに示されるような部分ツリー 1、部分ツリー 2及び部分ツリー 3を特定し、それぞれの部分ツリーについて、重量の件数と重量の合計を算出する（ステップ 4906)。図 50Dには、頂点ノード毎の集計結果が示されて、る。

[0202] 上記の説明では、頂点ノードによって代表される部分ツリーを特定する際に、すべての子孫ノードを特定している力例えば、例えば、子ノードまで、孫ノードまでのように、子孫の世代数を限定することによって集計範囲を限定することも可能である。

[0203] また、上記の例では、ノード間の親子関係が深さ優先モードで表現されているが、幅優先モードで表現し、そこ力部分ツリーを特定しても構わな、。

[0204] [ツリーデータソートの概要]

本発明に力かるツリーデータのソート処理は、記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータの少なくとも二つのノード群 (ノードの集まり、例えば、部分ツリー）に順序を付ける処理である。以下では、簡単のため、ノード群が部分ツリーである場合について説明する。 [0205] 本発明のツリーデータのソート処理は、個々の部分ツリーに関連付けられたある指標 (比較基準値)を収集し、次に、この指標に順序関係を付けることにより、部分ッリ一自体に順序を付けることにより実現される。

[0206] ソート処理は、指標の収集の仕方によって二通りに大別できる。第 1のツリーデータソート方法は、集計の結果を利用する方法である。例えば、上記の第 2のッリーデ一タ集計方法では、部分ツリー毎に集計結果が収集されている。したがって、例えば、図 50A〜Dの例において、部分ツリー 1〜3を「重量の件数」の多い順に並べることが要求された場合、図 50Dに示された「重量の件数」を指標として用いると、この指標の大小関係に応じて、部分ツリー 1〜3に順序関係を定義することができ、すなわち、部分ツリー 1〜3をソートすることができる。

[0207] これに対して、第 2のツリーデータソート方法は、集計結果を利用するのではなぐ部分ツリーのノードに関連付けられた情報をそのまま指標として利用して、部分ツリーに順序関係を定義する。第 2のツリーデータソート方法は、例えば、図 50A〜Dの例では、部分ツリーの中で、ノードタイプが「価格」であるノードのノード値、すなわち、「価格の値」の順に部分ツリーをソートする。

[0208] [第 1のツリーデータソート]

本発明の一実施例に力かる第 1のツリーデータソート方法は、例えば、図 43Aに示されるようなツリー型データ構造のデータの頂点ノード 1、頂点ノード 6及び頂点ノード 8でそれぞれ表される部分ツリー 1 (図 50A)、部分ツリー 2 (図 50B)及び部分ツリー 3 (図 50C)を重量の件数を指標としてソートする。

[0209] コンピュータシステム 10の記憶装置、例えば、 RAM14には、ルート'ノードとルート •ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータが展開されている。ノード間の親子関係は、図 43Aに示されるように、ルート'ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート ·ノードの各々に付与されたノード識別子に非ルート ·ノードの各々の親ノードに付与されたノード識別子を関連付けることにより表現されている。各ノードはデータの項目を表す項目名情報 (例えば、ノードタイプ）とデータの項目値を表す項目値情報 (例えば、ノード値)とが関連付けられ、各ノード群 (例えば、部分ツリー 1、部分ツリー 2及び部分ツリー 3)は当該ノード群を代表する頂点ノード (例えば、頂点ノード 1、頂点ノード 6及び頂点ノード 8)及び当該頂点ノードの子孫ノードを含む。

[0210] コンピュータシステム 10は、集計の対象を表す項目名情報 (例えば、ノードタイプ = 「重量」）を指定し、集計の範囲を表す少なくとも二つの頂点ノード (例えば、頂点ノード 1、頂点ノード 6及び頂点ノード 8を含む頂点ノードリストを指定する。集計の対象、及び、集計の範囲は、例えば、ユーザがコンピュータシステム 10の入力装置 24を介して入力してもよく、又は、外部記憶媒体 18から読み出してもよぐ或いは、 I/F22 を介して外部力も設定してもよ!/、。

[0211] 次に、コンピュータシステム 10は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード又は当該頂点ノードの子孫ノードに関連付けられた項目名情報が集計の対象と一致するかどうかを判定し、一致したノードに関連付けられた項目値情報を集計する。この集計は、例えば、図 49および図 50A〜Dを参照して説明した上記の第 2のツリーデータ集計方法を実行する。図 51A〜Cは、本発明の一実施例に力かる第 1のツリーデータソート方法の説明図であり、図 51Aには、第 2のツリーデータ集計方法を実行することにより得られた比較基準値の収集結果が示されている。本例では、頂点ノード毎の重量の件数が比較基準値の収集結果である。

[0212] 次に、コンピュータシステム 10は、頂点ノード毎に集計された項目値情報の順序関係に従って当該少なくとも二つの頂点ノードに順序を付けることにより、当該頂点ノードによって代表されるノード群に順序を付ける。本例では、頂点ノード 1に対応する重量の件数である 2と、頂点ノード 6に対応する重量の件数である 1と、頂点ノード 8に対応する重量の件数である 2を、昇順に並べ換えることにより、頂点ノードに順序が付けられる。この順序付けにより、頂点ノードは、頂点ノード 6、頂点ノード 1、頂点ノード 8 の順に並べられる。例えば、比較基準値が一致する場合には、元の頂点ノードの順番を保存して頂点ノードの順序付けを行う。図 51Bは、このようにして得られた比較基準値のソート結果である。頂点ノードに順序を付けることにより、図 51Cに示されるように、これらの頂点ノードによって代表される部分ツリーに順序を付けることができる。

[0213] 上記の説明では、頂点ノードによって代表される部分ツリーを特定する際に、すべての子孫ノードを特定している力例えば、例えば、子ノードまで、孫ノードまでのように、子孫の世代数を限定することによって集計範囲を限定することも可能である。

[0214] また、上記の例では、ノード間の親子関係が深さ優先モードで表現されているが、幅優先モードで表現し、そこ力部分ツリーを特定しても構わな、。

[0215] [第 2のツリーデータソート]

次に、本発明の一実施例にかかる第 2のツリーデータソート方法について説明する。図 52A〜Cは、本発明の一実施例に力かる第 2のツリーデータソート方法の処理の対象となるツリー型データ構造及びノードの親子関係の「子→親」表現（図 52A)と、ノードタイプ毎のノード値のリスト（図 52B)と、ノードに関連付けられたノードタイプ及びノード値 (図 52C)と、を説明する図である。頂点ノードは黒塗りの星印（★)で示されている。本例では、各ノードの項目名情報であるノードタイプは、シンボル番号（= Symbol No. )によって表される。図形とシンボル番号との対応関係は、図 43Bに示されている。

[0216] 本例では、各ノードの項目値情報であるノード値は、シンボル番号と値番号（ = VN o)を組み合わせて表される。シンボル番号毎に、すなわち、ノードタイプ毎に、そのノードタイプが表す項目の値が昇順 (又は降順）に配置された値リスト（=VL)が設けられる。値番号は、値リストへのポインタであり、例えば、ノード Xにシンボル番号 iと値番号 jが関連付けられている場合、ノード Xのノード値は、シンボル番号 iに固有の値リストの j番目の要素を参照することによって取得できる（例えば、先頭の要素が 0番目の要素であるとする）。このような値番号と値リストの組み合わせによって実際の値を指定する方式は、本願発明者によって提案されている（例えば、国際公開第 WOOOZ 10103号パンフレットを参照のこと）。

[0217] 例えば、図 52A〜Cに示されたツリーデータにおいて、頂点ノード 1、頂点ノード 6 及び頂点ノード 8によって代表される部分ツリーをそれぞれ部分ツリー 1、部分ツリー 2及び部分ツリー 3とする。各部分ツリーに属する価格の値を参照するためには、最初に、各部分ツリーに属するノードの中で、ノードタイプ =「価格」に関連付けられたノードを特定し、次に、特定されたノードに関連付けられたノード値を参照することが必要である。部分ツリー 1には、ノード 1、ノード 2、ノード 3、ノード 4及びノード 5が属している。これらのノードの中で、ノードタイプが「価格」であるノードには、シンボル番号 =

「2」が関連付けられている。同図の例では、ノード 4はシンボル番号 =「2」が関連付けられている。よって、ノード 4はノードタイプ =「価格」である。次に、ノード 4の価格の値を参照するため、最初に、ノード 4に関連付けられた値番号を参照すると、値番号 =「3」である。したがって、ノード 4〖こ関連付けられたノード値は、シンボル番号 =「2」に対応した値リスト、すなわち、（価格) VLの値番号 3に対応した要素 (すなわち、先頭力 4番目の要素）である。本例では、（価格) VLの値番号 3に対応した要素は「2 00」である。このようにして、ノード 4に関連付けられたノード値が取得される。

[0218] コンピュータシステム 10の記憶装置、例えば、 RAM14には、図 52A〜Cに示されるように、ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むッリ一型データ構造のデータが展開されている。ノード間の親子関係は、ルート'ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付けることにより定義される。各ノードはデータを表す少なくとも一つの実体情報が関連付けられ、各ノード群は当該ノード群を代表する頂点ノードである特定のノード及び当該特定のノードの子孫ノードを含む。

[0219] 次に、コンピュータシステム 10は、順序付けの対象となる少なくとも二つのノード群を表す頂点ノードを指定し、順序付けの指標となる項目名情報を指定する順序付けの対象 (例えば、頂点ノードリスト）、及び、順序付けの指標（例えば、ノードタイプ）は、例えば、ユーザがコンピュータシステム 10の入力装置 24を介して入力してもよぐ又は、外部記憶媒体 18から読み出してもよぐ或いは、 IZF22を介して外部カも設定してちよい。

[0220] 次に、コンピュータシステム 10は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード又は当該頂点ノードの子孫ノードの中で、順序付けの指標となる項目名情報が関連付けられたノードに関連付けられた項目値情報を取得する。図 52A〜Cの例では、上記の方法でノード値を取得すればよい。

[0221] さらに、コンピュータシステム 10は、頂点ノード毎に取得された項目値情報の順序関係（例えば、取得されたノード値の大小関係）に従って当該少なくとも二つの頂点ノードに順序を付けることにより、当該頂点ノードによって代表されるノード群 (例えば、部分ツリー）に順序を付ける。

[0222] 次に、ノード値の取得と部分ツリーの順序付けについてより詳細に説明する。図 53 は、本発明の一実施例に力かる第 2のツリーデータソート方法のフローチャートである。コンピュータシステム 10は、頂点ノードリスト及び指標を指定し (ステップ 5301)、作業用領域を初期化する (ステップ 5302)。続いて、コンピュータシステム 10は、頂点ノ一ドリスト（= [1, 6, 8])の各頂点ノードについて、順序付けの指標値（=価格の値）に対応した値番号を取得する（ステップ 5303)。続いて、コンピュータシステム 10は、各頂点ノードについて取得された値番号の出現回数をカウントし (ステップ 5304)、さらに、値番号毎にカウントされた出現回数を累計数化する (ステップ 5305)。最後に、コンピュータシステム 10は、頂点ノードリスト中の各頂点ノードを、累計数に基づいて、各頂点ノードに対応した値番号の順番にソートする (ステップ 5306)。尚、値番号の順序 (昇順又は降順）はソートの順番に対応して、る。

[0223] 図 54乃至 62は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態を説明する図である。

[0224] コンピュータシステム 10は、図 54に示されるように、ソート前頂点ノードリスト = [1, 6, 8]を指定し (ステップ 5301)、このソート前頂点ノードリストと同じサイズの一時的値番号格納領域 Tmp—VNo、及び、ソート後頂点ノードリスト格納領域を用意し、また、価格の値リスト VLと同じサイズのカウント領域 Countを用意する（ステップ 5302)

[0225] 次に、コンピュータシステム 10は、図 55に示されるように、頂点ノードリストから 1番目の頂点ノード 1を取り出し、頂点ノード 1に対応した部分ツリーを特定する（図 55の ※ェ）。次に、コンピュータシステム 10は、部分ツリーの中で、シンボル番号 = 2であるノード (すなわち、ノードタイプ力 ^価格」であるノード)を特定し、その特定されたノードに関連付けられた値番号 VNoである「3」を、 Tmp— VNoの 1番目の領域に格納する（図 55の※ 2)。次に、コンピュータシステム 10は、図 56に示されるように、頂点ノードリストから 2番目の頂点ノード 6を取り出し、頂点ノード 6に対応した部分ツリーを特定する（図 56の※ 1)。次に、コンピュータシステム 10は、部分ツリーの中で、シンボル番号 = 2であるノード (すなわち、ノードタイプが「価格」であるノード)を特定し、その特定されたノードに関連付けられた値番号 VNoである「2」を、 Tmp— VNoの 2番目の領域に格納する（図 56の※ 2)。次に、コンピュータシステム 10は、図 57に示されるように、頂点ノードリストから 3番目の頂点ノード 8を取り出し、頂点ノード 8に対応した部分ツリーを特定する（図 57の※ 1)。次に、コンピュータシステム 10は、部分ツリーの中で、シンボル番号 = 2であるノード（すなわち、ノードタイプが「価格」であるノード )を特定し、その特定されたノードに関連付けられた値番号 VNoである「1」を、 Tmp VNoの 3番目の領域に格納する（図 57の※ 2)。これにより、コンピュータシステム 1 0は頂点ノードに関連した値番号を取得できる (ステップ 5303)。

[0226] コンピュータシステム 10は、次に、頂点ノードリストに対応した Tmp— VNoに格納された値番号の出現回数 (存在数)をカウントする (ステップ 5304)。図 58に示されるように、頂点ノードリストの先頭の要素 =頂点ノード 1に対応した Tmp— VNoの要素 T mp-VNo [0]が「3」であるため、値番号 = 3に対応したカウント領域の要素 Count [ 3]をインクリメントし、同様に、 Tmp— VNo [l] = 2であるため、 Count[2]をインクリメントし、 Tmp— VNo[2] = lであるため、 Count [1]をインクリメントする。これにより、図 58の完成した Countが得られる。

[0227] コンピュータシステム 10は、次に、 Countの要素を累計して、カウント配列 Countを累計数配列 Aggrに変換する (ステップ 5305)。図 59に示されるように、カウント配列 Count 、

Count [0] =0

Count[l] = l

Count[2] = l

Count[3] = l

であるので、累計数配列 Aggrの要素は、

Aggr[0] =0

Aggr [ 1 ] = Count [0] = 0 Aggr[2] = Count [0] + Count [1] = 1

Aggr[3] = Count [0] + Count [1] + Count [2] = 2

となる。尚、説明の便宜上、カウント配列 Countと累計数配列 Aggrは区別されている力物理的にはカウント配列 Countの領域と累計数配列 Aggrの領域が同じ領域でも構わない。このようにして得られた累計数配列 Aggrは、ステップ 5303で取得された値番号を昇順に並べたときに（同じ値番号が 2個以上存在するときには、その個数分が重複して並べられる）、各値番号の先頭の位置を示している。本例では、値番号

= 3、値番号 = 2、値番号 = 1が 1回ずつ出現しているので、これらの値番号を昇順に並べると、

値番号 = 1

値番号 = 2

値番号 = 3

の順番になる。このとき、値番号 =0は存在しないので、値番号の昇順配列における値番号 = 0の先頭の位置はアドレス 0 ( = Aggr [0] )であり、値番号 = 1の先頭の位置はアドレス 0 (=Aggr[l])であり、値番号 2の先頭の位置はアドレス 1 (= Aggr [2]) であり、値番号 3の先頭の位置はアドレス 2 (= Aggr [3])である。このようにして、図 5 9に示されるよう〖こ、累計数配列 Aggrが得られる。この累計数配列 Aggrは、ソート後頂点ノードリストの格納位置を示すポインタの配列であるとみなすことができる。

[0228] 最後に、コンピュータシステム 10は、累計数配列 Aggrを利用して、頂点ノードリスト中の頂点ノードを、その頂点ノードに関連付けられた値番号の順に並べ換える (ステップ 5306)。

[0229] コンピュータシステム 10は、図 60に示されるように、頂点ノードリストから 1番目の要素であるソート前頂点ノードリスト [0] =頂点ノード 1を取り出し、頂点ノード 1に対応した Tmp— VNo [0] = 3が指し示す累計数配列 Aggrの要素である Aggr [3] = 2によつて示されるソート後頂点ノードリストの要素、すなわち、ソート後頂点ノードリスト [2] に、ソート前頂点ノードリスト [0] = 1をセットする。そして、 Aggr [3]をインクリメントする。このインクリメントによって、ソート後頂点ノードリストの格納位置を示すポインタが次の位置へ移動するので、値番号が重複している場合でも、正しく頂点ノードリストをソー卜することがでさる。

[0230] コンピュータシステム 10は、図 61に示されるように、ソート前頂点ノードリストの要素であるソート前頂点ノードリスト [1] =6に対しても同様に、頂点ノード 6に対応した Tm p—VNo [l] = 2が指し示す累計数配列 Aggrの要素である Aggr[2] = 1によって示されるソート後頂点ノードリストの要素、すなわち、ソート後頂点ノードリスト [1]に、ソート前頂点ノードリスト [1] =6をセットする。そして、 Aggr [2]をインクリメントする。

[0231] さらに、コンピュータシステム 10は、図 62Aに示されるように、ソート前頂点ノードリストの要素であるソート前頂点ノードリスト [3] =8に対しても同様に、頂点ノード 8に対応した Tmp— VNo [2] = 1が指し示す累計数配列 Aggrの要素である Aggr[l] =0 によって示されるソート後頂点ノードリストの要素、すなわち、ソート後頂点ノードリスト [0]に、ソート前頂点ノードリスト [2] =8をセットする。そして、 Aggr [1]をインクリメントする。

[0232] 以上の処理により、コンピュータシステム 10は、図 62Bに示されるように、ソート前頂点ノードリストを、価格で昇順にソートすることにより、ソート後頂点ノードリストに変換することができる。

[0233] 尚、以上の説明では、ある項目名情報 (例えば、あるノードタイプ)の値カ^ートの指標として指定されたときに、一つの部分ツリーには、その項目名情報が関連付けられているノードが一つである例に関して第 2のツリーデータソートを記述している力一つの部分ツリー内に、指標としてヒットするノードが 2個以上存在する場合がある。その場合には、ソートの目的や仕様等のアプリケーションに応じて一つのノードを選択する。また、一つの部分ツリー内に、指標としてヒットするノードが存在しない場合、その部分ツリーは、アプリケーションに応じて、ソートの対象から外す、又は、最下位の順番を付与する、などの取扱をすることができる。

[0234] さらに、上記の説明では、頂点ノードによって代表される部分ツリーを特定する際に、すべての子孫ノードを特定している力例えば、例えば、子ノードまで、孫ノードまでのように、子孫の世代数を限定することによって集計範囲を限定することも可能である。

[0235] また、上記の例では、ノード間の親子関係が深さ優先モードで表現されているが、幅優先モードで表現し、そこ力部分ツリーを特定しても構わな、。

[0236] [ツリー群への拡張]

ここまでの説明では、ツリー型データ構造のデータの検索、集計及びソートは、ルート ·ノードとルート ·ノード以外のノードである非ルート'ノードを含む一つのッリーデータを処理の対象としている。しかし、実際的なアプリケーションでは、ツリー型データ構造のデータは、複数のツリーデータにより構成される場合がある。このような場合には、各ツリーデータは、ツリー識別子が付与され、このツリー識別子によって区別される。そして、本発明は、各ツリーデータに対して、上記のツリー型データ構造のデータの検索、集計及びソートの方法を実施することにより、複数のツリーデータを含むッリ一型データ構造のデータにも適用可能である。

[0237] 図 63A〜Eは、複数のツリーデータにより構成されたツリー型データ構造のデータ、すなわち、ツリー群の一例を示す図である。同図の例では、ある製品の生産するために必要な部品の仕入れに関する情報 (仕入先、メーカ、品番、重量、価格など）がッリ一型データ構造のデータとして表されている。さらに、その部品には、複数の代替品と複数の仕入先があるため、入手ルート毎に別個のツリーデータが準備されている。各ノードは、そのノードに関連付けられた項目名情報 (すなわち、ノードタイプ)と項目値情報 (すなわち、ノード値)を用いて、（ノードタイプ、ノード値)の形で表されている

[0238] 図 63Aのデータは、ツリー識別子がツリーデータ 1であり、ルート'ノードが（品番、 1 )であり、ルート'ノードの子ノードとして、ノード (メーカ、 A)、ノード（重量、 10)、ノード (価格、 5000)、ノード (仕入先、 α )が存在する。図 63Α力 Εに示されるように、各ツリーデータは構造が異なっていても構わない。また、図 63Εに示されたッリーデータ 5は、ノードタイプ =メーカに対応したノードを含まない。

[0239] このようなツリー型データ構造のデータに対しても、検索、集計、ソートを行うことが可能である。検索、集計、ソートは、ツリーデータ毎に個別に行われ、その後、検索、集計、ソートの結果が統合される。統合された結果は、ツリーデータ識別子を介して、各ツリーデータと関連付けられる。本例では、各ツリーデータのルート'ノードは頂点ノードである。 [0240] 例えば、項目名情報 =「メーカ」であるパス条件による検索を実行すると、ッリーデータ 1の頂点ノード、ツリーデータ 2の頂点ノード、ツリーデータ 3の頂点ノード、及び、ツリーデータ 4の頂点ノードが検索にヒットする。し力し、ツリーデータ 5の頂点ノードは検索にヒットしない。なぜならば、ツリーデータ 5には、項目名情報 =「メーカ」に関連付けられたノードが存在しないからである。この検索の結果は、ツリーデータのツリーデータ識別子と頂点ノードのノード識別子の組の集合により表現される。検索にヒットしたノードそのものを検索結果とする場合も同様に、ツリーデータ識別子とノード識別子の組の集合により検索結果が表現される。

[0241] また、項目名情報 =「価格」、項目値情報≤ 4200であるノードを検索する項目値検索を行うことが可能である。頂点ノードを検索結果として返却する場合、この検索条件を満たす頂点ノードは、ツリーデータ 3の頂点ノード、ツリーデータ 4の頂点ノード、ッリーデータ 5の頂点ノードである。同様に、項目名情報 =「重量」であり、項目値情報

≤ 12であるノードを検索する項目値検索を実行すると、この検索にヒットする頂点ノードは、ツリーデータ 1の頂点ノード、ツリーデータ 2の頂点ノード、ツリーデータ 3の頂点ノードである。

[0242] 次に、検索条件 1 =「項目名情報 =「価格」、項目値情報≤ 4200」と検索条件 2=「項目名情報 =「重量」、項目値情報≤ 12」を満たす頂点ノードを検索すると、価格の値力 200以下のノードと、重量の値が 12以下のノードの両方のノードを子孫ノードとして含む頂点ノードは、ツリーデータ 3の頂点ノードであることがわかる。一方、この A ND検索の結果は、検索条件 1の検索結果 =「ツリーデータ 3の頂点ノード、ッリーデータ 4の頂点ノード、ツリーデータ 5の頂点ノード」と、検索条件 2の検索結果 =「ッリ一データ 1の頂点ノード、ツリーデータ 2の頂点ノード、ツリーデータ 3の頂点ノード」との間の論理積演算の結果と一致している。

[0243] さらに、「仕入先毎の件数」や「重量毎の価格平均」などの集計を行うことが可能である。このような集計は、上記の本発明の第 1のノードデータ集計方法において、集計の範囲を表す頂点ノードリストの要素がツリーデータ識別子とノード識別子の組によって特定されるように拡張することによって実現できる。

[0244] 最後に、「低価格順」のようなソートも、上記の本発明の第 1のツリーデータソート方法或いは第 2のツリーデータソート方法において、頂点ノードリストの要素がッリーデータ識別子とノード識別子の組によって特定されるように拡張することによって実現できる。

[0245] 以上のように、本発明は、ノードをツリーデータ識別子とノード識別子の組によって識別し、各ツリーデータに対して、ツリー型データ構造のデータの検索、集計及びソートの方法を実施することにより、複数のツリーデータを含むツリー型データ構造のデータにも拡張できる。

[0246] [情報処理装置]

図 64は、本発明の一実施例によるツリー型データ構造のデータを処理する情報処理装置 6400のブロック図である。情報処理装置 6400は、ツリー型データ構造を表現するデータを記憶する記憶部 6401と、ツリー型データ構造のデータを記憶部 640 1上に展開するデータ展開部 6402と、ツリーデータ処理のための条件を設定する条件指定部 6403と、条件指定部 6403によって設定された条件に従って記憶部 6401 上に展開されたデータを処理するツリーデータ処理部 6404と、を含む。

[0247] ツリーデータ処理部 6404は、ツリーデータ検索を実行する検索部 6405と、ツリーデータ集計を実行する集計部 6406と、ツリーデータソートのための指標を取得する指標取得部 6408と、集計部 6406からの集計結果又は指標取得部 6408からの指標を受け取って、ツリーデータソートを実行する順序付け部 6407と、を含む。

[0248] 記憶部 6401は、ルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを記憶する。データ展開部 6402は、ルート'ノードを含む全ノードに固有のノード識別子を付与し、非ルート'ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付け、これにより、ツリー型データ構造を構成するノード間の親子関係を表現し、各ノードにデータを表す少なくとも一つの実体情報を関連付け、ツリー型データ構造を記憶装置上に構築する。データ展開部 6402は、ルート'ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子を付与してもよい。

[0249] 条件指定部 6403は、検索、集計、ソートの目的に応じて各種の条件を設定する。

これらの条件は、ユーザによって図示されないユーザ'インタフェース装置を介して指定され、或いは、外部装置から取り込まれる。各種の条件には、少なくとも一つの実体情報に関する検索条件、検索範囲を表す少なくとも一つの部分ツリー、集計の対象を表す項目名情報、集計の範囲を表す少なくとも一つの部分ツリー、順序付けの対象となる少なくとも二つのノード群を表す頂点ノード、或いは、順序付けの指標となる項目名情報などが含まれる。

[0250] 検索部 6405は、各ノードについて、当該ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致した場合に当該ノードに検索ヒット情報を関連付け、前記ノード間の親子関係を迪つて当該ノードの祖先ノードに検索ヒット情報を関連付ける。また、検索部 6405は、少なくとも一つの頂点ノードのうち検索ヒット情報が関連付けられた頂点ノードに付与されたノード識別子を検索結果として保存してもよい。或いは、検索部 6405は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの祖先ノードを特定し、当該頂点ノード及び Z又は当該頂点ノードの祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付ける。

[0251] 他の一実施例では、検索部 6405は、少なくとも一つの実体情報を指定する第 1の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属するノード群を代表する頂点ノードに付与されたノード識別子を第 1の検索結果として保存し、少なくとも一つの実体情報を指定する第 2の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属するノ一ド群を代表する頂点ノードに付与されたノード識別子を第 2の検索結果として保存し、第 1の検索条件と第 2の検索条件の論理的な関係に対応した論理演算を第 1の検索結果と第 2の検索結果に実行することにより、第 1の検索条件と第 2の検索条件を論理的に組み合わせた検索結果を生成する。

[0252] 集計部 6406は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード及び Z又は当該頂点ノードの子孫ノードに関連付けられた項目名情報が集計の対象と一致するかどうかを判定し、一致したノードに関連付けられた項目値情報を集計する。他の一実施例では、集計部 64 06は、各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード又は当該頂点ノードの子孫ノードに関連付けられた項目名情報が集計の対象を表す項目名情報と一致するかどうかを判定し、一致したノードに関連付けられた項目値情報を、当該頂点ノードによって代表されたノード群に関係した集計の分類対象を表す項目名情報に関連付けられた項目値情報毎に集計する。

[0253] 順序付け部 6407は、頂点ノード毎に集計された項目値情報の順序関係に従って当該少なくとも二つの頂点ノードに順序を付けることにより、当該頂点ノードによって代表されるノード群に順序を付ける。

[0254] 他の一実施例では、指標取得部 6408は、各ツリーデータに属する各頂点ノードについて、前記ノード間の親子関係を迪つて当該頂点ノードの子孫ノードを特定し、当該頂点ノード又は当該頂点ノードの子孫ノードの中で、順序付けの指標となる項目名情報が関連付けられたノードに関連付けられた項目値情報を取得する。順序付け部 6407は、頂点ノード毎に取得された項目値情報の順序関係に従って当該少なくとも二つの頂点ノードに順序を付けることにより、当該頂点ノードによって代表されるノード群に順序を付ける。

[0255] 本発明は、以上の実施の形態に限定されることなぐ特許請求の範囲に記載された発明の範囲内で、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

図面の簡単な説明

[0256] [図 1]図 1は、本発明の実施の形態に力かるツリー型データ構造を取り扱うコンビユータシステムのブロックダイヤグラムである。

[図 2]図 2A、 Bは、ツリー形式データの一例である POSデータの説明図であり、図 2A は、このツリー形式データのデータ構造 (即ち、トポロジー)及びデータ値を視覚的に表現した例であり、図 2Bは、同じツリー形式データを XML形式で表現した例である。

[図 3]図 3A〜Cは、アークリストを用いたツリー型データ構造の表現形式の一例の説明図である。

[図 4]図 4A〜Cは、「子→親」関係に基づくツリー型データ構造の表現方法の説明図である。

[図 5]図 5は、ツリー型データ構造を記憶装置上に構築する方法のフローチャートである。

[図 6]図 6A〜Cは、 ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。

[図 7]図 7A〜Cは、 ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。

[図 8]図 8は、深さ優先に基づくノード定義処理のフローチャートである。

[図 9]図 9は、「子→親」表現に基づく親子関係の配列の説明図である。

[図 10]図 10は、図 6Cに示された深さ優先のツリー型データ構造から作成された「親

→子」表現に基づく親子関係の配列の説明図である。

[図 11]図 11は、幅優先に基づくノード定義処理のフローチャートである。

[図 12]図 12は、「子→親」表現に基づく親子関係の配列の説明図である。

[図 13]図 13は、図 7Cに示された深さ優先のツリー型データ構造から作成された「親

→子」表現に基づく親子関係の配列の説明図である。

[図 14]図 14Aは、幅優先モードに基づくツリー型データ構造、図 14Bは、当該ツリー型データ構造を、「子→親」表現に基づく親子関係の配列を示す図である。

[図 15]図 15Aは、頂点ノードリストの例、図 15Bは、頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 16]図 16Aは、検索処理により得られた頂点ノードリストの例、図 16Bは、頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 17]図 17Aは、集計処理により得られた頂点ノードリストおよび集計結果を示す配列の例、図 17Bは、頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 18]図 18Aは、ノード数でソートされた頂点ノードリスト、および、対応するノード数を示す配列の例、図 18Bは、頂点ノードリストで特定される部分ツリーの例を示す図である。

[図 19]図 19A、 Cは、それぞれ、論理積演算の対象となる頂点ノードリストの例、図 19 B、 Dは、それぞれ頂点ノードリストで特定される部分ツリー群の例を示す図である。 [図 20]図 20Aは、論理積演算の結果を示す頂点ノードリストの例、図 20Bは、頂点ノ一ドリストで特定される部分ツリー群を示す図である。

[図 21]図 21Aは、幅優先モードに基づくツリー型データ構造、図 21Bは、当該ツリー型データ構造を、「子→親」表現に基づく親子関係の配列を示す図である。

[図 22]図 22A、 Bは、論理積演算を説明する図である。

[図 23]図 23は、論理積演算の処理を示すフローチャートである。

[図 24]図 24は、論理積演算の処理例を示す図である。

[図 25]図 25は、論理積演算の処理例を示す図である。

[図 26]図 26は、実体的な値の取り扱い方の一例を示す図である。

[図 27]図 27Aは、本発明の一実施例に力かる子孫のパス条件による検索の対象となるツリー型データ構造とノードの親子関係の「子→親」表現の説明図であり、図 27B はシンボル番号と表示図形とシンボル名の対応関係を表す図である。

[図 28]図 28は、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法のフローチャートである。

[図 29]図 29A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 30]図 30A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 31]図 31A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 32]図 32A〜Dは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 33]図 33A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 34]図 34は、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法のフローチャートである。

[図 35]図 35A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。 [図 36]図 36A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 37]図 37A〜Cは、本発明の一実施例に力かる子孫のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 38]図 38A〜Cは、本発明の一実施例に力かる祖先のパス条件による検索の対象となるツリー型データ構造とノードの親子関係の「子→親」表現の説明図である。

[図 39]図 39は、本発明の一実施例に力かる祖先のパス条件によるツリー検索方法のフローチャートである。

[図 40]図 40A〜Cは、本発明の一実施例に力かる祖先のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 41]図 41A〜Cは、本発明の一実施例に力かる祖先のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 42]図 42A〜Cは、本発明の一実施例に力かる祖先のパス条件によるツリー検索方法の動作状態を説明する図である。

[図 43]図 43Aは、本発明の一実施例に力かる集計の対象となるツリー型データ構造とノードの親子関係の「子→親」表現の説明図であり、図 43Bはシンボル番号と表示図形とシンボル名の対応関係を表す図である。

[図 44]図 44A〜Dは、図 43Aの各頂点ノードによって代表される部分ツリーの説明図である。

[図 45]図 45は、本発明の一実施例に力かる第 1のツリーデータ集計方法のフローチヤートである。

[図 46]図 46は、本発明の一実施例に力かる第 1のツリーデータ集計方法の動作状態を説明する図である。

[図 47]図 47は、本発明の一実施例に力かる第 1のツリーデータ集計方法の動作状態を説明する図である。

[図 48]図 48は、本発明の一実施例に力かる第 1のツリーデータ集計方法の動作状態を説明する図である。

[図 49]図 49は、本発明の一実施例に力かる第 2のツリーデータ集計方法のフローチヤートである。

[図 50]図 50A〜Dは、本発明の一実施例に力かる第 2のツリーデータ集計方法の動作状態を説明する図である。

[図 51]図 51A〜Cは、本発明の一実施例に力かる第 1のツリーデータソート方法の説明図である。

[図 52]図 52Aは本発明の一実施例に力かる第 2のツリーデータソート方法の処理の対象となるツリー型データ構造及びノードの親子関係の「子→親」表現を示し、図 52 Bはノードタイプ毎のノード値のリストを示し、図 52Cはノードに関連付けられたノードタイプ及びノード値を示す図である。

[図 53]図 53は、本発明の一実施例に力かる第 2のツリーデータ集計方法のフローチヤートである。

[図 54]図 54は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 55]図 55は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 56]図 56は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 57]図 57は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 58]図 58は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 59]図 59は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 60]図 60は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 61]図 61は、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 62]図 62A、 Bは、図 52A〜Cに示されたツリー型データ構造のデータに本発明の一実施例に力かる第 2のツリーデータソート方法を適用したときの動作状態の説明図である。

[図 63]図 63A〜Eは、複数のツリーデータにより構成されたツリー型データ構造のデータの一例を示す図である。

[図 64]図 64は、本発明の一実施例による情報処置装置のブロック図である。

符号の説明

10 コンピュータシステム

12 CPU

14 RAM

16 ROM

18 固定記憶装置

20 CD— ROMドライバ

22 I/F

24 入力装置

26 表示装置

6400 情報処理装置

6401 n己' 1思 ρβ

6402 データ展開部

6403 条件指定部

6404 ツリーデータ処理部 6405 検索部 6406 集計部 6407 順序付け部 6408 指標取得部

Claims

請求の範囲

[1] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法であって、

を有する方法。

[2] 部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

検索ステップの後に、検索ヒット情報が関連付けられたノードを含む部分ツリーを表す識別子を検索結果として保存するステップをさらに有する、

請求項 1に記載の方法。

[3] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法であって、

各ノードはデータを表す少なくとも一つの実体情報が関連付けられ、部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群に関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付けるステップと、を有する方法。

[4] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法であって、

を有する方法。

[5] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法であって、

を有する方法。

記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを検索する方法であって、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存するステツプと、を有する方法。

[7] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを第 1の検索条件と第 2の検索条件を論理的に組み合わせて検索する方法であって、

検索範囲を表す少なくとも一つの部分ツリーが指定され、

を有する方法。

[8] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを集計する方法であって、

ルート ·ノードを含む全ノードに固有のノード識別子が付与され、非ルート ·ノードの各々に付与されたノード識別子に非ルート'ノードの各々の親ノードに付与されたノード識別子が関連付けられ、これにより、ツリー型データ構造を構成するノード間の親子関係が表現され、各ノードはデータを表す少なくとも一つの実体情報が関連付けられ、部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

を有する方法。

[9] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータを集計する方法であって、

集計の分類対象を表す実体情報を指定し、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定するステップと、

を有する方法。

[10] 記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータの少なくとも二つのノード群に順序を付ける方法であって、

を有する方法。

記憶装置に展開されたルート'ノードとルート'ノード以外のノードである非ルート'ノードを含むツリー型データ構造のデータの少なくとも二つのノード群に順序を付ける方法であって、

部分ツリーはツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、順序付けの対象となる少なくとも二つの部分ツリーを指定し、順序付けの指標となる実体情報を指定するステップと、

を有する方法。

[12] 各実体情報はデータの項目を表す項目名情報又はデータの項目値を表す項目値情報である、請求項 1乃至 11のうち何れか 1項に記載の方法。

[13] 特定のノード及び当該特定のノードの子孫ノードを含む部分ツリーは当該特定のノードのノード識別子によって表される、請求項 2乃至 11のうち何れか 1項に記載の方法。

[14] ルート'ノードを含む全ノードに付与された固有のノード識別子は同じ世代のノードよりも子ノードを優先して付与される、請求項 3、 4、 8、 9、 10又は 11のうち何れか 1項に記載の方法。

[15] ツリー型データ構造のデータはツリー識別子が付与された複数のツリーデータを含む、請求項 1乃至 11のうち何れか 1項に記載の方法。

[16] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

を有する情報処理装置。

[17] 部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

検索手段は、検索ヒット情報が関連付けられたノードを含む部分ツリーを表す識別子を検索結果として保存する手段を含む、

請求項 16に記載の情報処理装置。

[18] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

を有する情報処理装置。 [19] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

を有する情報処理装置。

[20] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、少なくとも一つの実体情報に関する検索条件を指定し、検索範囲を表す少なくとも一つの部分ツリーを指定する条件指定手段と、各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付ける検索手段と、

を有する情報処理装置。

[21] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータを検索する情報処理装置であって、

を有する情報処理装置。

[22] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、第 1の検索条件と第 2の検索条件を論理的に組み合わせて検索する情報処理装置であって、

を有する情報処理装置。

ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータ^^計する情報処理装置であって、

を有する情報処理装置。

[24] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータ^^計する情報処理装置であって、

を有する情報処理装置。

[25] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータの少なくとも二つのノード群に順序を付ける情報処理装置であって、

を有する情報処理装置。

ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有し、記憶装置に記憶されたデータの少なくとも二つのノード群に順序を付ける情報処理装置であって、

を有する情報処理装置。

[27] 各実体情報はデータの項目を表す項目名情報又はデータの項目値を表す項目値情報である、請求項 16乃至 26のうち何れか 1項に記載の情報処理装置。

[28] 特定のノード及び当該特定のノードの子孫ノードを含む部分ツリーは当該特定のノードのノード識別子によって表される、請求項 17乃至 26のうち何れか 1項に記載の情報処理装置。

[29] ルート'ノードを含む全ノードに付与された固有のノード識別子は同じ世代のノードよりも子ノードを優先して付与される、請求項 18、 19、 23、 24、 25又は 26のうち何れ力 1項に記載の情報処理装置。

[30] ツリー型データ構造のデータはツリー識別子が付与された複数のツリーデータを含む、請求項 16乃至 26のうち何れか 1項に記載の情報処理装置。

[31] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを検索する検索機能を実現させるためのプログラムであって、

各ノードにデータを表す少なくとも一つの実体情報が関連付けられ、

前記検索機能は、

少なくとも一つの実体情報に関する検索条件を指定する機能と、

各ノードについて、当該ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致した場合に当該ノードに検索ヒット情報を関連付け、前記ノード間の親子関係を迪つて当該ノードの祖先ノードに検索ヒット情報を関連付ける機能と、を含む、プログラム。

[32] 部分ツリーはツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、

前記検索機能は、

検索範囲を表す少なくとも一つの部分ツリーを指定する機能と、

検索ヒット情報が関連付けられたノードを含む部分ツリーを表す識別子を検索結果として保存する機能と、

をさらに含む、請求項 31に記載のプログラム。

[33] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを検索する検索機能を実現させるためのプログラムであって、

ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子が付与され、非ルート'ノードの各々に付与されたノード識別子に非ルート 'ノードの各々の親ノードに付与されたノード識別子が関連付けられ、これにより、ッリー型データ構造を構成するノード間の親子関係が表現され、

前記検索機能は、

部分ツリーがツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、少なくとも一つの実体情報に関する検索条件を指定し、検索範囲を表す少なくとも一つの部分ツリーを指定する機能と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群に関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付ける機能と、

を含む、プログラム。

[34] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを検索する検索機能を実現させるためのプログラムであって、ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子が付与され、非ルート'ノードの各々に付与されたノード識別子に非ルート 'ノードの各々の親ノードに付与されたノード識別子が関連付けられ、これにより、ッリー型データ構造を構成するノード間の親子関係が表現され、

前記検索機能は、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群に関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存する機能と、

を含む、プログラム。

ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを検索する検索機能を実現させるためのプログラムであって、

前記検索機能は、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該頂点ノードの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードに検索ヒット情報を関連付ける機能と、

を含む、プログラム。

[36] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを検索する検索機能を実現させるためのプログラムであって、

前記検索機能は、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーの祖先ノードを特定し、当該部分ツリーの特定のノード及び Z又は祖先ノードに関連付けられた少なくとも一つの実体情報が前記検索条件と一致するかどうかを判定し、一致したノードが存在する場合に、当該部分ツリーを表す識別子を検索結果として保存する機能と、

を含む、プログラム。

[37] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、第 1の検索条件と第 2の検索条件を論理的に組み合わせて検索する検索機能を実現させるためのプログラムであって、

前記検索機能は、

部分ツリーがツリー型データ構造の特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、検索範囲を表す少なくとも一つの部分ツリーを指定する機能と、

少なくとも一つの実体情報を指定する第 1の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属する部分ツリーを表す識別子を第 1の検索結果として保存し、少なくとも一つの実体情報を指定する第 2の検索条件に従って、前記ノード間の親子関係を迪つて当該第 1の検索条件に一致するノードが属する部分ツリーを表すノード識別子を第 2の検索結果として保存する機能と、

第 1の検索条件と第 2の検索条件の論理的な関係に対応した論理演算を第 1の検索結果と第 2の検索結果に実行することにより、第 1の検索条件と第 2の検索条件を論理的に組み合わせた検索結果を生成する機能と、

を含む、プログラム。

ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを集計する集計機能を実現させるためのプログラムであって、

前記集計機能は、

部分ツリーがツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定する機能と、各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられているかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を集計する機能と、

を含む、プログラム。

[39] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータを集計する集計機能を実現させるためのプログラムであって、

前記集計機能は、

頂点ノードがツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、集計の分類対象を表す実体情報を指定し、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも一つの部分ツリーを指定する機能と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたノードが存在するかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を、当該部分ツリーに属するノード群に関係した集計の分類対象を表す実体情報毎に集計する機能と、

を含む、プログラム。

[40] ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータの少なくとも二つのノード群に順序を付ける順序付け機能を実現させるためのプログラムであって、ルート ·ノードを含む全ノードに同じ世代のノードよりも子ノードを優先して固有のノード識別子が付与され、非ルート'ノードの各々に付与されたノード識別子に非ルート 'ノードの各々の親ノードに付与されたノード識別子が関連付けられ、これにより、ッリー型データ構造を構成するノード間の親子関係が表現され、

前記順序付け機能は、

部分ツリーがツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫を含むノード群であり、集計の対象を表す実体情報を指定し、集計の範囲を表す少なくとも二つの部分ツリーを指定する機能と、

各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中に集計の対象を表す実体情報が関連付けられたノードが存在するかどうかを判定し、存在する場合に、当該ノードに関連付けられた実体情報を集計する機能と、

部分ツリー毎に集計された項目値情報の順序関係に従って当該少なくとも二つの部分ツリーに順序を付ける機能と、

を含む、プログラム。

ルート'ノードとルート'ノード以外のノードである非ルート ·ノードを含むツリー型データ構造のデータを記憶する記憶装置を有するコンピュータに、記憶装置に記憶されたデータの少なくとも二つのノード群に順序を付ける順序付け機能を実現させるためのプログラムであって、

前記順序付け機能は、

部分ツリーがツリー型データ構造のデータの特定のノード及び当該特定のノードの子孫ノードを含むノード群であり、順序付けの対象となる少なくとも二つの部分ツリーを指定し、順序付けの指標となる実体情報を指定する機能と、

各ツリーデータに属する各部分ツリーについて、前記ノード間の親子関係を迪つて当該部分ツリーに属するノード群を特定し、当該ノード群の中で、順序付けの指標となる実体情報が関連付けられたノードに関連付けられた実体情報を取得する機能と部分ツリー毎に取得された項目値情報の順序関係に従って当該少なくとも二つの部分ツリーに順序を付ける機能と、

を含む、プログラム。

[42] 各実体情報はデータの項目を表す項目名情報又はデータの項目値を表す項目値情報である、請求項 31乃至 41のうち何れか 1項に記載のプログラム。

[43] 特定のノード及び当該特定のノードの子孫ノードを含む部分ツリーは当該特定のノードのノード識別子によって表される、請求項 32乃至 41のうち何れか 1項に記載のプログラム。

[44] ルート'ノードを含む全ノードに付与された固有のノード識別子は同じ世代のノードよりも子ノードを優先して付与される、請求項 33、 34、 38、 39、 40又は 41のうち何れ力 1項に記載のプログラム。

[45] ツリー型データ構造のデータはツリー識別子が付与された複数のツリーデータを含む、請求項 31乃至 41のうち何れ力 1項に記載のプログラム。

[46] 請求項 31乃至 45のうちいずれか 1項に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。