WO2006038498A1

WO2006038498A1 - 配列の生成方法、及び、配列生成プログラム

Info

Publication number: WO2006038498A1
Application number: PCT/JP2005/017794
Authority: WO
Inventors: Shinji Furusho
Original assignee: Turbo Data Laboratories Inc.
Priority date: 2004-10-01
Filing date: 2005-09-28
Publication date: 2006-04-13
Also published as: CN100587673C; JP4712718B2; JPWO2006038498A1; US20090106289A1; CN101031892A; CA2581219A1; EP1811383A1; KR101254544B1; KR20070057819A

Abstract

　ツリー型データ構造のデータ間の、例えば、親子、祖先、子孫、兄弟、世代などの関係を効率的にトレースできるツリー型データ構造の表現方法を提供する。メモリには、ノードに固有のノード識別子が付与され、ノード間の親子関係がルート・ノード以外のノードである非ルート・ノードの各々に付与されたノード識別子と非ルート・ノードの各々に関連付けられた親ノードのノード識別子との組からなるＣ－Ｐ配列によって表現されたツリー型データ構造のデータと、それぞれが特定のノード及びその子孫のノードを含む１以上のノード群を表わすために、特定のノードを頂点ノードとして、そのノード識別子を格納した頂点ノードリストとが設けられる。システム１０は、Ｃ－Ｐ配列を参照して、頂点ノードの各々を、子ノード、親ノード或いは頂点ノードと同世代のノード（兄ノード又は弟ノード）に移動させ、新たな頂点ノードリストを生成する。

Description

明細書

配列の生成方法、及び、配列生成プログラム

技術分野

[0001] 本発明はツリー型データ構造を表わす配列の生成方法、特に、ツリー型データ構造を表現し、記憶装置上に構築する方法に関する。また、本発明は、かかる方法を実施する情報処理装置に関する。更に、本発明は、かかる方法を実行するためのプログラムに関する。

背景技術

[0002] データベースは種々の用途に用いられている力中規模ないし大規模システムにおいては、論理的な矛盾が排除できるリレーショナルデータベース (RDB)の使用が主流となっている。たとえば、 RDBは飛行機の座席予約等のシステムに利用されている。この場合、キー項目を指定することにより、（多くの場合 1件の)ターゲットを迅速に検索することもでき、或いは、予約の確定、キャンセル或いは変更などを行うことができる。また、各便の座席数はせいぜい数百であるため、特定の航空便の空席数を求めることも可能である。

[0003] このような RDBは、表形式データの取り扱いに適している力ツリー形式データの取り扱いには適していないことが知られている（例えば、非特許文献 1を参照。 ) o

[0004] 更に、アプリケーションの中には、表形式による表現よりもツリー形式による表現の方が適しているものが存在する。特に、近年、イントラネットやインターネットのアプリケーシヨンのデータ標準として、ツリー型データ構造を採用する XMLが普及している（ XMLの詳細については、例えば、非特許文献 2を参照。 )₀

[0005] しかし、ツリー型データ構造の取り扱い、例えば、ツリー形式データの検索は、一般に、大変効率が悪い。この効率の悪さの第 1の理由は、データが各所のノードに分散して存在するため、データの存在すべき場所を直ちに特定することが困難である点にある。 RDBでは、例えば、「年齢」というデータは、あるテーブルの「年齢」という項目だけに格納されている。しかし、ツリー型データ構造では、「年齢」というデータを保持するノードが各所に散在しているので、一般的には、ツリー型データ構造の全体を調べなければ、該当するデータを検索することができない。

[0006] 効率の悪さの第 2の理由は、検索の結果を表現するために時間が力かるという点にある。検索にヒットしたノード群を表現しょうとすると、屡々、そのノードの子孫にあたるノードも表現しなければならな、が、 RDBMSとは異なりデータ構造が非定型であるため、子孫ノードを表現するために時間が力かる。

[0007] そこで、データベースの主流である RDBの利点をいかすため、従来、ツリー型データ構造をデータベース化するとき、ツリー形式データを RDB化する方法 (例えば、特許文献 1を参照。）が提案されている。 RDBでは、データはテーブル (表）に分解して保持される。そのため、実際のツリー形式データを RDB化するには、ツリー形式データをテーブルに押し込める必要がある。しかし、様々のツリー型データ構造を取り扱うためには、その構造毎に個別にデータをテーブルに押し込め、システム設計を行わなければならない。したがって、 RDBに基づくシステム構築は非常に手間の力かる作業である。

[0008] これに対して、ツリー形式データ、特に、 XMLデータをそのままの形でデータべ一ス化する方法も提案されている。ツリー型データ構造の場合、一つのノードに子孫ノードをぶら下げることができ、多様な表現が可能であるため、システム設計の手間を大幅に削減することができる。したがって、 XMLのようなツリー構造を取り扱える技術を核として、ツリー構造データを処理することへのニーズが高まって、る。

[0009] XMLデータをそのままの形でデータベース化する方法の一例のアプローチは、ッリー構造に記入されているデータのコピーを取り出し、例えば、「年齢」という項目であれば、「年齢」の検索用インデックスデータを別途保持する（例えば、特許文献 2を参照。；)。これにより、データ自身に属性を付加できるという XMLデータのメリットを十分に活用すると共に、タグを用いて表現された各項目の関係構造をそのまま記憶できるようにしている。

特許文献 1 :特開 2003— 248615号公報

特許文献 2：特開 2001— 195406号公報

非特許文献 1 :株式会社セック、 "Karearea White Paper", [online], [平成 16年 2月 1 9日検索」、インターネット < URL:http://www.sec. co.jp/products/karearea/ 非特許文献 2 :W3C、 "Extensible Markup Language (XML) 1.0 (ThirdEdition)", [onli ne]、 2004年 2月 4日、 [平成 16年 2月 19日検索]、インターネットく URL:http：〃 www .w3.org/TR/2004/REC-xml-20040204/>

発明の開示

発明が解決しょうとする課題

[0010] しかし、検索用インデックスデータを別途保持するようなアプローチでは、少なくともデータは二重に保持され、かつ、インデックスを作成するコスト及びインデックスを格納するためのデータ領域が必要となり、大規模なデータを保持する上で不利である。

[0011] 実際、このようなメカニズムによって、実際に検索を行い、ノードを特定したとしても、そのノードを表現するためには時間がかかる。また、このメカニズムは、ノード間の関係を問題とする検索 (例えば、祖先に「60歳」 t 、う「年齢」を含み、子孫に「1歳」 t 、う「年齢」を含むツリーの抽出）には利用できない。

[0012] このような従来技術の根本的な問題点は、個々のデータのみに着目し、データを蓄えたノード間をポインタで接続することによりツリー型データ構造が表現されているため、データ間の関係、例えば、親子、祖先、子孫、兄弟 (シブリング)、世代などの関係を効率的にトレースすることができないことにある。換言すると、ポインタは、その値が一定しないため、データの格納アドレスを示すという用途にし力使用できず、ノード間の関係を直接的に表現することができない。

[0013] そこで、本発明は、ツリー型データ構造のデータ間の関係を効率的にトレースすることができるツリー型データ構造の表現、および、構築に関する方法の提供を目的とする。

[0014] 更に、本発明は、ツリー型データ構造のデータ間の関係を効率的にトレースすることができるツリー型データ構造の構築に関する情報処理装置の提供を目的とする。

[0015] 更に、本発明は、ツリー型データ構造のデータ間の関係を効率的にトレースすることができるツリー型データ構造の表現、および、構築に関するプログラムの提供を目的とする。

[0016] また、ツリー型データ構造を取り扱う際には、ロケーションパスをたどる基準点となる、頂点となるノード (頂点ノード)を移動する必要も生じる。そこで、特に、本発明は、ッリー型データ構造における頂点ノードを移動させる方法、情報処理装置およびプログラムを提供することを目的とする。

課題を解決するための手段

[0017] 本発明の目的は、ノードに固有のノード識別子が付与され、ノード間の親子関係がルート'ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子と、非ルート ·ノードの各々に関連付けられた親ノードのノード識別子との組からなる第

1の配列によって表現された、ツリー型データ構造のデータを備えたコンピュータにおいて、

それぞれが特定のノードおよびその子孫のノードを含む 1以上のノード群を表わすために、当該特定のノードを頂点ノードとして、そのノード識別子を格納した第 2の配列を設けるステップと、

前記第 1の配列を参照して、前記第 2の配列にノード識別子が格納された頂点ノードの各々を、

a)当該頂点ノードとアークで直接結ばれ、かつ、当該アークが頂点ノードから延びているような子ノード、

b)当該頂点ノードとアークで直接結ばれ、かつ、当該アークがそこ力頂点ノードまで延びるような親ノード、

c)当該頂点ノードと同世代のノードであって、当該頂点ノードの親ノードから頂点ノードに対してアークが接続される以前に、アークが接続されている兄ノード、並びに、 d)当該頂点ノードと同世代のノードであって、当該頂点ノードの親ノードから頂点ノードに対してアークが接続された後に、アークが接続される弟ノード

の何れかに移動させて、移動後の新たな頂点ノードのノード識別子を格納した第 3 の配列を生成するステップと、を備えたことを特徴とする配列の生成方法により達成される。

[0018] 本発明において、新たな第 3の配列には、親ノード、子ノード、兄ノード或いは弟ノードの何れかに移動後の頂点ノードのノード識別子が格納される。これにより、ロケ一シヨンノスをたどる基準点を適切に変更することができ、ツリー型データ構造のデータのトレース等を容易にすることができる。 [0019] 好ましい実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート' ノードを含むノードに固有の連続する整数が付与され、

前記第 1の配列が、前記ルート'ノード以外のノードである非ルート'ノードの各々に付与された整数の順に、前記非ルート'ノードの各々の親ノードに付与された整数を並べることにより形成され、

前記頂点ノードの各々を、子ノードに移動させるために、前記第 3の配列を生成するステップが、

前記第 1の配列中、頂点ノードのノード識別子が格納された格納位置を特定するステツプと、

移動後の頂点ノードのノード識別子を、当該格納位置に対応するノード識別子と決定するステップと、を有する。

[0020] また、好ましい実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート 'ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、親ノードに移動させるために、前記第 3の配列を生成するステップが、

前記第 1の配列中、頂点ノードのノード識別子に対応する位置に格納されたノード識別子を特定するステップと、

移動後の頂点ノードのノード識別子を、前記対応する位置に格納されたノード識別子と決定するステップと、を有する。

[0021] 別の実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、兄ノードに移動させるために、前記第 3の配列を生成するステップが、

前記第 1の配列中、頂点ノードのノード識別子に対応する位置に格納された第 1のノード識別子を特定するステップと、

前記第 1の配列中、前記頂点ノード識別子に対応する位置の値より 1だけ小さい値の格納位置に格納された第 2のノード識別子を特定するステップと、

前記第 1のノード識別子と、第 2のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 2のノード識別子の格納位置に対応するノード識別子と決定するステップと、を有する。

[0022] さらに別の実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート ·ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、弟ノードに移動させるために、前記第 3の配列を生成するステップが、

前記第 1の配列中、前記頂点ノード識別子に対応する位置の値より 1だけ大きい値の格納位置に格納された第 3のノード識別子を特定するステップと、

前記第 1のノード識別子と、第 3のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 3のノード識別子の格納位置に対応するノード識別子と決定するステップと、を有する。

[0023] さらに別の実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート ·ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、子ノードに移動させるため、前記第 3の配列を生成するステップが、

[0024] 別の実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

[0025] また、別の実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート •ノードを含むノードに固有の連続する整数が付与され、

前記第 1の配列中、頂点ノードのノード識別子の格納位置に格納された第 1のノード識別子を特定するステップと、

前記第 1の配列中、頂点ノードのノード識別子の格納位置の値より小さい値の格納位置に格納された、当該第 1のノード識別子と等しい第 4のノード識別子を検索するステップと、前記第 4のノード識別子の格納位置のうち、最大の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を有する。

[0026] また、別の実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート •ノードを含むノードに固有の連続する整数が付与され、

前記第 1の配列中、頂点ノードのノード識別子の格納位置の値より大き、値の格納位置に格納された、当該第 1のノード識別子と等しい第 5のノード識別子を検索するステップと、

前記第 5のノード識別子の格納位置のうち、最小の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を有する。

[0027] また、本発明の目的は、ノードに固有のノード識別子が付与され、ノード間の親子関係がルート'ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子と、非ルート'ノードの各々に関連付けられた親ノードのノード識別子との組からなる第 1の配列によって表現された、ツリー型データ構造のデータを備えたコンビュータにより読み取り可能なコンピュータプログラムであって、前記コンピュータに、それぞれが特定のノードおよびその子孫のノードを含む 1以上のノード群を表わすために、当該特定のノードを頂点ノードとして、そのノード識別子を格納した第 2の配列を設けるステップと、前記第 1の配列を参照して、前記第 2の配列にノード識別子が格納された頂点ノードの各々を、

の何れかに移動させて、移動後の新たな頂点ノードのノード識別子を格納した第 3 の配列を生成するステップと、を実行させることを特徴とする配列生成プログラムによつても達成される。

[0028] 好ましい実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート' ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、子ノードに移動させるために、前記第 3の配列を生成するステップにおいて、前記コンピュータに、

移動後の頂点ノードのノード識別子を、当該格納位置に対応するノード識別子と決定するステップと、を実行させる。

[0029] また、好ましい実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート 'ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、親ノードに移動させるために、前記第 3の配列を生成するステップにおいて、前記コンピュータに、

移動後の頂点ノードのノード識別子を、前記対応する位置に格納されたノード識別子と決定するステップと、を実行させる。

[0030] 別の実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、兄ノードに移動させるために、前記第 3の配列を生成するステップにおいて、前記コンピュータに、

前記第 1のノード識別子と、第 2のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 2のノード識別子の格納位置に対応するノード識別子と決定するステップと、を実行させる。

[0031] さらに別の実施態様においては、子ノードよりも同じ世代のノードを優先して、ルート ·ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、弟ノードに移動させるために、前記第 3の配列を生成するステップにおいて、前記コンピュータに、前記第 1の配列中、頂点ノードのノード識別子に対応する位置に格納された第 1のノード識別子を特定するステップと、

前記第 1のノード識別子と、第 3のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 3のノード識別子の格納位置に対応するノード識別子と決定するステップと、を実行させる。

[0032] 好ましい実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート' ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、子ノードに移動させるため、前記第 3の配列を生成するステップにおいて、前記コンピュータに、

[0033] また、好ま U、実施態様にぉ、ては、同じ世代のノードよりも子ノードを優先して、ルート 'ノードを含むノードに固有の連続する整数が付与され、

[0034] 別の好ましい実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート 'ノードを含むノードに固有の連続する整数が付与され、

前記第 1の配列中、頂点ノードのノード識別子の格納位置の値より小さい値の格納位置に格納された、当該第 1のノード識別子と等しい第 4のノード識別子を検索するステップと、

前記第 4のノード識別子の格納位置のうち、最大の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を実行させる。

[0035] さらに好ましい実施態様においては、同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、弟ノードに移動させるために、前記第 3の配列を生成するステップにおいて、前記コンピュータに、

前記第 5のノード識別子の格納位置のうち、最小の格納位置を特定するステップと

前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を実行させる。

発明の効果

[0036] 本発明によれば、ツリー型データ構造のデータ間の関係を効率的にトレースすることができるツリー型データ構造の表現、および、構築に関する方法を提供することが可能となる。

[0037] 更に、本発明によれば、ツリー型データ構造のデータ間の関係を効率的にトレースすることができるツリー型データ構造の構築に関する情報処理装置を提供することが可能となる。

[0038] 更に、本発明によれば、ツリー型データ構造のデータ間の関係を効率的にトレースすることができるツリー型データ構造の表現、および、構築に関するプログラムを提供することが可能となる。

[0039] 特に、本発明によれば、特定のノードおよびその子孫のノードを含む 1以上のノード群を表わすための配列の生成および当該配列を処理する方法、情報処理装置およびプログラムを提供することが可能となる。発明を実施するための最良の形態

[0040] 以下、添付図面を参照して、本発明の実施の形態について説明する。

[0041] [コンピュータシステム構成]

図 1は、本発明の実施の形態に力かるツリー型データ構造を取り扱うコンピュータシステムのハードウェア構成を示すブロックダイヤグラムである。図 1に示すように、このコンピュータシステム 10は、通常のものと同様の構成であり、プログラムを実行することによりシステム全体および個々の構成部分を制御する CPU12、ワークデータなどを記憶する RAM(Random Access Memory) 14、プログラム等を記憶する ROM(Read 0 nly Memory) 16,ハードディスク等の固定記憶媒体 18、 CD—ROM19をアクセスするための CD— ROMドライバ 20、 CD—ROMドライバ 20や外部ネットワーク（図示せず)と接続された外部端子との間に設けられたインタフェース (IZF) 22、キーボードやマウスからなる入力装置 24、 CRT表示装置 26を備えている。 CPU12、 RAM 14

、 ROM16、外部記憶媒体 18、 I/F22,入力装置 24および表示装置 26は、バス 28 を介して相互に接続されて!ヽる。

[0042] 本実施の形態にかかる、ツリー型データ構造を記憶装置上に構築するプログラム、及び、ツリー型データ構造を記憶装置上で変換するプログラムは、 CD— ROM19に収容され、 CD— ROMドライバ 20に読取られても良いし、 ROM16に予め記憶されていても良い。また、いったん CD— ROM19から読み出したものを、外部記憶媒体 1

8の所定の領域に記憶しておいても良い。或いは、上記プログラムは、ネットワーク（図示せず)、外部端子および IZF22を経て外部から供給されるものであっても良い。

[0043] また、本発明の実施の形態に力かる情報処理装置は、コンピュータシステム 10にッリー型データ構造を記憶装置上に構築するプログラム、及び、ツリー型データ構造を記憶装置上で変換するプログラムを実行させることにより実現される。

[0044] [ツリー型データ構造]

図 2A、 Bは、ツリー形式データの一例である POSデータの説明図であり、図 2Aは、このツリー形式データのデータ構造 (即ち、トポロジー)及びデータ値を視覚的に表現した一例であり、図 2Bは、同じツリー形式データを XML形式で表現した一例である。図 2A、 Bに示されるようにツリー型データ構造は、ルート'ノード (本例では、 POS データ）力も始めて、各ノードで枝分かれしてリーフ'ノード (端点）に至るノードとァークの組み合わせによって表現される。各ノードの実体的な値、例えば、店名ノードの値 ="フランス店〃の格納場所は、店名ノードに関連したポインタで指定される。

[0045] 本発明は、ツリー型データ構造のトポロジーを対象とするため、以下の説明では、主として、ツリー型データ構造のトポロジーに関して説明する。

[0046] 従来、このようなツリー型データ構造は、データを蓄えたノード間をポインタで接続すること〖こよって表現されている。しかし、ポインタ表現は、ポインタ値に必然性がないという欠点がある。即ち、ある場合には特定のノード Aがある番地 (例えば、 100番地）に格納され、別の場合には同じノード Aが別の番地 (例えば、 200番地）に格納されるので、ポインタ値が一定ではなぐポインタ値は、本質的にノードの格納アドレスを表現するに過ぎない。そのため、例えば、ノードが深さ優先の規則に従ってポインタで接続されてヽる場合、これらのノードを幅優先の規則に従ってポインタで再接続することは困難である。

[0047] これに対して、本発明者は、ツリー型データ構造のトポロジーがアークリストによって記述可能であることに着目した。アークリストとは、ノード間の親子関係を表すアークのリストである。図 3A〜Cは、アークリストを用いたツリー型データ構造の表現形式の一例の説明図である。同図の例では、 0、 10、 20、 30、 40、 50、 60、 70、 80、 90、 1 00及び 110のノード識別子 (ID)が付与された 12個のノード力もなるツリー型データ構造が示されている。図 3Aはツリー型データ構造の全体を示している。図 3Aにおいて、丸形、ハート形などの図形の中央に記載された数字は、ノード IDを表し、矢印と矢印の側に記載されたく 0, 10 >などの数字の対は、アークを表している。尚、ノード IDは、文字列には限られず、数値、特に、整数でもよい。図 3Bは、親ノード (From — ID)から子ノード (To— ID)へのアークリストを示し、図 3Cは、ノード IDとノード Typ eの対のリストからなるノードリストを示す。尚、ツリー型データ構造を表現するだけの目的のためにはノードリストが無くても構わない。原理的には、このようなアークリストを用いることによって、ノード間の関係をポインタによらずに直接的に記述することが可能である。

[0048] [「子→親」関係に基づく表現]

図 3A〜Cの例では、アークリストは、親ノードに子ノードを対応付ける「親→子」関係に基づいて記述されている。そのため、一つの親ノード、例えば、ルート'ノード 0には、 3個の子ノード 10、 60及び 80が存在するため、アークリストの From— IDには、同じノード IDの 0が 3回出現している。つまり、親ノードを特定しても子ノードを特定することができないので、アークリストは、要素 From— IDの配列と要素 To— IDの配列により構成される。アークリストを使用する場合、あるノードは、 From— IDの配列と、 To— IDの配列の両方の配列に出現する。

[0049] これに対して、親子関係は、「子→親」関係によっても表現することが可能である。この場合、ノード間の親子関係は、ルート'ノード以外のノードである非ルート'ノードの各々と、関連付けられた親ノードと、の組の配列によって表現される。この「子→親」関係によって親子関係を表現する場合、「親→子」関係の場合には得られな力つた重要な性質がある。即ち、一つの子ノードには必ず唯一の親ノードが対応するので、子ノードを特定することによって、この子ノードに対応する唯一の親ノードを直ちに特定することができる。つまり、アークリストは、実際には、要素 To— IDの配列だけを準備すればよい。この結果として、アークリストを格納するための記憶容量が削減される。この記憶容量の削減は、メモリへのアクセス回数が低減するという効果があるので、結果的に、処理の高速ィ匕が実現できる。

[0050] 図 4A〜Cは、本発明の一実施例による「子→親」関係に基づくツリー型データ構造の表現方法の説明図である。図 4Aはツリー全体の説明図であり、図 4Bは「子→親」関係に基づくアークリストである。図 4Bのアークリストは、ルート'ノードに対する親ノードの格納領域を含んでいるので、ルート'ノードの親ノードとして、便宜的に〃—"が設定されている。但し、ルート'ノードに対応する親ノードは存在しないので、図 4Cに示されるように、「子→親」関係に基づくアークリストからルート'ノードに対する親ノードの格納領域を除いても構わない。このように本発明の一実施例では、ルート'ノード以外のノードである非ルート'ノードの各々に対して、非ルート'ノードの親ノードを関連付けることによりノード間の親子関係を表現する。そして、「子→親」表現された子のノード力親のノードのリストを迪ることでツリーのトポロジーを表現することができる

[0051] このような「子→親」関係に基づくツリー型データ構造は、本発明の一実施例によれば、図 5に示されるように、図 1に示されたコンピュータシステム 10に、ルート'ノードを含むノードに固有のノード識別子を付与するノード定義ステップ 501と、前記ルート' ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子に、前記非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付ける親子関係定義ステップ 502と、を実行させることによって RAM14上に構築される。このように、最初に、文字列、浮動小数、整数などの任意の識別情報によってノードにノード識別子を付与し、次に、「子→親」表現に基づいて親子関係を定義することによって、子ノードのノード識別子力親ノードのノード識別子を引く (ルックアップする)ことでツリーのトポロジーを表現することができる。 [0052] [ノード識別子]

好ま、一実施例によれば、ノード定義ステップはノード識別子として数値を使用し、より好ましくは、連続する整数を使用し、更に好ましくは、 0又は 1からの整数連番を使用する。これにより、ノード識別子から、そのノードに対応する親ノードのノード識別子が格納されて、るアドレスを簡単に取得することができるので、子ノードのノード識別子力親ノードのノード識別子を引く処理を高速ィ匕することができる。

[0053] ツリー型データ構造のノードにノード識別子として順序付きの番号を付与してノード間の親子関係を表現する場合、番号の付与順序に規則を定めることによって、その後のツリー型データ構造の取り扱、が容易になると、う利点がある。本発明によれば、この番号の付与順序の規則として、同じ世代のノードよりも子ノードを優先する深さ優先モードと、子ノードよりも同じ世代のノードを優先する幅優先モードが利用される

[0054] 図 6A〜Cは、本発明の一実施例により ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。図 6Aには、各ノードに I D番号が付与されたツリー構造型データが示され、図 6Bには、変換規則が示され、図 6Cには、各ノードに整数連番が付与されたツリー構造型データが示されている。本例の変換規則は、深さ優先で連続番号を付与する規則であり、具体的には、複数の子ノードが存在する場合、長子 (一番上の兄)ノードに最小番号を付与し、末子 (一番下の弟）ノードに大きい番号を付与し、かつ、兄弟ノードよりも子ノードを優先して番号を付与する。本例では、昇順に番号付けをしているが、降順に番号付けをしてもよい。

[0055] また、図 7A〜Cは、本発明の他の一実施例により ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。図 7Aには、各ノードに ID番号が付与されたツリー構造型データが示され、図 7Bには、変換規則が示され、図 7Cには、各ノードに整数連番が付与されたツリー構造型データが示されている。本例の変換規則は、幅優先で連続番号を付与する規則であり、具体的には、複数の子ノードが存在する場合、長子（一番上の兄）ノードに最小番号を付与し、末子（一番下の弟）ノードに大きい番号を付与し、かつ、子ノードよりも兄弟ノードを優先して番号を付与する。本例では、昇順に番号付けをしているが、降順に番号付けをしてもよい。

[0056] このようにノード識別子として番号を使用すると、ノード番号から直ちに、即ち、 0 (1

)のオーダーで、そのノードに関する格納値が格納されているアドレスを引くことができる。また、親子関係を「子→親」表現することによって、子ノードから親ノードを直ちに、即ち、 O (l)のオーダーで引くことができる。

[0057] [深さ優先モード]

本発明の一実施例によれば、図 6Cに示されるような深さ優先に基づくツリー型データ構造は、図 1に示されたコンピュータシステム 10に、

同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数を付与するノード定義ステップと、

ルート ·ノード以外のノードである非ルート ·ノードの各々に付与された整数の順に、非ルート'ノードの各々の親ノードに付与された整数を並べることにより形成される配列を前記記憶装置に格納する親子関係定義ステップと、

を実行させることによって、記憶装置上に構築される。これにより、ノードは深さ優先で連続整数が付与され、ノード間の親子関係は「子→親」関係の配列によって表現される。

[0058] 図 8は、本発明の一実施例による深さ優先に基づくノード定義処理のフローチヤ一トである。このノード定義処理は、コンピュータシステム 10に

最初にルート'ノードに番号を付与するステップ 801と、

既に番号が付与されたあるノードに唯一の子ノードが存在する場合には、当該子ノードに当該あるノードに付与された前記番号の次の番号を付与するステップ 802と、既に番号が付与されたあるノードに複数の子ノードが存在する場合には、当該複数の子ノードの間の兄弟関係に従って、弟ノードは直上の兄ノードの全ての子孫ノードに番号が付与された後に次の番号が付与されるように、一番上の兄ノードから一番下の弟ノードまで番号を付与するステップ 803と、

を実行させる。これにより、深さ優先モードで同一の親ノードから派生した複数の子ノードの間に兄弟関係が定義される。 [0059] 図 9は、本発明の一実施例により図 6Cに示された深さ優先のツリー型データ構造から作成された「子→親」表現に基づく親子関係の配列の説明図である。同図にサブツリー 1又はサブツリー 2として示されているように、深さ優先で連続番号が付与されたノードの親子関係を「子→親」関係に基づいて配列表現すると、あるノードの子孫ノードが連続領域に出現するという優れた性質が得られる。

[0060] 本発明の一実施例では、深さ優先モードの優れた性質を利用することにより、前記配列から、あるノードに付与された整数以上の値が格納されて！ヽる連続領域を抽出することにより、前記あるノードの全ての子孫ノードを特定する。これにより、あるノードの子孫ノードを表すノード群が前記配列内の連続ブロックとして獲得できる。例えば、連続ブロックのサイズを mとすると、あるノードの全ての子孫ノードを特定するための処理速度は、 O (m)のオーダーになる。

[0061] 既に説明したように、ノード間の親子関係は、「子→親」関係の配列の他に、「親→ 子」関係の配列によっても表現できる。図 10は、図 6Cに示された深さ優先のツリー型データ構造力作成された「親→子」表現に基づく親子関係の配列の説明図である。一つの親ノードに対して複数の子ノードが存在し得るので、親子関係の配列は、各ノードに対する子ノードの番号が格納されて、る領域を示すための配列 Aggrと、子ノードの番号が格納されている配列 P→Cの二つの配列により構成される。例えば、配列 Aggrの先頭から 2番目の要素 Aggr [1]の値は" 3"であり、これは、ノード [1]に対する子ノードの番号は、配列 P→Cの要素 P→C [3]以降に格納されていることを表している。これにより、ノード [0]、即ち、ルート'ノードに対する子ノードは、配列 P→C の先頭から 3個の要素、 P→C[0]の 1、 P→C[1]の 6、及び P→C [2]の 8であることがわカゝる。

[0062] この「親→子」表現に基づく親子関係の配列の求め方を説明する。

(1)ノードの番号が配列 P→Cの最大の添字（ = 11)と一致する場合、このノードに属する子ノードは存在しない。したがって、処理は継続されない。

(2)同図に太字で表された親ノードの番号力も Aggr値を求める。この Aggr値は、配列 P→Cの開始点を表す。

(3)太字で表された親ノード番号 + 1に対応する Aggr値を求める。この Aggr値 1 が配列 P→Cの終了点である。

[0063] 例えば、ノード 0の子ノードの開始点は、 Aggr [0]、即ち、 0であり、終了点は、 Agg r[l]— 1、即ち、 3— 1 = 2である。したがって、ノード 0の子ノードは、配列 P→Cの 0 〜2番目の要素、即ち、 1、 6及び 8である。

[0064] 或いは、「親→子」表現に基づく親子関係は、より単純に、親ノード番号の配列と、対応する子ノード番号の配列と、の二つの配列により表現することも可能である。しかし、この配列を利用して親子関係を見つけるためには、親ノードの番号を検索しなければならないので、即ち、 log (n)のアクセス時間を要するので効率が悪い。

[0065] [幅優先モード]

本発明の一実施例によれば、図 7Cに示されるような幅優先に基づくツリー型データ構造は、図 1に示されたコンピュータシステム 10に、

子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数を付与するノード定義ステップと、

前記ルート'ノード以外のノードである非ルート'ノードの各々に付与された整数の順に、前記非ルート'ノードの各々の親ノードに付与された整数を並べることにより形成される配列を前記記憶装置に格納する親子関係定義ステップと、

を実行させることによって、記憶装置上に構築される。これにより、ノードは幅優先モードで連続整数が付与され、ノード間の親子関係は「子→親」関係の配列によって表現される。

[0066] 図 11は、本発明の一実施例による幅優先に基づくノート定義処理のフローチャートである。このノード定義処理は、コンピュータシステム 10に、

各ノードが前記ルート'ノードから何世代目のノードである力及び、各世代に含まれるノード数を算出するステップ 1101と、

最初に前記ルート ·ノードに番号を付与するステップ 1102と、

ある世代に含まれる全てのノードに番号が付与されたならば、当該ある世代の次の世代にノードが存在しなくなるまで、当該次の世代に含まれる全てのノードに対して、親ノードが異なる場合には、当該親ノードに番号が付与された順番に当該ノードに番号を付与し、当該親ノードが同一である場合には、当該親ノードから派生した複数の子ノードの間に兄弟関係を定義し、一番上の兄ノードから一番下の弟ノードまで直前に付与された番号の次の番号から連続的に変化する固有の整数を順に付与するステツプ 1013と、

を実行させる。これにより、幅優先モードで同一の親ノードから派生した複数の子ノードの間に兄弟関係が定義される。

[0067] 図 12は、本発明の一実施例により図 7Cに示された幅優先のツリー型データ構造から作成された「子→親」表現に基づく親子関係の配列の説明図である。同図に示されているように、幅優先で連続番号が付与されたノードの親子関係を「子→親」関係に基づいて配列表現すると、あるノードの子ノードは連続領域に出現するという優れた性質が得られる。これは、幅優先モードで連続番号が付与されたノードの親子関係を「子→親」関係に基づいて配列表現すると、親ノードに付与された番号が前記配列中に順序付き (昇順又は降順)で出現することによる。

[0068] したがって、本発明の一実施例では、幅優先モードの優れた性質を利用することにより、前記配列から、あるノードに付与された整数と同じ値が格納されている連続領域を抽出することにより、前記あるノードの全ての子ノードを特定する。これにより、あるノ一ドの子ノードを、例えば、二分探索などの手法を用いて検索することが可能であり、即ち、 O (log (n) )のオーダーで検索することが可能になる。

[0069] 既に説明したように、ノード間の親子関係は、「子→親」関係の配列の他に、「親→ 子」関係の配列によっても表現できる。図 13は、図 7Cに示された幅優先のツリー型データ構造力作成された「親→子」表現に基づく親子関係の配列の説明図である。図 13—つの親ノードに対して複数の子ノードが存在し得るので、親子関係の配列は、各ノードに対する子ノードの番号が格納されて、る領域を示すための配列 Aggrと、子ノードの番号が格納されている配列 P→Cの二つの配列により構成される。例えば、配列 Aggrの先頭から 2番目の要素 Aggr [1]の値は" 3"であり、これは、ノード [1] に対する子ノードの番号は、配列 P→Cの要素 P→C [3]以降に格納されて!、ることを表している。これにより、ノード [0]、即ち、ルート'ノードに対する子ノードは、配列 P →Cの先頭から 3個の要素、 P→C[0]の 1、 P→C[1]の 2、及び、 P→C[2]の 3であることがゎカゝる。 [0070] この「親→子」表現に基づく親子関係の配列の求め方を説明する。

[0071] 例えば、ノード 0の子ノードの開始点は、 Aggr[0]、即ち、 0であり、終了点は、 Agg r[l]— 1、即ち、 3— 1 = 2である。したがって、ノード 0の子ノードは、配列 P→Cの 0 〜2番目の要素、即ち、 1、 2及び 3である。

[0072] [頂点ノードおよび部分ツリー群]

上述したツリーにおいて、ルート'ノードに最も近いノードの値で、当該ノードおよびそのノードから枝分かれしてリーフ'ノード (端点）に至るまでの全てのノードを表現することを考える。ここで、あるノードおよびそのノードから枝分かれしてリーフ'ノードに至るまでのノード群を、部分ツリーと称する。また、上記ノード (ルート'ノード）に最も近ソードを頂点ノードと称する。

[0073] 図 14Aは、前述した幅優先モードに基づくツリー型データ構造、図 14Bは、当該ッリー型データ構造を、「子→親」表現に基づく親子関係の配列を示す図である。たとえば、頂点ノード [4]は、ノード識別子 {4, 8, 9}を含み、頂点ノード [6]は、ノード識別子 {6}を含み、また、頂点ノード [3]は、ノード識別子 {3, 7, 10, 11 }を含む。このような、複数の頂点ノードからなる配列を、頂点ノードリストと称する。頂点ノードリストにより複数の部分ツリーを指定でき、指定された複数の部分ツリーを部分ツリー群と称する。

[0074] 以下、頂点ノードリストを、 [a, b, · · ·]と表す。ここに、「a」、」、 · · ·は、頂点ノードに対応するノード識別子である。頂点ノードリストを構成する頂点ノードの各々を展開して、当該頂点ノードを頂点とする部分ツリーに含まれるすべてのノードのノード識別子を求めることを考える。求められたノード識別子のリストにおいて、あるノード識別子は 1つしか存在しない場合、すなわち、ノード識別子が重複して出現しない場合、このような部分ツリー群を、「正規部分ツリー群」と称する。そうでないような部分ツリー群を、「非正規部分ツリー群」と称する。

[0075] 正規部分ツリー群であっても、非正規部分ツリー群であっても、頂点ノードリストによつて、頂点ノードおよびその子孫ノードからなる部分ツリー群を特定することができる

。たとえば、図 15Aに示すように、頂点ノードリスト [4, 6, 3]により、図 15Bに示すような部分ツリー群 (部分ツリー {4, 8, 9}、 {6}、 {3, 7, 10, 11 })が特定される。

[0076] 頂点ノードリストにより特定される部分ツリー群は、検索、集計、ソート、集合演算の対象とすることができる。

[0077] たとえば、図 15A、 Bの例で、「ハート形」のノードを含む部分ツリーを検索すると、図 16Bに示すような部分ツリー群が得られる。図 16Aは、この部分ツリー群を表す頂点ノードリストである。

[0078] また、各部分ツリーに属するノード数魏計すると、図 17Bに示すようになる。図 17 Aにおいて、配列 1701は頂点ノードリスト、配列 1702は、各頂点ノードにより特定される部分ツリーに属するノード数を示す配列である。

[0079] たとえば、ソートとして、各部分ツリーに属するノード数によるソートを考えることができる。図 18A中、配列 1801は、ソートされた頂点ノードリスト、配列 1802は、頂点ノ一ドリストにより特定される部分ツリーに属するノード数を示す配列である。また、図 1 8Bは、部分ツリーがノード数にしたがってソートされた状態を示す。

[0080] さらに、複数の部分ツリー群の間の集合演算として、論理積について説明する。図 14A、 Bに示すツリーにおいて、図 19Bに示す部分ツリー群 (対応する頂点ノードリストを図 19Aに示す）と、図 19Dに示す部分ッリ一群 (対応する頂点ノードリストを図 19 Cに示す）との論理積を考える。

[0081] 図 19Bにおける、ノード識別子「4」の頂点ノードにて特定される部分ツリー 1901と、図 19Dにおける、ノード識別子「1」の頂点ノード識別子にて特定される部分ツリー 1 911とを比較すると、部分ツリー 1901は、部分ツリー 1902に包含される。図 19Bにおける部分ツリー 1902と包含関係をもつような部分ツリーは、図 19Dに示す部分ッリ一群には存在しない。また、図 19Bにおけるノード識別子「3」の頂点ノードにて特定される部分ツリー 1903と、図 19Dにおける、ノード識別子「7」にて特定される部分ッリー 1913とを比較すると、部分ツリー 1913は、部分ツリー 1903に包含される。その結果、論理積演算の結果を示す頂点ノードリストは、図 20Aに示すように、 [4, 7]となる。図 20Bは、論理積演算の結果に対応する部分ツリー群である。

[0082] 図 16A、 B〜図 20A、 B力も理解できるように、頂点ノードリスト (集計においては、これに加えて、頂点ノードリストと同一サイズの、集計結果 (ノード数)を格納する配列）によって、それぞれの処理や演算の結果を表わすことができる。

[0083] [頂点ノードの移動]

表形式のデータでは、項目が規則的に並んでいるので、表示、編集の対象となるセル (或いは列や行)を指定する操作は簡単に実行可能である。その一方、ツリーのデータは、ノードが規則的に並んでいないので、表示、編集、集計の対象となるノード (表形式データの「セル」に該当する)群を特定する操作が不可欠となる。上述した頂点ノードにより、このような表示、編集、集計などの操作を行う対象のノード群を指定することができる。表示、編集、集計などの操作対象となるノード群を指定するノードをコンテキストノードと称することもある。したがって、本明細書において、頂点ノードは、コンテキストノードと同じ機能をもつ。

[0084] 上述した検索、集計、ソード、集合演算は、頂点ノードリスト中の値と異なる新たな値が出現しない操作であった。ところが、部分ツリー群を対象とした操作においては、ツリーのトポロジーを移動することが求められることがしばしば生じる。

[0085] たとえば、親を頂点ノードとして、家族構成を表わすようなツリーを考える。現在、母親のノードに、頂点ノードが位置しているが、子供全員の一覧を得たい場合には、頂点ノードを、母親から子供に移動する場合が考えられる。なお、正規部分ツリー群の頂点ノードリストであっても、頂点ノードを移動した後の頂点ノードリストは、正規部分ツリー群になるとは限らず、非正規部分ツリー群になる場合もある。

[0086] 以下、頂点ノードを移動する例について説明する。図 21Bに示すツリーにおいて、図 21Aの頂点ノードリストに示されるように、ノード識別子「1」、「2」および「3」のノードが、それぞれ、頂点ノードであるときに、当該頂点ノードを、「子供」に相当するノードに移動する場合を考える。なお、図 21B、 Dにおいて、矢印を付されたノードが、頂点ノードであることを示す。 [0087] この場合には、図 22Dに示すように、ノード識別子「1」の頂点ノードは、ノード識別子「4」および「5」のノードに移動する。また、ノード識別子「2」の頂点ノードは、ノード識別子「6」のノードに移動するとともに、ノード識別子「3」の頂点ノードは、ノード識別子「7」のノードに移動する。その結果、移動後の頂点ノードを表わす頂点ノードリストは、図 21Cに示すように、 [4, 5, 6, 7]となる。

[0088] 図 21Dに示すように、ノード識別子「4」、「5」、「6」および「7」のノードが頂点ノードであるときに、頂点ノードを、「親」に相当するノードに移動する場合を考える。ノード識別子「4」の頂点ノード、および、ノード識別子「5」の頂点ノードは、それぞれ、ノード識別子「1」のノードに移動する。また、ノード識別子「6」の頂点ノードは、ノード識別子「2」のノードに移動し、ノード識別子「7」の頂点ノードは、ノード識別子「3」のノードに移動する。その結果、移動後の頂点ノードを表わす頂点ノードリストは、 [1, 1, 2, 3]となる。

[0089] 次に、図 23Bに示すように、ノード識別子「1」、「2」、「3」のノードが頂点ノードであるときに、頂点ノードを、同じ世代で、かつ、すぐ下の「弟」のノード、つまり、本発明にかかるノード識別子の付与規則にしたがえば、同じ世代で、かつ、親ノードが同一であるノードのうち、最も近いノード識別子を有するノードに移動させることを考える（図 23Bの破線矢印参照)。ここに、「弟」のノードは、頂点ノードと同世代のノードであつて、当該頂点ノードの親ノードから頂点ノードに対してアークが接続された後に、ァークが接続されるようなノードと考える。また、「兄」のノードとは、当該頂点ノードと同世代のノードであって、当該頂点ノードの親ノード力頂点ノードに対してアークが接続される以前に、アークが接続されているノードと考える。

[0090] 図 23B、図 23Dに示すように、ノード識別子「1」の頂点ノードは、ノード識別子「2」のノードに移動し、ノード識別子「2」の頂点ノードは、ノード識別子「3」のノードに移動する。その一方、ノード識別子「3」の頂点ノードは、「弟」のノードが存在しないため消滅する。したがって、図 23Cに示すように、移動後の頂点ノードを表わす頂点ノードリストは、 [2, 3]となる。

[0091] [頂点ノードを移動させる際の処理 (幅優先モード) ]

以下、本発明の実施の形態において、頂点ノードを移動させる際に実行される処理について説明する。まず、幅先モードに基づくツリー型データ構造力作られた「子→親」表現に基づく配列 (C P配列）を利用した場合の頂点ノードの移動について説明する。

[0092] 図 24は、頂点ノードを子供に相当するノードに移動する際に、コンピュータシステム 10において実行される処理を示すフローチャートである。図 24に示すように、コンビユータシステム 10は、頂点ノードのノード識別子が格納された頂点ノードリストの値を参照して (ステップ 2401)、 C— P配列中、当該頂点ノードリストの値 (ノード識別子）と同一の値を検索する（ステップ 2402)。次いで、コンピュータシステム 10は、 C— P配列において頂点ノードのノード識別子を同一の値を有するノードのノード識別子を、新たな頂点ノードリストに格納する（ステップ 2403)。ステップ 2401〜2403の処理を全ての頂点ノードリスト中の値について実行することで (ステップ 2404参照）、新たな頂点ノードリストには、子供に相当するノードに移動された頂点ノードのノード識別子が格納される。

[0093] 図 25Aの例において、頂点ノードリストが [1, 2, 3]であると考える。ノード識別子「1 」の頂点ノード (矢印参照）に着目すると、 C— P配列を検索した結果、ノード識別子「 4」および「5」について、 C— P配列の値力頂点ノードリスト中の値「1」と同様であることがわかる（図 25B参照)。そこで、新たな頂点ノードリストには、値「4」および「5」が格納される。なお、幅優先モードにおける C P配列では、値が昇順であるため、ステップ 2402の検索は容易である。他の頂点ノードリスト中の値「2」、「3」についても同様の処理を実行する結果、新たな頂点ノードリスト [4, 5, 6, 7]を得ることができる。

[0094] 図 26は、頂点ノードを親に相当するノード (親ノード）に移動する際に、コンピュータシステム 10において実行される処理を示すフローチャートである。図 26に示すように、コンピュータシステム 10は、頂点ノードリストの値を参照して (ステップ 2601)、当該頂点ノードリストの値が示す C P配列の値を取得する（ステップ 2602)。コンビユータシステム 10は、取得した値を、新たな頂点ノードリストに格納する (ステップ 2603)。ステップ 2601〜2603の処理を全ての頂点ノードリスト中の値について実行することで (ステップ 2604参照）、新たな頂点ノードリストには、親に相当するノードに移動された頂点ノードのノード識別子が格納される。 [0095] 図 27Aにおいて、頂点ノードリストが [4, 5, 6, 7]であると考える。ノード識別子「4」の頂点ノード (矢印参照）に着目すると、ノード識別子「4」に対応する C P配列の値は、「1」であるため、この値が、新たな頂点ノードリストに格納される。同様に、頂点ノ一ドリストに格納された他のノードのノード識別子「5」、「6」および「7」について、それぞれ、対応する C— P配列の値は、「1」、「2」、「3」となる。したがって、新たな頂点ノ一ドリストは、 [1, 1, 2, 3]となる。

[0096] 図 28は、頂点ノードを、弟に相当するノード (弟ノード）に移動する際に、コンビユータシステム 10において実行される処理を示すフローチャートである。図 28に示すように、コンピュータシステム 10は、頂点ノードリストの値を参照して (ステップ 2801)、当該頂点ノードリストの値が示す C— P配列の値 (ノード識別子）を取得する (ステップ 28 02)。続いて、コンピュータシステム 10は、当該頂点ノードの次の値 (本実施の形態では、もとの値に「1」を加えた値)が示す C— P配列の値 (ノード識別子)を取得する（ステップ 2803)。

[0097] 次いで、コンピュータシステム 10は、取得した 2つの値を比較して、両者が一致する場合には (ステップ 2804でイエス (Yes))、上記次の値 (ノード識別子）を、新たな頂点ノードリストに格納する (ステップ 2805)。その一方、両者が一致しない場合には、処理対象となって、る頂点ノードが移動すると、消滅すると判断される。

[0098] コンピュータシステム 10は、ステップ 2601〜2603の処理を全ての頂点ノードリスト中の値について実行することで (ステップ 2806参照）、新たな頂点ノードリストには、弟に相当するノードに移動された頂点ノードのノード識別子が格納される。

[0099] 図 29Aにおいて頂点ノードリストが [4, 5, 6, 7]であると考える。ノード識別子「4」の頂点ノード (矢印参照）に着目すると、ノード識別子「4」に対応する C P配列の値は、「1」であり、ノード識別子「5」に対応する C— P配列の値も「1」である。したがって両者は一致するため、ノード識別子「5」が、新たな頂点ノードリストに格納される。ノード識別子「5」、「6」および「7」については、それぞれ、自身に対応する C P配列の値と、自身の値に「1」をカ卩えたものに対応する C P配列の値とが相違するため、頂点ノードは消滅する。したがって、新たな頂点ノードリストは、 [5]となる。

[0100] なお、頂点ノードを、「兄」に相当するノードに移動させる場合には、頂点ノードリスト中のノード識別子が示す C P配列の値と、当該ノード識別子の一つ前のノード識別子（つまり、値が「一 1」であるようなノード識別子）が示す C P配列の値とを比較すればよい。

[0101] [頂点ノードを移動させる際の処理 (深さ優先モード) ]

以下、本発明の実施の形態において、頂点ノードを移動させる際に実行される処理について説明する。まず、深さ優先モードに基づくツリー型データ構造力作られた「子→親」表現に基づく配列 (C P配列)を利用した場合の頂点ノードの移動について説明する。

[0102] 深さ優先モードの下においても、頂点ノードを子供に相当するノードに移動する際に、コンピュータシステム 10において実行される処理は、図 24に示すものと同様である。なお、深さ優先モードにおける C— P配列では、値は昇順とはなっていない。しかしながら、子供に相当するノードは、頂点ノードリスト中のノード識別子の次の (本実施の形態では値に「1」が加えられた)ノード識別子から、ノード識別子が示す C— P 配列の値が、頂点ノードリストの値より小さくなるようなノード識別子の一つ手前 (本実施の形態では、そのようなノード識別子より「1」だけ小さいノード識別子)のノードの範囲に現れる。

[0103] したがって、子供に相当するノードを検索する際には、図 30に示すように、コンビュータシステム 10は、頂点ノードリスト中のノードを基準ノードとして、当該基準ノードの次の位置（つまり、基準ノードのノード識別子に「1」を加えたノード識別子が示す位置 )に、検索用ポインタを配置し (ステップ 3001)、検索用ポインタが示す C— P配列の値を特定する (ステップ 3002)。次いで、特定された値が、基準ノードのノード識別子と同じであるかが判断される（ステップ 3003)。ステップ 3003でイエス (Yes)と判断された場合には、コンピュータシステム 10は、検索用ポインタが位置するノード識別子を、新たな頂点ノードリストに格納する (ステップ 3004)。その後、検索用ポインタが 1 つ進められる（ステップ 3005)。

[0104] その一方、ステップ 3003でノー (No)と判断された場合には、 C— P配列の値力基準ノードのノード識別子以上であるかを判断する（ステップ 3006)。ステップ 3006でイエス (Yes)と判断された場合には、検索用ポインタが位置するノード識別子のノードは、基準ノードの子孫であるため、次の処理のため、検索用ポインタが 1つ進められる (ステップ 3005)。ステップ 3006でノー (No)であることは、検索用ポインタが位置するノード識別子のノードは、頂点ノードの子孫ではないため、処理を終了させる。

[0105] 図 31Aの例において、頂点ノードリストが [1, 6, 8]であると考える。ノード識別子「1 」の頂点ノード (矢印参照）に着目する。検索用ポインタは、初期的には、ノード識別子「2」の位置に配置される。この時点で、検索用ポインタが示す C P配列の値は、「 1」であるため、ノード識別子「2」が新たな頂点ノードリストに格納される。

[0106] また、検索用ポインタが、ノード識別子「5」に配置されるときに、当該検索用ポインタが示す C— P配列の値は、「1」であるため、ノード識別子「5」が新たな頂点ノードリストに格納される。その後、検索用ポインタがノード識別子「6」には位置されるときに、当該検索用ポインタが示す C P配列の値は「0」であり、基準ノードのノード識別子「1」より小さいため、処理自体が終了する。

[0107] 次に、頂点ノードを親に相当するノードに移動する際に、コンピュータシステム 10にて実行される処理について説明する。親に相当するノードに移動する際の処理は、図 26に示すものと同様である。図 32Aの例において、頂点ノードリストが [2, 5, 7, 9 ]であると考える。ノード識別子「2」の頂点ノード (矢印参照）に着目すると、ノード識別子「2」に対応する C— P配列の値（図 32B参照）は、「1」であるため、この値が、新たな頂点ノードリストに格納される。同様に、ノード識別子「5」、「7」、「9」について、それぞれ、対応する C P配列の値は「1」、「6」、「8」であるため、新たな頂点ノードリストは、 [1, 1, 6, 8]となる。

[0108] 図 33は、頂点ノードを弟に相当するノードに移動する際に、コンピュータシステム 1 0において実行される処理を示すフローチャートである。図 33に示すように、コンビュータシステム 10は、頂点ノードリストの値を参照して (ステップ 3301)、当該頂点ノードリストの値が示す C— P配列の値 (ノード識別子）を取得する (ステップ 3302)。次ヽで、コンピュータシステム 10は、次のノード識別子（「1」だけ値が大きいノード識別子 )以降で、同一の C— P配列の値をもつノード識別子を検索する (ステップ 3303)。同一の値が見つかれば (ステップ 3304でイエス (Yes))、コンピュータシステム 10は、その値を有するノード識別子を、新たな頂点ノードリストに格納する (ステップ 3305)。同一の値が見つからない場合には、当該頂点ノードは消滅したと判断される。

[0109] コンピュータシステムは、ステップ 3301〜3305の処理を全ての頂点ノードリストの値について実行することで (ステップ 3306)、新たな頂点ノードリストには、弟に相当するノードに移動された頂点ノードのノード識別子が格納される。図 34Aにおいて、頂点ノードリストが [2, 5, 7, 9]であると考える。ノード識別子「2」の頂点ノードに着目すると、ノード識別子に対応する C— P配列の値は「1」である。図 33の処理によって、 C— P配列の値力「l」であるようなノード識別子「5」を検索することができるため、頂点ノードリストには、ノード識別子「5」が格納される。ノード識別子「5」、「7」、「9」の頂点ノードについては、 C— P配列を検索しても、同一の値を見出すことができない。つまり、親ノードとして同じ番号をもつノードを見出すことが出来ない。したがって、これら頂点ノードは、移動によって消滅する。その結果、新たな頂点ノードの頂点ノードリストは「5」となる。

[0110] [情報処理装置]

図 35は、本発明の一実施例に力かるツリー型データ構造を構築し、頂点ノードリストを生成し、かつ、頂点ノードの移動後の頂点ノードリストを生成する情報処理装置 3 500の機能ブロックダイヤグラムである。この情報処理装置 3500は、実際には、図 1 に示すコンピュータシステム 10に必要なプログラムをインストールすることにより実現される。

[0111] 図 35に示すように、情報処理装置 3500は、ツリー型データ構造を表現するデータ、および、頂点ノードリストを記憶する記憶部 3501と、ルート'ノードを含むノードに固有のノード識別子を付与し、ノード識別子を記憶部 3501に格納するノード定義部 35 02と、前記ルート'ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子に、前記非ルート'ノードの各々の親ノードに付与されたノード識別子を関連付け、当該関連付けを示す配列である C— P配列を記憶部 3501に格納する親子関係定義部 3503と、記憶部 3501に格納されたノード識別子および C— P配列に基づいて、頂点ノードリストを生成する頂点ノードリスト生成部 3504と、入力装置（図 1の符号 24参照）など力もの指示にしたがって、頂点ノードを移動させ、移動後の頂点ノードを示す新たな頂点ノードリストを生成する頂点ノード移動処理部 3505とを備えている。頂点ノードリスト生成部 35にて生成された頂点ノードリストや、頂点ノード移動処理部 3505にて生成された新たな頂点ノードリストは、記憶部 3501に記憶される。

[0112] 好ましくは、ノード定義部 3502は、ノード識別子として数値を用い、より好ましくは、ノード識別子として連続する整数を用いる。また、親子関係定義部 3503は、非ルート 'ノードの各々に付与されたノード識別子と、関連付けられた親ノードに付与されたノード識別子と、の組の配列を記憶部 3501に格納する。

[0113] また、入力装置（図 1の符号 24参照)からの指示などにより、ノードが指定されると、頂点ノードリスト生成部 3504は、指定されたノードのノード識別子を、頂点ノードリスト中に格納する。また、入力装置からの指示などにより、頂点ノードの移動の指示 (親に相当するノードへの移動、子に相当するノードへの移動、弟（兄）に相当するノードへの移動）が与えられると、頂点ノード移動処理部 3505は、 C P配列および頂点ノ一ドリストを、記憶部 3501から取得して、新たな頂点ノードリストを生成し、記憶部 35 01に記憶する。

[0114] 本発明は、以上の実施の形態に限定されることなぐ特許請求の範囲に記載された発明の範囲内で、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

図面の簡単な説明

[0115] [図 1]図 1は、本発明の実施の形態に力かるツリー型データ構造を取り扱うコンビユータシステムのブロックダイヤグラムである。

[図 2]図 2A、 Bは、ツリー形式データの一例である POSデータの説明図であり、図 2 は、このツリー形式データのデータ構造 (即ち、トポロジー)及びデータ値を視覚的に表現した例であり、図 2Bは、同じツリー形式データを XML形式で表現した例である。

[図 3]図 3A〜Cは、それぞれ、アークリストを用いたツリー型データ構造の表現形式の一例の説明図である。

[図 4]図 4A〜Cは、本発明の一実施例による「子→親」関係に基づくツリー型データ構造の表現方法の説明図である。

[図 5]図 5は、本発明の一実施例によるツリー型データ構造を記憶装置上に構築する方法のフローチャートである。 [図 6]図 6A〜Cは、本発明の一実施例により ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。

[図 7]図 7A〜Cは、本発明の他の一実施例により ID形式のツリー構造型データを整数連番形式のツリー構造型データへ変換する処理の説明図である。

[図 8]図 8は、本発明の一実施例による深さ優先に基づくノード定義処理のフローチヤートである。

[図 9]図 9は、本発明の一実施例により作成された「子→親」表現に基づく親子関係の配列の説明図である。

[図 10]図 10は、図 6Cに示された深さ優先のツリー型データ構造から作成された「親 →子」表現に基づく親子関係の配列の説明図である。

[図 11]図 11は、本発明の一実施例による幅優先に基づくノード定義処理のフローチヤートである。

[図 12]図 12は、本発明の一実施例により作成された「子→親」表現に基づく親子関係の配列の説明図である。

[図 13]図 13は、図 7Cに示された幅優先のツリー型データ構造から作成された「親→ 子」表現に基づく親子関係の配列の説明図である。

[図 14]図 14Aは、幅優先モードに基づくツリー型データ構造、図 14Bは、当該ツリー型データ構造を、「子→親」表現に基づく親子関係の配列を示す図である。

[図 15]図 15Aは、頂点ノードリストの例、図 15Bは、頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 16]図 16Aは、検索処理により得られた頂点ノードリストの例、図 16Bは、頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 17]図 17Aは、集計処理により得られた頂点ノードリストおよび集計結果を示す配列の例、図 17Bは、頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 18]図 18Aは、ノード数でソートされた頂点ノードリスト、および、対応するノード数を示す配列の例、図 18Bは、頂点ノードリストで特定される部分ツリーの例を示す図である。

[図 19]図 19A、 Cは、それぞれ、論理積演算の対象となる頂点ノードリストの例、図 19 B、 Dは、それぞれ頂点ノードリストで特定される部分ツリー群の例を示す図である。

[図 20]図 20Aは、論理積演算の結果を示す頂点ノードリストの例、図 20Bは、頂点ノ一ドリストで特定される部分ツリー群を示す図である。

[図 21]図 21Aは、本実施の形態に力かる頂点ノードリスト、図 21Bは、頂点ノードを矢印で示したツリーの例、図 21Cは、頂点ノードを子供に相当するノードに移動したときの頂点ノードリスト、図 21Dは、移動した頂点ノードを矢印で示したツリーの例を示す図である。

[図 22]図 22Aは、本実施の形態に力かる頂点ノードリスト、図 22Bは、頂点ノードを矢印で示したツリーの例、図 22Cは、頂点ノードを親に相当するノードに移動したときの頂点ノードリスト、図 22Dは、移動した頂点ノードを矢印で示したツリーの例を示す図である。

[図 23]図 23Aは、本実施の形態に力かる頂点ノードリスト、図 23Bは、頂点ノードを矢印で示したツリーの例、図 23Cは、頂点ノードを弟に相当するノードに移動したときの頂点ノードリスト、図 23Dは、移動した頂点ノードを矢印で示したツリーの例を示す図である。

[図 24]図 24は、頂点ノードを子供に相当するノードに移動する際に、コンピュータシステムにおいて実行される処理を示すフローチャートである。

[図 25]図 25Aは、ツリーの例を示す図、図 25Bは、頂点ノードを子供に相当するノードに移動する処理を説明する図である。

[図 26]図 26は、頂点ノードを親に相当するノードに移動する際に、コンピュータシステムにおいて実行される処理を示すフローチャートである。

[図 27]図 27Aは、ツリーの例を示す図、図 27Bは、頂点ノードを親に相当するノードに移動する処理を説明する図である。

[図 28]図 28は、頂点ノードを、弟に相当するノードに移動する際に、コンピュータシステムにおいて実行される処理を示すフローチャートである。

[図 29]図 29Aは、ツリーの例を示す図、図 29Bは、頂点ノードを弟に相当するノードに移動する処理を説明する図である。

[図 30]図 30は、子供に相当するノードを検索する際に、コンピュータシステムにて実

行される処理を示すフローチャートである。

[図〇 31]図 31Aは、ツリーの例を示す図、図 31Bは、頂点ノードを子供に相当するノードに移動する処理を説明する図である。

[図 32]図 32Aは、ツリーの例を示す図、図 32Bは、頂点ノードを親に相当するノードに移動する処理を説明する図である。

[図 33]図 33は、頂点ノードを弟に相当するノードに移動する際に、コンピュータシステムにおいて実行される処理を示すフローチャートである。

[図 34]図 34Aは、ツリーの例を示す図、図 34Bは、頂点ノードを弟に相当するノードに移動する処理を説明する図である。

[図 35]図 35は、本実施の形態に力かるツリー型データ構造、および、頂点ノードリストを記憶装置上に構築する情報処理装置の機能ブロックダイヤグラムである。

符号の説明

コンピュータシステム

12 CPU

14 RAM

16 ROM

18 固定記憶装置

20 CD— ROMドライバ

22 I/F

24 入力装置

26 表示装置

3500 情報処理装置

3501 n己' 1思 ρβ

3502 ノード定義部

3503 親子関係定義部

3504 頂点ノード生成部

3505 頂点ノード移動処理部

Claims

請求の範囲

[1] ノードに固有のノード識別子が付与され、

ノード間の親子関係がルート'ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子と、非ルート'ノードの各々に関連付けられた親ノードのノード識別子との組からなる第 1の配列によって表現された、ツリー型データ構造のデータを備えたコンピュータにおいて、

の何れかに移動させて、移動後の新たな頂点ノードのノード識別子を格納した第 3 の配列を生成するステップと、を備えたことを特徴とする配列の生成方法。

[2] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記頂点ノードの各々を、子ノードに移動させるために、前記第 3の配列を生成するステップが、前記第 1の配列中、頂点ノードのノード識別子が格納された格納位置を特定するステツプと、

移動後の頂点ノードのノード識別子を、当該格納位置に対応するノード識別子と決定するステップと、を有することを特徴とする請求項 1に記載の方法。

[3] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

移動後の頂点ノードのノード識別子を、前記対応する位置に格納されたノード識別子と決定するステップと、を有することを特徴とする請求項 1に記載の方法。

[4] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 1のノード識別子と、第 2のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 2のノード識別子の格納位置に対応するノード識別子と決定するステップと、を有することを特徴とする請求項 1に記載の方法。

[5] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 1のノード識別子と、第 3のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 3のノード識別子の格納位置に対応するノード識別子と決定するステップと、を有することを特徴とする請求項 1に記載の方法。

[6] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

[7] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、前記第 1の配列が、前記ルート'ノード以外のノードである非ルート'ノードの各々に付与された整数の順に、前記非ルート'ノードの各々の親ノードに付与された整数を並べることにより形成され、

[8] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 4のノード識別子の格納位置のうち、最大の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を有することを特徴とする請求項 1に記載の方法。

[9] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 5のノード識別子の格納位置のうち、最小の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を有することを特徴とする請求項 1に記載の方法。ノードに固有のノード識別子が付与され、

ノード間の親子関係がルート'ノード以外のノードである非ルート'ノードの各々に付与されたノード識別子と、非ルート'ノードの各々に関連付けられた親ノードのノード識別子との組からなる第 1の配列によって表現された、ツリー型データ構造のデータを備えたコンピュータにより読み取り可能なコンピュータプログラムであって、前記コンピュータに、

b)当該頂点ノードとアークで直接結ばれ、かつ、当該アークがそこ力頂点ノードまで延びるような親ノード、 c)当該頂点ノードと同世代のノードであって、当該頂点ノードの親ノードから頂点ノードに対してアークが接続される以前に、アークが接続されている兄ノード、並びに、 d)当該頂点ノードと同世代のノードであって、当該頂点ノードの親ノードから頂点ノードに対してアークが接続された後に、アークが接続される弟ノード

の何れかに移動させて、移動後の新たな頂点ノードのノード識別子を格納した第 3 の配列を生成するステップと、を実行させることを特徴とする配列生成プログラム。

[11] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

移動後の頂点ノードのノード識別子を、当該格納位置に対応するノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム。

[12] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

移動後の頂点ノードのノード識別子を、前記対応する位置に格納されたノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム [13] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 1のノード識別子と、第 2のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 2のノード識別子の格納位置に対応するノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム。

[14] 子ノードよりも同じ世代のノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 1のノード識別子と、第 3のノード識別子とがー致する場合に、前記移動後の頂点ノード識別子を、前記第 3のノード識別子の格納位置に対応するノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム。

[15] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

[16] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

移動後の頂点ノードのノード識別子を、前記対応する位置に格納されたノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム

[17] 同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 4のノード識別子の格納位置のうち、最大の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム。

同じ世代のノードよりも子ノードを優先して、ルート'ノードを含むノードに固有の連続する整数が付与され、

前記第 5のノード識別子の格納位置のうち、最小の格納位置を特定するステップと前記移動後の頂点ノードのノード識別子を、前記最大の格納位置に対応するノード識別子と決定するステップと、を実行させることを特徴とする請求項 10に記載のプログラム。