JP5152877B2

JP5152877B2 - 文書ベースシステムにおける文書データ記憶方法およびその装置

Info

Publication number: JP5152877B2
Application number: JP2010520410A
Authority: JP
Inventors: ▲東▼▲臨▼ 王; ▲海▼峰姜; ▲寧▼▲勝▼ ▲劉▼; 立▲偉▼ 王
Original assignee: サーセンコーポレイション
Priority date: 2007-08-15
Filing date: 2008-08-15
Publication date: 2013-02-27
Anticipated expiration: 2028-08-15
Also published as: EP2180413A1; WO2009021465A1; JP2010536105A; US20100146005A1; CN101369268A; US8423521B2; CN101369268B; EP2180413A4

Description

本発明は文書記憶の技術に関し、特に、文書ベースシステムにおける文書データ記憶方法およびその装置に関する。

文書ベースシステムは複雑なソフトウェアシステムであり、膨大な電子文書の組織、管理、セキュリティ、記憶や表示などの機能を提供している。従来の文書ベースシステムにおいて、文書データの記憶方式は、全ての文書データを１つのファイルとして記憶するものである。ファイルにアクセスすることにより、データの更新や問合せを実現する。しかし、情報量が次第に増加するに伴って、文書ベースシステムに格納された文書データ量も急速に増加する。これら膨大なデータの全てが１つのファイルとして記憶されるため、データの更新や問合せは非常に複雑になり、ユーザの興味のある内容に迅速に位置決めすることができず、内容抽出の効率は低くなってしまう。上記からわかるように、従来の記憶方式は、次第に増加する膨大なデータに既に適応することができない。

本発明の実施例は、文書ベースシステムにおける文書データ記憶方法およびその装置を提供することにより、文書内容に対して柔軟かつ効率的な検索や内容抽出を行うことを実現できる。

本発明の実施例に係る文書ベースシステムにおける文書データ記憶方法は、
前記文書データがツリー構造で記述され、
前記文書データを記憶する際に、
前記文書データを前記ツリー構造で複数のデータ片に分割し、
前記ツリー構造で前記複数のデータ片を記憶する、
ことを含み、
前記データ片の各々が前記ツリー構造内の１つのノードに対応する。
本発明の実施例に係る文書ベースシステムにおける文書データ記憶装置は、
前記文書データを前記ツリー構造で複数のデータ片に分割する第１ユニットと、
前記ツリー構造で前記複数のデータ片を記憶する第２ユニットと、を含み、
前記第１ユニットで分割したデータ片の各々が前記ツリー構造内の１つのノードに対応する。

本発明の実施例に係る文書ベースシステムにおける文書データ記憶方法およびその装置によれば、文書データのツリー構造で文書データを複数のデータ片に分割し、そして、該分割したデータ片をツリー構造で記憶する。このように、文書データをより細かいデータ片に分割して記憶することにより、ユーザが文書データの検索またはアクセスを行う際に、データ片のレベルに迅速かつ正確に位置決めして、柔軟かつ効率的なデータ検索や内容抽出を行うことができる。ネットワークに基づく文書アプリケーションの場合、文書伝送過程中の負担を低減する。

本発明の実施例に係る文書ベースシステムにおける文書データ記憶方法のフローチャートである。本発明の実施例に係る文書ベースシステムにおける文書データ記憶を実現する装置の構成を示す図である。

５０１記憶粒度確認ユニット
５０２データ片分割ユニット
５０３記録ユニット

本発明の実施例の目的、解決手段およびメリットをさらに明確にするために、以下、図面を参照して本発明の実施例をさらに詳しく説明する。
本発明の実施例に係る文書ベースシステムにおける文書データ記憶方法は、文書データを複数のデータ片に分割して、これら複数のデータ片の間の関係を記録する。文書データがツリー構造で記述された場合、前記文書データを記憶する際に、前記ツリー構造を複数のサブツリーに分割し、各サブツリーごとに１つのデータ片を形成し、分割後のツリー構造を記録する。

具体的には、文書データのツリー構造内のいずれか１つのノードから、データ片の分割を開始するようにしてよい。分割したデータ片は、該ノードをルートノードとするサブツリーである。該ノードがリーフノードである場合、該サブツリーは１つのみのノードを有する。上記の過程を繰り返して、複数のデータ片に分割することになる。

分割点を任意に選択するようにしてもよく、分割過程を任意の時点で終了するようにしてもよく、分割したサブツリーを同様な方法で引き続き分割するようにしてもよい。好ましい手段として、ツリー構造全体に対し記憶粒度を規定し、該記憶粒度でツリー構造全体を分割する。例えば、ページを記憶粒度とする場合、全てのページノードから分割を開始し、即ち、ページノードをルートノードとする全てのサブツリーを分割する。別の好ましい手段として、ツリー構造の異なる部分に対し異なる記憶粒度を規定し、それぞれの記憶粒度でツリー構造内の異なる部分を分割する。例えば、ある文書セットの全てのデータに対してはページノードから分割を開始するが、それ以外のデータに対しては文書ノードから分割を開始する。

図１は本発明の実施例に係る文書ベースシステムにおける文書データ記憶方法のフローチャートである。図１に示すように、該方法は以下のステップを含む。
ステップ１０１で、ツリー構造を用いて文書データを記述する。ここで、文書データを記述するツリー構造は、ルートノードからリーフノードまで順次に、文書、ページ、層、オブジェクトグループ、レイアウトオブジェクトを含むようにしてよい。ここで、文書データを記述するツリー構造は、文書データの組織構造とも呼ばれる。

ステップ１０２で、文書ベースシステムにおける文書データの記憶粒度を決定し、該記憶粒度で文書ベースシステムにおける文書データをデータ片に分割する。
ここで、文書データの記憶粒度は、文書ベースシステムがサポートするツリー構造、および文書データ自身の組織構造情報に関連する。

文書データのツリー構造が文書およびページである場合、文書データの記憶粒度は文書であってもよく、ページであってもよい。文書データ自身の組織構造が、文書である１階層のみを有し、ページに分割できない場合、文書データの記憶粒度は文書である。いずれにしても、文書ベースシステムにおける文書データ自身の組織構造は少なくとも文書レベルをサポートする。

文書データの記憶粒度を決定した後、該記憶粒度を最小分割単位として、文書データをデータ片に分割する。
ステップ１０３で、文書データの組織構造によって、分割したデータ片を格納する。

そのため、従来技術で文書ベースシステムにおける全ての文書データを１つのファイルとして記憶する方式に比べて、本発明の方式で文書記憶を行うことは、その記憶粒度が必ずより細かくなる。これにより、更新、検索の複雑性を低減することができ、文書データの検索や内容抽出を行うとき、記憶粒度に迅速に位置決めすることができるため、柔軟かつ効率的な検索や内容抽出を実現することができる。

具体的に、本発明の実施例に係る文書ベースシステムにおいて、文書ベースシステムにおける文書データのツリー構造は、拡張可能なマークアップ言語（ＸＭＬ）データベース方式、ファイルシステム方式、および関係データベース方式である３種類の方式で表されるようにしてよい。以下、３つの具体的な実施例により、上記３種類の方式の具体的な実施形態を説明する。

本発明の第１実施例では、ＸＭＬデータベース方式で文書ベースシステムにおける文書データのツリー構造を表す。このような方式で、本発明の実施例に係る文書ベースシステムにおける文書データ記憶方法のプロセスは、以下のステップを含む。
ステップ２０１で、文書データを記述するためのツリー構造を設定する。
本ステップで、設定された文書データのツリー構造は、ルートノードからリーフノードまで順次に下記の部分、即ち、文書セット、文書、ページ、層、オブジェクトグループ、レイアウトオブジェクトを含むようにしてよい。

上記の文書ベースシステムにおける文書データのツリー構造を表す方式について、
ＸＭＬデータベースのツリー構造を用いて文書ベースのツリー構造を表し、且つ文書ベース内の文書レベル以上の階層をＸＭＬデータベース内の集合（Ｃｏｌｌｅｃｔｉｏｎ）レベルにマッピングするようにしてよい。

例えば、文書ベースに対して、文書セット、文書、ページ、層、およびレイアウトオブジェクトを設定する。ＸＭＬデータベースのツリー構造を用いて上記の階層を表すようにしてよい。即ち、文書セットに複数の文書が含まれ、文書に複数のページが含まれ、ページに複数の層が含まれ、層に複数のレイアウトオブジェクトが含まれる。

ステップ２０２で、文書ベースシステムにおける文書データの記憶粒度を決定し、該記憶粒度で文書ベースシステムにおける文書データをデータ片に分割する。
本実施例では、文書データの記憶粒度の決定について、文書ベースシステムで設定された記憶粒度を基に、文書データ自身の組織構造を組み合わせて、記憶粒度を決定するようにしてよい。ここで、文書ベースシステムで記憶粒度を設定する方式は、文書ベースシステムに対して固定の記憶粒度を設定すること、および／または文書ベースシステムのパラメータ設定時に前記記憶粒度を設定すること、および／または文書ベースシステムのインストール時に記憶粒度を設定することを含むようにしてよい。文書データ自身により提供された構造情報は、例えば、文書がページを含むかどうか、ページが層を含むかどうかなどの情報であってよい。また、文書データの記憶粒度の決定は、ユーザ指定の方式で行われるようにしてもよい。最終的に決定された記憶粒度は、該文書ベースシステムにおける文書データのツリー構造内のページ、層などのようないずれのレベルであってもよい。好ましくは、ページを記憶粒度として決定する。文書データの異なる部分に対して同じ記憶粒度で分割するようにしてもよく、文書データの異なる部分に対して異なる記憶粒度を設定するようにしてもよい。

文書データをデータ片に分割する具体的な方式について、文書データの内の、記憶粒度に関連するデータに対して、決定された記憶粒度を単位として分割して、データ片を得るようにしてよい。さらに、文書データの内の、文書ベース、文書セットのメタデータ、ロールデータ、権限データ、ナビゲーションデータ、ソースファイルデータやフォントデータなどのような記憶粒度に関連しないデータに対して、まず、該データの前記ツリー構造内における対応レベルを決定し、そして、各レベル内の記憶粒度に関連しないデータを１つまたは複数のデータ片に分割して、対応レベル内の１つまたは複数のデータ片とする。具体的に、記憶粒度に関連しないデータの類別によって、記憶粒度に関連しないデータを分割するようにしてよい。例えば、ナビゲーションデータを１つのデータ片として、権限データを１つのデータ片とすることなどである。ここで、具体的に記憶粒度に関連しないデータを、１つのデータ片とするか、それとも複数のデータ片とするかについては、実際の応用によって決定する。同じ類別に属する記憶粒度に関連しないデータに対して、さらに、それ自身の特性によって、複数のデータ片に分割するようにしてもよい。例えば、記憶粒度が文書である場合、記憶粒度に関連するデータは該文書内の内容データなどであり、記憶粒度に関連しないデータは文書共有のフォントデータ、ソースファイルデータ、ナビゲーションデータなどである。フォントデータやソースファイルデータなどのような記憶粒度に関連しないデータの場合は、全ての文書のソースファイルデータやフォントデータを１つのデータ片とせず、異なる文書のソースファイルデータやフォントデータを異なるデータ片に分割するようにしてよい。しかし、ナビゲーションデータなどのような記憶粒度に関連しないデータの場合は、全ての文書のナビゲーションデータを１つのデータ片とするようにしてよい。

ステップ２０３で、分割したデータ片の間の組織構造を格納する。
本実施例では、文書ベースシステムにおける文書データのツリー構造は、ＸＭＬデータベースのツリー構造を用いて表現される。このような表現方式で、データ片の間の組織構造を格納する方式は、具体的に、該組織構造をＸＭＬデータベースのツリー構造にマッピングすることを含む。好ましくは、集合（Ｃｏｌｌｅｃｔｉｏｎ）を用いて該マッピング後のツリー構造を格納するようにしてもよい。

ステップ２０４で、分割したデータ片を格納する。
本ステップで、データ片を格納する方式について、具体的に、データ片をＸＭＬ文書に変換して、対応の集合に加えるようにしてよい。

ここまでで、本実施例に係る文書ベースシステムにおける文書データ記憶方法のプロセスを終了する。上記方法を応用した後、ＸＭＬデータベースの管理機能を用いて、文書ベースシステムにおける文書データを管理し、アプリケーションの要求を実現して、相応データに位置決めしてアプリケーションに返信することができる。

ＸＭＬデータベース方式を利用する最大のメリットとして、情報を抽出する際に最大の柔軟性を得ることができる。ＸＭＬデータベースがサポートするＸパス（ＸＰａｔｈ）およびＸクエリ（ＸＱｕｅｒｙ）などの方式を介して、アプリケーションは、文書オブジェクト、ページオブジェクト、層オブジェクト、層内オブジェクト（例えば、ピクチャー、文字、電子印章など）に便利にアクセスすることができる。理論上、文書ベースの構造がいずれかのレベルまで細分化されると、ＸＭＬデータベース方式を介して該レベルのオブジェクトにアクセスすることができる。

また、文書ベースシステムにおける文書データには、文書ベース、文書セットの階層構造を記述するメタデータ、権限データやグローバルデータ、ロールデータなどが若干ある。異なる文書、または同一の文書の異なるページに、上記データが複数回現れる可能性があるため、上記の記憶方式で文書データの記憶を行う際に、これらデータが、これらデータを含む異なるデータ片に複数回格納されることになり、このように、記憶領域の利用率が低下する。記憶領域の利用率を向上させるために、これらデータを独立に格納するようにしてよい。以下、グローバルデータの格納を例として、一致データの格納方式を説明する。

ステップ１で、文書ベースシステムにおける文書データのグローバルデータを抽出して独立に格納する。
本ステップで、グローバルデータを独立に格納する方式は、グローバルデータに対して対応の階層構造を確立し、確立した階層構造の下に、ＸＭＬ文書、ファイルまたはバイナリラージオブジェクトの形式でグローバルデータを格納することを含むようにしてよい。

ステップ２で、グローバルデータを含むデータ片においてグローバルデータへの引用を記録する。
上記の方式でグローバルデータの格納を行うと、グローバルデータを１回だけ格納し、他のデータ片において、独立して格納されたグローバルデータを記録せずに、該グローバルデータへの引用を記録することが可能になり、記憶領域の利用率が大幅に向上する。権限データ、メタデータなどのような他の一致データの格納方式については、上記と同じであるため、ここでは説明を省略する。

本実施例では、ステップ１においてグローバルデータに対して対応の階層構造を確立することは、グローバルデータをＸＭＬデータベースのツリー構造内のある階層に対応させ、グローバルデータを該階層の下に格納することを含むようにしてよい。他のメタデータ、ロールデータなどについても、それに対応する類似の階層構造を確立して、相応のデータを該階層の下に格納するようにしてもよい。

本発明の第２実施例では、ファイルシステム方式で文書ベースシステムにおける文書データのツリー構造を表す。このような方式で、本発明に係る文書ベースシステムにおける文書データ記憶方法のプロセスは、以下のステップを含む。
ステップ３０１で、文書ベースシステムにおける文書データのツリー構造を設定する。
本ステップで、設定された文書ベースシステムにおける文書データのツリー構造は、実施例１と同じであるため、ここでは説明を省略する。

文書ベースシステムにおける文書データのツリー構造を表す方式について、ファイルシステムのツリー構造を用いて文書ベースシステムにおける文書データのツリー構造を表すようにしてよい。
例えば、文書ベースシステムにおける文書データに対して文書セット、文書、ページ、層、および層内オブジェクトを設定する場合、ファイルシステムのツリー構造を用いて上記の階層を表すようにしてよい。例えば、文書セットに複数の文書が含まれ、文書に複数のページが含まれ、ページに複数の層が含まれ、層に複数の層内オブジェクトが含まれる。文書ベースのツリー構造は以下のように表せる。

ステップ３０２で、文書ベースシステムにおける文書データの記憶粒度を決定し、該記憶粒度で文書ベースシステムにおける文書データをデータ片に分割する。
本ステップで、文書データの記憶粒度を決定する方式、および文書データをデータ片に分割する方式については、実施例１と同じであるため、ここでは説明を省略する。

ステップ３０３で、分割したデータ片の間の組織構造を決定して格納する。
本ステップで、各データ片の間の組織構造を決定し、例えば、各層データの属する文書セット、文書、ページなどを決定する。そして、該組織構造をファイルシステム内のディレクトリの形式で記録する。
文書Ｄｏｃ１内の文書データを記憶する場合、該文書Ｄｏｃ１がＤｏｃＬｉｓｔ１の下に位置し、Ｄｏｃ１の文書構造は、第１ページに３層を備え、後ろの２ページにそれぞれ１層を備える３ページを含むと仮定すると、文書ベースに格納された組織構造は以下の通りである。

ステップ３０４で、分割したデータ片を格納する。
本ステップで、分割したデータ片を格納する方式について、具体的に、データ片をファイルシステム内のファイルとして、対応のディレクトリの下に格納するようにしてもよい。ここで、対応のディレクトリは、上記組織構造内の相応のディレクトリであってよい。
ここまでで、本実施例に係る文書ベースシステムにおける文書データ記憶方法のプロセスを終了する。

上記の方法を応用して文書記憶を完成した後、文書にアクセスする際に、文書セット名＋文書名＋ページ番号＋層番号＋…を指定することによって、アクセスしようとする記憶粒度オブジェクト（例えば、層オブジェクト）に迅速に位置決めし、データを取得してアプリケーションに返信することができる。

本実施例では、記憶領域の利用率を向上させるために、文書ベース、文書セットのメタデータ、ロールデータ、権限データ、およびグローバルデータを独立に格納するようにしてもよい。その具体的な方式は、実施例１のステップ１〜２に類似している。相違点として、本実施例における文書ベースのツリー構造の表現方式に対応し、上記のデータに対して対応の階層構造を確立する方式は、具体的に、ファイルシステムのディレクトリで特別のディレクトリを作成してグローバルデータに対応する階層構造とし、該ディレクトリの下にグローバルデータを格納することである。具体的に、上記グローバルデータなどは、ファイルの形式で格納されるようにしてよい。上記グローバルデータを含む他のデータ片には、上記グローバルデータを独立に格納する必要がなく、相応データへの引用だけが含まれることで、記憶領域の利用率を大幅に向上させる。

もちろん、本実施例では、層を記憶粒度とする場合を例に説明しているが、実際に、より粗いまたはより細かい記憶粒度で文書データを記憶することを実現するために、より粗いまたはより細かい記憶粒度に対応するディレクトリを作成してもよい。

本発明の第３実施例では、関係データベース方式で文書ベースシステムにおける文書データのツリー構造を表す。このような方式で、本発明に係る文書ベースシステムにおける文書データ記憶方法のプロセスは、以下のステップを含む。
ステップ４０１で、文書データを記述するためのツリー構造を設定する。
本ステップで、設定された文書ベースを記述するツリー構造は、実施例１と同じであるため、ここでは説明を省略する。

ツリー構造を表す方式として、関係データベース内のツリー構造を用いて文書ベースシステムにおける文書データのツリー構造を表す。
例えば、文書ベースに対してディレクトリ（即ち、文書セット）、文書、ページの３つの階層を設定する場合、関係データベース内の３つのテーブル（ディレクトリテーブル、文書テーブル、ページテーブル）で、ディレクトリ、文書、ページの３つのレベルの構造を有する仮想ディレクトリシステムを構築するようにしてよい。ここで、ディレクトリテーブルの定義は表１に示す通りであり、文書テーブルの定義は表２に示す通りであり、ページテーブルの定義は表３に示す通りである。

ステップ４０２で、文書ベースシステムにおける文書データの記憶粒度を決定し、該記憶粒度で文書ベースシステムにおける文書データをデータ片に分割する。
本実施例では、文書データの記憶粒度を決定する方式、および文書データをデータ片に分割する方式については、実施例１と同じであるため、ここでは説明を省略する。
ステップ４０３で、分割したデータ片の間の組織構造を決定して格納する。
本ステップで、各データ片の間の組織構造を決定し、例えば、各層データの属する文書セット、文書、ページなどを決定する。そして、該組織構造を関係データベースにおける相関テーブルの形式で記録する。

Ｄｏｃ１内の文書データを記憶する場合、該文書Ｄｏｃ１がＤｏｃＬｉｓｔ１の下に位置し、Ｄｏｃ１が３ページを含み、記憶粒度がページであると仮定すると、文書ベースに格納された組織構造と具体的なデータ片は、下記の表４〜６の相関テーブルの方式で記憶されるようにしてよい。

ステップ４０４で、分割したデータ片を格納する。
本ステップで、分割したデータ片を格納する方式について、具体的に、データ片を関係データベース内のバイナリラージオブジェクトとして、対応の相関テーブルに格納するようにしてもよい。
ここまでで、本実施例に係る文書ベースシステムにおける文書データ記憶方法のプロセスを終了する。

本実施例では、記憶領域の利用率を向上させるために、文書ベース、文書セットのメタデータ、ロールデータ、権限データやグローバルデータなどを独立に格納するようにしてもよい。その具体的な方式は、実施例１のステップ１〜２に類似している。相違点として、本実施例の文書ベースシステムにおける文書データのツリー構造の表現方式に対応し、グローバルデータに対して対応の階層構造を確立する方式は、具体的に、関係データベースの相関テーブルにおいて、相応データに対応する階層構造として、特別なエントリーを作成し、該エントリーにデータを格納することである。

具体的に実現する場合、ステップ４０１で設定された階層構造の定義を修正し、そのうちの記憶粒度テーブルの定義（即ち、ページテーブルの定義）を表７のように修正する。

ここからわかるように、ページ番号０のページに対応する相関テーブルを用いて、グローバルデータに対応する階層構造を表す。一致データを関係データベース内のバイナリラージオブジェクトとして、対応の相関テーブルに格納するようにしてよい。一致データを含む他のデータ片には、一致データを独立に格納する必要がなく、一致データへの引用だけが含まれることで、記憶領域の利用率を大幅に向上させる。

もちろん、本実施例では、ページを記憶粒度とする場合を例に説明しているが、実際に、より細かい記憶粒度で文書を記憶することを実現するために、より細かい記憶粒度に対応する相関テーブルを作成してもよい。
上述した本発明の具体的な実施形態からわかるように、本発明の実施例に係る方法では、まず、文書ベースのツリー構造を設定し、そして、文書ベースシステムにおける文書データの記憶粒度を決定し、該記憶粒度で文書ベースシステムにおける文書データをデータ片に分割し、各データ片の間の組織構造を決定して格納し、データ片を格納する。

図２は、本発明の実施例に係る文書ベースシステムにおける文書データ記憶を実現する装置の構成を示す図である。図２に示すように、本発明の実施例に係る装置は、記憶粒度確認ユニット５０１と、データ片分割ユニット５０２と、記録ユニット５０３と、を含む。
ここで、記憶粒度確認ユニット５０１は、文書ベースシステムにおける文書データの記憶粒度を決定する。

データ片分割ユニット５０２は、記憶粒度確認ユニット５０１で決定された記憶粒度で、文書データをデータ片に分割する。記録ユニット５０３は、データ片分割ユニット５０２で分割した各データ片の間の組織構造を記録し、相応の組織構造で、データ片分割ユニット５０２で分割した各データ片を格納する。

本発明の実施例に係る文書ベースシステムにおける文書データ記憶を実現する方法およびその装置によれば、文書ベースシステムにおける文書データをより細かいデータ片に分割して格納することができる。このように、ユーザが、ある文書の検索またはアクセスを行う際に、一番細かい記憶粒度のレベルに迅速且つ正確に位置決めし、柔軟且つ効率的な文書検索や内容抽出を行うことができる。ネットワークに基づく文書アプリケーションの場合は、ユーザの興味のある内容だけを伝送してもよく、文書伝送過程中の負担を低減することができる。

また、本発明の実施例では、文書データ記憶を行う際に、様々なフォーマットの文書を統合して格納することができるため、文書の互換性に極めて大きな利便性をもたらす。
上記は、本発明の好ましい実施例にすぎず、本発明の保護範囲を限定するものではない。本発明の精神と原則内で行われる種々の修正、均等置換え、改善などは全て本発明の保護範囲内に含まれるべきである。

Claims

文書ベースシステムにおける文書データ記憶方法であって、
前記文書データがツリー構造で記述され、
前記文書データを記憶する際に、
前記文書データを前記ツリー構造で複数のデータ片に分割し、
前記複数のデータ片をそれぞれ記憶し、前記複数のデータ片の間の組織構造を記録する、ことを含み、
ここで、前記データ片の各々が前記ツリー構造内の１つのサブツリーまたは１つのノードに対応し、
前記文書データを前記ツリー構造で複数のデータ片に分割することが、
前記文書データの記憶粒度を取得し、前記記憶粒度を最少単位として、前記文書データの内の、記憶粒度に関連するデータを、複数のデータ片に分割し、
前記ツリー構造の内の、前記記憶粒度以上の各ノードのグローバルデータを、前記ノードのサブノードに対応する１つまたは複数のデータ片に分割し、ここで、前記グローバルデータが、前記文書データの内の、記憶粒度に関連しないデータである、ことを含み、
前記複数のデータ片をそれぞれ記憶することが、
前記ツリー構造の各ノードをＸＭＬデータベースのツリー構造にマッピングして格納し、
前記複数のデータ片をデータベースのＸＭＬ文書に変換して、前記ＸＭＬデータベースのツリー構造に加える、ことを含むことを特徴とする方法。
前記文書データの記憶粒度が前記ツリー構造内の１レベルであることを特徴とする請求項１に記載の方法。
前記各ノードのグローバルデータを、前記ノードのサブノードに対応する１つまたは複数のデータ片に分割することが、
前記各ノードのグローバルデータの類別によって、前記グローバルデータを前記ノードのサブノードに対応する１つまたは複数のデータ片に分割することを含むことを特徴とする請求項１に記載の方法。
前記ツリー構造のルートノードが文書レベルであり、リーフノードが、ページ、層、オブジェクトグループ、オブジェクトの１つまたは任意の組合せを含むことを特徴とする請求項１に記載の方法。
文書ベースシステムにおける文書データ記憶装置であって、
前記文書データをツリー構造で複数のデータ片に分割する第１ユニットと、
前記複数のデータ片をそれぞれ記憶し、前記複数のデータ片の間の組織構造を記録する第２ユニットと、
を含み、
ここで、前記第１ユニットで分割したデータ片の各々が前記ツリー構造内の１つのサブツリーまたは１つのノードに対応し、
前記文書データをツリー構造で複数のデータ片に分割することが、
前記文書データの記憶粒度を取得し、前記記憶粒度を最小分割単位として、前記文書データの内の、記憶粒度に関連するデータを、複数のデータ片に分割し、
前記ツリー構造の内の、前記記憶粒度以上の各ノードのグローバルデータを、前記ノードのサブノードに対応する１つまたは複数のデータ片に分割し、ここで、前記グローバルデータが、前記文書データの内の、記憶粒度に関連しないデータである、ことを含み、
前記複数のデータ片をそれぞれ記憶することが、
前記ツリー構造の各ノードをＸＭＬデータベースのツリー構造にマッピングして格納し、
前記複数のデータ片をデータベースのＸＭＬ文書に変換して、前記ＸＭＬデータベースのツリー構造に加える、ことを含むことを特徴とする装置。