JP2004213497A

JP2004213497A - 情報管理装置

Info

Publication number: JP2004213497A
Application number: JP2003001617A
Authority: JP
Inventors: Toshiyasu Kunii; 利▲泰▼ 國井
Original assignee: Kanazawa Institute of Technology (KIT)
Current assignee: Kanazawa Institute of Technology (KIT)
Priority date: 2003-01-07
Filing date: 2003-01-07
Publication date: 2004-07-29

Abstract

【課題】リレーショナルデータベースモデルはデータの依存関係を把握していないと構築できず、サイバーワールドのモデリングにふさわしくなくなっている。
【解決手段】データベース参照部１２はふたつのデータベースを参照する。属性指定部３２からユーザの注目情報が指定される。抽出部２０はセル分解によりデータベースから注目情報を抽出する。演算部２２は抽出された注目情報間で演算を実行し、結果を出力する。一連の処理はホモトピーとして記録部２８へ記録され、再利用可能に保持される。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
この発明は情報管理技術、とくに、データベースを利用する情報管理装置に関する。
【０００２】
【従来の技術】
現代のグローバル化した社会において、ウェブ情報管理システムが非常に重要な役割を果たすようになった。現実に、この社会はウェブ上に構築されるサイバーワールドにドライブされている。サイバーワールドは、設計意図のあるなしに係わらずウェブ上に創造された情報の世界である。「ｅファイナンス」と「ｅマニュファクチャリング」は、サイバーワールドの主要なプレイヤーであり、日々、ＧＤＰ同等の商取引がなされ、かつては産業の現場でなされた製造が、ウェブ上で部品を購入し、そのアセンブリのための工場をも購入することに置き換わっている。サイバーワールドのこうした複雑さと成長の速度は、必要に応じて即座にサーバーワールドを処理するウェブ情報管理システムのみを媒介として扱いが可能となる。
【０００３】
ウェブ情報管理システムは、ウェブ上に提示される極めて多量かつ多様なデータから、目的のデータを的確、迅速に探索する能力をもたなければならない。そのために、最適なデータベースモデルをも併せて提示するものでなければならない。
【０００４】
【発明が解決しようとする課題】
従来、データベースモデルとしては、リレーショナルデータベースモデルが広く利用されてきた。しかし、リレーショナルデータベースは、データの依存関係を認知している情報管理者の存在を前提とする「ワールドモデル」であり、データの関連性は、情報管理者によって予め固定的に規定される。個人または企業などの閉じた集団内でデータを管理する場合には、静的かつ固定的なデータの依存関係でも利用可能であるが、サイバーワールドでは、独立に目まぐるしく活動を続けるウェブサイトが、ＷＷＷを通して有機的にリンクしている。それらの急速で複雑な情報の変化は、明らかに、リレーショナルデータベースの管理の限界を超えている。
【０００５】
また、リレーショナルデータベースは閉じた空間しか表現できないため、データベースごとにデータ管理の方法に違いがでる結果、異なるデータベース間でデータ管理、データ操作が不可能になる。リレーショナルデータベースモデルでは、状況変化が起こるたびにデータベースの再正規化という再設計を行わねばならず、変化の激しいサイバーワールドのモデル化にはまったく不向きになってしまった。
本発明はこうした認識からなされてものであり、その目的は、サイバーワールドのような、オープンで変化が大きな情報世界をも的確に扱うことのできる情報管理技術を提供することにある。
【０００６】
【課題を解決するための手段】
本発明の情報管理装置は、所定のデータベースを参照する参照部と、参照されたデータベースに記述された情報をｎ次元閉セルとして扱い、いま注目しようとする属性の組からなる情報をｉ次元閉セルとして扱い、ｎ次元閉セルからｉ次元閉セルを抽出する抽出部と、注目しようとする属性の組の決定手順、およびｉ次元閉セルの抽出の手順をホモトピーとして記録する記録部とを備える。抽出部は、ｉ次元閉セルを前記のデータベースが物理的に記憶されている領域とは別の記憶領域へ保存する。
【０００７】
この装置によれば、ｉ次元閉セルが最初のデータベースとは別に記録されるので、必要に応じて再利用できる。記録部が前記のホモトピーと対応づけてｉ次元セルを記録していれば、再利用の確実性が担保される。そのため、いちいちもとのデータベースへ戻る回数が減り、操作量、制御量が減る。
【０００８】
抽出部は、前記のｎ次元セルの境界を（ｎ−ｉ）回取ることによりｉ次元セルを抽出してもよい。これは付加空間モデルにおけるセル分解のプロセスと考えてもよい。（ｎ−ｉ）回境界を取る動作は、一時になされてもよい。
【０００９】
この装置は、新たに注目しようとする属性の組が決定されたとき、この組に対応するｊ次元セルがすでに記録部に記録されているか否かを判定する判定部をさらに含んでもよい。
【００１０】
参照部は、前記のデータベースのほかに第２のデータベースを参照し、抽出部は、これらふたつのデータベースからそれぞれｉ次元セルを抽出し、この装置はさらに、抽出されたふたつのｉ次元セル間で所期の処理を実行する演算部を備えてもよい。演算の例は、リレーショナルデータベースモデルにおけるジョインのほか、ＮＯＰ（ノーオペレーション）を含む任意の論理演算、算術演算であってよい。この態様によれば、ふたつのデータベースの構造が違っても、それらのデータベースから必要な情報を生成して利用できる。リレーショナルデータベースモデルでは、構造が異なるデータベース間でデータ操作ができないが、付加空間モデルに基づく本装置ではこれが可能になる。
【００１１】
本発明の別の態様も情報管理装置に関する。この装置は、第１および第２のデータベースを参照する参照部と、第１および第２のデータベースにおいて注目しようとする属性の組を指定する指定部と、第１および第２のデータベースに記述された情報をそれぞれ第１および第２の多次元閉セルとして扱い、注目しようとする属性の組からなる情報を目的の閉セルとして扱い、第１および第２の多次元閉セルからそれぞれ目的の閉セルを抽出する抽出部と、抽出された目的の閉セルどうしの間で所期の処理を実施する演算部と、目的の閉セルの抽出手順および処理をホモトピーとして記録し、かつ処理が実施された目的の閉セルをホモトピーと関連づけて記録する記録部と、指定部にて、注目しようとする属性の組が新たに指定されたとき、この組に対応する目的の閉セルがすでに前記記録部に記録されているか否かを判定する判定部とを備え、目的の閉セルが記録部に記録されていないとき抽出部による抽出が行われ、目的の閉セルが記録部に記録されているときは抽出部による抽出はスキップされ、記録部から当該目的の閉セルが読み出されて利用される。
【００１２】
抽出部は、第１および第２のデータベース自体の書換を行わない方法にて目的の閉セルを抽出し、演算部は、処理が実施された目的の閉セルを第１および第２のデータベースが物理的に記憶されている領域とは別の記憶領域へ保存してもよい。
【００１３】
本発明のさらに別の態様も情報管理装置に関し、第１および第２のデータベースを参照する参照部と、第１および第２のデータベースにおいて注目すべき情報を指定する指定部と、第１および第２のデータベースに記述された情報をそれぞれ付加空間モデルにおける第１および第２のセルとして扱い、注目すべき情報を第１および第２のセルからそれぞれセル分解操作によって目的セルとして抽出する抽出部と、抽出された目的セルどうしの間で所期の処理を実施する演算部と、目的セルの抽出手順および処理をホモトピーとして記録し、かつ処理が実施された目的セルをホモトピーと関連づけて記録する記録部と、指定部にて、注目すべき情報が新たに指定されたとき、この注目すべき情報に対応する目的セルがすでに記録部に記録されているか否かを判定する判定部とを備え、目的セルが記録部に記録されていないとき抽出部による抽出が行われ、目的セルが記録部に記録されているときは抽出部による抽出はスキップされ、記録部から当該目的セルが読み出されて利用される。
【００１４】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【００１５】
【発明の実施の形態】
以下本発明を好適な実施の形態をもとに説明する。まず、実施の形態の基礎として本発明者が提唱する付加空間モデル（ＡｄｊｕｎｃｔｉｏｎＳｐａｃｅＭｏｄｅｌ）およびセル構造空間モデル（以下単にセル情報モデルともいう）の基礎理論を前提技術として述べ、しかるのち具体的な実施の形態を説明する。なお、セル情報モデルは、付加空間モデルにセルの次元という概念を加えた下位モデルである。
【００１６】
［前提技術］
セル情報モデルは、情報モデルとしては不規則データモデルの分野に適用できるもので、時空におよぶ諸元を状況（ｓｉｔｕａｔｉｏｎ）というかたちでとらえる。数学的にいえば、セル情報モデルはホモトピーに関する理論的なフレームワークに位置づけられたセル空間構造理論にもとづき、グラフ理論の拡張理論にあたる。［１］サイバーワールドのモデリング
不変量を根拠に理論構築を行う。サイバーワールドを非可逆な空間としての時間を含む空間の１タイプと考え、その表現に、自由度としての次元と、異なる次元の空間がいかに接続されているかを示す接続性とを含む不変量が適切であることを示す。
【００１７】
一般論として、サイバーワールドをモデリングするためには以下の４つのステップが必要である。
第１に、サイバーワールドと現実世界との相違点および共通点を明確化しなければならない。もっとも明白な違いは成長速度にあり、したがってその複雑さにある。ローカルな世界を同時に世界規模のウェブの世界にリンクする性質はきわめて特殊であり、かつそのスピードも光速に匹敵する。現実に、人類の歴史において、ウェブ上に実現される高速性は、かつてもったことのない能力を人類に与えた。ウェブ上で働くすべての人はサイバーワールドの構築と破壊を同時に行っているのである。
【００１８】
第２に、明確化された相違点と共通点を特徴づけるための適切なモデリングの方法論を見いだす必要がある。極端な複雑度および変化の高速性により、モデリングの規模を最小化するための方法は、階層化された概念のうえに構築されるべきである。さらにその階層は、絶え間なく変化するサイバーワールドの中から普遍的な特性を特定するために、不変量の階層であり、後に概念の付加がモジュラーな形でつぎつぎに可能な形式にすべきである。
【００１９】
第３に、そうして構築されたモデリングの方法論を、現実の設計（ｄｅｓｉｇｎ）に落とし込む必要がある。一般に設計は、不変量の適切な選択と特定の情報構造および演算を必要とする。たとえば不変量の概念階層は、不変量を相続する階層として設計される。これまでの研究により、ふたつの不変量、すなわち自由度としての次元およびそれらの接続性の重要性を認識した。すなわち、情報構造としてセル空間構造を考え、演算としてセルの構築（コンポジション）および分解（デコンポジション）を考えるに至った。
【００２０】
第４に、そうして得られた設計をセル情報モデルと名付けた情報モデルとして実装する。セル情報モデルは、既存の種々のデータモデルの能力を強化するものであり、セルの境界、セルの次元およびセルの接続性のすべてを保証することができる。セル情報モデルは、サイバーワールドを一貫性のある形で表現でき、その正当性を証明できる。
［２］不変量の概念階層
科学的な研究において、モデリングは非常に重要なステップである。とくに自然科学では、現実世界をモデリングするために、不変量の概念を中心として理論構築がなされる。オブジェクトおよび現象は不変量をもとに分類され、モデリングされる。物理では、相対性理論が発表されるまでエネルギーと質量は不変量であった。数学では、オブジェクトをモデリングするために以下の手順がとられる。すなわち、同値関係により、数学的なオブジェクトをその部分集合の排他的論理和として表現できる同値類へ分類する。同値関係にもとづく概念階層のレベルは以下のとおりである。
【００２１】
１．拡張されたレベル、その特別な場合としてホモトピーレベル
２．集合レベル
３．位相幾何学レベル、その特別な場合としてグラフ理論上のレベル
４．付加空間レベル
５．セル構造空間レベル
６．表現（プレゼンテーション）レベル
７．可視化レベル
これらの階層は、モジュラー、かつのちにインクリメンタルに付加していくことが可能な設計、すなわちサイバーワールドの不変量の相続的な階層を実現するために有力である。
［３］セル情報モデル
サイバーワールドをモデリングするためには、ＣＷ空間などのセル空間構造にもとづくアプローチが、グラフ理論に基づくそれに比べ、はるかに適している。セル構造空間レベルによれば、オブジェクトを境界の存在する、または存在しないセルとして、認識可能かつ計算可能な空間内に位置づけることができるためである。境界をもつセルは「閉」（ｃｌｏｓｅｄ）であり、境界のないセルは「開」（ｏｐｅｎ）である。ｎ次元のセル、すなわち「ｎセル」は、ｎ次元球と同相の空間である（ｎは整数）。ここで、オープンなｎセルをｅ^ｎと表記し、クローズなｎセルを
【数１】

と表記する。また、クローズなｎセルの内部を
【数２】

と表記する。したがって、
【数３】

はクローズなｎセルの境界にあたり、これは（ｎ−１）次元の球Ｓ^ｎ−１に等しい。セルモデリングによれば、セルの構築と分解はセルの次元と接続性を不変量に保ったまま実現できる。したがって、オブジェクトのアイデンティフィケーションは、アイデンティフィケーションのための写像をとおして体系的に実施される。後述するように、データベーススキーマの構築およびスキーマの分解は、セル構築およびセル分解の特別な場合に相当する。
【００２２】
ここで次元の例を述べる。たとえばサイバーワールドにおいて、ひとつの属性をもつオブジェクトは、ひとつの属性から他の属性へ移行することができないため、その自由度は０であり、したがってその次元も０である。そのため、これを表現レベルでは「点」で表することができる。属性とは、オブジェクトが本来有する特質や特徴を同定するための互いに独立な集合をいう。属性をふたつ有するオブジェクトでは、一方の属性から他方の属性への移行が可能なため、その自由度も次元も「１」である。したがって、表現レベルにおいて直線として表すことができる。同様に、属性が３および４のオブジェクトは、それぞれ２次元および３次元に相当し、曲面および球として表現できる。一般に、ｎ個の属性を有するオブジェクトは（ｎ−１）の自由度を有し、その次元はｎ−１である。これは、（ｎ−１）次元の球として表現できる。リレーショナルモデルでは、ｎ個の属性をもつオブジェクトはリレーショナルスキーマとして表され、ｎ列のテーブルとして実体化される。リレーショナルモデルは集合の直積にもとづき、したがってそれは集合理論レベルにおける表現といえる。
【００２３】
一方、接続性は連続かつ全射な写像である接着写像（アスタッチングマップ）によって定義される。ある写像ｆ：Ｘ→Ｙが全射であるとは、
【数４】
（∀ｙ∈Ｙ）（∃ｘ∈Ｘ）［ｆ（ｘ）＝ｙ］
を意味する。「写像ｆ：Ｘ→Ｙが連続である」とは、「｛ｆ^−１（ｙ）｜ｙ∈Ａ｝がＸにおいてオープンであり、かつその場合にかぎり、Ｙの部分集合であるＡがＹにおいてオープンになる」ことを意味する。
【００２４】
共通部分をもたない位相空間ＸおよびＹについて、
【数５】

は、接着写像ｆ：Ｘ_０→ＹによってＸをＹに接着することにより得られる付加空間（接着空間ともいう）である。ＸとＹの単なる排他的論理和の空間から、接着関数ｆによって定まる付加空間への写像ｇがアイデンティフィケーション写像であり、この写像はａｄｊｕｎｃｔｉｏｎｓｐａｃｅｍｏｄｅｌにおいて中心的な役割を果たす。付加空間を利用するモデルを付加空間モデルという。付加空間モデルは、接着関数とアイデンティフィケーション写像の組合せで表現される。一方、セル情報モデルは、付加空間モデルにセルの次元という概念を追加したものである。ここで、
【数６】

は、排他的論理和を表し、しばしば＋であらわされる。〜は同値関係を示す。同値関係とは、同一律「ｘ〜ｘ」、対象律「ｘ〜ｙならｙ〜ｘ」、推移律「ｘ〜ｙかつｙ〜ｚならｘ〜ｚ」がすべて成り立つ関係であり、集合論的な同値関係、ホモトピー同値関係、トポロジー同値関係などがある。推移律は、空間を、共通部分をもたない同値類と呼ばれる部分空間へ分割する。
【００２５】
サイバースペースをより明確にモデリングするための基礎として、同値関係および同値類について述べる。ｘ／〜＝｛ｙ∈Ｘ：ｘ〜ｙ｝によって定義されるＸの部分集合は、ｘの同値類と呼ばれる。ここで、「類（クラス）」は実際には集合のことであるが、昔から類（クラス）と呼ばれているため、その表記にしたがう。すべての同値類からなる集合Ｘ／〜は、Ｘの商空間と呼ばれ、以下のように表記される。
【００２６】
【数７】
Ｘ／〜＝｛ｘ／〜∈２^Ｘ｜ｘ∈Ｘ｝⊆２^Ｘ
推移律から、ｘ∈Ｘ，ｘ／〜≠φを満たすそれぞれのｘについて、以下の式が成り立つ。
【数８】

これは、集合Ｘが、空ではなく、共通部分をもたない同値類へ分割または分解されたことを意味する。ここで同値類をｘ／〜と表記し、これは以下の意味である。
【数９】
ｘ／〜＝｛ｙ∈Ｘ｜ｘ〜ｙ｝
簡単な例で説明する。「濃度（ｃａｒｄｉｎａｌｉｔｙ）」は、集合理論上の同値関係であり、もとの集合を同じ濃度を有する、共通部分をもたない部分集合へ分割する。別な例として、グラフ理論において「同型」は同値関係であり、グラフの集合も、共通部分をもたない同型のグラフの部分集合へ分解できる。
【００２７】
ユークリッド幾何学において、「合同」はひとつの同値関係を形成し、すべての図形を互いに合同な図形からなる部分集合へ分解できる。これらの部分集合は共通部分をもたず、その和集合がもとの集合、すなわちすべての図形の集合に一致する。この和集合が商空間に当たる。「相似」もひとつの同値関係である。「合同」および「相似」はともにアフィン変換の例である。一方、「対称」という関係は、群理論における同値関係の例であり、対称な図形からなる互いに共通部分をもたない部分集合の和集合へ分解する。
【００２８】
以上が接着写像の実例である。ここで、接着写像の一般的な定義に触れる。すべての同値類の集合はＸ／〜と表記され、以下の式で示される。
【数１０】
Ｘ／〜＝｛ｘ／〜∈２^Ｘ｜ｘ∈Ｘ｝⊆２^Ｘ
これはＸの商空間とも呼ばれる。接着写像ｆは全射かつ連続な以下の写像である。
【数１１】
ｆ：Ｘ_０→ｙ（Ｘ_０⊂Ｙ）
【数１２】

は商空間であり、以下の関係をもつ。
【数１３】

ここでは、後述するように、情報スキーマの統合およびウェブ上の情報マイニングによる情報の統合のための特別な場合を考える。いまＳ^ｎ−１は、クローズなｎセルの境界であり、
【数１４】

と表記できる。ここで全射かつ連続な接着写像ｆを
【数１５】
ｆ：Ｓ^ｎ−１→Ｘ
と定義する。このとき、付加空間Ｙは以下のように商空間として定義される。
【００２９】
【数１６】

いま、ホモトピックな写像ｆおよびｇ、
【数１７】
ｆ，ｇ：Ｓ^ｎ−１→Ｘ
を考える。すると、
【数１８】

というホモトピー同値関係が生じる。
【００３０】
Ｊ．Ｈ．Ｃ．Ｗｈｉｔｅｈｅａｄの指摘によれば、位相空間として任意のサイバーワールドＸが与えられたとき、このＸから整数Ｚによってインデックスが与えられたＸの部分空間であるＸ^ｐセルの有限または無限の配列を帰納的に構成することができる。すなわちフィルトレーションと呼ばれる空間｛Ｘ^ｐ｜Ｘ^ｐ⊆Ｘ，ｐ∈Ｚ｝が以下のように形成できる。ここでＸ^ｐはＸの被覆とよばれ、以下の関係がなりたつ。
【数１９】
Ｘ＝∪_ｐ∈ＺＸ^ｐ
さらに、Ｘ^ｐ−１はＸ^ｐの部分空間であり、すなわち、
【数２０】
Ｘ^０⊆Ｘ^１⊆Ｘ^２⊆・・・⊆Ｘ^ｐ−１⊆Ｘ^ｐ⊆・・・⊆Ｘ
と表記できる。フィルトレーションはスケルトンとも呼ばれる。最大でｐ次元のスケルトンはｐ−スケルトンと呼ばれる。Ｘ^０、Ｘ^１、Ｘ^２・・・Ｘ^ｐ−１およびＸ^ｐはサイバーワールドＸの部分サイバーワールドである。フィルトレーションと位相的に同値な空間はフィルトレーション空間と呼ばれる。
【００３１】
実用上、重要なセル空間がある。それらはＣＷ複体および多様体である。フィルトレーション空間が有限であるとき、これはＣＷ空間と同値である。さらに、ＣＷ空間が可微分性を有するとき、これは多様体と同値である。
［４］セル情報モデルによる情報マイニングをとおしたウェブ情報のモデリング、帰納的なウェブ情報スキーマの統合およびウェブ情報の統合
ウェブ情報をモデリングするための第一歩として、サイバーワールドがいかに出現し、その実体がなにであるかを見きわめるために、ウェブ上の共有情報世界であるサイバーワールド形成の本質の特徴づけを行う。サイバーワールドＸは、しばしば多くのウェブサイトにおけるローカルかつ多岐にわたる活動の結果ウェブ上に形成される。企業内の情報とは異なり、開始点となるスキーマの集合を与えてくれる情報管理者の存在を仮定することはできない。情報マイニングのプロセスをとおし、ローカルに存在する複数のウェブサイトにおける特別な情報を発見してサイバースペースＸを知ることができる。もちろん情報マイニングは手当たりしだいすべきものではない。ウェブサイトをブラウザでながめたのち、複数のウェブサイトに分散して存在する情報およびその統合からなにをマイニングすべきか、およびいかなるものが出現すると予測されるかについてアイデアを抽出しなければならない。この種の情報マイニングは一般に「設計に基づく情報マイニング」と呼ばれる。なぜなら、マイニングすべき対象に関し、「統合指針」として適用すべき所定の規則が存在するためである。この統合指針は、なにをどのように統合するかについて設計指針として働く。
【００３２】
上述のＷｈｉｔｅｈｅａｄの帰納的スキームに基づくウェブ上の情報マイニングによれば、ローカルなウェブの世界の全世界規模のサイバーワールドへの統合は完全な形で実現される。帰納的な統合によってｎ次元のサイバーワールドＸ^ｎが取得される具体的な方法を、以下ウェブ上のサーチおよび統合のプロセスによって説明する。
【００３３】
帰納的な統合はふたつのフェイズからなる。すなわち情報のスキーマ統合フェイズおよび情報統合フェイズである。第１のフェイズである情報スキーマの統合フェイズは以下の手順で進行する。
１．興味の対象である属性である
【数２１】

をすべて読み出し、以下の０次元のサイバーワールドＸ^０を形成する。
【数２２】
Ｘ^０＝｛ｅ^０ _１，ｅ^０ _２，ｅ^０ _３，・・・ｅ^０ _ｊ｝
２．１次元のサイバーワールドＸ^１を生成するために、ウェブサイトにおける興味の対象であるふたつの属性のすべての組合せ
【数２３】

を読み出す。そののち、それらの共通部分のない和集合、
【数２４】

を接着写像ＦによってＸ^０へ接着する。こうして、以下の１次元サイバーワールドＸ^１を得ることができる。
【数２５】

ただしここで、ｉ＝１、２、・・・ｋであり、接着写像Ｆは、
【数２６】

である。
【００３４】
３．属性の読み出しおよび統合を繰り返すことにより、情報マイニングを経て（ｎ−１）次元のサイバーワールドＸ^ｎ−１を構築したとする。ここでＸ^ｎ−１はｎ個の属性を有する。（ｎ＋１）個の属性を有するｎ次元のサイバーワールドＸ^ｎを統合的に生成するために、いままでと同様の方法でウェブサイトにおいて興味の対象である（ｎ＋１）個の属性
【数２７】

のすべての組み合わせを読み出す。つづいてそれらの共通部分のない和集合、
【数２８】

をすでに構築された（ｎ−１）次元のサイバーワールドＸ^ｎ−１へ接着写像Ｇをとおして接着する。この結果、以下のようにｎ次元のサイバーワールドＸ^ｎを生成することができる。
【数２９】

ただし、ｉ＝１、２、・・・ｋであり、接着写像Ｇは、
【数３０】

である。以上のプロセスにより、情報スキーマの統合が完了する。
【００３５】
一方、第２のフェイズである情報統合フェイズは、きわめて単純であるが計算量は多い。このフェイズは、設計指針に基づき、セル接着によって生成されるサイバーワールドに含まれるべきインスタンスを判断および決定するために、スキーマ統合の際に行われるセル接着のすべてのステップにおいて、すべてのインスタンスを検査する。
【００３６】
Ｗｈｉｔｅｈｅａｄの帰納的な方法論に基づいて構築したサイバーワールドは、以下の関係式を満たす。
【数３１】
Ｘ^０⊆Ｘ^１⊆Ｘ^２⊆・・・⊆Ｘ^ｎ−１⊆Ｘ^ｎ⊆・・・⊆Ｘ
サイバーワールドの有効性の観点からいえば、この式は任意の有効なサイバーワールドがそれ以下の次元のサイバーワールドを含み、かつそれらのサイバーワールドが有効であることを意味する。
【００３７】
上述の例において、アイデンティフィケーションは同値関係に基づく同値類によって行われる。「同値類によるアイデンティフィケーション」はリレーショナルモデルにおける統合（ｊｏｉｎ）演算の一般化である。この点は、セル情報モデルの実用上の能力の一部を示している。ウェブ上のサイバーワールドの高度に複雑かつきわめて速い変化に鑑みれば、セル情報モデルのこの統合能力は、ウェブ情報モデルとして真の理論的基礎を提供するものである。
【００３８】
なお、設計指針を実行するために「興味の対象である属性」というとき、「興味」とは、すくなくとも部分的な意味において、アイデンティフィケーションのための同値関係の選択を意味する。すなわち、「アイデンティフィケーションのための同値関係の選択」は設計指針の主要部分を占めている。ウェブに関連する情報システムにおいて、設計指針は、イントラネットまたはコミュニティネットとしてのローカルなサイトを統治するためにローカルに存在するか、または国境のないサイバーワールドにおいて作用すべくグローバルに存在する。設計指針は、ウェブに基づく情報システムにおいて再利用可能なリソースである。
［５］帰納的でない情報スキーマの統合としてのウェブ情報の状況モデリング、およびセル情報モデルに基づく情報の統合
ウェブ上において、しばしば、任意のサイバーワールドから新たなサイバーワールドを創造する必要が生じる。これは、前章で述べた帰納的手法をつうじた情報マイニングよりも一般的であり、ウェブ上の電子商取引を含むｅ−ビジネスにおいてよく見られる要請である。たとえば、時空の両面で変化するウェブの状況をモデリングするために電子商取引の状況を考える。電子商取引の情報システムを構築するために、情報スキーマの観点からウェブ上の商取引の構造を見いだすことが一般に必要である。典型的な電子商取引における状況は以下のものを含む。
【００３９】
状況１．ある商品を購買するｅ−カスタマは、その商品をもっとも安い値段で販売するｅ−ショップを探すためにウェブをブラウズする。
状況２．ウェブ上で商品を販売するｅ−ショップは、セールスを拡大するためにｅ−カスタマのリストをブラウズする。
【００４０】
この状況において、ウェブ上でわれわれはｅ−ショップ、ｅ−カスタマおよびｅ−商品に関するすべての詳細情報を見いだすことに興味をもつわけではない。ここで、ｅ−ショップ、ｅ−カスタマおよびｅ−商品をそれぞれｓ、ｃおよびｍ次元のサイバーワールドとし、したがってそれぞれｓセルｅ^ｓ、ｃセルｅ^ｃおよびｍセルｅ^ｍと表記する。
【００４１】
状況１において、ｅ−カスタマは、あるｅ−ショップにおいて所望のｅ−商品がもっとも安い価格で売られているとき、購入者としての興味をもって、そのｅ−ショップにおける商品名を特定する。この状況は、セル分解演算およびそのあとに行われるアイデンティフィケーション演算によって特徴づけることができる。セル分解演算は、下に示す写像ｆであらわされる。この写像ｆは、接着写像ｇが保存されるかたちで、任意のｎ次元セルｅ^ｎをつぎの２つの共通部分をもたないセルの和集合へ射影する。
【数３２】

【数３３】

後述するように、各セル分解において接着写像を保存することにより、セル分解をホモトピックにすることができる。状況１に関する結論は、それを以下の状況モデルで理解することである。
１．セル分解
ｅ−ショップとしてのｓセルｅ^ｓ、ｅ−カスタマとしてのｃセルｅ^ｃおよびｅ−商品としてのｍセルｅ^ｍをセル分解する。このとき、電子商取引に関連する属性を特定すべく、同値セルｅ^ｑをそれ以外の部分から分離する。属性の例として、たとえばｅ^ｑをｅ^２へ簡単化して示せば、商品名、商品の識別情報および商品の価格がある。
２．セル接着によるセル構築
同値セルｅ^ｑを接着写像によってアイデンティファイする。すなわち、ｅ−商品としてのｍセルｅ^ｍ、およびｅ−ショップとしてのｓセルｅ^ｓをｅ−カスタマとしてのｃセルｅ^ｃへ接着する。
【００４２】
状況２も同様に、以下の状況モデルとして具体化される。
１．セル分解
状況１同様である。
２．セル接着によるセル構築
同値セルｅ^ｑを接着写像をとおしてアイデンティファイする。すなわち、ｅ−商品としてのｍセル｛ｅ^ｍ _ｉ｝およびｅ−カスタマとしてのｃセル｛ｅ^ｃ _ｉ｝をｅ−ショップとしてのｓセルｅ^ｓへ接着する。
［６］空間／時間情報および空間／時間演算のためのセル情報モデルの理論的フレームワークとしてのホモトピー
新世紀が幕を開けたいま、われわれは、現実の世界に対し、非常に根幹的な方法で影響を与えることができる時代になった。そのような瞬間に立ち会えることはきわめて幸運なことと言わねばならない。２１世紀に大きな役割を果たすと期待されるウェブおよびサイバーワールドに関する科学を構築することは、ウェブを基礎とする情報テクノロジーの構築に最大の貢献をするであろう。サイバーワールドは情報の世界であり、その意味においてウェブおよびサイバーワールドの情報モデルはキーエレメントである。同様に幸運なことに、われわれはセル空間構造として述べた科学を創造するために必要な数学的フレームワークをもっている。以下述べるホモトピー理論もそうである。
【００４３】
ホモトピー理論は、セル空間構造の基礎理論として働く。すなわち、サイバーワールドの時間および空間における変化を扱うとき、空間／時間情報および空間／時間演算を収容するためにホモトピー理論が利用される。いまたとえば、ひとつの位相空間Ｘから別の位相空間Ｙへの写像関数ｆの変化を考える。変化ののち、ｆは別の写像関数ｇになる。したがって、以下のｆからｇへの連続変形を設計する。
【数３４】
ｆ，ｇ：Ｘ→Ｙ
この変形を正規化された区間［０，１］について考える。この区間は時間的、空間的とを問わない。いま、位相空間Ｘのうち変化のない部分ＡをＸの部分空間ＡとしてＡ⊂Ｘと表記する。設計すべきホモトピーＨは以下のとおりである。
【００４４】
【数３５】
Ｈ：Ｘ×Ｉ→Ｙただし、
（∀ｘ∈）（Ｈ（ｘ，１）＝ｆ（ｘ）ａｎｄＨ（ｘ，１）＝ｇ（ｘ））
および
（∀ａ∈Ａ，∀ｔ∈Ｉ）（Ｈ（ａ，ｔ）＝ｆ（ａ）＝ｇ（ａ））
このときｆはＡに関してｇとホモトピックとよばれ、以下のように表記される。
【数３６】

ここで新たな設計上の問題が生じる。すなわち、２つの位相空間ＸおよびＹをホモトピー同値、
【数３７】

として設計する方法、つまりこれらを同じホモトピー型をもつよう設計する方法である。これは以下の手順で解決される。すなわち、ｆ：Ｘ→Ｙおよびｈ：Ｙ→Ｘが以下の条件を満たせばよい。
【数３８】

ここで１_Ｘおよび１_Ｙは恒等写像であり、以下の式をみたす。
【数３９】
１_Ｘ：Ｘ→Ｘａｎｄ１_Ｙ：Ｙ→Ｙ
以上の手法で、セルの次元をホモトピックに変化させることができる。ホモトピー同値はトポロジー同値よりも広い概念である。ホモトピー同値は、変化の前後において、位相幾何学的にはもはや同値といえないサイバーワールドのいかなる変化をもアイデンティファイすることができる。サイバーワールドは種々の演算および処理によって変遷を重ねてゆくが、その変化のプロセスはホモトピーによって特定され、またホモトピー同値によって有効性が保障される。たとえば、それぞれのセル分解を実行する際、なぜ接着写像が保存されるかが理解できる。それはセル分解をホモトピックに保ち、したがってセル分解のプロセスを逆向きにたどることができるためである。
【００４５】
ホモトピックな情報モデルの研究は、情報モデルの科学を探求するために、今後取り組まれていくべき分野である。いかなる情報演算がホモトピー同値になるかを検討することは非常に興味深い研究テーマになる。
【００４６】
［具体例］
以上の前提技術をもとに、以下本発明に係る情報管理装置を説明する。
図１は実施の形態に係る情報管理装置１０の構成を示す。情報管理装置１０は、データベース参照部１２、メモリ１４、解析部１６、ＧＵＩ（グラフィカル・ユーザ・インタフェイス）１８、整形部２４を備える。データベース参照部１２はインターネット経由でウェブ上から、またはローカルを含む任意の記憶装置から、ユーザが興味を示すデータベースを探索し、参照する。参照されたデータベースは、ワークエリアとしてのメモリ１４で保持される。解析部１６はＧＵＩ１８から与えられる指示をもとにメモリ１４に格納されたデータベースを解析し、必要な情報を抽出し、整形部２４へ出力する。整形部２４は渡された情報を図示しない表示用テンプレートへ流し込み、その他表示に必要な処理を施し、図示しない表示装置へ出力する。ユーザは表示装置で必要な情報を確認する。以下、実施の形態では、第１、第２データベースというふたつの異なるデータベースを読み出して利用するが、これらを併せて単にデータベースとよぶこともある。
【００４７】
解析部１６は、抽出部２０、演算部２２、手順取得部２６、記録部２８、判定部３０を備える。ＧＵＩ１８は属性指定部３２を備える。ユーザは、属性指定部３２において、データベース中、注目しようとする情報を指定する。指定は、例えば「ある商品の価格」のように行われ、そこからデータベースの属性「商品」「価格」などが抽出部２０へ送られる。以下、これら注目すべき属性の組を単に「注目情報」ともいう。
【００４８】
抽出部２０は第１、第２データベースからそれぞれ注目情報に当たる部分を抽出する。抽出は前提技術でいうセル分解であり、その結果、それぞれのデータベースから第１、第２の注目情報のセルが抽出される。セル分解にはいくつかのアルゴリズムが考えられるが、セルの境界をとることによってセルの次元を落としていく場合、すなわち、Ｂ^ｎから∂Ｂ^ｎを生成していく場合、必要な次数になるまで処理を繰り返すため、抽出部２０には自身へのフィードバックループが形成されている。
【００４９】
演算部２２は、抽出の結果得られたふたつの注目情報のセル間で所定の演算を施し、その結果を整形部２４へ出力する。セル間の演算は、たとえばそれらのセルの統合であり、前提技術でいう接着写像で表現される。演算の結果は記録部２８へ記録され、必要に応じて再利用される。
【００５０】
手順取得部２６は、ＧＵＩ１８から解析部１６に与えられた指示、抽出部２０による抽出の手順、演算部２２による演算の手順をすべてログ的に取得し、一連の操作を示すホモトピーを記録部２８へ記録する。その際、演算部２２の演算の結果と当該ホモトピーを関連づけて保存する。
【００５１】
判定部３０は、ユーザが注目情報を指定したとき、それに対応する目的のセルがすでに記録部２８に存在するかどうかを記録部２８内を検索して判定する。存在する場合、判定部３０は抽出部２０に対して抽出処理を停止するよう指示し、記録部２８から目的のセルを読み出してこれを整形部２４へ提供する。一方、セルが記録部２８に存在しないとき、判定部３０は抽出部２０に対して抽出処理の実行を指示する。
【００５２】
図２は、抽出部２０によるセル分解の概念を示す。同図では、データベース全体をｎ次元閉セルＢ^ｎとして表現し、その中のひとつの属性を外した境界を∂Ｂ^ｎと表示している。ここでは、外した属性は「ａ_０」であるが、いずれの属性を外していくかは、属性指定部３２から入力された注目情報をもとに判断する。たとえば、注目情報を構成する属性が「ａ_３」と「ａ_４」であれば、図２のｎ次元閉セルの属性を昇順に走査し、「ａ_０」「ａ_１」「ａ_２」「ａ_５」・・・のように外していけばよい。
【００５３】
以上の構成による情報管理装置１０の動作を具体例をもとに説明する。ここでは、第１、第２データベースとして、ふたつの店舗がそれぞれ構築する販売データベースを考える。これらの店舗は自身で用いるデータベースを最適化している結果、それらのデータベース構造は異なり、リレーショナルデータベースモデルでは両データベースを跨ぐようなデータ操作を行うことができない。ここでは、それらのデータベースから、ある特定の商品の実販累積数を調べたいとする。
【００５４】
図３、図４は、それぞれ第１データベース１００、第２データベース１２０の構成を示す。第１データベース１００は、商品欄１０２、価格欄１０４、累積欄１０６、メーカ欄１０８をもつ。第２データベース１２０は、商品欄１０２、メーカ欄１０８、発売日欄１２２、累積欄１０６、色欄１２４をもつ。
【００５５】
ユーザはまず、ＧＵＩ１８の属性指定部３２により、「商品ｄｅｆおよびｇｈｉの実販累積数を知りたい」と入力する。ここから、注目情報が「商品」「累積」と判明する。抽出部２０は第１データベース１００および第２データベース１２０から注目情報を抽出する。図５、図６は、それぞれ第１データベース１００、第２データベース１２０から分解によって抽出された注目情報の閉セルである第１注目セル１３０と第２注目セル１４０を示す。第１注目セル１３０、第２注目セル１４０は、それぞれＩＤ欄１３２、商品欄１０２、累積欄１０６を有する。ＩＤ欄１３２は、セル自身を特定するＩＤを格納し、これにより再利用性が確保される。第１注目セル１３０と第２注目セル１４０は、それぞれ「ＩＤ１」「ＩＤ２」というＩＤで必要に応じて記録部２８へ記録される。商品欄１０２には、それぞれ商品「ｄｅｆ」と「ｇｈｉ」のみが挙げられている。
【００５６】
つづいて、これらふたつの注目セルは演算部２２へ投入される。演算部２２は演算として、「ふたつの注目セルの統合」とその際、「累積数の加算」を実行する。
【００５７】
図７はその結果得られた最終目的セルである第３注目セル１５０を示す。第３注目セル１５０は、第１注目セル１３０等と同じ構造をもつが、累積欄１０６における数字が第１注目セル１３０と第２注目セル１４０の合計になっている。第３注目セル１５０は整形部２４へ出力され、ユーザへ結果として表示される。また、「ＩＤ３」が付与され、記録部２８へ格納される。
【００５８】
図８は、記録部２８に記録されたログ情報２００を示す。ログ情報２００は、一連の処理を時系列に示すホモトピー２０２と、その結果最終的に得られた閉セルである第３注目セル１５０へのリンク情報２０４を含む。ホモトピー２０２として、処理が以下のごとく最初から記述されている。
【００５９】
第１０行：第１データベース１００と第２データベース１２０の参照
第２０行：商品ｄｅｆとｇｈｉの累積を集計すべき旨の指示の入力
第３０行：第１データベース１００から注目情報である第１注目セル１３０（ＩＤ１）を生成
第４０行：第２データベース１２０から注目情報である第２注目セル１４０（ＩＤ２）を生成
第５０行：注目情報である第１注目セル１３０と第２注目セル１４０を商品ｄｅｆとｇｈｉについて接着写像ｆで集計し、第３注目セル１５０を生成
第６０行：第３注目セル１５０（ＩＤ３）を保存。
【００６０】
以上、実施の形態を説明した。この実施の形態によれば、以下のような作用効果が得られる。
まず、リレーショナルデータベースモデルと異なり、構造が違うデータベース間で自由なデータの参照と操作が可能になる。また、その操作をホモトピーで残すことにより、最初のデータベースから最後の結果に至る任意の時点のデータを取り出すことができる。リレーショナルデータベースモデルでは、ホモトピーを残す発想がないため、射影（プロジェクション）によって必要な属性を取り出すと、もとのテーブルとの関連性を維持することができず、データの柔軟な活用が困難である。
【００６１】
なお、手順取得部２６は、ホモトピーを利用して任意の時点の注目情報を特定する機能、すなわちＧＵＩ１８を介してユーザが求める時点を特定し、ホモトピーを上から、または下から辿ることにより、所期の時点における注目セルを特定する機能を備えてもよい。
【００６２】
目的セルである第３注目セル１５０を最初のデータベースである第１データベース１００、第２データベース１２０とは別に生成し、別の個所へ記録したため、目的セルの再利用性が確保されている。
【００６３】
以上、実施の形態は例示であり、さまざまな変形例が可能であり、そうした変形例も本発明に含まれることは当業者に理解されるところである。
【００６４】
【発明の効果】
本発明によれば、データベースの情報管理を効果的に行うことができる。
【図面の簡単な説明】
【図１】実施の形態に係る情報管理装置の構成図である。
【図２】実施の形態で注目情報を境界から抽出する概念を示す図である。
【図３】実施の形態で読み込む第１データベースを示す図である。
【図４】実施の形態で読み込む第２データベースを示す図である。
【図５】実施の形態で第１データベースから抽出された注目情報に相当する第１注目セルを示す図である。
【図６】実施の形態で第２データベースから抽出された注目情報に相当する第２注目セルを示す図である。
【図７】第１注目セルと第２注目セルから演算の結果求められた目的セルである第３注目セルを示す図である。
【図８】実施の形態の一連の処理を記述したホモトピーを含むログ情報を示す図である。
【符号の説明】
１０情報管理装置、１２データベース参照部、２０抽出部、２２演算部、２６手順取得部、２８記録部、３０判定部、３２属性指定部。

Claims

所定のデータベースを参照する参照部と、
参照されたデータベースに記述された情報をｎ次元閉セルとして扱い、いま注目しようとする属性の組からなる情報をｉ次元閉セルとして扱い、前記ｎ次元閉セルから前記ｉ次元閉セルを抽出する抽出部と、
前記注目しようとする属性の組の決定手順、および前記ｉ次元閉セルの抽出の手順をホモトピーとして記録する記録部と、
を備え、前記抽出部は、前記ｉ次元閉セルを前記データベースが物理的に記憶されている領域とは別の記憶領域へ保存することを特徴とする情報管理装置。
前記抽出部は、前記ｎ次元セルの境界を（ｎ−ｉ）回取ることにより前記ｉ次元セルを抽出する請求項１に記載の装置。
前記記録部は、前記ホモトピーと対応づけて前記ｉ次元セルを記録する請求項１に記載の装置。
新たに注目しようとする属性の組が決定されたとき、この組に対応するｊ次元セルがすでに前記記録部に記録されているか否かを判定する判定部をさらに含む請求項３に記載の装置。
前記参照部は、前記所定のデータベースのほかに第２のデータベースを参照し、前記抽出部は、これらふたつのデータベースからそれぞれｉ次元セルを抽出し、
当該情報管理装置はさらに、抽出されたふたつのｉ次元セル間で所期の処理を実行する演算部を備える請求項１に記載の装置。
前記記録部は、前記処理の結果を当該処理の手順とともに記録する請求項５に記載の装置。
第１および第２のデータベースを参照する参照部と、
前記第１および第２のデータベースにおいて注目しようとする属性の組を指定する指定部と、
前記第１および第２のデータベースに記述された情報をそれぞれ第１および第２の多次元閉セルとして扱い、前記注目しようとする属性の組からなる情報を目的の閉セルとして扱い、前記第１および第２の多次元閉セルからそれぞれ目的の閉セルを抽出する抽出部と、
抽出された目的の閉セルどうしの間で所期の処理を実施する演算部と、
前記目的の閉セルの抽出手順および前記処理をホモトピーとして記録し、かつ前記処理が実施された前記目的の閉セルを前記ホモトピーと関連づけて記録する記録部と、
前記指定部にて、注目しようとする属性の組が新たに指定されたとき、この組に対応する目的の閉セルがすでに前記記録部に記録されているか否かを判定する判定部と、
を備え、目的の閉セルが前記記録部に記録されていないとき前記抽出部による抽出が行われ、目的の閉セルが前記記録部に記録されているときは前記抽出部による抽出はスキップされ、前記記録部から当該目的の閉セルが読み出されて利用されることを特徴とする情報管理装置。
前記抽出部は、前記第１および第２のデータベース自体の書換を行わない方法にて前記目的の閉セルを抽出し、
前記演算部は、前記処理が実施された目的の閉セルを前記第１および第２のデータベースが物理的に記憶されている領域とは別の記憶領域へ保存する請求項７に記載の装置。
所定のデータベースを参照する参照部と、
参照されたデータベースに記述された情報を付加空間モデルにおけるセルとして扱い、いま注目すべき情報を前記セルからセル分解操作によって抽出する抽出部と、
前記注目すべき情報の決定および抽出の手順をホモトピーとして記録し、かつ前記注目すべき情報をそのホモトピーに関連づけて記録する記録部と、
新たに注目すべき情報が指定されたとき、この情報が前記記録部にすでに記録されているか否かを判定する判定部と、
を備えることを特徴とする情報管理装置。
第１および第２のデータベースを参照する参照部と、
前記第１および第２のデータベースにおいて注目すべき情報を指定する指定部と、
前記第１および第２のデータベースに記述された情報をそれぞれ付加空間モデルにおける第１および第２のセルとして扱い、前記注目すべき情報を前記第１および第２のセルからそれぞれセル分解操作によって目的セルとして抽出する抽出部と、
抽出された目的セルどうしの間で所期の処理を実施する演算部と、
前記目的セルの抽出手順および前記処理をホモトピーとして記録し、かつ前記処理が実施された前記目的セルを前記ホモトピーと関連づけて記録する記録部と、
前記指定部にて、注目すべき情報が新たに指定されたとき、この注目すべき情報に対応する目的セルがすでに前記記録部に記録されているか否かを判定する判定部と、
を備え、目的セルが前記記録部に記録されていないとき前記抽出部による抽出が行われ、目的セルが前記記録部に記録されているときは前記抽出部による抽出はスキップされ、前記記録部から当該目的セルが読み出されて利用されることを特徴とする情報管理装置。