JP2003323443A - 問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体 - Google Patents

問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体

Info

Publication number
JP2003323443A
JP2003323443A JP2002130563A JP2002130563A JP2003323443A JP 2003323443 A JP2003323443 A JP 2003323443A JP 2002130563 A JP2002130563 A JP 2002130563A JP 2002130563 A JP2002130563 A JP 2002130563A JP 2003323443 A JP2003323443 A JP 2003323443A
Authority
JP
Japan
Prior art keywords
search
information source
information
inquiry
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002130563A
Other languages
English (en)
Inventor
Takashi Hayashi
孝志 林
Gengo Suzuki
源吾 鈴木
Kazuya Konishi
一也 小西
Nobuyuki Kobayashi
伸幸 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002130563A priority Critical patent/JP2003323443A/ja
Publication of JP2003323443A publication Critical patent/JP2003323443A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 検索実行結果の転送量を軽減し、異種情報源
の高速な統合検索を行う。 【解決手段】 入力された問い合せを、その要求する情
報が情報源側で欠損しないような検索命令文に変換する
ために、仮検索命令文間にまたがる検索条件節を結合し
ている論理記号(AND/OR)や、情報源側で評価が
可能な要素と問い合せが要求している検索条件節の評価
の要素、検索条件節中で指定されている要素との包含関
係を判定することで、個々の仮検索命令文の情報源側で
の実行可否、統合検索装置側での再評価要/不要、限量
子の切り替えを判定する。該判定を一時的に保持し、該
判定に基づいて、個々の情報源での検索実行結果のう
ち、問い合せが要求していない情報を削除し、問い合せ
が要求している情報へと統合する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報源の統合検索
方法および装置に関する。
【0002】
【従来の技術】近年、コンピュータの高機能化や低価格
化、オープンなネットワークであるインターネット、イ
ントラネット、エクストラネット等の普及によって、エ
ンドユーザが大量の情報を容易に閲覧、加工できる環境
が急速に整いつつある。これと並行して、大量の情報を
効率的に蓄積・管理するための研究・開発が活発となっ
てきている。そして、情報はその種別に応じて、より効
率的な情報源管理システムが研究・開発されてきてい
る。ここで情報源管理システムとは、検索命令文を受け
付け、格納している情報の中から検索結果を返却するシ
ステムであり、データベース管理システムやファイルシ
ステム等を指す。また、情報源管理システムに管理され
ているデータベースやファイル群を情報源と呼ぶ。
【0003】例えば、ビジネス分野のアプリケーション
では、蓄積・管理する文字・数値情報が複雑な論理構造
を有することはそれほど多くないので、論理構造をテー
ブル形式で表現した関係データベースが有効である。ま
た、求められる操作も定型的であり、標準化されている
関係データベースの諸操作(関係代数)で十分簡明に記
述することができる。
【0004】一方、データの特性によっては、テーブル
形式にして正規化すると複雑な論理構造になってしまう
こともある。データの単位毎に、その中の項目が異なっ
たり、欠損する場合である。このようなデータを総称し
て半構造化情報と呼ぶ。そして、半構造化情報を扱うた
めにはこのようなデータの場合、階層構造でデータを表
現するXML(Extensible Markup Language)が有効で
ある。XMLは文書管理や電子商取引への応用が期待さ
れており、大量のXML文書を蓄積・検索したいという
ニーズが高まっている。実際、関係データベース管理シ
ステムに対し、XMLを容易に扱えるライブラリをカー
トリッジとして提供しているベンダや、XMLを変換し
たDOM(Document Object Model)を格納できるデー
タベース管理システムを製造しているベンダが増えてい
る。また、XMLを操作するための様々な言語も提案さ
れている。例えば、XML文書中の特定の部分を指定す
る言語としてXPathがW3C勧告として、公開され
ている(参考文献[1]:http://www.w3.org/TR/xpath
20/)。このXPathを問い合せ言語として利用して
いるデータベース管理システムは既に製造されている。
さらに、より複雑な操作も記述できる問い合せ言語XQ
ueryもW3Cによって開発がすすめられている(参
考文献[2]:http://www.w3.org/TR/xquery/)。
【0005】このように、情報の種別・特性に特化し
た、より効率的な情報源管理システムが研究・開発され
ている一方で、各情報源管理システムを個別に利用する
だけでなく、それらを統合するシステムの研究・開発も
すすんでいる。
【0006】本出願人は、特開平10−143539号
公報で、ネットワークに接続された、異なる複数の情報
源に対する情報検索を容易に行えるようにした情報検索
方式、情報検索システムを提案している。提案した情報
検索方法、情報検索システムは、複数の情報源に対して
アクセスするための参照情報を予め登録しておき、問い
合せを取得すると、その問い合せを解析し、参照情報を
参照して問い合せに対応する情報がどの情報源に格納さ
れているかを特定するとともに、どのような取得方法で
情報が取得可能であるかの情報を取得し、問い合せに対
応する情報の格納位置および取得方法を示す情報に基づ
いて検索命令文を生成し、問い合せに対応する情報源管
理システムから検索結果を取得し、ユーザに提供する。
したがって、提案した情報検索方法、情報検索システム
を利用すれば、情報源管理システムの参照情報を登録す
るだけでよく、それらを統合するためのプログラムを新
たにコーディングする必要はない。
【0007】このようなシステムはメディエータと呼ば
れている。現在、内部のデータモデルとしてリレーショ
ナルモデルよりも柔軟な半構造モデル(XML)を採用
したシステム(以下、XMLメディエータ)が研究され
ている(参考文献[3]:V.Christophides 他:"On Wr
apping Query Languages and Efficient XML Integrati
on", Proc. of ACM SIGMOD/PODS 2000, Research Sessi
ons、参考文献[4]:C. Baru 他:"XML-Based Inform
ation Mediation with MIX", Proc. of ACM SIGMOD/POD
S 99, Demonstrations)。
【0008】
【発明が解決しようとする課題】しかし、XMLメディ
エータを用いて、様々な情報を統合する場合、次の問題
が生じる。
【0009】XMLメディエータを用いて、高速な異種
情報源の統合検索を実現する場合、問い合せ最適化が重
要となる。メディエータでは、利用者からの問い合せ
は、情報源の格納位置や問い合せ実行の手順などを意識
しない非手続き言語で指定される。この場合、メディエ
ータは、同一の結果を導出する複数の検索手続き候補か
ら最も効率の良い検索手続きを選択する。これを問い合
せの最適化と呼ぶ。特に、検索条件処理を情報源側に行
わせ、検索結果の転送量を軽減することによる問い合せ
の最適化は有効である。しかし、半構造化情報(XM
L)に対する問い合せは再構成・変換を含むことが一般
的である。再構成・変換に伴い、以下の問題が生じる。
【0010】(1)問い合せの最適化において、検索条
件処理により評価される要素が変化するため、単純に情
報源側に検索条件処理を行わせると、利用者が求める情
報を取得できない場合がある。ここで、利用者が求める
情報とは (1−1)問い合せで要求した必要な情報が欠損してい
ない (1−2)問い合せで要求していない不必要な情報が含
まれていない検索結果を指す。
【0011】スキーマとしてリレーショナルモデルを採
用したメディエータの場合、関係代数演算の間の可換規
則や結合規則を利用して、各検索手続き候補が同一の結
果を導出するのを示すことが容易である。これに対し、
従来のXMLメディエータでは、柔軟なスキーマ構造を
扱える反面、問い合せに含まれる再構成・変換を考慮せ
ず、単純に情報源側に検索条件処理を行わせると、利用
者が求める情報を取得できない場合がある。
【0012】また、異種情報源に検索処理を行わせる
と、以下の問題が生じる。
【0013】(2)異種情報源管理システムで採用され
ている各問い合せ言語の能力・制約を考慮した上での、
問い合せの最適化が困難である。
【0014】メディエータは、異なる複数の情報源に対
する検索を行う。そして、各情報源は独自の問い合せ言
語を採用している。利用者からメディエータに対して入
力された問い合せは、各情報源独自の問い合せ言語にマ
ッピングされる。この時、従来のXMLメディエータ
は、各問い合せ言語の能力・制約を考慮しておらず、問
い合せの最適化が困難であるという問題がある。
【0015】本発明の目的は、異種情報源を統合検索す
る際に、必要な情報の欠損、不要な情報の取得が生じ
ず、各問い合せ言語の能力・制約を考慮して容易に問い
合せの最適化ができつつ、検索実行結果の転送量を低減
し、異種情報源の高速な統合検索を行う統合検索方法お
よび装置を提供することにある。
【0016】
【課題を解決するための手段】本発明は、入力された問
い合せを、該問い合せが要求する情報を情報源側で欠損
しない検索命令文へと変換し、変換された検索命令文を
情報源に送信し、検索を実行させ、情報源での検索実行
結果を、問い合せが要求している情報へと統合する。
【0017】そして、入力された問い合せを、その要求
する情報が情報源側で欠損しないような検索命令文に変
換するために、仮検索命令文間にまたがる検索条件節を
結合している論理記号(AND/OR)や、情報源側で
評価が可能な要素と問い合せが要求している検索条件節
の評価の要素、検索条件節中で指定されている要素との
包含関係を判定することで、個々の仮検索命令文の情報
源側での実行可否、統合検索装置側での再評価要/不
要、限量子の切り替えを判定し、該判定を一時的に保持
し、該判定に基づいて、個々の情報源での検索実行結果
のうち、問い合せが要求していない情報を削除し、問い
合せが要求している情報へと統合する。
【0018】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0019】図1は本発明の一実施形態である統合検索
装置の構成を示すブロック図である。
【0020】統合検索装置1はユーザインタフェース部
11と構文解析部12と統合検索処理部13と情報源ア
クセス部14とメタデータ記憶部15とメタデータ管理
部16とを有する。
【0021】ユーザインタフェース部11は、アプリケ
ーションプログラム3を介して入力される問い合せ7を
受け付ける。問い合せ7は複数の検索結果構造指定語
(c=1〜C)を含む検索結果構造指定部分7aと、複
数の検索条件指定語(w=1〜W)からなる検索条件指
定部分7bから構成される。検索結果構造指定語および
検索条件指定語を総称して問い合せ指定語と呼ぶ。
【0022】構文解釈部12は、ユーザインタフェース
部11が受け付けた問い合せ7の構文を解析する。
【0023】統合検索処理部13は、各情報源管理シス
テム51,52で採用されている問い合せ言語によって記
述された検索命令文8を生成し、各情報源61a,61b
2a,62bに格納されている情報を一括して検索する。
統合検索処理部13中で、ビュー所在探索部21は、問
い合せ7中(検索結果構造指定部分7a、検索条件指定
部分7b)で指定されたビューの所在を探索する。ここ
で、ビューとは、ある視点からとらえた仮想的な情報で
ある。本実施形態では、ビューには(a)情報源61a
1b,62a,62bの情報をそのまま登録したビュー(以
下、情報源ビュー)、(b)問い合せ7により新しく生
成し、登録したビュー(以下、問い合せ生成ビュー)の
2種類がある。検索命令文生成計画部22は、(1)ア
プリケーションプログラム3を介して入力された問い合
せ7、(2)探索されたビューのスキーマ構造、(3)
各情報源管理システム51,52で採用されている問い合
せ言語の能力・制約を考慮して、情報源61a,61b,6
2a,62bにどのような検索命令文8を送信すればよいか
を計画し、さらに、各検索命令文8の検索結果を統合す
るための処理を計画する。検索命令文生成実行部23
は、検索命令文生成計画部22が計画した情報源に送信
する検索命令文8に関する情報を受けて、問い合せ指定
語を構成して、情報源アクセス部14が送出する検索命
令文8を生成する。処理一時記憶部24は、検索命令文
生成計画部22が計画した各検索命令文8の検索結果の
処理に関する情報を一時的に記憶する領域である。検索
結果処理部25は、情報源アクセス部14が取得した情
報源検索結果9に対し、それらを統合するために、検索
命令文生成計画部22が計画し、処理一時記憶部24が
記憶していた処理(複数の情報源に跨ったジョインや、
検索条件によるフィルタリング、検索結果構造の再構成
等)を行う。
【0024】情報源アクセス部14は、生成された検索
命令文8を各情報源管理システム5 1,52に送信し、情
報を取得する。この情報源アクセス部14には、通信網
4を介して情報源管理システム51,52が接続されてい
る。
【0025】メタデータ記憶部15は、各情報源管理シ
ステム51,52の所在、アクセス情報、各情報源61a
1b,62a,62bに格納されているビューのスキーマ構
造・構成要素などに関する情報を記憶し管理する。
【0026】メタデータ管理部16は、メタデータ記憶
部15に対する各種情報の入力/削除/変更を行う。シ
ステム管理者は、メタデータ管理部16を介してメタデ
ータを登録・管理する。
【0027】図2はメタデータ記憶部15が保有する情
報の詳細を示す。メタデータ記憶部15は、各情報源管
理システム51,52にアクセスする手段等の情報源管理
システムに関する情報を管理する情報源管理システムメ
タデータと、情報源ビューのスキーマ構造・要素および
所在やユーザ名などのアクセス情報あるいは問い合せ生
成ビューを生成するための問い合せ(ビュー生成用問い
合せ)と生成されたビューのスキーマ構造・要素を管理
するビューメタデータと、ビューとビューとの間の関連
および関連を結びつけるための要素を管理する関連メタ
データとを保有する。
【0028】次に、統合検索装置1の処理手順の概要に
ついて説明する。図3は本実施形態の全体の概略動作を
示すフローチャートであり、準備フェーズ(ステップ1
00)と検索フェーズ(ステップ200)の順で処理が
行われる。準備フェーズでは、検索を実行する前に、シ
ステム管理者がメタデータの準備を行う。検索フェーズ
は検索を実行するフェーズである。
【0029】図4は準備フェーズを具体的に示すフロー
チャートである。まず、各情報源管理システム51,52
に関する情報を情報源管理システムメタデータに定義し
(ステップ101)、各ビューのアクセス情報とスキー
マ構造・要素あるいはビューを生成するための問い合せ
と登録されたビューのスキーマ構造・要素をビューメタ
データに定義し(ステップ102)、ビューとビューと
の間の関連および関連を結びつけるための要素に関する
情報を関連メタデータに定義する(ステップ103)。
上記処理は、メタデータ管理部16を介してシステム管
理者が定義してもよいし、各情報源61a,61b,62a
2bがそれぞれのメタ情報を返却する機構を有していれ
ば、該機構を利用し、自動的に定義してもよい。
【0030】図5は検索フェーズを具体的に示すフロー
チャートである。検索フェーズでは、まず、ユーザイン
タフェース部11が、アプリケーションプログラム3を
介して入力されたユーザからの問い合せ7を受理する
(ステップ201)。構文解析部12は問い合せ7を解
析し(ステップ202)、ビュー所在探索部21は、問
い合せ7中で指定されたビューをビューメタデータから
探索する(ステップ203)。ステップ204で、指定
されたビューがビューメタデータに無ければエラー出力
して検索フェーズを終了する。ステップ205で、探索
されたビューが問い合せ生成ビューの場合、ビュー生成
用問い合せ中で指定されたビューをさらにビューメタデ
ータから探索する。これを情報源ビューに行き着くまで
繰り返す。つづいて、該情報源ビューを管理する情報源
管理システム51,52をビューメタデータから探索し
(ステップ206)、該情報源ビューへのアクセス情報
の項目が情報源管理システムメタデータに設定されてい
る項目と等しいかを判断し(ステップ207)、等しく
なければエラー出力して検索フェーズを終了する。次
に、検索命令文生成計画部22は、ビューメタデータ、
関連メタデータを参照して、仮検索命令文(cand=
1〜CAND)の組み合わせを生成し(ステップ20
8)、処理一時記憶部24を初期化する(ステップ20
9)。初期化では、全ての検索条件指定語について、
「限量子」を問い合せそのままに、「情報源側での評価
が可能」であり、「統合検索装置側での評価は不要」と
設定する。次に、仮検索命令文が1つ(cand=1)
(ステップ210)か、または仮検索命令文が複数の場
合、仮検索命令文間にまたがる検索条件指定部分が全て
AND条件で連結され(ステップ211)、かつ等結合
の場合(ステップ212)のみ、検索条件処理を情報源
側に行わせられる可能性がある。その他の場合、検索条
件処理を情報源側に行わせることはできず、全て統合検
索装置1側で行う。したがって、処理一時記憶部24を
「情報源側での評価が不可能」、「統合検索装置側での
評価が必要」と更新する(ステップ213)。検索条件
処理を情報源に行わせられる可能性がある場合、個々の
仮検索命令文の各検索条件指定語Wcand(i)(i
=1〜N)についてビューメタデータを参照して、情報
源側で評価が可能な要素とアプリケーションプログラム
3を介して入力された問い合せ7が要求している評価の
要素との包含関係が(1)1:1、(2)N:1、
(3)1:Nのいずれかを判定する(ステップ21
4)。なお、以下で1とは要素数が高々1であることを
指す。(1)1:1の場合、検索条件指定部分7bの限
量子がALLでもANYでも、検索条件指定語Wcan
d(i)に関しては検索条件処理を情報源側に行わせら
れるため、処理一時記憶部24の更新は行わない。
(2)N:1の場合、検索条件指定部分7bの限量子が
ALLでもANYでも、Wcand(i)に関しては検
索条件処理を情報源側に行わせることはできない。つま
り、統合検索装置1側で評価を行う必要がある。処理一
時記憶部24を「情報源側での評価が不可能」、「統合
検索装置側での評価が必要」と更新する(ステップ21
5)。(3)1:Nの場合、さらに、情報源側で評価が
可能な要素と検索条件指定語Wcand(i)との包含
関係が(3−1)1:1、(3−2)1:Nのいずれか
を判定する(ステップ216)。(3−1)1:1の場
合、検索条件指定部分7bの限量子がALLでもANY
でも、Wcand(i)に関しては検索条件処理を情報
源側に行わせられる。したがって、処理一時記憶部24
は更新を行わない。(3−2)1:Nの場合、検索条件
指定部分7bの限量子がALLの場合、ANYにして、
ANYの場合、そのままで、Wcand(i)に関して
は検索条件処理を情報源側に行わせられる。ただし、統
合検索装置側で再評価が必要となる。したがって、「統
合検索装置1側での評価が必要」、「限量子について
は、ALLをANYに変更」するように処理一時記憶部
24を更新する(ステップ217)。上記の処理を検索
条件指定語の数N回分繰り返す。そして、各検索条件指
定語Wcand(i)間のAND/ORにより、最終的
に条件処理を情報源側に行わせられるかを判定し、これ
で処理一時記憶部24の情報を更新する(ステップ21
8)。上記の処理を、仮検索命令文の数(CAND)分
繰り返す。検索命令文生成実行部23は、探索されたビ
ューの所在および上記処理に関する情報を参照し、検索
命令文8を生成する(ステップ219)。情報源アクセ
ス部14は、生成された検索命令文8をアクセス情報と
ともに各情報源管理システム51,52に送信し(ステッ
プ220)、情報源検索結果9を取得する(ステップ2
21)。検索結果処理部25は、情報源アクセス部14
が取得した情報源検索結果9に対し、処理一時記憶部2
4を参照し、問い合せ7に応じた処理(複数の情報源に
跨ったジョインや、検索条件によるフィルタリング、検
索結果構造の再構成等)を行い(ステップ222)、ユ
ーザインタフェース部11を介して検索結果10を出力
する(ステップ223)。
【0031】次に、本実施形態における処理手順の詳細
を、図7から図43を用いて具体的に説明する。 (A)XPathを問い合せとして受付可能な情報源管
理システム 図7は、検索対象となるXML文書群を管理する情報源
管理システムおよび情報源の例を示すイメージ図であ
る。XML文書群を格納しているデータベース名はit
em_informationであり、XML文書管理
システムeXobjectにより管理されている。接続
するためのユーザ名はadminであり、パスワードは
hogehogeである。eXobjectは、XPa
thを問い合せとして受け付け可能な情報源管理システ
ムである。XPath規格では、木構造をどのような経
路でたどって所望のデータを特定するかという記述法を
決めている(詳細は、参考文献[1]:http://www.w3.
org/TR/xpath20/ 参照)。
【0032】図8、図9は、item_informa
tionに格納されているXML文書brand−li
st.xmlの内容を示す図である。図8(a)は、文
書要素およびその階層構造を規定するDTD(Document
Type Definition)のグラフィック表現、図8(b)は
実際のXML文書、図9は実際のXML文書(インスタ
ンス)のグラフィック表現をそれぞれ示す図である(グ
ラフィック表現については、参考文献[5]:改定版標
準XML完全解説 参照)。 (B)SQLを問い合せとして受付可能な情報源管理シ
ステム 図10は、検索対象となる文字・数値情報を格納してい
る関係データベース管理システムおよび関係データベー
スの例を示すイメージ図である。関係データベース名は
order_dataであり、関係データベース管理シ
ステムDataSQLにより管理されている。接続する
ためのユーザ名はtigerであり、パスワードはge
hogehoである。DataSQLは、標準的なSQ
Lを受け付ける関係データベース管理システムである。
【0033】図11に示す通り、データベースorde
r_dataには、注文IDと発注者とを管理するor
derテーブル、商品名と価格を管理するitemテー
ブルなどが格納されている。
【0034】次に、上記具体例に基づいて、図3に示す
各フェーズの動作を具体的に説明する。
【0035】まず、準備フェーズについて説明する。図
12は情報源管理システム名とライブラリ名と該システ
ムにアクセスするのに必要な情報の種別とを示す情報源
管理システムメタデータの内容を示す図である。各情報
源管理システムにアクセスする手段に関する情報とし
て、図12に示すように、情報源管理システム名と接続
手段のライブラリ名と該システムにアクセスするのに必
要な情報の種別とを情報源管理システムメタデータに設
定する(図4のステップ101)。
【0036】図13は、情報源ビューのスキーマ構造・
要素および所在やユーザ名などのアクセス情報あるいは
問い合せ生成ビューを生成するための問い合せ(ビュー
生成用問い合せ)と生成されたビューのスキーマ構造・
要素を管理するビューメタデータの内容を示す図であ
る。図13(a),(b)が、それぞれeXobjec
tに管理されているデータベースitem−infor
mationとDataSQLに管理されているデータ
ベースorder_dataのアクセス情報、スキーマ
構造、要素を表している情報源ビューのビューメタデー
タである。minOccurおよびmaxOccurは
各要素の出現回数の最小値および最大値である。unb
oundedは無限大を示す。
【0037】ビューを生成するための言語は、アプリケ
ーションプログラム3を介して入力される問い合せ7と
同じ言語を採用するとし、複数の検索結果構造指定語
(c=1〜C)からなる検索結果構造指定部分7aと、
複数の検索条件指定語(w=1〜W)からなる検索条件
指定部分7bから構成されるとする。本実施形態では、
XQueryのFLWR式を用いて説明する。FLWR
式には、指定されたノードシーケンスを変数にバイン
ドするFOR節またはLET節、指定された条件に従
ってノードシーケンスをフィルタリングするWHERE
節、照会結果ツリーを生成するRETURN節からな
る(詳細は参考文献[2]:http://www.w3.org/TR/xqu
ery/ 参照)。図13(c)が、データベースorde
r_dataに対して生成したビューorder−li
stの生成用問い合せ、スキーマ構造、要素を表してい
る問い合せ生成ビューのビューメタデータである。
【0038】各情報のアクセス情報とスキーマ構造・要
素あるいはビューを生成用問い合せと登録されたビュー
のスキーマ構造・要素を、ビューメタデータに設定する
(図4のステップ102)。
【0039】図14は、ビューとビューとの間の関連お
よび関連を結びつけるための要素に関する情報である関
連メタデータの内容を示す図である。図14は2つのビ
ューを商品名(item−nameとdescript
ion)で等結合することを示す。関連に関する情報を
関連メタデータに設定する(図4のステップ103)。
【0040】次に、検索フェーズについて説明する。 (a)XPath情報源に対する問い合せ−その1 図15に示す問い合せがアプリケーションプログラム3
から発行された場合を例に具体的に説明する。図15は
「ブランド名がAndrew Soccerである製品
のブランド名と製品名を検索する」問い合せである。
【0041】まず、問い合せ7を受理し(図5のステッ
プ201)、構文解析部12は問い合せ7を解析する
(図5のステップ202)。
【0042】・検索結果構造指定語 brand−na
me, item−name ・検索条件指定語 brand−name ビュー所在探索部21は、問い合せ7中で指定されたビ
ューをビューメタデータから探索する(図5のステップ
203)。図15の問い合せでは、2行目のbrand
−listから図13(a)の3行目brand−li
stが探索される。問い合せ7で指定されたビューが存
在し(図5のステップ204)、かつ情報源ビューなの
で(図5のステップ205)、ビューbrand−li
stを管理する情報源管理システムをビューメタデータ
から探索する(図5のステップ206)。図13(a)
の6行目から該情報源ビューを管理しているのはeXo
bjectである。また、アクセス情報の項目も図12
と図13(a)8行目から10行目との比較から、db
−name、user−name、passwordと
等しい(図5のステップ207)。
【0043】次に、検索命令文生成計画部22は仮検索
命令文の組み合わせを生成し(図5のステップ20
8)、図16に示すように処理一時記憶部24を初期化
する(図5のステップ209)。図16の5行目が検索
条件指定語brand−nameの検索条件処理を情報
源側に行わせられ(push_down=“OK”)、
統合検索装置1側での(再)評価が不要であり(eva
luate=“No Need”)、限量子はANYで
評価すること(quantifier=“ANY”)を
示している(XQueryのWHERE節はデフォルト
ANYのため初期化ではANYとする)。
【0044】図15の問い合せ7は単一の情報源ビュー
に対する問い合せなので、仮検索命令文の数cand=
1であり、検索条件処理を情報源側に行わせられる可能
性がある(図5のステップ210)。また、検索条件指
定語は1語(brand−name)なので、i=1で
ある。
【0045】次に、検索条件指定語brand−nam
eについてビューメタデータを参照して、情報源側で評
価が可能な要素とアプリケーションプログラム3を介し
て入力された問い合せ7が要求している評価の要素との
包含関係を判定する(図6のステップ214)。情報源
側で評価が可能な要素は、XPathの持つ制約により
「全ての検索結果構造指定語および検索条件指定語に共
通する親要素」となる。図13(a)の14行目から2
4行目のスキーマを参照すると、brand−name
とitem−nameに共通する親要素はbrandな
ので、これが情報源側での評価可能な要素となる。一
方、図15に示す問い合せ7が要求している評価の要素
はfor節で変数に結びつけた要素となるため、ite
mとなる。以上と図13(a)のスキーマより、bra
nd1個に対し、itemはN個と判定される(図6の
ステップ214)。
【0046】さらに、情報源側での評価要素brand
1個に対し、検索条件指定語brand−nameは1
個なので(図6のステップ216)、処理一時記憶部2
4の更新は行わない。また、検索条件指定語は1語なの
で、AND/ORによる更新(図6のステップ218)
も行われない。
【0047】検索命令文生成実行部23は検索命令文8
を生成する(図6のステップ219)。生成された検索
命令文8(XPath)を図17に示す。
【0048】情報源アクセス部14は、生成された検索
命令文8(図17)をアクセス情報(db−name:
item−information, user−na
me:admin, password:hogeho
ge)とともに情報源管理システムeXobjectに
送信し(図6のステップ220)、情報源検索結果9を
取得する(図6のステップ221)。情報源アクセス部
14は図18に示す。
【0049】検索結果処理部25は、情報源アクセス部
14が取得した情報源検索結果9に対し、処理一時記憶
部24を参照し、検索結果構造の再構成を行い(図6の
ステップ222)、ユーザインタフェース部11を介し
て検索結果10を出力する(図6のステップ223)。
最終的な検索結果を図19に示す。 (b)XPath情報源に対する問い合せ−その2 続いて、図20に示す問い合せ7がアプリケーションプ
ログラム3から発行された場合を例に具体的に説明す
る。図20は「色が赤(一色)の製品のブランド名と製
品名を検索する」問い合せである(色は1つの製品につ
いて複数色指定可能。図9のAS−tie01参照)。
【0050】図5のステップ201から207までは先
ほどの(a)XPath情報源に対する問い合せ−その
1と同じなので、説明を省略する。
【0051】・検索結果構造指定語 brand−na
me, item−name ・検索条件指定語 color 次に、検索命令文生成計画部22は仮検索命令文の組み
合わせを生成し(図5のステップ208)、図21に示
すように処理一時記憶部24を初期化する(図5のステ
ップ209)。図21の5行目が検索条件指定語col
orの検索条件処理を情報源側に行わせられ(push
_down=“OK”)、統合検索装置1側での(再)
評価が不要であり(evaluate=“No Nee
d”)、限量子はALLで評価すること(quanti
fier=“ALL”)を示している(図20に示す問
い合せの3行目が限量子ALLを示しているため)。
【0052】図20の問い合せ7は単一の情報源ビュー
に対する問い合せなので、仮検索命令文の数cand=
1であり、検索条件処理を情報源側に行わせられる可能
性がある(図5のステップ210)。また、検索条件指
定語は1語(color)なので、i=1である。
【0053】次に、検索条件指定語$item/col
orについてビューメタデータを参照して、情報源側で
評価が可能な要素と、「アプリケーションプログラム3
を介して入力された問い合せ7が要求している評価の要
素との包含関係を判定する(図6のステップ214)。
先ほどの例同様、情報源側での評価可能な要素はbra
nd、図20に示す問い合せ7が要求している評価の要
素はitemとなるため、brand1個に対し、it
emはN個と判定される(図6のステップ214)。
【0054】さらに、情報源側での評価可能な要素br
and1個に対し、検索条件指定語colorはN個な
ので(図6のステップ216)、処理一時記憶部24を
更新する(図6のステップ217)。具体的には、図2
1の5行目evaluate=“No Need”をe
valuate=“Need”、quantifier
=“ALL”をquantifier=“ANY”とす
る。ALLのままでは、「色が赤のみの製品ばかり扱っ
ているブランド」が取得され、製品CK−tie01が
情報源側で落とされてしまう。また、検索条件指定語は
1語なので、AND/ORによる更新(図6のステップ
218)は行われない。
【0055】検索命令文生成実行部23は検索命令文8
を生成する(図6のステップ219)。生成された検索
命令文8(XPath)を図22、取得された検索結果
10を図23に示す。「色が(ANY=1つでも)赤い
製品を含むブランド」が取得されている。
【0056】検索結果処理部25は、再評価および検索
結果構造の再構成を行い(図6のステップ222)、ユ
ーザインタフェース部11を介して検索結果10を出力
する(図6のステップ223)。最終的な検索結果を図
24に示す。再評価により、AS−tie01、CK−
shirt01、CK−tie01が落ち、AS−sh
irt01、AS−suit01、CK−tie02が
残る。 (c)XPath情報源に対する問い合せ−その3 続いて、図25に示す問い合せ7がアプリケーションプ
ログラム3から発行された場合を例に具体的に説明す
る。図25は「ブランド名がAndrew Socce
rかまたは、色が赤(一色)の製品のブランド名と製品
名を検索する」問い合せである。
【0057】図5のステップ201から207までは先
ほどの(a)、(b)と同じなので、説明を省略する。
【0058】・検索結果構造指定語 brand−na
me, item−name ・検索条件指定語 brand−name, co
lor 初期化された処理一時記憶部24を図26に示す(図5
のステップ209)。図25の問い合せ7は単一の情報
源ビューに対する問い合せなので、仮検索命令文の数c
and=1であり、検索条件処理を情報源側に行わせら
れる可能性がある(図5のステップ210)。
【0059】図6のステップ214,216,217は
先ほどの(a)、(b)と同じなので、説明を省略す
る。次に、検索条件指定語は2語(brand−nam
e,color)なので、AND/ORによる更新(図
6のステップ218)は行う。表1にAND/ORによ
る更新マトリックスを示す。
【0060】
【表1】
【0061】問い合せ7に示すように、検索条件指定語
はORで連結されており(図5の3行目)、一方が統合
検索装置1での再評価を必要としている場合(eval
uate=“Need”)、統合検索装置1側では、両
方の条件で再評価する必要がある。更新された処理一時
記憶部24を図27に示す。
【0062】検索命令文生成実行部23は、検索命令文
8を生成する(図6のステップ218)。生成された検
索命令文8(XPath)を図28、取得された検索結
果10を図29に示す。「ブランド名がAndrew
Soccerかまたは、色が(ANY=1つでも)、赤
い製品を含むブランド」が取得されている。検索結果処
理部25は、再評価および検索結果構造の再構成を行い
(図6のステップ222)、ユーザインタフェース部1
1を介して検索結果10を出力する(図6のステップ2
23)。最終的な検索結果を図30に示す。brand
−nameにより再評価を行うことで、AS−tie0
1が残る。 (d)SQL情報源に対する問い合せ−その1 図31に示す問い合せ7がアプリケーションプログラム
3から発行された場合を例に具体的に説明する。図31
は「顧客Yotsukoshiによる注文(orde
r)を検索する」問い合せである。
【0063】まず、問い合せ7を受理し(図5のステッ
プ201)、構文解析部12は問い合せ7を解析する
(図5のステップ202)。
【0064】・検索結果構造指定語 order ・検索条件指定語 customer ビュー所在探索部21は、問い合せ7中で指定されたビ
ューをビューメタデータから探索する(図5のステップ
203)。図31の問い合せ7では、1行目のorde
r−listから図13(c)の71行目order−
listが探索される。問い合せ7で指定されたビュー
は存在したが(図5のステップ204)、情報源ビュー
ではないので(図5のステップ205)、ビュー生成問
い合せ内で指定されているビューを、再びビューメタデ
ータから探索する(図5のステップ203)。ビュー生
成問い合せでは、図13(c)74行目のorder−
dataから図13(b)の31行目order−da
taが問い合せで指定されたビューが存在し(図5のス
テップ204)、かつ情報源ビューなので(図5のステ
ップ205)、order−dataを管理する情報源
管理システムをビューメタデータから探索する(図5の
ステップ206)。図13(b)の34行目から該情報
源ビューを管理しているのはDataSQLである。ま
た、アクセス情報の項目も図12と図13(b)36行
目から38行目との比較から、db−name、use
r−name、passwordと等しい(図5のステ
ップ207)。
【0065】・検索結果構造指定語 id,cust−
name,description,cost ・検索条件指定語 cust−name,id(ジ
ョイン条件),oid(ジョイン条件) 次に、検索命令文生成計画部22は仮検索命令文の組み
合わせを生成し(図5のステップ208)、図32に示
すように処理一時記憶部24を初期化する(図5のステ
ップ209)。図32の5行目が検索条件指定語cus
t−nameの検索条件処理を情報源側に行わせられ
(push_down=“OK”)、統合検索装置1側
での(再)評価が不要であり(evaluate=“N
o Need”)、限量子はANYで評価すること(q
uantifier=“ANY”)を示している(SQ
LのWHERE節はデフォルトANYのため初期化では
ANYとする)。
【0066】図31の問い合せ7は単一の情報源ビュー
に対する問い合せなので、仮検索命令文の数cand=
1であり、検索条件処理を情報源側に行わせられる可能
性がある(図5のステップ210)。また、検索条件指
定語は1語(cust−name)なので、i=1であ
る。
【0067】次に、ビューメタデータを参照して、情報
源側で評価が可能な要素とアプリケーションプログラム
3を介して入力された問い合せ7が要求している評価の
要素との包含関係を判定する(図6のステップ21
4)。情報源側での評価可能な要素は、SQLの持つ制
約により「row要素毎」となる。判定のため、図13
(c)のビュー生成問い合せによって生成されるビュー
の内容を図33、34に示す。図33は、ビューの要素
および階層構造を規定するDTDのグラフィック表現、
図34はインスタンスのグラフィック表現をそれぞれ示
す図である。図31に示す問い合せ7が要求している評
価の要素はfor節で変数に結びつけた要素となるた
め、orderとなる。以上より、row(=db/o
rder/row)1個に対し、orderは1個なの
で、更新は行わない。また、検索条件指定語は1語なの
で、AND/ORによる更新(図6のステップ218)
も行われない。検索命令文生成実行部23は検索命令文
8を生成する(図6のステップ219)。生成された検
索命令文8(SQL)を図35に示す。
【0068】情報源アクセス部14は、生成された検索
命令文8(図35)をアクセス情報(db−name:
order_data, user−name:tig
er, password:gehogeho)ととも
に情報源管理システムDataSQLに送信し(図6の
ステップ220)、情報源検索結果9を取得する(図6
のステップ221)。取得された検索結果を図36に示
す。
【0069】検索結果処理部25は、情報源アクセス部
14が取得した情報源検索結果9に対し、処理一時記憶
部24を参照し、検索結果構造の再構成を行い(図6の
ステップ222)、ユーザインタフェース部11を介し
て検索結果10を出力する(図6のステップ223)。
最終的な検索結果10を図37に示す。 (e)SQL情報源に対する問い合せ−その2 図38に示す問い合せ7がアプリケーションプログラム
3から発行された場合を例に具体的に説明する。図38
は「(一つでも)5000円より高い商品(item)
を含む注文(order)を検索する」問い合せであ
る。
【0070】図5のステップ201から207までは先
ほどの(d)SQL情報源に対する問い合せ−その1と
ほぼ同じなので、説明を省略する。問い合せ7中の検索
結果構造指定語と検索条件指定語を以下に示す。
【0071】・検索結果構造指定語 order ・検索条件指定語 cost ビューorder−dataに対する検索結果構造指定
語と検索条件指定語を以下に示す。
【0072】・検索結果構造指定語 id,cust−
name,description,cost ・検索条件指定語 cost,id(結合条件),
oid(結合条件) 次に、検索命令文生成計画部22は仮検索命令文の組み
合わせを生成し(図5のステップ208)、図39に示
すように処理一時記憶部24を初期化する(図5のステ
ップ209)。
【0073】図38の問い合せ7は単一の情報源ビュー
に対する問い合せなので、仮検索命令文の数cand=
1であり、検索条件処理を情報源側に行わせられる可能
性がある(図5のステップ210)。また、検索条件指
定語は1語(cust−name)なので、i=1であ
る。次に、情報源側で評価が可能な要素と問い合せが要
求している評価の要素との包含関係を判定する(図6の
ステップ214)。情報源側での評価可能な要素は、
(d)同様、row要素毎、問い合せ7が要求している
評価の要素はorderとなる。以上より、row(=
db/item/row)N個に対しorderは1個
なので(1order(注文)に対し、item(商
品)がN)、処理一時記憶部24を更新する(図6のス
テップ215)。具体的には、図39の5行目push
_down=“OK”をpush_down=“N
G”、evaluate=“No Need”をeva
luate=“Need”とする。更新せずに、検索条
件を情報源に処理させると、AS−tie01が480
0円なので、情報源側で落とされてしまう。また、検索
条件指定語は1語なので、AND/ORによる更新(図
6のステップ218)は行われない。
【0074】検索命令文生成実行部23は検索命令文8
を生成する(図6のステップ219)。生成された検索
命令文8(SQL)を図40に示す。検索条件処理は行
わない。
【0075】検索結果処理部25は、再評価および検索
結果構造の再構成を行い(図6のステップ222)、ユ
ーザインタフェース部11を介して検索結果10を出力
する(図6のステップ223)。最終的な検索結果を図
41に示す。 (f)統合検索 図42に示す問い合せ7がアプリケーションプログラム
3から発行された場合を例に具体的に説明する。図42
は「顧客Yotsukoshiによる注文のうち、赤い
商品の商品名、価格を検索する」問い合せである。
【0076】図5のステップ201から207までは、
(b)XPath情報源に対する問い合せ−その2、
(d)SQL情報源に対する問い合せ−その1とほぼ同
じなので、説明を省略する。
【0077】・検索結果構造指定語 descript
ion,cost ・検索条件指定語 customer,color 次に、検索命令文生成計画部22は仮検索命令文の組み
合わせを生成する(図5のステップ208)。図14に
示す関連メタデータはビューorder_dataの要
素descriptionとビューbrand−lis
tの要素item−nameを等結合することを示して
いる。異種情報源にまたがる結合条件で指定されている
要素を検索結果構造指定語として加えると、それぞれの
ビューに対する検索結果構造指定語と検索条件指定語は
以下のようになり、これが仮検索命令文の組み合せとな
る。
【0078】ビューorder−dataに対する検索
結果構造指定語と検索条件指定語 ・検索結果構造指定語 id,cust−name,d
escription,cost ・検索条件指定語 cust−name ビューbrand−listに対する検索結果構造指定
語と検索条件指定語 ・検索結果構造指定語 item,item−name ・検索条件指定語 color 処理一時記憶部24の初期化も(b)、(d)とほぼ同
じなので説明を省略する。
【0079】このように情報源ビューに対する問い合せ
が複数であり(cand=2)(図5のステップ21
0)、仮検索命令文間にまたがる検索条件指定部分が全
てAND条件で連結され(図5のステップ211)、か
つ等結合の場合(図5のステップ212)なので、その
処理を続けられる。
【0080】これ以降の処理は(b)、(d)とほぼ同
じなので説明を省略する。最終的な検索結果を図43に
示す。
【0081】なお、統合検索装置1は専用のハードウェ
アにより実現されるもの以外に、その機能を実現するた
めのプログラムを、コンピュータ読み取り可能な記録媒
体に記録して、この記録媒体に記録されたプログラムを
コンピュータシステムに読み込ませ、実行するものであ
ってもよい。コンピュータ読み取り可能な記録媒体と
は、フロッピーディスク、光磁気ディスク、CD−RO
M等の記録媒体、コンピュータシステムに内蔵されるハ
ードディスク装置等の記憶装置を指す。さらに、コンピ
ュータ読み取り可能な記録媒体は、インターネットを介
してプログラムを送信する場合のように、短時間の間、
動的にプログラムを保持するもの(伝送媒体もしくは伝
送波)、その場合のサーバとなるコンピュータシステム
内部の揮発性メモリのように、一定時間プログラムを保
持しているものも含む。
【0082】
【発明の効果】以上説明したように、本発明によれば、
XMLメディエータを用いた異種情報源の統合検索にお
いて、入力された問い合せを個々の異種情報源管理シス
テムで受理可能な検索命令文に変換し、検索条件処理を
情報源側で行わせることで、検索実行結果の転送量を軽
減することができ、また、検索実行結果の転送量軽減に
よる問い合せ最適化を利用した、異種情報源の高速な統
合検索を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施形態である独自処理を記述可能
な情報源の統合検索装置の構成を示すブロック図であ
る。
【図2】メタデータ記憶部15が保有するテーブルの詳
細を示す図である。
【図3】全体の概略動作を示すフローチャートである。
【図4】準備フェーズを具体的に示すフローチャートで
ある。
【図5】検索フェーズを具体的に示すフローチャート
(その1)である。
【図6】検索フェーズを具体的に示すフローチャート
(その2)である。
【図7】検索対象となるXML文書群を管理する情報源
管理システムおよび情報源の例を示すイメージ図であ
る。
【図8】データベースitem_informatio
nに格納されているXML文書brand−list.
xmlの内容を示す図である。
【図9】データベースitem_informatio
nに格納されているXML文書brand−list.
xmlの内容を示す図である。
【図10】検索対象となる文字・数値情報を格納してい
る関係データベース管理システムおよび関係データベー
スの例を示すイメージ図である。
【図11】データベースorder_dataに格納さ
れているテーブルorderとitemの内容を示す図
である。
【図12】情報源管理システム名とライブラリ名と該シ
ステムにアクセスするのに必要な情報の種別とを示す情
報源管理システムメタデータの内容を示す図である。
【図13】ビューメタデータの内容を示す図である。
【図14】ビューとビューとの間の関連および関連を結
びつけるための要素に関する情報である関連メタデータ
の内容を示す図である。
【図15】説明(a)において、使用する問い合せを示
す図である。
【図16】説明(a)において、初期化された処理一時
記憶部24を示す図である。
【図17】説明(a)において、生成された検索命令文
(XPath)を示す図である。
【図18】説明(a)において、情報源アクセス部14
が取得した情報源検索結果を示す図である。
【図19】説明(a)において、最終的な検索結果を示
す図である。
【図20】説明(b)において、使用する問い合せを示
す図である。
【図21】説明(b)において、初期化された処理一時
記憶部24を示す図である。
【図22】説明(b)において、生成された検索命令文
(XPath)を示す図である。
【図23】説明(b)において、情報源アクセス部14
が取得した情報源検索結果を示す図である。
【図24】説明(b)において、最終的な検索結果を示
す図である。
【図25】説明(c)において、使用する問い合せを示
す図である。
【図26】説明(c)において、初期化された処理一時
記憶部24を示す図である。
【図27】説明(c)において、更新された処理一時記
憶部24を示す図である。
【図28】説明(c)において、生成された検索命令文
(XPath)を示す図である。
【図29】説明(c)において、情報源アクセス部14
が取得した情報源検索結果を示す図である。
【図30】説明(c)において、最終的な検索結果を示
す図である。
【図31】説明(d)において、使用する問い合せを示
す図である。
【図32】説明(d)において、初期化された処理一時
記憶部24を示す図である。
【図33】図13(c)のビュー生成問い合せによって
生成されるビューの要素および階層構造を規定するDT
Dのグラフィック表現を示す図である。
【図34】図13(c)のビュー生成問い合せによって
生成されるビューのインスタンスのグラフィック表現を
示す図である。
【図35】説明(d)において、生成された検索命令文
(SQL)を示す図である。
【図36】説明(d)において、情報源アクセス部14
が取得した情報源検索結果を示す図である。
【図37】説明(d)において、最終的な検索結果を示
す図である。
【図38】説明(e)において、使用する問い合せを示
す図である。
【図39】説明(e)において、初期化された処理一時
記憶部24を示す図である。
【図40】説明(e)において、生成された検索命令文
(SQL)を示す図である。
【図41】説明(e)において、最終的な検索結果を示
す図である。
【図42】説明(f)において、使用する問い合せを示
す図である。
【図43】説明(f)において、最終的な検索結果を示
す図である。
【符号の説明】
1 統合検索装置 2 通信網 3 アプリケーションプログラム 4 通信網 51,52 情報源管理システム 61a,61b,62a,62b 情報源 7 問い合せ 7a 検索結果構造指定部分 7b 検索条件指定部分 8 検索命令文 9 情報源検索結果 10 検索結果 11 ユーザインタフェース部 12 構文解析部 13 統合検索処理部 14 情報源アクセス部 15 メタデータ記憶部 16 メタデータ管理部 21 ビュー所在探索部 22 検索命令文生成計画部 23 検索命令文生成実行部 24 処理一時記憶部 25 検索結果処理部 100〜103,200〜223 ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小西 一也 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 小林 伸幸 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 PP24 PP26 5B082 GA08 GC04

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 入力された問い合せを、該問い合せが要
    求する情報を情報源側で欠損しない検索命令文へと変換
    するステップと、変換された検索命令文を前記情報源に
    送信し、検索を実行させるステップと、情報源での検索
    実行結果を、問い合せが要求している情報へと統合する
    ステップとを有する、問い合せ最適化を利用した統合検
    索方法。
  2. 【請求項2】 入力された問い合せを、該問い合せが要
    求する情報を前記情報源側で欠損しない検索命令文へと
    変換するステップは、1つあるいは複数の仮検索命令文
    を生成するステップと、該仮検索命令文間にまたがる検
    索条件節の情報源側での実行可否を判定するステップ
    と、前記情報源のスキーマ構造を保持するステップと、
    保持されたスキーマを参照して、前記仮検索命令文中の
    検索条件節の情報源側での実行可否、統合検索装置側で
    の再評価要/不要、限量子の切り替えを判定するステッ
    プと、前記判定に基づいて個々の情報源に受付可能な形
    式の検索命令文を生成するステップと、前記判定を一時
    的に保持するステップとを含む、請求項1に記載の問い
    合せ最適化を利用した統合検索方法。
  3. 【請求項3】 前記仮検索命令文間にまたがる検索条件
    節の情報源側での実行可否を判定するステップは、仮検
    索命令文間にまたがる検索条件節を結合している論理記
    号を判定するステップである、請求項2に記載の問い合
    せ最適化を利用した統合検索方法。
  4. 【請求項4】 前記情報源のスキーマ構造を保持するス
    テップは、異種情報源を半構造化情報という視点でとら
    え、該情報源のスキーマ構造および要素の関係を保持す
    るステップである、請求項2に記載の問い合せ最適化を
    利用した統合検索方法。
  5. 【請求項5】 異種情報源を半構造化情報という視点で
    とらえ、該情報源のスキーマ構造および要素の関係を保
    持するステップは、異種情報源のスキーマ構造そのもの
    を半構造化情報という視点でとらえ、該情報源のスキー
    マ構造および要素の関係を保持するステップと、異種情
    報源に対する問い合せにより生成された検索結果を半構
    造化情報という視点でとらえ、該検索結果のスキーマ構
    造および要素の関係を保持するステップを含む、請求項
    4に記載の問い合せ最適化を利用した統合検索方法。
  6. 【請求項6】 保持されたスキーマを参照して、仮検索
    命令文中の検索条件節の情報源側での実行可否、統合検
    索装置側での再評価要/不要、限量子の切り替えを判定
    するステップは、個々の仮検索命令文の検索条件節につ
    いて、前記情報源側で評価が可能な要素と問い合せが要
    求している検索条件節の要素との包含関係を判定するス
    テップと、前記情報源側で評価が可能な要素と検索条件
    節中で指定されている要素との包含関係を判定するステ
    ップと、検索命令文中の検索条件節を結合している論理
    記号を判定するステップとを含む、請求項2に記載の問
    い合せ最適化を利用した統合検索方法。
  7. 【請求項7】 情報源での検索実行結果を問い合せが要
    求している情報へと統合するステップは、前記一時的に
    保持された検索条件節の統合検索装置側での再評価要・
    不要に関する情報を参照するステップと、個々の情報源
    での検索実行結果のうち、問い合せが要求していない情
    報を再評価により削除し、問い合せが要求している情報
    のスキーマへと構成するステップとを含む、請求項1に
    記載の問い合せ最適化を利用した統合検索方法。
  8. 【請求項8】 入力された問い合せを、該問い合せが要
    求する情報を情報源側で欠損しない検索命令文へと変換
    する手段と、変換された検索命令文を前記情報源に送信
    し、検索を実行させる手段と、前記情報源での検索実行
    結果を、前記問い合せが要求している情報へと統合する
    手段とを有する、問い合せ最適化を利用した統合検索装
    置。
  9. 【請求項9】 入力された問い合せを、該問い合せが要
    求する情報を情報源側で欠損しない検索命令文へと変換
    する手段は、1つあるいは複数の仮検索命令文を生成す
    る手段と、該仮検索命令文間にまたがる検索条件節の前
    記情報源側での実行可否を判定する手段と、前記情報源
    のスキーマ構造を保持する手段と、保持されたスキーマ
    を参照して、前記仮検索命令文中の検索条件節の情報源
    側での実行可否、統合検索装置側での再評価要/不要、
    限量子の切り替えを判定する手段と、前記判定に基づい
    て個々の情報源に受付可能な形式の検索命令文を生成す
    る手段と、前記の判定を一時的に保持する手段を含む、
    請求項8に記載の、問い合せ最適化を利用した統合検索
    装置。
  10. 【請求項10】 前記仮検索命令文間にまたがる検索条
    件節の情報源側での実行可否を判定する手段は、前記仮
    検索命令文間にまたがる検索条件節を結合している論理
    記号を判定する手段である、請求項9に記載の問い合せ
    最適化を利用した統合検索装置。
  11. 【請求項11】 前記情報源のスキーマ構造を保持する
    手段は、異種情報源を半構造化情報という視点でとら
    え、該情報源のスキーマ構造および要素の関係を保持す
    る手段である、請求項9に記載の問い合せ最適化を利用
    した統合検索装置。
  12. 【請求項12】 異種情報源を半構造化情報という視点
    でとらえ、該情報源のスキーマ構造および要素の関係を
    保持する手段は、異種情報源のスキーマ構造そのものを
    半構造化情報という視点でとらえ、該情報源のスキーマ
    構造および要素の関係を保持する手段と、異種情報源に
    対する問い合せにより生成された検索結果を半構造化情
    報という視点でとらえ、該検索結果のスキーマ構造およ
    び要素の関係を保持する手段を含む、請求項11に記載
    の問い合せ最適化を利用した統合検索装置。
  13. 【請求項13】 保持されたスキーマを参照して、仮検
    索命令文中の検索条件節の情報源側での実行可否、統合
    検索装置側での再評価要/不要、限量子の切り替えを判
    定する手段は、個々の仮検索命令文の検索条件節につい
    て、前記情報源側で評価が可能な要素と問い合せが要求
    している検索条件節の要素との包含関係を判定する手段
    と、前記情報源側で評価が可能な要素と検索条件節中で
    指定されている要素との包含関係を判定する手段と、検
    索命令文中の検索条件節を結合している論理記号を判定
    する手段とを含む、請求項9に記載の問い合せ最適化を
    利用した統合検索装置。
  14. 【請求項14】 情報源での検索実行結果を問い合せが
    要求している情報へと統合する手段は、前記の一時的に
    保持された検索条件節の統合検索装置側での再評価要/
    不要に関する情報を参照する手段と、個々の情報源での
    検索実行結果のうち、問い合せが要求していない情報を
    再評価により削除し、問い合せが要求している情報のス
    キーマへと構成する手段とを含む、請求項8に記載の問
    い合せ最適化を利用した統合検索装置。
  15. 【請求項15】 請求項1から7のいずれか1項に記載
    の統合検索方法をコンピュータに実行させるための統合
    検索プログラム。
  16. 【請求項16】 請求項1から7のいずれか1項に記載
    の統合検索方法をコンピュータに実行させるための統合
    検索プログラムを記録した記録媒体。
JP2002130563A 2002-05-02 2002-05-02 問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体 Pending JP2003323443A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002130563A JP2003323443A (ja) 2002-05-02 2002-05-02 問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002130563A JP2003323443A (ja) 2002-05-02 2002-05-02 問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体

Publications (1)

Publication Number Publication Date
JP2003323443A true JP2003323443A (ja) 2003-11-14

Family

ID=29543567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002130563A Pending JP2003323443A (ja) 2002-05-02 2002-05-02 問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体

Country Status (1)

Country Link
JP (1) JP2003323443A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8555262B2 (en) 2005-06-29 2013-10-08 Visa U.S.A. Inc. Schema-based dynamic parse/build engine for parsing multi-format messages
JP2017027325A (ja) * 2015-07-22 2017-02-02 株式会社東芝 データベースシステムおよびデータベースシステム用プログラム
JP2017091084A (ja) * 2015-11-06 2017-05-25 三菱電機株式会社 検索制御装置および検索制御方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8555262B2 (en) 2005-06-29 2013-10-08 Visa U.S.A. Inc. Schema-based dynamic parse/build engine for parsing multi-format messages
US9215196B2 (en) 2005-06-29 2015-12-15 Visa U.S.A., Inc. Schema-based dynamic parse/build engine for parsing multi-format messages
US9756001B2 (en) 2005-06-29 2017-09-05 Visa U.S.A. Schema-based dynamic parse/build engine for parsing multi-format messages
JP2017027325A (ja) * 2015-07-22 2017-02-02 株式会社東芝 データベースシステムおよびデータベースシステム用プログラム
JP2017091084A (ja) * 2015-11-06 2017-05-25 三菱電機株式会社 検索制御装置および検索制御方法

Similar Documents

Publication Publication Date Title
US6934712B2 (en) Tagging XML query results over relational DBMSs
Bikakis et al. The XML and semantic web worlds: technologies, interoperability and integration: a survey of the state of the art
KR100815563B1 (ko) Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
US7844633B2 (en) System and method for storage, management and automatic indexing of structured documents
US20050289138A1 (en) Aggregate indexing of structured and unstructured marked-up content
Frischmuth et al. Ontowiki–an authoring, publication and visualization interface for the data web
US8983931B2 (en) Index-based evaluation of path-based queries
US20060101320A1 (en) System and method for the storage, indexing and retrieval of XML documents using relational databases
JPH06290102A (ja) 情報にアクセスする装置および方法
JP2001147933A (ja) 構造化文書検索方法、構造化文書検索装置及び構造化文書検索システム
US9063957B2 (en) Query systems
Abramowicz et al. Filtering the Web to feed data warehouses
US20090307187A1 (en) Tree automata based methods for obtaining answers to queries of semi-structured data stored in a database environment
Ribeiro et al. Transparent Interoperability Middleware between Data and Service Cloud Layers.
JP3671765B2 (ja) 異種情報源問い合わせ変換方法及び装置及び異種情報源問い合わせ変換プログラムを格納した記憶媒体
JP2003323443A (ja) 問い合せ最適化を利用した統合検索方法、統合検索装置、プログラム、および記録媒体
Mami Strategies for a Semantified Uniform Access to Large and Heterogeneous Data Sources
Noh et al. A comparison of two approaches to utilizing XML in parametric databases for temporal data
Li et al. Representing UML snowflake diagram from integrating XML data using XML schema
Tseng et al. An automatic load/extract scheme for XML documents through object-relational repositories
US20070299837A1 (en) Data Processing Method and System Based on Networked Relational Dimension
Lo et al. Flexible user interface for converting relational data into XML
Tamiar et al. Structured Web pages management for efficient data retrieval
Nottelmann et al. Combining DAML+ OIL, XSLT and probabilistic logics for uncertain schema mappings in MIND
US20240119071A1 (en) Relationship-based display of computer-implemented documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040326

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040326

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040326

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070912

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080206