JP2001067369A - 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体 - Google Patents

情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体

Info

Publication number
JP2001067369A
JP2001067369A JP24093499A JP24093499A JP2001067369A JP 2001067369 A JP2001067369 A JP 2001067369A JP 24093499 A JP24093499 A JP 24093499A JP 24093499 A JP24093499 A JP 24093499A JP 2001067369 A JP2001067369 A JP 2001067369A
Authority
JP
Japan
Prior art keywords
index
search
value
information
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24093499A
Other languages
English (en)
Inventor
Misa Namiuchi
みさ 波内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP24093499A priority Critical patent/JP2001067369A/ja
Publication of JP2001067369A publication Critical patent/JP2001067369A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】実データを保持する情報源とは独立にデータ/
アプリケーション特性に応じた最適なインデックス手法
により情報検索を可能にする。 【解決手段】出力式評価手段712は入力された問合せの
出力式中のすべての属性にインデックスが生成されてい
るかどうかを調べ、すべての属性にインデックスが生成
されている場合には、インデックス値記憶部32を検索
し、管理されているインデックス値を取得することによ
って、外部情報源91にアクセスすることなく、問合せ結
果を生成する。また一部の属性にインデックス未生成の
とき、予め外部情報源91にアクセスすると共に所定のイ
ンデックス生成を行い、登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報検索システム、
情報検索方法および情報検索用プログラムを記録した記
録媒体に関し、特に大規模情報源から高速に目的の情報
を抽出できる情報検索システム、情報検索方法および情
報検索用プログラム製品、並びにこれを担持する媒体
(特に記録媒体)に関する。
【0002】
【従来の技術】従来、情報検索手段は、データベース管
理システム、データウェアハウス、データマートなどの
情報源において、そこに格納されたデータを検索し、要
求された値、データあるいはその集合を返却するために
用いられている。
【0003】ある情報源に対する検索要求である問合せ
は、一般に、検索条件式と、検索結果として何を返却す
るかを指定する出力式を含む。情報源の一つであるデー
タベースに対する問合せには、SQL(Structured Query
Language)言語が一般に用いられているが、SQLでは例
えば、以下のような式により、検索条件式と出力式を含
む問合せを記述する。 SELECT <出力式> FROM <検索対象リスト> WHERE <検索条件式> 図1(A)は、問合せを解釈し、検索結果を返却する従来の
情報検索システムの構成を示すブロック図である。
【0004】図1(A)を参照すると、従来システムは、キ
ーボードなどの入力装置1と、プログラム制御により動
作するデータ処理装置2と、情報を記憶する記憶装置3
と、ディスプレイ装置や印刷装置などの出力装置4とを
含む。
【0005】記憶装置3は、インデックス記憶部31と実
データ記憶部30とを備えている。
【0006】実データ記憶部30は、そのシステムが定め
たデータ構造で情報を保持している。
【0007】インデックス記憶部31は、実データから抽
出した任意の属性値あるいはその組合せと、実データを
一意に識別するためのIDとのペアであるインデックス
(索引)を保持している。このIDを以下、データID(誤
解を生じないであろう場合には単に"ID")と呼ぶ。デー
タIDは、一意な値、あるいは、複数の値の組合せによっ
てシステム中での一意性を確保する。インデックスは、
B-木(B-tree)やハッシュ(hashing)などの構造によ
って管理することが一般的である。
【0008】データ処理装置2は、検索手段21とインデ
ックス生成手段22を備える。
【0009】検索手段21は、検索式評価手段211、出力
式評価手段212、インデックス検索手段213、実データ検
索手段214とを備える。
【0010】検索式評価手段211は、入力装置1から与え
られた問合せ文字列を解析し、インデックス検索手段21
3あるいは実データ検索手段214を利用して条件を満足す
るデータIDの集合を取得する。問合せの条件式中にイン
デックスが生成されている属性が記述されている場合に
は、インデックス検索手段213を利用し、そうでない場
合には、実データ検索手段214を利用して検索する。
【0011】出力式評価手段212は、検索式評価手段211
の検索結果であるデータIDの集合について、出力式に指
定されている形式の検索結果を作成し、出力装置4に出
力する。検索結果作成にあたり、実データ検索手段214
により、出力式に指定されている属性値を取得する。
【0012】インデックス検索手段213は、インデック
ス記憶部31を検索し、条件を満足する属性値を持つ実デ
ータのIDを取得し、返却する。
【0013】実データ検索手段214は、実データ記憶部3
0を検索し、条件を満足する実データのIDを検索する。
また、与えられたデータIDに対応する実データあるいは
指定された属性値を、実データ記憶部30から取得する。
【0014】インデックス生成手段22は、検索に先立
ち、実データ記憶部30から実データを読み出し、指定さ
れた属性あるいはその組合せに対してインデックスを生
成して、それをインデックス記憶部31に格納する。
【0015】近年、このような情報検索システムを利用
して大量データを検索・分析するOLAP (OnLine Analyti
cal Processing) やデータマイニングなどのアプリケー
ションが増加している。この種のアプリケーションで
は、段階的に変化させた条件による複数の問合せを実行
してデータを分類したり、データの持つ属性に計算を施
し、得られた値を利用して全体データの特徴を分析する
などの処理を行う。
【0016】特に、データマイニングのように、様々な
計算を伴う多様なマイニング手法が提案され、それが改
良され続けている分野では、それぞれの手法に必要な計
算手法を高速に計算するための支援が必要である。ま
た、そこで扱われるデータの特性に応じた高速なデータ
取り出し手法(インデックス)がサポートされることが
望ましい。
【0017】また、画像や音声などのマルチメディア・
データを扱うアプリケーションでは、それぞれのメディ
ア特有のインデックス手法や、多次元データに対する多
次元インデックス手法などを柔軟に取り込み、利用でき
るようにすることが望ましい。
【0018】さらに、近年の計算機技術の進歩により、
種々の情報源で管理可能なデータ量が激増し、数ギガバ
イトから数テラバイトのサイズを有するものもある。し
たがって、このような大量データを扱うアプリケーショ
ンでは、その検索処理においてインデックスを最大限に
利用し、可能な限り実データにアクセスする回数を減ら
すことが望ましい。
【0019】複数の情報源に対して検索を行う場合に
は、それぞれの情報源に対応した情報検索システムに対
してそれぞれ問合せを発行し、その結果を統合する上位
アプリケーションが利用される。この上位アプリケーシ
ョンを以下、統合型情報検索システムとよぶ。
【0020】図1(B)に示すように、従来のこの種の統
合型情報検索システム5は、検索仲介手段51を有する。
検索仲介手段51では、入力装置1から入力された問合せ
を、情報検索システム61〜63(情報検索システムの数は
任意)に送る。このとき、それぞれの情報検索システム
のデータ管理形式や問合せ方式が異なることが一般的で
あるため、検索仲介手段51では、それぞれの情報検索シ
ステムが解釈実行可能な形式に問合せを変換する機能を
持つ。
【0021】情報検索システム61〜63の検索結果は、検
索仲介手段51に返却される。検索仲介手段51は、この結
果を統合し、必要な場合にはデータ形式の変換を行っ
て、結果を出力装置4に出力する。
【0022】
【発明が解決しようとする課題】従来の情報検索システ
ムの第1の問題点は、データの特性やアプリケーション
特性に応じた多様なインデックス手法を柔軟に適用する
ことができないということである。その理由は、一つの
情報検索システムでは、汎用インデックス機能と実デー
タ管理機能が同時に提供されていて、それを自由に変更
できないためである。
【0023】第2の問題点は、問合せの出力式に含まれ
る属性すべてにインデックスが生成されている場合に
も、問合せ結果を作成するために、検索条件を満足する
すべての実データをメモリ中にロードするということで
ある。これにより、検索結果が大量の場合には、問合せ
出力を生成するために大きな処理コストが必要となる。
その理由は、従来の情報検索システムでは、問合せ出力
を生成するためにインデックスを利用する手段を持たな
いためである。
【0024】第3の問題点は、属性値を加工した値によ
って高速に実データを検索する手段を持たないというこ
とである。その理由は、従来のインデックスが、属性値
とその組合せのみを管理するものであり、属性値を加工
した値に対してインデックスを生成する手段を持たない
ためである。
【0025】第4の問題点は、統合型情報検索システム
は実装が困難であるということである。その理由は、与
えられた問合せを、任意の情報検索システムの持つデー
タモデル、データ構造、検索インタフェースに応じた形
式に変換し、返却されたデータを統合して出力する処理
を共通化、自動化することが難しいからである。
【0026】本発明の一課題(1)は、データやアプリ
ケーションのそれぞれの特性に最適の多様なインデック
ス手法を柔軟に適用することができる情報検索システム
を提供することである。
【0027】本発明の他の一課題(2)は、検索条件を
満足する全ての実データをメモリ中にロードする必要の
ない情報検索システムを提供すること、特に問合せ出力
を生成するためにインデックスを利用できる情報検索シ
ステムを提供することにある。
【0028】本発明のさらに他の一課題(3)は、多様
な属性に対応する多数のインデックスを含む情報を、さ
らに効率的に検索できるようにすること、特に属性値を
加工した値に対するインデックスを生成してそれを利用
できる情報検索システムを提供することにある。
【0029】本発明のさらに他の一課題(4)は、デー
タ構造に、プログラムによって自動的に変換可能程度の
差異がある複数の外部情報源のデータに対し、より統合
性の高い統合型情報検索システムを提供すること、特に
同じ検索式を使って、検索処理を実行できる情報検索シ
ステムを提供することにある。
【0030】
【課題を解決するための手段】本発明の第1の視点にお
いて、情報検索システムは、属性値を指定された方法で
加工する式計算手段と、前記式計算手段により生成され
た値に対してインデックスを生成するインデックス生成
手段と、前記インデックス生成手段により生成されたイ
ンデックスを使ってインデックス検索を行うインデック
ス検索手段と、前記インデックス検索手段を使って問合
せの指定する条件検索を実施する検索式評価手段と、を
備えたことを特徴とする。
【0031】本発明の第2の視点において、情報検索シ
ステムは、複数の情報源中の属性値を予め定めた統一形
式に変換するデータ変換手段と、前記データ変換手段に
より変換された値に対してインデックスを生成するイン
デックス生成手段と、前記インデックス生成手段により
生成されたインデックスを使ってインデックス検索を行
うインデックス検索手段と、前記インデックス検索手段
を使って問合せの指定する条件検索を実施する検索式評
価手段と、を備えたことを特徴とする。
【0032】本発明の第3の視点において、情報検索シ
ステムは、複数の情報源中の属性値を予め定めた統一形
式に変換するデータ変換手段と、前記データ変換手段に
より変換された値を指定された方法で加工する式計算手
段と、前記式計算手段により加工された値に対してイン
デックスを生成するインデックス生成手段と、前記イン
デックス生成手段により生成されたインデックスを使っ
てインデックス検索を行うインデックス検索手段と、前
記インデックス検索手段を使って問合せの指定する条件
検索を実施する検索式評価手段と、を備えたことを特徴
とする。
【0033】本発明の第4の視点において、情報検索シ
ステムは、情報源中でデータを一意に識別するIDとイン
デックスが生成されているすべての属性の値を管理する
インデックス値記憶手段と、属性値を前記インデックス
値記憶手段から検索するインデックス値検索手段と、前
記インデックス値検索手段により問合せ出力式に従った
問合せ結果を生成する出力式評価手段と、を備えたこと
を特徴とする。
【0034】本発明の第5の視点において、情報検索シ
ステムは、属性値を指定された方法で加工する式計算手
段と、前記式計算手段により生成された値と元の属性を
持つデータのIDとの組からなるインデックス値情報を生
成するインデックスインデックス生成手段と、前記イン
デックス生成手段により生成されたインデックス値情報
から前記式計算手段により加工された値を取得するイン
デックス値検索手段と、前記インデックス値検索手段を
使って問合せの出力式に従った問合せ結果を生成する出
力式評価手段と、を備えたことを特徴とする。
【0035】本発明の第6の視点において、情報検索シ
ステムは、複数の情報源中の属性値を予め定めた統一形
式に変換するデータ変換手段と、前記データ変換手段に
より変換された値と元の属性を持つデータのIDとの組か
らなるインデックス値情報をインデックス生成手段と、
前記インデックス生成手段により生成されたインデック
ス値情報から前記データ変換手段により変換された値を
取得するインデックス値検索手段と、前記インデックス
値検索手段を使って問合せの出力式に従った問合せ結果
を生成する出力式評価手段と、を備えたことを特徴とす
る。
【0036】本発明の第7の視点において、情報検索シ
ステムは、複数の情報源中の属性値を予め定めた統一形
式に変換するデータ変換手段と、前記データ変換手段に
より変換された値を指定された方法で加工する式計算手
段と、前記式計算手段により加工された値と元の属性を
持つデータのIDの組からなるインデックス値情報を生成
するインデックス生成手段と、前記インデックス生成手
段により生成されたインデックス値情報から前記データ
変換手段および式計算手段により変換・加工された値を
取得するインデックス値検索手段と、前記インデックス
値検索手段を使って問合せの出力式に従った問合せ結果
を生成する出力式評価手段と、を備えたことを特徴とす
る。
【0037】本発明の第8の視点において、本発明は、
夫々、第1〜第7の各視点に対応する情報検索方法を提
供する。その各特徴は、請求項10〜16の各項に記載
のとおりであり、長文化を避けるため、ここに各項への
引照をもって各記載を本欄に繰込むものとし、重複記載
を省略する。
【0038】本発明の第9の視点において、本発明は、
請求項10〜16に対応する情報検索方法を実施するた
めの、コンピュータ読取り可能なプログラム製品を提供
する。その各特徴は、請求項17〜19及び請求項21
〜24、並びに請求項20、25、26に記載のとおり
であり、ここに各項への引照をもって各記載を本欄に繰
込むものとする。
【0039】なお、該プログラム製品は、典型的には記
録媒体に記録されたプログラム製品として具現化される
が、本発明の開示は、これに止まらず、当該プログラム
はあらゆる形態の記憶装置一般(メモリ装置を含む)及
び搬送波キャリアを媒体としても担持される。
【0040】
【発明の実施の形態】本発明の第1の情報検索システム
形態は、実データを管理する情報源とは独立に、問合せ
処理機能とインデックス管理機能を持ち、問合せの検索
条件式と出力式に既にインデックスが作成されている属
性が指定された場合、インデックス値のみによって問合
せ結果を生成する。より具体的には、検索式評価手段
(図2の711)、出力式評価手段(図2の712)、インデッ
クス検索手段(図2の213)とインデックス値取得手段
(図2の713)とを備え、問合せ中に含まれるすべての属
性にインデックスが生成されている場合には、外部情報
源(図2の91)にアクセスすることなく、インデックス
値記憶部(図2の32)に管理されているインデックス値
を利用して、問合せ結果を生成するよう動作する。
【0041】また、本発明の第2の情報検索システム形
態は、問合せ中の属性だけでなく、属性を含む式(加工
式)に対するインデックスを管理し、その値を利用して
問合せ結果を生成する。より具体的には、属性の値を計
算する式計算手段(図5の75)とインデックス情報記憶
部(図5の33)とを備え、問合せ中にインデックスが生
成されている式が含まれるかどうかの情報をインデック
ス情報記憶部に調べ、含まれている場合には、インデッ
クス値記憶部(図5の32)に管理されているインデック
ス値を利用して、問合せ結果を生成するよう動作する。
【0042】さらに、本発明の第3の情報検索システム
形態は、複数の外部情報源のデータ形式を統一し、同一
インデックスによって管理する。より具体的には、デー
タ変換手段(図8の76)を備え、複数の外部情報源中の
異なるデータ形式による同じ種類のデータに対し、その
データ形式を一つに統一し、統一した値に対してインデ
ックスを生成することによって、複数の外部情報源に対
して一つの問合せを実行するよう動作する。
【0043】次に、本発明の各実施の形態について図面
を参照してさらに詳細に説明する。
【0044】[実施形態1]図2を参照すると、本発明
の第1の実施の形態は、キーボードなどの入力装置1
と、プログラム制御により動作するデータ処理装置7
と、情報を記憶する記憶装置8と、ディスプレイ装置や
印刷装置などの出力装置4とから構成されている。
【0045】記憶装置8は、インデックス記憶部31とイ
ンデックス値記憶部32とを備えている。インデックス記
憶部31は、実データから抽出した任意の属性値あるいは
その組合せと、実データを一意に識別できるデータIDと
のペアであるインデックスを保持している。
【0046】インデックス値記憶部32は、インデックス
記憶部31にインデックスが生成されている属性の値(以
下、これをインデックス値とよぶ)と、実データに一意
に付加されているIDを保持している。複数の属性に対し
て別々のインデックスが生成されている場合には、それ
ぞれに対応するすべてのインデックス値をIDに対応させ
て保持する。
【0047】データ処理装置7は、検索手段71、外部情
報源検索手段73、インデックス生成手段74とを含む。検
索手段71は、検索式評価手段711、出力式評価手段712、
インデックス検索手段213、インデックス値取得手段713
を含む。
【0048】検索式評価手段711は、入力装置1から与え
られた問合せ文字列を解析し、インデックス検索手段21
3あるいは外部情報源検索手段73によって条件を満足す
るデータを検索する。
【0049】出力式評価手段712は、検索式評価手段711
の検索結果であるデータIDの集合について、インデック
ス取得手段713あるいは外部情報源検索手段73によって
問合せ出力を生成し、出力装置4に送出する。
【0050】インデックス検索手段213は、インデック
ス記憶部31を検索して、条件式を満足する属性値を持つ
データのIDを取得する。
【0051】インデックス値取得手段713は、与えられ
たID(集合)に対応するデータの指定された属性値をイ
ンデックス値記憶部32から取り出し、返却する。
【0052】外部情報源91は、データベースなどの情報
源であり、それ自身がデータ検索手段を提供するものと
する。
【0053】外部情報源検索手段73は、与えられた問合
せの処理を、実データを保持する外部情報源91に委譲す
る。また、与えられたデータIDに対応するデータの指定
された属性値を、外部情報源から取得する。
【0054】インデックス生成手段74は、検索に先立
ち、外部情報源検索手段73を使って実データを読み出
し、指定された属性あるいはその組合せに対してインデ
ックスを生成して、それをインデックス記憶部31に格納
する。同時に、インデックス値記憶部32にそのインデッ
クス値を登録する。あるデータに対して初めてインデッ
クスが生成されたときには、データIDとインデックス値
のペアがインデックス値記憶部32に登録され、それ以降
は最初に生成されたデータIDとインデックス値のペアに
インデックス値を追加していく。
【0055】次に、図2および図3のフローチャートを
参照して本実施の形態の全体の動作について詳細に説明
する。
【0056】まず、インデックス生成処理について、図
2および図3(B)を用いて説明する。
【0057】最初に、外部情報源検索手段73により外部
情報源91から所定のデータを読み出す(図3(B)の32
0)。次に、インデックス生成手段74においてインデッ
クスが生成され(321)、インデックス記憶部31、イン
デックス値記憶部32に登録される(322)。この「所定
データ」の読み出し自体は、公知の仕方で夫々の求める
属性と関連する外部情報源に適した夫々の検索分野、対
象キーワード等の指定等に基づいて行うことができる。
【0058】次に、検索処理について、図2および図3
(A)を用いて説明する。
【0059】まず、入力装置1から入力された問合せを
検索式評価手段711により解析する(図3(A)の301)。
そして、インデックス記憶部31を検索して、その問合せ
の検索条件式中に含まれるすべての属性に事前にインデ
ックスが生成されているかどうかを判定する(302)。
もしすべての属性にインデックスが生成されていたとす
ると、インデックス検索手段213がインデックス記憶部3
1を検索してインデックス値を取得し、検索条件式を評
価する(303)。インデックス未生成の属性が含まれる
場合には、外部情報源検索手段73により、問合せ全体の
処理を外部情報源91に委譲し(304)、得られた結果を
そのまま出力装置4から出力する(310)。
【0060】検索式中のすべての属性にインデックスが
生成されている場合、次に、検索結果を出力する処理を
行う。まず、出力式評価手段712が問合せ中の出力式に
属性が含まれているかどうかを判定する(305)。含ま
れていない場合には、出力式評価手段712が出力式を評
価し(306)、結果を出力する(310)。
【0061】出力式に属性が含まれている場合には、そ
れらの属性すべてにインデックスが生成されているかど
うかを判定する(307)。すべての属性にインデックス
が生成されている場合、インデックス値取得手段713に
よりインデックス値記憶部32を検索し、出力式が指定す
る属性値を取り出す(308)。インデックス未生成の属
性が含まれる場合には、外部情報源検索手段73により、
外部情報源91から属性値を取り出す(309)。このと
き、外部情報源91から取り出すデータは、検索条件式に
対するインデックス検索(303)の結果、抽出されたデ
ータのみを対象とする。最後に、出力式に沿って処理結
果を生成し、出力する(310)。
【0062】次に、本実施の形態の効果について説明す
る。
【0063】本実施の形態では、インデックス記憶部31
とインデックス検索手段213を外部情報源91の実データ
と分離して実装するというように構成されているため、
実データを管理する情報源とは独立して様々なインデッ
クス手法を適用することができる。
【0064】また、本実施の形態では、さらに、問合せ
の出力式に沿って検索結果を生成する場合に、出力式に
含まれる属性すべてにインデックスが生成されていると
きには、インデックス値記憶部32に格納された値を利用
するというように構成されているため、出力を生成する
ために実データを外部情報源91からロードする必要がな
く、ロードにかかる時間を節約することができる。
【0065】[実施例1]次に、具体的な実施例を用い
て本実施形態1の動作を説明する。
【0066】図4に示すように、外部情報源401中の従
業員情報(実データ)を記録した従業員テーブル402に
対して、事前にインデックス生成手段74により、インデ
ックス記憶部403に、各種属性(ここでは、名前、生年
月日(及び/又は年令)、役職等)に分類したインデッ
クステーブルとしてインデックスが生成されている。即
ち、属性「名前」に対する名前インデックス404、属性
「生年月日」に対する生年月日インデックス405、属性
「役職」に対する役職インデックス406、属性「所属」
に対する所属インデックス407が生成されているとす
る。
【0067】インデックス値記憶部408には、これらす
べてのインデックスデータIDと値との対応関係を管理す
るインデックス値テーブル409を格納する。インデック
ス値テーブル409中の一行は、一つのデータのIDと、そ
のデータのうちインデックスが生成されている属性すべ
ての値を保持している。インデックス値テーブル409で
持つインデックス値は、インデックス記憶部403に格納
された各インデックス中のインデックス値へのポインタ
でも、それをコピーした値そのものでも、どちらを利用
してもよい。コピーしたインデックス値が占めるメモリ
領域がマシン環境を圧迫しない限りにおいては、コピー
値を保持した方が性能が上がる。
【0068】ここに、問合せ「従業員の中で、総務部の
課長の名前を検索せよ」が入力された場合を考える。こ
れは、SQLでは問合せ1のように表現される。ここで、E
は従業員テーブル402を表現するものとする。
SELECT E.名前 FROM E WHERE E.所属 = '総務' AND E.役職 = '課長'; [問合せ1]
【0069】まず、検索式評価手段711により、インデ
ックス記憶部403が検索され、検索条件式(問合せ1のWH
ERE以下)中の属性「所属」および「役職」にインデッ
クスが生成されていることが確認される。条件式中に他
にインデックスが生成されていない属性は存在しないの
で、インデックス検索手段213によりインデックス記憶
部403の対応するインデックスからインデックス値を取
得し、条件判定を実施する。そして、結果として検索条
件を満足するデータID集合が得られる。
【0070】次に、出力式評価手段712において、検索
結果を生成するために出力式「E.名前」を評価する。こ
の中に含まれる属性「名前」にはインデックスが生成さ
れており、この他にインデックスが生成されていない属
性は含まれていないので、インデックス値取得手段713
により、インデックス値記憶部408から、結果のID集合
の要素それぞれに対応する「名前」の値を取り出す。そ
して、それらを出力装置4に返却する。
【0071】次の問合せ2の場合は、問合せ1と出力式が
異なり、出力式に属性を含まない。このため、検索式の
評価は問合せ1と同様の処理を行うが、出力式の評価
は、検索式の評価結果を基に、外部情報源401にはアク
セスせず、自システム(出力式評価手段712)内で評価
を完了することができる(図3(A)の306)。 SELECT COUNT(*) AS N FROM E WHERE E.所属 = '総務' AND E.役職 = '課長'; [問合せ2]
【0072】以上の処理においては、問合せ全体を評価
するために外部情報源401にアクセスせず、すべて自シ
ステム内で評価を完了することができるため、外部情報
源401からの実データのロード時間を省略することがで
きる。
【0073】一方、以下の問合せ3の場合には、検索条
件式にインデックスが生成されていない属性「職級」を
含むため、検索評価手段711は、外部情報源検索手段73
を使って外部情報源401に処理を委譲する(図3(A)の30
4)。そして外部情報源401から返却された検索結果を、
出力装置4に返却する(310)。 SELECT E.名前 FROM E WHERE E.役職 = '課長' AND E.職級 <> 'A7'; [問合せ3]
【0074】ここで、他のインデックス手法、例えば、
従業員の顔写真データ(属性「顔」)に対し、類似画像
検索用インデックスを導入する場合を考える。この場合
は、類似画像検索用インデックス生成手段をインデック
ス生成手段74として組み込み、類似画像検索用インデッ
クス検索手段をインデックス検索手段213およびインデ
ックス値取得手段713に組み込み、インデックス記憶部4
03およびインデックス値記憶部408に類似画像検索用イ
ンデックスの値(情報)を格納すれば良く、外部情報源
401に影響を与えることはない。
【0075】[実施形態2]次に、本発明の第2の実施
の形態について図面を参照して詳細に説明する。
【0076】図5を参照すると、本発明の第2の実施の
形態は、記憶装置13の構成が、図2に示された第1の実
施の形態における記憶装置8の構成に加え、インデック
ス情報記憶部33を有する点で異なる。また、データ処理
装置10の構成が、図2に示された第1の実施の形態にお
ける記憶装置7の構成に加え、式計算手段75を有する点
で異なる。
【0077】インデックス情報記憶部33は、インデック
スとして登録されている属性とインデックス記憶部31の
インデックス集合の対応を管理する。属性を加工した値
に対してインデックスを生成する場合には、その加工式
とインデックスとの対応を管理する。
【0078】式計算手段75は、属性を加工した値に対し
てインデックスを生成する場合に、属性値を加工(計
算)してインデックス値を生成する処理を行う。属性値
の加工方法は、予めユーザによって指定されているとす
る。
【0079】図5および図6、図7のフローチャートを
参照して本実施の形態の全体の動作について詳細に説明
する。
【0080】まず、インデックス生成処理について、図
5および図7を用いて説明する。最初に、生成するイン
デックス情報をインデックス情報記憶部33に登録する
(図7の620)。このインデックス情報には、インデッ
クス生成対象データのテーブル名、属性名の他、属性の
加工値をインデックス登録する場合には、その加工式の
情報を含む。次に、外部情報源検索手段73により外部情
報源91からデータを読み出す(320)。そして、属性を
加工(計算)した値をインデックス化するよう指定され
ている場合には(621)、式計算手段74によってインデ
ックス値を計算する(622)。指定されてない場合に
は、式計算手段74では何もしない。最後に、インデック
ス生成手段74において、指定された方法でインデックス
を生成し(321)、インデックス記憶部31、インデック
ス値記憶部32に登録する(322)。
【0081】次に、検索処理について説明する。
【0082】まず、検索式評価手段711が入力装置1より
入力された問合せを解析し(図6の301)し、インデッ
クス情報記憶部33を検索して検索条件式にインデックス
が生成されていない式あるいは属性が含まれるどうかを
調べる(601)。インデックスが生成されていない式あ
るいは属性が含まれる場合(YES)には、外部情報源
検索手段73により、外部情報源91に検索処理を委譲する
(304)。
【0083】検索条件式中の式にインデックスが生成さ
れている場合には、インデックス記憶部31を検索し、イ
ンデックス値を取得する(603)。次に、インデックス
値が取得されていないすべての属性について、インデッ
クス検索手段213がインデックス記憶部31を検索してイ
ンデックス値を取得し、検索条件式を評価し、条件を満
足するデータIDを得る(303)。
【0084】次に、検索結果を出力する処理を行う。ま
ず、出力式評価手段712が問合せ中の出力式に属性が含
まれているかどうかを判定する(305)。含まれていな
い場合には、出力式評価手段712により出力式を評価
し、結果を生成する(306)。
【0085】出力式に属性が含まれている場合には、す
べての属性あるいは式にインデックスが生成されている
かどうかを、インデックス情報記憶部33を検索して判定
する(604)。インデックスが生成されていない式ある
いは属性が含まれる場合には、外部情報源検索手段73に
より、検索条件を満足したデータ集合に対してのみ、外
部情報源91から属性値を取り出し(309)、出力式を生
成する(310)インデックスが生成されている場合に
は、インデックス値取得手段713によりインデックス値
記憶部32を検索し、出力式が指定する式の値を取り出
す。式に対してインデックスが生成されている場合には
(605)、式のインデックス値を取得し(606)、残りの
属性値を取り出す(308)。最後に、出力式に沿って処
理結果を生成し、出力する(310)。
【0086】次に、本実施の形態の効果について説明す
る。
【0087】本実施の形態では、インデックス情報記憶
部33によって属性を含む式に生成されたインデックスが
管理されるように構成されているため、属性を含む式の
値を計算することなく、条件判定、値の取り出し、およ
び、検索結果生成を行うことができる。
【0088】[実施例2]次に、具体的な実施例2を用
いて本実施の形態の動作を説明する。
【0089】図8に示すように、インデックス記憶部70
2には、式「age(生年月日)」について式計算手段75によ
って予め値が計算された年齢インデックス705が生成さ
れているものとする。ここで"age()"は、年齢を計算す
るための関数とする。このとき、インデックス情報記憶
部701でには、属性に対するインデックス情報だけでな
く、この式に対応するインデックス情報が同時に管理さ
れている。本実施例では、インデックス情報テーブル70
4に、年齢インデックスの情報が格納されている。
【0090】ここで、問合せ「従業員の中で、50歳以上
の課長の名前を検索せよ」が入力された場合を考える。
これは、SQLでは問合せ4のように表現される。 SELECT E.名前 FROM E WHERE E.役職 = '課長' AND age(E.生年月日) > 50; [問合せ4]
【0091】このとき検索式評価手段711は、インデッ
クス情報記憶部701のインデックス情報テーブル704を検
索し、式「age(E.生年月日)」にインデックスが生成さ
れていると知る(602)。これにより、インデックス検
索手段213が「age(E.生年月日)」に対応するインデック
スを検索し(603)、検索条件式を評価する。このと
き、「age(E.生年月日)」の値は年齢インデックス705よ
り取得するので、属性「生年月日」の値を使って計算す
る必要はない。
【0092】[実施形態3]次に、本発明の第3の実施
の形態について図面を参照して詳細に説明する。
【0093】図9を参照すると、本発明の第3の実施の
形態は、データ処理装置12の構成が、図5に示された第
2の実施の形態におけるデータ処理装置10の構成に加
え、データ変換手段76を有する点で異なる。また、外部
情報源検索手段78の検索対象が、単一ではなく複数の情
報源(91, 92, 93)を対象とする点で異なる。
【0094】データ変換手段76は、複数の外部情報源か
らインデックス作成用の属性値をそれぞれ取得し、デー
タの形式を統一する。データ形式統一のために変換手段
は、情報源ごとに予め与えられているものとする。
【0095】インデックス記憶部34では、第1の実施の
形態および第2の実施の形態におけるインデックス記憶
部31では単一情報源を対象とするため各属性値に対応す
るデータのIDだけを保持していたのに対し、複数の情報
源中のデータに対するインデックスを管理するために、
外部情報源を一意に特定するための情報源ID、その情報
源の中でデータを特定するためのデータIDを保持する。
【0096】インデックス値記憶部35も、第1の実施の
形態および第2の実施の形態におけるインデックス値記
憶部32と異なり、外部情報源を一意に特定するための情
報源ID、その情報源の中でデータを特定するためのデー
タIDおよび形式を統一するために変換した結果の属性値
の集合を保持する。
【0097】インデックス生成手段77は、第1の実施の
形態および第2の実施の形態におけるインデックス生成
手段74では、属性値とデータIDのペアでインデックスを
生成しているのに対し、属性値とデータIDおよび情報源
IDのセットでインデックスを生成する。
【0098】外部情報源検索手段78は複数の情報源を検
索対象とし、その中の指定された情報源にアクセスす
る。
【0099】インデックス検索手段717では、インデッ
クス記憶部34のインデックスを利用して検索条件を満足
するデータ集合を取得するが、このとき、データIDだけ
ではなく情報源IDも同時に取得し、そのペアを結果をし
て返却する。
【0100】出力式評価手段716では、インデックス検
索手段717から情報源IDとデータIDのペアの集合を受け
取り、それに対応する指定された属性値をインデックス
値取得手段718あるいは外部情報源検索手段78により取
得する。そして、得られた値から指定された形式の検索
結果を生成し、出力装置4に出力する。
【0101】図9、図10のフローチャートを参照して
本実施の形態の全体の動作について詳細に説明する。
【0102】まず、インデックスを生成するために、外
部情報源から外部情報源検索手段78によりデータを読み
出す(図10の620)。次に、データ変換手段76におい
て、読み出したデータ中のインデックスを生成する対象
の属性に対し、データ変換が必要かどうかを判定する
(901)。もしデータ変換が必要ならば、予め登録され
た変換手段によって属性値を変換する(902)。ある情
報源のある属性に対し、インデックス生成に際してデー
タ変換が必要かどうかの情報と変換手段は、ユーザによ
って情報源ごと、インデックス化する属性ごとに定義さ
れ、提供されているものとする。データ変換が不要の場
合には、データ変換手段76では何もしない。
【0103】次に、データ変換手段76で処理された値に
対し、式計算手段75およびインデックス生成手段77にお
いてインデックスが生成され(621, 622, 321)、イン
デックス記憶部34、インデックス値記憶部35に登録され
る(322)。
【0104】生成されたインデックスを利用した検索方
法は、第2の実施の形態における方法と同様である。た
だしこのとき、インデックス記憶部34からは外部情報源
のIDとデータIDが含まれるので、外部情報源を検索する
場合(図6の309)には、外部情報源検索手段78において
この2つのIDを基にデータの取り出しを行う。
【0105】次に、本実施の形態の効果について説明す
る。
【0106】本実施の形態では、データ構造にプログラ
ムによって自動的に変換可能程度の差異がある複数の外
部情報源のデータを、データ変換手段76によって変換
し、統一した形式でインデックス生成できるように構成
されているため、複数の情報源にまたがる検索を、同じ
検索式を使って、高速に実行することができる。
【0107】[実施例3]次に、具体的な実施例3を用
いて本実施の形態の動作を説明する。
【0108】図11に示すように、共に従業員情報を管理
する外部情報源401と外部情報源1003が存在する場合を
考える。外部情報源401と外部情報源1003で管理する従
業員情報の内容はほぼ同じだが、生年月日データの管理
方法が外部情報源401の従業員テーブル402では西暦であ
るのに対し、外部情報源1003の従業員テーブル1004が和
暦で管理されているように、データ形式が若干異なるも
のとする。
【0109】外部情報源401と外部情報源1003からデー
タを抽出し、属性「生年月日」に対してインデックスを
生成する場合、外部情報源検索手段78によって双方の情
報源からデータが抽出される。
【0110】従業員テーブル402のデータの属性「生年
月日」に対しては、変換指定がユーザから与えられてい
ない。よってデータ変換部76では何もせず、そのままイ
ンデックス生成手段77によってインデックスが生成され
る。
【0111】一方、従業員テーブル1004の場合には、デ
ータ変換手段76によって、属性「生年月日」のデータ形
式を変換する。ここで、予め、従業員テーブル1004の属
性「生年月日」に対し、和暦を西暦に変換するプログラ
ムを適用してインデックス生成するよう、ユーザが指定
しているとする。データ変換手段76では、この情報を基
に、従業員テーブル1004から抽出したデータの属性「生
年月日」を西暦に変換する。そして、インデックス生成
手段77において、変換した属性値と外部情報源1003のID
(ここでは"2"とする)と、データのIDを使ってインデ
ックスを生成し、インデックス記憶部34およびインデッ
クス値記憶部35に登録する。
【0112】以上の処理により、外部情報源401と外部
情報源1003に対し、同じインデックスを利用して検索が
できるようになる。
【0113】[実施形態4]次に、本発明の第4の実施
の形態について図面を参照して詳細に説明する。
【0114】図12を参照すると、本発明の第4の実施の
形態は、情報検索プログラムを記録した記録媒体11を備
える。この記録媒体11は磁気ディスク、半導体メモリそ
の他の記録媒体であってよい。
【0115】情報検索プログラムは記録媒体11からデー
タ処理装置12に読み込まれ、データ処理装置12の動作を
制御する。データ処理装置12は検索プログラムの制御に
より、以下の処理、すなわち第1および第2および第3
の実施の形態におけるデータ処理装置および記憶装置に
よる処理と同一の処理、を実行する。
【0116】入力装置1から問合せが与えられると、ま
ず、この問合せの検索条件式中にインデックスが生成さ
れた式あるいは属性が存在するかどうかを、インデック
ス情報記憶部33を検索して調べる。検索式中のすべての
式あるいは属性にインデックスが生成されている場合に
は、インデックス記憶部34を検索し、条件判定を行う。
インデックスが生成されていない属性が含まれる場合に
は、外部情報源91〜93に問合せ処理を委譲する。
【0117】インデックス検索を実施した場合には、次
に、検索結果を出力する。このとき、出力式中にインデ
ックスが生成された式あるいは属性が存在するかどうか
を、インデックス情報記憶部33を検索して調べる。すべ
ての式あるいは属性にインデックスが生成されている場
合には、インデックス値記憶部35を検索し、出力を生成
する。インデックスが生成されていない属性が含まれる
場合には、検索条件を満足するデータのみを外部情報源
91〜93から取り出し、それより必要な値を抽出して出力
を生成する。
【0118】生成された検索結果は、出力装置4に表示
させる。
【0119】
【発明の効果】第1の効果は、実データを保持する情報
源(のデータやアプリケーションの特性)とは独立に、
データやアプリケーションのそれぞれの特性に最適なイ
ンデックス手法を柔軟に適用することができることにあ
る。その理由は、情報源とは独立にインデックス検索手
段と自己のインデックス検索手段での検索に適したイン
デックス情報を有しているためである。
【0120】第2の効果は、問合せ中に記述されたすべ
ての属性にインデックスが生成されている場合、実デー
タのロード処理が不要になり、問合せ処理時間が短縮で
きることにある。その理由は、一つのデータについて、
インデックスが生成されているすべての属性値の各値と
各データIDを統合して管理しており、インデックス値を
利用して問合せ処理を行うためである。
【0121】第3の効果は、属性を含む式を計算するこ
となく問合せ結果を生成することができることにある。
この結果、問合せの応答速度を短縮することができる。
その理由は、属性値を加工する式の各値そのものに対す
るインデックスを生成し、式とインデックスとの対応関
係を保持することによって、式の値を取得し利用する手
段を有しているためである。
【0122】第4の効果は、複数の情報源に対して、高
速に問合せ処理を実行することが出来ることにある。そ
の理由は、データ構造にプログラムによって自動的に変
換可能な程度(ないし範囲)に差異がある複数の外部情
報源のデータを、データ変換手段によって変換し、統一
した形式でインデックス生成できるように構成されてお
り、このインデックスを使って問合せ処理を実行する手
段を有しているためである。
【図面の簡単な説明】
【図1】従来の情報検索システムの構成を示す示すブロ
ック図(A)と、統合型情報検索システムの構成を示すブ
ロック図(B)である。
【図2】本発明の第1の実施の形態の構成を示すブロッ
ク図である。
【図3】第1の実施の形態の動作を示す流れ図である。
【図4】第1の実施の形態の動作の具体例を示す図であ
る。
【図5】本発明の第2の実施の形態の構成を示すプロッ
ク図である。
【図6】第2の実施の形態の動作を示す流れ図である。
【図7】第2の実施の形態の動作を示す流れ図である。
【図8】第2の実施の形態の動作の具体例を示す図であ
る。
【図9】本発明の第3の実施の形態の構成を示すプロッ
ク図である。
【図10】第3の実施の形態の動作を示す流れ図であ
る。
【図11】第3の実施の形態の動作の具体例を示す図で
ある。
【図12】本発明の第4の実施の形態の構成を示すブロ
ック図である。
【符号の説明】 1 入力装置 2 データ処理装置 3 記憶装置 4 出力装置 21 検索手段 211 検索式評価手段 212 出力式評価手段 213 インデックス検索手段 214 実データ検索手段 22 インデックス生成手段 30 実データ記憶部 31 インデックス記憶部 5 統合型情報検索システム 51 検索仲介手段 61、62、63 情報検索システム 7 データ処理装置 8 記憶装置 71 検索手段 711 検索式評価手段 712 出力式評価手段 713 インデックス値取得手段 32 インデックス値記憶部 73 外部情報源検索手段 74 インデックス生成手段 91 外部情報源 401 外部情報源 402 従業員テーブル 403 インデックス記憶部 404 名前インデックス 405 生年月日インデックス 406 役職インデックス 407 所属インデックス 408 インデックス値記憶部 409 インデックス値テーブル 33 インデックス情報記憶部 75 式計算手段 10 データ処理装置 13 記憶装置 701 インデックス情報記憶部 702 インデックス記憶部 703 インデックス値記憶部 704 インデックス情報テーブル 706 インデックス値テーブル 12 データ処理装置 715 検索式評価手段 716 出力式評価手段 717 インデックス検索手段 718 インデックス値取得手段 34 インデックス記憶部 35 インデックス値記憶部 76 データ変換手段 77 インデックス生成手段 78 外部情報源検索手段 91、92、93 外部情報源 1001 インデックス記憶部 1002 インデックス値記憶部 1003 情報源2 1004 従業員テーブル 1005 名前インデックス 1006 生年月日インデックス 1007 役職インデックス 1008 年齢インデックス 1009 インデックス値テーブル 11 記録媒体

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】属性値を指定された方法で加工する式計算
    手段と、 前記式計算手段により生成された値に対してインデック
    スを生成するインデックス生成手段と、 前記インデックス生成手段により生成されたインデック
    スを使ってインデックス検索を行うインデックス検索手
    段と、 前記インデックス検索手段を使って問合せの指定する条
    件検索を実施する検索式評価手段と、 を備えたことを特徴とする情報検索システム。
  2. 【請求項2】複数の情報源中の属性値を予め定めた統一
    形式に変換するデータ変換手段と、 前記データ変換手段により変換された値に対してインデ
    ックスを生成するインデックス生成手段と、 前記インデックス生成手段により生成されたインデック
    スを使ってインデックス検索を行うインデックス検索手
    段と、 前記インデックス検索手段を使って問合せの指定する条
    件検索を実施する検索式評価手段と、 を備えたことを特徴とする情報検索システム。
  3. 【請求項3】複数の情報源中の属性値を予め定めた統一
    形式に変換するデータ変換手段と、 前記データ変換手段により変換された値を指定された方
    法で加工する式計算手段と、 前記式計算手段により加工された値に対してインデック
    スを生成するインデックス生成手段と、 前記インデックス生成手段により生成されたインデック
    スを使ってインデックス検索を行うインデックス検索手
    段と、 前記インデックス検索手段を使って問合せの指定する条
    件検索を実施する検索式評価手段と、 を備えたことを特徴とする情報検索システム。
  4. 【請求項4】インデックスとインデックスが生成された
    属性あるいは属性に対する加工式の情報を保持するイン
    デックス情報記憶手段を備え、 前記検索式評価手段は、入力された問合せの条件式中
    に、前記インデックス情報記憶手段に記憶されたインデ
    ックスが生成されている属性あるいは式が含まれている
    かどうかを調べ、条件式中のすべての属性または式にイ
    ンデックスが生成されている場合には、前記インデック
    ス検索手段によって条件検索を行うことを特徴とする請
    求項1、2または3記載の情報検索システム。
  5. 【請求項5】情報源中でデータを一意に識別するIDとイ
    ンデックスが生成されているすべての属性の値を管理す
    るインデックス値記憶手段と、 属性値を前記インデックス値記憶手段から検索するイン
    デックス値検索手段と、 前記インデックス値検索手段により問合せ出力式に従っ
    た問合せ結果を生成する出力式評価手段と、 を備えたことを特徴とする情報検索システム。
  6. 【請求項6】属性値を指定された方法で加工する式計算
    手段と、 前記式計算手段により生成された値と元の属性を持つデ
    ータのIDとの組からなるインデックス値情報を生成する
    インデックス生成手段と、 前記インデックス生成手段により生成されたインデック
    ス値情報から前記式計算手段により加工された値を取得
    するインデックス値検索手段と、 前記インデックス値検索手段を使って問合せの出力式に
    従った問合せ結果を生成する出力式評価手段と、 を備えたことを特徴とする情報検索システム。
  7. 【請求項7】複数の情報源中の属性値を予め定めた統一
    形式に変換するデータ変換手段と、 前記データ変換手段により変換された値と元の属性を持
    つデータのIDとの組からなるインデックス値情報をイン
    デックス生成手段と、 前記インデックス生成手段により生成されたインデック
    ス値情報から前記データ変換手段により変換された値を
    取得するインデックス値検索手段と、 前記インデックス値検索手段を使って問合せの出力式に
    従った問合せ結果を生成する出力式評価手段と、 を備えたことを特徴とする情報検索システム。
  8. 【請求項8】複数の情報源中の属性値を予め定めた統一
    形式に変換するデータ変換手段と、 前記データ変換手段により変換された値を指定された方
    法で加工する式計算手段と、 前記式計算手段により加工された値と元の属性を持つデ
    ータのIDの組からなるインデックス値情報を生成するイ
    ンデックス生成手段と、 前記インデックス生成手段により生成されたインデック
    ス値情報から前記データ変換手段および式計算手段によ
    り変換・加工された値を取得するインデックス値検索手
    段と、 前記インデックス値検索手段を使って問合せの出力式に
    従った問合せ結果を生成する出力式評価手段と、 を備えたことを特徴とする情報検索システム。
  9. 【請求項9】インデックスとインデックスが生成された
    属性あるいは属性に対する加工式の情報を保持するイン
    デックス情報記憶手段を備え、 前記出力式評価手段は、入力された問合せの出力式中
    に、前記インデックス情報記憶手段に記憶されたインデ
    ックスが生成されている属性あるいは式が含まれている
    かどうかを調べ、出力式中のすべての属性または式にイ
    ンデックスが生成されている場合には、前記インデック
    ス値検索手段によって条件検索を行うことを特徴とする
    請求項5、6、7または8記載の情報検索システム。
  10. 【請求項10】属性値を指定された方法で加工し、 加工された値に対してインデックスを生成し、 生成されたインデックスを使ってインデックス検索を行
    い、 インデックス検索により問合せの指定する条件検索を実
    施することを特徴とする情報検索方法。
  11. 【請求項11】複数の情報源中の属性値を予め定めた統
    一形式に変換し、 変換された値に対してインデックスを生成し、 生成されたインデックスを使ってインデックス検索を行
    い、 インデックス検索により問合せの指定する条件検索を実
    施することを特徴とする情報検索方法。
  12. 【請求項12】複数の情報源中の属性値を予め定めた統
    一形式に変換し、 変換された値を指定された方法で加工し、 加工された値に対してインデックスを生成し、 生成されたインデックスを使ってインデックス検索を行
    い、 インデックス検索により問合せの指定する条件検索を実
    施することを特徴とする情報検索方法。
  13. 【請求項13】データを一意に識別するIDとインデック
    スが生成されているすべての属性の値を管理し、 管理されている属性値を検索し、 検索された属性値により問合せ出力式に従った問合せ結
    果出力を生成することを特徴とする情報検索方法。
  14. 【請求項14】属性値を指定された方法で加工し、 加工された値と元の属性を持つデータのIDの組からなる
    インデックス値情報を生成し、 生成されたインデックス値情報を使って加工された値を
    取得し、 取得した値を使って問合せの指定する出力を生成するこ
    とを特徴とする情報検索方法。
  15. 【請求項15】複数の情報源中の属性値を予め定めた統
    一形式に変換し、 変換された値と元の属性を持つデータのIDの組からなる
    インデックス値情報を生成し、 生成されたインデックス値情報を使って変換された値を
    取得し、 取得した値を使って問合せの出力式に従った問合せ結果
    を生成することを特徴とする情報検索方法。
  16. 【請求項16】複数の情報源中の属性値を予め定めた統
    一形式に変換し、 変換された値を指定された方法で加工し、 加工された値と元の属性を持つデータのIDの組からなる
    インデックス値情報を生成し、 生成されたインデックス値情報を使って変換・加工され
    た値を取得し、 取得した値を使って問合せの出力式に従った問合せ結果
    を生成することを特徴とする情報検索方法。
  17. 【請求項17】属性値を指定された方法で加工する式計
    算処理と、 前記式計算処理により生成された値に対してインデック
    スを生成するインデックス生成処理と、 前記インデックス生成処理により生成されたインデック
    スを使ってインデックス検索を行うインデックス検索処
    理と、 前記インデックス検索処理を使って問合せの指定する条
    件検索を実施する検索式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  18. 【請求項18】複数の情報源中の属性値を予め定めた統
    一形式に変換するデータ変換処理と、 前記データ変換処理により変換された値に対してインデ
    ックスを生成するインデックス生成処理と、 前記インデックス生成処理により生成されたインデック
    スを使ってインデックス検索を行うインデックス検索処
    理と、 前記インデックス検索処理を使って問合せの指定する条
    件検索を実施する検索式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  19. 【請求項19】複数の情報源中の属性値を予め定めた統
    一形式に変換するデータ変換処理と、 前記データ変換処理により変換された値を指定された方
    法で加工する式計算処理と、 前記式計算処理により加工された値に対してインデック
    スを生成するインデックス生成処理と、 前記インデックス生成処理により生成されたインデック
    スを使ってインデックス検索を行うインデックス検索処
    理と、 前記インデックス検索処理を使って問合せの指定する条
    件検索を実施する検索式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  20. 【請求項20】前記検索式評価処理は、入力された問合
    せの条件式中に、前記インデックス情報記憶手段に記憶
    されたインデックスが生成されている属性あるいは式が
    含まれているかどうかを調べ、条件式中のすべての属性
    または式にインデックスが生成されている場合には、前
    記インデックス検索処理によって条件検索を行うことを
    特徴とする請求項17、18または19の媒体。
  21. 【請求項21】情報源中でデータを一意に識別するIDと
    インデックスが生成されているすべての属性の値を管理
    するインデックス値記憶処理と、 属性値を前記インデックス値記憶処理から検索するイン
    デックス値検索処理と、 前記インデックス値検索処理により問合せ出力式に従っ
    た問合せ結果を生成する出力式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  22. 【請求項22】属性値を指定された方法で加工する式計
    算処理と、 前記式計算処理により生成された値と元の属性を持つデ
    ータのIDとの組からなるインデックス値情報を生成する
    インデックス生成処理と、 前記インデックス生成処理により生成されたインデック
    ス値情報から前記式計算手段により加工された値を取得
    するインデックス値検索処理と、 前記インデックス値検索処理を使って問合せの出力式に
    従った問合せ結果を生成する出力式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  23. 【請求項23】複数の情報源中の属性値を予め定めた統
    一形式に変換するデータ変換処理と、 前記データ変換処理により変換された値と元の属性を持
    つデータのIDの組からなるインデックス値情報を生成す
    るインデックス生成処理と、 前記インデックス生成処理により生成されたインデック
    ス値情報から前記データ変換手段により変換された値を
    取得するインデックス値検索処理と、 前記インデックス値検索処理を使って問合せの出力式に
    従った問合せ結果を生成する出力式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  24. 【請求項24】複数の情報源中の属性値を予め定めた統
    一形式に変換するデータ変換処理と、 前記データ変換処理により変換された値を指定された方
    法で加工する式計算処理と、 前記式計算処理により加工された値と元の属性を持つデ
    ータのIDとの組からなるインデックス値情報を生成する
    インデックス生成処理と、 前記インデックス生成処理により生成されたインデック
    ス値情報から前記データ変換処理および式計算処理によ
    り変換・加工された値を取得するインデックス値検索処
    理と、 前記インデックス値検索処理を使って問合せの出力式に
    従った問合せ結果を生成する出力式評価処理と、 をコンピュータに実行させるためのプログラムを担持し
    たことを特徴とする媒体。
  25. 【請求項25】前記出力式評価処理は、入力された問合
    せの出力式中に、前記インデックス情報記憶手段に記憶
    されたインデックスが生成されている属性あるいは式が
    含まれているかどうかを調べ、出力式中のすべての属性
    または式にインデックスが生成されている場合には、前
    記インデックス検索処理によって条件検索を行うことを
    特徴とする請求項21、22、23または24記載の媒
    体。
  26. 【請求項26】前記媒体は、各プログラムを記録した記
    録媒体であることを特徴とする請求項17〜25の一に
    記載の媒体。
JP24093499A 1999-08-27 1999-08-27 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体 Pending JP2001067369A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24093499A JP2001067369A (ja) 1999-08-27 1999-08-27 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24093499A JP2001067369A (ja) 1999-08-27 1999-08-27 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2003374095A Division JP2004046906A (ja) 2003-11-04 2003-11-04 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
JP2004031531A Division JP2004192657A (ja) 2004-02-09 2004-02-09 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001067369A true JP2001067369A (ja) 2001-03-16

Family

ID=17066829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24093499A Pending JP2001067369A (ja) 1999-08-27 1999-08-27 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001067369A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004192657A (ja) * 2004-02-09 2004-07-08 Nec Corp 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
JP2007280361A (ja) * 2006-03-14 2007-10-25 Canon Inc 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体
JP2009129202A (ja) * 2007-11-22 2009-06-11 Ntt Data Corp データ処理装置、データ処理方法、および、プログラム
CN104123346A (zh) * 2014-07-02 2014-10-29 广东电网公司信息中心 一种结构化数据搜索方法
JP2015507293A (ja) * 2012-02-07 2015-03-05 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited ウェブページ検索の方法及び装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63298626A (ja) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd デ−タベ−ス管理方法
JPH10124491A (ja) * 1996-10-24 1998-05-15 Fujitsu Ltd 文書共有整理システム,共有文書管理装置および文書アクセス装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63298626A (ja) * 1987-05-29 1988-12-06 Matsushita Electric Ind Co Ltd デ−タベ−ス管理方法
JPH10124491A (ja) * 1996-10-24 1998-05-15 Fujitsu Ltd 文書共有整理システム,共有文書管理装置および文書アクセス装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004192657A (ja) * 2004-02-09 2004-07-08 Nec Corp 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
JP2007280361A (ja) * 2006-03-14 2007-10-25 Canon Inc 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体
JP2009129202A (ja) * 2007-11-22 2009-06-11 Ntt Data Corp データ処理装置、データ処理方法、および、プログラム
JP2015507293A (ja) * 2012-02-07 2015-03-05 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited ウェブページ検索の方法及び装置
US9262454B2 (en) 2012-02-07 2016-02-16 Alibaba Group Holding Limited Web page retrieval method and device
TWI564737B (zh) * 2012-02-07 2017-01-01 阿里巴巴集團控股有限公司 Web search methods and devices
CN104123346A (zh) * 2014-07-02 2014-10-29 广东电网公司信息中心 一种结构化数据搜索方法
CN104123346B (zh) * 2014-07-02 2017-10-20 广东电网公司信息中心 一种结构化数据搜索方法

Similar Documents

Publication Publication Date Title
JP4227033B2 (ja) データベース統合参照装置、データベース統合参照方法およびデータベース統合参照プログラム
TWI710919B (zh) 資料儲存裝置、轉譯裝置及資料庫存取方法
CN1705945B (zh) 提供查询的属性的方法和系统
US8886617B2 (en) Query-based searching using a virtual table
US6148296A (en) Automatic generation of database queries
JP4809652B2 (ja) .netデータ型およびインスタンスの持続性ストレージ
US10169446B1 (en) Relational modeler and renderer for non-relational data
US20130198233A1 (en) Integrated repository of structured and unstructured data
US7469257B2 (en) Generating and monitoring a multimedia database
CN108874971A (zh) 一种应用于海量标签化实体数据存储的工具和方法
US20130013590A1 (en) Searching and Displaying Data Objects Residing in Data Management Systems
Banane et al. Storing RDF data into big data NoSQL databases
US20040078355A1 (en) Information management system
JP3786233B2 (ja) 情報検索方法および情報検索システム
JP2004192657A (ja) 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
JP2001067369A (ja) 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
WO2023086322A1 (en) Late materialization of queried data in database cache
Batini et al. Data quality issues in data integration systems
Engle et al. Evaluation Criteria for Selecting NoSQL Databases in a Single Box Environment
JP2004046906A (ja) 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
JP3498926B2 (ja) 文書データベース管理システム
CN115718571B (zh) 一种基于多维度特征的数据管理方法和装置
Lin et al. A Scalable Lightweight RDF Knowledge Retrieval System
KR20030065860A (ko) 엑스엠엘 계층구조를 이용한 비디오 검색 시스템 및 그 방법
Lypak et al. Linguistic support for the formation of a consolidated information resource of social memory institutions

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040622