JP2005018118A - データベース検索システム - Google Patents
データベース検索システム Download PDFInfo
- Publication number
- JP2005018118A JP2005018118A JP2003177828A JP2003177828A JP2005018118A JP 2005018118 A JP2005018118 A JP 2005018118A JP 2003177828 A JP2003177828 A JP 2003177828A JP 2003177828 A JP2003177828 A JP 2003177828A JP 2005018118 A JP2005018118 A JP 2005018118A
- Authority
- JP
- Japan
- Prior art keywords
- search
- database
- item
- annotation
- target database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】データベース検索システムに係り、テーブル及び項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索する検索エンジンを用いて、キーワード検索することを課題とする。
【解決手段】検索文自動生成手段3は、各項目名を入力し、検索対象データベースのメタデータ2から検索文を生成し、アノテーション自動生成手段4は、各項目名、各項目の意味情報、検索対象データベース検索手段のURL、及び検索文を含むアノテーションを生成し、文書ファイル検索手段6は、検索キーワードに従ってアノテーションを検索し、検索対象データベース検索手段7は、アノテーションに基づいて、検索対象データベースを検索する。
【選択図】 図1
【解決手段】検索文自動生成手段3は、各項目名を入力し、検索対象データベースのメタデータ2から検索文を生成し、アノテーション自動生成手段4は、各項目名、各項目の意味情報、検索対象データベース検索手段のURL、及び検索文を含むアノテーションを生成し、文書ファイル検索手段6は、検索キーワードに従ってアノテーションを検索し、検索対象データベース検索手段7は、アノテーションに基づいて、検索対象データベースを検索する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
この発明は、文書ファイルに含まれるキーワードを検索することによって所望するデータを獲得する検索エンジンを用いて、データベース内のデータを検索するデータベース検索システムに関するものである。
【0002】
【従来の技術】
従来のデータベースシステムにおいては、データベースあるいはサーバの存在場所とデータベース内の実データの内容を表す情報をメタデータと称して蓄積し、そのメタデータを検索して、どこに何があるかに関する情報を入手する構成をとっている。ここで、メタデータとは、テーブル、項目(カラム)といったデータベースのスキーマに関する情報を指し、データベースに格納されているデータそのものは含まれていない。
【0003】
従来のデータベースシステムでは、たとえば関係データベースのように、データが格納されている場所、テーブル、項目を指定した検索文によって所望のデータを検索する。近年、システム統合、企業間連携等により既存のデータベースを連携させてデータを検索するシステムが登場し、すべての連携先のデータベース情報を予めシステム内に組み込むことが困難になっている。このような場合、たとえば、特開平11−213014号のように、存在場所、テーブル、項目に関する情報であるメタデータを事前に蓄積し、データ検索時に、メタデータを検索して実データへの検索文を作成する方法をとっている。
【0004】
一方で、WWW上のさまざまな文書ファイルを検索する検索エンジンを用いて、ユーザが指定したキーワードに該当する文書ファイルを検索する方法がとられることがある。しかし、上述のように、データベースのみの場合、およびデータベースとメタデータを組み合わせたシステムの場合、データベースとメタデータは、テーブルと項目構造のため、上記文書ファイルを検索する検索エンジンの対象とならない。仮にメタデータについて、文書ファイルの形式をとった場合においても、テーブル、項目といったスキーマに関する情報のみで実データが含まれないため、ユーザが指定したキーワードに該当せず、所望のデータを得られないという問題点があった。
【0005】
【特許文献1】
特開平11−213014号公報
【0006】
【発明が解決しようとする課題】
この発明は、上記のような問題点を解決するためになされたもので、テーブル、項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索する検索エンジンを用いてキーワード検索させることができるデータベース検索システムを得るものである。
【0007】
【課題を解決するための手段】
本発明に係るデータベース検索システムは、
検索対象のデータを管理する検索対象データベース及び当該検索対象データベースのメタデータにアクセス可能なデータベース検索システムであり、
検索文を用いて、検索対象データベース内の該当するデータを検索する検索対象データベース検索手段と、
検索対象データベースで管理する項目のうち、見出しとなる項目を特定する見出し項目名、キーワードとなる項目を特定するキーワード項目名、出力となる項目を特定する出力項目名を入力として、検索対象データベースのメタデータを検索して、検索文を生成する検索文自動生成手段と、
前記見出し項目名、前記キーワード項目名、前記出力項目名を入力として、検索対象データベースのメタデータ及び検索対象データベースを検索して、データベース内の見出し項目の内容である見出しデータ、データベース内のキーワード項目の内容であるキーワードデータ、出力項目名、検索対象データベース検索手段の場所、及び上記検索文自動生成手段で生成された検索文を含む見出し項目ごとに対応したアノテーション文書ファイルを生成するアノテーション自動生成手段と、
アノテーション自動生成手段により生成されたアノテーション文書ファイル群から、指定された検索キーワードに該当するアノテーション文書ファイルを検索する文書ファイル検索手段とを有し、
データベース検索システムは、検索対象データベース検索手段により検索したアノテーション文書ファイルに含まれる前記場所により検索対象データベース検索手段にアクセスし、前記検索したアノテーション文書ファイルに含まれる前記検索文を用いて、検索対象データベース内の該当するデータを検索することを特徴とする。
【0008】
【発明の実施の形態】
実施の形態1.
図1は、実施の形態1によるデータベース検索システムを示す構成図である。
図1において、1は、テーブルと項目構造を持つ検索対象データベース、2は、検索対象データの所在、テーブル名、項目名、意味内容などデータを管理するための情報である検索対象データベースのメタデータ、3は、指定された見出し項目名、キーワード項目名、出力項目名を入力として、検索対象データベースを検索する検索文を自動生成する検索文自動生成手段、4は、指定された見出し項目名ごとのテキストファイル形式のアノテーションを自動生成するアノテーション自動生成手段、5は、アノテーション自動生成手段によって生成されたアノテーションを記憶するアノテーション記憶部、6は、指定されたキーワードに該当するテキストファイルを含む文書ファイルを検索する文書ファイル検索手段、7は、検索文を入力として検索対象データベース内の該当するデータを検索する検索対象データベース検索手段である。
【0009】
次に実施の形態1によるデータベース検索システムの動作について説明する。図2は、実施の形態1によるデータベース検索システムの動作を示すフローチャートである。
まずステップST101において、検索文を入力として検索対象データベースを検索する検索対象データベース検索手段7を設置して、そのURLを定める。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0010】
次にステップST102において、検索文自動生成手段3により、見出し項目名、キーワード項目名、出力項目名を入力として、各項目を出力する検索対象データベース検索手段7の入力用の検索文を自動生成する。
【0011】
図3は、検索対象データベースのテーブル例を示す図である。このデータベースは、リレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.Fとする。見出し項目として、T1.Aが、キーワード項目として、T1.B,T1.Cが、出力項目として、T1.D,T1.Eが選択されたものとする。このときの、検索文を図4に示す。図4は、検索分の例を示す図である。見出し項目、キーワード項目、出力項目の各項目をSELECT句に含み、検索対象のテーブルT1をFROM句に含み、見出し項目をWHERE句に含むように検索文を自動生成する。この検索文に具体的な見出しが指定されると、その見出しを含むすべてのレコードが選択される。
【0012】
次にステップST103において、アノテーション自動生成手段4により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0013】
図5は、検索対象データベースのテーブルに関するメタデータの例を示す図である。また、図6は、検索対象データベースのテーブルの項目に関するメタデータの例を示す図である。図7は、意味情報の検索結果の例を閉めす図である。検索対象テーブルT1、見出し項目T1.A、キーワード項目T1.B,T1.C、出力項目T1.D,T1.Eに対応する意味情報を検索した結果の例を示している。テーブル名、テーブル意味情報、項目名、項目意味情報を、たとえばXML(eXtensible Markup Language)のタグを用いて区切って保存する。
【0014】
次にステップST104において、アノテーション自動生成手段4により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0015】
図8は、キーワードのリストの例を示す図である。見出し項目としてT1.Aが、キーワード項目としてT1.B,T1.Cが選択されて、図5に示した検索対象データベースのテーブルに適用した場合に生成されるキーワードのリストの例を示している。T1.Aの重複を除いた実データであるa1,a2,a3ごとにキーワードを生成する。
【0016】
次にステップST105において、アノテーション自動生成手段4により、ステップST102、ST103、ST104によって生成された検索対象データベースの検索手段7のURL、検索文、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0017】
図9は、実施の形態1に係るアノテーションの例を示す図である。a1に関するアノテーションの例を示している。検索対象データベースの検索手段7のURLとして「http://sample.co.jp/getTableInfo」901を、検索文として、「SELECTT1.A,T1.B,T1.C,T1.D,T1.EFROMT1WHERET1.A=’a1’」902を、キーワードのリストとして、図7に示したテーブル名、テーブル意味情報、項目名、項目意味情報903を、見出し項目データ、キーワード項目データとして図8に示したa1に関する実データ904を含む。
【0018】
次にステップST106において、ステップST105で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0019】
次にステップST107において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置し、あるいはインターネットの検索サイトの検索エンジンを利用してもよい。
【0020】
次にステップST108において、検索対象データベース検索手段7により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。つまり、アノテーションに含まれる検索対象データベースの検索手段のURL(場所の例)により、検索対象データベース検索手段7にアクセスし、アノテーションに含まれる検索文を用いて、検索対象データベース内の該当するデータを検索する。
【0021】
たとえば、ST105で作成されたa1,a2,a3に関するアノテーションに対して、検索キーワード「a1」を指定して検索した場合には、a1に関するアノテーションが選択される。次に、a1のアノテーションに含まれる検索対象データベースの検索手段のURL「http://sample.co.jp/getTableInfo」に、検索文「SELECTT1.A,T1.B,T1.C,T1.D,T1.E FROM T1 WHERE T1.A=’a1’」を加えて参照すると、検索文に該当するレコードが検索される。一般のwebの参照と同様にURLから参照する。たとえば、検索結果をCSV形式で出力する検索対象データベースの検索手段7の出力例を図10に示す。図10は、検索結果の例を示す図である。
【0022】
以上で明らかなように、実施の形態1によれば、指定された見出し項目ごとに、内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
【0023】
実施の形態2.
図11は、実施の形態2によるデータベース検索システムを示す構成図である。
1、2、3、5、6は、実施の形態1と同様のため説明を省略する。8は、見出しデータ、キーワードデータ、出力項目名、検索場所、検索条件を含むアノテーションを自動生成するアノテーション自動生成手段、9は検索文と検索条件を入力として検索対象データベース1内の該当するデータを検索する検索対象データベース検索手段である。
【0024】
次に実施の形態2によるデータベース検索システムの動作について説明する。図12は、実施の形態2によるデータベース検索システムを示すフローチャートである。
まずステップST201において、検索文と検索条件を入力として検索対象データベースを検索する検索対象データベース検索手段7を設置してそのURLを定める。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0025】
次にステップST202において、検索文自動生成手段3により、見出し項目名、キーワード項目名、出力項目名を入力として、各項目を出力する検索対象データベース検索手段9の入力用の検索文を自動生成する。生成された検索文は、検索対象データベース検索手段9の初期化時の入力、プログラムへの組み込み等によって設定する。たとえば、検索対象データベース検索手段9がサーブレットで実現されている場合には、そのプロパティファイルで設定する。
【0026】
たとえば、図3に示す検索対象データベース1のテーブル例を用いて説明する。このデータベースはリレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.Fとする。見出し項目として、T1.Aが、キーワード項目として、T1.B,T1.Cが、出力項目名として、T1.D,T1.Eが選択されたものとする。このときの、検索文を図4に示す。各項目が、SELECT句に含まれ、検索対象のテーブルT1がFROM句に含まれ、見出し項目が、WHERE句に含まれるように、検索文を自動生成する。この検索文に具体的な見出しが検索条件として入力されると、その見出しを含むすべてのレコードが選択されることとなる。この検索文を、検索対象データベース検索手段9のプロパティファイルに設定する。
【0027】
次にステップST203において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0028】
次にステップST204において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0029】
次にステップST205において、アノテーション自動生成手段8により、ステップST202、ST203、ST204によって生成された検索対象データベースの検索手段のURL、検索条件、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0030】
図13は、実施の形態2に係るアノテーションの例を示す図である。a1に関するアノテーションを示している。検索対象データベースの検索手段のURLとして「http://sample.co.jp/getTableInfo」1301を、検索条件として、「a1」1302を、キーワードとして、図7に示したテーブル名、テーブル意味情報、項目名、項目意味情報1303を、見出し項目データ、キーワード項目データとして図8に示したa1に関する実データ1304を含む。
【0031】
次にステップST206において、ステップST205で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバ内に配置して、インターネット、イントラネット等からアクセス可能にする。
【0032】
次にステップST207において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0033】
次にステップST208において、検索対象データベース検索手段9により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。つまり、アノテーションに含まれる検索対象データベースの検索手段のURL(場所の例)により、検索対象データベース検索手段7にアクセスし、アノテーションに含まれる検索条件と先に設定されたけ検索文を用いて、検索対象データベース無いの該当するデータを検索する。
【0034】
以上のように、実施の形態2によれば、指定された見出し項目ごとに、内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索条件によって検索対象データベースを検索するように構成したので、検索対象データベースの構造、検索方法を公開することなく、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。また、検索文を改変することにより、任意のデータベース検索を行う危険を回避することができる効果を奏する。
【0035】
実施の形態3.
図14、実施の形態3によるデータベース検索システムを示す構成図である。
1、2、5、6、8、9は、実施の形態2と同様のため説明を省略する。10は、指定された見出し項目名、キーワード項目名、出力項目名に加えて、複数テーブル間の関連を指定して、検索対象データベース1を検索する検索文を自動生成する検索文自動生成手段である。
【0036】
次に実施の形態3によるデータベース検索システムの動作について説明する。図15は、実施の形態3によるデータベース検索システムを示すフローチャートである。
まずステップST301において、検索文と検索条件を入力として検索対象データベース1を検索する検索対象データベース検索手段7を設置してそのURLを定める。たとえば、Webアプリケーションサーバ内に設置して、インターネット、イントラネット等からアクセス可能にする。
【0037】
次にステップST302において、テーブル間の関連を入力に加えた検索文自動生成手段10により、見出し項目名、キーワード項目名、出力項目名、複数テーブル間の関連を入力として、各項目を出力する検索対象データベース検索手段9の入力用の検索文を自動生成する。生成された検索文は、検索対象データベース検索手段9の初期化時の入力、プログラムへの組み込み等によって設定する。たとえば、検索対象データベース検索手段9がサーブレットで実現されている場合には、そのプロパティファイルで設定する。
【0038】
図16は、検索対象データベース1のテーブル例を示す図である。このデータベースはリレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.F、テーブルT2の項目名は、T2.G,T2.Hとする。見出し項目として、T1.Aが、キーワード項目は指定なし、出力項目名として、T2.G,T2.Hが選択されたものとする。また、テーブル間関連として、T1.D=TO_CHAR(12.G,’YYYY/MM/DD’)が指定されたものとする。すなわち、見出しデータの日付データに発生したすべての事象(たとえば気温等)を検索するものとする。このときの、検索文を図17に示す。図17は、実施の形態3に係る検索文の例を示す図である。見出し項目、キーワード項目、出力項目の各項目を、SELECT句に含み、検索対象のテーブルT1,T2をFROM句に含み、見出し項目、およびテーブル間の関連を、WHERE句に含むように、検索文を自動生成する。この検索文に具体的な見出しが検索条件として入力されると、その見出しを含むすべてのレコードが選択されることとなる。この検索文を、検索対象データベース検索手段9のプロパティファイルに設定する。
【0039】
次にステップST303において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0040】
次にステップST304において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0041】
次にステップST305において、アノテーション自動生成手段8により、ステップST302、ST303、ST304によって生成された検索対象データベースの検索手段のURL、検索条件、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0042】
次にステップST306において、ステップST305で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバ内に配置して、インターネット、イントラネット等からアクセス可能にする。
【0043】
次にステップST307において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0044】
次にステップST308において、検索対象データベース検索手段9により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。
【0045】
たとえば、図15に示した検索対象データベースに対して、キーワードとして、a1が指定された場合の出力結果を図18に示す。図18は、実施の形態3に係る検索結果の例を示す図である。
【0046】
以上のように、実施の形態3によれば、指定された見出し項目ごとに、複数のテーブルの内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、テーブル、項目構造を持つデータベース内に格納された複数テーブルに格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
【0047】
尚、上述のテーブル間の関連に関する処理を実施の形態1に適用して、検索文を作成することも有効である。
【0048】
実施の形態4.
図19は、実施の形態4によるデータベース検索システムを示す構成図である。
1、2、5、6、8は、実施の形態3と同様のため説明を省略する。11は、見出し項目名、キーワード項目名、出力項目名を入力として、検索対象データベースに関するメタデータ2を検索して、上記検索対象データベース検索手段12を実現するプログラムを自動生成して検索手段とする検索対象データベース検索手段自動生成手段である。12は、検索対象データベース検索手段自動生成手段によって生成された検索対象データベース検索手段である。
【0049】
次に実施の形態4によるデータベース検索システムの動作について説明する。図20は、実施の形態4によるデータベース検索システムを示すフローチャートである。
まずステップST401において、検索対象データベース検索手段自動生成手段11により、見出し項目名、キーワード項目名、出力項目名を入力として、検索対象データベースに関するメタデータを検索して検索対象データベース1を検索する検索文を自動生成する。これは、前述の実施の形態1における検索文自動生成手段の動作と同じである。
【0050】
図21に示す例を用いて説明する。図21は、検索対象データベース1のテーブルの例である。このデータベースはリレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.F、テーブルT3の項目名は、T3.I,T3.Jとする。見出し項目として、T1.Aが、キーワード項目として、T1.Bが、出力項目名として、T3.Jが選択されたものとする。また、図22に示すように検索対象データベースのメタデータ2内に外部キーT1.Bの参照先が、T3.Iであるという情報が格納されているものとする。図22は、検索対象データベースのメタデータの例を示す図である。見出し項目、キーワード項目、出力項目を出力する検索文として、外部キー情報を用いて、図23のように見出しを入力条件とする検索文を生成する。図23は、検索文の例である。
【0051】
次にステップST402において、検索対象データベース検索手段自動生成手段11により、ST401で作成された検索文をプログラム内に持ち、その検索文の結果を、たとえば、CSVファイルで出力する検索対象データベース検索手段12を実現するプログラムを自動生成する。与えられた検索文を実行して、CSVファイルを出力するプログラムは容易に実現することができる。
【0052】
次に、ステップST403において、検索対象データベース検索手段自動生成手段11により、自動生成された検索対象データベースを検索する検索対象データベース検索手段12を設置してそのURLを定める。たとえば、Webアプリケーションサーバ内に設置して、インターネット、イントラネット等からアクセス可能にする。
【0053】
次にステップST404において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0054】
次にステップST405において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0055】
次にステップST406において、アノテーション自動生成手段8により、ステップST403、ST404、ST405によって生成された検索対象データベースの検索手段のURL、検索条件、テーブル名、テーブル意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件としてアノテーションに含める。
【0056】
次にステップST407において、ステップST406で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0057】
次にステップST408において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0058】
次にステップST409において、検索対象データベース検索手段12により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。
【0059】
以上のように、この実施の形態4によれば、指定された見出し項目ごとに、複数のテーブルの内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索条件によって検索対象データベースを検索する検索手段を自動生成して検索するように構成したので、テーブルと項目構造を持つデータベース内に格納された複数テーブルに格納されたデータを対象に、専用の検索対象手段を開発することなく、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
尚、実施の形態1に対して、検索対象データベース検索手段自動生成手段を適用することも有効である。
【0060】
実施の形態5.
図24は、実施の形態5によるデータベース検索システムを示す構成図である。
1,2,3,5,6,7は、実施の形態1と同様のため説明を省略する。13は、入力として見出しリストを加えたアノテーション自動生成手段である。
【0061】
次に実施の形態5によるデータベース検索システムの動作について説明する。図25は、実施の形態5によるデータベース検索システムを示すフローチャートである。
まずステップST501において、検索文を入力として検索対象データベースを検索する検索対象データベース検索手段7を設置してそのURLを定める。たとえば、Webアプリケーションサーバ内に設置して、インターネット、イントラネット等からアクセス可能にする。
【0062】
次にステップST502において、検索文自動生成手段3により、見出し項目名、見出しリスト、キーワード項目名、出力項目名を入力として、各項目を出力する検索対象データベース検索手段7の入力用の検索文を自動生成する。
【0063】
次にステップST503において、アノテーション自動生成手段13により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0064】
次にステップST504において、アノテーション自動生成手段13により、見出し項目名、見出しリスト、キーワード項目名を入力として検索対象データベース1を検索して、指定された見出しリスト内にあるデータに合致する見出しごとのキーワードを得る。
【0065】
たとえば、見出し項目としてT1.Aが、見出しリストとして、[’a1’,’a3’]が、キーワード項目としてT1.B,T1.Cが選択されて、図5に示した検索対象データベースのテーブルの例に適用した場合に、生成されるキーワードのリストの例を示す。図26は、キーワードリストの例である。T1.Aの見出しリスト内に存在するa1,a3ごとにキーワードを生成する。
【0066】
次にステップST505において、アノテーション自動生成手段13により、ステップST502、ST503、ST504によって生成された検索対象データベースの検索手段のURL、検索文、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0067】
次にステップST506において、ステップST505で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバ内に配置して、インターネット、イントラネット等からアクセス可能にする。
【0068】
次にステップST507において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0069】
次にステップST508において、検索対象データベース検索手段7により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。
【0070】
以上のように、実施の形態5によれば、指定された見出しリストに該当する内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、意図した話題に関して、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
尚、実施の形態2に対して、見出しリストによる処理を適用することも有効である。
【0071】
【発明の効果】
本発明によれば、指定された見出し項目ごとに、内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
【図面の簡単な説明】
【図1】実施の形態1によるデータベース検索システムを示す構成図である。
【図2】実施の形態1によるデータベース検索システムの動作を示すフローチャートである。
【図3】検索対象データベースのテーブル例を示す図である。
【図4】検索分の例を示す図である。
【図5】検索対象データベースのテーブルに関するメタデータの例を示す図である。
【図6】検索対象データベースのテーブルの項目に関するメタデータの例を示す図である。
【図7】意味情報の検索結果の例を閉めす図である。
【図8】キーワードのリストの例を示す図である。
【図9】実施の形態1に係るアノテーションの例を示す図である。
【図10】
【図11】実施の形態2によるデータベース検索システムを示す構成図である。
【図12】実施の形態2によるデータベース検索システムを示すフローチャートである。
【図13】実施の形態2に係るアノテーションの例を示す図である。
【図14】実施の形態3によるデータベース検索システムを示す構成図である。
【図15】実施の形態3によるデータベース検索システムを示すフローチャートである。
【図16】検索対象データベース1のテーブル例を示す図である。
【図17】実施の形態3に係る検索文の例を示す図である。
【図18】実施の形態3に係る検索結果の例を示す図である。
【図19】実施の形態4によるデータベース検索システムを示す構成図である。
【図20】実施の形態4によるデータベース検索システムを示すフローチャートである。
【図21】検索対象データベース1のテーブルの例である。
【図22】検索対象データベースのメタデータの例を示す図である。
【図23】検索文の例である。
【図24】実施の形態5によるデータベース検索システムを示す構成図である。
【図25】実施の形態5によるデータベース検索システムを示すフローチャートである。
【図26】キーワードリストの例である。
【符号の説明】
1 検索対象データベース、2 メタデータ、3 検索文自動生成手段、4 アノテーション自動生成手段、5 アノテーション記憶部、6 文書ファイル検索手段、7 検索対象データベース検索手段、8 アノテーション自動生成手段、9 検索対象データベース検索手段、10 検索文自動生成手段、11 検索対象データベース検索手段自動生成手段、12 検索対象データベース検索手段、13 アノテーション自動生成手段。
【発明の属する技術分野】
この発明は、文書ファイルに含まれるキーワードを検索することによって所望するデータを獲得する検索エンジンを用いて、データベース内のデータを検索するデータベース検索システムに関するものである。
【0002】
【従来の技術】
従来のデータベースシステムにおいては、データベースあるいはサーバの存在場所とデータベース内の実データの内容を表す情報をメタデータと称して蓄積し、そのメタデータを検索して、どこに何があるかに関する情報を入手する構成をとっている。ここで、メタデータとは、テーブル、項目(カラム)といったデータベースのスキーマに関する情報を指し、データベースに格納されているデータそのものは含まれていない。
【0003】
従来のデータベースシステムでは、たとえば関係データベースのように、データが格納されている場所、テーブル、項目を指定した検索文によって所望のデータを検索する。近年、システム統合、企業間連携等により既存のデータベースを連携させてデータを検索するシステムが登場し、すべての連携先のデータベース情報を予めシステム内に組み込むことが困難になっている。このような場合、たとえば、特開平11−213014号のように、存在場所、テーブル、項目に関する情報であるメタデータを事前に蓄積し、データ検索時に、メタデータを検索して実データへの検索文を作成する方法をとっている。
【0004】
一方で、WWW上のさまざまな文書ファイルを検索する検索エンジンを用いて、ユーザが指定したキーワードに該当する文書ファイルを検索する方法がとられることがある。しかし、上述のように、データベースのみの場合、およびデータベースとメタデータを組み合わせたシステムの場合、データベースとメタデータは、テーブルと項目構造のため、上記文書ファイルを検索する検索エンジンの対象とならない。仮にメタデータについて、文書ファイルの形式をとった場合においても、テーブル、項目といったスキーマに関する情報のみで実データが含まれないため、ユーザが指定したキーワードに該当せず、所望のデータを得られないという問題点があった。
【0005】
【特許文献1】
特開平11−213014号公報
【0006】
【発明が解決しようとする課題】
この発明は、上記のような問題点を解決するためになされたもので、テーブル、項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索する検索エンジンを用いてキーワード検索させることができるデータベース検索システムを得るものである。
【0007】
【課題を解決するための手段】
本発明に係るデータベース検索システムは、
検索対象のデータを管理する検索対象データベース及び当該検索対象データベースのメタデータにアクセス可能なデータベース検索システムであり、
検索文を用いて、検索対象データベース内の該当するデータを検索する検索対象データベース検索手段と、
検索対象データベースで管理する項目のうち、見出しとなる項目を特定する見出し項目名、キーワードとなる項目を特定するキーワード項目名、出力となる項目を特定する出力項目名を入力として、検索対象データベースのメタデータを検索して、検索文を生成する検索文自動生成手段と、
前記見出し項目名、前記キーワード項目名、前記出力項目名を入力として、検索対象データベースのメタデータ及び検索対象データベースを検索して、データベース内の見出し項目の内容である見出しデータ、データベース内のキーワード項目の内容であるキーワードデータ、出力項目名、検索対象データベース検索手段の場所、及び上記検索文自動生成手段で生成された検索文を含む見出し項目ごとに対応したアノテーション文書ファイルを生成するアノテーション自動生成手段と、
アノテーション自動生成手段により生成されたアノテーション文書ファイル群から、指定された検索キーワードに該当するアノテーション文書ファイルを検索する文書ファイル検索手段とを有し、
データベース検索システムは、検索対象データベース検索手段により検索したアノテーション文書ファイルに含まれる前記場所により検索対象データベース検索手段にアクセスし、前記検索したアノテーション文書ファイルに含まれる前記検索文を用いて、検索対象データベース内の該当するデータを検索することを特徴とする。
【0008】
【発明の実施の形態】
実施の形態1.
図1は、実施の形態1によるデータベース検索システムを示す構成図である。
図1において、1は、テーブルと項目構造を持つ検索対象データベース、2は、検索対象データの所在、テーブル名、項目名、意味内容などデータを管理するための情報である検索対象データベースのメタデータ、3は、指定された見出し項目名、キーワード項目名、出力項目名を入力として、検索対象データベースを検索する検索文を自動生成する検索文自動生成手段、4は、指定された見出し項目名ごとのテキストファイル形式のアノテーションを自動生成するアノテーション自動生成手段、5は、アノテーション自動生成手段によって生成されたアノテーションを記憶するアノテーション記憶部、6は、指定されたキーワードに該当するテキストファイルを含む文書ファイルを検索する文書ファイル検索手段、7は、検索文を入力として検索対象データベース内の該当するデータを検索する検索対象データベース検索手段である。
【0009】
次に実施の形態1によるデータベース検索システムの動作について説明する。図2は、実施の形態1によるデータベース検索システムの動作を示すフローチャートである。
まずステップST101において、検索文を入力として検索対象データベースを検索する検索対象データベース検索手段7を設置して、そのURLを定める。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0010】
次にステップST102において、検索文自動生成手段3により、見出し項目名、キーワード項目名、出力項目名を入力として、各項目を出力する検索対象データベース検索手段7の入力用の検索文を自動生成する。
【0011】
図3は、検索対象データベースのテーブル例を示す図である。このデータベースは、リレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.Fとする。見出し項目として、T1.Aが、キーワード項目として、T1.B,T1.Cが、出力項目として、T1.D,T1.Eが選択されたものとする。このときの、検索文を図4に示す。図4は、検索分の例を示す図である。見出し項目、キーワード項目、出力項目の各項目をSELECT句に含み、検索対象のテーブルT1をFROM句に含み、見出し項目をWHERE句に含むように検索文を自動生成する。この検索文に具体的な見出しが指定されると、その見出しを含むすべてのレコードが選択される。
【0012】
次にステップST103において、アノテーション自動生成手段4により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0013】
図5は、検索対象データベースのテーブルに関するメタデータの例を示す図である。また、図6は、検索対象データベースのテーブルの項目に関するメタデータの例を示す図である。図7は、意味情報の検索結果の例を閉めす図である。検索対象テーブルT1、見出し項目T1.A、キーワード項目T1.B,T1.C、出力項目T1.D,T1.Eに対応する意味情報を検索した結果の例を示している。テーブル名、テーブル意味情報、項目名、項目意味情報を、たとえばXML(eXtensible Markup Language)のタグを用いて区切って保存する。
【0014】
次にステップST104において、アノテーション自動生成手段4により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0015】
図8は、キーワードのリストの例を示す図である。見出し項目としてT1.Aが、キーワード項目としてT1.B,T1.Cが選択されて、図5に示した検索対象データベースのテーブルに適用した場合に生成されるキーワードのリストの例を示している。T1.Aの重複を除いた実データであるa1,a2,a3ごとにキーワードを生成する。
【0016】
次にステップST105において、アノテーション自動生成手段4により、ステップST102、ST103、ST104によって生成された検索対象データベースの検索手段7のURL、検索文、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0017】
図9は、実施の形態1に係るアノテーションの例を示す図である。a1に関するアノテーションの例を示している。検索対象データベースの検索手段7のURLとして「http://sample.co.jp/getTableInfo」901を、検索文として、「SELECTT1.A,T1.B,T1.C,T1.D,T1.EFROMT1WHERET1.A=’a1’」902を、キーワードのリストとして、図7に示したテーブル名、テーブル意味情報、項目名、項目意味情報903を、見出し項目データ、キーワード項目データとして図8に示したa1に関する実データ904を含む。
【0018】
次にステップST106において、ステップST105で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0019】
次にステップST107において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置し、あるいはインターネットの検索サイトの検索エンジンを利用してもよい。
【0020】
次にステップST108において、検索対象データベース検索手段7により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。つまり、アノテーションに含まれる検索対象データベースの検索手段のURL(場所の例)により、検索対象データベース検索手段7にアクセスし、アノテーションに含まれる検索文を用いて、検索対象データベース内の該当するデータを検索する。
【0021】
たとえば、ST105で作成されたa1,a2,a3に関するアノテーションに対して、検索キーワード「a1」を指定して検索した場合には、a1に関するアノテーションが選択される。次に、a1のアノテーションに含まれる検索対象データベースの検索手段のURL「http://sample.co.jp/getTableInfo」に、検索文「SELECTT1.A,T1.B,T1.C,T1.D,T1.E FROM T1 WHERE T1.A=’a1’」を加えて参照すると、検索文に該当するレコードが検索される。一般のwebの参照と同様にURLから参照する。たとえば、検索結果をCSV形式で出力する検索対象データベースの検索手段7の出力例を図10に示す。図10は、検索結果の例を示す図である。
【0022】
以上で明らかなように、実施の形態1によれば、指定された見出し項目ごとに、内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
【0023】
実施の形態2.
図11は、実施の形態2によるデータベース検索システムを示す構成図である。
1、2、3、5、6は、実施の形態1と同様のため説明を省略する。8は、見出しデータ、キーワードデータ、出力項目名、検索場所、検索条件を含むアノテーションを自動生成するアノテーション自動生成手段、9は検索文と検索条件を入力として検索対象データベース1内の該当するデータを検索する検索対象データベース検索手段である。
【0024】
次に実施の形態2によるデータベース検索システムの動作について説明する。図12は、実施の形態2によるデータベース検索システムを示すフローチャートである。
まずステップST201において、検索文と検索条件を入力として検索対象データベースを検索する検索対象データベース検索手段7を設置してそのURLを定める。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0025】
次にステップST202において、検索文自動生成手段3により、見出し項目名、キーワード項目名、出力項目名を入力として、各項目を出力する検索対象データベース検索手段9の入力用の検索文を自動生成する。生成された検索文は、検索対象データベース検索手段9の初期化時の入力、プログラムへの組み込み等によって設定する。たとえば、検索対象データベース検索手段9がサーブレットで実現されている場合には、そのプロパティファイルで設定する。
【0026】
たとえば、図3に示す検索対象データベース1のテーブル例を用いて説明する。このデータベースはリレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.Fとする。見出し項目として、T1.Aが、キーワード項目として、T1.B,T1.Cが、出力項目名として、T1.D,T1.Eが選択されたものとする。このときの、検索文を図4に示す。各項目が、SELECT句に含まれ、検索対象のテーブルT1がFROM句に含まれ、見出し項目が、WHERE句に含まれるように、検索文を自動生成する。この検索文に具体的な見出しが検索条件として入力されると、その見出しを含むすべてのレコードが選択されることとなる。この検索文を、検索対象データベース検索手段9のプロパティファイルに設定する。
【0027】
次にステップST203において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0028】
次にステップST204において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0029】
次にステップST205において、アノテーション自動生成手段8により、ステップST202、ST203、ST204によって生成された検索対象データベースの検索手段のURL、検索条件、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0030】
図13は、実施の形態2に係るアノテーションの例を示す図である。a1に関するアノテーションを示している。検索対象データベースの検索手段のURLとして「http://sample.co.jp/getTableInfo」1301を、検索条件として、「a1」1302を、キーワードとして、図7に示したテーブル名、テーブル意味情報、項目名、項目意味情報1303を、見出し項目データ、キーワード項目データとして図8に示したa1に関する実データ1304を含む。
【0031】
次にステップST206において、ステップST205で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバ内に配置して、インターネット、イントラネット等からアクセス可能にする。
【0032】
次にステップST207において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0033】
次にステップST208において、検索対象データベース検索手段9により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。つまり、アノテーションに含まれる検索対象データベースの検索手段のURL(場所の例)により、検索対象データベース検索手段7にアクセスし、アノテーションに含まれる検索条件と先に設定されたけ検索文を用いて、検索対象データベース無いの該当するデータを検索する。
【0034】
以上のように、実施の形態2によれば、指定された見出し項目ごとに、内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索条件によって検索対象データベースを検索するように構成したので、検索対象データベースの構造、検索方法を公開することなく、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。また、検索文を改変することにより、任意のデータベース検索を行う危険を回避することができる効果を奏する。
【0035】
実施の形態3.
図14、実施の形態3によるデータベース検索システムを示す構成図である。
1、2、5、6、8、9は、実施の形態2と同様のため説明を省略する。10は、指定された見出し項目名、キーワード項目名、出力項目名に加えて、複数テーブル間の関連を指定して、検索対象データベース1を検索する検索文を自動生成する検索文自動生成手段である。
【0036】
次に実施の形態3によるデータベース検索システムの動作について説明する。図15は、実施の形態3によるデータベース検索システムを示すフローチャートである。
まずステップST301において、検索文と検索条件を入力として検索対象データベース1を検索する検索対象データベース検索手段7を設置してそのURLを定める。たとえば、Webアプリケーションサーバ内に設置して、インターネット、イントラネット等からアクセス可能にする。
【0037】
次にステップST302において、テーブル間の関連を入力に加えた検索文自動生成手段10により、見出し項目名、キーワード項目名、出力項目名、複数テーブル間の関連を入力として、各項目を出力する検索対象データベース検索手段9の入力用の検索文を自動生成する。生成された検索文は、検索対象データベース検索手段9の初期化時の入力、プログラムへの組み込み等によって設定する。たとえば、検索対象データベース検索手段9がサーブレットで実現されている場合には、そのプロパティファイルで設定する。
【0038】
図16は、検索対象データベース1のテーブル例を示す図である。このデータベースはリレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.F、テーブルT2の項目名は、T2.G,T2.Hとする。見出し項目として、T1.Aが、キーワード項目は指定なし、出力項目名として、T2.G,T2.Hが選択されたものとする。また、テーブル間関連として、T1.D=TO_CHAR(12.G,’YYYY/MM/DD’)が指定されたものとする。すなわち、見出しデータの日付データに発生したすべての事象(たとえば気温等)を検索するものとする。このときの、検索文を図17に示す。図17は、実施の形態3に係る検索文の例を示す図である。見出し項目、キーワード項目、出力項目の各項目を、SELECT句に含み、検索対象のテーブルT1,T2をFROM句に含み、見出し項目、およびテーブル間の関連を、WHERE句に含むように、検索文を自動生成する。この検索文に具体的な見出しが検索条件として入力されると、その見出しを含むすべてのレコードが選択されることとなる。この検索文を、検索対象データベース検索手段9のプロパティファイルに設定する。
【0039】
次にステップST303において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0040】
次にステップST304において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0041】
次にステップST305において、アノテーション自動生成手段8により、ステップST302、ST303、ST304によって生成された検索対象データベースの検索手段のURL、検索条件、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0042】
次にステップST306において、ステップST305で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバ内に配置して、インターネット、イントラネット等からアクセス可能にする。
【0043】
次にステップST307において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0044】
次にステップST308において、検索対象データベース検索手段9により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。
【0045】
たとえば、図15に示した検索対象データベースに対して、キーワードとして、a1が指定された場合の出力結果を図18に示す。図18は、実施の形態3に係る検索結果の例を示す図である。
【0046】
以上のように、実施の形態3によれば、指定された見出し項目ごとに、複数のテーブルの内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、テーブル、項目構造を持つデータベース内に格納された複数テーブルに格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
【0047】
尚、上述のテーブル間の関連に関する処理を実施の形態1に適用して、検索文を作成することも有効である。
【0048】
実施の形態4.
図19は、実施の形態4によるデータベース検索システムを示す構成図である。
1、2、5、6、8は、実施の形態3と同様のため説明を省略する。11は、見出し項目名、キーワード項目名、出力項目名を入力として、検索対象データベースに関するメタデータ2を検索して、上記検索対象データベース検索手段12を実現するプログラムを自動生成して検索手段とする検索対象データベース検索手段自動生成手段である。12は、検索対象データベース検索手段自動生成手段によって生成された検索対象データベース検索手段である。
【0049】
次に実施の形態4によるデータベース検索システムの動作について説明する。図20は、実施の形態4によるデータベース検索システムを示すフローチャートである。
まずステップST401において、検索対象データベース検索手段自動生成手段11により、見出し項目名、キーワード項目名、出力項目名を入力として、検索対象データベースに関するメタデータを検索して検索対象データベース1を検索する検索文を自動生成する。これは、前述の実施の形態1における検索文自動生成手段の動作と同じである。
【0050】
図21に示す例を用いて説明する。図21は、検索対象データベース1のテーブルの例である。このデータベースはリレーショナルデータベースを用いて実現されているものとする。テーブルT1の項目名は、T1.A,T1.B,T1.C,T1.D,T1.E,T1.F、テーブルT3の項目名は、T3.I,T3.Jとする。見出し項目として、T1.Aが、キーワード項目として、T1.Bが、出力項目名として、T3.Jが選択されたものとする。また、図22に示すように検索対象データベースのメタデータ2内に外部キーT1.Bの参照先が、T3.Iであるという情報が格納されているものとする。図22は、検索対象データベースのメタデータの例を示す図である。見出し項目、キーワード項目、出力項目を出力する検索文として、外部キー情報を用いて、図23のように見出しを入力条件とする検索文を生成する。図23は、検索文の例である。
【0051】
次にステップST402において、検索対象データベース検索手段自動生成手段11により、ST401で作成された検索文をプログラム内に持ち、その検索文の結果を、たとえば、CSVファイルで出力する検索対象データベース検索手段12を実現するプログラムを自動生成する。与えられた検索文を実行して、CSVファイルを出力するプログラムは容易に実現することができる。
【0052】
次に、ステップST403において、検索対象データベース検索手段自動生成手段11により、自動生成された検索対象データベースを検索する検索対象データベース検索手段12を設置してそのURLを定める。たとえば、Webアプリケーションサーバ内に設置して、インターネット、イントラネット等からアクセス可能にする。
【0053】
次にステップST404において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0054】
次にステップST405において、アノテーション自動生成手段8により、見出し項目名、キーワード項目名を入力として検索対象データベース1を検索して、同一見出しごとのキーワードを得る。
【0055】
次にステップST406において、アノテーション自動生成手段8により、ステップST403、ST404、ST405によって生成された検索対象データベースの検索手段のURL、検索条件、テーブル名、テーブル意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件としてアノテーションに含める。
【0056】
次にステップST407において、ステップST406で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバに登録して、インターネット、イントラネット等からアクセス可能にする。
【0057】
次にステップST408において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0058】
次にステップST409において、検索対象データベース検索手段12により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。
【0059】
以上のように、この実施の形態4によれば、指定された見出し項目ごとに、複数のテーブルの内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索条件によって検索対象データベースを検索する検索手段を自動生成して検索するように構成したので、テーブルと項目構造を持つデータベース内に格納された複数テーブルに格納されたデータを対象に、専用の検索対象手段を開発することなく、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
尚、実施の形態1に対して、検索対象データベース検索手段自動生成手段を適用することも有効である。
【0060】
実施の形態5.
図24は、実施の形態5によるデータベース検索システムを示す構成図である。
1,2,3,5,6,7は、実施の形態1と同様のため説明を省略する。13は、入力として見出しリストを加えたアノテーション自動生成手段である。
【0061】
次に実施の形態5によるデータベース検索システムの動作について説明する。図25は、実施の形態5によるデータベース検索システムを示すフローチャートである。
まずステップST501において、検索文を入力として検索対象データベースを検索する検索対象データベース検索手段7を設置してそのURLを定める。たとえば、Webアプリケーションサーバ内に設置して、インターネット、イントラネット等からアクセス可能にする。
【0062】
次にステップST502において、検索文自動生成手段3により、見出し項目名、見出しリスト、キーワード項目名、出力項目名を入力として、各項目を出力する検索対象データベース検索手段7の入力用の検索文を自動生成する。
【0063】
次にステップST503において、アノテーション自動生成手段13により、見出し項目名、キーワード項目名、出力項目名を入力として検索対象データベースのメタデータ2を検索してテーブルと項目の意味情報を得る。
【0064】
次にステップST504において、アノテーション自動生成手段13により、見出し項目名、見出しリスト、キーワード項目名を入力として検索対象データベース1を検索して、指定された見出しリスト内にあるデータに合致する見出しごとのキーワードを得る。
【0065】
たとえば、見出し項目としてT1.Aが、見出しリストとして、[’a1’,’a3’]が、キーワード項目としてT1.B,T1.Cが選択されて、図5に示した検索対象データベースのテーブルの例に適用した場合に、生成されるキーワードのリストの例を示す。図26は、キーワードリストの例である。T1.Aの見出しリスト内に存在するa1,a3ごとにキーワードを生成する。
【0066】
次にステップST505において、アノテーション自動生成手段13により、ステップST502、ST503、ST504によって生成された検索対象データベースの検索手段のURL、検索文、テーブル名、テーブルの意味情報、見出し項目名、キーワード項目名、出力項目名、各項目の意味情報、見出し項目データ、キーワード項目データを含むアノテーションを自動生成する。このとき、各見出しを検索条件とするよう、検索文を変換して含める。
【0067】
次にステップST506において、ステップST505で生成したアノテーションを文書ファイル検索手段6の検索対象となるように配置する。たとえば、Webアプリケーションサーバ内に配置して、インターネット、イントラネット等からアクセス可能にする。
【0068】
次にステップST507において、検索キーワードを入力として、アノテーションを検索対象に含むように、文書ファイル検索手段6により、文書を検索する。文書ファイル検索手段6は、既存の技術によって実現することができ、イントラネット内に設置する、あるいは、インターネットの検索サイトの検索エンジンを利用してもよい。
【0069】
次にステップST508において、検索対象データベース検索手段7により、検索されたアノテーションに従って検索対象データベース1を検索し、結果を出力する。
【0070】
以上のように、実施の形態5によれば、指定された見出しリストに該当する内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、意図した話題に関して、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
尚、実施の形態2に対して、見出しリストによる処理を適用することも有効である。
【0071】
【発明の効果】
本発明によれば、指定された見出し項目ごとに、内容に関するテキスト形式のアノテーションを作成し、そのアノテーションを文書ファイル検索手段から検索可能な場所に設定し、アノテーションに含まれるURL,検索文によって検索対象データベースを検索するように構成したので、テーブルと項目構造を持つデータベース内に格納されたデータを対象に、文書ファイルを検索するエンジンを用いてキーワード検索させることができる効果を奏する。
【図面の簡単な説明】
【図1】実施の形態1によるデータベース検索システムを示す構成図である。
【図2】実施の形態1によるデータベース検索システムの動作を示すフローチャートである。
【図3】検索対象データベースのテーブル例を示す図である。
【図4】検索分の例を示す図である。
【図5】検索対象データベースのテーブルに関するメタデータの例を示す図である。
【図6】検索対象データベースのテーブルの項目に関するメタデータの例を示す図である。
【図7】意味情報の検索結果の例を閉めす図である。
【図8】キーワードのリストの例を示す図である。
【図9】実施の形態1に係るアノテーションの例を示す図である。
【図10】
【図11】実施の形態2によるデータベース検索システムを示す構成図である。
【図12】実施の形態2によるデータベース検索システムを示すフローチャートである。
【図13】実施の形態2に係るアノテーションの例を示す図である。
【図14】実施の形態3によるデータベース検索システムを示す構成図である。
【図15】実施の形態3によるデータベース検索システムを示すフローチャートである。
【図16】検索対象データベース1のテーブル例を示す図である。
【図17】実施の形態3に係る検索文の例を示す図である。
【図18】実施の形態3に係る検索結果の例を示す図である。
【図19】実施の形態4によるデータベース検索システムを示す構成図である。
【図20】実施の形態4によるデータベース検索システムを示すフローチャートである。
【図21】検索対象データベース1のテーブルの例である。
【図22】検索対象データベースのメタデータの例を示す図である。
【図23】検索文の例である。
【図24】実施の形態5によるデータベース検索システムを示す構成図である。
【図25】実施の形態5によるデータベース検索システムを示すフローチャートである。
【図26】キーワードリストの例である。
【符号の説明】
1 検索対象データベース、2 メタデータ、3 検索文自動生成手段、4 アノテーション自動生成手段、5 アノテーション記憶部、6 文書ファイル検索手段、7 検索対象データベース検索手段、8 アノテーション自動生成手段、9 検索対象データベース検索手段、10 検索文自動生成手段、11 検索対象データベース検索手段自動生成手段、12 検索対象データベース検索手段、13 アノテーション自動生成手段。
Claims (5)
- 検索対象のデータを管理する検索対象データベース及び当該検索対象データベースのメタデータにアクセス可能なデータベース検索システムであり、
検索文を用いて、検索対象データベース内の該当するデータを検索する検索対象データベース検索手段と、
検索対象データベースで管理する項目のうち、見出しとなる項目を特定する見出し項目名、キーワードとなる項目を特定するキーワード項目名、出力となる項目を特定する出力項目名を入力として、検索対象データベースのメタデータを検索して、検索文を生成する検索文自動生成手段と、
前記見出し項目名、前記キーワード項目名、前記出力項目名を入力として、検索対象データベースのメタデータ及び検索対象データベースを検索して、データベース内の見出し項目の内容である見出しデータ、データベース内のキーワード項目の内容であるキーワードデータ、出力項目名、検索対象データベース検索手段の場所、及び上記検索文自動生成手段で生成された検索文を含む見出し項目ごとに対応したアノテーション文書ファイルを生成するアノテーション自動生成手段と、
アノテーション自動生成手段により生成されたアノテーション文書ファイル群から、指定された検索キーワードに該当するアノテーション文書ファイルを検索する文書ファイル検索手段とを有し、
データベース検索システムは、検索対象データベース検索手段により検索したアノテーション文書ファイルに含まれる前記場所により検索対象データベース検索手段にアクセスし、前記検索したアノテーション文書ファイルに含まれる前記検索文を用いて、検索対象データベース内の該当するデータを検索することを特徴とするデータベース検索システム。 - 検索対象のデータを管理する検索対象データベース及び当該検索対象データベースのメタデータにアクセス可能なデータベース検索システムであり、
検索文と検索条件を用いて、検索対象データベース内の該当するデータを検索する検索対象データベース検索手段と、
検索対象データベースで管理する項目のうち、見出しとなる項目を特定する見出し項目名、キーワードとなる項目を特定するキーワード項目名、出力となる項目を特定する出力項目名を入力として、検索対象データベースのメタデータを検索して、検索文と検索条件を生成し、検索文を検索対象データベース検索手段に設定する検索文自動生成手段と、
前記見出し項目名、前記キーワード項目名、前記出力項目名を入力として、検索対象データベースのメタデータ及び検索対象データベースを検索して、データベース内の見出し項目の内容である見出しデータ、データベース内のキーワード項目の内容であるキーワードデータ、出力項目名、検索対象データベース検索手段の場所、及び上記検索文自動生成手段で生成された検索条件を含む見出しごとに対応したアノテーション文書ファイルを生成するアノテーション自動生成手段と、
アノテーション自動生成手段により生成されたアノテーション文書ファイル群から、指定された検索キーワードに該当するアノテーション文書ファイルを検索する文書ファイル検索手段とを有し、
データベース検索システムは、検索対象データベース検索手段により検索したアノテーション文書ファイルに含まれる前記場所により検索対象データベース検索手段にアクセスし、前記検索したアノテーション文書ファイルに含まれる前記検索条件及び設定されている前記検索文を用いて、検索対象データベース内の該当するデータを検索することを特徴とするデータベース検索システム。 - 上記検索文自動生成手段は、検索対象データベースで管理するテーブル群について、1つ以上のテーブルの関連を入力し、入力したテーブルの関連に従って、検索文を作成することを特徴とする請求項1または請求項2いずれかに記載のデータベース検索システム。
- データベース検索システムは、
前記検索文自動生成手段として動作し、更に、前記検索対象データベース検索手段を実現するプログラムを自動生成し、生成したプログラムを検索手段として設置する検索対象データベース検索手段自動生成手段を有することを特徴とする請求項1または請求項2に記載のデータベース検索システム。 - 上記アノテーション自動生成手段は、前記見出し項目名、キーワード項目名、及び出力項目名に加えて、見だし項目のリストである見出しリストを入力として、見出しリストに含まれる見出し項目に対応するアノテーション文書ファイルのみを作成することを特徴とする請求項1または2のいずれかに記載のデータベース検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003177828A JP2005018118A (ja) | 2003-06-23 | 2003-06-23 | データベース検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003177828A JP2005018118A (ja) | 2003-06-23 | 2003-06-23 | データベース検索システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005018118A true JP2005018118A (ja) | 2005-01-20 |
Family
ID=34179634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003177828A Pending JP2005018118A (ja) | 2003-06-23 | 2003-06-23 | データベース検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005018118A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016512634A (ja) * | 2013-02-27 | 2016-04-28 | ヒタチ データ システムズ コーポレーションHitachi Data Systems Corporation | オブジェクトストレージインデキシングシステムのためのコンテンツクラス |
KR20190139735A (ko) * | 2018-06-08 | 2019-12-18 | 김영태 | 논리연산 입력테이블에 입력된 키워드를 이용한 데이터 검색 및 정렬방법과 그 시스템 |
-
2003
- 2003-06-23 JP JP2003177828A patent/JP2005018118A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016512634A (ja) * | 2013-02-27 | 2016-04-28 | ヒタチ データ システムズ コーポレーションHitachi Data Systems Corporation | オブジェクトストレージインデキシングシステムのためのコンテンツクラス |
KR20190139735A (ko) * | 2018-06-08 | 2019-12-18 | 김영태 | 논리연산 입력테이블에 입력된 키워드를 이용한 데이터 검색 및 정렬방법과 그 시스템 |
KR102079872B1 (ko) * | 2018-06-08 | 2020-02-20 | 김영태 | 논리연산 입력테이블에 입력된 키워드를 이용한 데이터 검색 및 정렬방법과 그 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10275434B1 (en) | Identifying a primary version of a document | |
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
KR101323187B1 (ko) | 사용자에 의해 입력된 정보를 통합하여 검색하는 방법과시스템 | |
US9164987B2 (en) | Translating a search query into multiple languages | |
US6094649A (en) | Keyword searches of structured databases | |
US7240052B2 (en) | Refinement of a search query based on information stored on a local storage medium | |
US20070162459A1 (en) | System and method for creating searchable user-created blog content | |
JP2014222538A (ja) | 索引キーを使用して検索を絞込むシステムおよび方法 | |
US8290928B1 (en) | Generating sitemap where last modified time is not available to a network crawler | |
US7685130B2 (en) | Searching for services in natural language | |
JP5221664B2 (ja) | 情報マップ管理システムおよび情報マップ管理方法 | |
US9529922B1 (en) | Computer implemented systems and methods for dynamic and heuristically-generated search returns of particular relevance | |
US8001138B2 (en) | Word relationship driven search | |
Hughes et al. | A metadata search engine for digital language archives | |
US8131752B2 (en) | Breaking documents | |
JP2005018118A (ja) | データベース検索システム | |
Rafes et al. | A platform for scientific data sharing | |
JP4034503B2 (ja) | 文書検索システムおよび文書検索方法 | |
KR100909470B1 (ko) | 멀티미디어 컨텐츠 검색 방법 및 시스템 | |
JP2009043288A (ja) | コミュニティ依存型情報検索システム及び方法 | |
JP2006236254A (ja) | コミュニティ依存型情報検索システム及び方法 | |
MUKHERJEE | Developing and integration of an online thesaurus: with special reference to LGBTQIA related terms | |
JP2004348586A (ja) | 分散データ統合システム | |
JP2003281160A (ja) | メタデータ作成システム、メタデータ作成方法、メタデータ作成プログラムおよび記録媒体 | |
Palmer | CSE 400 Professor: Camillo J. Taylor Advisor: Pat Palmer April 11, 2005 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041026 |