JP3567861B2 - 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 - Google Patents

情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 Download PDF

Info

Publication number
JP3567861B2
JP3567861B2 JP2000207563A JP2000207563A JP3567861B2 JP 3567861 B2 JP3567861 B2 JP 3567861B2 JP 2000207563 A JP2000207563 A JP 2000207563A JP 2000207563 A JP2000207563 A JP 2000207563A JP 3567861 B2 JP3567861 B2 JP 3567861B2
Authority
JP
Japan
Prior art keywords
information
database
data value
end user
location estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000207563A
Other languages
English (en)
Other versions
JP2002024262A (ja
Inventor
史朗 春日
源吾 鈴木
裕一 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000207563A priority Critical patent/JP3567861B2/ja
Publication of JP2002024262A publication Critical patent/JP2002024262A/ja
Application granted granted Critical
Publication of JP3567861B2 publication Critical patent/JP3567861B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体に係り、特に、ネットワーク上に複数存在する情報源を、エンドユーザがそれらの内容を知らなくても、キーワードにより所在を推定し、それらを統合した検索を行う情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】
ネットワーク上に複数存在するデータベース、文書中の箇条書き、CSV形式のように、定型的なデータ構造を持つデータをエンドユーザが簡単なインタフェースで所在を探索し、検索を行いたいという要求が高まっている。インターネットの上のWebページに対する情報の所在探索技術としては、ロボット型のサーチエンジンが挙げられる。
【0003】
また、特開平10−143539に開示されている「情報検索方法及びシステム」では、ユーザの入力したキーワードから、情報源のカラム名(または、その同義語)から、情報源の所在を探索することが可能である。
【0004】
例として、「相撲力士検索」DBがあり、その中に「力士」テーブルがあり、その中に「力士名」カラムがあったとき、ユーザは、当該システムに“力士名”とだけ入力することで、「相撲力士検索」DBの「力士」テーブルの「力士名」カラムの所在を得ることができる。
【0005】
【発明が解決しようとする課題】
しかしながら、上記銃等のロボット型サーチエンジンでは、以下のような問題がある。
【0006】
▲1▼ データベースなどの情報は、予めWebページに変換して、公開されている必要がある。
【0007】
▲2▼ 検索結果としては、情報の所在しか返さない。
【0008】
▲3▼ 複数の情報源の検索結果を、統合することが出来ない。
【0009】
また、上記の特開平10−143539「情報検索方法及びシステム」には、以下のような問題がある。
【0010】
▲1▼ 情報源のデータ値(情報源の持つ情報の人名「山田太郎」や数量「1000」などの実際の値)から所在を探索することができない。
【0011】
例えば、「相撲力士検索」DBがあり、その中に「力士」テーブルがあり、その中に「力士名」カラムがあったとき、ユーザは、当該システムに“貴乃花”という力士名を入力しても、情報の所在を得ることができない。これは、当該システムが情報源のデータ値を所在を探索する手掛かりにしていないためである。
【0012】
▲3▼ 複数の情報の所在があったとき、それぞれが、どの程度ユーザの意図に合致しているかわからない。
【0013】
本発明は、上記の点に鑑みなされたもので、情報源のデータ値から情報源の所在を探索することを可能とし、複数の情報源があったとき、ユーザの意図に合致している程度の高いものから提示することが可能な情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体を提供することを目的とする。
【0014】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0015】
発明は入力されたキーワードにより、ネットワーク上に複数存在するデータベースの所在を推定する情報源所在推定方法において、
ネットワーク上のデータベースから該データベースが保持するデータ値を読み出して、該データ値と、該データ値をデータ表現形式の情報を用いて別の表現に変換した様々な別表現形式、及び、入力された複数のデータベースシステムにアクセスするための該データ値の参照情報から所在推定情報を生成して、予め単一の情報資源辞書に登録するデータ登録ステップと(ステップ1)
エンドユーザから複数のキーワードが入力されると(ステップ2)、該複数のキーワードを用いて、情報資源辞書から該キーワードに関連する所在推定情報を検索し、該所在推定情報の集合をエンドユーザに返却する推定ステップと(ステップ3)、を行い、
推定ステップにおいて、
エンドユーザにより指定されたキーワードと、データベースから読み出したデータ値、データ値の様々な別表現形式、該データベースのカラム名の同義語、該データベースのスキーマの説明文の間で適合度を計算し、複数のデータベースの所在推定情報を適合度の高いものから該エンドユーザに提示する。
【0020】
図2は、本発明の原理構成図である。
【0021】
本発明は入力されたキーワードにより、ネットワーク上に複数存在するデータベースの所在を推定する情報源所在推定装置であって
単一の情報資源辞書220と、
ネットワーク上のデータベースから該データベースが保持するデータ値を読み出して、該データ値と、該データ値をデータ表現形式の情報を用いて別の表現に変換した様々な別表現形式、及び、入力された複数のデータベースシステムにアクセスするための該データ値の参照情報から所在推定情報を生成して、予め単一の情報資源辞書に登録するデータ登録手段240と、
エンドユーザから複数のキーワードが入力されると、該複数のキーワードに基づいて、情報資源辞書220を検索し、検索された所在推定情報の集合をエンドユーザに返却する推定手段210と、を有し、
推定手段210は、
エンドユーザにより指定されたキーワードと、データベース300から読み出したデータ値、データ値の様々な別表現形式、該データベースのカラム名の同義語、該データベースのスキーマの説明文の間で適合度を計算し、複数のデータベースの所在推定情報を適合度の高いものから該エンドユーザに提示する手段を含む
【0026】
本発明は、入力されたキーワードにより、ネットワーク上に複数存在するデータベースの所在を推定する情報源所在推定プログラムを格納した記憶媒体であって、
コンピュータに、
ネットワーク上のデータベースから該データベースが保持するデータ値を読み出して、該データ値と、該データ値をデータ表現形式の情報を用いて別の表現に変換した様々な別表現形式、及び、入力された複数のデータベースシステムにアクセスするための該データ値の参照情報から所在推定情報を生成して、予め単一の情報資源辞書に登録するデータ登録ステップと、
エンドユーザから複数のキーワードが入力されると、該複数のキーワードを用いて、情報資源辞書から該キーワードに関連する所在推定情報を検索し、該所在推定情報の集合をエンドユーザに返却するステップと、を実行させ、
推定ステップは、
エンドユーザにより指定されたキーワードと、データベースから読み出したデータ値、該データ値の様々な別表現形式、該データベースのカラム名の同義語、該データベースのスキーマの説明文の間で適合度を計算し、複数のデータベースの所在推定情報を適合度の高いものから該エンドユーザに提示するステップを実行させるプログラムを格納した記憶媒体である。
【0031】
上記のように、本発明では、複数の情報源のデータ値(情報源の持つ情報の人名「山田太郎」や数量「1000」などの実際の値)や、情報源のスキーマ等を、その参照情報と共に、予め辞書に登録し、この辞書を用いて情報源の所在を探索することが可能となる。
【0032】
また、単一の辞書にデータ値と共に参照情報を登録することで、エンドユーザは、キーワードの表現形式を意識することなく、情報源の所在推定を行うことが可能となる。
【0033】
また、本発明は、所在情報の候補集合における個々の候補について適合率を算出し、その降順にソートした候補集合をエンドユーザに提示することが可能となる。
【0034】
【発明の実施の形態】
以下では、特開平10−143539「情報検索方法及びシステム」(以下、DBSENA)を異種情報源検索装置として用いた場合の実施形態を示す。
【0035】
図3は、本発明の検索装置の構成を示す。
【0036】
同図に示すシステムは、エンドユーザが操作するアプリケーション100と、情報を検索する異種情報源検索装置200、及び情報源300より構成される。異種情報源検索装置200は、所在推定部210、情報源辞書220、統合検索部230、データ値収集部240から構成される。
【0037】
情報源300は、リレーショナルデータベースや、スキーマをリレーションに変換した文書データベース、画像データベース、Webページなどである。
【0038】
情報資源辞書220には、情報300に関する以下の情報を蓄積することができる。1つは、参照情報であり、もう1つは、所在推定情報である。
【0039】
参照情報は、以下のような情報が含まれる。
【0040】
・アクセス情報:
当該アクセス情報には、個々の情報源300にアクセスするためのサーバ名、データベース名、ログイン名、パスワードが含まれる。
【0041】
・スキーマ:
当該スキーマとして、個々の情報源300のテーブル名、カラム名、テーブル間の関連が含まれる。
【0042】
・スキーマの説明文:
スキーマの説明文には、テーブルの説明文、カラムの説明文がある。
【0043】
・カラム名の同義語:
当該カラム名の同義語には、前述のカラム名に対する様々な言い換え(同義語)がある。
【0044】
・データの表現形式:
データ表現形式は、個々の情報源300のデータ値の表現形式と変換ルールである。データ値の表現形式は、変換ルールに従って、他の表現形式(別表現)に変換できる。
【0045】
所在推定情報は、以下のような情報が含まれる。
【0046】
テーブル名、カラム名、カラム名の同義語、テーブル説明文、カラム説明文、各カラムのデータ値とデータ値の別表現から情報源300の所在を特定するための情報である。
【0047】
以下に、図3におけるシステムの動作を説明する。
【0048】
図4は、本発明の処理の概要を示すフローチャートである。
【0049】
ステップ100) 管理者による「参照情報」の登録処理:
異種情報源検索装置200の管理者は、情報源300の「参照情報」を、情報資源辞書220に登録する。
【0050】
ステップ200) エンドユーザによる情報源の所在推定処理:
異種情報源検索装置200のエンドユーザは、アプリケーションプログラム100を通して、所在推定部210にキーワードを入力し、キーワードに関連のある情報源300の所在推定を行わせ、複数の「所在情報」の候補を得る。
【0051】
ステップ300) エンドユーザによる情報統合検索処理:
異種情報源検索装置200のエンドユーザは、ステップ200で得られた複数の「所在情報」の候補から、希望のものを選び出し、統合検索部230に渡す。統合検索部230は、「所在情報」を元に情報源300からデータを検索し、複数の検索結果を統合し、統合された検索結果をエンドユーザに渡す。
【0052】
次に、上記のステップ100の管理者による「参照情報」の登録手順を説明する。
【0053】
図5は、本発明の参照情報の登録手順のフローチャートである。
【0054】
ステップ101) 情報源300として、リレーショナルデータベースが配置されている。
【0055】
ステップ102) 管理者は、情報源300の「参照情報」を、情報資源辞書220に登録する。
【0056】
ステップ103) 管理者は、データ値収集部240を用いて、各カラムのデータ値を情報源300より読出し、さらに、データ値をデータ表現形式の情報を用いてデータ値の別表現に変換する。次に、前述の参照情報(テーブル名、カラム名、カラム名の同義語、テーブル説明文、カラム説明文)、データ値とデータ値の別表現を用いて、情報源300の所在を特定する「所在推定情報」を作成し、情報資源辞書220に蓄積する。なお、各カラムのデータ値は、膨大な量であるので、管理者が所在推定に必要であると判断したもののみを蓄積の対象とする。
【0057】
次に、上記のステップ200のエンドユーザによる情報源300の所在推定手順を説明する。
【0058】
図6は、本発明の情報源の所在推定手順のフローチャートである。
【0059】
ステップ201) エンドユーザは、アプリケーションプログラム100を通して、所在推定部210に複数のキーワードを入力する。
【0060】
ステップ202) 所在推定部210は、情報源辞書220の所在推定情報を用い、複数のキーワードから、そのキーワードと関連のある情報源300の所在の集合をキーワード毎に特定する。
【0061】
ステップ203) キーワード毎の情報源300の所在の集合を、キーワード数分組み合わせて、キーワードに関連する情報源の所在を示す「所在情報」の候補集合を作成する。このとき、テーブル間の結合方法がなく、検索ができない候補は排除する。
【0062】
ステップ204) 前述の個々の候補を、評価関数により評価し、適合率を算出する。
【0063】
ステップ205) 前述の候補集合を、適合率に従って並べ替える。
【0064】
ステップ206) 所在推定部210は、「所在情報」の候補集合をアプリケーションプログラム100を通して、エンドユーザに返却する。
【0065】
次に、上記のステップ300のエンドユーザによる情報の統合検索手順を説明する。
【0066】
図7は、本発明のエンドユーザによる統合検索手順のフローチャートである。
ステップ301) エンドユーザは、アプリケーションプログラム100を通して、任意の候補(所在情報)を入力する。
【0067】
ステップ302) 統合検索部230は、「所在情報」を元に、情報源300を特定し、情報検索命令文を発行する。このとき、キーワードがテーブルを指している場合は、テーブル自体を返却する。カラムの場合は、指定のカラムを返却する。データ値の場合は、データ値を含むカラムに対して、指定のデータ値のみを返却するような条件指定を情報検索命令文に付加して検索を実行する。また、複数の情報源300を跨がる結合を行う場合は、複数の情報源300へ情報検索命令文を発行し、統合検索部230において複数の検索結果を結合する。
【0068】
ステップ303) 情報源300から返却された検索結果をアプリケーションプログラム100を通してエンドユーザに返却する。
【0069】
【実施例】
以下、図面及び表に基づいて本発明の実施例を説明する。
【0070】
最初に、管理者による参照情報の例を図5に基づいて説明する。
【0071】
ステップ101)情報源300として、例えば、以下の3つの情報源300が存在するとする。なお、以下では、任意のテーブルを表すのに、「データベース名、テーブル名」、任意のカラムを表すのに「データベース名、テーブル名、カラム名」という表記を用いる。以下、図3に示す情報源300aを自動車DB▲1▼、情報源300bを自動車DB▲2▼、情報源300cを自動車DB▲3▼として説明する。
【0072】
・情報源300a(自動車DB▲1▼)は、以下のテーブルを持つ。
【0073】
【表1】
Figure 0003567861
・情報源300b(自動車DB▲2▼)は、以下の2つのテーブルを持つ。なお、「自動車DB▲2▼.自動車.ID」と「自動車DB▲2▼.販売.ID」に関連(リンク)が張られている。
【0074】
【表2】
Figure 0003567861
・情報源300c(自動車DB▲3▼)は以下のテーブルを持つ。
【0075】
【表3】
Figure 0003567861
ステップ102) 参照情報の登録:
管理者は、以下の「参照情報」を情報資源辞書220に登録する。
【0076】
情報源300aについて、情報資源辞書220に以下の「参照情報」を登録する。
【0077】
・アクセス情報
サーバ名:server1,ログイン名:user1,パスワード:********
・スキーマ
情報源300aのテーブル名、全てのカラム名
・データ値の別表現
【0078】
【表4】
Figure 0003567861
・所在推定辞書にデータ値を登録するカラム
【0079】
【表5】
Figure 0003567861
情報源300bについて、情報資源辞書220に以下の「参照情報」を登録する。
【0080】
・アクセス情報
サーバ名:server2,ログイン名:user2,パスワード:********
・スキーマ
情報源300bのテーブル名、全てのカラム名、関連(リンク)
・所在推定辞書にデータ値を登録するカラム
【0081】
【表6】
Figure 0003567861
情報源300cについて、情報資源辞書220に以下の「参照情報」を登録する。
【0082】
・アクセス情報
サーバ名:server3,ログイン名:user3,パスワード:********
・スキーマ
情報源300cのテーブル名、全てのカラム名
・説明文
【0083】
【表7】
Figure 0003567861
・カラム名の同義語
【0084】
【表8】
Figure 0003567861
・所在推定辞書にデータ値を登録するカラム
【0085】
【表9】
Figure 0003567861
ステップ103) 所在推定情報の登録:
データ値収集部240は、情報資源辞書220に登録された「参照情報」と情報源300からデータ値を読出し、「所在推定情報」を作成し、情報資源辞書220に登録する。以下に作成される「所在推定情報」の例を示す。
【0086】
【表10】
Figure 0003567861
次に、エンドユーザによる情報源の所在推定処理について図6に基づいて説明する。
【0087】
ステップ201) エンドユーザによるキーワード指定:
エンドユーザによるキーワードを以下とする。
【0088】
【表11】
Figure 0003567861
ステップ202) 所在推定:
所在推定部210により、情報資源辞書220の「所在推定情報」を元に、所在推定が行われる。所在推定は、エンドユーザによるキーワードと、「所在推定情報」のキーワード項目の文字列比較により、適合したものを抜き出す操作である。ユーザの入力キーワードが、情報資源辞書220上のキーワードの一部に一致すれば、適合したものと見做す。抜き出された「所在推定情報」を以下に示す。
【0089】
【表12】
Figure 0003567861
ステップ203) 候補作成:
ステップ202で抜き出された「所在推定情報」を同一テーブル内であるか、テーブル間で関連が存在し、データとして纏められるものを候補としてグループ化する。
【0090】
【表13】
Figure 0003567861
ステップ204) 適合率算出:
エンドユーザにより入力されたキーワードと、各候補間の適合率を算出する。適合率の算出例を以下に示す。
【0091】
・ヒット率(h)の導出
ヒット率は、入力キーワード中のヒットした数の割合である。
【0092】
a.対応リソース係数(r)
対象リソース係数は、キーワードがヒットした対象の文字列の種類による係数である。対応リソース係数の一覧を以下に示す。
【0093】
【表14】
Figure 0003567861
b.文字列マッチ率(m)
文字列マッチ率は、入力キーワードが辞書上のキーワード文字列に対して、どの程度マッチしたかを示す。文字列マッチ率の導出式を以下に示す。
【0094】
【数1】
Figure 0003567861
以上から、ヒット率は以下のように示される。
【0095】
【数2】
Figure 0003567861
c.分散率(d)
分散率は、データセット・情報源をまたがる度合いである。
【0096】
候補が含むデータセットの数:D
候補が含む情報源の数:I
と置くと、分散率は、以下のように示される。
【0097】
【数3】
Figure 0003567861
ヒット率、分散率より、適合率は、以下のように算出される。θはヒット率と分散率の重みを調整するパラメータである。ここでは、θ=45°を用いる。
【0098】
【数4】
Figure 0003567861
例として、候補Aの適合率を算出すると、
【0099】
【数5】
Figure 0003567861
前述の適合率算出方法により得られる適合率を以下に示す。
【0100】
【表15】
Figure 0003567861
ステップ205) 適合率による並び替え:
次に、適合率について降順にソートし、以下の候補集合を作成する。同じ適合率の候補の順番は特に規定しないが、ここでは、前述の候補集合における出現順とした。
【0101】
【表16】
Figure 0003567861
ステップ206) 候補集合の返却:
所在推定部210は、アプリケーションプログラム100に対し、候補集合を返却し、処理を終了する。
【0102】
次に、エンドユーザにより統合検索処理について図7に基づいて説明する。
【0103】
ステップ301) 候補の選択:
選択された候補は、統合検索部230を用いて、実際にデータ値の検索が行われる。例として、以下では、候補Bが選択された場合の検索実行結果を示す。
【0104】
ステップ302) 検索の実行:
選択された候補Bの検索実行において、以下の情報検索命令文が情報源300bへ適応される。
【0105】
【表17】
Figure 0003567861
ステップ303) 結果の返却:
候補Bの検索結果として、下記の表が返却されて処理を終了する。
【0106】
【表18】
Figure 0003567861
また、上記の実施例では、図3の構成に基づいて説明しているが、図3の異種情報源検索装置の各構成要素をプログラム(モジュール)として構築し、検索装置として利用されるコンピュータに接続されるディスク装置や、フロッピーディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現できる。
【0107】
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【0108】
【発明の効果】
上述のように、本発明では、ネットワーク上に複数存在する情報源を、エンドユーザがそれらの内容を知らなくても、キーワード(データ値)により所在を推定し、それらを統合した検索を行うことができる。
【0109】
更に、複数の情報源があったとき、ユーザの意図に合致している程度の高いものから提示することができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の検索装置の構成図である。
【図4】本発明の処理の概要を示すフローチャートである。
【図5】本発明の参照情報の登録手順のフローチャートである。
【図6】本発明の情報源の所在推定手順のフローチャートである。
【図7】本発明のエンドユーザによる統合検索手順のフローチャートである。
【符号の説明】
100 アプリケーションプログラム
200 所在推定装置、異種情報源検索装置
210 推定手段、所在推定部
220 辞書、情報資源辞書
230 統合検索部
240 データ値収集部、データ登録手段
300 情報源

Claims (3)

  1. 入力されたキーワードにより、ネットワーク上に複数存在するデータベースの所在を推定する情報源所在推定方法において、
    前記ネットワーク上の前記データベースから該データベースが保持するデータ値を読み出して、該データ値と、該データ値をデータ表現形式の情報を用いて別の表現に変換した様々な別表現形式、及び、入力された複数のデータベースシステムにアクセスするための該データ値の参照情報から所在推定情報を生成して、予め単一の情報資源辞書に登録するデータ登録ステップと、
    エンドユーザから複数のキーワードが入力されると、該複数のキーワードを用いて、前記情報資源辞書から該キーワードに関連する所在推定情報を検索し、該所在推定情報の集合を前記エンドユーザに返却する推定ステップと、を行い、
    前記推定ステップにおいて、
    前記エンドユーザにより指定された前記キーワードと、前記データベースから読み出したデータ値、前記データ値の様々な別表現形式、該データベースのカラム名の同義語、該データベースのスキーマの説明文の間で適合度を計算し、複数のデータベースの所在推定情報を適合度の高いものから該エンドユーザに提示することを特徴とする情報源所在推定方法。
  2. 入力されたキーワードにより、ネットワーク上に複数存在するデータベースの所在を推定する情報源所在推定装置であって
    単一の情報資源辞書と、
    前記ネットワーク上の前記データベースから該データベースが保持するデータ値を読み出して、該データ値と、該データ値をデータ表現形式の情報を用いて別の表現に変換した様々な別表現形式、及び、入力された複数のデータベースシステムにアクセスするための該データ値の参照情報から所在推定情報を生成して、予め単一の情報資源辞書に登録するデータ登録手段と、
    エンドユーザから複数のキーワードが入力されると、該複数のキーワードに基づいて、前記情報資源辞書を検索し、検索された所在推定情報の集合を前記エンドユーザに返却する推定手段と、を有し、
    前記推定手段は、
    前記エンドユーザにより指定された前記キーワードと、前記データベースから読み出したデータ値、前記データ値の様々な別表現形式、該データベースのカラム名の同義語、該データベースのスキーマの説明文の間で適合度を計算し、複数のデータベースの所在推定情報を適合度の高いものから該エンドユーザに提示する手段を含むことを特徴とする情報源所在推定装置。
  3. 入力されたキーワードにより、ネットワーク上に複数存在するデータベースの所在を推定する情報源所在推定プログラムを格納した記憶媒体であって、
    コンピュータに、
    前記ネットワーク上の前記データベースから該データベースが保持するデータ値を読み出して、該データ値と、該データ値をデータ表現形式の情報を用いて別の表現に変換した様々な別表現形式、及び、入力された複数のデータベースシステムにアクセスするための該データ値の参照情報から所在推定情報を生成して、予め単一の情報資源辞書に登録するデータ登録ステップと、
    エンドユーザから複数のキーワードが入力されると、該複数のキーワードを用いて、前記情報資源辞書から該キーワードに関連する所在推定情報を検索し、該所在推定情報の集合を前記エンドユーザに返却するステップと、を実行させ、
    前記推定ステップは、
    前記エンドユーザにより指定された前記キーワードと、前記データベースから読み出し たデータ値、前記データ値の様々な別表現形式、該データベースのカラム名の同義語、該データベースのスキーマの説明文の間で適合度を計算し、複数のデータベースの所在推定情報を適合度の高いものから該エンドユーザに提示するステップを実行させるプログラムを格納したことを特徴とする情報源所在推定プログラムを格納した記憶媒体。
JP2000207563A 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 Expired - Lifetime JP3567861B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000207563A JP3567861B2 (ja) 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000207563A JP3567861B2 (ja) 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JP2002024262A JP2002024262A (ja) 2002-01-25
JP3567861B2 true JP3567861B2 (ja) 2004-09-22

Family

ID=18704311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000207563A Expired - Lifetime JP3567861B2 (ja) 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3567861B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100899850B1 (ko) 2003-09-15 2009-05-27 아브 이니티오 소프트웨어 엘엘시 데이터 프로파일링
JP5326303B2 (ja) * 2008-03-10 2013-10-30 富士通株式会社 統合装置、統合プログラム、統合方法
AU2012211167B2 (en) 2011-01-28 2014-08-21 Ab Initio Technology Llc Generating data pattern information
US9147195B2 (en) 2011-06-14 2015-09-29 Microsoft Technology Licensing, Llc Data custodian and curation system
US9244956B2 (en) * 2011-06-14 2016-01-26 Microsoft Technology Licensing, Llc Recommending data enrichments
EP3657348B1 (en) 2012-10-22 2021-12-01 AB Initio Technology LLC Profiling data with source tracking
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04291668A (ja) * 1991-03-20 1992-10-15 Mitsubishi Electric Corp 検索装置
JPH086964A (ja) * 1994-06-15 1996-01-12 Mitsubishi Electric Corp データベース検索装置

Also Published As

Publication number Publication date
JP2002024262A (ja) 2002-01-25

Similar Documents

Publication Publication Date Title
US6665837B1 (en) Method for identifying related pages in a hyperlinked database
US8332422B2 (en) Using text search engine for parametric search
Paliwal et al. Semantics-based automated service discovery
US9378285B2 (en) Extending keyword searching to syntactically and semantically annotated data
US6546388B1 (en) Metadata search results ranking system
EP1012750B1 (en) Information retrieval
US6182063B1 (en) Method and apparatus for cascaded indexing and retrieval
US8060501B1 (en) Document ranking based on semantic distance between terms in a document
US7092936B1 (en) System and method for search and recommendation based on usage mining
US7720870B2 (en) Method and system for quantifying the quality of search results based on cohesion
KR100813806B1 (ko) 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법
US7966332B2 (en) Method of generating a distributed text index for parallel query processing
US20030018621A1 (en) Distributed information search in a networked environment
US20090299978A1 (en) Systems and methods for keyword and dynamic url search engine optimization
US20070094250A1 (en) Using matrix representations of search engine operations to make inferences about documents in a search engine corpus
CN101567011A (zh) 文档处理装置和文档处理方法
US6941293B1 (en) Methods and apparatus for determining equivalent descriptions for an information need
JP3567861B2 (ja) 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体
Yu et al. A methodology to retrieve text documents from multiple databases
KR20030075219A (ko) 벡터문서모델을 이용한 동일/유사제품 클러스트링 장치 및그 방법
JP3565117B2 (ja) 複数異種情報源アクセス方法及びクライアント装置及び複数異種情報源アクセスプログラムを格納した記憶媒体
JP2003271648A (ja) 検索装置、検索方法、ならびに、プログラム
KR20140094994A (ko) 비일시적 검색 제공 방법과 시스템 및 컴퓨터 디바이스
US20080021875A1 (en) Method and apparatus for performing a tone-based search
Lee et al. Geographically-sensitive link analysis

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040607

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3567861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140625

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term