JP2002024262A - 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 - Google Patents

情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Info

Publication number
JP2002024262A
JP2002024262A JP2000207563A JP2000207563A JP2002024262A JP 2002024262 A JP2002024262 A JP 2002024262A JP 2000207563 A JP2000207563 A JP 2000207563A JP 2000207563 A JP2000207563 A JP 2000207563A JP 2002024262 A JP2002024262 A JP 2002024262A
Authority
JP
Japan
Prior art keywords
information source
information
data value
location
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000207563A
Other languages
English (en)
Other versions
JP3567861B2 (ja
Inventor
Shiro Kasuga
史朗 春日
Gengo Suzuki
源吾 鈴木
Yuichi Iizuka
裕一 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000207563A priority Critical patent/JP3567861B2/ja
Publication of JP2002024262A publication Critical patent/JP2002024262A/ja
Application granted granted Critical
Publication of JP3567861B2 publication Critical patent/JP3567861B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 情報源のデータ値から情報毛の所在を探索す
ることを可能とし、複数の情報源があったとき、ユーザ
の意図に合致している程度の高いものから提示すること
が可能な情報源所在推定方法及び装置及び情報源所在推
定プログラムを格納した記憶媒体を提供する。 【解決手段】 本発明は、複数の情報源の保持するデー
タ値を、該データ値の参照情報と共に、予め単一の辞書
に登録し、エンドユーザからキーワードが入力される
と、該キーワードに関連する情報源の所在を、辞書を用
いて情報源の保持するデータ値から推定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報源所在推定方
法及び装置及び情報源所在推定プログラムを格納した記
憶媒体に係り、特に、ネットワーク上に複数存在する情
報源を、エンドユーザがそれらの内容を知らなくても、
キーワードにより所在を推定し、それらを統合した検索
を行う情報源所在推定方法及び装置及び情報源所在推定
プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】ネットワーク上に複数存在するデータベ
ース、文書中の箇条書き、CSV形式のように、定型的
なデータ構造を持つデータをエンドユーザが簡単なイン
タフェースで所在を探索し、検索を行いたいという要求
が高まっている。インターネットの上のWebページに
対する情報の所在探索技術としては、ロボット型のサー
チエンジンが挙げられる。
【0003】また、特開平10−143539に開示さ
れている「情報検索方法及びシステム」では、ユーザの
入力したキーワードから、情報源のカラム名(または、
その同義語)から、情報源の所在を探索することが可能
である。
【0004】例として、「相撲力士検索」DBがあり、
その中に「力士」テーブルがあり、その中に「力士名」
カラムがあったとき、ユーザは、当該システムに“力士
名”とだけ入力することで、「相撲力士検索」DBの
「力士」テーブルの「力士名」カラムの所在を得ること
ができる。
【0005】
【発明が解決しようとする課題】しかしながら、上記銃
等のロボット型サーチエンジンでは、以下のような問題
がある。
【0006】 データベースなどの情報は、予めWe
bページに変換して、公開されている必要がある。
【0007】 検索結果としては、情報の所在しか返
さない。
【0008】 複数の情報源の検索結果を、統合する
ことが出来ない。
【0009】また、上記の特開平10−143539
「情報検索方法及びシステム」には、以下のような問題
がある。
【0010】 情報源のデータ値(情報源の持つ情報
の人名「山田太郎」や数量「1000」などの実際の
値)から所在を探索することができない。
【0011】例えば、「相撲力士検索」DBがあり、そ
の中に「力士」テーブルがあり、その中に「力士名」カ
ラムがあったとき、ユーザは、当該システムに“貴乃
花”という力士名を入力しても、情報の所在を得ること
ができない。これは、当該システムが情報源のデータ値
を所在を探索する手掛かりにしていないためである。
【0012】 複数の情報の所在があったとき、それ
ぞれが、どの程度ユーザの意図に合致しているかわから
ない。
【0013】本発明は、上記の点に鑑みなされたもの
で、情報源のデータ値から情報源の所在を探索すること
を可能とし、複数の情報源があったとき、ユーザの意図
に合致している程度の高いものから提示することが可能
な情報源所在推定方法及び装置及び情報源所在推定プロ
グラムを格納した記憶媒体を提供することを目的とす
る。
【0014】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。
【0015】本発明(請求項1)は、ネットワーク上に
複数存在する情報源を、キーワードにより所在を推定す
る情報源所在推定方法において、複数の情報源の保持す
るデータ値を、複数のデータベースシステムにアクセス
するための該データ値の参照情報と共に、予め単一の辞
書に登録し(ステップ1)、エンドユーザからキーワー
ドが入力されると(ステップ2)、該キーワードに関連
する情報源の所在を、辞書を用いて情報源の保持するデ
ータ値から推定する(ステップ3)。
【0016】本発明(請求項2)は、情報源の保持する
1つのデータ値を、複数の表現形式に変換し、該データ
値の参照情報と共に、予め単一の辞書に登録する。
【0017】本発明(請求項3)は、情報源のスキーマ
の説明文を、該説明文の参照情報と共に予め単一の辞書
に登録する。
【0018】本発明(請求項4)は、情報源の保持する
データ値と、該情報源の保持するデータ値の様々な別表
現形式と、該情報源のスキーマと、該情報源のカラム名
の同義語と、該情報源のスキーマの説明文の任意の組み
合わせを、参照情報と共に、予め単一の辞書に登録す
る。
【0019】本発明(請求項5)は、エンドユーザの指
定したキーワードと、情報源の保持するデータ値・情報
源の保持するデータ値の様々な別表現形式・情報源のカ
ラム名の同義語・情報源のスキーマの説明文の間で適合
度を計算し、複数の情報源をユーザの要求の適合度の高
いものから提示する。
【0020】図2は、本発明の原理構成図である。
【0021】本発明(請求項6)は、ネットワーク上に
複数存在する情報源を、キーワードにより所在を推定す
る情報源所在推定装置において、単一の辞書220と、
複数の情報源の保持するデータ値を、複数のデータベー
スシステムにアクセスするための該データ値の参照情報
と共に、予め単一の辞書220に登録するデータ登録手
段240と、エンドユーザからキーワードが入力される
と、該キーワードに関連する情報源の所在を、辞書22
0を用いて情報源の保持するデータ値から推定する推定
手段210とを有する。
【0022】本発明(請求項7)は、データ登録手段2
40において、情報源の保持する1つのデータ値を、複
数の表現形式に変換し、該データ値の参照情報と共に、
予め単一の辞書220に登録する手段を含む。
【0023】本発明(請求項8)は、データ登録手段2
40において、情報源のスキーマの説明文を、該説明文
の参照情報と共に予め単一の辞書220に登録する手段
を含む。
【0024】本発明(請求項9)は、データ登録手段2
40において、情報源の保持するデータ値と、該情報源
の保持するデータ値の様々な別表現形式と、該情報源の
スキーマと、該情報源のカラム名の同義語と、該情報源
のスキーマの説明文の任意の組み合わせを、参照情報と
共に、予め単一の辞書220に登録する手段を含む。
【0025】本発明(請求項10)は、エンドユーザの
指定したキーワードと、情報源の保持するデータ値・情
報源の保持するデータ値の様々な別表現形式・情報源の
カラム名の同義語・情報源のスキーマの説明文の間で適
合度を計算し、複数の情報源をユーザの要求の適合度の
高いものから提示する手段を更に有する。
【0026】本発明(請求項11)は、ネットワーク上
に複数存在する情報源を、キーワードにより所在を推定
する情報源所在推定プログラムを格納した記憶媒体であ
って、複数の情報源の保持するデータ値を、複数のデー
タベースシステムにアクセスするための該データ値の参
照情報と共に、予め単一の辞書に登録するデータ登録プ
ロセスと、エンドユーザからキーワードが入力される
と、該キーワードに関連する情報源の所在を、辞書を用
いて情報源の保持するデータ値から推定する推定プロセ
スとを有する。
【0027】本発明(請求項12)は、データ登録プロ
セスにおいて、情報源の保持する1つのデータ値を、複
数の表現形式に変換し、該データ値の参照情報と共に、
予め単一の辞書に登録するプロセスを含む。
【0028】本発明(請求項13)は、データ登録プロ
セスにおいて、情報源のスキーマの説明文を、該説明文
の参照情報と共に予め単一の辞書に登録するプロセスを
含む。
【0029】本発明(請求項14)は、データ登録プロ
セスにおいて、情報源の保持するデータ値と、該情報源
の保持するデータ値の様々な別表現形式と、該情報源の
スキーマと、該情報源のカラム名の同義語と、該情報源
のスキーマの説明文の任意の組み合わせを、参照情報と
共に、予め単一の辞書に登録するプロセスを含む。
【0030】本発明(請求項15)は、エンドユーザの
指定したキーワードと、情報源の保持するデータ値・情
報源の保持するデータ値の様々な別表現形式・情報源の
カラム名の同義語・情報源のスキーマの説明文の間で適
合度を計算し、複数の情報源をユーザの要求の適合度の
高いものから提示するプロセスを更に有する。
【0031】上記のように、本発明では、複数の情報源
のデータ値(情報源の持つ情報の人名「山田太郎」や数
量「1000」などの実際の値)や、情報源のスキーマ
等を、その参照情報と共に、予め辞書に登録し、この辞
書を用いて情報源の所在を探索することが可能となる。
【0032】また、単一の辞書にデータ値と共に参照情
報を登録することで、エンドユーザは、キーワードの表
現形式を意識することなく、情報源の所在推定を行うこ
とが可能となる。
【0033】また、本発明は、所在情報の候補集合にお
ける個々の候補について適合率を算出し、その降順にソ
ートした候補集合をエンドユーザに提示することが可能
となる。
【0034】
【発明の実施の形態】以下では、特開平10−1435
39「情報検索方法及びシステム」(以下、DBSEN
A)を異種情報源検索装置として用いた場合の実施形態
を示す。
【0035】図3は、本発明の検索装置の構成を示す。
【0036】同図に示すシステムは、エンドユーザが操
作するアプリケーション100と、情報を検索する異種
情報源検索装置200、及び情報源300より構成され
る。異種情報源検索装置200は、所在推定部210、
情報源辞書220、統合検索部230、データ値収集部
240から構成される。
【0037】情報源300は、リレーショナルデータベ
ースや、スキーマをリレーションに変換した文書データ
ベース、画像データベース、Webページなどである。
【0038】情報資源辞書220には、情報300に関
する以下の情報を蓄積することができる。1つは、参照
情報であり、もう1つは、所在推定情報である。
【0039】参照情報は、以下のような情報が含まれ
る。
【0040】・アクセス情報:当該アクセス情報には、
個々の情報源300にアクセスするためのサーバ名、デ
ータベース名、ログイン名、パスワードが含まれる。
【0041】・スキーマ:当該スキーマとして、個々の
情報源300のテーブル名、カラム名、テーブル間の関
連が含まれる。
【0042】・スキーマの説明文:スキーマの説明文に
は、テーブルの説明文、カラムの説明文がある。
【0043】・カラム名の同義語:当該カラム名の同義
語には、前述のカラム名に対する様々な言い換え(同義
語)がある。
【0044】・データの表現形式:データ表現形式は、
個々の情報源300のデータ値の表現形式と変換ルール
である。データ値の表現形式は、変換ルールに従って、
他の表現形式(別表現)に変換できる。
【0045】所在推定情報は、以下のような情報が含ま
れる。
【0046】テーブル名、カラム名、カラム名の同義
語、テーブル説明文、カラム説明文、各カラムのデータ
値とデータ値の別表現から情報源300の所在を特定す
るための情報である。
【0047】以下に、図3におけるシステムの動作を説
明する。
【0048】図4は、本発明の処理の概要を示すフロー
チャートである。
【0049】ステップ100) 管理者による「参照情
報」の登録処理:異種情報源検索装置200の管理者
は、情報源300の「参照情報」を、情報資源辞書22
0に登録する。
【0050】ステップ200) エンドユーザによる情
報源の所在推定処理:異種情報源検索装置200のエン
ドユーザは、アプリケーションプログラム100を通し
て、所在推定部210にキーワードを入力し、キーワー
ドに関連のある情報源300の所在推定を行わせ、複数
の「所在情報」の候補を得る。
【0051】ステップ300) エンドユーザによる情
報統合検索処理:異種情報源検索装置200のエンドユ
ーザは、ステップ200で得られた複数の「所在情報」
の候補から、希望のものを選び出し、統合検索部230
に渡す。統合検索部230は、「所在情報」を元に情報
源300からデータを検索し、複数の検索結果を統合
し、統合された検索結果をエンドユーザに渡す。
【0052】次に、上記のステップ100の管理者によ
る「参照情報」の登録手順を説明する。
【0053】図5は、本発明の参照情報の登録手順のフ
ローチャートである。
【0054】ステップ101) 情報源300として、
リレーショナルデータベースが配置されている。
【0055】ステップ102) 管理者は、情報源30
0の「参照情報」を、情報資源辞書220に登録する。
【0056】ステップ103) 管理者は、データ値収
集部240を用いて、各カラムのデータ値を情報源30
0より読出し、さらに、データ値をデータ表現形式の情
報を用いてデータ値の別表現に変換する。次に、前述の
参照情報(テーブル名、カラム名、カラム名の同義語、
テーブル説明文、カラム説明文)、データ値とデータ値
の別表現を用いて、情報源300の所在を特定する「所
在推定情報」を作成し、情報資源辞書220に蓄積す
る。なお、各カラムのデータ値は、膨大な量であるの
で、管理者が所在推定に必要であると判断したもののみ
を蓄積の対象とする。
【0057】次に、上記のステップ200のエンドユー
ザによる情報源300の所在推定手順を説明する。
【0058】図6は、本発明の情報源の所在推定手順の
フローチャートである。
【0059】ステップ201) エンドユーザは、アプ
リケーションプログラム100を通して、所在推定部2
10に複数のキーワードを入力する。
【0060】ステップ202) 所在推定部210は、
情報源辞書220の所在推定情報を用い、複数のキーワ
ードから、そのキーワードと関連のある情報源300の
所在の集合をキーワード毎に特定する。
【0061】ステップ203) キーワード毎の情報源
300の所在の集合を、キーワード数分組み合わせて、
キーワードに関連する情報源の所在を示す「所在情報」
の候補集合を作成する。このとき、テーブル間の結合方
法がなく、検索ができない候補は排除する。
【0062】ステップ204) 前述の個々の候補を、
評価関数により評価し、適合率を算出する。
【0063】ステップ205) 前述の候補集合を、適
合率に従って並べ替える。
【0064】ステップ206) 所在推定部210は、
「所在情報」の候補集合をアプリケーションプログラム
100を通して、エンドユーザに返却する。
【0065】次に、上記のステップ300のエンドユー
ザによる情報の統合検索手順を説明する。
【0066】図7は、本発明のエンドユーザによる統合
検索手順のフローチャートである。ステップ301)
エンドユーザは、アプリケーションプログラム100を
通して、任意の候補(所在情報)を入力する。
【0067】ステップ302) 統合検索部230は、
「所在情報」を元に、情報源300を特定し、情報検索
命令文を発行する。このとき、キーワードがテーブルを
指している場合は、テーブル自体を返却する。カラムの
場合は、指定のカラムを返却する。データ値の場合は、
データ値を含むカラムに対して、指定のデータ値のみを
返却するような条件指定を情報検索命令文に付加して検
索を実行する。また、複数の情報源300を跨がる結合
を行う場合は、複数の情報源300へ情報検索命令文を
発行し、統合検索部230において複数の検索結果を結
合する。
【0068】ステップ303) 情報源300から返却
された検索結果をアプリケーションプログラム100を
通してエンドユーザに返却する。
【0069】
【実施例】以下、図面及び表に基づいて本発明の実施例
を説明する。
【0070】最初に、管理者による参照情報の例を図5
に基づいて説明する。
【0071】ステップ101)情報源300として、例
えば、以下の3つの情報源300が存在するとする。な
お、以下では、任意のテーブルを表すのに、「データベ
ース名、テーブル名」、任意のカラムを表すのに「デー
タベース名、テーブル名、カラム名」という表記を用い
る。以下、図3に示す情報源300aを自動車DB、
情報源300bを自動車DB、情報源300cを自動
車DBとして説明する。
【0072】・情報源300a(自動車DB)は、以
下のテーブルを持つ。
【0073】
【表1】 ・情報源300b(自動車DB)は、以下の2つのテ
ーブルを持つ。なお、「自動車DB.自動車.ID」
と「自動車DB.販売.ID」に関連(リンク)が張
られている。
【0074】
【表2】 ・情報源300c(自動車DB)は以下のテーブルを
持つ。
【0075】
【表3】 ステップ102) 参照情報の登録:管理者は、以下の
「参照情報」を情報資源辞書220に登録する。
【0076】情報源300aについて、情報資源辞書2
20に以下の「参照情報」を登録する。
【0077】・アクセス情報 サーバ名:server1,ログイン名:user1,
パスワード:******** ・スキーマ 情報源300aのテーブル名、全てのカラム名 ・データ値の別表現
【0078】
【表4】 ・所在推定辞書にデータ値を登録するカラム
【0079】
【表5】 情報源300bについて、情報資源辞書220に以下の
「参照情報」を登録する。
【0080】・アクセス情報 サーバ名:server2,ログイン名:user2,
パスワード:******** ・スキーマ 情報源300bのテーブル名、全てのカラム名、関連
(リンク) ・所在推定辞書にデータ値を登録するカラム
【0081】
【表6】 情報源300cについて、情報資源辞書220に以下の
「参照情報」を登録する。
【0082】・アクセス情報 サーバ名:server3,ログイン名:user3,
パスワード:******** ・スキーマ 情報源300cのテーブル名、全てのカラム名 ・説明文
【0083】
【表7】 ・カラム名の同義語
【0084】
【表8】 ・所在推定辞書にデータ値を登録するカラム
【0085】
【表9】 ステップ103) 所在推定情報の登録:データ値収集
部240は、情報資源辞書220に登録された「参照情
報」と情報源300からデータ値を読出し、「書愛推定
情報」を作成し、情報資源辞書220に登録する。以下
に作成される「所在推定情報」の例を示す。
【0086】
【表10】 次に、エンドユーザによる情報源の所在推定処理につい
て図6に基づいて説明する。
【0087】ステップ201) エンドユーザによるキ
ーワード指定:エンドユーザによるキーワードを以下と
する。
【0088】
【表11】 ステップ202) 所在推定:所在推定部210によ
り、情報資源辞書220の「所在推定情報」を元に、所
在推定が行われる。所在推定は、エンドユーザによるキ
ーワードと、「所在推定情報」のキーワード項目の文字
列比較により、適合したものを抜き出す操作である。ユ
ーザの入力キーワードが、情報資源辞書220上のキー
ワードの一部に一致すれば、適合したものと見做す。抜
き出された「所在推定情報」を以下に示す。
【0089】
【表12】 ステップ203) 候補作成:ステップ202で抜き出
された「所在推定情報」を同一テーブル内であるか、テ
ーブル間で関連が存在し、データとして纏められるもの
を候補としてグループ化する。
【0090】
【表13】 ステップ204) 適合率算出:エンドユーザにより入
力されたキーワードと、各候補間の適合率を算出する。
適合率の算出例を以下に示す。
【0091】・ヒット率(h)の導出 ヒット率は、入力キーワード中のヒットした数の割合で
ある。
【0092】a.対応リソース係数(r) 対象リソース係数は、キーワードがヒットした対象の文
字列の種類による係数である。対応リソース係数の一覧
を以下に示す。
【0093】
【表14】 b.文字列マッチ率(m) 文字列マッチ率は、入力キーワードが辞書上のキーワー
ド文字列に対して、どの程度マッチしたかを示す。文字
列マッチ率の導出式を以下に示す。
【0094】
【数1】 以上から、ヒット率は以下のように示される。
【0095】
【数2】 c.分散率(d) 分散率は、データセット・情報源をまたがる度合いであ
る。
【0096】候補が含むデータセットの数:D 候補が含む情報源の数:I と置くと、分散率は、以下のように示される。
【0097】
【数3】 ヒット率、分散率より、適合率は、以下のように算出さ
れる。θはヒット率と分散率の重みを調整するパラメー
タである。ここでは、θ=45°を用いる。
【0098】
【数4】 例として、候補Aの適合率を算出すると、
【0099】
【数5】 前述の適合率算出方法により得られる適合率を以下に示
す。
【0100】
【表15】 ステップ205) 適合率による並び替え:次に、適合
率について降順にソートし、以下の候補集合を作成す
る。同じ適合率の候補の順番は特に規定しないが、ここ
では、前述の候補集合における出現順とした。
【0101】
【表16】 ステップ206) 候補集合の返却:所在推定部210
は、アプリケーションプログラム100に対し、候補集
合を返却し、処理を終了する。
【0102】次に、エンドユーザにより統合検索処理に
ついて図7に基づいて説明する。
【0103】ステップ301) 候補の選択:選択され
た候補は、統合検索部230を用いて、実際にデータ値
の検索が行われる。例として、以下では、候補Bが選択
された場合の検索実行結果を示す。
【0104】ステップ302) 検索の実行:選択され
た候補Bの検索実行において、以下の情報検索命令文が
情報源300bへ適応される。
【0105】
【表17】 ステップ303) 結果の返却:候補Bの検索結果とし
て、下記の表が返却されて処理を終了する。
【0106】
【表18】 また、上記の実施例では、図3の構成に基づいて説明し
ているが、図3の異種情報源検索装置の各構成要素をプ
ログラム(モジュール)として構築し、検索装置として
利用されるコンピュータに接続されるディスク装置や、
フロッピー(登録商標)ディスク、CD−ROM等の可
搬記憶媒体に格納しておき、本発明を実施する際にイン
ストールすることにより、容易に本発明を実現できる。
【0107】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内において、種々変更・応
用が可能である。
【0108】
【発明の効果】上述のように、本発明では、ネットワー
ク上に複数存在する情報源を、エンドユーザがそれらの
内容を知らなくても、キーワード(データ値)により所
在を推定し、それらを統合した検索を行うことができ
る。
【0109】更に、複数の情報源があったとき、ユーザ
の意図に合致している程度の高いものから提示すること
ができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の検索装置の構成図である。
【図4】本発明の処理の概要を示すフローチャートであ
る。
【図5】本発明の参照情報の登録手順のフローチャート
である。
【図6】本発明の情報源の所在推定手順のフローチャー
トである。
【図7】本発明のエンドユーザによる統合検索手順のフ
ローチャートである。
【符号の説明】
100 アプリケーションプログラム 200 所在推定装置、異種情報源検索装置 210 推定手段、所在推定部 220 辞書、情報資源辞書 230 統合検索部 240 データ値収集部、データ登録手段 300 情報源
───────────────────────────────────────────────────── フロントページの続き (72)発明者 飯塚 裕一 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 NK02 NK35 PP12 PP22 PQ02 PQ74 PR06 QM08 QP03

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上に複数存在する情報源
    を、キーワードにより所在を推定する情報源所在推定方
    法において、 複数の情報源の保持するデータ値を、複数のデータベー
    スシステムに対してアクセスするための該データ値の参
    照情報と共に、予め単一の辞書に登録し、 エンドユーザからキーワードが入力されると、該キーワ
    ードに関連する情報源の所在を、前記辞書を用いて前記
    情報源の保持するデータ値から推定することを特徴とす
    る情報源所在推定方法。
  2. 【請求項2】 前記情報源の保持する1つのデータ値
    を、複数の表現形式に変換し、該データ値の参照情報と
    共に、予め単一の前記辞書に登録する請求項1記載の情
    報源所在推定方法。
  3. 【請求項3】 前記情報源のスキーマの説明文を、該説
    明文の参照情報と共に予め単一の前記辞書に登録する請
    求項1記載の情報源所在推定方法。
  4. 【請求項4】 前記情報源の保持するデータ値と、該情
    報源の保持するデータ値の様々な別表現形式と、該情報
    源のスキーマと、該情報源のカラム名の同義語と、該情
    報源のスキーマの説明文の任意の組み合わせを、参照情
    報と共に、予め単一の前記辞書に登録する請求項1記載
    の情報源所在推定方法。
  5. 【請求項5】 前記エンドユーザの指定した前記キーワ
    ードと、前記情報源の保持するデータ値・情報源の保持
    するデータ値の様々な別表現形式・情報源のカラム名の
    同義語・情報源のスキーマの説明文の間で適合度を計算
    し、複数の情報源をユーザの要求の適合度の高いものか
    ら提示する請求項1記載の情報源所在推定方法。
  6. 【請求項6】 ネットワーク上に複数存在する情報源
    を、キーワードにより所在を推定する情報源所在推定装
    置において、 単一の辞書と、 複数の情報源の保持するデータ値を、複数のデータベー
    スシステムにアクセスするための該データ値の参照情報
    と共に、予め前記単一の辞書に登録するデータ登録手段
    と、 エンドユーザからキーワードが入力されると、該キーワ
    ードに関連する情報源の所在を、前記辞書を用いて前記
    情報源の保持するデータ値から推定する推定手段とを有
    することを特徴とする情報源所在推定装置。
  7. 【請求項7】 前記データ登録手段は、 前記情報源の保持する1つのデータ値を、複数の表現形
    式に変換し、該データ値の参照情報と共に、予め単一の
    前記辞書に登録する手段を含む請求項6記載の情報源所
    在推定装置。
  8. 【請求項8】 前記データ登録手段は、 前記情報源のスキーマの説明文を、該説明文の参照情報
    と共に予め単一の前記辞書に登録する手段を含む請求項
    6記載の情報源所在推定装置。
  9. 【請求項9】 前記データ登録手段は、 前記情報源の保持するデータ値と、該情報源の保持する
    データ値の様々な別表現形式と、該情報源のスキーマ
    と、該情報源のカラム名の同義語と、該情報源のスキー
    マの説明文の任意の組み合わせを、参照情報と共に、予
    め単一の前記辞書に登録する手段を含む請求項6記載の
    情報源所在推定装置。
  10. 【請求項10】 前記エンドユーザの指定した前記キー
    ワードと、前記情報源の保持するデータ値・情報源の保
    持するデータ値の様々な別表現形式・情報源のカラム名
    の同義語・情報源のスキーマの説明文の間で適合度を計
    算し、複数の情報源をユーザの要求の適合度の高いもの
    から提示する手段を更に有する請求項6記載の情報源所
    在推定装置。
  11. 【請求項11】 ネットワーク上に複数存在する情報源
    を、キーワードにより所在を推定する情報源所在推定プ
    ログラムを格納した記憶媒体であって、 複数の情報源の保持するデータ値を、複数のデータベー
    スシステムにアクセスするための該データ値の参照情報
    と共に、予め前記単一の辞書に登録するデータ登録プロ
    セスと、 エンドユーザからキーワードが入力されると、該キーワ
    ードに関連する情報源の所在を、前記辞書を用いて前記
    情報源の保持するデータ値から推定する推定プロセスと
    を有することを特徴とする情報源所在推定プログラムを
    格納した記憶媒体。
  12. 【請求項12】 前記データ登録プロセスは、 前記情報源の保持する1つのデータ値を、複数の表現形
    式に変換し、該データ値の参照情報と共に、予め単一の
    前記辞書に登録するプロセスを含む請求項11記載の情
    報源所在推定プログラムを格納した記憶媒体。
  13. 【請求項13】 前記データ登録プロセスは、 前記情報源のスキーマの説明文を、該説明文の参照情報
    と共に予め単一の前記辞書に登録するプロセスを含む請
    求項11記載の情報源所在推定プログラムを格納した記
    憶媒体。
  14. 【請求項14】 前記データ登録プロセスは、 前記情報源の保持するデータ値と、該情報源の保持する
    データ値の様々な別表現形式と、該情報源のスキーマ
    と、該情報源のカラム名の同義語と、該情報源のスキー
    マの説明文の任意の組み合わせを、参照情報と共に、予
    め単一の前記辞書に登録するプロセスを含む請求項11
    記載の情報源所在推定プログラムを格納した記憶媒体。
  15. 【請求項15】 前記エンドユーザの指定した前記キー
    ワードと、前記情報源の保持するデータ値・情報源の保
    持するデータ値の様々な別表現形式・情報源のカラム名
    の同義語・情報源のスキーマの説明文の間で適合度を計
    算し、複数の情報源をユーザの要求の適合度の高いもの
    から提示するプロセスを更に有する請求項11記載の情
    報源所在推定プログラムを格納した記憶媒体。
JP2000207563A 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 Expired - Lifetime JP3567861B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000207563A JP3567861B2 (ja) 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000207563A JP3567861B2 (ja) 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JP2002024262A true JP2002024262A (ja) 2002-01-25
JP3567861B2 JP3567861B2 (ja) 2004-09-22

Family

ID=18704311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000207563A Expired - Lifetime JP3567861B2 (ja) 2000-07-07 2000-07-07 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3567861B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217424A (ja) * 2008-03-10 2009-09-24 Fujitsu Ltd 記憶部統合装置、記憶部統合プログラム、記憶部統合方法
JP2010267288A (ja) * 2003-09-15 2010-11-25 Ab Initio Technology Llc データプロファイリング
KR20140041546A (ko) * 2011-06-14 2014-04-04 마이크로소프트 코포레이션 데이터 보강 제안 기법
US9323748B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9449057B2 (en) 2011-01-28 2016-09-20 Ab Initio Technology Llc Generating data pattern information
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US10721220B2 (en) 2011-06-14 2020-07-21 Microsoft Technology Licensing, Llc Data custodian and curation system
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04291668A (ja) * 1991-03-20 1992-10-15 Mitsubishi Electric Corp 検索装置
JPH086964A (ja) * 1994-06-15 1996-01-12 Mitsubishi Electric Corp データベース検索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04291668A (ja) * 1991-03-20 1992-10-15 Mitsubishi Electric Corp 検索装置
JPH086964A (ja) * 1994-06-15 1996-01-12 Mitsubishi Electric Corp データベース検索装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8868580B2 (en) 2003-09-15 2014-10-21 Ab Initio Technology Llc Data profiling
JP2010267288A (ja) * 2003-09-15 2010-11-25 Ab Initio Technology Llc データプロファイリング
JP2010267289A (ja) * 2003-09-15 2010-11-25 Ab Initio Technology Llc データプロファイリング
US9323802B2 (en) 2003-09-15 2016-04-26 Ab Initio Technology, Llc Data profiling
JP2009217424A (ja) * 2008-03-10 2009-09-24 Fujitsu Ltd 記憶部統合装置、記憶部統合プログラム、記憶部統合方法
US9449057B2 (en) 2011-01-28 2016-09-20 Ab Initio Technology Llc Generating data pattern information
US9652513B2 (en) 2011-01-28 2017-05-16 Ab Initio Technology, Llc Generating data pattern information
JP2014523013A (ja) * 2011-06-14 2014-09-08 マイクロソフト コーポレーション データエンリッチメントの推奨
US10721220B2 (en) 2011-06-14 2020-07-21 Microsoft Technology Licensing, Llc Data custodian and curation system
KR20140041546A (ko) * 2011-06-14 2014-04-04 마이크로소프트 코포레이션 데이터 보강 제안 기법
KR101976220B1 (ko) 2011-06-14 2019-05-07 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 데이터 보강 제안 기법
US10540349B2 (en) 2011-06-14 2020-01-21 Microsoft Technology Licensing, Llc Recommending data enrichments
KR102035984B1 (ko) 2011-06-14 2019-10-23 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 데이터 보강 제안 기법
KR20190049924A (ko) * 2011-06-14 2019-05-09 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 데이터 보강 제안 기법
US9323748B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9990362B2 (en) 2012-10-22 2018-06-05 Ab Initio Technology Llc Profiling data with location information
US9569434B2 (en) 2012-10-22 2017-02-14 Ab Initio Technology Llc Profiling data with source tracking
US9323749B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US10719511B2 (en) 2012-10-22 2020-07-21 Ab Initio Technology Llc Profiling data with source tracking
US10241900B2 (en) 2013-02-01 2019-03-26 Ab Initio Technology Llc Data records selection
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US11163670B2 (en) 2013-02-01 2021-11-02 Ab Initio Technology Llc Data records selection
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods

Also Published As

Publication number Publication date
JP3567861B2 (ja) 2004-09-22

Similar Documents

Publication Publication Date Title
US7092936B1 (en) System and method for search and recommendation based on usage mining
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US6529903B2 (en) Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
JP5265739B2 (ja) 多数のクエリー修正モデルの統合
US6865575B1 (en) Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
US6850934B2 (en) Adaptive search engine query
US7120574B2 (en) Synonym extension of search queries with validation
JP5224851B2 (ja) 検索エンジン、検索システム、検索方法およびプログラム
US20040158560A1 (en) Systems and methods for query expansion
US7310633B1 (en) Methods and systems for generating textual information
WO2002101588A1 (fr) Systeme de gestion de contenus
US20070214128A1 (en) Discovering alternative spellings through co-occurrence
US20090083024A1 (en) Apparatus, method, computer program product, and system for machine translation
JP2015525929A (ja) 検索品質を改善するための重みベースのステミング
US6941293B1 (en) Methods and apparatus for determining equivalent descriptions for an information need
JP2002132812A (ja) 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
JP2002024262A (ja) 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体
US20020129026A1 (en) Process for accessing information via a communications network
JP2001188802A (ja) 情報検索装置及び情報検索方法
JP3786233B2 (ja) 情報検索方法および情報検索システム
JP4499179B1 (ja) 端末装置
JP4057962B2 (ja) 質問応答装置、質問応答方法及びプログラム
KR20030075219A (ko) 벡터문서모델을 이용한 동일/유사제품 클러스트링 장치 및그 방법
JP2001134597A (ja) 複数異種情報源アクセス方法及び装置及び複数異種情報源アクセスプログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040607

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3567861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090625

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100625

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110625

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120625

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130625

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140625

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term