JP2002024262A - 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 - Google Patents
情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体Info
- Publication number
- JP2002024262A JP2002024262A JP2000207563A JP2000207563A JP2002024262A JP 2002024262 A JP2002024262 A JP 2002024262A JP 2000207563 A JP2000207563 A JP 2000207563A JP 2000207563 A JP2000207563 A JP 2000207563A JP 2002024262 A JP2002024262 A JP 2002024262A
- Authority
- JP
- Japan
- Prior art keywords
- information source
- information
- data value
- location
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
ることを可能とし、複数の情報源があったとき、ユーザ
の意図に合致している程度の高いものから提示すること
が可能な情報源所在推定方法及び装置及び情報源所在推
定プログラムを格納した記憶媒体を提供する。 【解決手段】 本発明は、複数の情報源の保持するデー
タ値を、該データ値の参照情報と共に、予め単一の辞書
に登録し、エンドユーザからキーワードが入力される
と、該キーワードに関連する情報源の所在を、辞書を用
いて情報源の保持するデータ値から推定する。
Description
法及び装置及び情報源所在推定プログラムを格納した記
憶媒体に係り、特に、ネットワーク上に複数存在する情
報源を、エンドユーザがそれらの内容を知らなくても、
キーワードにより所在を推定し、それらを統合した検索
を行う情報源所在推定方法及び装置及び情報源所在推定
プログラムを格納した記憶媒体に関する。
ース、文書中の箇条書き、CSV形式のように、定型的
なデータ構造を持つデータをエンドユーザが簡単なイン
タフェースで所在を探索し、検索を行いたいという要求
が高まっている。インターネットの上のWebページに
対する情報の所在探索技術としては、ロボット型のサー
チエンジンが挙げられる。
れている「情報検索方法及びシステム」では、ユーザの
入力したキーワードから、情報源のカラム名(または、
その同義語)から、情報源の所在を探索することが可能
である。
その中に「力士」テーブルがあり、その中に「力士名」
カラムがあったとき、ユーザは、当該システムに“力士
名”とだけ入力することで、「相撲力士検索」DBの
「力士」テーブルの「力士名」カラムの所在を得ること
ができる。
等のロボット型サーチエンジンでは、以下のような問題
がある。
bページに変換して、公開されている必要がある。
さない。
ことが出来ない。
「情報検索方法及びシステム」には、以下のような問題
がある。
の人名「山田太郎」や数量「1000」などの実際の
値)から所在を探索することができない。
の中に「力士」テーブルがあり、その中に「力士名」カ
ラムがあったとき、ユーザは、当該システムに“貴乃
花”という力士名を入力しても、情報の所在を得ること
ができない。これは、当該システムが情報源のデータ値
を所在を探索する手掛かりにしていないためである。
ぞれが、どの程度ユーザの意図に合致しているかわから
ない。
で、情報源のデータ値から情報源の所在を探索すること
を可能とし、複数の情報源があったとき、ユーザの意図
に合致している程度の高いものから提示することが可能
な情報源所在推定方法及び装置及び情報源所在推定プロ
グラムを格納した記憶媒体を提供することを目的とす
る。
説明するための図である。
複数存在する情報源を、キーワードにより所在を推定す
る情報源所在推定方法において、複数の情報源の保持す
るデータ値を、複数のデータベースシステムにアクセス
するための該データ値の参照情報と共に、予め単一の辞
書に登録し(ステップ1)、エンドユーザからキーワー
ドが入力されると(ステップ2)、該キーワードに関連
する情報源の所在を、辞書を用いて情報源の保持するデ
ータ値から推定する(ステップ3)。
1つのデータ値を、複数の表現形式に変換し、該データ
値の参照情報と共に、予め単一の辞書に登録する。
の説明文を、該説明文の参照情報と共に予め単一の辞書
に登録する。
データ値と、該情報源の保持するデータ値の様々な別表
現形式と、該情報源のスキーマと、該情報源のカラム名
の同義語と、該情報源のスキーマの説明文の任意の組み
合わせを、参照情報と共に、予め単一の辞書に登録す
る。
定したキーワードと、情報源の保持するデータ値・情報
源の保持するデータ値の様々な別表現形式・情報源のカ
ラム名の同義語・情報源のスキーマの説明文の間で適合
度を計算し、複数の情報源をユーザの要求の適合度の高
いものから提示する。
複数存在する情報源を、キーワードにより所在を推定す
る情報源所在推定装置において、単一の辞書220と、
複数の情報源の保持するデータ値を、複数のデータベー
スシステムにアクセスするための該データ値の参照情報
と共に、予め単一の辞書220に登録するデータ登録手
段240と、エンドユーザからキーワードが入力される
と、該キーワードに関連する情報源の所在を、辞書22
0を用いて情報源の保持するデータ値から推定する推定
手段210とを有する。
40において、情報源の保持する1つのデータ値を、複
数の表現形式に変換し、該データ値の参照情報と共に、
予め単一の辞書220に登録する手段を含む。
40において、情報源のスキーマの説明文を、該説明文
の参照情報と共に予め単一の辞書220に登録する手段
を含む。
40において、情報源の保持するデータ値と、該情報源
の保持するデータ値の様々な別表現形式と、該情報源の
スキーマと、該情報源のカラム名の同義語と、該情報源
のスキーマの説明文の任意の組み合わせを、参照情報と
共に、予め単一の辞書220に登録する手段を含む。
指定したキーワードと、情報源の保持するデータ値・情
報源の保持するデータ値の様々な別表現形式・情報源の
カラム名の同義語・情報源のスキーマの説明文の間で適
合度を計算し、複数の情報源をユーザの要求の適合度の
高いものから提示する手段を更に有する。
に複数存在する情報源を、キーワードにより所在を推定
する情報源所在推定プログラムを格納した記憶媒体であ
って、複数の情報源の保持するデータ値を、複数のデー
タベースシステムにアクセスするための該データ値の参
照情報と共に、予め単一の辞書に登録するデータ登録プ
ロセスと、エンドユーザからキーワードが入力される
と、該キーワードに関連する情報源の所在を、辞書を用
いて情報源の保持するデータ値から推定する推定プロセ
スとを有する。
セスにおいて、情報源の保持する1つのデータ値を、複
数の表現形式に変換し、該データ値の参照情報と共に、
予め単一の辞書に登録するプロセスを含む。
セスにおいて、情報源のスキーマの説明文を、該説明文
の参照情報と共に予め単一の辞書に登録するプロセスを
含む。
セスにおいて、情報源の保持するデータ値と、該情報源
の保持するデータ値の様々な別表現形式と、該情報源の
スキーマと、該情報源のカラム名の同義語と、該情報源
のスキーマの説明文の任意の組み合わせを、参照情報と
共に、予め単一の辞書に登録するプロセスを含む。
指定したキーワードと、情報源の保持するデータ値・情
報源の保持するデータ値の様々な別表現形式・情報源の
カラム名の同義語・情報源のスキーマの説明文の間で適
合度を計算し、複数の情報源をユーザの要求の適合度の
高いものから提示するプロセスを更に有する。
のデータ値(情報源の持つ情報の人名「山田太郎」や数
量「1000」などの実際の値)や、情報源のスキーマ
等を、その参照情報と共に、予め辞書に登録し、この辞
書を用いて情報源の所在を探索することが可能となる。
報を登録することで、エンドユーザは、キーワードの表
現形式を意識することなく、情報源の所在推定を行うこ
とが可能となる。
ける個々の候補について適合率を算出し、その降順にソ
ートした候補集合をエンドユーザに提示することが可能
となる。
39「情報検索方法及びシステム」(以下、DBSEN
A)を異種情報源検索装置として用いた場合の実施形態
を示す。
作するアプリケーション100と、情報を検索する異種
情報源検索装置200、及び情報源300より構成され
る。異種情報源検索装置200は、所在推定部210、
情報源辞書220、統合検索部230、データ値収集部
240から構成される。
ースや、スキーマをリレーションに変換した文書データ
ベース、画像データベース、Webページなどである。
する以下の情報を蓄積することができる。1つは、参照
情報であり、もう1つは、所在推定情報である。
る。
個々の情報源300にアクセスするためのサーバ名、デ
ータベース名、ログイン名、パスワードが含まれる。
情報源300のテーブル名、カラム名、テーブル間の関
連が含まれる。
は、テーブルの説明文、カラムの説明文がある。
語には、前述のカラム名に対する様々な言い換え(同義
語)がある。
個々の情報源300のデータ値の表現形式と変換ルール
である。データ値の表現形式は、変換ルールに従って、
他の表現形式(別表現)に変換できる。
れる。
語、テーブル説明文、カラム説明文、各カラムのデータ
値とデータ値の別表現から情報源300の所在を特定す
るための情報である。
明する。
チャートである。
報」の登録処理:異種情報源検索装置200の管理者
は、情報源300の「参照情報」を、情報資源辞書22
0に登録する。
報源の所在推定処理:異種情報源検索装置200のエン
ドユーザは、アプリケーションプログラム100を通し
て、所在推定部210にキーワードを入力し、キーワー
ドに関連のある情報源300の所在推定を行わせ、複数
の「所在情報」の候補を得る。
報統合検索処理:異種情報源検索装置200のエンドユ
ーザは、ステップ200で得られた複数の「所在情報」
の候補から、希望のものを選び出し、統合検索部230
に渡す。統合検索部230は、「所在情報」を元に情報
源300からデータを検索し、複数の検索結果を統合
し、統合された検索結果をエンドユーザに渡す。
る「参照情報」の登録手順を説明する。
ローチャートである。
リレーショナルデータベースが配置されている。
0の「参照情報」を、情報資源辞書220に登録する。
集部240を用いて、各カラムのデータ値を情報源30
0より読出し、さらに、データ値をデータ表現形式の情
報を用いてデータ値の別表現に変換する。次に、前述の
参照情報(テーブル名、カラム名、カラム名の同義語、
テーブル説明文、カラム説明文)、データ値とデータ値
の別表現を用いて、情報源300の所在を特定する「所
在推定情報」を作成し、情報資源辞書220に蓄積す
る。なお、各カラムのデータ値は、膨大な量であるの
で、管理者が所在推定に必要であると判断したもののみ
を蓄積の対象とする。
ザによる情報源300の所在推定手順を説明する。
フローチャートである。
リケーションプログラム100を通して、所在推定部2
10に複数のキーワードを入力する。
情報源辞書220の所在推定情報を用い、複数のキーワ
ードから、そのキーワードと関連のある情報源300の
所在の集合をキーワード毎に特定する。
300の所在の集合を、キーワード数分組み合わせて、
キーワードに関連する情報源の所在を示す「所在情報」
の候補集合を作成する。このとき、テーブル間の結合方
法がなく、検索ができない候補は排除する。
評価関数により評価し、適合率を算出する。
合率に従って並べ替える。
「所在情報」の候補集合をアプリケーションプログラム
100を通して、エンドユーザに返却する。
ザによる情報の統合検索手順を説明する。
検索手順のフローチャートである。ステップ301)
エンドユーザは、アプリケーションプログラム100を
通して、任意の候補(所在情報)を入力する。
「所在情報」を元に、情報源300を特定し、情報検索
命令文を発行する。このとき、キーワードがテーブルを
指している場合は、テーブル自体を返却する。カラムの
場合は、指定のカラムを返却する。データ値の場合は、
データ値を含むカラムに対して、指定のデータ値のみを
返却するような条件指定を情報検索命令文に付加して検
索を実行する。また、複数の情報源300を跨がる結合
を行う場合は、複数の情報源300へ情報検索命令文を
発行し、統合検索部230において複数の検索結果を結
合する。
された検索結果をアプリケーションプログラム100を
通してエンドユーザに返却する。
を説明する。
に基づいて説明する。
えば、以下の3つの情報源300が存在するとする。な
お、以下では、任意のテーブルを表すのに、「データベ
ース名、テーブル名」、任意のカラムを表すのに「デー
タベース名、テーブル名、カラム名」という表記を用い
る。以下、図3に示す情報源300aを自動車DB、
情報源300bを自動車DB、情報源300cを自動
車DBとして説明する。
下のテーブルを持つ。
ーブルを持つ。なお、「自動車DB.自動車.ID」
と「自動車DB.販売.ID」に関連(リンク)が張
られている。
持つ。
「参照情報」を情報資源辞書220に登録する。
20に以下の「参照情報」を登録する。
パスワード:******** ・スキーマ 情報源300aのテーブル名、全てのカラム名 ・データ値の別表現
「参照情報」を登録する。
パスワード:******** ・スキーマ 情報源300bのテーブル名、全てのカラム名、関連
(リンク) ・所在推定辞書にデータ値を登録するカラム
「参照情報」を登録する。
パスワード:******** ・スキーマ 情報源300cのテーブル名、全てのカラム名 ・説明文
部240は、情報資源辞書220に登録された「参照情
報」と情報源300からデータ値を読出し、「書愛推定
情報」を作成し、情報資源辞書220に登録する。以下
に作成される「所在推定情報」の例を示す。
て図6に基づいて説明する。
ーワード指定:エンドユーザによるキーワードを以下と
する。
り、情報資源辞書220の「所在推定情報」を元に、所
在推定が行われる。所在推定は、エンドユーザによるキ
ーワードと、「所在推定情報」のキーワード項目の文字
列比較により、適合したものを抜き出す操作である。ユ
ーザの入力キーワードが、情報資源辞書220上のキー
ワードの一部に一致すれば、適合したものと見做す。抜
き出された「所在推定情報」を以下に示す。
された「所在推定情報」を同一テーブル内であるか、テ
ーブル間で関連が存在し、データとして纏められるもの
を候補としてグループ化する。
力されたキーワードと、各候補間の適合率を算出する。
適合率の算出例を以下に示す。
ある。
字列の種類による係数である。対応リソース係数の一覧
を以下に示す。
ド文字列に対して、どの程度マッチしたかを示す。文字
列マッチ率の導出式を以下に示す。
る。
れる。θはヒット率と分散率の重みを調整するパラメー
タである。ここでは、θ=45°を用いる。
す。
率について降順にソートし、以下の候補集合を作成す
る。同じ適合率の候補の順番は特に規定しないが、ここ
では、前述の候補集合における出現順とした。
は、アプリケーションプログラム100に対し、候補集
合を返却し、処理を終了する。
ついて図7に基づいて説明する。
た候補は、統合検索部230を用いて、実際にデータ値
の検索が行われる。例として、以下では、候補Bが選択
された場合の検索実行結果を示す。
た候補Bの検索実行において、以下の情報検索命令文が
情報源300bへ適応される。
て、下記の表が返却されて処理を終了する。
ているが、図3の異種情報源検索装置の各構成要素をプ
ログラム(モジュール)として構築し、検索装置として
利用されるコンピュータに接続されるディスク装置や、
フロッピー(登録商標)ディスク、CD−ROM等の可
搬記憶媒体に格納しておき、本発明を実施する際にイン
ストールすることにより、容易に本発明を実現できる。
ることなく、特許請求の範囲内において、種々変更・応
用が可能である。
ク上に複数存在する情報源を、エンドユーザがそれらの
内容を知らなくても、キーワード(データ値)により所
在を推定し、それらを統合した検索を行うことができ
る。
の意図に合致している程度の高いものから提示すること
ができる。
る。
である。
トである。
ローチャートである。
Claims (15)
- 【請求項1】 ネットワーク上に複数存在する情報源
を、キーワードにより所在を推定する情報源所在推定方
法において、 複数の情報源の保持するデータ値を、複数のデータベー
スシステムに対してアクセスするための該データ値の参
照情報と共に、予め単一の辞書に登録し、 エンドユーザからキーワードが入力されると、該キーワ
ードに関連する情報源の所在を、前記辞書を用いて前記
情報源の保持するデータ値から推定することを特徴とす
る情報源所在推定方法。 - 【請求項2】 前記情報源の保持する1つのデータ値
を、複数の表現形式に変換し、該データ値の参照情報と
共に、予め単一の前記辞書に登録する請求項1記載の情
報源所在推定方法。 - 【請求項3】 前記情報源のスキーマの説明文を、該説
明文の参照情報と共に予め単一の前記辞書に登録する請
求項1記載の情報源所在推定方法。 - 【請求項4】 前記情報源の保持するデータ値と、該情
報源の保持するデータ値の様々な別表現形式と、該情報
源のスキーマと、該情報源のカラム名の同義語と、該情
報源のスキーマの説明文の任意の組み合わせを、参照情
報と共に、予め単一の前記辞書に登録する請求項1記載
の情報源所在推定方法。 - 【請求項5】 前記エンドユーザの指定した前記キーワ
ードと、前記情報源の保持するデータ値・情報源の保持
するデータ値の様々な別表現形式・情報源のカラム名の
同義語・情報源のスキーマの説明文の間で適合度を計算
し、複数の情報源をユーザの要求の適合度の高いものか
ら提示する請求項1記載の情報源所在推定方法。 - 【請求項6】 ネットワーク上に複数存在する情報源
を、キーワードにより所在を推定する情報源所在推定装
置において、 単一の辞書と、 複数の情報源の保持するデータ値を、複数のデータベー
スシステムにアクセスするための該データ値の参照情報
と共に、予め前記単一の辞書に登録するデータ登録手段
と、 エンドユーザからキーワードが入力されると、該キーワ
ードに関連する情報源の所在を、前記辞書を用いて前記
情報源の保持するデータ値から推定する推定手段とを有
することを特徴とする情報源所在推定装置。 - 【請求項7】 前記データ登録手段は、 前記情報源の保持する1つのデータ値を、複数の表現形
式に変換し、該データ値の参照情報と共に、予め単一の
前記辞書に登録する手段を含む請求項6記載の情報源所
在推定装置。 - 【請求項8】 前記データ登録手段は、 前記情報源のスキーマの説明文を、該説明文の参照情報
と共に予め単一の前記辞書に登録する手段を含む請求項
6記載の情報源所在推定装置。 - 【請求項9】 前記データ登録手段は、 前記情報源の保持するデータ値と、該情報源の保持する
データ値の様々な別表現形式と、該情報源のスキーマ
と、該情報源のカラム名の同義語と、該情報源のスキー
マの説明文の任意の組み合わせを、参照情報と共に、予
め単一の前記辞書に登録する手段を含む請求項6記載の
情報源所在推定装置。 - 【請求項10】 前記エンドユーザの指定した前記キー
ワードと、前記情報源の保持するデータ値・情報源の保
持するデータ値の様々な別表現形式・情報源のカラム名
の同義語・情報源のスキーマの説明文の間で適合度を計
算し、複数の情報源をユーザの要求の適合度の高いもの
から提示する手段を更に有する請求項6記載の情報源所
在推定装置。 - 【請求項11】 ネットワーク上に複数存在する情報源
を、キーワードにより所在を推定する情報源所在推定プ
ログラムを格納した記憶媒体であって、 複数の情報源の保持するデータ値を、複数のデータベー
スシステムにアクセスするための該データ値の参照情報
と共に、予め前記単一の辞書に登録するデータ登録プロ
セスと、 エンドユーザからキーワードが入力されると、該キーワ
ードに関連する情報源の所在を、前記辞書を用いて前記
情報源の保持するデータ値から推定する推定プロセスと
を有することを特徴とする情報源所在推定プログラムを
格納した記憶媒体。 - 【請求項12】 前記データ登録プロセスは、 前記情報源の保持する1つのデータ値を、複数の表現形
式に変換し、該データ値の参照情報と共に、予め単一の
前記辞書に登録するプロセスを含む請求項11記載の情
報源所在推定プログラムを格納した記憶媒体。 - 【請求項13】 前記データ登録プロセスは、 前記情報源のスキーマの説明文を、該説明文の参照情報
と共に予め単一の前記辞書に登録するプロセスを含む請
求項11記載の情報源所在推定プログラムを格納した記
憶媒体。 - 【請求項14】 前記データ登録プロセスは、 前記情報源の保持するデータ値と、該情報源の保持する
データ値の様々な別表現形式と、該情報源のスキーマ
と、該情報源のカラム名の同義語と、該情報源のスキー
マの説明文の任意の組み合わせを、参照情報と共に、予
め単一の前記辞書に登録するプロセスを含む請求項11
記載の情報源所在推定プログラムを格納した記憶媒体。 - 【請求項15】 前記エンドユーザの指定した前記キー
ワードと、前記情報源の保持するデータ値・情報源の保
持するデータ値の様々な別表現形式・情報源のカラム名
の同義語・情報源のスキーマの説明文の間で適合度を計
算し、複数の情報源をユーザの要求の適合度の高いもの
から提示するプロセスを更に有する請求項11記載の情
報源所在推定プログラムを格納した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000207563A JP3567861B2 (ja) | 2000-07-07 | 2000-07-07 | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000207563A JP3567861B2 (ja) | 2000-07-07 | 2000-07-07 | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002024262A true JP2002024262A (ja) | 2002-01-25 |
JP3567861B2 JP3567861B2 (ja) | 2004-09-22 |
Family
ID=18704311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000207563A Expired - Lifetime JP3567861B2 (ja) | 2000-07-07 | 2000-07-07 | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3567861B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009217424A (ja) * | 2008-03-10 | 2009-09-24 | Fujitsu Ltd | 記憶部統合装置、記憶部統合プログラム、記憶部統合方法 |
JP2010267288A (ja) * | 2003-09-15 | 2010-11-25 | Ab Initio Technology Llc | データプロファイリング |
KR20140041546A (ko) * | 2011-06-14 | 2014-04-04 | 마이크로소프트 코포레이션 | 데이터 보강 제안 기법 |
US9323748B2 (en) | 2012-10-22 | 2016-04-26 | Ab Initio Technology Llc | Profiling data with location information |
US9449057B2 (en) | 2011-01-28 | 2016-09-20 | Ab Initio Technology Llc | Generating data pattern information |
US9892026B2 (en) | 2013-02-01 | 2018-02-13 | Ab Initio Technology Llc | Data records selection |
US9971798B2 (en) | 2014-03-07 | 2018-05-15 | Ab Initio Technology Llc | Managing data profiling operations related to data type |
US10721220B2 (en) | 2011-06-14 | 2020-07-21 | Microsoft Technology Licensing, Llc | Data custodian and curation system |
US11068540B2 (en) | 2018-01-25 | 2021-07-20 | Ab Initio Technology Llc | Techniques for integrating validation results in data profiling and related systems and methods |
US11487732B2 (en) | 2014-01-16 | 2022-11-01 | Ab Initio Technology Llc | Database key identification |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04291668A (ja) * | 1991-03-20 | 1992-10-15 | Mitsubishi Electric Corp | 検索装置 |
JPH086964A (ja) * | 1994-06-15 | 1996-01-12 | Mitsubishi Electric Corp | データベース検索装置 |
-
2000
- 2000-07-07 JP JP2000207563A patent/JP3567861B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04291668A (ja) * | 1991-03-20 | 1992-10-15 | Mitsubishi Electric Corp | 検索装置 |
JPH086964A (ja) * | 1994-06-15 | 1996-01-12 | Mitsubishi Electric Corp | データベース検索装置 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8868580B2 (en) | 2003-09-15 | 2014-10-21 | Ab Initio Technology Llc | Data profiling |
JP2010267288A (ja) * | 2003-09-15 | 2010-11-25 | Ab Initio Technology Llc | データプロファイリング |
JP2010267289A (ja) * | 2003-09-15 | 2010-11-25 | Ab Initio Technology Llc | データプロファイリング |
US9323802B2 (en) | 2003-09-15 | 2016-04-26 | Ab Initio Technology, Llc | Data profiling |
JP2009217424A (ja) * | 2008-03-10 | 2009-09-24 | Fujitsu Ltd | 記憶部統合装置、記憶部統合プログラム、記憶部統合方法 |
US9449057B2 (en) | 2011-01-28 | 2016-09-20 | Ab Initio Technology Llc | Generating data pattern information |
US9652513B2 (en) | 2011-01-28 | 2017-05-16 | Ab Initio Technology, Llc | Generating data pattern information |
JP2014523013A (ja) * | 2011-06-14 | 2014-09-08 | マイクロソフト コーポレーション | データエンリッチメントの推奨 |
US10721220B2 (en) | 2011-06-14 | 2020-07-21 | Microsoft Technology Licensing, Llc | Data custodian and curation system |
KR20140041546A (ko) * | 2011-06-14 | 2014-04-04 | 마이크로소프트 코포레이션 | 데이터 보강 제안 기법 |
KR101976220B1 (ko) | 2011-06-14 | 2019-05-07 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 데이터 보강 제안 기법 |
US10540349B2 (en) | 2011-06-14 | 2020-01-21 | Microsoft Technology Licensing, Llc | Recommending data enrichments |
KR102035984B1 (ko) | 2011-06-14 | 2019-10-23 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 데이터 보강 제안 기법 |
KR20190049924A (ko) * | 2011-06-14 | 2019-05-09 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 데이터 보강 제안 기법 |
US9323748B2 (en) | 2012-10-22 | 2016-04-26 | Ab Initio Technology Llc | Profiling data with location information |
US9990362B2 (en) | 2012-10-22 | 2018-06-05 | Ab Initio Technology Llc | Profiling data with location information |
US9569434B2 (en) | 2012-10-22 | 2017-02-14 | Ab Initio Technology Llc | Profiling data with source tracking |
US9323749B2 (en) | 2012-10-22 | 2016-04-26 | Ab Initio Technology Llc | Profiling data with location information |
US10719511B2 (en) | 2012-10-22 | 2020-07-21 | Ab Initio Technology Llc | Profiling data with source tracking |
US10241900B2 (en) | 2013-02-01 | 2019-03-26 | Ab Initio Technology Llc | Data records selection |
US9892026B2 (en) | 2013-02-01 | 2018-02-13 | Ab Initio Technology Llc | Data records selection |
US11163670B2 (en) | 2013-02-01 | 2021-11-02 | Ab Initio Technology Llc | Data records selection |
US11487732B2 (en) | 2014-01-16 | 2022-11-01 | Ab Initio Technology Llc | Database key identification |
US9971798B2 (en) | 2014-03-07 | 2018-05-15 | Ab Initio Technology Llc | Managing data profiling operations related to data type |
US11068540B2 (en) | 2018-01-25 | 2021-07-20 | Ab Initio Technology Llc | Techniques for integrating validation results in data profiling and related systems and methods |
Also Published As
Publication number | Publication date |
---|---|
JP3567861B2 (ja) | 2004-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7092936B1 (en) | System and method for search and recommendation based on usage mining | |
KR101721338B1 (ko) | 검색 엔진 및 그의 구현 방법 | |
US6529903B2 (en) | Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query | |
JP5265739B2 (ja) | 多数のクエリー修正モデルの統合 | |
US6865575B1 (en) | Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query | |
US6850934B2 (en) | Adaptive search engine query | |
US7120574B2 (en) | Synonym extension of search queries with validation | |
JP5224851B2 (ja) | 検索エンジン、検索システム、検索方法およびプログラム | |
US20040158560A1 (en) | Systems and methods for query expansion | |
US7310633B1 (en) | Methods and systems for generating textual information | |
WO2002101588A1 (fr) | Systeme de gestion de contenus | |
US20070214128A1 (en) | Discovering alternative spellings through co-occurrence | |
US20090083024A1 (en) | Apparatus, method, computer program product, and system for machine translation | |
JP2015525929A (ja) | 検索品質を改善するための重みベースのステミング | |
US6941293B1 (en) | Methods and apparatus for determining equivalent descriptions for an information need | |
JP2002132812A (ja) | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 | |
JP4967037B2 (ja) | 情報検索装置、情報検索方法、端末装置、およびプログラム | |
JP2002024262A (ja) | 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体 | |
US20020129026A1 (en) | Process for accessing information via a communications network | |
JP2001188802A (ja) | 情報検索装置及び情報検索方法 | |
JP3786233B2 (ja) | 情報検索方法および情報検索システム | |
JP4499179B1 (ja) | 端末装置 | |
JP4057962B2 (ja) | 質問応答装置、質問応答方法及びプログラム | |
KR20030075219A (ko) | 벡터문서모델을 이용한 동일/유사제품 클러스트링 장치 및그 방법 | |
JP2001134597A (ja) | 複数異種情報源アクセス方法及び装置及び複数異種情報源アクセスプログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040607 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3567861 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090625 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090625 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100625 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100625 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110625 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120625 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130625 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140625 Year of fee payment: 10 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |