JPH05502533A - 情報検索のための適応階層化装置 - Google Patents

情報検索のための適応階層化装置

Info

Publication number
JPH05502533A
JPH05502533A JP3514691A JP51469191A JPH05502533A JP H05502533 A JPH05502533 A JP H05502533A JP 3514691 A JP3514691 A JP 3514691A JP 51469191 A JP51469191 A JP 51469191A JP H05502533 A JPH05502533 A JP H05502533A
Authority
JP
Japan
Prior art keywords
record
relevance
item
query
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3514691A
Other languages
English (en)
Inventor
チャン,シーチオ
チョウ,アニタ
ドゥー,ミンウェン
Original Assignee
ジーティーイー ラボラトリーズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジーティーイー ラボラトリーズ インコーポレイテッド filed Critical ジーティーイー ラボラトリーズ インコーポレイテッド
Publication of JPH05502533A publication Critical patent/JPH05502533A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 、のための 口 本出願は一般にはコンピュータをベースにした情報検索装置に関するものであり 、特に、フルテキストデータベースから情報を検索する装置に関する。詳述する と、本出願は、レコードが、照会項目に対するレコードの関連性あるいは再現性 (relevance)にしたがって階層化されるフルテキストデータベースの ための新規な適応性のあるレコード階層化方式に関するものである。本発明の装 置は多重レベル(ML)のレコード関連性重み付けあるいは順序付はモデルに基 づく。
従来技術においては、フルテキスト形情報検索における潜在的なヒツトから関連 情報を選択するのを助けるために多くの類似性の尺度が提案されている。関連性 を定量化するという目的で種々の項目重み付は方式もまた設計されている。関連 性フィードバックを使用して探索プロセスにおける照会を洗練化するかまたは自 動的に発生する努力も行なわれている。ところが、関連性の概念はユーザの解釈 を受けやすくそれゆえ性質上あいまいであるから、一つの固定した類似性の尺度 すなわち重み付は方式がいつか完全になるということはあり得ないことは明瞭で ある。
関連性フィードバックプロセスを介してユーザーの予想に適合し得る融通性のあ る重み付は方式を有することが所望されている。ニス・シー・チャン(S、−C ,Chang)およびダブル・シー・チェノ(W、−仁Chen)による、19 87年10月発行のProc、 ASIS Annual Meeting 1 987第30頁〜35頁所収の” And−1ess Retrieval:  TowardPerfect Ranking”という記事で提案されている多 重レベルレコード関連性重み付はモデルは、重み付けおよび階層化プロセスを動 的に指定および制御するための自然的な基礎を提供することを狙った唯一の従来 モデルである。かかる多重モデルは、多重レベルでレコード−項目重み付は基準 をモデル化することによりこれらの利益を可能にする。それゆえ、複雑でモして 相矛盾しさえする重み付は基準が種々のレベルを分類整理可能である。各レベル は簡単な基準だけを包摂するので、多重レベルモデルの下で重み付は規則につい て記述しそしてユーザがこれを理解するのが簡単である。それゆえユーザがこれ らの基準の変更を通じて直接的な指示を得ることが可能、である。
プール演算子が情報検索にとって十分な程度には融通性のないことが知られてい る。ジー・サルトン(G、 5alton)、イー・エイ・フォックス(E、  A、 Fax)およびエイチ・つ(H,Wu lによる 1983年12月発行 のCACM 、 26(912) 、第1022頁〜1036頁所収の ” E xtended BooleanRetrieval”およびエイ・ブックスタ イン(A。
Bookstein)による 1980年7月発行のJournal ASTS 、第240頁〜247頁所収の ” An Approach to Weig htedBoolean Retrieval ”において、かかるプール演算 子を「柔軟」にする努力が払われている。しかし、彼らは依然として演算子を保 持し、そして上述のモデルはかかるプール演算子を置換するよう設計されている 。いずれの2つの照会項目でも、以下の関係がプール演算子および近接性演算子 間で保持されることは知られている事実である。
ADJ−1AI’iD →OR すなわち、近接性は両方の項目の存在を意味しており、両方の項目の存在はこれ らのうち少な(とも一つは存在することを意味する。多重レベルモデルは、プー ル演算子および近接性演算子間のこの自然な関係を捕捉できる(それにより演算 子の使用を除去する)ことが示された。これを行なうために、近接性をモデル化 するためにフレーズ(句)の出現およびワード(語)の出現を定量化する均一な 方法が確立された。
引用した上記刊行物においては、実験的な情報検索システムFAIRS(198 8年3月発行のProc、 RIAO88、第172頁〜182頁所収の” T owards a Fr1endly AdaptableInformati on Retrieval System (使用しやすい適応情報検索システ ム)”参照)内のテキストエディタを使用してプロログ(Prolog)コード を修正する方式が、探索中に重み付は式を変更できることを示す証拠として呈示 された。ところが、テキストエディタをプロログコードへ適用することは、いず れのユーザによっても習熟せられるようなタスクではない。本出願では我々は、 多重レベルモデルで項目重み付けが行なわれる仕方をいずれのユーザでも容易に 制御できるFAIR3におけるスプレッドシート重み付は制御方式を開示するa FAIR3は主としてプロログで記述されている。プロログがその規則を動的に 書き直すという能力が使用されかかる特徴を実施する。
本発明は、フルテキスト情報検索システムのために、適応性のある多重レベルレ コードの階層化を行ない、それにより被検索レコードが、照会項目に対するそれ らの関連性に関して定量的に階層化されそし、てユーザが関連性因子を指定し各 レベルでかかる関連性因子の相対的な重み付けを行なうための方法に関する。第 1のステップでは、ユーザはフルテキストデータベースを探索するための一組の 照会項目(−項目は一ワード以上包摂可能である)を選択する。第2のステップ で、ユーザは複数の関連性因子を選択しそしてこれらを複数のレベルで順序付け そしてそれぞれの関連性因子ごとにユーザが所定の探索レベルについてユーザの 照会項目に対するいずれのレコードの関連値に影響を与える当該照会項目の性質 の属性について値を割り当てる。ユーザは順次照会項目を包摂するレコードにつ いてフルテキストデータベースの探索をリクエストする。
次のステップでは、各照会項目ごとに、システムは、レコードにおける当該項目 の出現数の関数としてそして一ワード以上包摂する項目については当該項目のワ ードの出現間の距離の関数として、当該項目を包摂する被検索レコードごとに第 1の関連性重み付けを計算する。引き続くステップでは、システムは、各照会項 目ごとにそして各関連性因子ごとの前記各属性ごとに、前記第1の重み付は値お よび前記関連性因子の関数として被検索レコードごとに第2の関連性重み付は値 を計算する。後続のステップでは、システムは、各被検索レコードごとに、当該 レコードに出現する前記照会項目の全てについて、前記第2の重み付は値の全て の関数として第3の関連性重みを計算する。そして、最後のステップでは、シス テムは、各レベルの第3の関連性重みの定量化値にしたがってすべての被検索レ コードを階層化する。先行レベルでの重み付けによって決定される階層順序は、 後続レベルでの重み付けによって決定される順序に対して優先権を有する。すな わち、レコードは最初にレベル1での重み付けによって階層化される。もし2つ のレコードがレベル1で等しい重み付けを有することが見出されれば、レベル2 の重みがこれらレコードを区別するのに使用される(以下同様)。
本発明の別の様相において、ユーザは種々の値を関連性因子の属性に割り当て種 々のレベルでの階層化を得ることができる。
区」LL」L男 第1図は、本発明の一実施例が実施されるハードウエアおよびオペレーティング ソフトウェア装置を図示するブロック図である。
第2図は、本発明の実施例で使用されるフルテキストデータベース入力を付与( indexing)するための情報処理のフローチャート図である。
第3図は、第2図のフルテキストデータベースからの情報検索を行なうための照 会プロセスの情報処理フローチャート図である。
第4図は、所定のレベルでのレコード重みの決定を図示する本発明の適応階層化 装置の一実施例のフローチャート図である。
第1図は、引用した上記刊行物において部分的に開示されており頭辞語FAIR 3によって指示される実験的情報検索装置のためのハードウェアシステムおよび オペレーティングシステム環境のブロック図である。 FAIRSは、それぞれ がそれ自身のオペレーティングシステムを使用するところの複数のコンビエータ システムに対して作動する。全てのシステムの主要特徴は参照番号12によって 示されている大容量のデータ記憶装置である。
第2図は、FAIRSを使用する大型システムにおいて、フルテキストデータベ ース入力を行ないそしてデータベースを指標付けるあるいは索引付けるための情 報処理動作の流れを図示するフローチャート図である。オリジナルテキストファ イル21が現状のまま記憶製雪12へ読み込まれ、ユーザが随意にレコードマー カを指定すると、それぞれのファイルに名前が付けられそしてそのファイル名へ の拡張子として、 TXTを有する。ユーザはさらにユーザファイルについてシ ステム22へ説明し、拡張子として、 SRCを有するユーザファイルのリスト 、拡張子として、CFGを有するユーザファイルの構成、拡張子として、 NE Wを有する追加の新規ファイルを提供する。ユーザは指標付けられないワードか らなる否定辞書23(、NEG)をも提供する。入力21.22および23はF AIRSプログラムの下で、適応情報読取り/構文解析系24により処理される 。かがるプロセスの一部としての指標作成器25が検索にとって必要なインデッ クスファイルを26を発生する。インデックスファイルの主要構成要素が、テキ ストファイル21におけるワードの全出現場所に対するインデックスである倒置 ファイル、 INV27である。残余のインデックスファイル(28a、28b 、28c、28d)は、それぞれのワードを有するレコードの場所(、REC) 、ワードの出現場所(、LOC)、各レコードのアドレス(、ADR)およびユ ーティリティファイル(、CNT)を含む。
第3図はシステムへ入力されたファイルから照会を通じて情報を検索する情報処 理のフローチャート図である。ユーザの照会31を綴り変化33および同義語定 義34について検査することによりかがるユーザの照会31は改善される(32 )。ユーザが照会を確認した後、インデックスファイル26は照会項目を包摂す るレコードを探索するのに使用される(35)。探索において見出されたレコー ドは階層化規則37にしたがって階層化が行なわれる(36)、オリジナルファ イル21はユーザフィードバックを行なうために表示される(38)。
この時点で、ユーザは関連性情報をフィードバック(39a)L、て探索を洗線 化できるし、また被検索テキストレコード39を受け取り(39b)そしてこれ らを別途の使用のために他の媒体へ転送でき′る。
本発明はかかる情報の流れにおける上述のファイルの階層化およびユーザ関連性 フィードバックに直接間わるものである。
以下、我々は、先に引用された我々の初期の刊行物において提案された多重レベ ル重み付はモデルおよび近接性モデルの簡単な全体像を与えそして順次どのよう にしてこれがテキストエディタに代わる我々のスプレッドシート方式において具 体化されるかを説明する。ベクトルをベースにした類似性の尺度は、ベクトル類 似測定値が対応するベクトルによって表現されるレコードまたは照会の関連関係 をある程度定量化するであろうということを期待して、レコード関連性をモデル 化するのに使用されることが多い。かかるベクトルベースの類似性尺度を設計ま たは洗線化するのに2つの種別の試みがあった。第1の種別は、内積あるいはコ サイン尺度などの所定のベクトル類似式を使用することである。第2の種別は、 ワード頻度計数などのある種の項目出現の性質を表す種々の重み付は関数を使用 することである。
多重レベルモデルはある意味において第2の種別の試みのうちの一つとして描像 可能である。しかし、多重レベルモデルは伝統的な重み付はモデルおよび関連モ デルとは異なる。なぜならそれはとりわけ照会とレコードとの間の関連性をモデ ル化するように設計されているからである。それは2つのレコード間の関連性を 測るようになってはいない。そのようなわけで、多重レベルモデルは同一のベク トルが関連性が低いとして測られるのをわざと許容しているが、これはベクトル ベースの類似性尺度の伝統的な精神とは異なるようにみえる。
ベクトル空間の観点から、ある誘電(寸法がnの可能なワード)を有するレコー ドRと照会Qとの間の関連性を評価するための多重レベル関連性重み付はモデル は、f (WQ、 ・ WR,+1≦n≦n+m) (、)として表現可能であ る(ここで、Q′はQのスーパーセットである)、Q′はモデルによってQから 発生されるm個の余分の「ダミーワード」 (以下で説明する)を包摂可能であ る。2つの重み付は関数WO,Wアは非常に異なる。照会−項目重み付は形関数 Woはたとえユーザが照会項目について明示の重みを指定可能であるとしても常 にバイナリである。レコード−項目重み付は関数Woはレコード項目をベクトル へ対応付ける。多重レベルモデルの主な強勢点は多重レベルを有しそれゆえ複雑 かつ相矛盾しさえするユーザの関連性解釈を(種々のしベルで)指定できるW3 に置かれる。
もし我々が式(1)で関数fの代わりに全てのiにわたる加法を用いれば、式( 1)は、スカラーとベクトルとの乗法である演算子「*」を除いて、ちょうど内 積のようにみえる。実際、これがまさに我々のスプレッドシート方式で行なわれ ていることである。
多重レベルモデルにおいては、TERMl、TERM2、・・・、TERMiと いう簡単な照会形式が想定されている。照会におけるコンマは項目(terll りの境界を区別するのに使用されている。TERMiは単一ワード(簡単な項目 )でもよいしフレーズ(複雑な項目)でもよい。近接性は多重レベルモデルへの 準備で最初にモデル化される。
゛ のモデル 以下のS個のワードからなる複雑な照会項目を考える。
Ll、、l’ld2・・・Wd。
我々は、連続ワード間の近接関係を表示するのに、以下の5−19のダミーワー ドを発生する。
wd、2.Wd2i、”’、Wd+−++−すなわち、Wd+iはワードWd、 とワードWd、との近接性を表わす。これらのダミーワードはワードベアのレコ ードに8ける出現間の距離の効果を説明するために発生される。
ダミーワードの各出現が以下のように定義される。
Wd、およびWd、がある照会の複雑な項目Wd、、Wd2.・・・Wd。
における近接ワードのベアであると仮定する。我々は別途に、ワードベア(Wd 、およびwdJ)はできるだけ最小限の距離dでもってレコード中に生ずると仮 定するが、かかる最小限の距離はレコードをワードからなる線形ストリングとし て眺めることにより計算されそれゆえ距離dは1+(その間のワード数)である 。そのとき、かかるWd、 Wd、の各出現は、項目Wd、 、 Wdz 、・ ・・、Wd、の全出現に対して 寄与するであろう(ここで、kは我々の実施において現在は1にセットされてい る)。数28−1は、実際のワード数Sとダミーワード数s−1の和である。我 々は、ワードの実際の出現とそれらの近接存在とが項目の出現に等しく寄与しそ して近接因子はそれらの距離に応じて調整されることを仮定している。それゆえ もし2つのワードWd、 、 Wd、がレコードで互いに近接していれば(すな わち距離dが1に等しい)、そのとき我々は、ダミーフードWd、1の全出現数 に近い完全な1(1,/1)出現を計数するであろう。しかし、もしベアがより 大きな距離で出現するならば、出現の有意性は漸次減縮される。
それゆえ、多重レベルモデルの定義においては、名称「項目」が使用される場合 、それはワードまたはダミーフードを意味する。フレーズはフレーズ中のワード そして対応するダミーワードに関して定義される。
たとえば、我々はフレーズAB (s=2)を有しそして 一−−AB−B−−A−−B−−− からなるレコードを有すると仮定する(ここでダッシュは無関係なワードの出現 を権ポする)。ダミーフードWd□は、それぞれ距離が1および3のABおよび A−−Bという2つの出現によって表わされる。このレコードにおけるWdA、 の全出現数は、 として計算されるであろう。
同時に、実際のワードAおよびBの5つの出現がある。それゆえ、項目ABの全 出現は として計算される。
こうして、ワードAおよびBが近接せられるかあるいはおよそ5ワ一ド以内であ るかを指定することのジレンマが解〆肖される。ユーザがしなければならないこ とは、フレーズ中のワードを指定することであり、レコードにおけるワード間の 出現が接近すればおそら(レコードは大きな重みを獲得する。
レベルモデル 所定の照会について、レコードrにおける所定の項目tの関連性重みWtrは、 順序付けられたn個組(ベクトル)によって以下のように表わされる。
Wtr: (F、 、F2 、・・・、Fn )七Y 七r tr ここで、Fl は実数値関数である。関連性因子F+七Y はユーザにより決定されるそれらの相対的な重要性によって順序付けられる。す なわち、関連性決定の観点から、F、 はF2 よりも重要であり、Fitいは F *、。
皆 伊 よりも重要である(以下同様)。被検索レコードについての階層はn個の座標の 値にしたがって関連性ベクトルを順序付けることにより決定される。
各因子F、ごとに、レコードrにおける項目tにつ+r いて、その値に影響を与え得るいくつかの(およそk)の属性Aがある。これら の属性関数は照会項目を実数へ対応付け、レコードに出現する項目のい(つかの 性質をとして表現できる(ここで”+r はレコードrにおける項目tQj番目 の属性である)。
照会−項目重み付は関数は常にバイナリであるから、照会Qに対するレコードr の関連性を評価するためのレベルiでのレコード−項目重み付は関数W+、は、 W、=f(F、tE Q′nQU (Qから発生されるダミー七−七− ワード) である。モデルの背後に隠れている直感的洞察は、被検索レコードの関連性が、 それぞれが種々の優先順位1こあるいくつかの因子にしたがってユーザにより判 定されることである。各レベルで、因子は、−組の属性を使用して重み付けられ る。たとえば、ORよりもANDの方が高いという優先順位は、すべての探索ワ ードが存在するか否かという基準だけが考察されるところのレベルとして表現し つる。このことは以下で明らかとなろう。
レベル み」モデルに づく 、スプレッドシート 多重レベルモデルは本質的にテキストベース中のレコードにおける探索ワードの 各出現がレコードの(照会に対する)関連性評価にとって有意味であるというこ とを告げている。関連性の有意性の大きさは多重レベル重み付はモデルにしたが って定義付けられる。関連性評価におけるレコードの有意性に対する各ワード出 現の寄与は種々のレベルでのかかる出現のいくつかの属性によって定量化される 。これらの指針に基づいて我々は我々の重み付は式の構築を開始する。
それは関連性評価のための相対的な順序付けを確立するのに十分であることに注 意されたい。すなわち、我々はレコードAがレコードBよりも関連性があるとい うことだけでどの程度かを知る必要はない。これは、階層化式を構築する方法を 大幅に簡単にする。それゆえ、我々は、レコードrについて各レベルiで関連性 重み付は因子貨1.を計算するための式を構築する際に、主演算子として乗法お よび加法を選択した。これらは正数の順序を保存する最も簡単な数学演算子であ る。すなわち、a、b、c、d (>O)について、 a≧b、c;i:d −a’b≧Cd≧が成り立つ(ここで、 は乗法または加 法のいずれかである)。
我々は、同じ項目tについて、それがレコード中に出現するたびに全ての属性A 、を接続するために乗法を選択している0項目の属性を表わす数は種々の事項を 意味し得るけれども、乗法はすべての重み付は情報を保存し、一方、加法は小さ な数を弁別する。同時に、乗法で【ま、逆数が否定的なあるいは負の効果を表す のに容易に使用できる。
もちろん、上述の議論は、すべての属性は等しく発生されることを仮定している 。他の属性に優るいくつかの属性に対する可能なユーザの偏向を補償するために 、我々は、レベルiでの各属性A4のための一定係数の選択肢を提供する。それ ゆえ、レベルiでのそしてレコードrにおける項目tについての関連性重み付は 因子F、がここに以下の式として具体化される。
七r ここで、 Fl/は、同様の一組の属性を持つ同様のプロセスを七Y 通じて得られ、かくして比較可能であるから、加法を使用することは合理的であ る。それゆえ、我々は多重レベルモデルにおける関数fのかわりに加法を選択す る。5多重レベルモデルによれば、照会−項目重み付は関数はノ\イナリである から、照会Qに対するレコードrの関連1生を評価するためのレベルiでの重み 付は関数W、い(ま以下の式で表される。
(ここでQ′=QU(Qから発生されるダミーワード)である) 上述した関連式を実施するスプレッドシート形適応可能方式を以下で説明する。
み・し およびそれらの5 現在、我々はユーザが、重み付はプロセスおよび階層化プロセスでレコードにお ける探索項目の出現ごとIこ5つだけの属性の影響を統制するのを許容している 。これら5つの属性は理解するのが容易で且つ直観的に分力)る。5つの属性は 以下の通りである。
1 重要性:ユーザによる項目指定の相対的な重み2、通俗性二項口を有するテ キストベースにおけるレコードの数 3、頻度性ニレコードにおける項目の出現数4、レコード識別子ニレコードの識 別番号5、ワード場所ニレコード内のワード出現の平均的な位置 レコード項目を定量化するため、5つの属性のなかでも特に通俗性および頻度性 が重み付は関数としてもつとも頻繁に使用される。重要性もまた頻繁に使用され るが、レコード項目ではな(照会項目についての限定要素としてより頻繁に使用 される。属性のレコード識別子およびワード場所は項目重み付は因子としてはほ とんど使用されなかったが、これらはときどき関連性の判定に影響を与える。レ コード識別番号は通常レコードがテキストベースに装入されるところの年代順を 指示し、ユーザの優先順位に影響を与え得る。さらに、ワード場所もまたユーザ にとって何かを意味し得る。たとえば、文書類の集合物を探索するときに、最初 に出現するワードは表題またはアブストラクトで使用されているワードであるこ とが多く、最後のワードは参照文献で現れることが多い、ユーザはこれらの状況 のうちの一つがユーザ4ことつてより重要なものであることを見出すであろう。
5つの属性は非常に異なるが、これらは多重レベルモデルとよ(なじむ。各属性 ごとに、「肯定的」、「否定的」または「中性的」という潜在的な3つの影響の うちの一つが指定される。「肯定的」とは、この属性の値がレコードの関連性に 正の影響を有することを意味している。この属性はそれゆえこのレコードについ ての関連性評価に対して掛は合わされる。「否定的」とは、この属性がレコード の関連性に否定的な影響を有することを意味している。この場合、属性値の逆数 がレコードの関連性評価に掛は合わされる。「中性的」とは、このレコードの関 連性評価に対して、この属性の影響が何らないことを意味する。この選択肢を選 択した結果として、レコードの関連性評価には常に定数1が掛は合わされる。潜 在的な各影響(「中性的」を除く)ごとに、係数が指定され属性を別途に定量化 する。たとえば、係数が3の肯定的な影響は、属性値が関連性評価における乗数 (multiplier)となる前に3倍されることを意味する。これは他の属 性に優る所定の属性を強調するのに使用可能である。もちろん、係数の考えは、 冨法や加法などの他の種別の計算を包摂するよう拡張可能である。しかし、我々 は、乗法がこの目的のために十分であろうと考える。重み付は規則のためのFA IR5における現行の省略値(デフォルト)は以下の通りである(すべての係数 は括弧で示されているように1にセットされている)。
レコードに される る ワードについてのレベルにおけるレコードの に・す るその属性の5各影響あるいは係数は個別に変更可能である。レベルは閉息に付 加または削除可能である。土台となる数式発生器が規則を順次対応する実行可能 なプロログコードへ変換する。 FAIR5はまた、ユーザが現行の規則が適当 であるかどうかを判定するために、拡張性関連性フィードバック(プレビュー) 機構(ニス・シー・エイ・チョウ(S、 C,and A、 Chat)による 1988年3月発行のProc。
RIAO88、第172頁〜188頁所収の” Towards aFrien dly Adaptable Information RetrievalS ystem”を参照されたい)を提供する。
数式発生プロセスは、近接性の取扱いのため多重レベルモデルにより発生される 「ダミーワード」を除き簡単明快である。本質的にはそれはレコードにおけるフ レーズの出現頻度を計数する方法である。かかるダミーワードの各「出現」はそ のフレーズ出現頻度の部分を表すOと1との間のある値を担い得る。数式発生器 は、属性の頻度性が中性ヘセントされているとき、レコードにおけるダミーワー ドの全出現中の最大値を選択しくこれはダミーワードについてたとえどのように 多くの出現があろうとも1だけが計数されそれゆえ我々は最大のものを拾うこと を意味する)、それ以外は、ダミーワードの全出現の平均値が使用される。
上述のデフォルト設定で示されているように、レコードは探索ワードの「範囲」 、すなわちレコードがどの(らいの数の明確に区別される探索ワードを有してい るか、にしたがって階層化される(レベル1)。これはANDのケースを取り扱 う。すなわち、探索ワードを全て有するレコードが最も上位に階層化される。も しかかるレコードが何ら存在しなければ、最も広範な範囲を持つレコードが自然 に選択される。k個の探索項目が賦与されているとすれば、検索されるレコード は自動的に以下の態様で階層化される。
(すべての項目を有する)、 (いずれかに−1個の項目)、 (いずれかに−2個の項目)、・・・ (いずれか1つの項目) これはもうすでに「いずれかN」の演算子よりも優れており、受は入れることの できる応答を得るためにユーザがプール演算子を入れ習える必要性がまったくな い。
第2レベル〜第4レベルでのデフォルト設定では、探索ワードの重要性およびレ コードにおけるその出現頻度は関連性評価に対して肯定的な影響を持つがワード の通俗性は否定的な影響を有すべきであることを述べている。それらの対応する 影響は列挙される順番で考えられる。
第5レベルのデフォルト設定は、他の全てが等しいとき、レコードをそれらの識 別番号にしたがって逆の順番に階層化することを述べている。レコード識別番号 がテキストベースに入れられるところの年代順を指示するとき、第3レベルの規 則は最も最後のレコードを最も上位に階層化するのと等価である。
我々のデフォルト設定における第6のレベルは、他の全てが等しいとき、レコー ドが探索ワードを先頭に、すなわちドキュメントまたはレコードの最初に、有す れば、このレコードに最も大きな重みを与えることを指示している。
この基本設定の変更が明瞭な方法で容易に行なえる。
たとえば、我々は幾人かのユーザがレベル6をレベル2まで移動し、探索ワード の出現の重要性を強調するのを見出した。
第4図は、ユーザの統制下にある任意のレベルでのレコードの重み決定のフロー チャート図である。
最初、レベルiでのレコードRについての重み付は因子WはW*’=O(40) である。
引き続き、項目使用者は各照会項目について近接性因子を措定する必要がないこ とを知る。なぜなら、レベルiでの項目Tの重みWはW T ’ = T 、l とT、l (これは参照番号41でレコードRにおける項目下のワードの最近接 出現の距離によって決定される)に等しいからである。
こうして、Tllは上述したように0と1との間の値を取る。
引き続き、ユーザはそれぞれの階層化属性をその係数を調整することにより定量 化できる(9照番号42)。
各階層化属性kについて、ユーザは、照会Qに対するレコードRの関連性に対す るその潜在的な影響が否定的(43)であるか、肯定的(44)であるかまたは 中性的(45)であるかを指定する。これは、係数因子1/Attrsい 1ま たはAttrSkを選択する。引き続き、システムは項目の当初の重みにこの因 子を掛は合わせ、項目について新規な重みW ’r ’ = W ? ”1’乗 算因子を得る(46)。順次、レベルiでのレコードRの重みW(w*’)はそ の以前の重みにレベルiでの項目Tの重みを加えて、 WR’=W11’+WT’ (48) となる。
全てのレベル1で、すべての項目について、このプロセスを繰り返すことにより 、レコードの重みが決定される(49)、プロセスが全てのレコードについて完 了したとき、照会に対するデータベースにおける各レコードの関連性が確立され る。
この出願では、我々は、フルテキスト形情報検索における階層化プロセスを与え そしてこれを制卸する新規な方法を開示した。ユーザは重み付は方式について知 らされておりそして完全な統制状態にある。このバージョンのFAIR5は形式 的評価のため権定人内のユーザに分配されている。この方式の初期評価は非常に 好ましいものであった。ユーザには情報検索における探索および階層化プロセス を統制する前例のない能力が与えられている。
いくつかの属性がレコード関連重み付けに対してかなり自然でかつ明瞭な意味を 持ちi尋るが、レコード識別子やワード場所などの他のいくつかの属性の関連性 に対する影響に対して一般的なコンセンサスあるいは合意事項は何ら存在しない ことは明らかである。それらの有用性はユーザがそのときに考えていることに依 存して主観的なものである。かかる属性の存在は、いずれの状況についても完全 な固定した階層化計画などの考えがないことを明瞭に証明している。ここに開示 した′ような適応性のある階層化方式こそ、ユーザがユーザに固有の探索を口論 む可能性を開(のである。
多重レベル重み付はモデルのこの現行の実施はシステムにより提供される固定し た数の属性によって依然として制限されている。ユーザに多重レベル重み付は規 則で使用されるユーザ自身の属性定義を許すことは階層化プロセスを統制する際 のユーザの能力を非常に高める。
FiG、2 FIG、 3 FIG、4 要 約 書 被検索レコードの当該レコードに生ずる照会項目に対する関連性ないし再現性を 定量化するフルテキスト情報検索のための適応性レコード階層化方法である。本 方法は、階層化プロセスの各レベルでレコード重み付けに影響を与えるユーザ入 力を可能にする多重レベル重み付は技術を使用する。本方法は、データベースの レコードに生ずる項目の性質の重み付けられた属性を使用しそして複雑な項目の 近接ワード間の距離を補償する。本方法は大きなフルテキストデータベースで実 施されそして結果的に生ずる階層化は、ユーザの照会に対する被検索レコードの 関連性の階層化において相当に高いレベルの精度を実現する。
国際調査報告

Claims (8)

    【特許請求の範囲】
  1. 1.フルテキスト形情報検索システムのために適応性のある多重レベルレコード 階層化を行ない、被検索レコードが照会項目に対するそれらの関連性に関して定 量的に階層化されるための方法において、 照会項目tからなるセットQを選択し、照会のフルテキスト形探索を形成する段 階にして、項目tは1ワード以上を包摂可能である前記段階と、 複数の関連性因子を選択および順序付け、前記照会項目を複数レベルで変更する 段階と、 各レベルについて照会項目tに対するいずれのレコードrの開運値にも影響を与 える当該照会項目tの性質の属性について、各関連性因子Fごとに、値を指定す る段階と、 フルテキストデータベースを探索し、当該照会項目tを包摂するレコードを検索 する段階と、各照会項目tについてはレコードrにおけるその出現の関数として 、そして1ワード以上有する項目についてはレコードrにおける当該項目tのワ ードの最近接出現間の距離の関数として、各検索レコードrごとに第1の関連性 重みを計算する段階と、 各照会項目tについてそして前記の各属性について、前記関連性因子に影響を考 える当該属性および前記第1の関連性重み値の関数として、各被検索レコードr ごとに第2の関連性重み値を計算する段階と、各被検案レコードrについて、前 記レコードrに出現する全ての照会項目tについての全ての第2の関連性重み値 の関数として第3の関連性重みを計算する段階と、レコードrの重みとして前記 第3の関連性重みを使用して各レベルでその階層を決定する段階と、前記照会Q における全ての照会項目について各レベルで前記第3の関連性重みの定置値にし たがって全ての被検索レコードを階層化する段階とを具備する方法。
  2. 2.各関連性因子Fについて、各レベルについて照会頂目tに対するいずれのレ コードrの関連性値にも影響を与える前記照会項目tの性質のうち少なくとも一 つの属性について少なくとも一つの異なる値を各関連性因子Fについて再度指定 し、 フルテキストデータベースを探索し、当該照会項目tを包含するレコードを検索 する段階と、各レベルについて、前記第1および第2および第3の関連性重みを 順番に再度計算する段階と、各レベルで前記再計算された第3の関連性重みの定 量値にしたがって全ての被検索レコードを階層化する段階にして、後続のレベル が前のレベルよりも優先性を与える当該段階とを具備する請求項1の方法。
  3. 3.第1の関連性重みを計算する段階は、もしtが単一ワードであれば、tの各 出現を1として計数し、 tがs個のワード(s>1)を包摂する場合は、項目tにおけるワードの連続ペ アの近接出現を計数することにより、tの各出現にtにおける各ワードの各出現 を加えたものを計数する段階にして、当該ペアにおけるワードの出現間の距離d は、以下の式 1/2s−1・1/dx(k≧1) により1+当該出現間のワード数である前記段階と、項目t内のs個のワードの 計数と近接計数とを加える段階と、 その和に1/(2s−1)を掛け合わせる段階とを具備する請求項1の方法。
  4. 4.第2の関連性重みを計算する段階は、レベルiでレコードrについて項目t の関連性に影響する各照会項目tのための一組の属性Aを選択する段階と、 各属性aについて係数を選択し他の属性に関係してその値を乗算する段階と、 レコードrにおける各項目tの各属性aについて、当該属性が肯定的、中性的ま たは否定的かどうかを指示する値を指定する段階と、 レコードrにおける各項目tの前記第1の計算された関連性重みにtの前記属性 の各々の前記関連性影響因子を掛け合わせ、前記第2の計算された関連性重みを 生ずる段階とを具備する請求項1の方法。
  5. 5.前記第3の関連性みを計算する段階は、レコードrに出現する各照会項目t の各属性について個々の第2の計算された関連性重みを加算し、各レベルについ てレコードrの重み付けられた関連性を得る段階とを具備する請求項1の方法。
  6. 6.レコード項目を定量化するために関連性重み関数に応じて選択される前記一 組の属性は、ユーザにより指定される項目tの相対的重みである重要性と、 項目tを有するテキストベースのレコードの数である通俗性と、 レコードrにおける項目tの出現数である頻度性と、レコードrの識別番号であ るレコード識別子と、レコードrにおける項目tのワードの出現の平均的な位置 であるワード場所と、 ユーザにより選択される他の任意の属性とを含む請求項3の方法。
  7. 7.レコードrにおける項目tの出現の属性の影響に対して値を割り当てる段階 は、 もし属性Ajtrがレベルiで肯定的な影響を有すれば値Ajtrを指定し、 もし属性Ajtrがレベルiで否定的な影響を有すれば値1/Ajtrを指定し 、 それ以外であれば、値1を指定することを具備する請求項4の方法。
  8. 8.照会Qに対するレコードrの関連性は、▲数式、化学式、表等があります▼ (ここでQ′=QU{Qから発光されるダミーワード}である)である請求項1 の方法。
JP3514691A 1990-08-29 1991-08-26 情報検索のための適応階層化装置 Pending JPH05502533A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/574,828 US5321833A (en) 1990-08-29 1990-08-29 Adaptive ranking system for information retrieval
US574,828 1990-08-29

Publications (1)

Publication Number Publication Date
JPH05502533A true JPH05502533A (ja) 1993-04-28

Family

ID=24297821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3514691A Pending JPH05502533A (ja) 1990-08-29 1991-08-26 情報検索のための適応階層化装置

Country Status (6)

Country Link
US (1) US5321833A (ja)
EP (1) EP0497960B1 (ja)
JP (1) JPH05502533A (ja)
CA (1) CA2071485A1 (ja)
DE (1) DE69132331T2 (ja)
WO (1) WO1992004681A1 (ja)

Families Citing this family (267)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
JPH05101107A (ja) * 1991-10-07 1993-04-23 Hitachi Ltd 適合率を用いた絞り込みデータ検索装置及び方法
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
JP2792293B2 (ja) * 1991-11-29 1998-09-03 日本電気株式会社 情報検索装置
US7242988B1 (en) * 1991-12-23 2007-07-10 Linda Irene Hoffberg Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US5428778A (en) * 1992-02-13 1995-06-27 Office Express Pty. Ltd. Selective dissemination of information
US5495578A (en) * 1992-04-06 1996-02-27 Hewlett-Packard Company Apparatus and method for changing the behavior of a computer program while retaining control of program execution
US5388259A (en) * 1992-05-15 1995-02-07 Bell Communications Research, Inc. System for accessing a database with an iterated fuzzy query notified by retrieval response
US5440481A (en) * 1992-10-28 1995-08-08 The United States Of America As Represented By The Secretary Of The Navy System and method for database tomography
US5511186A (en) * 1992-11-18 1996-04-23 Mdl Information Systems, Inc. System and methods for performing multi-source searches over heterogeneous databases
US5649183A (en) * 1992-12-08 1997-07-15 Microsoft Corporation Method for compressing full text indexes with document identifiers and location offsets
US5819259A (en) * 1992-12-17 1998-10-06 Hartford Fire Insurance Company Searching media and text information and categorizing the same employing expert system apparatus and methods
US5701459A (en) * 1993-01-13 1997-12-23 Novell, Inc. Method and apparatus for rapid full text index creation
EP0610760B1 (en) * 1993-01-28 2003-05-02 Kabushiki Kaisha Toshiba Document detection system with improved document detection efficiency
JPH06231180A (ja) * 1993-02-02 1994-08-19 A T R Shichokaku Kiko Kenkyusho:Kk 検索データの評価支援方式
US5541986A (en) * 1993-07-27 1996-07-30 Bell Communications Research, Inc. Method and system for automated telecommunications service script consolidation and downloading
US5504887A (en) * 1993-09-10 1996-04-02 International Business Machines Corporation Storage clustering and packing of objects on the basis of query workload ranking
US5692176A (en) * 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
US5903867A (en) * 1993-11-30 1999-05-11 Sony Corporation Information access system and recording system
US5761496A (en) * 1993-12-14 1998-06-02 Kabushiki Kaisha Toshiba Similar information retrieval system and its method
CA2120447C (en) * 1994-03-31 1998-08-25 Robert Lizee Automatically relaxable query for information retrieval
US5724567A (en) * 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
US6202058B1 (en) * 1994-04-25 2001-03-13 Apple Computer, Inc. System for ranking the relevance of information objects accessed by computer users
US5524240A (en) * 1994-05-24 1996-06-04 Panasonic Technologies, Inc. Method and apparatus for storage and retrieval of handwritten information
US5649023A (en) * 1994-05-24 1997-07-15 Panasonic Technologies, Inc. Method and apparatus for indexing a plurality of handwritten objects
US5710916A (en) * 1994-05-24 1998-01-20 Panasonic Technologies, Inc. Method and apparatus for similarity matching of handwritten data objects
US5854923A (en) * 1994-06-21 1998-12-29 International Business Machines Corp. Facility for the intelligent selection of information objects (persona)
US5706497A (en) * 1994-08-15 1998-01-06 Nec Research Institute, Inc. Document retrieval using fuzzy-logic inference
US6460036B1 (en) 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US8799461B2 (en) 1994-11-29 2014-08-05 Apple Inc. System for collecting, analyzing, and transmitting information relevant to transportation networks
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US9832610B2 (en) 1994-11-29 2017-11-28 Apple Inc. System for collecting, analyzing, and transmitting information relevant to transportation networks
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5577241A (en) * 1994-12-07 1996-11-19 Excite, Inc. Information retrieval system and method with implementation extensible query architecture
US5717913A (en) * 1995-01-03 1998-02-10 University Of Central Florida Method for detecting and extracting text data using database schemas
US5946678A (en) * 1995-01-11 1999-08-31 Philips Electronics North America Corporation User interface for document retrieval
JP3282937B2 (ja) * 1995-01-12 2002-05-20 日本アイ・ビー・エム株式会社 情報検索方法及びシステム
US5855015A (en) * 1995-03-20 1998-12-29 Interval Research Corporation System and method for retrieval of hyperlinked information resources
US5875110A (en) * 1995-06-07 1999-02-23 American Greetings Corporation Method and system for vending products
US7085729B1 (en) 1995-06-16 2006-08-01 I2 Technologies Us, Inc. System and method for allocating manufactured products to sellers
US6188989B1 (en) 1995-06-16 2001-02-13 I2 Technologies, Inc. System and method for managing available to promised product (ATP)
US5724571A (en) 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
US6466241B1 (en) 1995-07-17 2002-10-15 Gateway, Inc. Method and apparatus for managing program activation through use of a favorite program button menu
US6359636B1 (en) 1995-07-17 2002-03-19 Gateway, Inc. Graphical user interface for control of a home entertainment system
JPH0981574A (ja) * 1995-09-14 1997-03-28 Fujitsu Ltd 検索集合表示画面を利用したデータベース検索法およびシステム
US5717914A (en) * 1995-09-15 1998-02-10 Infonautics Corporation Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
US5737734A (en) * 1995-09-15 1998-04-07 Infonautics Corporation Query word relevance adjustment in a search of an information retrieval system
WO1997012334A1 (en) * 1995-09-25 1997-04-03 International Compu Research, Inc. Matching and ranking legal citations
US5752241A (en) * 1995-11-14 1998-05-12 Lucent Technologies Inc. Method and apparatus for estimating transitive closure and reachability
US5826260A (en) * 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
US5754840A (en) * 1996-01-23 1998-05-19 Smartpatents, Inc. System, method, and computer program product for developing and maintaining documents which includes analyzing a patent application with regards to the specification and claims
US5808615A (en) * 1996-05-01 1998-09-15 Electronic Data Systems Corporation Process and system for mapping the relationship of the content of a collection of documents
US5826261A (en) * 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
TW490643B (en) * 1996-05-21 2002-06-11 Hitachi Ltd Estimated recognition device for input character string
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
US7555458B1 (en) 1996-06-05 2009-06-30 Fraud Control System.Com Corporation Method of billing a purchase made over a computer network
US20030195846A1 (en) 1996-06-05 2003-10-16 David Felger Method of billing a purchase made over a computer network
US8229844B2 (en) 1996-06-05 2012-07-24 Fraud Control Systems.Com Corporation Method of billing a purchase made over a computer network
US6745194B2 (en) * 2000-08-07 2004-06-01 Alta Vista Company Technique for deleting duplicate records referenced in an index of a database
US5745890A (en) 1996-08-09 1998-04-28 Digital Equipment Corporation Sequential searching of a database index using constraints on word-location pairs
US5765150A (en) * 1996-08-09 1998-06-09 Digital Equipment Corporation Method for statistically projecting the ranking of information
US5745898A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for generating a compressed index of information of records of a database
US5765149A (en) * 1996-08-09 1998-06-09 Digital Equipment Corporation Modified collection frequency ranking method
US5745889A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Method for parsing information of databases records using word-location pairs and metaword-location pairs
US6173298B1 (en) 1996-09-17 2001-01-09 Asap, Ltd. Method and apparatus for implementing a dynamic collocation dictionary
US6119114A (en) * 1996-09-17 2000-09-12 Smadja; Frank Method and apparatus for dynamic relevance ranking
US5913209A (en) * 1996-09-20 1999-06-15 Novell, Inc. Full text index reference compression
US5870740A (en) * 1996-09-30 1999-02-09 Apple Computer, Inc. System and method for improving the ranking of information retrieval results for short queries
US6199076B1 (en) * 1996-10-02 2001-03-06 James Logan Audio program player including a dynamic program selection controller
JP3841233B2 (ja) * 1996-12-18 2006-11-01 ソニー株式会社 情報処理装置および情報処理方法
GB9701866D0 (en) * 1997-01-30 1997-03-19 British Telecomm Information retrieval
US6415319B1 (en) 1997-02-07 2002-07-02 Sun Microsystems, Inc. Intelligent network browser using incremental conceptual indexer
US6006222A (en) * 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US6012053A (en) * 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
US5933822A (en) 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
WO1999005621A1 (en) * 1997-07-22 1999-02-04 Microsoft Corporation System for processing textual inputs using natural language processing techniques
US6182068B1 (en) * 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US6078916A (en) * 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
US6014665A (en) * 1997-08-01 2000-01-11 Culliss; Gary Method for organizing information
US6014664A (en) * 1997-08-29 2000-01-11 International Business Machines Corporation Method and apparatus for incorporating weights into data combinational rules
US6073130A (en) * 1997-09-23 2000-06-06 At&T Corp. Method for improving the results of a search in a structured database
US5946681A (en) * 1997-11-28 1999-08-31 International Business Machines Corporation Method of determining the unique ID of an object through analysis of attributes related to the object
US6067539A (en) * 1998-03-02 2000-05-23 Vigil, Inc. Intelligent information retrieval system
US6701516B1 (en) 1998-05-21 2004-03-02 Qifang Li P++ software
US6216123B1 (en) 1998-06-24 2001-04-10 Novell, Inc. Method and system for rapid retrieval in a full text indexing system
US7778954B2 (en) * 1998-07-21 2010-08-17 West Publishing Corporation Systems, methods, and software for presenting legal case histories
US7529756B1 (en) * 1998-07-21 2009-05-05 West Services, Inc. System and method for processing formatted text documents in a database
US6505202B1 (en) * 1998-08-04 2003-01-07 Linda Allan Mosquera Apparatus and methods for finding information that satisfies a profile and producing output therefrom
IL126373A (en) * 1998-09-27 2003-06-24 Haim Zvi Melman Apparatus and method for search and retrieval of documents
US6418429B1 (en) * 1998-10-21 2002-07-09 Apple Computer, Inc. Portable browsing interface for information retrieval
WO2000045341A1 (en) * 1999-01-29 2000-08-03 Lg Electronics Inc. Method of searching or browsing multimedia data and data structure
US7016916B1 (en) 1999-02-01 2006-03-21 Lg Electronics Inc. Method of searching multimedia data
US6584458B1 (en) 1999-02-19 2003-06-24 Novell, Inc. Method and apparatuses for creating a full text index accommodating child words
US8572069B2 (en) 1999-03-31 2013-10-29 Apple Inc. Semi-automatic index term augmentation in document retrieval
US8275661B1 (en) 1999-03-31 2012-09-25 Verizon Corporate Services Group Inc. Targeted banner advertisements
WO2000058863A1 (en) 1999-03-31 2000-10-05 Verizon Laboratories Inc. Techniques for performing a data query in a computer system
US7024416B1 (en) * 1999-03-31 2006-04-04 Verizon Laboratories Inc. Semi-automatic index term augmentation in document retrieval
US7047242B1 (en) 1999-03-31 2006-05-16 Verizon Laboratories Inc. Weighted term ranking for on-line query tool
US6826559B1 (en) * 1999-03-31 2004-11-30 Verizon Laboratories Inc. Hybrid category mapping for on-line query tool
EP1212699A4 (en) * 1999-05-05 2006-01-11 West Publishing Co SYSTEM, METHOD AND SOFTWARE FOR CLASSIFYING DOCUMENTS
US6385611B1 (en) * 1999-05-07 2002-05-07 Carlos Cardona System and method for database retrieval, indexing and statistical analysis
US6850891B1 (en) 1999-07-23 2005-02-01 Ernest H. Forman Method and system of converting data and judgements to values or priorities
US6718363B1 (en) * 1999-07-30 2004-04-06 Verizon Laboratories, Inc. Page aggregation for web sites
US7219073B1 (en) * 1999-08-03 2007-05-15 Brandnamestores.Com Method for extracting information utilizing a user-context-based search engine
US7630986B1 (en) * 1999-10-27 2009-12-08 Pinpoint, Incorporated Secure data interchange
WO2001042963A2 (en) * 1999-12-07 2001-06-14 Maier Robert J Methods and systems for selecting travel products
US8271316B2 (en) * 1999-12-17 2012-09-18 Buzzmetrics Ltd Consumer to business data capturing system
US6691098B1 (en) * 2000-02-08 2004-02-10 International Business Machines Corporation System and method for explaining exceptions in data
DE10014066A1 (de) * 2000-03-22 2001-09-27 Definiens Ag Verfahren zum Auffinden von Objekten
US7212996B1 (en) * 2000-04-20 2007-05-01 Jpmorgan Chase Bank, N.A. System and method for dynamic, multivariable comparison of financial products
US6912525B1 (en) 2000-05-08 2005-06-28 Verizon Laboratories, Inc. Techniques for web site integration
WO2001088662A2 (en) * 2000-05-17 2001-11-22 Answerfriend.Com Answering natural language queries
US6957213B1 (en) 2000-05-17 2005-10-18 Inquira, Inc. Method of utilizing implicit references to answer a query
US6697800B1 (en) * 2000-05-19 2004-02-24 Roxio, Inc. System and method for determining affinity using objective and subjective data
US6640218B1 (en) 2000-06-02 2003-10-28 Lycos, Inc. Estimating the usefulness of an item in a collection of information
CA2411184C (en) 2000-06-09 2015-02-24 Thanh Ngoc Nguyen Method and apparatus for data collection and knowledge management
US7117163B1 (en) 2000-06-15 2006-10-03 I2 Technologies Us, Inc. Product substitution search method
US7024418B1 (en) * 2000-06-23 2006-04-04 Computer Sciences Corporation Relevance calculation for a reference system in an insurance claims processing system
US7003506B1 (en) * 2000-06-23 2006-02-21 Microsoft Corporation Method and system for creating an embedded search link document
US6954731B1 (en) 2000-06-27 2005-10-11 Ncr Corporation Methods and system for optimizing a campaign
US20020059395A1 (en) * 2000-07-19 2002-05-16 Shih-Ping Liou User interface for online product configuration and exploration
NL1016056C2 (nl) * 2000-08-30 2002-03-15 Koninkl Kpn Nv Methode en systeem voor personalisatie van digitale informatie.
US7249044B2 (en) * 2000-10-05 2007-07-24 I2 Technologies Us, Inc. Fulfillment management system for managing ATP data in a distributed supply chain environment
US7370009B1 (en) * 2000-10-05 2008-05-06 I2 Technologies Us, Inc. Extreme capacity management in an electronic marketplace environment
US7197470B1 (en) * 2000-10-11 2007-03-27 Buzzmetrics, Ltd. System and method for collection analysis of electronic discussion methods
US7185065B1 (en) 2000-10-11 2007-02-27 Buzzmetrics Ltd System and method for scoring electronic messages
US20020059240A1 (en) * 2000-10-25 2002-05-16 Edave, Inc. System for presenting consumer data
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US7523060B1 (en) 2000-12-20 2009-04-21 I2 Technologies Us, Inc. System and method for negotiating according to improved matching criteria
US6708174B1 (en) * 2000-12-20 2004-03-16 I2 Technologies, Inc. System and method for retrieving information according to improved matching criteria
US7295999B1 (en) 2000-12-20 2007-11-13 Jpmorgan Chase Bank, N.A. System and method for determining eligibility and enrolling members in various programs
US6766316B2 (en) 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US8429051B1 (en) 2001-01-19 2013-04-23 Robert K. Samson Investment guidance system which enables individuals to rate and select assets based on personal investment preferences
US6778193B2 (en) 2001-02-07 2004-08-17 International Business Machines Corporation Customer self service iconic interface for portal entry and search specification
US6701311B2 (en) 2001-02-07 2004-03-02 International Business Machines Corporation Customer self service system for resource search and selection
US6643639B2 (en) 2001-02-07 2003-11-04 International Business Machines Corporation Customer self service subsystem for adaptive indexing of resource solutions and resource lookup
US6853998B2 (en) 2001-02-07 2005-02-08 International Business Machines Corporation Customer self service subsystem for classifying user contexts
US6785676B2 (en) 2001-02-07 2004-08-31 International Business Machines Corporation Customer self service subsystem for response set ordering and annotation
US6873990B2 (en) 2001-02-07 2005-03-29 International Business Machines Corporation Customer self service subsystem for context cluster discovery and validation
WO2002077897A1 (en) * 2001-03-13 2002-10-03 Minsoo Kang Digital map ranking system
US7065499B1 (en) * 2001-03-19 2006-06-20 I2 Technologies Us, Inc. Intelligent order promising
US7024371B2 (en) * 2001-04-13 2006-04-04 I2 Technologies Us, Inc. High availability planning and scheduling architecture
US7043444B2 (en) * 2001-04-13 2006-05-09 I2 Technologies Us, Inc. Synchronization of planning information in a high availability planning and scheduling architecture
US7003503B2 (en) * 2001-06-07 2006-02-21 Idealswork Inc. Ranking items
US20030014501A1 (en) * 2001-07-10 2003-01-16 Golding Andrew R. Predicting the popularity of a text-based object
US7146409B1 (en) * 2001-07-24 2006-12-05 Brightplanet Corporation System and method for efficient control and capture of dynamic database content
US6711569B1 (en) * 2001-07-24 2004-03-23 Bright Planet Corporation Method for automatic selection of databases for searching
US7284191B2 (en) * 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US20030130887A1 (en) * 2001-10-03 2003-07-10 Thurston Nathaniel Non-deterministic method and system for the optimization of a targeted content delivery
US8117072B2 (en) * 2001-11-13 2012-02-14 International Business Machines Corporation Promoting strategic documents by bias ranking of search results on a web browser
US7565367B2 (en) 2002-01-15 2009-07-21 Iac Search & Media, Inc. Enhanced popularity ranking
US20030157470A1 (en) * 2002-02-11 2003-08-21 Michael Altenhofen E-learning station and interface
US7266553B1 (en) * 2002-07-01 2007-09-04 Microsoft Corporation Content data indexing
US20040024756A1 (en) * 2002-08-05 2004-02-05 John Terrell Rickard Search engine for non-textual data
EP1540550A4 (en) * 2002-08-19 2006-09-27 Choicestream PERSONALIZED STATISTICAL RECOMMENDATION SYSTEM
US7249312B2 (en) * 2002-09-11 2007-07-24 Intelligent Results Attribute scoring for unstructured content
US20040049505A1 (en) * 2002-09-11 2004-03-11 Kelly Pennock Textual on-line analytical processing method and system
US6829599B2 (en) * 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
US7111000B2 (en) * 2003-01-06 2006-09-19 Microsoft Corporation Retrieval of structured documents
US7734627B1 (en) 2003-06-17 2010-06-08 Google Inc. Document similarity detection
US7599938B1 (en) 2003-07-11 2009-10-06 Harrison Jr Shelton E Social news gathering, prioritizing, tagging, searching, and syndication method
US7814089B1 (en) 2003-12-17 2010-10-12 Topix Llc System and method for presenting categorized content on a site using programmatic and manual selection of content items
US8271495B1 (en) 2003-12-17 2012-09-18 Topix Llc System and method for automating categorization and aggregation of content from network sites
US7249126B1 (en) * 2003-12-30 2007-07-24 Shopping.Com Systems and methods for dynamically updating relevance of a selected item
JP2005250980A (ja) * 2004-03-05 2005-09-15 Oki Electric Ind Co Ltd 文書検索システム、検索条件入力装置、検索実行装置、文書検索方法、および文書検索プログラム
US20050198559A1 (en) * 2004-03-08 2005-09-08 Kabushiki Kaisha Toshiba Document information management system, document information management program, and document information management method
US7725414B2 (en) 2004-03-16 2010-05-25 Buzzmetrics, Ltd An Israel Corporation Method for developing a classifier for classifying communications
US7716216B1 (en) * 2004-03-31 2010-05-11 Google Inc. Document ranking based on semantic distance between terms in a document
US20050246194A1 (en) * 2004-04-06 2005-11-03 Lundberg Steven W System and method for information disclosure statement management
US8612208B2 (en) 2004-04-07 2013-12-17 Oracle Otc Subsidiary Llc Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
US7747601B2 (en) 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US8082264B2 (en) * 2004-04-07 2011-12-20 Inquira, Inc. Automated scheme for identifying user intent in real-time
US7702618B1 (en) 2004-07-26 2010-04-20 Google Inc. Information retrieval system for archiving multiple document versions
US7711679B2 (en) 2004-07-26 2010-05-04 Google Inc. Phrase-based detection of duplicate documents in an information retrieval system
US7536408B2 (en) 2004-07-26 2009-05-19 Google Inc. Phrase-based indexing in an information retrieval system
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7599914B2 (en) * 2004-07-26 2009-10-06 Google Inc. Phrase-based searching in an information retrieval system
US7584175B2 (en) 2004-07-26 2009-09-01 Google Inc. Phrase-based generation of document descriptions
US7580929B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase-based personalization of searches in an information retrieval system
US7567959B2 (en) 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7426507B1 (en) * 2004-07-26 2008-09-16 Google, Inc. Automatic taxonomy generation in search results using phrases
US7199571B2 (en) * 2004-07-27 2007-04-03 Optisense Network, Inc. Probe apparatus for use in a separable connector, and systems including same
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
WO2006039566A2 (en) 2004-09-30 2006-04-13 Intelliseek, Inc. Topical sentiments in electronically stored communications
US8620717B1 (en) * 2004-11-04 2013-12-31 Auguri Corporation Analytical tool
US7539668B2 (en) * 2004-11-30 2009-05-26 International Business Machines Corporation System and method for sorting data records contained in a query result based on suitability score
US7792811B2 (en) * 2005-02-16 2010-09-07 Transaxtions Llc Intelligent search with guiding info
US8583632B2 (en) * 2005-03-09 2013-11-12 Medio Systems, Inc. Method and system for active ranking of browser search engine results
WO2006102122A2 (en) * 2005-03-18 2006-09-28 Wink Technologies, Inc. Search engine that applies feedback from users to improve search results
US9158855B2 (en) 2005-06-16 2015-10-13 Buzzmetrics, Ltd Extracting structured data from weblogs
JP2008545200A (ja) * 2005-06-28 2008-12-11 チョイスストリーム インコーポレイテッド 広告をターゲット化する統計システムの方法及び装置
US20070100779A1 (en) * 2005-08-05 2007-05-03 Ori Levy Method and system for extracting web data
US8429167B2 (en) 2005-08-08 2013-04-23 Google Inc. User-context-based search engine
US8027876B2 (en) 2005-08-08 2011-09-27 Yoogli, Inc. Online advertising valuation apparatus and method
US7930647B2 (en) * 2005-12-11 2011-04-19 Topix Llc System and method for selecting pictures for presentation with text content
JP2007257369A (ja) * 2006-03-23 2007-10-04 Fujitsu Ltd 情報検索装置
US7921099B2 (en) * 2006-05-10 2011-04-05 Inquira, Inc. Guided navigation system
US7526486B2 (en) 2006-05-22 2009-04-28 Initiate Systems, Inc. Method and system for indexing information about entities with respect to hierarchies
US8332366B2 (en) * 2006-06-02 2012-12-11 International Business Machines Corporation System and method for automatic weight generation for probabilistic matching
US8781813B2 (en) 2006-08-14 2014-07-15 Oracle Otc Subsidiary Llc Intent management tool for identifying concepts associated with a plurality of users' queries
US20080052674A1 (en) * 2006-08-25 2008-02-28 Donald Edward Little Code Aggregation and Sharing
US7739255B2 (en) * 2006-09-01 2010-06-15 Ma Capital Lllp System for and method of visual representation and review of media files
US8356009B2 (en) * 2006-09-15 2013-01-15 International Business Machines Corporation Implementation defined segments for relational database systems
US7698268B1 (en) * 2006-09-15 2010-04-13 Initiate Systems, Inc. Method and system for filtering false positives
US7685093B1 (en) * 2006-09-15 2010-03-23 Initiate Systems, Inc. Method and system for comparing attributes such as business names
US7660783B2 (en) * 2006-09-27 2010-02-09 Buzzmetrics, Inc. System and method of ad-hoc analysis of data
US20080109845A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp System and method for generating advertisements for use in broadcast media
US20080109409A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp Brokering keywords in radio broadcasts
US20080109305A1 (en) * 2006-11-08 2008-05-08 Ma Capital Lllp Using internet advertising as a test bed for radio advertisements
US8095476B2 (en) * 2006-11-27 2012-01-10 Inquira, Inc. Automated support scheme for electronic forms
US9405732B1 (en) 2006-12-06 2016-08-02 Topix Llc System and method for displaying quotations
US7908260B1 (en) 2006-12-29 2011-03-15 BrightPlanet Corporation II, Inc. Source editing, internationalization, advanced configuration wizard, and summary page selection for information automation systems
US8175989B1 (en) 2007-01-04 2012-05-08 Choicestream, Inc. Music recommendation system using a personalized choice set
US20080189163A1 (en) * 2007-02-05 2008-08-07 Inquira, Inc. Information management system
US8359339B2 (en) * 2007-02-05 2013-01-22 International Business Machines Corporation Graphical user interface for configuration of an algorithm for the matching of data records
US8515926B2 (en) 2007-03-22 2013-08-20 International Business Machines Corporation Processing related data from information sources
US8423514B2 (en) * 2007-03-29 2013-04-16 International Business Machines Corporation Service provisioning
WO2008121824A1 (en) * 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for data exchange among data sources
WO2008121700A1 (en) * 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for managing entities
WO2008121170A1 (en) * 2007-03-29 2008-10-09 Initiate Systems, Inc. Method and system for parsing languages
US7693813B1 (en) 2007-03-30 2010-04-06 Google Inc. Index server architecture using tiered and sharded phrase posting lists
US8086594B1 (en) 2007-03-30 2011-12-27 Google Inc. Bifurcated document relevance scoring
US7925655B1 (en) 2007-03-30 2011-04-12 Google Inc. Query scheduling using hierarchical tiers of index servers
US8166045B1 (en) 2007-03-30 2012-04-24 Google Inc. Phrase extraction using subphrase scoring
US7702614B1 (en) 2007-03-30 2010-04-20 Google Inc. Index updating using segment swapping
US8166021B1 (en) 2007-03-30 2012-04-24 Google Inc. Query phrasification
US8352511B2 (en) * 2007-08-29 2013-01-08 Partnet, Inc. Systems and methods for providing a confidence-based ranking algorithm
US9126116B2 (en) 2007-09-05 2015-09-08 Sony Computer Entertainment America Llc Ranking of user-generated game play advice
US9108108B2 (en) * 2007-09-05 2015-08-18 Sony Computer Entertainment America Llc Real-time, contextual display of ranked, user-generated game play advice
US8117223B2 (en) 2007-09-07 2012-02-14 Google Inc. Integrating external related phrase information into a phrase-based indexing information retrieval system
EP2193415A4 (en) 2007-09-28 2013-08-28 Ibm METHOD AND SYSTEM FOR ANALYZING A SYSTEM FOR THE ADJUSTMENT OF DATA SETS
US8713434B2 (en) 2007-09-28 2014-04-29 International Business Machines Corporation Indexing, relating and managing information about entities
EP2198374A4 (en) * 2007-09-28 2013-07-17 Ibm METHOD AND SYSTEM FOR ASSOCIATING DATA SETS IN SEVERAL LANGUAGES
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US8347326B2 (en) 2007-12-18 2013-01-01 The Nielsen Company (US) Identifying key media events and modeling causal relationships between key events and reported feelings
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US9317599B2 (en) * 2008-09-19 2016-04-19 Nokia Technologies Oy Method, apparatus and computer program product for providing relevance indication
US20100153181A1 (en) * 2008-12-11 2010-06-17 Georgia Tech Research Corporation Systems and methods for providing information services
US8346701B2 (en) * 2009-01-23 2013-01-01 Microsoft Corporation Answer ranking in community question-answering sites
US8244739B2 (en) * 2009-01-23 2012-08-14 Nec Corporation Data retrieval device using a skip table
US8407234B1 (en) 2009-04-10 2013-03-26 inFRONT Devices & Systems LLC Ordering a list embodying multiple criteria
US20110066497A1 (en) * 2009-09-14 2011-03-17 Choicestream, Inc. Personalized advertising and recommendation
WO2011044174A1 (en) * 2009-10-05 2011-04-14 Callspace, Inc Contextualized telephony message management
US20110099164A1 (en) * 2009-10-23 2011-04-28 Haim Zvi Melman Apparatus and method for search and retrieval of documents and advertising targeting
US9183173B2 (en) * 2010-03-02 2015-11-10 Microsoft Technology Licensing, Llc Learning element weighting for similarity measures
US9990429B2 (en) * 2010-05-14 2018-06-05 Microsoft Technology Licensing, Llc Automated social networking graph mining and visualization
US8874727B2 (en) 2010-05-31 2014-10-28 The Nielsen Company (Us), Llc Methods, apparatus, and articles of manufacture to rank users in an online social network
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
CN102043866B (zh) * 2011-01-25 2013-03-13 苏州普达新信息技术有限公司 基于表单特征的松弛搜索与优化排序方法
US8543577B1 (en) 2011-03-02 2013-09-24 Google Inc. Cross-channel clusters of information
US20120259676A1 (en) 2011-04-07 2012-10-11 Wagner John G Methods and apparatus to model consumer choice sourcing
US9442928B2 (en) 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
US9442930B2 (en) 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US9465889B2 (en) 2012-07-05 2016-10-11 Physion Consulting, LLC Method and system for identifying data and users of interest from patterns of user interaction with existing data
US9833707B2 (en) 2012-10-29 2017-12-05 Sony Interactive Entertainment Inc. Ambient light control and calibration via a console
US9753986B2 (en) 2012-12-17 2017-09-05 International Business Machines Corporation Multi-dimensional feature merging for supporting evidence in a question and answering system
US9501506B1 (en) 2013-03-15 2016-11-22 Google Inc. Indexing system
WO2014152010A1 (en) 2013-03-15 2014-09-25 Affinnova, Inc. Method and apparatus for interactive evolutionary algorithms with respondent directed breeding
US9483568B1 (en) 2013-06-05 2016-11-01 Google Inc. Indexing system
US10147108B2 (en) 2015-04-02 2018-12-04 The Nielsen Company (Us), Llc Methods and apparatus to identify affinity between segment attributes and product characteristics
CN108170693B (zh) * 2016-12-07 2020-07-31 北京国双科技有限公司 推送热词的方法及装置
US10561942B2 (en) 2017-05-15 2020-02-18 Sony Interactive Entertainment America Llc Metronome for competitive gaming headset
US10128914B1 (en) 2017-09-06 2018-11-13 Sony Interactive Entertainment LLC Smart tags with multiple interactions
US11449407B2 (en) 2020-05-28 2022-09-20 Bank Of America Corporation System and method for monitoring computing platform parameters and dynamically generating and deploying monitoring packages

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5850071A (ja) * 1979-12-28 1983-03-24 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文書抜粋記憶
JPS6455642A (en) * 1987-08-14 1989-03-02 Ibm Searching method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4422158A (en) * 1980-11-28 1983-12-20 System Development Corporation Method and means for interrogating a layered data base
US4417321A (en) * 1981-05-18 1983-11-22 International Business Machines Corp. Qualifying and sorting file record data
US4495566A (en) * 1981-09-30 1985-01-22 System Development Corporation Method and means using digital data processing means for locating representations in a stored textual data base
US4870568A (en) * 1986-06-25 1989-09-26 Thinking Machines Corporation Method for searching a database system including parallel processors
US4849898A (en) * 1988-05-18 1989-07-18 Management Information Technologies, Inc. Method and apparatus to identify the relation of meaning between words in text expressions
US4839853A (en) * 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5850071A (ja) * 1979-12-28 1983-03-24 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文書抜粋記憶
JPS6455642A (en) * 1987-08-14 1989-03-02 Ibm Searching method

Also Published As

Publication number Publication date
EP0497960A4 (en) 1993-09-15
DE69132331D1 (de) 2000-08-24
US5321833A (en) 1994-06-14
CA2071485A1 (en) 1992-03-01
EP0497960B1 (en) 2000-07-19
WO1992004681A1 (en) 1992-03-19
DE69132331T2 (de) 2000-11-30
EP0497960A1 (en) 1992-08-12

Similar Documents

Publication Publication Date Title
JPH05502533A (ja) 情報検索のための適応階層化装置
US8037061B2 (en) System and computer readable medium for generating refinement categories for a set of search results
Godin et al. Experimental comparison of navigation in a Galois lattice with conventional information retrieval methods
KR101301380B1 (ko) 네트워크 상에서의 문서의 바이어스된 클릭 거리를사용하는 순위 함수
US7644371B2 (en) User interface and method to facilitate hierarchical specification of queries using an information taxonomy
JP3719415B2 (ja) 情報検索方法、情報検索システム、およびプログラム
KR20120085731A (ko) 전자적 문서 집합으로부터 질의의 결과를 산출하는 방법, 시스템 및 장치
JP2006172446A (ja) 複合データアクセス
Kazai et al. The INEX evaluation initiative
TWI290687B (en) System and method for search information based on classifications of synonymous words
Prasad et al. A microcomputer-based image database management system
Gibbins et al. Applying mspace interfaces to the semantic web
KR20020089677A (ko) 문서 자동 분류 방법 및 이를 수행하기 위한 시스템
JP2004287835A (ja) オブジェクト表作成方法及びオブジェクト推薦方法及びオブジェクト表作成プログラム及びオブジェクト推薦方法
Sieverts et al. Software for information storage and retrieval tested, evaluated and compared Part 1—General introduction
JP2009064191A (ja) 情報検索支援装置、情報検索支援方法、プログラムおよび記録媒体
JP2008146209A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JP2006501545A (ja) オブジェクト分類のための顕著な特徴を自動的に判定する方法および装置
Sutanto et al. Automatic index expansion for concept-based image query
JP2002297668A (ja) ハイパーテキスト文書検索方法とその装置及びそのプログラムとこのプログラムを記録した記録媒体
Thao et al. A relevance model for Web image search
JP3690266B2 (ja) 文書データベース作成方法及び装置及び文書データベース作成プログラムを格納した記憶媒体
Cruz et al. Integrating layout into multimedia data retrieval
Oladele et al. Archival System for Projects Using Association Approach