JP2002140361A - 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体 - Google Patents

文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体

Info

Publication number
JP2002140361A
JP2002140361A JP2000331817A JP2000331817A JP2002140361A JP 2002140361 A JP2002140361 A JP 2002140361A JP 2000331817 A JP2000331817 A JP 2000331817A JP 2000331817 A JP2000331817 A JP 2000331817A JP 2002140361 A JP2002140361 A JP 2002140361A
Authority
JP
Japan
Prior art keywords
search
document
program
user
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000331817A
Other languages
English (en)
Other versions
JP3934325B2 (ja
Inventor
Yasuhiko Inaba
靖彦 稲場
Katsumi Tada
勝巳 多田
Natsuko Sugaya
菅谷  奈津子
Tadataka Matsubayashi
忠孝 松林
Akihiko Yamaguchi
明彦 山口
Mikihiko Tokunaga
幹彦 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000331817A priority Critical patent/JP3934325B2/ja
Priority to US09/952,594 priority patent/US6865571B2/en
Priority to EP01122142A priority patent/EP1209582B1/en
Priority to DE60141318T priority patent/DE60141318D1/de
Publication of JP2002140361A publication Critical patent/JP2002140361A/ja
Application granted granted Critical
Publication of JP3934325B2 publication Critical patent/JP3934325B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ある知識を誰が知っているかを提示し、その
知識を共有することを目的とする知識管理システムにお
いて、各ユーザの知識を手間なく適切に登録し、登録さ
れた知識のうち適切なものを提示し再利用する。 【解決手段】 主メモリ121に格納される情報検索プ
ログラム101は、ユーザが最初に検索条件を設定して
からレリバンスフィードバックを繰り返し、検索を終了
するまでをひとつの検索シーケンスとして抽出し、検索
シーケンス毎に履歴を検索シーケンス履歴格納ファイル
112に保存する。また履歴検索プログラム201は、
所定の検索条件に基づき検索シーケンス履歴格納ファイ
ル112を検索することにより、関連するノウハウを持
っているユーザを提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザが指定した
検索条件をもとに文書を検索する方法および装置に係わ
り、特に各ユーザのうち誰がどの情報を知っているか、
あるいは興味を持っているかという情報を検索して提示
する方法及び装置に関する。
【0002】
【従来の技術】近年、激化する企業間や組織間の競争に
おいて、作業効率を上げるために各人が持っている知識
やノウハウを共有し、再利用することが必要となってい
る。
【0003】このため企業や組織の中で、「この情報を
知っているのは誰であるか」といったことを知る方法
(以下「KnowWho検索」と呼ぶ)に対する要求が高まっ
てきている。たとえば、「A社に対する営業戦略を知っ
ている人物は誰であるか」といった検索を行なう必要が
ある。このようなKnowWho検索を実現する技術として、
以下に示す二つの技術がある。
【0004】まず第一の技術は、「特開平10−636
85号公報」に示されるように、各ユーザが過去に文書
検索システムを用いて検索を行なった際の検索条件式を
保存しておき、他のユーザがその保存された検索条件式
を検索することで、目的の情報を知っているユーザを検
索する、という技術である(以下、従来技術1と呼
ぶ)。
【0005】この技術による処理の流れを図2のPAD
(Problem Analysis Diagram)
図を用いて説明する。この処理ではステップ301にお
いて、ステップ302〜ステップ309の処理をシステ
ム終了まで繰り返す。まずステップ302において、ユ
ーザからの入力を受け付ける。次にステップ303にお
いて文書検索要求が入力されたと判定された場合には、
以下のステップ304〜ステップ306の処理を実行す
る。まず、ステップ304において、ユーザからの検索
条件式を受け付ける。次に、ステップ305において、
ステップ304で取得した検索条件式にもとづいて文書
を検索する。次に、ステップ306において、ステップ
304で取得した検索条件式を保存する。
【0006】また、ステップ307において、検索条件
式の検索が要求されたと判定された場合には、以下のス
テップ308〜ステップ309の処理を実行する。ま
ず、ステップ308において、ユーザからの検索条件式
を受け付ける。次に、ステップ309において、ステッ
プ306で保存した検索条件式のうち、ステップ308
で取得した検索条件式に類似した検索条件式を利用した
ユーザ名を提示する。
【0007】たとえば、"「A社」「営業」「戦略」の
3語を含む文書を検索する"という検索条件を入力する
と、過去に類似した検索条件式を入力したユーザの名前
を検索結果として提示することが可能となる。このこと
により、「A社に対する営業戦略」を知っていると思わ
れる人物を推測することが可能となる。
【0008】また第二の技術は、「特開平10−833
86号公報」に示されるように、各ユーザが自分の知っ
ているノウハウを表すデータ(以下、個人プロファイル
と呼ぶ)を予め登録しておき、他のユーザが個人プロフ
ァイルを検索することにより、目的とする情報を知って
いる人物が誰であるかを提示する、という技術である
(以下、従来技術2と呼ぶ)。この技術による処理の流
れを図3のPAD図を用いて説明する。
【0009】この処理ではステップ401において、ス
テップ402〜ステップ408の処理をシステム終了ま
で繰り返す。まずステップ402において、ユーザから
の入力を受け付ける。次にステップ403において、ノ
ウハウの登録が要求されたと判定された場合には、以下
のステップ404〜ステップ405の処理を実行する。
まずステップ404において、ユーザからそのユーザの
持っているノウハウの入力を受け付ける。次にステップ
405において、ステップ404で受け付けたノウハウ
を保存する。
【0010】また、ステップ406において、ノウハウ
の検索が要求されたと判定された場合には、以下のステ
ップ407〜ステップ408の処理を実行する。まずス
テップ407において、ユーザからの検索条件式を受け
付ける。次にステップ408において、ステップ407
で取得した検索条件にもとづき、ステップ405で保存
したノウハウを検索し、検索されたノウハウを登録した
ユーザ名を提示する。
【0011】たとえば、「A社に対する営業戦略」を知
っているユーザは、予めそのユーザの個人プロファイル
に「A社」「営業」といった文字列を登録しておく。そ
して他のユーザは、「A社」「営業」などの検索条件で
この個人プロファイルを検索し、登録したユーザ名を取
得することで、この個人プロファイルを登録した人物が
「A社に対する営業戦略」を知っていると推測すること
が可能となる。
【0012】
【発明が解決しようとする課題】しかしながら上述した
従来技術1では、過去に利用された検索条件式に類似し
ているものがあれば、目的とする検索結果が得られたか
否かにかかわらず、これを検索結果として提示してしま
う。そのため、所望の文書をまったく検索できないよう
な不適切な検索条件式を入力した人物も提示されてしま
うという問題があった。
【0013】たとえば"「A社」「営業」「戦略」の3
語を含む文書を検索する"という検索条件に似た検索条
件式として、"「B社」「営業」「戦略」の3語を含む
文書を検索する"という検索条件式が、検索条件中の2
語が一致しているため検索される場合がある。このよう
に、「A社に対する営業戦略」ではなく「B社に対する
営業戦略」を知っていると思われるユーザが検索されて
しまう、といった問題があった。
【0014】また従来技術2では、事前に登録者が個人
プロファイルを用意するという手間がかかり、また用意
されたノウハウしか利用できないという問題があった。
また、各ユーザは必ずしも適切な個人プロファイルを用
意できないという問題があった。
【0015】たとえば、各ユーザは「A社に対する営業
戦略」などのノウハウについて社内データベースを検索
するなどの手段で知るたびに、「A社」「営業」といっ
た文字列を、自分のプロファイルに登録しなければなら
ないという手間がかかる。また、「A社」「営業」とい
う文字列だけでは、「A社」に何の案件で営業するノウ
ハウなのかなどが表現できないなど、必ずしも適切な個
人プロファイルを登録することができないという問題が
あった。
【0016】本発明の目的は、以上のような問題を解決
し、「各ユーザが何を知っているか」という情報を各ユ
ーザの負担なく適切に登録することを可能にし、また
「この情報を知っているのは誰か」という情報を適切に
検索することを可能にする手段を提供することにある。
【0017】
【課題を解決するための手段】本発明は、指定された検
索条件に基づいて登録された文書を検索する文書検索方
法において、文書検索の結果として得られた少なくとも
1つの文書についてユーザにより所望するか否かの評価
の入力を受け付けるステップと、所望すると評価された
文書の該当する検索語の重みを増し、所望でないと評価
された文書の該当する検索語の重みを減じるようにその
検索条件を変更するステップと、変更された検索条件に
基づいて上記の文書検索と評価の入力を繰り返すステッ
プと、最終的にユーザにより所望すると評価された文書
の識別子をユーザの識別子とともに検索履歴として記憶
手段に格納するステップとを有する文書検索方法を特徴
とする。またこの検索履歴に最終的に得られた検索条件
を格納するステップを有する文書検索方法を特徴とす
る。また本発明は、このような機能を備えた文書検索装
置を特徴とする。
【0018】また本発明は、少なくとも1つの文書の識
別子をキーとしてこの検索履歴を検索し、合致する文書
の識別子を有する検索履歴のレコードを取得して表示す
る文書検索方法を特徴とする。
【0019】また本発明は、指定された検索条件に基づ
いてこの検索履歴を検索し、指定された検索条件に類似
する検索条件を有する検索履歴のレコードを取得して表
示する文書検索方法を特徴とする。
【0020】
【発明の実施の形態】以下、本発明の実施の形態につい
て説明する。
【0021】まず、本発明の実施形態のシステム構成を
図1に示す。本実施形態におけるシステムは、ディスプ
レイ114、キーボード115、中央演算処理装置(C
PU)116、磁気ディスク装置117、フロッピディ
スクドライブ(FDD)118、主メモリ121および
これらを結ぶバス120から構成される計算機である。
【0022】磁気ディスク装置117は二次記憶装置の
一つであり、検索プロファイル格納ファイル109、登
録文書格納ファイル110、フィードバック履歴検索フ
ァイル111、検索シーケンス格納ファイル112、お
よびプロファイル履歴格納ファイル113が格納され
る。FDD118を介してフロッピディスク119に格
納されている情報が、主メモリ121あるいは磁気ディ
スク装置117へ読み込まれる。
【0023】主メモリ121には、情報検索プログラム
101および履歴検索プログラム201が格納される。
情報検索プログラム101は、検索プロファイル生成プ
ログラム102、類似文書検索プログラム103、検索
プロファイル修正プログラム104、フィードバック履
歴保存プログラム105、および履歴保存プログラム1
06で構成される。ここで履歴保存プログラム106
は、検索シーケンス保存プログラム107およびプロフ
ァイル保存プログラム108で構成される。
【0024】履歴検索プログラム201は、検索プロフ
ァイル生成プログラム102、類似文書検索プログラム
103、類似プロファイル検索プログラム203、およ
び類似検索シーケンス検索プログラム204で構成され
る。ここで、検索プロファイル生成プログラム102お
よび類似文書検索プログラム103は、情報検索プログ
ラム101を構成する検索プロファイル生成プログラム
102、類似文書検索プログラム103とそれぞれ同一
のものである。
【0025】ディスプレイ114は、検索条件を入力す
るための案内画面及び検索結果を表示するための表示装
置である。キーボード115は、検索条件やその他の指
示を入力するための入力装置である。図1のシステム構
成は、いわば検索サーバにディスプレイ114及びキー
ボード115が接続され、ユーザがこのディスプレイ1
14及びキーボード115を介して検索サーバにアクセ
スする構成であるが、ディスプレイ114及びキーボー
ド115を設けるクライアント端末とネットワークを介
して検索サーバにアクセスする、いわゆるクライアント
−サーバ型のシステムであってもよい。
【0026】なおフロッピディスク119など記憶媒体
上に情報検索プログラム101および履歴検索プログラ
ム201を格納し、FDD118などの駆動装置を介し
て当該計算機の主メモリ121に読み込み、CPU11
6によって実行することが可能である。
【0027】次に本実施形態における全体的な処理の流
れを図4のPAD図を用いて説明する。
【0028】本発明の実施形態では、図2に示した従来
技術におけるステップ304〜ステップ306の代り
に、ステップ1004において情報検索プログラム10
1を起動する。また、ステップ308〜ステップ309
の代りに、ステップ1006において履歴検索プログラ
ム201を起動する。
【0029】まずユーザは最初に図5に示す画面900
において、情報検索プログラム101を用いて文書情報
の検索を行なうのか、または過去の検索シーケンスの履
歴を検索するのかを選択する。テキストボックス901
に種文書を入力して、「類似文書を検索する」ボタン9
02を押下すると、情報検索プログラム101が起動さ
れて、種文書と類似した文書を検索する。同様に「類似
ユーザ、類似プロファイルを検索する」ボタン903を
押下すると、履歴検索プログラム201が起動されて、
類似検索シーケンスを検索することになる。
【0030】本実施形態における処理では、ステップ1
001において、以下に示す1002〜1006の処理
をシステム終了まで繰り返す。まずステップ1002に
おいて、ユーザからの入力を受け付ける。次にステップ
1003において、ユーザからの入力が類似文書の検索
要求であると判定された場合、ステップ1004で情報
検索プログラム101を起動する。次にステップ100
5において、ユーザからの入力が類似する検索シーケン
スの検索要求であると判定された場合、ステップ100
6で履歴検索プログラム201を起動する。以上が本実
施形態におけるおおまかな処理の流れである。
【0031】以下、ステップ1004で起動される情報
検索プログラム101を説明する。
【0032】情報検索プログラム101は、ユーザが入
力した文書(以下、種文書と呼ぶ)と内容の類似する文
書を登録文書から選択し、ユーザに提示する類似文書検
索プログラム103を有する。また、検索結果をユーザ
が評価してそれをもとに検索をやり直す、いわゆるレリ
バンスフィードバック機能を備えている。ここで、ユー
ザが最初に種文書を入力し、レリバンスフィードバック
を繰り返して、検索を終了するまでの一連の動作を検索
シーケンスと呼ぶことにする。
【0033】まず以下に、本発明における情報検索プロ
グラム101について図6を用いて説明する。図6は本
発明における情報検索プログラム101の構成を示す図
である。
【0034】本発明における情報検索プログラム101
は、検索プロファイル生成プログラム102と、類似文
書検索プログラム103と、検索プロファイル修正プロ
グラム104と、フィードバック履歴保存プログラム1
05と、履歴保存プログラム106から構成される。ま
たアクセスされるファイルは、検索プロファイル格納フ
ァイル109、登録文書格納ファイル110、フィード
バック履歴格納ファイル111、検索シーケンス履歴格
納ファイル112及びプロファイル履歴格納ファイル1
13である。ここで履歴保存プログラム106は、検索
シーケンス保存プログラム107と、プロファイル保存
プログラム108から構成される。以下、それぞれのプ
ログラムについて説明する。
【0035】まず、検索プロファイル生成プログラム1
02は、ユーザ100から検索条件を受け付け、ユーザ
100の検索したい内容を要素として持つデータ(以
下、検索プロファイルと呼ぶ)を生成するプログラムで
ある。
【0036】本プログラムは、ユーザ100から入力さ
れる種文書を受け付ける。そしてその種文書から検索プ
ロファイルを生成して、検索プロファイル格納ファイル
109に書き込む。この検索プロファイルが検索条件と
なる。
【0037】ここで検索プロファイルの内容と生成方法
の例を図7を用いて説明する。本図の例では、ユーザ1
00が種文書501として、「サッカーに続き高校野球
が開幕・・・」という文書を入力した。このとき検索プ
ロファイル生成プログラム102は、種文書501から
自立語の可能性がある検索語の文字列(以下、特徴文字
列とよぶ)を1つ以上抽出し、各特徴文字列について類
似文書検索のときに用いる重み値として種文書501内
での出現回数を算出する。そして抽出した特徴文字列と
その重みを検索プロファイル503に書き込む。以上
が、検索プロファイル生成プログラム102の説明であ
る。
【0038】次に、類似文書検索プログラム103は、
登録文書格納ファイル110に登録された各文書に対
し、指定された種文書に概念的な類似度に応じた得点を
付与し、類似度の高い文書を検索結果としてユーザ10
0に表示するプログラムである。
【0039】本プログラムは、検索プロファイル格納フ
ァイル109に格納された検索プロファイルに基づき、
登録文書格納ファイル110に格納された各文書に対し
て類似度を算出し、類似度の高い少なくとも1つの文書
をユーザ100に表示する。ここで類似度の算出方法と
しては、以下の式1のようなものを用いる。
【0040】
【数1】 この式で、S(D)は登録文書格納ファイル110内の
文書番号Dの文書の類似度であり、Frq(i)は種文
書に出現する単語iの文書番号Dの文書における出現回
数であり、w(i)は検索プロファイル格納ファイル1
09内の単語iの重み、すなわち種文書における単語i
の出現回数である。ここで類似度算出式としてはこれ以
外のものを用いてもよい。以上が、類似文書検索プログ
ラム103の説明である。
【0041】次に、検索プロファイル修正プログラム1
04は、検索結果文書に対してユーザ100が、「所望
の文書である」或いは「所望の文書ではない」といった
評価を入力した場合、その評価に基づいて検索プロファ
イルの内容を修正するプログラムである。本プログラム
は、ユーザ100から、ユーザ100が評価した文書
と、その評価を受け付ける。そしてその評価に基づいて
検索プロファイル格納ファイル109に格納されている
検索プロファイルの内容を修正する。
【0042】ここで検索プロファイルの修正方法の例を
図7を用いて説明する。本図の例では、「サッカーの試
合の結果は・・・」という文書504が検索結果として
ユーザ100に提示され、その文書に対してユーザ10
0が「所望でない」という評価を与えたときの例であ
る。このとき、本プログラムにおいて、検索プロファイ
ル生成プログラム102と同様に、文書504から特徴
文字列をその出現回数505を抽出する。そして、生成
されている検索プロファイル503の該当する文字列の
重みをその出現回数505によって減算する。その結
果、検索プロファイル503の内容は修正後の検索プロ
ファイル506の内容に修正される。一致する文字列の
出現回数を減算するのは、ユーザが所望しない文書であ
るので、文字列が一致してもたまたま一致しただけであ
り、ユーザには興味のない文字列であろうと推定して重
みを減じるのである。なお減算の結果として重みが負に
なってもよいし、0で止まりとしてもよい。
【0043】一方、「所望である」という評価がされた
文書については、生成されている検索プロファイル50
3の該当する文字列の重みにその出現回数505を加算
する。以上が、検索プロファイル修正プログラム104
の説明である。
【0044】ユーザは修正された検索プロファイルに基
づいて類似文書検索プログラム103を実行させ、登録
文書格納ファイル110を再検索させることができる。
そして再検索の結果を上記手順に従って再評価し、再び
検索プロファイル修正プログラム104を実行させて検
索プロファイル格納ファイル109を修正することがで
きる。このようにしてレリバンスフィードバックを繰り
返すことにより、ユーザの希望する文書に接近すること
ができる。
【0045】次に、フィードバック履歴保存プログラム
105は、ユーザ100がレリバンスフィードバックを
行なった際にその履歴を保存しておくプログラムであ
る。本プログラムは、ユーザ100が評価した文書の識
別子とその評価を、フィードバック履歴格納ファイル1
11に追加書き込みする。ユーザ100がレリバンスフ
ィードバックを繰り返して、次々と検索を行なうたび
に、その際に評価した文書の識別子とその評価が追加書
き込みされることになる。
【0046】ここでフィードバック履歴格納ファイル1
11に格納される情報の例を図8に示す。本図の例で
は、ユーザ「Matsui」が最初に「005.txt」というフ
ァイル名の文書を種文書として入力し、その後検索シー
ケンスを通じて得られた文書65と文書50を「所望で
ある」と評価し、文書35を「所望でない」と評価し
た、というレリバンスフィードバックを行なった場合で
ある。そしてこのとき、「0005.pfl」というファイ
ル名で保存されている検索プロファイルが検索に用いら
れており、レリバンスフィードバックのたびにこの検索
プロファイルの内容が修正されている。以上が、フィー
ドバック履歴保存プログラム105の説明である。
【0047】次に、履歴保存プログラム106を構成す
る検索シーケンス保存プログラム107およびプロファ
イル保存プログラム108について説明する。まず、検
索シーケンス保存プログラム107は、ユーザ100が
レリバンスフィードバックを繰り返して、検索を終了す
る際に、一連の評価した文書とそれぞれの評価を、検索
シーケンス履歴格納ファイル112に追加保存するプロ
グラムである。
【0048】本プログラムは、ユーザ100からログア
ウト指示などの検索シーケンス終了宣言を受け付けたと
きに起動され、フィードバック履歴格納ファイル111
に格納された情報を読み込み、その内容を検索シーケン
ス履歴格納ファイル112に追加書き込みする。このと
きの例を図9に示す。本図の例は、過去に検索シーケン
スID(識別子)1〜4を付与された検索シーケンスが
行われていたが、図の最下行の部分が新たに追加書き込
みされ、検索シーケンスIDとして5が付与されたとい
う例である。検索シーケンス履歴格納ファイル112の
各行が各々検索シーケンスによって得られた最終結果の
レコードを示している。以上が検索シーケンス保存プロ
グラム106の説明である。
【0049】次に、プロファイル保存プログラム108
は、ユーザ100がレリバンスフィードバックを繰り返
した結果、内容が修正され洗練されてきた検索プロファ
イルを保存するプログラムである。
【0050】本プログラムは、ユーザ100から検索シ
ーケンス終了宣言を受け付けたときに起動され、検索プ
ロファイル格納ファイル109に格納された情報を読み
込み、その内容をプロファイル履歴格納ファイル113
に保存する。プロファイル履歴格納ファイル113の内
容は、複数のユーザについて各ユーザの検索プロファイ
ル格納ファイル109、すなわち修正後の検索プロファ
イル506を蓄積したものである。以上がプロファイル
保存プログラム108の説明である。
【0051】以上の検索シーケンス履歴格納ファイル1
12やプロファイル履歴格納ファイル113は、後述す
るように、履歴検索プログラム201により後の検索者
が、「以前に同様の検索を行なった人物はいないだろう
か」といった検索をする際の検索対象として用いられ
る。
【0052】以上が本実施形態における情報検索プログ
ラム101を構成する各プログラムの説明である。
【0053】ここで、検索プロファイル生成プログラム
102において、検索プロファイル格納ファイル109
に書き込む文字列は、抽出した特徴文字列全てを書き込
む方法であっても良いし、抽出した特徴文字列のうち種
文書内での出現回数が上位のものから順に所定数に限定
しても良い。また特徴文字列を抽出する方法は、「特開
平11−143902号公報」に開示されている方法を
用いても良いし、形態素解析を用いて各文書中の単語を
抽出する方法や、その他の方法であっても良い。
【0054】次に、ステップ1006において起動され
る履歴検索プログラム201について図10を用いて説
明する。図10は本実施形態における履歴検索プログラ
ム201の構成を示す図である。
【0055】本発明における履歴検索プログラム201
は、過去に情報検索プログラム101を用いて行なわれ
た検索の履歴を検索する。これにより、類似した観点を
持つユーザが誰であるかといった情報を取得したり、情
報検索プログラム101に入力する検索条件として過去
に用いられたものを取得し再利用することを可能にする
ものである。
【0056】本実施形態における履歴検索プログラム2
01は、検索プロファイル生成プログラム102と、類
似文書検索プログラム103と、類似プロファイル検索
プログラム203と、類似検索シーケンス検索プログラ
ム204とから構成される。またアクセスされるファイ
ルは、検索プロファイル格納ファイル109、登録文書
格納ファイル110、プロファイル履歴格納ファイル1
13および検索シーケンス履歴格納ファイル112であ
る。
【0057】ここで、検索プロファイル生成プログラム
102と、類似文書検索プログラム103と、類似プロ
ファイル格納ファイル109と、類似文書登録文書格納
ファイル110と、プロファイル履歴格納ファイル11
3と、検索シーケンス履歴格納ファイル112は、上述
した情報検索プログラム101に関して説明したものと
同一のものである。すなわち、これらのプログラム及び
ファイルは、情報検索プログラム101と、履歴検索プ
ログラム201とで共有されている。以下、それぞれの
プログラムについて説明する。
【0058】まず、検索プロファイル生成プログラム1
02は、ユーザ200から入力される種文書から、履歴
検索用の検索プロファイルを作成するためのプログラム
である。本プログラムの処理内容は、上述したのでここ
では説明を省く。
【0059】次に、類似文書検索プログラム103は、
登録された各文書に対し、指定された種文書に概念的な
類似度に応じた得点を付与し、類似度の高い文書を取得
するプログラムである。ここで取得された文書は、後述
するように過去に検索を行なったユーザのレリバンスフ
ィードバックの履歴として記録された文書と照合するた
めに用いられる。たとえば、ここで取得された文書を過
去に「所望である」と評価したユーザは、このとき履歴
検索を行なっているユーザと検索の観点(目的)が似て
いると判断できるからである。
【0060】本プログラムは、検索プロファイル格納フ
ァイル109に格納された検索プロファイルに基づき、
登録文書格納ファイル110に格納された各文書に対し
て類似度を算出する。そして、類似度が一定の閾値を超
える文書の識別子を検索結果として取得する。
【0061】次に、類似プロファイル検索プログラム2
03は、ユーザ200によって入力された種文書に基づ
いて生成された検索プロファイルと類似した、過去に用
いられた検索プロファイルを検索するプログラムであ
る。
【0062】本プログラムは、検索プロファイル格納フ
ァイル109に格納された検索プロファイルに基づき、
プロファイル履歴格納ファイル113に格納された各検
索プロファイルに対して類似度を算出する。そして、類
似度が一定の閾値を超える文書の識別子を検索結果とし
て取得する。ここで類似度の算出方法としては類似文書
検索プログラム103と同様の方法を用いても良いし、
別の方法を用いても良い。以上が、類似プロファイル検
索プログラム203の説明である。
【0063】次に、類似検索シーケンス検索プログラム
204は、上記の類似文書検索プログラム103および
類似プロファイル検索プログラム203の検索結果にも
とづき、過去に行なわれた検索シーケンスのうち、検索
の観点(目的)が類似するものを抽出するプログラムで
ある。
【0064】本プログラムでは、まず類似文書検索プロ
グラム103および類似プロファイル検索プログラム2
03の検索結果を取得する。そして、検索シーケンス履
歴格納ファイル112に格納された過去の各検索シーケ
ンスと照合して、類似検索シーケンスを照合結果として
ユーザ200に提示する。
【0065】ここで照合処理の例を図11に示す。本図
の例では、類似文書検索プログラム103の検索結果8
01として文書8と文書3という2つの文書が取得され
た。また、類似プロファイル検索プログラム203の検
索結果802として0002.pflと0003.pflという
2つのプロファイルが取得された。このとき類似検索シ
ーケンス検索プログラム204は、検索シーケンス履歴
格納ファイル112に格納された各検索シーケンスのう
ち、「所望と評価した文書」の項目に検索結果801、
「検索プロファイル」の項目に検索結果802の内容を
含むものを抽出する。ここでは、検索シーケンスID:
3の「所望と評価した文書」の中に文書3と文書8が含
まれ、検索シーケンスID:2の「検索プロファイル」
の項目に0002.pflが含まれる。そこで、検索シーケ
ンスID:3と2が類似した検索シーケンスであるとし
て、該当シーケンスを実行したユーザ名や、利用された
プロファイルを履歴検索を行なっているユーザ200に
提示する。
【0066】このとき、以上の例では検索結果801や
検索結果802の内容を含んでいるだけで類似シーケン
スであると判定するとしたが、所定数以上含んでいない
と類似シーケンスと判定しないなどの方法や、所定のプ
ログラムで類似度を算出して、類似度が所定の閾値を超
えたものだけを類似シーケンスと判定するなどの方法を
とっても良い。
【0067】また、履歴検索を行なっているユーザ20
0の所望しない概念を表すプロファイルを作成し、「不
要と評価した文書」の項目に格納された文書との類似度
を用いるなどの方法を同時に利用しても良い。また検索
条件として少なくとも1つの文書の識別子を入力し、こ
の文書識別子をキーとして検索シーケンス履歴格納ファ
イル112を検索し、指定された文書識別子を「所望と
評価した文書」に含むレコードを抽出して表示してもよ
い。以上が、類似検索シーケンス検索プログラム204
の説明である。また以上が本発明における履歴検索プロ
グラム201を構成する各プログラムの説明である。
【0068】次に、ステップ1004において起動され
る情報検索プログラム101の処理の流れを図12のP
AD図を用いて説明する。まず、ステップ1101にお
いて、種文書が入力されたと判定された場合、次のステ
ップ1102を実行する。ステップ1102では、検索
プロファイル生成プログラム102により、検索プロフ
ァイルを生成し、検索プロファイル格納ファイル109
に保存する。次に、ステップ1103において、検索結
果に対する評価が入力されたと判定された場合、次のス
テップ1104、ステップ1105を実行する。ステッ
プ1104では、検索結果に対する評価に基づき、検索
プロファイル修正プログラム104により、検索プロフ
ァイル格納ファイル109に格納されている検索プロフ
ァイルの内容を修正する。ステップ1105では、ステ
ップ1103で入力された評価をフィードバック履歴保
存プログラム105により、フィードバック履歴格納フ
ァイル111に保存する。
【0069】次に、ステップ1106において、検索プ
ロファイル格納ファイル109に格納された検索プロフ
ァイルの内容に基づき、類似文書検索プログラム103
により類似文書を検索する。次に、ステップ1107に
おいて、検索シーケンスの終了要求が入力された、また
はタイムアウトが発生したと判定された場合、次のステ
ップ1108とステップ1109を実行する。ステップ
1108では、検索シーケンス保存プログラム107に
より、フィードバック履歴格納ファイル111内の情報
を検索シーケンス履歴格納ファイル112に追加書き込
みする。ステップ1109では、プロファイル保存プロ
グラム108により、検索プロファイル格納ファイル1
09内の情報をプロファイル履歴格納ファイル113に
保存する。すなわちステップ1107が検索シーケンス
を抽出するステップに相当し、ステップ1108および
ステップ1109が抽出した検索シーケンスの履歴を保
存するステップに相当する。
【0070】以上がステップ1004において起動され
る情報検索プログラム101の処理の流れである。以上
の処理により、ユーザはレリバンスフィードバックを用
いた類似文書検索が可能となる。また、検索シーケンス
終了時にはどのようなレリバンスフィードバックを行な
ったかという情報と、レリバンスフィードバックによっ
て洗練された検索プロファイルを保存することが可能と
なる。
【0071】次に、ステップ1006において起動され
る履歴検索プログラム201の処理の流れを図13のP
AD図を用いて説明する。まず、ステップ1201にお
いて、検索プロファイル生成プログラム102により、
種文書から検索プロファイルを作成し、検索プロファイ
ル格納ファイル109に書き込む。次に、ステップ12
02において、類似文書検索プログラム103により、
ステップ1201で生成した検索プロファイルに基づき
類似文書を検索する。
【0072】次に、ステップ1203において、類似プ
ロファイル検索プログラム203により、ステップ12
01で生成した検索プロファイルに基づきプロファイル
履歴格納ファイル113に格納された類似プロファイル
を検索する。次に、ステップ1204において、類似検
索シーケンス検索プログラム204により、ステップ1
202およびステップ1203の検索結果をもとに、検
索シーケンス履歴格納ファイル112内の情報のうち類
似検索シーケンスを抽出して、ユーザに提示する。ここ
で、類似検索シーケンスの抽出方法は、類似検索シーケ
ンス検索プログラム204の説明で上述したとおりであ
る。
【0073】このときのユーザへ提示する情報の例を図
14に示す。図14は、図5のテキストボックス901
に種文書を入力して「類似ユーザ、類似プロファイルを
検索する」ボタン903を押下し、履歴検索プログラム
201が起動された結果として表示される画面である。
本図の例では、表示エリア1301に、「Etohさん」や
「Shimizuさん」といった過去に類似観点で検索を行な
ったユーザの名前が提示される。また、表示エリア13
02に、それらのユーザが行なった検索において生成・
修正された検索プロファイルの内容が提示される。
【0074】これらの情報をもとにユーザは、自分の知
りたい情報について「Etohさん」や「Shimizuさん」が
知っている可能性があることがわかり、彼らにノウハウ
などを聞けば良いということがわかる。
【0075】また、検索プロファイルが提示されるた
め、それを入力にして検索を行なったり、提示された検
索プロファイルに含まれる文字列を、自分の種文書や検
索プロファイルに追加して検索するなどといった応用が
可能となる。
【0076】以上がステップ1006において起動され
る履歴検索プログラム201の処理の流れである。以上
の処理により、どのユーザがどのようなノウハウを持っ
ているかを検索して知ることができ、かつレリバンスフ
ィードバックによって洗練された検索プロファイルとい
った検索ノウハウを取得して再利用することができる。
【0077】以上が本発明による実施の形態である。な
お、本発明の実施形態では、ユーザが検索条件として種
文書を入力し類似文書を検索するものとしたが、検索タ
ームを羅列したり、それらのブーリアン条件で検索する
ものとしても良い。
【0078】また、本発明の実施形態では、ユーザが検
索シーケンスを終了した時点で、その履歴を検索シーケ
ンス履歴格納ファイル112に保存するものとしたが、
検索シーケンスの途中でユーザが評価を入力するたび
に、検索シーケンス格納ファイル112の内容を書き換
える形態にしても良い。その場合、実行中の検索シーケ
ンスも、類似検索シーケンス検索プログラム204の検
索対象となることになる。
【0079】また、検索条件を登録しておき、条件に合
致する文書情報が発生した際にユーザに該文書情報を配
信する、文書情報配信システムにおいても適用できる。
すなわち、文書情報配信システムにおいて各ユーザが登
録している検索プロファイルそれぞれに対して、レリバ
ンスフィードバックの履歴を保存しておき、その履歴を
類似検索シーケンス検索プログラム204を用いて検索
することにより、類似した観点をもつユーザと、その検
索プロファイルが抽出可能となる。
【0080】また、検索結果に対する評価の入力方法
は、ひとつの検索結果文書に対しユーザが評価を入力す
るものとしても良いし、複数の検索結果文書に対してそ
れぞれ評価を一度に入力するものとしても良い。また本
実施例では、評価の種類は「所望である」と「所望でな
い」の2種類としたが、「やや所望である」「やや所望
ではない」といったものを用いて多段階の評価ができる
ようにしても良い。
【0081】
【発明の効果】以上述べたように本発明によれば、各ユ
ーザが行なったレリバンスフィードバックの履歴と、レ
リバンスフィードバックによって修正された検索条件を
対応づけ、それぞれの検索シーケンスを単位に履歴管理
する。
【0082】このことにより、ユーザが行なった検索の
試行錯誤の履歴と、その結果修正・洗練された検索条件
が個人プロファイルとして自動的に蓄積される。そのた
め「各ユーザが何を知っているか」という情報を、各ユ
ーザの負担なく登録することが可能となる。
【0083】また、蓄積された検索の試行錯誤の履歴や
検索条件を、他のユーザが検索することができるため、
「この情報を知っているのは誰か」という情報を適切に
検索することが可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態の構成を示す図である。
【図2】従来技術1による処理の流れを示すPAD図で
ある。
【図3】従来技術2による処理の流れを示すPAD図で
ある。
【図4】本発明の実施形態における全体的な処理の流れ
を示す図である。
【図5】本発明の実施形態におけるディスプレイ900
に表示される初期画面の例を示す図である。
【図6】本発明の実施形態における情報検索プログラム
101の構成を示す図である。
【図7】本発明の実施形態における検索プロファイルの
内容と生成方法の例を示す図である。
【図8】本発明の実施形態におけるフィードバック履歴
格納ファイル111に格納される情報の例を示す図であ
る。
【図9】本発明の実施形態における検索シーケンス保存
プログラム107が、検索シーケンス履歴格納ファイル
112に情報を追加書込みする例を示す図である。
【図10】本発明の実施形態における履歴検索プログラ
ム201の構成を示す図である。
【図11】本発明の実施形態における類似検索シーケン
ス検索プログラム204が、保存された検索シーケンス
の履歴を検索条件と照合する例を示す図である。
【図12】本発明の実施形態における情報検索プログラ
ム101の処理の流れを示すPAD図である。
【図13】本発明の実施形態における履歴検索プログラ
ム201の処理の流れを示すPAD図である。
【図14】本発明の実施形態における類似検索シーケン
ス検索プログラム204による検索結果として、ユーザ
に提示される画面の例である。
【符号の説明】
101 情報検索プログラム、102 検索プロファイ
ル生成プログラム、103 類似文書検索プログラム、
104 検索プロファイル修正プログラム、105 フ
ィードバック履歴保存プログラム、106 履歴保存プ
ログラム、107検索シーケンス保存プログラム、10
8 プロファイル保存プログラム、109 検索プロフ
ァイル格納ファイル、110 登録文書格納ファイル、
111フィードバック履歴格納ファイル、112 検索
シーケンス履歴格納ファイル、113 プロファイル履
歴格納ファイル、201 履歴検索プログラム、203
類似プロファイル検索プログラム、204 類似検索シ
ーケンス検索プログラム
フロントページの続き (72)発明者 菅谷 奈津子 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション開 発本部内 (72)発明者 松林 忠孝 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション開 発本部内 (72)発明者 山口 明彦 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション開 発本部内 (72)発明者 徳永 幹彦 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア開発本部内 Fターム(参考) 5B075 ND03 NK02 PP23 PQ02 PR03 PR06 QM08

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】指定された検索条件に基づいて登録された
    文書を検索する文書検索方法において、文書検索の結果
    として得られた少なくとも1つの文書の各々についてユ
    ーザにより所望するか否かの評価の入力を受け付けるス
    テップと、所望すると評価された文書の該当する検索語
    の重みを増し、所望でないと評価された文書の該当する
    検索語の重みを減じるように前記検索条件を変更するス
    テップと、変更された検索条件に基づいて前記文書検索
    と評価の入力を繰り返すステップと、最終的にユーザに
    より所望すると評価された文書の識別子をユーザの識別
    子とともに検索履歴として記憶手段に格納するステップ
    とを有することを特徴とする文書検索方法。
  2. 【請求項2】さらに前記検索履歴に最終的に得られた前
    記検索条件を格納するステップを有することを特徴とす
    る請求項1記載の文書検索方法。
  3. 【請求項3】少なくとも1つの文書の識別子をキーとし
    て前記検索履歴を検索し、合致する文書の識別子を有す
    る前記検索履歴のレコードを取得して表示することを特
    徴とする請求項1記載の文書検索方法。
  4. 【請求項4】指定された検索条件に基づいて前記検索履
    歴を検索し、指定された検索条件に類似する検索条件を
    有する前記検索履歴のレコードを取得して表示すること
    を特徴とする請求項2記載の文書検索方法。
  5. 【請求項5】前記の評価の入力を受け付けるステップ
    と、前記検索条件を変更するステップと、前記文書検索
    と評価の入力を繰り返すステップと、過去に蓄積された
    前記検索履歴を検索して当該ユーザにより所望すると評
    価された文書の識別子を含むレコードを取得して表示す
    ることを特徴とする請求項1記載の文書検索方法。
  6. 【請求項6】前記の評価の入力を受け付けるステップ
    と、前記検索条件を変更するステップと、前記文書検索
    と評価の入力を繰り返すステップと、過去に蓄積された
    前記検索履歴を検索して当該ユーザの変更後の検索条件
    と類似する検索条件を有するレコードを取得して表示す
    ることを特徴とする請求項2記載の文書検索方法。
  7. 【請求項7】指定された検索条件に基づいて登録された
    文書を検索する文書検索装置において、文書検索の結果
    として得られた少なくとも1つの文書についてユーザに
    より所望するか否かの評価の入力を受け付ける手段と、
    所望すると評価された文書の該当する検索語の重みを増
    し、所望でないと評価された文書の該当する検索語の重
    みを減じるように前記検索条件を変更する手段と、ユー
    ザにより所望すると評価された文書の識別子とユーザの
    識別子との対応を記憶する記憶手段と、最終的に所望す
    ると評価された文書の識別子を当該ユーザの識別子とと
    もに前記記憶手段に格納する手段とを有することを特徴
    とする文書検索装置。
  8. 【請求項8】計算機読み取り可能なプログラムを格納す
    る記憶媒体であって、前記プログラムは、指定された検
    索条件に基づいて登録された文書を検索するプログラム
    であり、文書検索の結果として得られた少なくとも1つ
    の文書についてユーザにより所望するか否かの評価の入
    力を受け付ける機能と、所望すると評価された文書の該
    当する検索語の重みを増し、所望でないと評価された文
    書の該当する検索語の重みを減じるように前記検索条件
    を変更する機能と、変更された検索条件に基づいて前記
    文書検索と評価の入力を繰り返す機能と、最終的にユー
    ザにより所望すると評価された文書の識別子をユーザの
    識別子とともに検索履歴として記憶手段に格納する機能
    とを有することを特徴とする文書検索プログラムを格納
    する記憶媒体。
  9. 【請求項9】前記プログラムは、さらに少なくとも1つ
    の文書の識別子をキーとして前記検索履歴を検索し、合
    致する文書の識別子を有する前記検索履歴のレコードを
    取得して表示する機能を有することを特徴とする請求項
    8記載の文書検索プログラムを格納する記憶媒体。
  10. 【請求項10】前記プログラムは、さらに指定された検
    索条件に基づいて前記検索履歴を検索し、指定された検
    索条件に類似する検索条件を有する前記検索履歴のレコ
    ードを取得して表示する機能を有することを特徴とする
    請求項8記載の文書検索プログラムを格納する記憶媒
    体。
JP2000331817A 2000-10-31 2000-10-31 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体 Expired - Fee Related JP3934325B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2000331817A JP3934325B2 (ja) 2000-10-31 2000-10-31 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体
US09/952,594 US6865571B2 (en) 2000-10-31 2001-09-13 Document retrieval method and system and computer readable storage medium
EP01122142A EP1209582B1 (en) 2000-10-31 2001-09-14 Document retrieval method and system and computer readable storage medium
DE60141318T DE60141318D1 (de) 2000-10-31 2001-09-14 Dokumentenwiederauffindungsmethode, -system und computerlesbares Speichermedium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000331817A JP3934325B2 (ja) 2000-10-31 2000-10-31 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体

Publications (2)

Publication Number Publication Date
JP2002140361A true JP2002140361A (ja) 2002-05-17
JP3934325B2 JP3934325B2 (ja) 2007-06-20

Family

ID=18808111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000331817A Expired - Fee Related JP3934325B2 (ja) 2000-10-31 2000-10-31 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体

Country Status (4)

Country Link
US (1) US6865571B2 (ja)
EP (1) EP1209582B1 (ja)
JP (1) JP3934325B2 (ja)
DE (1) DE60141318D1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178421A (ja) * 2002-11-28 2004-06-24 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラムおよび記録媒体
JP2005084943A (ja) * 2003-09-09 2005-03-31 Hitachi Ltd 文書検索システムおよび方法
JP2006107467A (ja) * 2004-09-30 2006-04-20 Microsoft Corp 複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法及び記録媒体
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
JP2007507798A (ja) * 2003-09-30 2007-03-29 グーグル・インク ドキュメントをスコア付けするための方法、ドキュメントをランク付けするための方法及びドキュメントをスコア付けするためのシステム
JP2012069106A (ja) * 2010-09-23 2012-04-05 Fisher-Rosemount Systems Inc プロセス制御システムに検索サービスを提供するためのシステム、方法、および製品

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010053991A1 (en) * 2000-03-08 2001-12-20 Bonabeau Eric W. Methods and systems for generating business models
US7444309B2 (en) * 2001-10-31 2008-10-28 Icosystem Corporation Method and system for implementing evolutionary algorithms
JP2003178238A (ja) * 2001-12-11 2003-06-27 Hitachi Ltd 情報配信方法及び装置並びにその処理プログラム
US20030128236A1 (en) * 2002-01-10 2003-07-10 Chen Meng Chang Method and system for a self-adaptive personal view agent
US20030212663A1 (en) * 2002-05-08 2003-11-13 Doug Leno Neural network feedback for enhancing text search
WO2004090692A2 (en) * 2003-04-04 2004-10-21 Icosystem Corporation Methods and systems for interactive evolutionary computing (iec)
US7146361B2 (en) * 2003-05-30 2006-12-05 International Business Machines Corporation System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND)
EP1649346A2 (en) * 2003-08-01 2006-04-26 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US7356518B2 (en) * 2003-08-27 2008-04-08 Icosystem Corporation Methods and systems for multi-participant interactive evolutionary computing
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US7797316B2 (en) 2003-09-30 2010-09-14 Google Inc. Systems and methods for determining document freshness
JP4354303B2 (ja) * 2004-03-01 2009-10-28 コニカミノルタビジネステクノロジーズ株式会社 データ送信システム及びデータ送信装置
EP1782285A1 (en) * 2004-07-06 2007-05-09 Icosystem Corporation Methods and apparatus for query refinement using genetic algorithms
US7707220B2 (en) * 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
US8078607B2 (en) * 2006-03-30 2011-12-13 Google Inc. Generating website profiles based on queries from webistes and user activities on the search results
US8620915B1 (en) 2007-03-13 2013-12-31 Google Inc. Systems and methods for promoting personalized search results based on personal information
US8862567B2 (en) * 2004-10-21 2014-10-14 At&T Intellectual Property I, L.P. Methods, systems, and computer program products for discreetly monitoring a communications network for sensitive information
US8874570B1 (en) 2004-11-30 2014-10-28 Google Inc. Search boost vector based on co-visitation information
US20060149710A1 (en) * 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
KR101532715B1 (ko) 2005-03-18 2015-07-02 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
US9256685B2 (en) 2005-03-31 2016-02-09 Google Inc. Systems and methods for modifying search results based on a user's history
US20060224583A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for analyzing a user's web history
US7574426B1 (en) * 2005-03-31 2009-08-11 A9.Com, Inc. Efficiently identifying the items most relevant to a current query based on items selected in connection with similar queries
US20060224608A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for combining sets of favorites
JP4707477B2 (ja) * 2005-06-23 2011-06-22 富士通株式会社 ファイル共有プログラムおよびファイル共有装置
US9715542B2 (en) 2005-08-03 2017-07-25 Search Engine Technologies, Llc Systems for and methods of finding relevant documents by analyzing tags
JP4281719B2 (ja) * 2005-08-10 2009-06-17 コニカミノルタビジネステクノロジーズ株式会社 ファイル処理装置、ファイル処理方法、およびファイル処理プログラム
EP1927058A4 (en) * 2005-09-21 2011-02-02 Icosystem Corp SYSTEM AND METHOD FOR SUPPORTING THE PRODUCT DESIGN AND QUANTIFYING ACCEPTANCE
WO2007041343A2 (en) * 2005-09-29 2007-04-12 Icosystem Corporation Methods and apparatus for interactive searching techniques
US7769751B1 (en) * 2006-01-17 2010-08-03 Google Inc. Method and apparatus for classifying documents based on user inputs
US7996396B2 (en) * 2006-03-28 2011-08-09 A9.Com, Inc. Identifying the items most relevant to a current query based on user activity with respect to the results of similar queries
EP2032224A2 (en) * 2006-06-26 2009-03-11 Icosystem Corporation Methods and systems for interactive customization of avatars and other animate or inanimate items in video games
US20080031433A1 (en) * 2006-08-04 2008-02-07 Dustin Kenneth Sapp System and method for telecommunication audience configuration and handling
US9037581B1 (en) 2006-09-29 2015-05-19 Google Inc. Personalized search result ranking
US8399573B2 (en) * 2006-11-22 2013-03-19 Sabic Innovative Plastics Ip B.V. Polymer blend compositions
US7792816B2 (en) * 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
JP4524702B2 (ja) * 2008-02-08 2010-08-18 コニカミノルタビジネステクノロジーズ株式会社 データ管理装置、検索条件情報管理方法、およびコンピュータプログラム
JP5174279B2 (ja) * 2010-03-26 2013-04-03 楽天株式会社 検索システム、検索方法、検索プログラム及び記録媒体
US8601027B2 (en) 2011-06-20 2013-12-03 Google Inc. Query-based user groups in social networks
US8965915B2 (en) 2013-03-17 2015-02-24 Alation, Inc. Assisted query formation, validation, and result previewing in a database having a complex schema
JP6635624B2 (ja) * 2016-11-10 2020-01-29 株式会社オプティム 情報処理装置、情報処理システム、情報処理方法およびプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5911138A (en) * 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
US5706497A (en) * 1994-08-15 1998-01-06 Nec Research Institute, Inc. Document retrieval using fuzzy-logic inference
US5515488A (en) * 1994-08-30 1996-05-07 Xerox Corporation Method and apparatus for concurrent graphical visualization of a database search and its search history
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
JPH1083386A (ja) 1996-02-29 1998-03-31 Toshiba Corp 情報共有支援システム
JPH1063685A (ja) 1996-08-19 1998-03-06 Nec Corp 情報検索システム
US6006222A (en) * 1997-04-25 1999-12-21 Culliss; Gary Method for organizing information
US5940821A (en) * 1997-05-21 1999-08-17 Oracle Corporation Information presentation in a knowledge base search and retrieval system
US6081774A (en) * 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
JPH11143902A (ja) 1997-11-11 1999-05-28 Hitachi Ltd n−gramを用いた類似文書検索方法
US5953718A (en) * 1997-11-12 1999-09-14 Oracle Corporation Research mode for a knowledge base search and retrieval system
US6363377B1 (en) * 1998-07-30 2002-03-26 Sarnoff Corporation Search data processor
US6356899B1 (en) * 1998-08-29 2002-03-12 International Business Machines Corporation Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages
US6353825B1 (en) * 1999-07-30 2002-03-05 Verizon Laboratories Inc. Method and device for classification using iterative information retrieval techniques
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6757646B2 (en) * 2000-03-22 2004-06-29 Insightful Corporation Extended functionality for an inverse inference engine based web search
US6636848B1 (en) * 2000-05-31 2003-10-21 International Business Machines Corporation Information search using knowledge agents

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178421A (ja) * 2002-11-28 2004-06-24 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラムおよび記録媒体
JP2005084943A (ja) * 2003-09-09 2005-03-31 Hitachi Ltd 文書検索システムおよび方法
US8639690B2 (en) 2003-09-30 2014-01-28 Google Inc. Document scoring based on query analysis
JP2007507798A (ja) * 2003-09-30 2007-03-29 グーグル・インク ドキュメントをスコア付けするための方法、ドキュメントをランク付けするための方法及びドキュメントをスコア付けするためのシステム
JP2011159296A (ja) * 2003-09-30 2011-08-18 Google Inc ドキュメントをスコア付けする方法
US9767478B2 (en) 2003-09-30 2017-09-19 Google Inc. Document scoring based on traffic associated with a document
US8407231B2 (en) 2003-09-30 2013-03-26 Google Inc. Document scoring based on link-based criteria
US8521749B2 (en) 2003-09-30 2013-08-27 Google Inc. Document scoring based on document inception date
US8527524B2 (en) 2003-09-30 2013-09-03 Google Inc. Document scoring based on document content update
US8549014B2 (en) 2003-09-30 2013-10-01 Google Inc. Document scoring based on document content update
US8577901B2 (en) 2003-09-30 2013-11-05 Google Inc. Document scoring based on query analysis
JP2006107467A (ja) * 2004-09-30 2006-04-20 Microsoft Corp 複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法及び記録媒体
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
JP2012069106A (ja) * 2010-09-23 2012-04-05 Fisher-Rosemount Systems Inc プロセス制御システムに検索サービスを提供するためのシステム、方法、および製品
US10083249B2 (en) 2010-09-23 2018-09-25 Fisher-Rosemount Systems, Inc. Systems, methods and articles of manufacture to provide a search service to a process control system

Also Published As

Publication number Publication date
US20020073065A1 (en) 2002-06-13
EP1209582A2 (en) 2002-05-29
US6865571B2 (en) 2005-03-08
EP1209582B1 (en) 2010-02-17
EP1209582A3 (en) 2002-08-28
DE60141318D1 (de) 2010-04-01
JP3934325B2 (ja) 2007-06-20

Similar Documents

Publication Publication Date Title
JP3934325B2 (ja) 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体
JP3870666B2 (ja) 文書検索方法および装置並びにその処理プログラムを記録した記録媒体
US20180101621A1 (en) Identifier vocabulary data access method and system
US7409401B2 (en) Method and system for supporting multivalue attributes in a database system
US20090204588A1 (en) Method and apparatus for determining key attribute items
US20020007375A1 (en) Document management method and computer-readable storage medium storing program code for executing the same
US6070169A (en) Method and system for the determination of a particular data object utilizing attributes associated with the object
JP3547338B2 (ja) 情報検索方法及び装置
JP3578651B2 (ja) 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003016112A (ja) 情報検索システム及び情報検索方法並びに情報検索プログラム
JP2000137725A (ja) 情報検索システム、情報検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20020147705A1 (en) Method system and program product for data searching
US5715442A (en) Data unit group handling apparatus
JPH1069487A (ja) あいまい名称による情報の管理方法
JP4253134B2 (ja) 文書処理装置、文書処理方法、プログラムおよび記録媒体
JP3933407B2 (ja) 文書処理装置、文書処理方法および文書処理プログラムが格納された記憶媒体
JP3065151B2 (ja) 標準名付与システム
JP2002063172A (ja) 画像検索方法および装置と画像検索プログラムを記録した記録媒体
JPH10187745A (ja) 部分文字列検索装置および部分文字列検索方法
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体
US20240184833A1 (en) Advanced keyword search
JP2002366567A (ja) 代替キーワードのフリー設定による検索システム
JPH10232885A (ja) データベース類似検索方法及び装置及び類似検索プログラムを格納した記憶媒体
JP2001084271A (ja) 情報検索装置及びそのアルゴリズム更新方法及びコンピュータ読み取り可能な記憶媒体
JPH06243118A (ja) 操作手順生成方式

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070315

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120330

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140330

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees