JP3506892B2 - グループ適応型情報検索装置 - Google Patents

グループ適応型情報検索装置

Info

Publication number
JP3506892B2
JP3506892B2 JP34940897A JP34940897A JP3506892B2 JP 3506892 B2 JP3506892 B2 JP 3506892B2 JP 34940897 A JP34940897 A JP 34940897A JP 34940897 A JP34940897 A JP 34940897A JP 3506892 B2 JP3506892 B2 JP 3506892B2
Authority
JP
Japan
Prior art keywords
information
search
external
group
collection device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34940897A
Other languages
English (en)
Other versions
JPH11184862A (ja
Inventor
奨 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP34940897A priority Critical patent/JP3506892B2/ja
Publication of JPH11184862A publication Critical patent/JPH11184862A/ja
Application granted granted Critical
Publication of JP3506892B2 publication Critical patent/JP3506892B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索システム
の適応性を特に特定の利用者グループの情報活動支援に
最適化し得るように高めるグループ適応型情報検索装置
に関する。
【0002】
【従来の技術】インターネットを始めとする解放型情報
環境において、必要な情報を効率的に収集することはコ
ストのかかる仕事である。従来は、DEC社のAltaVist
a を初めとする検索サービスが行っているように、ロボ
ットと呼ばれるソフトウェアを用いて情報を網羅的に収
集し、全文検索の手法によるキーワード検索機能を利用
者に提供する手法と、 Yahoo社が行っているように、人
手により情報を階層的に整理して利用者にこれを提供す
る手法(ディレクトリ)が一般的であった。
【0003】
【発明が解決しようとする課題】解放型情報環境からの
情報獲得手段として従来から提供されている検索サービ
スやディレクトリは、非常に大量の情報を持っているた
め網羅性に優れているが、検索結果が多数現れることか
ら、必要な情報を選び出すには依然としてコストがかか
る。こうしたサービスを使った場合でも、ある特定の情
報を効率的に探すには、ある程度経験を積んだ検索技能
者(サーチャ)がいくつかの検索サービスを使い分けな
がら行うのが現状である。
【0004】このため、特別な検索技術を要しない、適
応性の高い検索システムが求められている。DEC社が
AltaVista で実施している検索結果の自動分類わけ機能
や、統計的な手法やコホーネンの自己組織化マップを用
いた関連キーワードの自動表示機能など、利用者への適
応性を高める努力はさまざまなアプローチでなされてい
るが、従来は個人を対象とする機構が多かった。
【0005】一方、仕事をグループで進めている場合な
ど、特定の利用者グループの興味が非常に接近する場
合、他のグループ員が行った検索行為が再利用可能にな
ることが多い。しかしながら、従来の機構にはこうした
利用者グループを対象とした適応性が考慮されていない
という問題がある。
【0006】本発明は、上記に鑑みてなされたもので、
その目的とするところは、情報検索システムの適応性を
特定の利用者グループの情報活動支援に最適化されるよ
うに高め得るグループ適応型情報検索装置を提供するこ
とにある。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、キーワードに基づく情報
検索システムにおいて、興味が接近している特定の利用
者グループのグループ員がどのような情報にアクセスし
たかを利用ログに記録し、外部情報サーバにアクセスし
て各グループ員に情報を中継する代理サーバを有し、前
記利用ログからグループ員が閲覧した情報を収集する閲
覧情報収集装置と、複数の外部サーバからなる外部検索
システム、および当該外部検索システムの出力結果から
生成した情報を収集する検索結果収集装置を有する外部
検索併用装置と、前記閲覧情報収集装置と前記検索結果
収集装置が収集した情報を索引付けして検索可能にする
情報検索装置と、使用されなくなった情報を削除する検
索母集合管理装置とを有することを要旨とする。
【0008】請求項1記載の本発明にあっては、閲覧情
報収集装置で収集した利用者グループの閲覧情報および
検索結果収集装置で収集した外部検索システムからの情
報を情報検索装置で索引付けして検索可能にすることに
より他のグループ員の閲覧や検索などの情報行動の再利
用が可能となり、利用者グループに適応した検索母集合
を有する検索装置を構築することができ、利用者グルー
プに対する適応性を高めることができる。
【0009】 また、請求項2記載の本発明は、請求項
1記載の発明において、前記外部検索併用装置が外部サ
ービス処理部に、前記閲覧情報収集装置がプロキシ入出
力部に、前記情報検索装置および前記検索母集合管理装
置がローカルデータベース部にそれぞれ組み込まれてい
ることを要旨とする。
【0010】請求項2記載の本発明にあっては、外部の
情報検索システムの検索結果を利用して情報を収集し、
索引付けする処理が外部サービス処理部に、閲覧情報
(プロキシログ等)に基づく情報の収集・索引付け処理
がプロキシ入出力部に、それぞれ組み込まれ、これら2
通りの入力情報から検索母集団を作成する処理と使用頻
度に応じて検索母集団のサイズを調整・維持する処理が
ローカルデータベース部に組み込まれる。なお、このと
きローカルデータベース部とプロキシI/O部は検索サ
ービスを起動するCGIとはタイマ起動により独立に動
く。
【0011】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態について説明する。
【0012】図1乃至図4は、本発明の一実施形態に係
るグループ適応型情報検索装置を構成する各装置の構成
を別々に示す図である。本実施形態のグループ適応型情
報検索装置は、図1に示す閲覧情報収集装置1、図2に
示す情報検索装置3、図3に示す外部検索併用装置5、
および図4に示す検索母集合管理装置7から構成されて
いる。図1に示す閲覧情報収集装置1は、代理サーバ
(プロキシ)12のログから利用者グループが閲覧した
情報を収集する。図3に示す外部検索併用装置5は、複
数の外部検索サーバ54などからなる外部検索システム
および検索結果収集装置61を有し、検索結果収集装置
61は外部検索システムの出力結果から生成した情報を
収集する。図2に示す情報検索装置3は、閲覧情報収集
装置1および検索結果収集装置61で収集した情報を索
引付けして検索可能にする。図4に示す検索母集合管理
装置7は、使用頻度が少なくなった情報を検索対象から
削除し、常に利用者グループのサイズに見合った母集合
を維持する。
【0013】各装置について更に詳しく説明する。
【0014】閲覧情報収集装置1は、図1に示すよう
に、外部情報サーバ11が汎用の情報サーバであり、利
用者9が外部情報サーバ11へのアクセスに代理サーバ
12を使用する。代理サーバ12は利用者9がどのよう
な情報にアクセスしたかを利用ログ13に記録し、外部
情報サーバ11にアクセスして利用者9に情報を中継す
る。
【0015】タイマ14は、定期的に利用ログ解析装置
15を起動する。利用ログ解析装置15は、起動される
と、解析ルール16に基づいて代理サーバ12の利用ロ
グ13から検索付けにふさわしい情報リストを抽出し、
該情報リスト17を出力する。
【0016】解析ルールは、例えば次のように記述され
る。
【0017】 .html .htm / !www.asahi.com この例では、情報の位置を示すURLの拡張子がhtmlか
htm か/で終わるもので、かつホストがwww.asahi.com
でないものだけを抽出することを指示している。
【0018】利用ログ解析装置15における解析ルール
の表現については特別な記述法を要さない。パターンマ
ッチングするかしないかで抽出するかどうかを決定す
る。閲覧情報収集装置1の出力は、抽出された情報リス
トであり、通常情報の位置を示すURLのリストであ
る。
【0019】情報検索装置3は、図2に示すように、ロ
ボット31が収集情報リスト33を順次読み出し、外部
情報サーバ11にアクセスして情報を収集する。ロボッ
ト31で収集された情報は情報検索機構34に渡され、
情報検索機構34はこの情報に基づいて索引付けを行
い、利用者9から入力される検索キーワードに対応する
情報を検索結果として利用者9に返送する。また、情報
検索装置3は、指定された情報の削除や検索の再形成と
いったデータベースとしての基本的機能を備えている。
【0020】外部検索併用装置5は、図3に示すよう
に、検索前処理部51において利用者9からの検索アク
セスからキーワードと検索条件を抽出し、外部システム
選択部52と情報検索機構34の両方に送る。外部シス
テム選択部52は選択ルール53に基づき使用すべき外
部検索サーバ54を抽出し、それぞれの問い合わせ形式
変換部55に検索キーワードと検索条件を送る。なお、
外部システム選択部52が用いる選択ルールは、検索に
用いる結果を受信できたキーワード、母集合のジャン
ル、ネットワーク位置(距離と遅延)、状態、即応性の
統計、検索結果の品質からスコアを計算するものであ
る。
【0021】例えば、 # rule file for external system selection host: search.mycompany.com(外部システムの名称) port: 3776 (通信ポート) hops: 5 (ネットワーク距離) RTT : 120ms (ネットワーク遅延) STATUS: up (外部システムの状態) LRT : 200ms (前回の応答時間) group: Computer (母集合のジャンル) keyword: (良く検索に用いられるキーワード) java,oop,network computing,distributed communicati
on,mobile agents Quality: 3/200(ユーザがクリックした数/検索結果) といった情報を外部システムごとに持ち、以下の基準に
よりシステムを選択する。
【0022】1.LRT<BASETIMEmsかつR
TT<BASETIMEmsであるシステムは常に選択
(BASETIMEはLAN環境によって決まる定数
で、例えば100msなどを設定) 2.上記以外で、 group=Generic であるシステムは常
に選択 3.上記以外で、keyword にユーザが入力した検索キー
ワードが含まれているシステムは常に選択 4.上記以外で、 Quality>BORDER%であるシス
テムを選択(BORDER値は管理者が決定する値で、
例えば1%など) また、外部システムに関する情報は適宜更新される。
【0023】問い合わせ形式変換部55および結果形式
変換部56は、それぞれ外部検索サーバ54の要求する
問い合わせ形式を生成し、結果を本グループ適応型情報
検索装置の内部形式に変換する。
【0024】検索後処理部57は、外部検索サーバ54
からなる各外部システムからの結果と情報検索機構34
からの結果を組み合わせ、適宜並び替えを行う。また、
結果の閲覧等利用者行動を追跡できるようにURLの書
換えも行う。利用者9が検索結果を利用すると、検索結
果収集装置61が起動され、利用された検索結果をリス
トの形で出力する。このリストは閲覧情報収集装置1の
出力と同様に情報検索装置3のロボット31に送られ
る。
【0025】 検索母集合管理装置7は、図4に示すよ
うに、情報の位置(URL)と属性(寿命、利用回数)
を記憶する情報管理リスト71と該情報管理リスト71
の更新に当たって適用される更新ルール73を有し、母
集合管理部74がタイマ75によって定期的に起動され
ると、更新ルール73に従って情報管理リスト71を更
新し、使用頻度が少なくなってきた情報や寿命がきた情
報を削除リストとして情報検索機構34に出力する。
【0026】なお、更新に当たっては基本的にキャッシ
ュなどで用いられるLRU(Last Rcently Used )アル
ゴリズムに基づいて情報の寿命を減じていく。更新ルー
ル73はURLのマッチングによりこの減じる方法を調
整する。例えば、 persistent: www.ingrid.org は、ホストがwww.ingrid.orgである情報の寿命を低減し
ないというルールである。
【0027】以上のように構成されるグループ適応型情
報検索装置において、利用者グループの利用する情報ア
クセス中継装置である代理サーバ12のログ情報に基づ
き情報を収集して、この収集した情報に対して情報検索
装置3で索引付けを行うとともに、また利用者グループ
が利用する外部検索サーバ54等からなる外部の情報検
索システムの検索結果を再利用し、この結果に含まれる
情報を独自に収集して、索引付けを行うというように2
通りの情報入力から検索母集合を作成する。また、使用
頻度の少なくなってきた情報については検索母集合から
削除し、常に利用者グループのサイズに見合った母集合
数を維持することができる。これらの結果、利用者グル
ープの情報要求に従来より高い適応性を有することがで
きる。
【0028】 図5は、本発明の他の実施形態に係るグ
ループ適応型情報検索装置の全体的構成を示す図であ
る。同図に示すグループ適応型情報検索装置は、WWW
検索システムであるPA search を構成しているものであ
り、利用者からのキーワード入力および検索条件を処理
する検索処理部81aおよび利用者の検索結果クリック
からキーワード−URL組とアクセス履歴を保持するフ
ィードバック部81bからなるCGI処理部81と、そ
れぞれの外部サービスに合わせて問い合わせを変換して
接続し、返却されてきた検索結果を統一的に変換すると
ともに、タイムアウト処理も有する外部検索サービス処
理部82と、ローカルDB部84に対して問い合わせを
発行して結果を得るローカルDB入出力(I/O)部8
3と、プロキシのログを処理し、重複を除いた文書情報
URLのみをローカルDB部84の入力ファイルとして
出力するプロキシ入出力(I/O)部85とから構成さ
れている。
【0029】なお、フィードバック部81bの手法は、
原田らの手法(原田、清水:”WWW検索システムにお
ける不特定多数の操作履歴の活用”、情報処理学会研究
会報告97-DSP-81,1997)による。また、ローカルDB部
84にはPerl言語で書かれたソフトウエアであるSSE
(Sony Drive Search Engine,SSE vl.1,available from
http://www.sony.co.jp/Search/downlocal-j,html)等
の任意のアプリケーションを用いる。更に、ローカルD
B部84は前記文書情報URLを元に情報を取得し、イ
ンデクシング(索引づけ)を行う。
【0030】以上説明したPA search の構造は基本機能
部のみの実装であり、簡単な実施例である。なお、PA s
earch の試作システムではプログラム言語のPerl言語を
用いて、1500行程度となっている。
【0031】
【発明の効果】以上説明したように、本発明によれば、
グループが閲覧した情報を収集して自動的に索引付けす
ることにより一度閲覧した情報に対しては迅速に検索を
行うことができ、また一度も閲覧したことがない情報に
ついては網羅性の高い既存の外部検索システムを利用し
て検索結果を得ることができ、更に検索結果としてあま
り閲覧されなくなった情報は削除されるので、情報検索
装置の適応性を特定の利用者グループの情報活動支援に
最適化し得るように高めることができる。
【0032】また、本発明によれば、利用者グループが
閲覧した情報、検索した情報を収集して、ローカルな情
報検索システムを構築し、他のグループ員が他の検索シ
ステムを用いて時間をかけて探し出した情報などを容易
に検索できるため、検索行動の再利用を可能とし、グル
ープの情報活動を効率化することができる。また、検索
母集合がグループ員の情報アクセスから生成されるの
で、従来のものよりも適応的なグループ向け情報環境支
援装置である。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るグループ適応型情報
検索装置に使用される閲覧情報収集装置の構成を示す図
である。
【図2】本発明の一実施形態に係るグループ適応型情報
検索装置に使用される情報検索装置の構成を示す図であ
る。
【図3】本発明の一実施形態に係るグループ適応型情報
検索装置に使用される外部検索併用装置の構成を示す図
である。
【図4】本発明の一実施形態に係るグループ適応型情報
検索装置に使用される検索母集合管理装置の構成を示す
図である。
【図5】本発明の他の実施形態に係るグループ適応型情
報検索装置の全体的構成を示す図である。
【符号の説明】
1 閲覧情報収集装置 3 情報検索装置 5 外部検索併用装置 7 検索母集合管理装置 11 外部情報サーバ 12 代理サーバ 34 情報検索機構 54 外部検索サーバ 61 検索結果収集装置 74 母集合管理部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−3074(JP,A) 特開 平2−128246(JP,A) 特開 平9−81577(JP,A) 特開 平5−61913(JP,A) WEBCOMPASS,Oh!PC, 日本,ソフトバンク株式会社,1997年 6月 1日,Vol.16,No.1,p p.134−135. 宗形憲樹,複数のサーチエンジンを利 用するWeb情報検索ソフト WEBC OMPASS,Hello!PC,日 本,ソフトバンク株式会社,1997年 5 月24日,Vol.4,No.9,p. 131 北村 繁宏 他,インターネット上の 情報を整理・共有するDBツール,情報 処理学会第53回全国大会講演論文集,日 本,社団法人 情報処理学会,1996年 9月 4日,Vol.3,No.4T− 1,pp.3−209〜3−210. (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 340 G06F 17/30 110 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 キーワードに基づく情報検索システムに
    おいて、興味が接近している特定の 利用者グループのグループ員
    がどのような情報にアクセスしたかを利用ログに記録
    し、外部情報サーバにアクセスして各グループ員に情報
    を中継する代理サーバを有し、前記利用ログからグルー
    プ員が閲覧した情報を収集する閲覧情報収集装置と、複数の外部サーバからなる外部検索システム、および当
    該外部検索システムの出力結果から生成した情報を収集
    する検索結果収集装置を有する外部検索併用装置 と、 前記閲覧情報収集装置と前記検索結果収集装置が収集し
    た情報を索引付けして検索可能にする情報検索装置と、 使用されなくなった情報を削除する検索母集合管理装置
    とを有することを特徴とするグループ適応型情報検索装
    置。
  2. 【請求項2】 前記外部検索併用装置が外部サービス処
    理部に、前記閲覧情報収集装置がプロキシ入出力部に、
    前記情報検索装置および前記検索母集合管理装置がロー
    カルデータベース部にそれぞれ組み込まれていることを
    特徴とする請求項1記載のグループ適応型情報検索装
    置。
JP34940897A 1997-12-18 1997-12-18 グループ適応型情報検索装置 Expired - Fee Related JP3506892B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34940897A JP3506892B2 (ja) 1997-12-18 1997-12-18 グループ適応型情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34940897A JP3506892B2 (ja) 1997-12-18 1997-12-18 グループ適応型情報検索装置

Publications (2)

Publication Number Publication Date
JPH11184862A JPH11184862A (ja) 1999-07-09
JP3506892B2 true JP3506892B2 (ja) 2004-03-15

Family

ID=18403554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34940897A Expired - Fee Related JP3506892B2 (ja) 1997-12-18 1997-12-18 グループ適応型情報検索装置

Country Status (1)

Country Link
JP (1) JP3506892B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7725526B1 (en) * 2000-06-23 2010-05-25 International Business Machines Corporation System and method for web based sharing of search engine queries
JP2002352010A (ja) * 2001-05-29 2002-12-06 Nec Corp コミュニティ情報システム及びビジネス
JP2009010957A (ja) * 2008-07-07 2009-01-15 Nec Corp 情報配信サービスシステムおよび情報配信方法
US9495460B2 (en) * 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
JP5416023B2 (ja) * 2010-04-15 2014-02-12 ヤフー株式会社 閲覧端末及び方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02128246A (ja) * 1988-11-09 1990-05-16 Toshiba Corp 分散型データベースシステムにおける制御方式
JPH033074A (ja) * 1989-05-31 1991-01-09 Toshiba Corp 分散型データベースシステム
JPH0561913A (ja) * 1991-09-02 1993-03-12 Nippon Telegr & Teleph Corp <Ntt> 情報管理装置
JP3210553B2 (ja) * 1995-09-08 2001-09-17 日本電信電話株式会社 情報提示方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEBCOMPASS,Oh!PC,日本,ソフトバンク株式会社,1997年 6月 1日,Vol.16,No.1,pp.134−135.
北村 繁宏 他,インターネット上の情報を整理・共有するDBツール,情報処理学会第53回全国大会講演論文集,日本,社団法人 情報処理学会,1996年 9月 4日,Vol.3,No.4T−1,pp.3−209〜3−210.
宗形憲樹,複数のサーチエンジンを利用するWeb情報検索ソフト WEBCOMPASS,Hello!PC,日本,ソフトバンク株式会社,1997年 5月24日,Vol.4,No.9,p.131

Also Published As

Publication number Publication date
JPH11184862A (ja) 1999-07-09

Similar Documents

Publication Publication Date Title
CA2308107C (en) Ordering of database search results based on user feedback
US7552109B2 (en) System, method, and service for collaborative focused crawling of documents on a network
US6006217A (en) Technique for providing enhanced relevance information for documents retrieved in a multi database search
US6401118B1 (en) Method and computer program product for an online monitoring search engine
US8046357B2 (en) Sampling internet user traffic to improve search results
KR101063364B1 (ko) 웹 크롤링 프로세스 동안 웹 사이트에 우선순위를 부여하기위한 시스템 및 방법
US7013323B1 (en) System and method for developing and interpreting e-commerce metrics by utilizing a list of rules wherein each rule contain at least one of entity-specific criteria
US6983320B1 (en) System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages
US6418453B1 (en) Network repository service for efficient web crawling
US6718365B1 (en) Method, system, and program for ordering search results using an importance weighting
US7739281B2 (en) Systems and methods for ranking documents based upon structurally interrelated information
JP5114380B2 (ja) 検索結果の関連性の再ランク付けおよびその増強
US6789076B1 (en) System, method and program for augmenting information retrieval in a client/server network using client-side searching
US9189553B2 (en) Methods and systems for prioritizing a crawl
JPH1091638A (ja) 検索システム
JP2007526537A (ja) 持続的にイベントデータを記憶および提供するためのサーバアーキテクチャおよび方法
WO2000077689A1 (en) A process for improving search engine efficiency using user feedback
Lee et al. Intelligent agents for matching information providers and consumers on the world-wide-web
CN100527106C (zh) 增加对于可从数据网得到的内容的存取速度的方法
JPWO2003042869A1 (ja) 情報検索支援装置、コンピュータプログラム、プログラム格納媒体
Fu et al. A Framework for Personal Web Usage Mining.
JP3506892B2 (ja) グループ適応型情報検索装置
US7266762B1 (en) Method and system for distributed autonomous maintenance of bidirectional hyperlink metadata on the web and similar hypermedia repository
US20060116992A1 (en) Internet search environment number system
US20060149606A1 (en) System and method for agent assisted information retrieval

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081226

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091226

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees