JP2000339320A - 情報検索方法および装置と情報検索プログラムを記録した記録媒体 - Google Patents

情報検索方法および装置と情報検索プログラムを記録した記録媒体

Info

Publication number
JP2000339320A
JP2000339320A JP11145267A JP14526799A JP2000339320A JP 2000339320 A JP2000339320 A JP 2000339320A JP 11145267 A JP11145267 A JP 11145267A JP 14526799 A JP14526799 A JP 14526799A JP 2000339320 A JP2000339320 A JP 2000339320A
Authority
JP
Japan
Prior art keywords
information
user
search
character string
indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11145267A
Other languages
English (en)
Other versions
JP3655495B2 (ja
Inventor
Seiji Washisaki
誠司 鷲▲崎▼
Tatsuya Muramoto
達也 村本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP14526799A priority Critical patent/JP3655495B2/ja
Publication of JP2000339320A publication Critical patent/JP2000339320A/ja
Application granted granted Critical
Publication of JP3655495B2 publication Critical patent/JP3655495B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 WWW上で増加している膨大な情報から目的
とする情報を適確かつ効率的に検索し得る情報検索方法
および装置と情報検索プログラムを記録した記録媒体を
提供する。 【解決手段】 利用者のハイパーリンク情報の参照履歴
を履歴記録部4を介してアクセス履歴データベース5に
記録し、利用者が参照した情報を情報分割部6で該情報
の意味内容に基づき複数の部分に分割し、この分割した
情報の各部分を示していて、かつハイパーリンクとして
関係づけられている情報を探索し、この探索して検出し
た情報から当該情報を示している文字列を文字列抽出部
7で抽出し、当該情報の分割した各部分に対して各部分
を示している文字列をまとめて目次データベース9に蓄
積しておき、利用者からの検索要求に対して、検索部2
により目次データベース9から文字列を検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、互いに関連づけら
れている膨大なハイパーテキスト情報の中から利用者の
目的とする情報を参照する際に、他の利用者の参照履歴
を利用して情報検索を効率良く行う情報検索方法および
装置に関し、特にある目的を持って情報を検索している
利用者に対して過去の情報参照履歴を用いて情報を効率
的に検索する情報検索方法および装置と情報検索プログ
ラムを記録した記録媒体に関する。
【0002】
【従来の技術】現在、WWW(World Wide Web)上で
は、情報が爆発的に増加している。このような情報は知
識の集合体であるとみなすことが可能であり、このよう
な情報を効率よく利用するための方法がいくつも提案さ
れている。このような方法のうち、ディレクトリ型検索
サービスおよびロボット型検索サービスについて説明す
る。
【0003】ディレクトリ型検索サービスは、情報を主
観的な観点で分類し、それを効率良く参照できるように
したシステムである。スポーツ情報を例に取ると、スポ
ーツという概念の下には、様々なスポーツの種類が分類
されている。サッカー、野球、ラグビーなどの情報は、
スポーツ情報配下の階層に存在するという一般的な常識
と一致するため、利用者は戸惑うことなく、これらの情
報にアクセスできると考えられる。このように様々な情
報を適当な概念にまとめて、それらを階層的に整理した
のが、このサービスのポイントである。NTT Directo
ry(http://navi.ntt.co.jp) ,Yahoo(http://www.yaho
o.co.jp/)などが代表例である。
【0004】次に、ロボット型検索サービスに関しての
説明を行う。WWW上には、現在数億の情報が存在する
と言われている。これらの情報を上記のディレクトリ型
サービスで実現することは、その分類方法が自動化でき
ないために、かなり難しいと言われている。そこで、W
WW上の雑多な情報を検索するために、WWW情報の記
述形式であるHTML(Hyper Text Markup Language)
のハイパーリンクを自動的に辿ることで、予めWWW上
の情報を可能な限り収集しておき、そうして収集した情
報を全文検索機能などを用いて検索可能にすることで、
WWW上の情報の検索を仮想的に実現したものである。
TITAN(http://titan.mcnet.ne.jp/) ,Goo(htt
p://www.goo.ne.jp)が代表例である。
【0005】すなわち、ロボット型検索サービスでは、
インターネットロボットと呼ばれるソフトウェアによ
り、HTMLが持つハイパーリンクを再帰的に辿ること
により情報の収集を行うものであり、ディレクトリ型検
索サービスと比較してかなり大量な情報を収集すること
が可能であり、それに合わせた検索サービスを行うこと
により、WWWのかなりの部分の情報を仮想的に検索す
ることが可能になる。
【0006】
【発明が解決しようとする課題】上述した従来の方法の
うち、ディレクトリ型検索サービスでは、情報を主観的
に分類するというディレクトリ型サービスの特徴から、
情報の精度は高いが、情報量が少ないという問題点があ
る。現在サービスされているものでは、数10万件程度
の情報を収集しているに過ぎない。これでは、WWW上
の全情報に対する割合が、数パーセントにしか達せず、
情報の取りこぼしや、本当に必要な情報に辿りつけない
ことがある。
【0007】また、ロボット型検索サービスでは、上述
したように、ディレクトリ型検索サービスと比較してか
なり大量な情報を収集することが可能であり、WWWの
かなりの部分の情報を仮想的に検索することが可能にな
るが、利用者が探索目的を検索語句で表現し、その検索
語句に対して最も近いものから順に出力することになる
ため、検索語句を慎重に選択しないと、膨大な数の結果
が返却され、結局その膨大な情報の中から必要な情報を
探索しなければならないという新たな問題が発生する。
【0008】本発明は、上記に鑑みてなされたもので、
その目的とするところは、WWW上で増加している膨大
な情報から目的とする情報を適確かつ効率的に検索し得
る情報検索方法および装置と情報検索プログラムを記録
した記録媒体を提供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、互いに関連づけられてい
る膨大なハイパーテキスト情報の中から利用者の目的と
する情報を参照する際に、他の利用者の参照履歴を利用
して情報検索を行う情報検索方法であって、利用者のハ
イパーリンク情報の参照履歴を記録し、利用者が参照し
た情報を該情報の意味内容に基づき複数の部分に分割
し、この分割した情報の各部分を示していて、かつハイ
パーリンクとして関係づけられている情報を探索し、こ
の探索して検出した情報から当該情報を示している文字
列を抽出し、当該情報の分割した各部分に対して各部分
を示している文字列をまとめて蓄積しておき、利用者か
らの検索要求に対して、前記蓄積した文字列を検索する
ことを要旨とする。
【0010】請求項1記載の本発明にあっては、利用者
のハイパーリンク情報の参照履歴を記録し、利用者が参
照した情報を複数の部分に分割し、この分割した情報の
各部分を示している情報を探索し、この探索した情報か
ら当該情報を示している文字列を抽出し、当該情報の分
割した各部分に対して各部分を示している文字列をまと
めて蓄積しておき、利用者からの検索要求に対して、蓄
積した文字列を検索するため、他の利用者の情報参照履
歴から目次的な情報を予め作成し、この情報を検索する
ことで、より抽象化された情報の検索が可能となり、利
用者が求める情報に容易に辿りつくことができる。
【0011】また、請求項2記載の本発明は、請求項1
記載の発明において、当該情報の分割したある部分を示
している文字列が複数存在する場合、この複数の文字列
から当該部分に最も関連深い文字列を選択することを要
旨とする。
【0012】請求項2記載の本発明にあっては、当該情
報の分割したある部分を示している文字列が複数存在す
る場合、この複数の文字列から当該部分に最も関連深い
文字列を選択するため、最適な情報を検索することがで
きる。
【0013】更に、請求項3記載の本発明は、請求項1
記載の発明において、前記蓄積した文字列を検索する処
理が、利用者の検索要求に対して情報を検索するだけで
なく、検索結果として得られる情報を分割した各部分に
相当する文字列を当該情報の抽象化された目次情報とし
て提示することを要旨とする。
【0014】請求項3記載の本発明にあっては、利用者
の検索要求に対して情報を検索するだけでなく、検索結
果として得られる情報を分割した各部分に相当する文字
列を当該情報の抽象化された目次情報として提示するた
め、その情報の構造を明確にすることができる。
【0015】請求項4記載の本発明は、互いに関連づけ
られている膨大なハイパーテキスト情報の中から利用者
の目的とする情報を参照する際に、他の利用者の参照履
歴を利用して情報検索を行う情報検索装置であって、利
用者のハイパーリンク情報の参照履歴を記録する参照履
歴記録手段と、利用者が参照した情報を該情報の意味内
容に基づき複数の部分に分割する情報分割手段と、この
分割した情報の各部分を示していて、かつハイパーリン
クとして関係づけられている情報を前記参照履歴記録手
段から探索する情報探索手段と、この探索して検出した
情報から当該情報を示している文字列を抽出する文字列
抽出手段と、当該情報の分割された各部分に対して各部
分を示している文字列をまとめて蓄積する文字列蓄積手
段と、利用者からの検索要求に対して、前記蓄積した文
字列を前記文字列蓄積手段から検索する検索手段とを有
することを要旨とする。
【0016】請求項4記載の本発明にあっては、利用者
のハイパーリンク情報の参照履歴を記録し、利用者が参
照した情報を複数の部分に分割し、この分割した情報の
各部分を示している情報を探索し、この探索した情報か
ら当該情報を示している文字列を抽出し、当該情報の分
割した各部分に対して各部分を示している文字列をまと
めて蓄積しておき、利用者からの検索要求に対して、蓄
積した文字列を検索するため、他の利用者の情報参照履
歴から目次的な情報を予め作成し、この情報を検索する
ことで、より抽象化された情報の検索が可能となり、利
用者が求める情報に容易に辿りつくことができる。
【0017】また、請求項5記載の本発明は、請求項4
記載の発明において、当該情報のある部分を示している
文字列が複数存在する場合、この複数の文字列から当該
部分に最も関連深い文字列を選択する選択手段を有する
ことを要旨とする。
【0018】請求項5記載の本発明にあっては、当該情
報の分割したある部分を示している文字列が複数存在す
る場合、この複数の文字列から当該部分に最も関連深い
文字列を選択するため、最適な情報を検索することがで
きる。
【0019】更に、請求項6記載の本発明は、請求項4
記載の発明において、前記検索手段が、利用者の検索要
求に対して情報を検索するだけでなく、検索結果として
得られる情報を分割した各部分に相当する文字列を当該
情報の抽象化された目次情報として提示する手段を有す
ることを要旨とする。
【0020】請求項6記載の本発明にあっては、利用者
の検索要求に対して情報を検索するだけでなく、検索結
果として得られる情報を分割した各部分に相当する文字
列を当該情報の抽象化された目次情報として提示するた
め、その情報の構造を明確にすることができる。
【0021】請求項7記載の本発明は、互いに関連づけ
られている膨大なハイパーテキスト情報の中から利用者
の目的とする情報を参照する際に、他の利用者の参照履
歴を利用して情報検索を行う情報検索プログラムを記録
した記録媒体であって、利用者のハイパーリンク情報の
参照履歴を記録し、利用者が参照した情報を該情報の意
味内容に基づき複数の部分に分割し、この分割した情報
の各部分を示していて、かつハイパーリンクとして関係
づけられている情報を探索し、この探索して検出した情
報から当該情報を示している文字列を抽出し、当該情報
の分割した各部分に対して、各部分を示している文字列
をまとめて蓄積し、利用者からの検索要求に対して、前
記蓄積した文字列を検索する情報検索プログラムを記録
媒体に記録することを要旨とする。
【0022】請求項7記載の本発明にあっては、利用者
のハイパーリンク情報の参照履歴を記録し、利用者が参
照した情報を複数の部分に分割し、この分割した情報の
各部分を示している情報を探索し、この探索した情報か
ら当該情報を示している文字列を抽出し、当該情報の分
割した各部分に対して各部分を示している文字列をまと
めて蓄積しておき、利用者からの検索要求に対して、蓄
積した文字列を検索する情報検索プログラムを記録媒体
に記録しているため、該記録媒体を用いて、その流通性
を高めることができる。
【0023】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。図1は、本発明の一実施形態に係る
情報検索装置の構成を示すブロック図である。同図に示
す情報検索装置は、互いに関連づけられている膨大なハ
イパーテキスト情報の中から利用者の目的とする情報を
参照しようとする際に他の利用者の参照履歴を利用して
情報検索を効率的に行うものである。なお、ハイパーテ
キストを実現しているものは、Apple社のハイパー
テキスト、インターネット上のWWW(World Wide We
b),XML(eXtensible Markup Language)などの様
々なものがあるが、本実施形態では説明をわかりやすく
するために、WWWを一例として説明するが、他のハイ
パーテキストシステムに対しても同様の方法で適用可能
である。
【0024】図1において、1はWWW情報を参照する
利用者であるクライアント、2は検索部、3は中継サー
バ、4は履歴記録部、5はアクセス履歴データベース
(DB)、6は情報分割部、7は文字列抽出部、8は文
字列蓄積部、9は目次データベース(DB)、11はW
WW、10はWWW11上の情報である。
【0025】次に、図2に示すフローチャートおよび図
3乃至図7を参照して、図1に示す実施形態の作用を説
明する。
【0026】WWW11上のWWW情報10を参照して
いる利用者であるクライアント1は、セキュリティ上、
中継サーバ3を介してインターネット上のWWW情報1
0にアクセスしていることが多く、中継サーバ3は各ク
ライアント1からの参照要求を実際のWWWサーバに問
いかけると同時に、その参照履歴を履歴記録部4を介し
てアクセス履歴データベース5に蓄積している。なお、
このような中継サーバ3を利用していない場合でも、各
情報10に対する参照履歴は、各情報サーバに蓄積され
ており、それを利用することにより多くの履歴情報の利
用が可能である。このような参照履歴はハイパーリンク
が指し示している有向グラフとして蓄積されていると考
えてよい。
【0027】上述したようにアクセス履歴データベース
5に参照履歴が蓄積されると、この蓄積された参照履歴
の中のある情報が抽出され(図2のステップS10
1)、この抽出した情報をその意味内容に基づいて情報
分割部6で分割する(ステップS102)。なお、分割
方法は様々なものがあるが、例えば text tiling手法
(Marti A.Hearst,a quantitative approach to discou
rse segmentation,1993 )や、HTML(Hyper Text M
arkup Language)の構造などを用いることにより、その
意味内容に基づく分割が可能である。
【0028】上述した参照情報の抽出および分割処理に
ついて図3、図4を参照して詳細に説明する。参照履歴
は、ある情報を基にして考えると、それを指している情
報とそれが示している情報に分類することができる。す
なわち、図3において、ある情報はターゲット情報であ
り、HTML−1〜3は「それを指している情報」であ
り、HTML−A〜Cは「それが指している情報」であ
る。このように過去に複数の利用者により辿られた履歴
に基づき、リンク上の関係が存在するので、それを抽出
する。すなわち、参照履歴から訪問したURLを抽出す
るのである。
【0029】また、このように抽出された情報、すなわ
ち図3に示すターゲット情報をその意味内容に基づき分
割すると、図4に示すように、Part1,Part
2,Part3,Part4のように複数の部分に分割
される。このように意味内容に基づいてターゲット情報
を分割した各部分情報のうち、Part1で示す部分情
報はHTML−1に含まれる文字列であるアンカー(An
chor)で指し示され、またターゲット情報のPart1
で示す部分情報に含まれる文字列であるアンカー(Anch
or)でHTML−Aが指し示されるというようにリンク
上の関係が存在する。また、同様にターゲット情報を分
割した各部分情報のうち、Part2で示す部分情報は
HTML−3に含まれる文字列であるアンカー(Ancho
r)で指し示され、このPart2で示す部分情報に含
まれる文字列であるアンカー(Anchor)でHTML−B
が指し示されている。更に同様にターゲット情報を分割
した各部分情報のうち、Part4で示す部分情報はH
TML−2に含まれる文字列であるアンカー(Anchor)
で指し示され、このPart4で示す部分情報に含まれ
る文字列であるアンカー(Anchor)でHTML−Cが指
し示されている。
【0030】上述したように、情報の分割が終了する
と、当該情報の一部が抽出される(ステップS10
3)。具体的には、図4に示す例では、Part1など
のような情報の一部が抽出される。それから、この部分
情報を探索して、該部分情報を指している参照元の情報
が検出できないか否か、すなわち発見できたか否かをチ
ェックする(ステップS104)。
【0031】この参照元の探索は、具体的には例えば図
4においてPart1という部分情報の中に存在するハ
イパーリンク情報を探索し、このハイパーリンク情報が
参照履歴の中に存在しているかどうかを確認する。これ
は例えばHTML−Aのようなものである。このハイパ
ーリンク情報が参照履歴として存在する場合には、Pa
rt1の情報、すなわち履歴上ではターゲット情報のU
RLに相当する情報とHTML−Aを含む参照履歴の列
をアクセス履歴データベース5から探索し、それが存在
する場合には、その前の履歴としての参照元を特定す
る。図4では、HTML−1が参照元として特定でき
る。同様に、図4ではPart2にはHTML−3、P
art4にはHTML−2が参照元として特定できる。
すなわち、上記処理では、ターゲット情報をその内容に
より分割し、その中からリンクの状況を基にどこから参
照されているかを同定する。
【0032】上述したように、当該部分情報を示してい
る情報を検出できた場合には、当該部分情報を示してい
るハイパーリンクを文字列抽出部7で探索して抽出する
(ステップS105)。具体的には、図5に示す例で
は、Anchor1のような文字列である。実際には、
この文字列を辿ると、ターゲット情報が参照できるよう
な仕組みになっており、このような文字列のことをアン
カー(Anchor)文字列と呼ばれているものである。例え
ば、図5では、ターゲットとなる情報がPart1〜4
の4つに分割され、各々はいくつかの情報から指し示さ
れ(いわゆるリンクされ)各々のアンカー文字列として
Anchor1〜8が抽出されている。このような文字
列のAnchorと各ブロックである部分情報Part
1〜4を対応づけて、目次データベース9に蓄積してお
くのである。なお、図5に示すように、ターゲット情報
の分割したPart1〜4で示す各部分情報を示してい
る文字列であるAnchorが1つの部分情報に対して
複数存在する場合、この複数の文字列であるアンカー
(Anchor)から当該部分情報に最も関連深い文字列を選
択するようになっている。
【0033】具体的には、図7のような各参照先とその
各部分に対して、参照元文字列すなわちアンカー文字列
が存在する。参照先のhttp://www.foo.co.jp/ のPar
t1には、「プロ野球」「メジャーリーグ」などのよう
な文字列が対応づけられていることを示している。この
ように対応づけられた文字列と情報を文字列蓄積部8を
介して目次データベース9に蓄積する(ステップS10
6)。なお、目次データベースと呼んでいるのは、各文
字列が該当する情報に対して目次のような働きをするか
らである。
【0034】上述したように、目次データベース9が構
築されてから、図6に示すように、利用者であるクライ
アント1から情報の検索要求(Query) が出されると、検
索エンジンである検索部2は実際のWWW11を検索す
るのではなく、目次データベース9を検索する。目次情
報は元の情報の抽象化された情報と考えることができ、
より効果的な検索が可能になる。この検索の結果として
得られた情報を利用者に返却し、利用者は実際の情報へ
アクセスすることができる。検索部2による文字列の検
索処理は、利用者の検索要求に対して情報を検索するだ
けでなく、検索結果として得られる情報を分割した各部
分に相当する文字列を当該情報の抽象化された目次情報
として提示するようになっている。
【0035】また、利用者は検索で発見された情報の意
味的な構造を、各々の部分毎に付与されている文字列を
目次とみなすことにより、容易に把握することができ、
今まではその構造が意識されていなかったところに、具
体的な構造を導入することが可能になる。この場合、利
用者への提示方法としては、まず目次情報に相当する文
字列を出力しておき、それに該当する情報をハイパーリ
ンクとして辿ることができるようにしておくと、その構
造を生かして情報獲得が可能になる。
【0036】上述したように、本実施形態の情報検索装
置では、他の利用者の情報参照の一連の流れを利用する
ことにより、情報への効率的なアクセスを実現してい
る。すなわち、情報検索の目的に対して過去に同じよう
な検索が行われている場合には、その参照履歴を取得
し、それを元に当該情報の各部分が指されている情報の
文字列から、当該情報の目次に相当する情報として取り
扱うことで、この目次に相当すると考えられる文字列を
検索し、これにより更に精度が高く、無駄のない情報検
索が可能になる。また、目次に相当する情報を利用者に
提示することにより、その情報の構造を明確にすること
ができる。
【0037】なお、上記実施形態の処理をプログラムと
して記録媒体に記録することにより該記録媒体を用い
て、その流通性を高めることができる。
【0038】
【発明の効果】以上説明したように、本発明によれば、
利用者のハイパーリンク情報の参照履歴を記録し、利用
者が参照した情報を複数の部分に分割し、この分割情報
の各部分を示している情報を探索し、この探索した情報
から当該情報を示している文字列を抽出し、当該情報の
分割した各部分に対して各部分を示している文字列をま
とめて蓄積しておき、利用者からの検索要求に対して、
蓄積した文字列を検索するので、他の利用者の情報参照
履歴から目次的な情報を予め作成し、この情報を検索す
ることで、より抽象化された情報の検索が可能となり、
利用者が求める情報に容易に辿りつくことができる。
【0039】また、本発明によれば、利用者の検索要求
に対して情報を検索するだけでなく、検索結果として得
られる情報を分割した各部分に相当する文字列を当該情
報の抽象化された目次情報として提示するので、情報の
構造を抽象化された目次で容易に把握することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る情報検索装置の構成
を示すブロック図である。
【図2】図1に示す情報検索装置の作用を示すフローチ
ャートである。
【図3】図1に示す情報検索装置における参照情報の収
集処理を示す説明図である。
【図4】図1に示す情報検索装置における参照元の同定
処理を示す説明図である。
【図5】図1に示す情報検索装置におけるアンカー(An
chor)とそれに対する情報の蓄積処理を示す説明図であ
る。
【図6】図1に示す情報検索装置における利用者の検索
要求に適合する情報集合の抽出処理を示す説明図であ
る。
【図7】図1に示す情報検索装置において抽出したアン
カー文字列と情報の例を示す図である。
【符号の説明】
3 中継サーバ 4 履歴記録部 5 アクセス履歴データベース 6 情報分割部 7 文字列抽出部 8 文字列蓄積部 9 目次データベース 10 情報 11 WWW

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 互いに関連づけられている膨大なハイパ
    ーテキスト情報の中から利用者の目的とする情報を参照
    する際に、他の利用者の参照履歴を利用して情報検索を
    行う情報検索方法であって、 利用者のハイパーリンク情報の参照履歴を記録し、 利用者が参照した情報を該情報の意味内容に基づき複数
    の部分に分割し、 この分割した情報の各部分を示していて、かつハイパー
    リンクとして関係づけられている情報を探索し、 この探索して検出した情報から当該情報を示している文
    字列を抽出し、 当該情報の分割した各部分に対して各部分を示している
    文字列をまとめて蓄積しておき、 利用者からの検索要求に対して、前記蓄積した文字列を
    検索することを特徴とする情報検索方法。
  2. 【請求項2】 当該情報の分割したある部分を示してい
    る文字列が複数存在する場合、この複数の文字列から当
    該部分に最も関連深い文字列を選択することを特徴とす
    る請求項1記載の情報検索方法。
  3. 【請求項3】 前記蓄積した文字列を検索する処理は、
    利用者の検索要求に対して情報を検索するだけでなく、
    検索結果として得られる情報を分割した各部分に相当す
    る文字列を当該情報の抽象化された目次情報として提示
    することを特徴とする請求項1記載の情報検索方法。
  4. 【請求項4】 互いに関連づけられている膨大なハイパ
    ーテキスト情報の中から利用者の目的とする情報を参照
    する際に、他の利用者の参照履歴を利用して情報検索を
    行う情報検索装置であって、 利用者のハイパーリンク情報の参照履歴を記録する参照
    履歴記録手段と、 利用者が参照した情報を該情報の意味内容に基づき複数
    の部分に分割する情報分割手段と、 この分割した情報の各部分を示していて、かつハイパー
    リンクとして関係づけられている情報を前記参照履歴記
    録手段から探索する情報探索手段と、 この探索して検出した情報から当該情報を示している文
    字列を抽出する文字列抽出手段と、 当該情報の分割された各部分に対して各部分を示してい
    る文字列をまとめて蓄積する文字列蓄積手段と、 利用者からの検索要求に対して、前記蓄積した文字列を
    前記文字列蓄積手段から検索する検索手段とを有するこ
    とを特徴とする情報検索装置。
  5. 【請求項5】 当該情報のある部分を示している文字列
    が複数存在する場合、この複数の文字列から当該部分に
    最も関連深い文字列を選択する選択手段を有することを
    特徴とする請求項4記載の情報検索装置。
  6. 【請求項6】 前記検索手段は、利用者の検索要求に対
    して情報を検索するだけでなく、検索結果として得られ
    る情報を分割した各部分に相当する文字列を当該情報の
    抽象化された目次情報として提示する手段を有すること
    を特徴とする請求項4記載の情報検索装置。
  7. 【請求項7】 互いに関連づけられている膨大なハイパ
    ーテキスト情報の中から利用者の目的とする情報を参照
    する際に、他の利用者の参照履歴を利用して情報検索を
    行う情報検索プログラムを記録した記録媒体であって、 利用者のハイパーリンク情報の参照履歴を記録し、 利用者が参照した情報を該情報の意味内容に基づき複数
    の部分に分割し、 この分割した情報の各部分を示していて、かつハイパー
    リンクとして関係づけられている情報を探索し、 この探索して検出した情報から当該情報を示している文
    字列を抽出し、 当該情報の分割した各部分に対して、各部分を示してい
    る文字列をまとめて蓄積し、 利用者からの検索要求に対して、前記蓄積した文字列を
    検索することを特徴とする情報検索プログラムを記録し
    た記録媒体。
JP14526799A 1999-05-25 1999-05-25 情報検索方法および装置と情報検索プログラムを記録した記録媒体 Expired - Fee Related JP3655495B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14526799A JP3655495B2 (ja) 1999-05-25 1999-05-25 情報検索方法および装置と情報検索プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14526799A JP3655495B2 (ja) 1999-05-25 1999-05-25 情報検索方法および装置と情報検索プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000339320A true JP2000339320A (ja) 2000-12-08
JP3655495B2 JP3655495B2 (ja) 2005-06-02

Family

ID=15381188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14526799A Expired - Fee Related JP3655495B2 (ja) 1999-05-25 1999-05-25 情報検索方法および装置と情報検索プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3655495B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002304411A (ja) * 2001-04-06 2002-10-18 Nec Fielding Ltd 情報検索配信システムおよびプログラム
JPWO2005121982A1 (ja) * 2004-06-14 2008-04-10 日本電気株式会社 情報提供システム、方法、プログラム、情報通信端末、および情報表示切り替えプログラム
JP2008192168A (ja) * 2001-03-30 2008-08-21 Siemens Ag 既に呼出した情報ページを再度見出すための表示の発生方法
JP2009032292A (ja) * 2008-11-10 2009-02-12 Nec Corp 文書検索装置、検索方法及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776886B (zh) * 2016-11-29 2019-09-24 中国农业银行股份有限公司 一种网页页面正文内容抽取方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113356A (ja) * 1997-06-13 1999-01-06 Nippon Telegr & Teleph Corp <Ntt> 情報共助方法及びシステム及び情報共助プログラムを格納した記憶媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113356A (ja) * 1997-06-13 1999-01-06 Nippon Telegr & Teleph Corp <Ntt> 情報共助方法及びシステム及び情報共助プログラムを格納した記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008192168A (ja) * 2001-03-30 2008-08-21 Siemens Ag 既に呼出した情報ページを再度見出すための表示の発生方法
JP2002304411A (ja) * 2001-04-06 2002-10-18 Nec Fielding Ltd 情報検索配信システムおよびプログラム
JPWO2005121982A1 (ja) * 2004-06-14 2008-04-10 日本電気株式会社 情報提供システム、方法、プログラム、情報通信端末、および情報表示切り替えプログラム
JP2009032292A (ja) * 2008-11-10 2009-02-12 Nec Corp 文書検索装置、検索方法及びプログラム

Also Published As

Publication number Publication date
JP3655495B2 (ja) 2005-06-02

Similar Documents

Publication Publication Date Title
US8276065B2 (en) System and method for classifying electronically posted documents
KR100403714B1 (ko) 웹문서 레이아웃 이미지 및 웹사이트 구조를 제공하여인터넷 검색을 용이하게 할 수 있는 시스템 및 방법
US6671681B1 (en) System and technique for suggesting alternate query expressions based on prior user selections and their query strings
US7725424B1 (en) Use of generalized term frequency scores in information retrieval systems
US7225407B2 (en) Resource browser sessions search
US9268856B2 (en) System and method for inclusion of interactive elements on a search results page
KR100505848B1 (ko) 검색 시스템
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
Wöber Domain specific search engines
US7756860B2 (en) Advanced handling of multiple form fields based on recent behavior
US20070033229A1 (en) System and method for indexing structured and unstructured audio content
US7849070B2 (en) System and method for dynamically ranking items of audio content
CA2245089A1 (en) Search system for providing fulltext search over web pages of world wide web servers
EP2380099A1 (en) System and method for aggregating data from a plurality of web sites
US20040015485A1 (en) Method and apparatus for improved internet searching
JP2010128928A (ja) 検索システム及び検索方法
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
JP3698242B2 (ja) 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体
US8005827B2 (en) System and method for accessing preferred provider of audio content
KR100557874B1 (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
JP4010058B2 (ja) 文書関連付け装置、文書閲覧装置、文書関連付けプログラムを記録したコンピュータ読み取り可能な記録媒体及び文書閲覧プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000339320A (ja) 情報検索方法および装置と情報検索プログラムを記録した記録媒体
Ayan et al. Automating extraction of logical domains in a web site
KR100931772B1 (ko) 웹사이트 검색 서비스 제공 방법 및 그 시스템

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041005

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050303

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080311

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090311

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090311

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100311

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110311

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees