JP3521174B2 - 情報フィルタリング装置および同装置に適用される関連情報提供方法 - Google Patents

情報フィルタリング装置および同装置に適用される関連情報提供方法

Info

Publication number
JP3521174B2
JP3521174B2 JP21456397A JP21456397A JP3521174B2 JP 3521174 B2 JP3521174 B2 JP 3521174B2 JP 21456397 A JP21456397 A JP 21456397A JP 21456397 A JP21456397 A JP 21456397A JP 3521174 B2 JP3521174 B2 JP 3521174B2
Authority
JP
Japan
Prior art keywords
document
documents
company
related information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21456397A
Other languages
English (en)
Other versions
JPH1153392A (ja
Inventor
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21456397A priority Critical patent/JP3521174B2/ja
Publication of JPH1153392A publication Critical patent/JPH1153392A/ja
Application granted granted Critical
Publication of JP3521174B2 publication Critical patent/JP3521174B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、たとえば新たに
発生した情報の中からユーザが所望する情報のみを選択
して提供する情報フィルタリング装置および同装置に適
用される関連情報提供方法に係り、特に選択した情報に
関連する情報を適切に検索して付与する情報フィルタリ
ング装置および関連情報提供方法に関する。
【0002】
【従来の技術】近年のインターネットの普及に伴ない、
誰もがこのインターネットに接続された世界中に点在す
る計算機に格納された情報を簡単にアクセスできるよう
になってきている。特に、WWW(World Wid
e Web)では、HTTP(Hyper Text
Transfer Protocol)を用いることに
より、利用者が世界中の情報をGUI(Graphic
al User Interface)ベースのブラウ
ザによって簡単にアクセスできる仕組みを提供してい
る。このWWWでは、ある計算機上でhttpdと呼ば
れるソフトウェアを用いる。このソフトウェアは、自身
が動作する計算機のデータベースに格納されているHT
ML(Hyper Text Markup Lang
uage)で記述したハイパーテキストファイルを、他
の計算機からの要求に応じて転送するものである。した
がって、インターネットに接続されている計算機は、転
送してもらいたいハイパーテキストファイルを格納して
いる計算機上で動作しているhttpdに対し、ハイパ
ーテキストファイルのアドレスを指定することによって
指定したファイルを読み取ることができる。
【0003】HTMLの記述では、ハイパーテキストフ
ァイル内のリンク情報が、前記アドレスにより記述され
るので、HTTPのプロトコルにしたがったブラウザ
は、各httpd支配下のハイパーテキストファイルを
表示できることになる。ブラウザは、音声、静止画およ
び動画などのマルチメディアデータを含むハイパーテキ
ストを表示することができる。
【0004】このWWWの仕組みにより、ユーザは、簡
単にインターネット上の情報にアクセスできるようにな
り、多くの個人や企業が、Webページまたはホームペ
ージと呼ばれるハイパーテキストファイルを公開するよ
うになってきている。
【0005】一方、インターネットの普及とともに文書
の電子化も進んでおり、新聞や雑誌といった出版物も電
子的に提供する(つまり電子メールやWWWによって提
供される)ことが始まりつつある。従来の紙ベースで行
なわれていた出版が電子化されることにより、今後は書
店などにわざわざ足を運ばなくても、家庭にいながら種
々の情報を入手できるようになってくると考えられる。
しかしながら、このような情報アクセスの利便性の増大
は、逆に情報洪水ともいえる状況を作り出しつつある。
すなわち、アクセスできる情報があまりにも膨大になる
結果、不要な情報の中に肝心な必要とする情報が埋もれ
てしまい、見失ってしまうといった現象が出てくる。こ
のため、膨大な情報からユーザの要求・興味にあったも
のを選出してユーザに提供する情報フィルタリング装置
の需要が高まりつつある。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
情報フィルタリング装置においては、予め定められた情
報源(たとえば、新聞社で発行する新聞記事)から情報
を選択するだけであった。たとえば、新聞社が発行する
新聞記事を対象とした情報フィルタリング装置では、ユ
ーザごとに設定された検索条件にしたがって関連する記
事を選択するのみである。このため、仮にフィルタリン
グ結果の記事内の内容に関してより詳しいことを知りた
いとユーザが感じても、その記事から直接情報を得るこ
とができないという問題があった。
【0007】たとえば、わからない単語が出てきた場合
は、その単語の意味を辞書などで調べる必要がある。こ
のような場合、ユーザは辞書を引けば良いだけであるの
で、たいした手間がかかるとはいえない。ところが、多
くの場合、単語の意味内容を調べるといった単純なもの
ではなく、関連する情報を収集したいといったことが多
い。したがって、たとえばWWW上で公開されている検
索サーバを使って、知りたい内容をさらに検索するとい
ったようなことを行なう必要があった。あるいは、記事
が新製品の発売などの記事であった場合には、その記事
内容を発表した企業のホームページをWWW上で閲覧
し、そこに格納されているプレスリリースの原稿や関連
情報などを探して必要な情報を得る必要があった。
【0008】単語の意味を調べるといった単純な内容で
あれば辞書で十分であるが、関連情報を調べるといった
ときに、そのような情報は辞書や百科事典といった出版
物に頼っていては新鮮な情報を得ることができにない。
現在、WWWが普及してきた状況にあっては、新鮮な情
報を得ようとすれば、WWWを利用するのが最適な方法
であるといえる。
【0009】しかしながら、現状のネットワーク基盤に
あっては、WWWでWebページにアクセスするには多
くの通信時間がかかるため、ユーザが所望の情報を得よ
うとすると、膨大な手間と時間が必要である。
【0010】この発明はこのような実情に鑑みてなされ
たものであり、記事中の詳細情報や関連情報などを掲載
しているWebページを事前に検索しておき、そのよう
なページとのリンク付けを予め行なっておくことによ
り、ユーザの手間を格段に減らすことを可能とする情報
フィルタリング装置および同装置に適用される関連情報
提供方法を提供することを目的とする。
【0011】
【課題を解決するための手段】この発明は、前述した目
的を達成するために、複数の文書の中から予め登録され
た検索条件に合致する文書を選択する情報フィルタリン
グ装置において、選択された文書から会社名となる語句
を前記選択文書中から抽出する語句抽出手段と、会社名
となる語句と該会社名の会社が公開している文書の格納
位置とを関連付けたテーブルを用いて、検索範囲とする
文書群を、前記語句抽出手段が抽出した前記会社名とな
る語句から、この語句の会社が公開している文書の格納
位置を起点とした所定の階層内に限定する検索範囲限定
手段と、前記検索範囲限定手段によって限定された文書
群を対象に前記文書の関連文書を検索する文書検索手段
と、前記文書検索手段が検索した関連文書の格納位置を
含む関連情報を前記選択文書に付与する関連情報付与手
段とを具備してなることを特徴とする情報フィルタリン
グ装置を提供する
【0012】この発明においては、たとえばあるWeb
ページをユーザに提供する際、その関連情報を載せたW
ebページを適切に検索してそのアドレスを埋め込むこ
とにより、ユーザは簡単な操作のみでその関連情報を載
せたWebページを表示できるようになる。このため、
検索サーバによってWebページを検索したり、Web
ページを表示させながら関連する情報の有無を調べると
いったユーザの負担を大幅に軽減させることが可能とな
る。
【0013】
【発明の実施の形態】以下、図面を参照してこの発明の
実施形態を説明する。 (第1実施形態)まず、この発明の第1実施形態を説明
する。図1に、この第1実施形態に係る情報フィルタリ
ング装置の機器構成を示す。図1に示すように、この第
1実施形態の情報フィルタリング装置は、フィルタリン
グ処理を実行するCPU1、プログラムおよび各種デー
タを格納する記憶装置2、ならびに他の計算機からデー
タを読み込む回線入出力装置3を備えてなる。
【0014】図2は、この第1実施形態の情報フィルタ
リング装置の機能ブロック図である。図2に示すよう
に、この第1実施形態の情報フィルタリング装置10
は、ユーザの関心のある情報を選択する情報フィルタリ
ング部11、情報フィルタリング部11で選択された文
書を格納する文書格納部12、文書格納部12に格納さ
れた文書から関連情報を検索する手掛かりとなる語句を
抽出する語句抽出部13、抽出された語句に基づいて文
書を検索する文書検索部14、検索された文書が格納さ
れているアドレスを処理対象の文書に付与する関連情報
付与部15、および情報フィルタリング部11を起動し
た後、関連情報付与部15を起動する制御を行なう制御
部16からなる。また、この第1実施形態の情報フィル
タリング装置10では、情報フィルタリング部11、語
句抽出部13、文書検索部14、関連情報付与部15お
よび制御部16は、記憶装置2に記憶されてCPU1に
よって実行制御されるプログラムとして構成され、ま
た、文書格納部12は、記憶装置2上に構築されてい
る。
【0015】なお、情報フィルタリング部11における
処理内容は、この発明の主旨ではない。たとえば、特願
平7−212940号などで開示されている方法の一部
を流用することにより実現することができる。つまり、
たとえば新聞記事に対する情報フィルタリングでは、新
聞社などから電子的に配信される新聞記事を対象に、予
め登録されている検索条件との類似度計算を行なう。そ
して、この類似度計算で得られる類似度値が予め定めら
れた閾値を越える記事を選択記事として文書格納部に格
納する。また、この特願平7−212940号で開示さ
れている情報フィルタリング装置では、選択された記事
を類似度の順にソーティングしてユーザに提供する。一
方、これらに対してこの第1実施形態の情報フィルタリ
ング装置10では、文書格納部12に格納された記事に
ついての関連情報を自動的に検索し付与する点を特徴と
している。
【0016】ここで、文書格納部12の格納形式を図3
(a)に、格納された記事の一例を図3(b)に、図3
(b)に示した記事に対応するHTMLを図3(c)に
それぞれ示す。
【0017】次に、関連情報付与部15の処理の流れを
図4に図示する。関連情報付与部15は、文書格納部1
2に格納されている記事を対象に、語句抽出部13を起
動し検索の手掛かりとすべき語句を抽出する(ステップ
A1)。次に、関連情報付与部15は、抽出した語句を
文書検索部14に送り、関連ページを検索する(ステッ
プA2)。そして、関連情報付与部15は、関連ページ
のアドレスを対象となっている記事に付与し処理を終え
る(ステップA3)。
【0018】記事から単純に語句を抽出し、それを使っ
て検索を行なうと、ユーザにとって必要でないページま
でも検索してしまうという問題がある。そこで、精度よ
く検索を行なうことを目的とした関連情報付与部15の
処理の流れを図5に示す(図4の処理の流れを新聞記事
を対象に関連するWebページを検索するものとして詳
細化したものである)。
【0019】まず始めに、関連情報付与部15は、記事
から主体者となる語句を抽出する(図3(b)の記事で
は「日本XYZ」を抽出する)(ステップB1)。次
に、関連情報付与部15は、この取り出した主体者名か
らその主体者が公開しているホームページを求める(ス
テップB2)。具体的には、たとえば図6に示したよう
な形式で、会社名とその会社が公開しているホームペー
ジのURLとの対応テーブルを用意しておく。そして、
この会社名と抽出した主体者名とを照合することによっ
て、その主体者が公開しているホームページのアドレス
を求めることは容易に実現できる。
【0020】次に、関連情報付与部15は、この求めた
URLを起点として関連ページを検索し(ステップB
3)、関連ページのアドレスを記事に埋め込む(ステッ
プB4)。ここで、図3(b)の例に対して、検索され
た関連ページのURLが仮にhttp://www.x
yz.co.jp/release/970324.h
tmlであると仮定すると、関連ページへのアドレス
は、HTMLの記述法を用いて,図7の22a〜22b
のように埋め込むことができる(ホームページのアドレ
スは、図7の21a〜21bのように埋め込まれる)。
【0021】次に、語句抽出部13の処理の流れ(図5
のステップB1に対応)を図8に示す。この第1実施形
態の語句抽出部13では、記事における主体的な位置を
占める会社名を抽出するために、表現パターンを用いて
抽出する。表現パターンとしては、図9に示すような、
新聞記事において会社名を表現する表現パターンと会社
名に対応する部分を表現した規則とをテーブルとして記
憶しておく。図9において、「^」は、文の始めを意味
しており、「*A」や「*B」は、任意の文字列を意味
している。会社名フィールドの「*A」は、表現パター
ンフィールドのパターンのうち、会社名に対応する部分
を表現している。語句抽出部13では、このような表現
パターンと記事とを照合し、照合に成功した場合に、会
社名に対応する文字列を取り出す(ステップC1〜ステ
ップC2)。
【0022】たとえば、図3(b)に示した記事は、図
9に示す表現パターンの1行目と照合する。つまり、変
数「*A」には「日本XYZ」が、変数「*B」には
「東京都千代田区○○町××、社長□□氏」が照合する
ことになる。したがって、会社名に対応する「日本XY
Z」が出力として得られる。
【0023】また、表現パターンとして図10に示すよ
うな商品名を抽出する規則を用意しておけば、商品名を
抽出することができる。ここで述べた処理では、単純な
文字列照合による方法を述べたが、たとえば形態素解析
を行なうことにより、語の区切りを求めて精度を向上さ
せることも可能である。
【0024】Webのページは、ハイパーテキスト構造
になっており、図11(a)に模式的に示したように、
各ページが関係づけられている。そして、HTMLの記
述法では、図11(b)に示すように、<A HREF
=URL>というタグでリンクづけするページのURL
を記述することで関係づけが行なわれている。企業や個
人が公開するページは、Webブラウザによって大きな
話題から詳細な話題へとユーザがリンクをポインティン
グしながら所望のページへ辿っていくことを想定してお
り、図11(a)に示すような階層的な構成とする場合
が多い(リンクの関係がループとなる場合も存在す
る)。
【0025】ここで、文書検索部14の処理の流れ(図
5のステップB3に対応)を図12に、再帰的に処理す
るサブルーチンを図13に示す。文書検索部14は、語
句抽出部13で得られたURLを起点として、まず、そ
のURLのページを読み込む(ステップD1)。次に、
文書検索部14は、その読み込んだページと関連ページ
検索の元となっている記事との類似度を求め、類似度が
一定の値を越える場合に関連ページの候補とする(ステ
ップD2〜ステップD4)。
【0026】ここで、文書検索部14は、そのページ内
にリンクが含まれるか否かをチェックし(ステップD
5)、含まれる場合は(ステップD5のYES)、それ
らの各リンクについてサブルーチンを呼び出す(ステッ
プD6〜ステップD7)。このサブルーチンは、図13
に示すように再帰的な関数である。そして、文書検索部
14は、最終的に得られた候補の中から最大の類似度を
持つページを関連ページとして選択する(ステップD
8)。
【0027】図13に示すサブルーチンでは、まず始め
に、リンクのループにより同じページを何度も処理する
ことを避けるため、入力されたURLがすでに処理した
ものか否かをチェックする(ステップE1)。また、他
のWebサーバへのリンクをたどることは避けることに
より、検索の範囲が発散することを避ける(ステップE
2)。さらに、階層をたどる深さがあまり深くならない
ように、既定値を越えたか否かをチェックする(ステッ
プE3)。そして、これまで処理していないURLであ
り、他のサイトへのリンクでもなく、かつ深さが既定値
以内のURLであれば、入力されたURLのページを読
み込むとともに(ステップE4)、入力記事との間の類
似度を求める(ステップE5)。そして、類似度が所定
の値を越える場合に(ステップE6のYES)、関連ペ
ージの候補として格納する(ステップE7)。さらに、
そのページがリンクを含む場合は(ステップE8のYE
S)、それらの各リンクに対して、自分自身を再帰的に
呼び出す(ステップE9〜ステップE10)。
【0028】なお、入力記事と読み込んだページとの間
の類似度の算出法は、たとえば特願平7−212940
号などで開示されている方法を用いることができる。ま
た、この第1実施形態では、記事全体との類似度を求め
ることにより、関連ページを検索する方法を取ったが、
これを商品名のように特定の語句により検索するように
変形することは容易である。
【0029】(第2実施形態)次に、この発明の第2実
施形態を説明する。図14は、この第2実施形態の情報
フィルタリング装置の機能ブロック図である。
【0030】この第2実施形態の情報フィルタリング装
置は、第1実施形態と比較して、文書履歴記憶部17を
有すること、および関連情報付与部15の処理の流れが
異なる。以下、これらの異なる部分について説明する。
【0031】関連情報付与部15の処理の流れを図15
に図示する。この処理では、関連ページの検索にあた
り、文書履歴記憶部17に格納されているこれまでの入
力文書から類似度の強い文書を検索し、その結果に基づ
いて、実際の検索を行なうものである。これは、たとえ
ば提供しようとする記事に先駆けて提供された記事の中
から関連する記事を検索し、その検索された記事の主体
者となっているホームページを起点に関連ページを得る
ことを目的にしている。このように2段階で行なうこと
によって、提供しようとする記事の関連情報を載せたW
ebページへのリンクが効率的に得られることになる。
【0032】すなわち、関連情報付与部15は、文書格
納部12に格納されている記事を対象に、語句抽出部1
3を起動し検索の手掛かりとすべき語句を抽出する(ス
テップF1)。次に、関連情報付与部15は、この抽出
した語句と関連する項目が文書履歴記憶部17に存在す
るか検索する(ステップF2)。文書履歴記憶部17に
関連する項目が存在した場合(ステップF2のYE
S)、関連情報付与部15は、文書履歴記憶部17から
取り出した項目を文書検索部14に送り、関連ページを
検索する(ステップF3)。そして、関連情報付与部1
5は、関連ページのアドレスを対象となっている記事に
付与する(ステップF4)。また、関連情報付与部15
は、語句抽出部13が抽出した語句を文書履歴記憶部1
7に格納しておく(ステップF5)。
【0033】文書履歴記憶部17の記憶形式の例を図1
6に示す。ここで、「その他」の部分については、文書
中で用いられた会社名や商品名以外の名詞を設定してお
くものとする(抽出した語句ではなく記事全体を格納し
ておいても構わない)。
【0034】この図16に示したような語句を文書履歴
として格納しておくと、図3(b)の記事との類似度を
求めることにより1の項目が選択できる。関連情報付与
部15は、この項目を文書検索部14に送り、関連ペー
ジを検索する。そして、その検索された関連ページのア
ドレスを、たとえば図17に示す領域23のように、提
供する記事に埋め込む。これにより、より効率的に関連
情報を提供することが可能となる。
【0035】なお、関連ページへの自動的なリンクづけ
は、第1および第2実施形態の情報フィルタリング装置
のように、文書を選択する装置のみに限らない。一定の
文書を提供する情報提供装置の場合に関しても、語句の
抽出および文書検索を行なうことにより、関連情報を付
与することは有効である。
【0036】また、この発明の手法をサ−バ側で実現
し、関連情報を付与した文書を電子メールで送付するこ
とも可能であるし、ユーザ側のクライアントがHTTP
のプロトコルにしたがって読み出すように実現すること
も可能である。また、単純のシステムとして実現した場
合には、個人のパーソナルコンピュータやワークステー
ション上などで動作し、文書格納部に格納されている
(関連情報が付与された)文書を、ハイパーテキストを
表示するためのブラウザで読み出させることでも実現可
能である。
【0037】さらに、この発明の手法は、ソフトウェア
として実現可能であるため、CD−ROMやフロッピィ
ディスクなどといった記録媒体によって頒布することが
可能である。また、磁気ディスクなどに格納しておき、
ネットワークで取り寄せる(ダウンロード)ような形式
で頒布することも可能である。
【0038】
【発明の効果】以上詳述したように、この発明によれ
ば、複数の文書の中から予め登録された検索条件に合致
する文書を選択して提供する際、この提供しようとする
文書の関連情報を格納したWebページのアドレスを自
動的に付与することにより、ユーザは簡単にそのページ
をブラウザによって表示できるようになる。このため、
検索サーバによってページを検索したり、ページを表示
させながら関連する情報の有無を調べるといったユーザ
の負担を大幅に軽減することが可能となる。
【図面の簡単な説明】
【図1】この発明の第1実施形態に係る情報フィルタリ
ング装置の機器構成を示す図。
【図2】同第1実施形態の情報フィルタリング装置の機
能ブロック図。
【図3】同第1実施形態の文書格納部の格納内容の一例
を示す図。
【図4】同第1実施形態の関連情報付与部の処理の流れ
を示す図。
【図5】同第1実施形態の精度よく検索を行なうことを
目的とした関連情報付与部の処理の流れを示す図。
【図6】同第1実施形態の会社名とホームページのUR
Lとの対応テーブルの一例を示す図。
【図7】同第1実施形態の関連情報を埋め込む例を示す
図。
【図8】同第1実施形態の語句抽出部の処理の流れを示
す図。
【図9】同第1実施形態の語句を抽出するための表現パ
ターンを例示する図。
【図10】同第1実施形態の語句を抽出するための表現
パターンを例示する図。
【図11】Webのページのハイパーテキスト構造を説
明するための図。
【図12】同第1実施形態の文書検索部の処理の流れを
示す図。
【図13】同第1実施形態の文書検索部の処理の流れ
(サブルーチン)を示す図。
【図14】この発明の第2実施形態に係る情報フィルタ
リング装置の機能ブロック図。
【図15】同第2実施形態の関連情報付与部の処理の流
れを示す図。
【図16】同第2実施形態の文書履歴記憶部の記憶形式
の例を示す図。
【図17】同第2実施形態の関連情報を埋め込む例を示
す図。
【符号の説明】
1…CPU、2…記憶装置、3…回線入出力装置、10
…情報フィルタリング装置、11…情報フィルタリング
部、12…文書格納部、13…語句抽出部、14…文書
検索部、15…関連情報付与部、16…制御部、17…
文書履歴記憶部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 350 G06F 17/30 110 G06F 17/30 170 G06F 12/00 547 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の文書の中から予め登録された検索
    条件に合致する文書を選択する情報フィルタリング装置
    において、 選択された文書から会社名となる語句を前記選択文書中
    から抽出する語句抽出手段と、会社名となる語句と該会社名の会社が公開している文書
    の格納位置とを関連付けたテーブルを用いて、検索範囲
    とする文書群を、前 記語句抽出手段が抽出した前記会社
    名となる語句ら、この語句の会社が公開している文書
    の格納位置を起点とした所定の階層内に限定する検索範
    囲限定手段と、 前記検索範囲限定手段によって限定された文書群を対象
    に前記文書の関連文書を検索する文書検索手段と、 前記文書検索手段が検索した関連文書の格納位置を含む
    関連情報を前記選択文書に付与する関連情報付与手段と
    を具備してなることを特徴とする情報フィルタリング装
    置。
  2. 【請求項2】 複数の文書の中から予め登録された検索
    条件に合致する文書を選択する情報フィルタリング装置
    に適用される関連情報提供方法において、 選択された文書から会社名となる語句を前記選択文書中
    から抽出するステップと、会社名となる語句と該会社が公開している文書の格納位
    置とを関連付けたテーブルを用いて、検索範囲とする文
    書群を、前 記抽出された前記会社名となる語句ら、こ
    の語句の会社が公開している文書の格納位置を起点とし
    た所定の階層内に限定するステップと、 前記限定された文書群を対象に前記文書の関連文書を検
    索するステップと、 前記検索された関連文書の格納位置を含む関連情報を前
    記選択文書に付与するステップとからなることを特徴と
    する関連情報提供方法。
  3. 【請求項3】 複数の文書の中から予め登録された検索
    条件に合致する文書を選択するコンピュータ上で関連情
    報を提供するためのプログラムであって、 選択された文書から会社名となる語句を前記選択文書中
    から抽出し、会社名となる語句と該会社が公開している文書の格納位
    置とを関連付けたテーブルを用いて、検索範囲とする文
    書群を、前 記抽出された前記会社名となる語句から、こ
    の語句の会社が公開している文書の格納位置を起点とし
    た所定の階層内に限定し、 前記限定された文書群を対象に前記文書の関連文書を検
    索し、 前記検索された関連文書の格納位置を含む関連情報を前
    記選択文書に付与するように前記コンピュータを動作さ
    せるプログラムを記録したコンピュータ読取り可能な記
    録媒体。
JP21456397A 1997-08-08 1997-08-08 情報フィルタリング装置および同装置に適用される関連情報提供方法 Expired - Fee Related JP3521174B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21456397A JP3521174B2 (ja) 1997-08-08 1997-08-08 情報フィルタリング装置および同装置に適用される関連情報提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21456397A JP3521174B2 (ja) 1997-08-08 1997-08-08 情報フィルタリング装置および同装置に適用される関連情報提供方法

Publications (2)

Publication Number Publication Date
JPH1153392A JPH1153392A (ja) 1999-02-26
JP3521174B2 true JP3521174B2 (ja) 2004-04-19

Family

ID=16657801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21456397A Expired - Fee Related JP3521174B2 (ja) 1997-08-08 1997-08-08 情報フィルタリング装置および同装置に適用される関連情報提供方法

Country Status (1)

Country Link
JP (1) JP3521174B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134616A (ja) * 1999-10-25 2001-05-18 Nec Corp 特定の話題に関するウェブ情報の構成方法とその構成システム
JP2001167111A (ja) * 1999-12-09 2001-06-22 Sharp Corp 情報収集装置および方法、ならびに関連情報データベース構築方法
US6721726B1 (en) 2000-03-08 2004-04-13 Accenture Llp Knowledge management tool
US6900807B1 (en) 2000-03-08 2005-05-31 Accenture Llp System for generating charts in a knowledge management tool
US7350138B1 (en) 2000-03-08 2008-03-25 Accenture Llp System, method and article of manufacture for a knowledge management tool proposal wizard
EP1377914A2 (en) * 2000-03-08 2004-01-07 Accenture LLP Method of manufacture for a knowledge management tool
JP4566347B2 (ja) * 2000-06-30 2010-10-20 ヤフー株式会社 商品検索装置及び方法
US7620621B2 (en) 2001-05-01 2009-11-17 General Electric Company Methods and system for providing context sensitive information
EP1363203A1 (en) * 2002-05-15 2003-11-19 Abb Research Ltd. System and method for searching information automatically according to analysed results
US8140965B2 (en) * 2003-02-28 2012-03-20 Google, Inc. Identifying related information given content and/or presenting related information in association with content-related advertisements
US7930301B2 (en) 2003-03-31 2011-04-19 Microsoft Corporation System and method for searching computer files and returning identified files and associated files
JP2005301996A (ja) * 2004-03-16 2005-10-27 Canon Inc 文書統合装置、文書統合装置の文書統合方法及びプログラム及び記録媒体
US20080250010A1 (en) * 2007-04-05 2008-10-09 Samsung Electronics Co., Ltd. Method and system for determining and pre-processing potential user queries related to content in a network
CN101553816B (zh) * 2006-11-20 2012-02-22 株式会社爱可信 信息显示装置以及信息显示系统
JP2008198139A (ja) * 2007-02-15 2008-08-28 Oki Electric Ind Co Ltd 付加情報検索装置
JP2010108268A (ja) * 2008-10-30 2010-05-13 Toshiba Corp 文書処理装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3810463B2 (ja) * 1995-07-31 2006-08-16 株式会社ニューズウオッチ 情報フィルタリング装置

Also Published As

Publication number Publication date
JPH1153392A (ja) 1999-02-26

Similar Documents

Publication Publication Date Title
JP3521174B2 (ja) 情報フィルタリング装置および同装置に適用される関連情報提供方法
JP3270351B2 (ja) 電子化文書処理装置
US7809710B2 (en) System and method for extracting content for submission to a search engine
US8527491B2 (en) Expanded text excerpts
US9483534B2 (en) User interfaces for a document search engine
US7016977B1 (en) Method and system for multilingual web server
US9323827B2 (en) Identifying key terms related to similar passages
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
KR100932999B1 (ko) 사용자 정보 및 콘텐츠에 기초하여 자동으로 생성된 링크에의한 문서 브라우징
US20020083045A1 (en) Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program
US7099870B2 (en) Personalized web page
EP0926606A2 (en) Document data linking apparatus
US20120284612A1 (en) Enabling hypertext elements to work with software applications
US20090313536A1 (en) Dynamically Providing Relevant Browser Content
EP1312039A2 (en) System and method for automatic preparation and searching of scanned documents
US6938083B1 (en) Method of providing duplicate original file copies of a searched topic from multiple file types derived from the web
Hedley et al. Sampling, information extraction and summarisation of hidden web databases
US20110252313A1 (en) Document information selection method and computer program product
JP2001265774A (ja) 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム
JP3683687B2 (ja) 情報フィルタリング装置および情報フィルタリング方法
US7386794B2 (en) Apparatus and method for performing the management of operation history
JP2002049644A (ja) 情報処理装置、記憶媒体及びコンピュータプログラム
JPH117452A (ja) ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体
JP2002297655A (ja) 新着コンテンツ配信方法、プログラム、媒体およびシステム
JP2004288151A (ja) 操作履歴管理装置、操作履歴管理方法、および操作履歴管理プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040202

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees