JP3655714B2 - 情報フィルタリング装置及び記録媒体 - Google Patents
情報フィルタリング装置及び記録媒体 Download PDFInfo
- Publication number
- JP3655714B2 JP3655714B2 JP30500796A JP30500796A JP3655714B2 JP 3655714 B2 JP3655714 B2 JP 3655714B2 JP 30500796 A JP30500796 A JP 30500796A JP 30500796 A JP30500796 A JP 30500796A JP 3655714 B2 JP3655714 B2 JP 3655714B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- information
- information acquisition
- document
- acquired
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Description
【発明の属する技術分野】
この発明は、分散する複数の情報の中から検索条件に適合する情報を選択して利用者に提供する情報フィルタリング装置および情報フィルタリング方法に関する。
【0002】
【従来の技術】
近年、インターネットの普及は目覚ましいものがあり、世界中に点在する計算機に格納された情報が、インターネットに接続されてさえいれば、どこからでも簡単にアクセスできるようになってきている。特に、WWW(World Wide Web)では、HTTP(HyperText Transfer Protocol)を用いることにより、利用者が、世界中の情報をGUI(Graphical User Interface)ベースのブラウザによって簡単にアクセスできる仕組みを提供している。
【0003】
WWWでは、ある計算機上でhttpdと呼ばれるソフトウェアを用いる。このソフトウェアは、その計算機のデータベースに格納されているHTML(HyperText Markup Language)で記述されたハイパーテキストファイルを、他の計算機からの要求に応じて転送するものである。インターネットに接続されている計算機は、転送を要求するハイパーテキストファイルを有する計算機上で動作するhttpdに対し、ハイパーテキストファイルのアドレスを指定することによって、指定したファイルを読み込むことができる。HTMLの記述では、ハイパーテキストファイル内のリンク情報として、前記アドレスが記述されるので、HTTPのプロトコルにしたがったブラウザは、各httpd支配下のハイパーテキストファイルを表示することができる。そして、音声、静止画、動画などの様々なデータを出力することができるようにすることによって、マルチメディアデータを含むハイパーテキストを、ブラウザは表示することができる。
【0004】
そして、このWWWの仕組みによって、利用者は、より簡単にインターネット上の情報にアクセスできるようになり、多くの個人や企業が、Webページと呼ばれるハイパーテキストファイルを公開するようになってきている。
【0005】
一方において、WWWでは、データベースの管理者がおらず、個々人がそれぞれ勝手にWebページを作成あるいは修正し、しかもその規模が膨大であるために(1996年度初頭における世界中で公開されているWebページは4000万ページと推定されている)、個々の利用者が、自らが必要とするWebページがどこにあるか(URLアドレスとして何を指定すれば必要なWebページを取得できるか)を知ることが困難な状況になってきている。
【0006】
このため、最近では、アクセス可能なWebページを内容ベースで検索するシステムが開発され、検索を代行するようなサービスが行なわれるようになってきている。Web検索サーバでは、キーワードを指定することによって、そのキーワードを含むWebページを検索することができる。利用者は、これらWeb検索サーバを用いて必要なWebページを検索する。
【0007】
しかしながら、このようにWeb検索サーバを用いることによって、オンラインで必要な情報を容易に検索できるようになったものの、これは、利用者が能動的に必要な情報を検索指示した場合にのみ得られるものである。すなわち、利用者が関心・興味をいだいている情報が新しく作成された際に、利用者が検索指示を行なっていなければ、たとえ重要な情報であったとしても、その利用者がその情報を知ることはない。したがって、利用者が関心・興味のある情報が発生したときに、その旨を適切な利用者に知らしめるシステムが必要である。旧来のデータベースシステムでは、このような機能をSDI(Selective Disseminative Information)と呼んでいる。SDIでは、利用者は自らの関心・興味のある情報を選択するためのキーワードなどを個人プロファイルとしてシステムに登録しておく。そして、システムは、新しくデータが登録された際に、そのデータとキーワード(プロファイル)とを比較して、そのデータがキーワードと合致するときに、所望した情報が新たに発生した旨を、プロファイルを登録した利用者に知らせるものである。
【0008】
このような旧来型のデータベースでは、個々のデータはローカルな環境に存在するか、または特定のデータベース管理者が管理するものであったために、新しく情報が発生した情報と既存の情報とを区別することが容易であった。それに対して、WWWでは、個々人がWebページを独自に登録できる仕組みになっており、かつWWW全体を管理する管理者も存在しないため、新規情報と既存情報との区別が非常に困難である。このような実情から、最近では、このような問題点を解決する情報フィルタリング装置が種々考えられてきている。
【0009】
ところで、WWWのように超分散型の文書データベースであって、文書登録、更新および削除といった管理について何ら統一的な取り決めがない文書データベースにおいては、利用者が関心・興味をいだく情報の存在の種類として、以下の3種類が考えられる。なお、WWWでは、情報公開を行なう各ユーザが、複数のハイパーテキスト文書を用いて何らかの情報を公開するのが通常であるが、このような文書のまとまりをここではサイトと呼ぶことにする。
【0010】
(1)利用者の関心の高い情報が常に提供されるサイトであり、何らかの変更や更新が発生すれば、ただちに通知が受けたいと考えるサイト。たとえば、ある利用者が「鉄道」を趣味に持っていると仮定すると、鉄道の同好の人々が運営しているサイトなどがこれに相当する。ここでは、このようなサイトをウォッチサイトと呼ぶことにする。
【0011】
(2)更新の頻度は高いが内容に一般性が高く、必ずしも利用者の関心のあるものが登録されるとは限らないが、関心の情報であれば通知を受けたいと考えるサイト。たとえば、新聞記事や雑誌記事を掲載しているサイトなどがこれに相当する。ここでは、このようなサイトをニュースサイトと呼ぶことにする。
【0012】
(3)上記2種類のサイトは、その場所(アドレス)を利用者自身が知り得ているものであるが、その反対に、利用者が知らないサイトであって、関心の情報が登録された場合にのみ通知を受けたいと考えるサイト。ここでは、このようなサイトを不特定サイトと呼ぶことにする。
【0013】
しかしながら、最近になって種々考えられてきている情報フィルタリング装置においても、このような3種類のタイプのサイトを適宜切り分けて、利用者に適切な情報を効率的に選択して提供することはできなかった。すなわち、ある利用者が複数のトピックに関心を持っていた場合に、すべてのトピックに対して同じサイト(一つでもよいし複数でもよい)と検索条件とが画一的に割り当てられてしまうために、効率的な情報フィルタリングが行なわれているとは到底いえなかった。このような状況から、ある利用者が複数のトピックに関心を持っていた場合には、どのような検索条件で情報を選択するかといったことを、トピックごとに設定できるとともに、どのようなサイトにそれに関連する情報が存在するかについても、トピックごとに設定できることが求められていた。
【0014】
【発明が解決しようとする課題】
このように、従来の情報フィルタリングを、たとえばWWWのように超分散的な文書データベースであって、文書の登録/削除/更新といった文書管理に統一的な取り決めがない文書データベースに適用する場合においては、利用者が関心をもつ情報の出現のタイプに応じた適切な情報フィルタリングを行なうことができないという問題があった。
【0015】
この発明は、このような実情に鑑みてなされたものであり、情報取得先および検索条件をグループ化してトピックごとに管理することによって、効率的な情報フィルタリングを可能とする情報フィルタリング装置および情報フィルタリング方法を提供することを目的とする。
【0016】
【課題を解決するための手段】
この発明の情報フィルタリング装置は、予め登録されたトピックに応じて、分散する複数の情報の中から所定の情報を選択する情報フィルタリング装置において、情報取得先のアドレスおよび検索条件をグループ化して前記トピックごとに管理するトピック管理手段と、前記トピックそれぞれに、前記トピック管理手段に管理された情報取得先アドレスで示される情報取得先から情報を取得し、前記トピック管理手段に同一グループとして管理された検索条件を用いて前記取得した情報の中から所定の情報を選択する情報選択手段とを具備してなることを特徴とする。
【0017】
この発明の情報フィルタリング装置においては、トピック管理手段が、情報取得先のアドレスおよび検索条件をグループ化してトピックごとに管理し、情報選択手段が、トピックそれぞれに、そのトピック用に管理された情報取得先のアドレスで示される情報取得先から情報を取得した後、そのトピック用に管理された検索条件を用いて取得した情報に対する選択処理を実行する。すなわち、この発明の情報フィルタリング装置では、従来の情報フィルタリングのように、すべてのトピックについて同一の情報取得先から情報を取得し、かつ同一の検索条件を用いて取得した情報に対する選択処理を実行するのではなく、トピックそれぞれについて、そのトピック用の情報取得先および検索条件によって情報の取得および選択を行なうので、不必要な情報を取得してしまうようなことを極力防止することができ、効率的な情報フィルタリングが可能となる。
【0018】
また、前記トピック管理手段が、前記情報取得先アドレスで示される情報取得先に対応する情報取得手法を前記グループに含めて管理する手段を具備し、前記情報選択手段が、前記情報取得先で保有される情報をその情報取得先に対応する情報取得手法により取得する手段を具備することが好ましい。これにより、互いに異なる情報取得手法を必要とする複数の情報取得先に対するアクセスが各種切り替え作業を必要とせずに可能となり、使い勝手を向上させることができる。
【0019】
また、前記トピックを階層的に分類して登録するトピック登録手段と、前記情報選択手段によって選択された情報すべてを前記トピックの階層構造に対応させて編集した検索結果文書を作成する結果整形手段とをさらに具備することが好ましい。これにより、利用者は、情報フィルタリングの指標となるトピックを自己の関心・興味に合わせて能率的に管理することができるとともに、そのフィルタリング結果の可読性を飛躍的に向上させることができる。
【0020】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態について説明する。
【0021】
図1にこの発明を実施するための機器構成を図示する。図1に示すように、フィルタリング処理を実行するCPU1、プログラムならびに各種データを格納する記憶装置2、および他の計算機からデータを読み込むための回線入出力装置3を具備してなる。なお、この発明は、ソフトウェアとしての実施が可能であり、フロッピィディスクやCD−ROMなどに格納した形態で提供したり、磁気ディスクなどに格納しておいて、ネットワークで入手可能な形態で提供することが可能である。
【0022】
図2にこの発明の機能ブロックを図示する。
【0023】
制御部10は、全体の制御を司る。情報取得ドライバ記憶部11は、トピック管理部14において利用者が選択可能な情報取得ドライバを格納する。検索条件記憶部12は、トピック管理部14において利用者が入力した検索条件を格納する。トピック記憶部13は、トピック管理部14において利用者が入力した情報取得先アドレスと、その処理のための方法を定義した情報取得ドライバへのポインタと、検索条件記憶部12に格納された検索条件へのポインタとをグループ化してトピック単位に格納する。トピック管理部14は、トピック記憶部13に格納されている内容を表示するとともに、利用者の入力にしたがって情報取得先の定義ならびに検索条件の設定を行なう。情報選択部15は、トピック記憶部13に記憶されている情報取得先から情報取得ドライバを用いて情報取得を行なった後、取得した各情報と検索条件とを比較して、検索条件に合致する情報を選択する。結果整形部16は、トピック記憶部13に記憶された分類階層にしたがって、選択した結果を整形したデータを作成する。
【0024】
各種記憶部に格納するデータの形式や、処理の流れなどを説明する前に、まず全体動作について概略を説明する。
【0025】
図3にトピック管理部14で表示する際の画面の一例を示す。図3に示したように、画面の左側でトピックの階層構造を表示する。図示した例では、「仕事」のトピックの下位のトピックとして、「イントラネット」と「パソコン」とが設定されている。また、趣味の下位のトピックとして、「鉄道」と「カラオケ」とが設定されている。
【0026】
画面の右側では、画面の左側で選択されているトピックに設定されているウォッチサイト、ニュースサイトおよび新着/検索サイトを表示する。図示した例では、トピック「イントラネット」に対応するウォッチサイトとして「××××」と「○○○○」が、ニュースサイトとして「△△△△」が、新着/検索サイトとして「□□□□」と「※※※※」とが設定されている(トピック記憶部13に格納されている)ことを示している。
【0027】
図3において、上部に表示されているボタンは、新たなトピックを定義したり(挿入ボタン)、削除したり(削除ボタン)、編集したり(編集ボタン)するためのものであり、マウスなどのポインティングデバイスによって選択することにより、対応する処理が起動される。
【0028】
たとえば、図3に示したトピック管理画面上で、トピック「仕事」を選択し、その上で挿入を選択すると、図4(a)に示すように「新規トピック」がトピック「パソコン」の下に挿入される。また、図3に示した画面上で、ウォッチサイトを選択し、その上で挿入を選択すると、図4(b)に示すように「新規ウォッチサイト」が挿入される。
【0029】
また、図3に示した画面上でトピック「パソコン」を選択し、その上で削除を選択すると、図5に示すようにトピック「パソコン」が削除される。ウォッチサイトやニュースサイト、新着/検索サイトについても、各サイトを選択した上で削除を選択することにより、同様に選択したサイトがウォッチサイト、ニュースサイト、新着/検索サイトの登録から削除される。
【0030】
図3に示した画面上で、ウォッチサイト、ニュースサイトおよび新着/検索サイトの中のいずれかのサイトを選択し、その上で編集を選択した場合、図6に示すようにサイト別の設定画面が表示される。その画面上で、サイトの種別、名前、サイトのアドレスなどを設定するとともに、処理する情報取得ドライバを選択する。また、図3に示した画面上で検索条件を選択した上で編集を選択すると、図7(a)に示すように検索条件編集画面が表示され、その画面上で検索条件を編集可能である。図3に示す画面の左側のトピックの階層表示上のノードを選択した上で、編集を選択すると、図7(b)に示すように、そのノードの名前を変更するための画面が表示され、トピック階層上に表示される文字列を変更することができる。
【0031】
上記画面例で説明したように、この発明では、利用者の関心・興味を階層的なトピック分類で管理するとともに、情報取得先の種別とそのアドレス、内容選別のための検索条件とを各トピックごとに設定できるようにする。そして、これにより、トピックそれぞれに応じた効率的な情報取得が実現されることになる。
【0032】
以上で画面上での動作内容の概要を説明したので、この動作を実現するために必要な記憶部のデータ格納形式ならびに処理の流れについて説明する。
【0033】
図8に情報取得ドライバ記憶部11のデータ形式の一例を図示する。図8に示したように、情報取得ドライバ記憶部11には、各ドライバの名前とドライバを格納したファイル名とが対構造となって格納される。情報取得ドライバは、HTTPのプロトコルにしたがって情報取得先から文書を読み込むとともに、そのサイトの種類に応じた個別処理を行なうものである。
【0034】
たとえば、ある新聞社のサイトでは、複数の記事が一つの文書として公開されている。このように複数の記事が一つの文書として提供されている場合、文書全体を一まとまりで情報選択部15において検索条件との照合を行なうと、精度のよい選択ができない。したがって、複数の記事からなる文書を公開している新聞社サイトを扱う情報取得ドライバは、文書の読み込みに加えて、記事の分割処理を行ない、分割後の個々の記事ごとに情報選択処理を行なう。
【0035】
また、不特定サイトでの関連情報の発生を検出するために、この発明では、新着/検索サイトの利用を考慮している。新着サイトというのは、新しいサイトを作成した場合に、そのサイトの作成者が、新着サイトを管理しているサイトの管理サーバに投稿し、その投稿された内容が新着サイトの文書に一定期間掲載される仕組みで運営されているサイトのことである。この発明においては、このような新着サイトの運営の仕組みについては何ら関与するところではないが、この種の新着サイトは、複数の新規サイトの紹介文を一つの文書にまとめて登録している。このため、前述の新聞社サイトを扱う情報取得ドライバと同様に、文書読み込みに加えて、個々の紹介文ごとに分割処理を行なう必要がある。
【0036】
検索サイトというのは、検索条件を入力してオンラインでWebページを検索する検索サーバに対応するものである。通常、HTTPプロトコルにおいては、Webページの取得は単に取得したい文書のアドレスをパラメータとして、GETコマンドをその文書を格納している計算機で動作しているhttpdに対して送信し、一方、httpdでは、そのアドレスに対応する文書をGETコマンドを送出した計算機に転送する。したがって、このような検索サーバでは、検索条件を指定する必要がある。この検索条件の指定方法は、通常、GETコマンドのパラメータの検索サーバの検索プログラムに相当する文書アドレスに加えて、その検索プログラムへの引数(キーワード等の検索条件)を文字列でアペンドする形で指定する。たとえば、以下の例では、「Titles」が検索プログラムの名前、「?」が引数との区切り記号、「&」が引数間の区切り記号である。また以下の例では、「qt=Giants」は検索条件のキーワードが「Giants」であること、「nh=10」は検索プログラムに対する検索結果の出力文書数を指定する引数である。
【0037】
GET/Titles?qt=Giants&nh=10
このように、検索サイトに対応したドライバは、検索条件記憶部12に格納されている検索条件から各検索サーバへの検索のための引数を生成し、GETコマンドを発行する処理を行なう。
【0038】
Web検索サーバで検索した場合には、検索結果として指定した検索条件に一致する複数のページのアドレスが取得できる。この発明では、これらの取得したアドレスのうち、前回のフィルタリング時に取得しなかったアドレスのページを情報選択部15への入力として読み込む。このため、検索サイト用のドライバでは、前回の検索結果を記憶しておき(不図示)、その次の実行時に前回の検索結果に含まれないアドレスを新規ページとして取り扱う。
【0039】
ウォッチサイトに対応したドライバの処理では、前回のフィルタリング時に読み込んだ文書内容を記憶しておき(不図示)、読み込んだ文書をこの内容と比較することにより変更があったことを検知する。
【0040】
ニュースサイト用ドライバ、検索サイト用ドライバ、ウォッチサイト用ドライバのそれぞれについて典型的な処理の流れを図14に示す。
【0041】
以上説明したように、情報取得ドライバは、サイトの種類に応じて検索引数の発行、書式解析などを行ない、基本的にサイトごとに提供するものである。ここでは、このドライバの内部処理については発明の主旨とするところではない。要するに、このような情報取得ドライバを利用者が選択できるように、図8に示した情報取得ドライバ記憶部11に格納する点が、この発明の特徴とするところである。
【0042】
図9に、トピック階層に含まれる各ノードのデータ形式を図示する。図9に示したように、トピック名を格納する領域、兄弟トピックへのポインタを格納する領域、子トピックへのポインタを格納する領域、ウォッチサイトリストへのポインタを格納する領域、ニュースサイトリストへのポインタを格納する領域、新着/検索サイトリストへのポインタを格納する領域および検索条件ファイル名を格納する領域からなる。一例として、図3に示した画面例に対応するトピック階層の内容を図10に示す。
【0043】
トピック階層の各トピックには、対応するウォッチサイト、ニュースサイト、新着/検索サイトのリストそれぞれへのポインタが格納されている。図11にウォッチサイトリストの1つのノードのデータ形式を図示する。図11に示したように、情報取得先のタイトル、情報取得先のアドレス、情報取得のためのドライバのファイル名、次のノードへのポインタなどの領域からなる。
【0044】
図12に、ウォッチサイトリストの一例を図示する。図12の例では、鉄道同好会および鉄道の旅友の会の2つのウォッチサイトからなる。
【0045】
ニュースサイトリストのデータ形式や新着/検索サイトリストのデータ形式も同様の形式である。たとえば、ニュースサイトリストの内容の一例を図13に示す。
【0046】
以上説明したデータに基づいてトピック管理部14は、ユーザからの入力にしたがってトピック管理の処理を行なう。図15乃至図18にトピック管理部14の処理の流れを示す。
【0047】
トピック管理部14は、マウス、キーボードなどの入力デバイスの入力にしたがって処理を行なう。利用者から入力される可能性のあるコマンドは、終了、挿入、削除および選択である。
【0048】
終了、挿入、削除、編集については、図3の表示例で示したように、画面上部にあるボタンを選択することにより起動される。選択については、トピック階層の表示でのトピック、ウォッチサイト、ニュースサイト、新着/検索サイトの各ノード、たとえば、図3においては、「××××」や「○○○○」などが選択可能である。
【0049】
挿入が選択された場合(ステップD3のY)、直前に選択されている箇所がトピックであった場合は(ステップD9のY)、そのトピックの直下に新規トピックを追加する(ステップD10)(図4(a)がその例)。また、ウォッチサイトが選択された場合には(ステップD11のY)、ウォッチサイトに新規のウォッチサイトを追加する(ステップD12)(図4(b)がその例)。ニュースサイト、新着/検索サイトについても同様に処理が行なわれる。
【0050】
また、削除が選択された場合(ステップD4のY)、直前に選択されている箇所がトピックであった場合は(ステップD18のY)、そのトピックの以下すべてのトピックが削除される(ステップD19)。一方、直前に選択されている箇所がウォッチサイトやニュースサイト、新着/検索サイトのノード(図3の例では「××××」や「○○○○」など)であった場合には(ステップD20のY)、そのノードに対応するウォッチサイトリスト、ニュースサイトリストおよび新着/検索サイトをリストから削除する(ステップD21)。
【0051】
また、編集が選択された場合(ステップD5のY)、直前に選択されている箇所が検索条件であった場合は(ステップD23のY)、図7(a)に示すような検索条件編集画面を表示する(ステップD24)。そして、利用者は、この画面上で検索条件の修正を行なうことになる。直前に選択されている箇所がトピックであった場合(ステップD25のY)、図7(b)に示すようなトピック名編集画面を表示する(ステップD26)。そして、利用者は、この画面上でトピック名の修正を行なうことになる。直前に選択されている箇所がウォッチサイト、ニュースサイトまたは新着/検索サイトのノードであった場合(ステップD27のY)、図6に示すような取得ドライバ設定画面が表示される(ステップD28)。そして、利用者は、この画面上で情報取得ドライバの設定や、取得先のアドレスの設定などを行なうことになる。
【0052】
情報選択部15は、トピック階層に設定されたトピックにしたがって、ユーザが指定した時点あるいは予め定められた時点に起動される。
【0053】
情報選択部15の処理の流れを図19に図示する。トピックごとに設定されている情報取得先から文書を読み込み(ステップE1〜ステップE2)、さらに対応する検索条件との照合を行ない、検索条件に一致する文書について結果記憶部17に格納する(ステップE3)。
【0054】
検索条件との照合については、たとえば検索条件中の単語が、対象とする文書中に含まれているか否かをチェックする方法(キーワード検索)でもよいし、類似度を計算してランクづけする方法でも構わない。この類似度を計算する方法を用いれば、選択結果を利用者に提供するための文書中で類似度順に並べることも可能になる(特願平8−243295号に開示された方法などにより可能)。
【0055】
図20に結果記憶部17のデータ形式の一例を図示する。図20に示したように、結果記憶部17は、トピック名、ウォッチサイト、ニュースサイト、新着/検索サイトなどの種別、文書のタイトル、アドレスおよび検索条件との類似度などを格納する領域からなる。
【0056】
結果整形部16は、トピック記憶部13の内容と結果記憶部17の内容とにしたがって、利用者に提供する文書を作成する。図21に作成した文書をWebブラウザで表示した例を示す。結果記憶部17には、トピックごとに選択された文書のタイトルとアドレスが格納されているので、各トピックごとにグループ化して選択された情報を表示している。
【0057】
【発明の効果】
以上詳述したように、この発明によれば、情報取得先と検索条件とを一つのグループとしてまとめて扱えるとともに、階層的な管理が容易に行なえるようになる。利用者が関心をもつ内容に関連する文書は、普遍的に存在するのではなくある程度の偏りがある。そこで、前述したように、情報取得先と検索条件とをグループ化してトピックごとにまとめて扱うことにより、余分な文書情報を取得したり、余分な文書に対して情報選択の処理を行なうといったことが省略でき、処理効率が大幅に向上する。
【0058】
また、処理結果をトピックの階層構造に対応させて利用者に呈示するため、フィルタリング結果の可読性を飛躍的に向上させることができる。
【図面の簡単な説明】
【図1】この発明の実施形態の機器構成を示す図。
【図2】同実施形態の基本的な機能ブロックを示す図。
【図3】同実施形態のトピック階層管理画面の表示例を示す図。
【図4】同実施形態のトピック挿入時の画面の移行例を示す図。
【図5】同実施形態のトピック削除時の画面の移行例を示す図。
【図6】同実施形態の検索条件編集画面例およびトピック名編集画面例を示す図。
【図7】同実施形態の情報取得ドライバ設定例を示す図。
【図8】同実施形態の情報取得ドライバ記憶部のデータ形式を示す図。
【図9】同実施形態のトピック階層のデータ形式を示す図。
【図10】同実施形態のトピック階層の内容例を示す図。
【図11】同実施形態のウォッチサイトリストのデータ形式を示す図。
【図12】同実施形態のウォッチサイトリストの内容例を示す図。
【図13】同実施形態のニュースサイトリストの内容例を示す図。
【図14】同実施形態の情報取得ドライバの処理の流れを示すフローチャート。
【図15】同実施形態のトピック管理部の処理の流れを示す第1のフローチャート。
【図16】同実施形態のトピック管理部の処理の流れを示す第2のフローチャート。
【図17】同実施形態のトピック管理部の処理の流れを示す第3のフローチャート。
【図18】同実施形態のトピック管理部の処理の流れを示す第4のフローチャート。
【図19】同実施形態の情報選択部の処理の流れを示すフローチャート。
【図20】同実施形態の結果記憶部のデータ形式を示す図。
【図21】同実施形態の結果表示例を示す図。
【符号の説明】
1…CPU
2…記憶装置
3…回線入出力装置
10…制御部
11…情報取得ドライバ記憶部
12…検索条件記憶部
13…トピック記憶部
14…トピック管理部
15…情報選択部
16…結果整形部
17…結果記憶部。
Claims (5)
- 予め登録されたトピックに応じて、分散する複数の情報の中から検索条件に適合する情報を選択する情報フィルタリング装置において、
トピック毎に、検索条件、情報取得先のアドレス、当該情報取得先の種別及び当該種別に応じた情報取得方法を設定するための設定手段と、
トピック毎に、当該トピックに対し前記選定手段で設定された各情報取得先から、当該情報取得先の種別に応じて前記設定手段で設定された、(a)情報取得先から複数の記事を含む文書を取得して当該文書を当該複数の記事に分割する第1の情報取得方法と、(b)情報取得先から当該トピックに設定された検索条件に適合する文書のアドレスを取得し、今回取得されたアドレスのうち前回取得されなかったアドレスの文書を取得する第2の情報取得方法と、(c)情報取得先から今回取得した文書の内容が前回取得した文書の内容と異なるときに、今回取得した文書を選択する第3の情報取得方法とを含む複数の情報取得方法のうちの1つを用いて、情報を取得する情報取得手段と、
トピック毎に前記情報取得手段で取得した情報の中から、当該トピックに設定された検索条件に適合する情報を選択する情報選択手段と、
を具備したことを特徴とする情報フィルタリング装置。 - トピックの分類階層に従って、前記設定手段でトピック毎に設定された検索条件、情報取得先のアドレス、当該情報取得先の種別及び当該種別に応じた情報取得方法を記憶する記憶手段をさらに具備したことを特徴とする請求項1記載の情報フィルタリング装置。
- 前記設定手段は、前記トピックの分類階層に対しトピックの追加・削除・編集・選択を行うためのトピック管理画面と、前記トピック管理画面上で選択されたトピックに対し情報取得先のアドレス、種別及び前記複数の情報取得方法のうちの1つを設定するための設定画面と、前記トピック管理画面上で選択されたトピックに対し検索条件を設定するための設定画面を表示することを特徴とする請求項2記載の情報フィルタリング装置。
- 前記情報選択手段によって選択された情報をトピック毎にグループ化してユーザに提供するための検索結果文書を作成する手段をさらに具備したことを特徴とする請求項1記載の情報フィルタリング装置。
- 予め登録されたトピックに応じて、分散する複数の情報の中から検索条件に適合する情報を選択する機能をコンピュータに実現させるためのプログラムであって、
トピック毎に、検索条件、情報取得先のアドレス、当該情報取得先の種別及び当該種別に応じた情報取得方法を設定するための機能と、
トピック毎に、当該トピックに対し設定された各情報取得先から、当該情報取得先の種別に応じて設定された、(a)情報取得先から複数の記事を含む文書を取得して当該文書を当該複数の記事に分割する第1の情報取得方法と、(b)情報取得先から当該トピックに設定された検索条件に適合する文書のアドレスを取得し、今回取得されたアドレスのうち前回取得されなかったアドレスの文書を取得する第2の情報取得方法と、(c)情報取得先から今回取得した文書の内容が前回取得した文書の内容と異なるときに、今回取得した文書を選択する第3の情報取得方法とを含む複数の情報取得方法のうちの1つを用いて、情報を取得する機能と、
トピック毎に取得した情報の中から、当該トピックに設定された検索条件に適合する情報を選択する機能と、
をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30500796A JP3655714B2 (ja) | 1996-11-15 | 1996-11-15 | 情報フィルタリング装置及び記録媒体 |
US08/970,622 US6073170A (en) | 1996-11-15 | 1997-11-14 | Information filtering device and information filtering method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30500796A JP3655714B2 (ja) | 1996-11-15 | 1996-11-15 | 情報フィルタリング装置及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10143532A JPH10143532A (ja) | 1998-05-29 |
JP3655714B2 true JP3655714B2 (ja) | 2005-06-02 |
Family
ID=17939969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30500796A Expired - Fee Related JP3655714B2 (ja) | 1996-11-15 | 1996-11-15 | 情報フィルタリング装置及び記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6073170A (ja) |
JP (1) | JP3655714B2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3403335B2 (ja) * | 1998-06-26 | 2003-05-06 | 日立ソフトウエアエンジニアリング株式会社 | 仮想地理空間オブジェクト生成システム及び記録媒体 |
US6665681B1 (en) * | 1999-04-09 | 2003-12-16 | Entrieva, Inc. | System and method for generating a taxonomy from a plurality of documents |
US9977831B1 (en) | 1999-08-16 | 2018-05-22 | Dise Technologies, Llc | Targeting users' interests with a dynamic index and search engine server |
US7613992B1 (en) * | 1999-08-16 | 2009-11-03 | Raichur Arvind A | Dynamic index and search engine server |
US8504554B2 (en) | 1999-08-16 | 2013-08-06 | Raichur Revocable Trust, Arvind A. and Becky D. Raichur | Dynamic index and search engine server |
US9195756B1 (en) | 1999-08-16 | 2015-11-24 | Dise Technologies, Llc | Building a master topical index of information |
KR100304482B1 (ko) * | 1999-09-22 | 2001-11-02 | 구자홍 | 다중 계층구조를 가지는 사용자 선호도 정보구조와 이를 이용한 멀티미디어 정보 서비스 방법 |
AU8010200A (en) * | 1999-10-12 | 2001-04-23 | North American Business Services, L.L.C. | Method and system for network multimedia forum |
US7788211B2 (en) * | 2000-06-16 | 2010-08-31 | Nokia Networks Oy | Robust and efficient compression of list of items |
US7379963B1 (en) * | 2000-07-14 | 2008-05-27 | Knownow-Delaware | Delivery of any type of information to anyone anytime anywhere |
US7343323B1 (en) | 2000-08-29 | 2008-03-11 | Gcg, Llc | Business transaction system and method |
US6980982B1 (en) | 2000-08-29 | 2005-12-27 | Gcg, Llc | Search system and method involving user and provider associated beneficiary groups |
JP2002175322A (ja) * | 2000-12-07 | 2002-06-21 | Taiji Kasai | 情報収集方法及び情報収集システム |
EP1342171A1 (en) * | 2000-12-14 | 2003-09-10 | Kapow APS | Query processor, query processor elements and a method of establishing such a query processor and query processor elements and a domain processor |
US6957206B2 (en) | 2001-04-19 | 2005-10-18 | Quantum Dynamics, Inc. | Computer system and method with adaptive N-level structures for automated generation of program solutions based on rules input by subject matter experts |
US7620621B2 (en) * | 2001-05-01 | 2009-11-17 | General Electric Company | Methods and system for providing context sensitive information |
US20020169872A1 (en) * | 2001-05-14 | 2002-11-14 | Hiroshi Nomiyama | Method for arranging information, information processing apparatus, storage media and program tranmission apparatus |
US20030135553A1 (en) * | 2002-01-11 | 2003-07-17 | Ramesh Pendakur | Content-based caching and routing of content using subscription information from downstream nodes |
US8543564B2 (en) * | 2002-12-23 | 2013-09-24 | West Publishing Company | Information retrieval systems with database-selection aids |
US7216121B2 (en) * | 2002-12-31 | 2007-05-08 | International Business Machines Corporation | Search engine facility with automated knowledge retrieval, generation and maintenance |
US20040139107A1 (en) * | 2002-12-31 | 2004-07-15 | International Business Machines Corp. | Dynamically updating a search engine's knowledge and process database by tracking and saving user interactions |
US8843458B2 (en) * | 2003-04-28 | 2014-09-23 | Koninklijke Philips N.V. | Method and arrangement for automatically searching information sources accessible through a data network |
US7324986B2 (en) * | 2003-06-30 | 2008-01-29 | At&T Delaware Intellectual Property, Inc. | Automatically facilitated support for complex electronic services |
US7409593B2 (en) * | 2003-06-30 | 2008-08-05 | At&T Delaware Intellectual Property, Inc. | Automated diagnosis for computer networks |
US7237266B2 (en) * | 2003-06-30 | 2007-06-26 | At&T Intellectual Property, Inc. | Electronic vulnerability and reliability assessment |
US20050038697A1 (en) * | 2003-06-30 | 2005-02-17 | Aaron Jeffrey A. | Automatically facilitated marketing and provision of electronic services |
US20060074980A1 (en) * | 2004-09-29 | 2006-04-06 | Sarkar Pte. Ltd. | System for semantically disambiguating text information |
US8688673B2 (en) * | 2005-09-27 | 2014-04-01 | Sarkar Pte Ltd | System for communication and collaboration |
KR100802511B1 (ko) | 2005-10-11 | 2008-02-13 | 주식회사 코리아 와이즈넛 | 토픽 기반의 검색 서비스 제공 시스템 및 그 방법 |
JP2007108873A (ja) * | 2005-10-11 | 2007-04-26 | Toshiba Corp | データ検索条件階層管理装置 |
US8190650B2 (en) * | 2006-05-02 | 2012-05-29 | Microsoft Corporation | Efficiently filtering using a web site |
JP4910582B2 (ja) * | 2006-09-12 | 2012-04-04 | ソニー株式会社 | 情報処理装置および方法、並びに、プログラム |
JP2010204897A (ja) * | 2009-03-03 | 2010-09-16 | Axissoft Corp | 情報選択装置、情報選択プログラム及び情報選択方法 |
US9195771B2 (en) * | 2011-08-09 | 2015-11-24 | Christian George STRIKE | System for creating and method for providing a news feed website and application |
CN103942218B (zh) * | 2013-01-22 | 2018-05-22 | 阿里巴巴集团控股有限公司 | 一种生成、更新专题页面的方法及设备 |
WO2015072450A1 (ja) * | 2013-11-14 | 2015-05-21 | クラリオン株式会社 | 検索結果評価システム、ナビゲーションシステム、及び検索結果評価方法 |
JP6565628B2 (ja) * | 2015-11-19 | 2019-08-28 | 富士通株式会社 | 検索プログラム、検索装置および検索方法 |
JP7520500B2 (ja) * | 2019-12-09 | 2024-07-23 | 株式会社東芝 | データ生成装置およびデータ生成方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5404505A (en) * | 1991-11-01 | 1995-04-04 | Finisar Corporation | System for scheduling transmission of indexed and requested database tiers on demand at varying repetition rates |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
US5901287A (en) * | 1996-04-01 | 1999-05-04 | The Sabre Group Inc. | Information aggregation and synthesization system |
US5867799A (en) * | 1996-04-04 | 1999-02-02 | Lang; Andrew K. | Information system and method for filtering a massive flow of information entities to meet user information classification needs |
US5970489A (en) * | 1997-05-20 | 1999-10-19 | At&T Corp | Method for using region-sets to focus searches in hierarchical structures |
US5999940A (en) * | 1997-05-28 | 1999-12-07 | Home Information Services, Inc. | Interactive information discovery tool and methodology |
US5987454A (en) * | 1997-06-09 | 1999-11-16 | Hobbs; Allen | Method and apparatus for selectively augmenting retrieved text, numbers, maps, charts, still pictures and/or graphics, moving pictures and/or graphics and audio information from a network resource |
-
1996
- 1996-11-15 JP JP30500796A patent/JP3655714B2/ja not_active Expired - Fee Related
-
1997
- 1997-11-14 US US08/970,622 patent/US6073170A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6073170A (en) | 2000-06-06 |
JPH10143532A (ja) | 1998-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3655714B2 (ja) | 情報フィルタリング装置及び記録媒体 | |
US8745039B2 (en) | Method and system for user guided search navigation | |
US7428705B2 (en) | Web map tool | |
US20020007373A1 (en) | System, method, and computer program product for knowledge management | |
JP2002230035A (ja) | 情報整理方法、情報処理装置、情報処理システム、記憶媒体、およびプログラム伝送装置 | |
JP2007058782A (ja) | 情報検索装置および情報検索方法 | |
JP3803961B2 (ja) | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム | |
CN1127031C (zh) | 以电子方式创建个性化文档的系统和方法 | |
JP4469432B2 (ja) | インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH10254886A (ja) | 検索システムにおける検索結果コンテンツへの付加的情報の付加及び検索システム | |
JP3612185B2 (ja) | 文書情報更新監視装置 | |
JP3683687B2 (ja) | 情報フィルタリング装置および情報フィルタリング方法 | |
JP3588507B2 (ja) | 情報フィルタリング装置 | |
JP2009123067A (ja) | 用語辞書生成方法、用語辞書生成装置、プログラム、および記録媒体 | |
JPH07219835A (ja) | 分散ハイパーテキスト装置 | |
JP2008269106A (ja) | スキーマ抽出方法、情報処理装置、コンピュータプログラム及び記録媒体 | |
Myaeng et al. | A Digital Library System for Easy Creation/Manipulation of New Documents from Existing Resources. | |
JPH10222534A (ja) | 情報検索装置 | |
KR20050004274A (ko) | 검색엔진과, 검색시스템, 검색시스템에서의 데이터베이스작성방법 및, 기억매체 | |
Christos et al. | A web content manipulation technique based on page fragmentation | |
JPH11265402A (ja) | データ処理システム及びデータ処理システムを制御するプログラムを記録した記録媒体 | |
Turk | Software agents and robots in construction: An outlook | |
JP2002351900A (ja) | インターネット上での情報検索システム | |
JP4173857B2 (ja) | 情報フィルタリング装置および情報フィルタリング方法 | |
Knight et al. | Overview of the ROADS software |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041203 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20041203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050304 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090311 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100311 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110311 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110311 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120311 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |