JP3612125B2 - Information filtering method and information filtering apparatus - Google Patents
Information filtering method and information filtering apparatus Download PDFInfo
- Publication number
- JP3612125B2 JP3612125B2 JP32590795A JP32590795A JP3612125B2 JP 3612125 B2 JP3612125 B2 JP 3612125B2 JP 32590795 A JP32590795 A JP 32590795A JP 32590795 A JP32590795 A JP 32590795A JP 3612125 B2 JP3612125 B2 JP 3612125B2
- Authority
- JP
- Japan
- Prior art keywords
- article
- abstract
- paragraph
- articles
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
Description
【0001】
【発明の属する技術分野】
この発明は、膨大なテキスト記事からユーザの要求・興味にあったものを検索して定期的にユーザに提供する情報フィルタリング方法および情報フィルタリング装置。
【0002】
【従来の技術】
近年、ワードプロセッサーや電子計算機の普及、インターネットなどの計算機ネットワークを介した電子メールや電子ニュースの普及に伴い、文書の電子化は加速的に進みつつある。
【0003】
電子出版という言葉が示すように、今後は新聞、雑誌や本の情報も電子的に提供されることが一般的になると考えられる。これにより、個人にとってリアルタイムで入手可能となるテキスト情報の量は膨大になっていくと予測される。
【0004】
これに伴い、新聞や雑誌などの膨大なテキスト記事からユーザの要求・興味にあったものを選出して定期的にユーザに提供する情報フィルタリングシステムあるいは情報フィルタリングサービスの需要が高まりつつある。
【0005】
一方、大量の情報をコンパクトにするという観点から、文書の抄録を作成する方法についても、従来から研究が行なわれてきた。従来は、最初の段落のみを抽出する方法や予め登録しておいたキーワードを用いてキーワードを含む文のみを抽出する方法などがとられてきた。
【0006】
【発明が解決しようとする課題】
しかしながら、最初の段落のみを抽出する方法では、必ずしもそこにユーザが必要とする情報が含まれているとは限らず、適切な方法ではなかった。また、キーワードを含む文を並べただけでは、それらの文のつながりがわからないという問題があった。
【0007】
また、一旦登録したキーワードは、ユーザが変更しなければ追加や修正が行なわれず、これをユーザが行なうことは面倒な作業であった。
そこで、本発明は、上記問題点に鑑みてなされたものであり、情報フィルタリングにより検索された記事について、ユーザへの負担がなく、各ユーザの所望するテーマに合致する読みやすい抄録を生成できる情報フィルタリング方法および情報フィルタリング装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の情報フィルタリング方法は、複数の情報源からテキストやイメージなどの記事の配信を受け、それら配信された記事の中から、ユーザ毎に予め指定されたテーマに関する記事を検索してユーザに配信する情報フィルタリング方法において、ユーザ毎に予め指定されたテーマに基づく検索情報を基に、前記情報源から配信された記事からユーザが所望する記事を検索し、この検索された記事の抄録を前記検索情報を基に生成し、この生成された抄録をユーザに配信することにより、抄録を生成する際に、ユーザの興味や関心に関する情報を格納したプロファイルを用いるので、ユーザそれぞれが必要とする情報を含んだ抄録を生成することが可能になる。
【0009】
また、本発明の情報フィルタリング方法は、複数の情報源からテキストやイメージなどの記事の配信を受け、それら配信された記事の中から、ユーザ毎に予め指定されたテーマに関する記事を検索してユーザに配信する情報フィルタリング方法において、ユーザ毎に予め指定されたテーマに基づく検索情報を基に、前記情報源から配信された記事からユーザが所望する記事を検索し、この検索された記事の特徴と前記検索情報を基に前記検索された記事の抄録を生成し、この生成された抄録をユーザに配信することにより、記事の特徴に応じて、当該文書に適切な抄録生成方法を用いて当該文書の抄録を生成することができる。
【0010】
また、本発明の情報フィルタリング装置は、複数の情報源からテキストやイメージなどの記事の配信を受け、それら配信された記事の中から、ユーザ毎に予め指定されたテーマに関する記事を検索してユーザに配信する情報フィルタリング装置において、ユーザ毎に予め指定されたテーマに基づく検索情報を基に、前記情報源から配信された記事からユーザが所望する記事を検索する検索手段と、前記検索情報を基に前記検索手段で検索された記事の抄録を生成する抄録生成手段と、この抄録生成手段で生成された抄録をユーザに配信する配信手段とを具備することにより、抄録を生成する際に、ユーザの興味や関心に関する情報を格納したプロファイルを用いるので、ユーザそれぞれが必要とする情報を含んだ抄録を生成することが可能になる。
【0011】
さらに、本発明の情報フィルタリング装置は、複数の情報源からテキストやイメージなどの記事の配信を受け、それら配信された記事の中から、ユーザ毎に予め指定されたテーマに関する記事を検索してユーザに配信する情報フィルタリング装置において、ユーザ毎に予め指定されたテーマに基づく検索情報を基に、前記情報源から配信された記事からユーザが所望する記事を検索する検索手段と、この検索手段で検索された記事の特徴に応じて、前記検索情報を基に前記検索手段で検索された記事の抄録を生成する複数の抄録生成手段と、前記検索手段で検索された記事の特徴を検出する特徴検出手段と、この特徴検出手段で検出された記事の特徴に基づき前記複数の抄録生成手段のうちの1つを選択する選択手段と、この選択手段で選択された抄録生成手段で生成された抄録をユーザに配信する配信手段とを具備することにより、記事の特徴に応じて、当該文書に適切な抄録生成方法を用いて当該文書の抄録を生成することができる。
【0012】
【発明の実施の形態】
本発明の一実施形態について図面を参照して説明する。
まず、図1を参照して、本発明の情報フィルタリング装置を用いた情報フィルタリングシステム全体の構成について説明する。
【0013】
情報フィルタリングシステムは、新聞社、通信社、または出版社などの複数の情報源2からテキスト記事の配信を受け、それを定期的に加入ユーザ端末3それぞれに送信する情報提供システムであり、このシステムの情報提供サービスは情報フィルタリングセンタ1によって実現されている。
【0014】
情報フィルタリングセンタ1は、通信網を介して複数の情報源2および複数の加入ユーザ端末3に接続された1つの情報フィルタリング装置から構成され、ここには、情報フィルタリングのための制御や処理を行う中央処理装置4、プログラム並びにデータを格納する半導体メモリ、磁気ディスク、光ディスクなどの記憶装置5、回線や電波などの通信網を介して情報源2からテキスト記事を受信する受信部6、回線や電波などの通信網を介してユーザ端末3にテキスト記事を送信したり、ユーザ端末3からの回答等を受信する送受信部7などから構成されている。
【0015】
各ユーザ端末3は、例えばパーソナルコンピュータやワークステーションなどの情報処理端末であり、情報フィルタリングセンタ1から送信されたテキスト記事を受信したり、情報フィルタリングセンタ1にテキストデータを送信するテキスト情報送受信部8と、受信したテキスト記事を画面表示する表示部9などを備えている。
【0016】
情報フィルタリングセンタ1は、図2に示されているように、ユーザプロファイル10と称する一種の検索条件をユーザ毎に保持しており、そのユーザプロファイル10に従って該当するユーザに提供すベき記事を検索する。ユーザプロファイル10は、ユーザによって指定された複数のテーマ(トピック)などを基に構成されており、それらテーマに合致する記事が検索および選出されてユーザに送られる。
【0017】
次に、図3を参照して情報フィルタリングセンタ1の構成について説明する。図3において、ユーザプロファイル格納部50には、記事を検索するための検索条件に対応するプロファイルが格納されている。ここで、プロファイルの記憶形式とその具体例について図4を参照して説明する。図4(a)に示すように、プロファイルには、利用者がほしいと思う記事に含まれると考えられる単語とその重みが記述されている。具体的には、図4(b)に示すように、各ユーザ毎に複数の単語とその重みが記憶されている。なお、プロファイル作成の方法は本発明の主眼ではなく、例えば、人が利用者からどのような記事がほしいかを聞き、該当する記事に含まれると思われる単語を列挙する方法でもよい。
【0018】
記事格納部51には、情報源2から配信され、受信部6で受信された記事が格納される。ここで、記事格納部51に格納されている記事データの記憶形式とその具体例について図5を参照して説明する。
【0019】
図5(a)および(b)に示すように、記事データは、センタ1が管理する全ての記事についてその記事を識別するための記事ID(例えば、「001」、「002」、「003」…)、記事の発行元(例えば、「A新聞社」、「B新聞社」、「C出版社」…)、記事の見出し(例えば、「マルチメディアパソコン発売」、「半導体売行き好調」…)、およびその記事の本文の格納位置を示す記事格納部51に対するポインタ(例えば、123456、123457、123458)から構成されて、記事格納部51に記憶されている。
【0020】
記事検索部52は、ユーザプロファイル格納部50に記憶されているユーザプロファイルを用いて、記事格納部51に格納されている記事を検索する。ここでの検索方法としては、例えば「SMART情報検索システム」(ジェラルド・サルトン編、神保健二監訳、企画センター)に記載されている公知の方法を用いることができる。すなわち、この方法(ベクトル空間法)よれば、たとえば、プロファイルに記憶されている各単語のベクトル空間を仮定し、このベクトル空間上において各単語の重みベクトルと検索対象の記事における対応する単語の出現回数ベクトルとの内積を求めることによりプロファイルに対する類似度を算出し、この類似度の大きい順にランク付けされ、検索された記事を並べて出力することが可能である。
【0021】
図6に記事検索部52から出力される検索結果の具体例を示す。図6には、あるユーザプロファイルに対して4件の記事が検索された場合について示している。すなわち、ユーザプロファイルのIDとともに、算出された類似度に基づく記事のランク(例えば、「1」、「2」、「3」、「4」)と記事IDから構成される検索結果が、検索結果格納部53に格納される。
【0022】
従来のフィルタリングシステムでは、検索結果格納部53に格納された結果と、記事格納部51に格納された記事データから、最終的に利用者へ送るフィルタリング結果が作成されて、検索結果格納部53の所定の記憶領域に記憶されるようになっている。
【0023】
図7は、利用者へ送られる従来のフィルタリング結果の具体例を示したもので、記事のランク、記事の見出し、その記事の本文などから構成されている。
抄録生成部100は、検索結果格納部53に格納されたフィルタリング結果について、フィルタリング結果に含まれる記事の抄録を生成するものである。抄録生成部100は、図3に示すように、抄録生成制御部101、記事特徴検出部102、および複数(ここでは、例えば3つ)の生成部103−1、103−2、103−3から構成される。
【0024】
記事特徴検出部102は、記事検索部52で検索された記事から、例えば、記事の文字数、段落数といった記事の特徴を検出するようになっている。
第1の作成部103−1、第2の作成部103−2、第3の作成部103−3は、それぞれ記事特徴検出部102で検出された記事の特徴に適した抄録を生成するようになっている。
【0025】
抄録生成制御部101は、抄録生成部100全体の制御を司るものである。
次に、図8に示すフローチャートを参照して、抄録生成制御部101の処理動作について説明する。
【0026】
抄録生成制御部101は、例えば、記事のランク(n)が高い順に検索結果格納部53に格納されているフィルタリング結果を取り出し(ステップS1〜ステップS3)、当該のフィルタリング結果の記事IDについて、順に以下の処理を行なう。まず、記事IDを記事特徴検出部102へ渡し、記事特徴検出部102から選択すべき生成部の番号(この場合、「1」(第1の生成部103−1)、「2」(第2の生成部103−2)、「3」(第3の生成部103−3)のいずれか)を受け取る(ステップS4〜ステップS5)。
【0027】
次に、当該の番号の生成部へ、記事IDとユーザプロファイルのIDを渡す(ステップS6)。そして、当該の生成部で生成された抄録を受け取り(ステップS7)、当該の記事について、図6に示したような検索結果格納部53に格納されたフィルタリング結果に含まれる記事のランク、記事IDにより記事格納部51から取り出した記事見出し、および、当該記事の抄録が検索結果格納部53の所定の記憶領域に記憶され、最終的に利用者へ配信するフィルタリング結果が生成される。
【0028】
次に、図9に示すフローチャートを参照して記事特徴検出部102の処理動作について説明する。
記事特徴検出部102は、抄録生成制御部101から渡された記事IDを用いて、記事格納部51から、記事本文へのポインタをたどって、記事本文を取り出す(ステップS10)。次に、取り出した記事本文の文字数と段落数をカウントする(ステップS11)。段落は、行の先頭が空白文字であることを検出して、段落の始まりであるとすることができる。さらに、予め格納されている抄録生成条件テーブルを参照しながら処理を進める。
【0029】
図10に、記事特徴検出部102に記憶されている抄録生成条件テーブルの形式(図10(a))とその具体例(図10(b))を示す。抄録生成条件テーブルは、複数の生成部を識別するID番号(例えば、「1」、「2」、「3」)と、その生成部にて適用される記事の文字数の最大値(例えば、「400」、「800」、「10000」)および段落数の最大値(例えば、「5」、「10」、「100」)が格納されている。
【0030】
さて、記事特徴検出部102は、図10に示したような抄録生成条件テーブルの最初の行に示されているID番号「1」の第1の生成部103−1の文字数および段落数を取り出し、当該の記事本文の文字数および段落数と比較する(ステップS12)。当該の記事本文の文字数と段落数の両方が、抄録作成部1のそれぞれの値より小さい場合には「1」を返して終了する(ステップS13)。
【0031】
もし、この条件に合わない場合には、抄録生成条件テーブルの次の行、すなわち、ID番号「2」の第2の生成部103−2の文字数および段落数を取り出して同様の処理を行ない、条件に合う場合には「2」を返して終了する(ステップS14〜ステップS15)。さらに、この条件に合わない場合には第3の生成部103−3のID番号「3」を返して終了する(ステップS16)。
【0032】
抄録生成制御部101は、記事特徴検出部102から返された数字に対応して、第1〜第3の生成部のうちの1つを選択し、選択した生成部へ記事IDとユーザプロファイルを渡す。
【0033】
次に、第1〜第3の生成部(103−1〜103−3)の処理動作について説明する。
まず、第1の生成部103−1の処理動作について説明する。第1の生成部103−1は、抄録生成制御部101から渡された記事IDを用いて、記事格納部51から記事の最初の段落を取り出す。文字数や段落数が少ない記事では、第1段落に主な情報が書かれていることが多いので、記事格納部51から取り出された記事の第1段落を取り出す処理を行なっている。
【0034】
次に、第2の生成部103−2の処理動作について図11に示すフローチャートを参照して説明する。第2の生成部103−2は、まず、抄録生成制御部101から渡された記事IDを用いて、記事格納部51から記事の本文を取り出し格納し(ステップS20)、その本文について各段落の類似度を算出する(ステップS21)。
【0035】
ここで、段落類似度の算出処理動作について、図12に示すフローチャートを参照して説明する。
まず、記事格納部51から取り出された記事本文の第1段落から順に、ひとつずつ段落を取り出し(ステップS30〜ステップS33)、ユーザプロファイルのIDを用いてユーザプロファイル格納部50から所望のユーザプロファイルを取り出して、このユーザプロファイルを用いて段落の類似度を算出し(ステップS34)、その結果を蓄えていく(ステップS35)。
【0036】
段落の類似度の算出は、前述の記事検索部52が記事全体を対象として行なう類似度の算出処理(ベクトル空間法)を、段落を対象にして行なうことによって実現できる。
【0037】
全ての段落について類似度を算出してその結果が蓄えられたら(ステップS36、ステップS31)、最後に、蓄えた結果を段落の類似度の順に並べ換える(ステップS32)。なお、この段落類似度の算出結果は、第2の生成部103−2に割り当てられた検索結果格納部53の所定の記憶領域に、例えば、図13に示すように記憶される。図13(a)に示すように、段落類似度の算出結果は、段落の番号、段落の類似度、段落の内容から構成されていて、段落の類似度が高いものから順に並んでいる(図13(b))。
【0038】
図11の説明にもどり、第2の生成部103−2は、図13に示したような段落類似度算出結果を基に、最も類似度が高かった段落の番号を取り出す(ステップS22)。もし、当該の段落の番号が「1」である場合には、第1段落のみを抄録生成制御部101へ返す(ステップS23、ステップS25)。そうでないない場合には、格納しておいた第1段落と、最も類似度が高かった段落の両方を、抄録生成制御部101へ返す(ステップS23、ステップS24)。
【0039】
このように、第2の生成部103−2では、主な情報が書かれている第1段落と、利用者の関心が高い(類似度の最も高い)段落の両方を取り出す処理を行なっている。これは、例えば、国や地方自治体の予算に関する記事では、予算全体に関する情報が最初の段落に書かれ、予算の個々の細目については、第2段落以降の段落に分けて書かれるので、ある利用者がマルチメディアに関心がある場合、プロファイルを用いることによって、マルチメディアに関する予算の割当などについて書かれた段落を取り出すことができ、第1段落とともに利用者へ送られることになる。従って、利用者は、第1段落により、記事の全体の情報を得るとともに、自分の関心がある情報についても知ることができる。
【0040】
なお、第1段落の他には、最も類似度の高い段落だけでなく、最も類似度の高い段落から複数の段落を選ぶようにすることは容易に実現できる。
次に、第3の生成部103−3の処理動作について図14に示すフローチャートを参照して説明する。
【0041】
第3の生成部103−3は、抄録生成制御部101から受け取った記事IDを用いて、記事格納部51から記事本文を取り出し(ステップS40)、図12に示したユーザプロファイルを用いた段落類似度算出処理を行って、全ての段落の類似度を算出し、第3の生成部103−2に割り当てられた検索結果格納部53の所定の記憶領域に、例えば、図13に示すように記憶される(ステップS41)。
【0042】
その結果をもとに、次に、例えば、段落の総数を3で割った値(整数)の数だけ、類似度の最も大きい段落から順に取り出す。段落の総数を「3」で割った値を用いることにより、約1/3の長さの抄録を生成することができる(ステップS42)。例えば、記事の全体が14の段落からなる場合には、類似度の最も高い段落から4つの段落が取り出されることになる。このように第3の生成部103−3は、雑誌の記事のように、記事全体の長さが長い場合に、利用者が関心のある情報が含まれると考えられる段落を取り出して抄録を作成する処理を行なっている。
【0043】
なお、段落の総数を割る値は「3」に限るものではなく、他の値でもよい。また、利用者が予め指定した値を設定するようにすることも容易に実現できる。
以上の第1〜第3の生成部103−1〜103−3のいづれかの生成部で生成された抄録を抄録生成制御部101が受け取り(図8のステップS7)、当該の記事についての記事ランク、記事見出し、および、当該記事の抄録等が、検索結果格納部53の所定の記憶領域に記憶され、最終的に各ユーザへ配信されるフィルタリング結果が生成される。
【0044】
図15に抄録生成部100で生成されたフィルタリング結果の具体例を示す。図15に示すように、フィルタリング結果は、記事のランク、記事の見出し、記事の全文から一部の段落を取り出して作成した抄録から構成されている。
【0045】
このような構成で検索結果格納部53に記憶されたフィルタリング結果は、テキスト情報送受信部7および所定の通信網を介して、例えば、電子メールやFAXで利用者へ送られる。利用者は、送られてきた記事を読み、自分にとって関心がある記事であるかどうかの観点で「○」や「×」を付けて情報フィルタリングセンタ1へ送り返すことができる。すなわち、ユーザ端末から所定の通信網およびテキスト情報送受信部7を介して送り返されてきた回答は、ユーザ回答格納部60へ格納される。
【0046】
図16にユーザ回答格納部60に格納されたユーザの回答データの具体例を示す。利用者は、関心のあった記事に「○」、関心のなかった記事に「×」、どちらでもない記事はそのままとしている。ユーザの回答は、さらにユーザが必要とする記事を選択できるように、プロファイルを修正するために利用される。
【0047】
プロファイル修正部61は、図16に示したようなユーザの回答と、ユーザ回答中の記事IDを用いて記事格納部51から取り出した記事本文とから、ユーザプロファイル格納部50に格納されているユーザプロファイルを修正する。プロファイルを修正する方法は、例えば、「SMART情報検索システム」(ジェラルド・サルトン編、神保健二監訳、企画センター)に記載されている方法が適用できよう。すなわち、この方法は、ユーザが関心のあった記事の中から単語の出現頻度を計数して、その計数値が最も大きい単語をユーザプロファイルに新たに追加するというものである。
【0048】
以上説明したように、上記実施形態によれば、ユーザプロファイル格納部50に格納されている各ユーザ毎のプロファイルは、ユーザの回答に基づいて常に修正・調整され、このプロファイルを用いて記事検索部52で記事格納庫51に格納された記事との類似度を算出してユーザが所望する情報を含んだ記事の検索を行い、さらに、この検索された記事について、抄録生成部100で同じくプロファイルを用いて類似度を算出することにより抄録を生成することにより、ユーザが必要とする情報を含んだ抄録の作成が容易に行える。
【0049】
また、抄録生成部100で検索された記事の抄録を生成する際、まず、記事特徴検出部102で、その記事の特徴、具体的には、例えば、文字数、段落数を求めて、第1〜第3の生成部103−1〜103−3のうちの1つを選択して、その記事の特徴に適した抄録生成方法を選択することにより、ユーザが必要とする情報を含んだ抄録の作成が容易に行える。
【0050】
さらに、このようにして生成された抄録を各ユーザに配信することにより、情報フィルタリングにより検索されて配信された記事内容から各利用者が情報を得るための時間を短縮し、労力を軽減することができる。
【0051】
【発明の効果】
以上説明したように、本発明によれば、情報フィルタリングにより検索された記事について、ユーザが必要とする情報を含んだ抄録の作成が容易に行える情報フィルタリング方法および情報フィルタリング装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る情報フィルタリング装置のシステム全体の構成を示すブロック図。
【図2】図1のシステムの運用形態を概念的に示す図。
【図3】情報フィルタリング装置の構成を示したブロック図。
【図4】ユーザプロファイルの記憶形式とその具体例について説明するための図。
【図5】記事格納部に格納される記事データの記憶形式とその具体例について説明するための図。
【図6】記事検索部から出力され、検索結果格納部に格納される検索結果の記憶形式とその具体例について説明するための図。
【図7】従来のフィルタリング装置の出力形態の具体例を示した図。
【図8】抄録生成制御部の処理動作を説明するためのフローチャート。
【図9】抄録生成部の記事特徴検出部の処理動作を説明するためのフローチャート。
【図10】記事特徴検出部が参照する抄録生成条件テーブルの記憶形式とその具体例について説明するための図。
【図11】抄録生成部の第2の生成部の処理動作を説明するためのフローチャート。
【図12】段落類似度算出処理について説明するためのフローチャート。
【図13】段落類似度の算出結果の記憶形式とその具体例について説明するための図。
【図14】抄録生成部の第3の生成部の処理動作について説明するためのフローチャート。
【図15】抄録生成部で生成された抄録に基づき生成されて検索結果格納部に格納され各ユーザに配信される情報フィルタリング結果の具体例を示した図。
【図16】ユーザ回答格納部に格納されたユーザの回答データの具体例を示した図。
【符号の説明】
1…情報フィルタリングセンタ、2…情報源、3…ユーザ端末、4…中央処理部、5…記憶部、6…テキスト情報受信部、7…テキスト情報送受信部、50…ユーザプロファイル格納部、51…記事格納部、52…記事検索部、53…検索結果格納部、60…ユーザ回答格納部、61…プロファイル修正部、100…抄録生成部、101…抄録生成制御部、102…記事特徴検出部、103−1…第1の生成部、103−2…第2の生成部、103−3…第3の生成部。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information filtering method and an information filtering device for searching for a user's request / interest from an enormous amount of text articles and periodically providing it to the user.
[0002]
[Prior art]
In recent years, with the spread of word processors and electronic computers, and the spread of electronic mail and electronic news via computer networks such as the Internet, the digitization of documents is accelerating.
[0003]
As the term “electronic publishing” suggests, it will be common to provide information on newspapers, magazines and books electronically in the future. As a result, the amount of text information that can be obtained in real time for an individual is expected to become enormous.
[0004]
Accordingly, there is an increasing demand for an information filtering system or an information filtering service that selects and regularly provides a user with a user's request / interest from huge text articles such as newspapers and magazines.
[0005]
On the other hand, from the viewpoint of making a large amount of information compact, research has also been conducted on methods for creating document abstracts. Conventionally, a method of extracting only the first paragraph or a method of extracting only a sentence including a keyword using a keyword registered in advance has been employed.
[0006]
[Problems to be solved by the invention]
However, the method of extracting only the first paragraph does not necessarily include the information required by the user, and is not an appropriate method. Moreover, there is a problem that the connection of sentences is not understood only by arranging sentences including keywords.
[0007]
Also, once the registered keyword is not changed by the user, it is not added or modified, and it is troublesome for the user to do this.
Therefore, the present invention has been made in view of the above problems, and for an article searched by information filtering, there is no burden on the user, and information that can generate an easy-to-read abstract that matches each user's desired theme. An object is to provide a filtering method and an information filtering device.
[0008]
[Means for Solving the Problems]
The information filtering method of the present invention receives distribution of articles such as texts and images from a plurality of information sources, searches the distributed articles for articles on a theme specified in advance for each user, and distributes them to the users. In the information filtering method, an article desired by a user is searched from articles distributed from the information source based on search information based on a theme specified in advance for each user, and an abstract of the searched article is searched. By creating a summary based on information and distributing the generated abstract to the user, a profile storing information about the user's interests and interests is used when generating the abstract. It is possible to generate an abstract that includes it.
[0009]
Further, the information filtering method of the present invention receives articles such as texts and images from a plurality of information sources, searches for articles related to the theme designated in advance for each user from the distributed articles. In the information filtering method distributed to the user, based on the search information based on the theme specified in advance for each user, the article desired by the user is searched from the articles distributed from the information source. An abstract of the searched article is generated based on the search information, and the generated abstract is distributed to the user, so that the document can be generated using an abstract generation method appropriate for the document according to the feature of the article. Abstracts can be generated.
[0010]
Further, the information filtering device of the present invention receives articles such as texts and images from a plurality of information sources, searches the articles for articles on a theme specified in advance for each user, and searches the articles for users. In the information filtering device distributed on the basis of search information based on a theme specified in advance for each user, search means for searching for an article desired by the user from articles distributed from the information source, and the search information When generating an abstract, the system includes: an abstract generation unit that generates an abstract of the article searched by the search unit; and a distribution unit that distributes the abstract generated by the abstract generation unit to the user. It is possible to generate an abstract that contains information that each user needs because it uses a profile that stores information about interests That.
[0011]
Furthermore, the information filtering device of the present invention receives distribution of articles such as texts and images from a plurality of information sources, searches the distributed articles for articles on a theme specified in advance for each user, and In the information filtering device distributed to the user, based on search information based on a theme specified in advance for each user, search means for searching for an article desired by the user from articles distributed from the information source, and search by the search means A plurality of abstract generation means for generating abstracts of articles searched by the search means based on the search information, and feature detection for detecting features of articles searched by the search means A selection means for selecting one of the plurality of abstract generation means based on the feature of the article detected by the feature detection means, and a selection by the selection means A distribution means for distributing the abstract generated by the abstract generation means to the user, and generating an abstract of the document using an abstract generation method appropriate for the document according to the feature of the article. Can do.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
An embodiment of the present invention will be described with reference to the drawings.
First, with reference to FIG. 1, the structure of the whole information filtering system using the information filtering apparatus of this invention is demonstrated.
[0013]
The information filtering system is an information providing system for receiving a text article from a plurality of
[0014]
The
[0015]
Each
[0016]
As shown in FIG. 2, the
[0017]
Next, the configuration of the
[0018]
The article storage unit 51 stores articles distributed from the
[0019]
As shown in FIGS. 5A and 5B, the article data includes article IDs (for example, “001”, “002”, “003”) for identifying the articles for all articles managed by the
[0020]
The
[0021]
FIG. 6 shows a specific example of the search result output from the
[0022]
In the conventional filtering system, a filtering result that is finally sent to the user is created from the result stored in the search
[0023]
FIG. 7 shows a specific example of the conventional filtering result sent to the user, and is composed of the rank of the article, the headline of the article, the body of the article, and the like.
The
[0024]
The article
The first creation unit 103-1, the second creation unit 103-2, and the third creation unit 103-3 each generate an abstract suitable for the feature of the article detected by the article
[0025]
The abstract
Next, the processing operation of the abstract
[0026]
The abstract
[0027]
Next, the article ID and the user profile ID are passed to the number generation unit (step S6). And the abstract produced | generated by the said production | generation part is received (step S7), the rank of the article contained in the filtering result stored in the search
[0028]
Next, the processing operation of the article
The article
[0029]
FIG. 10 shows the format of the abstract generation condition table stored in the article feature detection unit 102 (FIG. 10A) and its specific example (FIG. 10B). The abstract generation condition table includes an ID number (for example, “1”, “2”, “3”) for identifying a plurality of generation units, and a maximum value of the number of characters of articles applied by the generation unit (for example, “ 400 ”,“ 800 ”,“ 10000 ”) and the maximum number of paragraphs (for example,“ 5 ”,“ 10 ”,“ 100 ”) are stored.
[0030]
Now, the article
[0031]
If this condition is not met, the next line of the abstract generation condition table, that is, the number of characters and the number of paragraphs of the second generation unit 103-2 with the ID number “2” is extracted and the same processing is performed If the condition is met, “2” is returned and the process ends (steps S14 to S15). If this condition is not met, the ID number “3” of the third generation unit 103-3 is returned and the process ends (step S16).
[0032]
The abstract
[0033]
Next, processing operations of the first to third generation units (103-1 to 103-3) will be described.
First, the processing operation of the first generation unit 103-1 will be described. The first generation unit 103-1 takes out the first paragraph of the article from the article storage unit 51 using the article ID passed from the abstract
[0034]
Next, the processing operation of the second generation unit 103-2 will be described with reference to the flowchart shown in FIG. The second generation unit 103-2 first extracts and stores the text of the article from the article storage unit 51 using the article ID passed from the abstract generation control unit 101 (step S20). The similarity is calculated (step S21).
[0035]
Here, the paragraph similarity calculation processing operation will be described with reference to the flowchart shown in FIG.
First, paragraphs are extracted one by one in order from the first paragraph of the article text extracted from the article storage unit 51 (steps S30 to S33), and a desired user profile is obtained from the user
[0036]
The calculation of the similarity of a paragraph can be realized by performing the similarity calculation processing (vector space method) performed on the entire article by the
[0037]
When the similarities are calculated for all the paragraphs and the results are stored (steps S36 and S31), the stored results are finally rearranged in the order of the similarity of the paragraphs (step S32). The paragraph similarity calculation result is stored in a predetermined storage area of the search
[0038]
Returning to the description of FIG. 11, the second generation unit 103-2 extracts the number of the paragraph with the highest similarity based on the paragraph similarity calculation result as shown in FIG. 13 (step S <b> 22). If the number of the paragraph is “1”, only the first paragraph is returned to the abstract generation control unit 101 (steps S23 and S25). Otherwise, both the stored first paragraph and the paragraph with the highest similarity are returned to the abstract generation control unit 101 (step S23, step S24).
[0039]
As described above, the second generation unit 103-2 performs processing for extracting both the first paragraph in which main information is written and the paragraph in which the user is highly interested (the highest similarity). . This is because, for example, in an article on the budget of a national or local government, information about the entire budget is written in the first paragraph, and each detail of the budget is written in the second and subsequent paragraphs. If a person is interested in multimedia, a paragraph about the budget allocation related to multimedia can be taken out by using the profile, and sent to the user together with the first paragraph. Accordingly, the user can obtain information on the entire article and information on his / her interest from the first paragraph.
[0040]
In addition to the first paragraph, it is easy to select a plurality of paragraphs from the paragraph having the highest similarity as well as the paragraph having the highest similarity.
Next, the processing operation of the third generation unit 103-3 will be described with reference to the flowchart shown in FIG.
[0041]
The third generation unit 103-3 takes out the article text from the article storage unit 51 using the article ID received from the abstract generation control unit 101 (step S40), and is similar to the paragraph using the user profile shown in FIG. The degree calculation process is performed to calculate the similarities of all paragraphs, and stored in a predetermined storage area of the search
[0042]
Based on the result, next, for example, the number of paragraphs having the largest similarity is extracted in order from the total number of paragraphs divided by 3 (an integer). By using a value obtained by dividing the total number of paragraphs by “3”, an abstract having a length of about 1/3 can be generated (step S42). For example, if the entire article consists of 14 paragraphs, 4 paragraphs are extracted from the paragraph with the highest similarity. In this way, the third generation unit 103-3 creates an abstract by extracting a paragraph that is considered to contain information of interest to the user when the entire article is long, such as an article in a magazine. Processing to do.
[0043]
The value that divides the total number of paragraphs is not limited to “3”, and may be another value. It is also easy to set a value designated in advance by the user.
The abstract
[0044]
FIG. 15 shows a specific example of the filtering result generated by the
[0045]
The filtering result stored in the search
[0046]
FIG. 16 shows a specific example of user answer data stored in the user answer storage unit 60. The user keeps the articles that are neither “○” for articles that are interested, or “x” for articles that are not interested. The user's answer is further used to modify the profile so that the user can select the articles he needs.
[0047]
The
[0048]
As described above, according to the above-described embodiment, the profile for each user stored in the user
[0049]
Further, when the abstract of the article searched by the
[0050]
Furthermore, by distributing the abstracts generated in this way to each user, the time for each user to obtain information from the contents of the articles searched and distributed by information filtering is reduced, and labor is reduced. Can do.
[0051]
【The invention's effect】
As described above, according to the present invention, it is possible to provide an information filtering method and an information filtering apparatus that can easily create an abstract including information required by a user for an article searched by information filtering.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an entire system of an information filtering apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram conceptually showing an operation mode of the system of FIG.
FIG. 3 is a block diagram showing a configuration of an information filtering device.
FIG. 4 is a diagram for explaining a user profile storage format and a specific example thereof.
FIG. 5 is a diagram for explaining a storage format of article data stored in an article storage unit and a specific example thereof.
FIG. 6 is a diagram for explaining a storage format of search results output from an article search unit and stored in a search result storage unit and a specific example thereof.
FIG. 7 is a diagram showing a specific example of an output form of a conventional filtering device.
FIG. 8 is a flowchart for explaining the processing operation of the abstract generation control unit.
FIG. 9 is a flowchart for explaining the processing operation of the article feature detection unit of the abstract generation unit.
FIG. 10 is a diagram for explaining a storage format of an abstract generation condition table referred to by an article feature detection unit and a specific example thereof.
FIG. 11 is a flowchart for explaining the processing operation of the second generation unit of the abstract generation unit.
FIG. 12 is a flowchart for explaining paragraph similarity calculation processing;
FIG. 13 is a diagram for explaining a storage format of paragraph similarity calculation results and a specific example thereof.
FIG. 14 is a flowchart for explaining a processing operation of a third generation unit of the abstract generation unit.
FIG. 15 is a diagram illustrating a specific example of an information filtering result generated based on an abstract generated by an abstract generation unit, stored in a search result storage unit, and distributed to each user.
FIG. 16 is a diagram showing a specific example of user answer data stored in a user answer storage unit;
[Explanation of symbols]
DESCRIPTION OF
Claims (4)
前記受信手段で受信された記事を記憶する第1の記憶手段と、 First storage means for storing articles received by the receiving means;
ユーザにより予め指定されたテーマに関する記事を検索するための単語とその重み値が指定されている検索条件を記憶する第2の記憶手段と、 Second storage means for storing a search condition in which a word for searching for an article related to a theme specified in advance by a user and a weight value thereof are specified;
前記第1の記憶手段で記憶された記事の中から、ユーザに配信する記事を抽出するとともに、当該記事の抄録を作成する情報フィルタリング処理を行う演算手段と、 A computing means for extracting an article to be distributed to the user from the articles stored in the first storage means and performing an information filtering process for creating an abstract of the article;
前記情報フィルタリング処理を行った結果を配信する配信手段と、 A distribution means for distributing the result of the information filtering process;
を備えたコンピュータにおける情報フィルタリング方法において、 In an information filtering method in a computer comprising:
前記演算手段が、 The computing means is
(1)前記第1の記憶手段で記憶された各記事に含まれる前記検索条件の単語の出現回数と当該単語の前記重み値を用いて、各記事の当該検索条件に対する類似度を算出して、当該類似度の高い順にランク付けされた複数の記事を検索する検索ステップと、 (1) Using the number of appearances of the word of the search condition included in each article stored in the first storage means and the weight value of the word, the similarity of each article to the search condition is calculated A search step for searching for a plurality of articles ranked in descending order of the similarity;
(2)前記検索ステップで検索された各記事を、記事本文の文字数及び段落数が予め定められた第1の閾値よりも少ない第1のグループ、当該第1の閾値以上でかつ当該第1の閾値よりも大きい第2の閾値よりも少ない第2のグループ及び当該第2の閾値以上の第3のグループのうちのいずれか1つに分類するステップと、 (2) For each article searched in the search step, a first group in which the number of characters and the number of paragraphs of the article body are less than a predetermined first threshold, which is equal to or more than the first threshold and the first Classifying into any one of a second group less than a second threshold greater than a threshold and a third group greater than or equal to the second threshold;
(3)前記第1のグループに分類された記事について、その最初の段落を抄録として抽出する第1の抄録作成ステップと、 (3) a first abstract creation step of extracting the first paragraph as an abstract for the articles classified into the first group;
(4)前記第2のグループに分類された記事の各段落に対し、当該段落に含まれる前記検索条件の単語の出現回数と当該単語の前記重み値を用いて当該検索条件に対する類似度を算出し、当該記事から最初の段落及び少なくとも当該類似度が最も高い段落を抄録として抽出する第2の抄録作成ステップと、 (4) For each paragraph of the article classified into the second group, the similarity to the search condition is calculated using the number of appearances of the word of the search condition included in the paragraph and the weight value of the word. A second abstract creation step for extracting the first paragraph and at least the paragraph with the highest similarity from the article as an abstract,
(5)前記第3のグループに分類された記事の各段落に対し、当該段落に含まれる前記検索条件の単語の出現回数と当該単語の前記重み値を用いて当該検索条件に対する類似度を算出し、当該記事から当該類似度が高い順に所定数の段落を抄録として抽出する第3の抄録作成ステップと、 (5) For each paragraph of the article classified into the third group, the similarity to the search condition is calculated using the number of appearances of the word of the search condition included in the paragraph and the weight value of the word. A third abstract creating step for extracting a predetermined number of paragraphs from the article in descending order of the similarity,
を実行し、 Run
前記配信手段が、前記検索ステップで検索された各記事のランクと、前記第1乃至第3の抄録作成ステップのうちのいずれかで作成された抄録とを配信する配信ステップと、 A delivery step in which the delivery means delivers the rank of each article searched in the search step and the abstract created in any of the first to third abstract creation steps;
を実行する Run
ことを特徴とする情報フィルタリング方法。An information filtering method characterized by the above.
前記配信ステップで抄録の配信された記事のうち、前記ユーザが関心ありと回答した記事については、その中に含まれる出現頻度の最も高い単語を前記検索条件に追加するステップをさらに有することを特徴とする請求項1記載の情報フィルタリング方法。 Of the articles distributed as abstracts in the distribution step, the article that the user replied with interest has the step of adding the word with the highest appearance frequency contained therein to the search condition. The information filtering method according to claim 1.
前記受信手段で受信された記事を記憶する第1の記憶手段と、 First storage means for storing articles received by the receiving means;
ユーザにより予め指定されたテーマに関する記事を検索するための単語とその重み値が指定されている検索条件を記憶する第2の記憶手段と、 Second storage means for storing a search condition in which a word for searching for an article related to a theme designated in advance by a user and its weight value are specified;
前記第1の記憶手段で記憶された各記事に含まれる前記検索条件の単語の出現回数と当該単語の前記重み値を用いて、各記事の当該検索条件に対する類似度を算出して、当該類似度の高い順にランク付けされた複数の記事を検索するための検索手段と、 Using the number of appearances of the word of the search condition included in each article stored in the first storage means and the weight value of the word, the similarity to the search condition of each article is calculated, and the similarity A search means for searching a plurality of articles ranked in descending order;
前記検索手段で検索された各記事を、記事本文の文字数及び段落数が予め定められた第1の閾値よりも少ない第1のグループ、当該第1の閾値以上でかつ当該第1の閾値よりも大きい第2の閾値よりも少ない第2のグループ及び当該第2の閾値以上の第3のグループ Each article searched by the search means is a first group in which the number of characters and the number of paragraphs of the article body are smaller than a predetermined first threshold, which is equal to or more than the first threshold and is lower than the first threshold. A second group that is less than a large second threshold and a third group that is greater than or equal to the second threshold のうちのいずれか1つに分類する手段と、Means for classifying any one of
前記第1のグループに分類された記事について、その最初の段落を抄録として抽出する第1の抄録作成手段と、 A first abstract creating means for extracting the first paragraph as an abstract for the articles classified into the first group;
前記第2のグループに分類された記事の各段落に対し、当該段落に含まれる前記検索条件の単語の出現回数と当該単語の前記重み値を用いて当該検索条件に対する類似度を算出し、当該記事から最初の段落及び少なくとも当該類似度が最も高い段落を抄録として抽出する第2の抄録作成手段と、 For each paragraph of the article classified into the second group, the similarity to the search condition is calculated using the number of appearances of the word of the search condition included in the paragraph and the weight value of the word, A second abstract creation means for extracting the first paragraph and at least the paragraph with the highest similarity from the article as an abstract;
前記第3のグループに分類された記事の各段落に対し、当該段落に含まれる前記検索条件の単語の出現回数と当該単語の前記重み値を用いて当該検索条件に対する類似度を算出し、当該記事から当該類似度が高い順に所定数の段落を抄録として抽出する第3の抄録作成手段と、 For each paragraph of the articles classified into the third group, the similarity to the search condition is calculated using the number of occurrences of the word of the search condition included in the paragraph and the weight value of the word, A third abstract creation means for extracting a predetermined number of paragraphs from the article in descending order of the degree of similarity;
前記検索手段で検索された各記事のランクと、前記第1乃至第3の抄録作成手段のうちのいずれかで作成された抄録とを配信する配信手段と、 Distribution means for distributing the rank of each article searched by the search means and the abstract created by any one of the first to third abstract creation means;
を具備したことを特徴とする情報フィルタリング装置。 An information filtering apparatus comprising:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32590795A JP3612125B2 (en) | 1995-12-14 | 1995-12-14 | Information filtering method and information filtering apparatus |
US08/766,859 US6052714A (en) | 1995-12-14 | 1996-12-13 | Information filtering apparatus and method for retrieving a selected article from information sources |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32590795A JP3612125B2 (en) | 1995-12-14 | 1995-12-14 | Information filtering method and information filtering apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09167164A JPH09167164A (en) | 1997-06-24 |
JP3612125B2 true JP3612125B2 (en) | 2005-01-19 |
Family
ID=18181933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32590795A Expired - Fee Related JP3612125B2 (en) | 1995-12-14 | 1995-12-14 | Information filtering method and information filtering apparatus |
Country Status (2)
Country | Link |
---|---|
US (1) | US6052714A (en) |
JP (1) | JP3612125B2 (en) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319768A (en) * | 1996-05-29 | 1997-12-12 | Oki Electric Ind Co Ltd | Main point extracting method |
JP3270351B2 (en) | 1997-01-31 | 2002-04-02 | 株式会社東芝 | Electronic document processing device |
US7236969B1 (en) | 1999-07-08 | 2007-06-26 | Nortel Networks Limited | Associative search engine |
JP3403335B2 (en) * | 1998-06-26 | 2003-05-06 | 日立ソフトウエアエンジニアリング株式会社 | Virtual geospatial object generation system and recording medium |
JP4198786B2 (en) * | 1998-06-30 | 2008-12-17 | 株式会社東芝 | Information filtering system, information filtering apparatus, video equipment, and information filtering method |
US6229524B1 (en) * | 1998-07-17 | 2001-05-08 | International Business Machines Corporation | User interface for interaction with video |
JP2000067067A (en) * | 1998-08-20 | 2000-03-03 | Sky Com:Kk | Distribution server and distribution system |
US6154783A (en) | 1998-09-18 | 2000-11-28 | Tacit Knowledge Systems | Method and apparatus for addressing an electronic document for transmission over a network |
US6115709A (en) * | 1998-09-18 | 2000-09-05 | Tacit Knowledge Systems, Inc. | Method and system for constructing a knowledge profile of a user having unrestricted and restricted access portions according to respective levels of confidence of content of the portions |
US8380875B1 (en) | 1998-09-18 | 2013-02-19 | Oracle International Corporation | Method and system for addressing a communication document for transmission over a network based on the content thereof |
AU5910699A (en) * | 1998-09-18 | 2000-04-10 | Tacit Knowledge Systems | Method of constructing and displaying an entity profile constructed utilizing input from entities other than the owner |
US6377949B1 (en) | 1998-09-18 | 2002-04-23 | Tacit Knowledge Systems, Inc. | Method and apparatus for assigning a confidence level to a term within a user knowledge profile |
WO2000017727A2 (en) | 1998-09-18 | 2000-03-30 | Tacit Knowledge Systems | Method and apparatus for querying a user knowledge profile |
US6253202B1 (en) * | 1998-09-18 | 2001-06-26 | Tacit Knowledge Systems, Inc. | Method, system and apparatus for authorizing access by a first user to a knowledge profile of a second user responsive to an access request from the first user |
JP2000242654A (en) * | 1999-02-18 | 2000-09-08 | Just Syst Corp | Information processor, information processing method and computer readable storage medium recorded with program for making computer execute the method |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
JP3688157B2 (en) * | 1999-07-19 | 2005-08-24 | 日本電信電話株式会社 | Literature information provision processing method and literature information provision device |
US6393417B1 (en) * | 1999-10-15 | 2002-05-21 | De Le Fevre Patrick Y. | Method for providing a rapid internet search |
US6546387B1 (en) * | 1999-11-15 | 2003-04-08 | Transcom Software Inc. | Computer network information management system and method using intelligent software agents |
US6879998B1 (en) * | 2000-06-01 | 2005-04-12 | Aerocast.Com, Inc. | Viewer object proxy |
US6904460B1 (en) * | 2000-06-01 | 2005-06-07 | Aerocast.Com, Inc. | Reverse content harvester |
US7213062B1 (en) | 2000-06-01 | 2007-05-01 | General Instrument Corporation | Self-publishing network directory |
US6772160B2 (en) * | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
US6741986B2 (en) * | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
US7577683B2 (en) | 2000-06-08 | 2009-08-18 | Ingenuity Systems, Inc. | Methods for the construction and maintenance of a knowledge representation system |
US6996768B1 (en) * | 2000-06-15 | 2006-02-07 | International Business Machines Corporation | Electric publishing system and method of operation generating web pages personalized to a user's optimum learning mode |
US6807568B1 (en) * | 2000-07-27 | 2004-10-19 | Union Beach, L.P. | Recipient selection of information to be subsequently delivered |
JP2002049562A (en) * | 2000-08-03 | 2002-02-15 | Nec Access Technica Ltd | Electronic mail service system |
US6684217B1 (en) * | 2000-11-21 | 2004-01-27 | Hewlett-Packard Development Company, L.P. | System and method for generating a profile from which a publication may be created |
US20040111386A1 (en) * | 2001-01-08 | 2004-06-10 | Goldberg Jonathan M. | Knowledge neighborhoods |
US20020103876A1 (en) * | 2001-01-29 | 2002-08-01 | Masayuki Chatani | System and computer-based method for providing transformed information in response to a client search request |
JP2002283301A (en) * | 2001-03-26 | 2002-10-03 | Makita Corp | Circular saw with improved corner cutting |
US6850934B2 (en) * | 2001-03-26 | 2005-02-01 | International Business Machines Corporation | Adaptive search engine query |
JPWO2002097691A1 (en) * | 2001-05-29 | 2004-09-16 | 富士通株式会社 | Information provision device |
JP2003196270A (en) * | 2001-12-27 | 2003-07-11 | Sharp Corp | Document information processing method, document information processor, communication system, computer program and recording medium |
US7356461B1 (en) * | 2002-01-14 | 2008-04-08 | Nstein Technologies Inc. | Text categorization method and apparatus |
WO2003067504A2 (en) | 2002-02-04 | 2003-08-14 | Ingenuity Systems, Inc. | Drug discovery methods |
US8793073B2 (en) | 2002-02-04 | 2014-07-29 | Ingenuity Systems, Inc. | Drug discovery methods |
JP4310068B2 (en) * | 2002-04-17 | 2009-08-05 | 株式会社日立製作所 | Document reading support method |
US9805373B1 (en) | 2002-11-19 | 2017-10-31 | Oracle International Corporation | Expertise services platform |
US7207004B1 (en) * | 2004-07-23 | 2007-04-17 | Harrity Paul A | Correction of misspelled words |
US20080033819A1 (en) * | 2006-07-28 | 2008-02-07 | Ingenuity Systems, Inc. | Genomics based targeted advertising |
US20100076965A1 (en) * | 2006-11-20 | 2010-03-25 | Access Co., Ltd. | Information display device, information display program and information display system |
US7945566B2 (en) * | 2007-08-10 | 2011-05-17 | Sap Ag | System and method of information filtering |
JP2010000632A (en) * | 2008-06-18 | 2010-01-07 | Canon Inc | Substrate for inkjet head, and inkjet head equipped with substrate |
JP5354981B2 (en) * | 2008-07-14 | 2013-11-27 | キヤノン株式会社 | Document management apparatus, document management method, and program |
US8407212B2 (en) | 2009-05-20 | 2013-03-26 | Genieo Innovation Ltd. | System and method for generation of a customized web page based on user identifiers |
US8504569B2 (en) * | 2009-05-20 | 2013-08-06 | Genieo Innovation Ltd. | Apparatus and methods for providing answers to queries respective of a user based on user uniquifiers |
US20100299691A1 (en) * | 2009-05-20 | 2010-11-25 | Genieo Innovation Ltd. | System and Method for Personalization of Television Content Provided by a Set-Top Box Based on a User's Context and Uniquifiers |
US20100299140A1 (en) * | 2009-05-22 | 2010-11-25 | Cycorp, Inc. | Identifying and routing of documents of potential interest to subscribers using interest determination rules |
WO2018011836A1 (en) | 2016-07-10 | 2018-01-18 | 横手健一 | Content distribution method and system |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2937521B2 (en) * | 1991-03-08 | 1999-08-23 | 株式会社東芝 | Document search device |
JP2937520B2 (en) * | 1991-03-08 | 1999-08-23 | 株式会社東芝 | Document search device |
JPH0612454A (en) * | 1992-06-26 | 1994-01-21 | Canon Inc | Method and device for document retrieval |
JP2944346B2 (en) * | 1993-01-20 | 1999-09-06 | シャープ株式会社 | Document summarization device |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
US5530852A (en) * | 1994-12-20 | 1996-06-25 | Sun Microsystems, Inc. | Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics |
US5699513A (en) * | 1995-03-31 | 1997-12-16 | Motorola, Inc. | Method for secure network access via message intercept |
US5907836A (en) * | 1995-07-31 | 1999-05-25 | Kabushiki Kaisha Toshiba | Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore |
US5649186A (en) * | 1995-08-07 | 1997-07-15 | Silicon Graphics Incorporated | System and method for a computer-based dynamic information clipping service |
US5867799A (en) * | 1996-04-04 | 1999-02-02 | Lang; Andrew K. | Information system and method for filtering a massive flow of information entities to meet user information classification needs |
-
1995
- 1995-12-14 JP JP32590795A patent/JP3612125B2/en not_active Expired - Fee Related
-
1996
- 1996-12-13 US US08/766,859 patent/US6052714A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6052714A (en) | 2000-04-18 |
JPH09167164A (en) | 1997-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3612125B2 (en) | Information filtering method and information filtering apparatus | |
KR101298334B1 (en) | Techniques for including collection items in search results | |
CN100535904C (en) | Method for searching on-line advertisement resource and device thereof | |
Hitchcock et al. | A Survey of STM Online Journals 1990-95: the Calm before the Storm: sixth | |
US7949660B2 (en) | Method and apparatus for searching and resource discovery in a distributed enterprise system | |
AU2010343183B2 (en) | Search suggestion clustering and presentation | |
JP5662961B2 (en) | Review processing method and system | |
US6546390B1 (en) | Method and apparatus for evaluating relevancy of messages to users | |
US7974975B2 (en) | Method and apparatus for distributing information to users | |
US8335719B1 (en) | Generating advertisement sets based on keywords extracted from data feeds | |
US20030014414A1 (en) | Personcast - customized end-user briefing | |
US6728932B1 (en) | Document clustering method and system | |
US20070078814A1 (en) | Novel information retrieval systems and methods | |
CN101458703A (en) | Resizing tag representations or tag group representations to control relative importance | |
JPH09101990A (en) | Information filtering device | |
US8782074B1 (en) | Method and system for identifying information relevant to content | |
US20080256067A1 (en) | File Search Engine and Computerized Method of Tagging Files with Vectors | |
CN101583945A (en) | Providing virtual really simple syndication (RSS) feeds | |
US8244710B2 (en) | Method and system for information retrieval using embedded links | |
CN102567423B (en) | Method and system for associated search of poetry | |
JP2003228585A (en) | Method of controlling file, and file controller capable of using the method | |
US20090063506A1 (en) | Method and apparatus for generating recommendation content list | |
CN101894146A (en) | Method and system for realizing advertising function by using created text edit box | |
JP2001312509A (en) | System and recording medium for distributing electronic data | |
JP2008009729A (en) | Content distribution method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041019 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041022 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081029 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081029 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091029 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101029 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111029 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |