JPH09167164A - 情報フィルタリング方法および情報フィルタリング装置 - Google Patents

情報フィルタリング方法および情報フィルタリング装置

Info

Publication number
JPH09167164A
JPH09167164A JP7325907A JP32590795A JPH09167164A JP H09167164 A JPH09167164 A JP H09167164A JP 7325907 A JP7325907 A JP 7325907A JP 32590795 A JP32590795 A JP 32590795A JP H09167164 A JPH09167164 A JP H09167164A
Authority
JP
Japan
Prior art keywords
user
article
articles
information
abstract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7325907A
Other languages
English (en)
Other versions
JP3612125B2 (ja
Inventor
Seiji Miike
誠司 三池
Masahiro Kajiura
正浩 梶浦
Tetsuya Sakai
哲也 酒井
Kenji Ono
顕司 小野
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP32590795A priority Critical patent/JP3612125B2/ja
Priority to US08/766,859 priority patent/US6052714A/en
Publication of JPH09167164A publication Critical patent/JPH09167164A/ja
Application granted granted Critical
Publication of JP3612125B2 publication Critical patent/JP3612125B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【課題】情報フィルタリングにより検索された記事につ
いて、ユーザが必要とする情報を含んだ抄録の作成が容
易に行える情報フィルタリング方法および情報フィルタ
リング装置を提供する。 【解決手段】ユーザプロファイル格納部50に格納され
ている各ユーザ毎のプロファイルは、ユーザの回答に基
づいて常に修正・調整され、このプロファイルを用いて
記事検索部52で記事格納庫51に格納された記事との
類似度を算出してユーザが所望する情報を含んだ記事の
検索を行い、さらに、この検索された記事について、抄
録生成部100で同じくプロファイルを用いて類似度を
算出することにより抄録を生成することにより、ユーザ
が必要とする情報を含んだ抄録の作成が容易に行える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、膨大なテキスト
記事からユーザの要求・興味にあったものを検索して定
期的にユーザに提供する情報フィルタリング方法および
情報フィルタリング装置。
【0002】
【従来の技術】近年、ワードプロセッサーや電子計算機
の普及、インターネットなどの計算機ネットワークを介
した電子メールや電子ニュースの普及に伴い、文書の電
子化は加速的に進みつつある。
【0003】電子出版という言葉が示すように、今後は
新聞、雑誌や本の情報も電子的に提供されることが一般
的になると考えられる。これにより、個人にとってリア
ルタイムで入手可能となるテキスト情報の量は膨大にな
っていくと予測される。
【0004】これに伴い、新聞や雑誌などの膨大なテキ
スト記事からユーザの要求・興味にあったものを選出し
て定期的にユーザに提供する情報フィルタリングシステ
ムあるいは情報フィルタリングサービスの需要が高まり
つつある。
【0005】一方、大量の情報をコンパクトにするとい
う観点から、文書の抄録を作成する方法についても、従
来から研究が行なわれてきた。従来は、最初の段落のみ
を抽出する方法や予め登録しておいたキーワードを用い
てキーワードを含む文のみを抽出する方法などがとられ
てきた。
【0006】
【発明が解決しようとする課題】しかしながら、最初の
段落のみを抽出する方法では、必ずしもそこにユーザが
必要とする情報が含まれているとは限らず、適切な方法
ではなかった。また、キーワードを含む文を並べただけ
では、それらの文のつながりがわからないという問題が
あった。
【0007】また、一旦登録したキーワードは、ユーザ
が変更しなければ追加や修正が行なわれず、これをユー
ザが行なうことは面倒な作業であった。そこで、本発明
は、上記問題点に鑑みてなされたものであり、情報フィ
ルタリングにより検索された記事について、ユーザへの
負担がなく、各ユーザの所望するテーマに合致する読み
やすい抄録を生成できる情報フィルタリング方法および
情報フィルタリング装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明の情報フィルタリ
ング方法は、複数の情報源からテキストやイメージなど
の記事の配信を受け、それら配信された記事の中から、
ユーザ毎に予め指定されたテーマに関する記事を検索し
てユーザに配信する情報フィルタリング方法において、
ユーザ毎に予め指定されたテーマに基づく検索情報を基
に、前記情報源から配信された記事からユーザが所望す
る記事を検索し、この検索された記事の抄録を前記検索
情報を基に生成し、この生成された抄録をユーザに配信
することにより、抄録を生成する際に、ユーザの興味や
関心に関する情報を格納したプロファイルを用いるの
で、ユーザそれぞれが必要とする情報を含んだ抄録を生
成することが可能になる。
【0009】また、本発明の情報フィルタリング方法
は、複数の情報源からテキストやイメージなどの記事の
配信を受け、それら配信された記事の中から、ユーザ毎
に予め指定されたテーマに関する記事を検索してユーザ
に配信する情報フィルタリング方法において、ユーザ毎
に予め指定されたテーマに基づく検索情報を基に、前記
情報源から配信された記事からユーザが所望する記事を
検索し、この検索された記事の特徴と前記検索情報を基
に前記検索された記事の抄録を生成し、この生成された
抄録をユーザに配信することにより、記事の特徴に応じ
て、当該文書に適切な抄録生成方法を用いて当該文書の
抄録を生成することができる。
【0010】また、本発明の情報フィルタリング装置
は、複数の情報源からテキストやイメージなどの記事の
配信を受け、それら配信された記事の中から、ユーザ毎
に予め指定されたテーマに関する記事を検索してユーザ
に配信する情報フィルタリング装置において、ユーザ毎
に予め指定されたテーマに基づく検索情報を基に、前記
情報源から配信された記事からユーザが所望する記事を
検索する検索手段と、前記検索情報を基に前記検索手段
で検索された記事の抄録を生成する抄録生成手段と、こ
の抄録生成手段で生成された抄録をユーザに配信する配
信手段とを具備することにより、抄録を生成する際に、
ユーザの興味や関心に関する情報を格納したプロファイ
ルを用いるので、ユーザそれぞれが必要とする情報を含
んだ抄録を生成することが可能になる。
【0011】さらに、本発明の情報フィルタリング装置
は、複数の情報源からテキストやイメージなどの記事の
配信を受け、それら配信された記事の中から、ユーザ毎
に予め指定されたテーマに関する記事を検索してユーザ
に配信する情報フィルタリング装置において、ユーザ毎
に予め指定されたテーマに基づく検索情報を基に、前記
情報源から配信された記事からユーザが所望する記事を
検索する検索手段と、この検索手段で検索された記事の
特徴に応じて、前記検索情報を基に前記検索手段で検索
された記事の抄録を生成する複数の抄録生成手段と、前
記検索手段で検索された記事の特徴を検出する特徴検出
手段と、この特徴検出手段で検出された記事の特徴に基
づき前記複数の抄録生成手段のうちの1つを選択する選
択手段と、この選択手段で選択された抄録生成手段で生
成された抄録をユーザに配信する配信手段とを具備する
ことにより、記事の特徴に応じて、当該文書に適切な抄
録生成方法を用いて当該文書の抄録を生成することがで
きる。
【0012】
【発明の実施の形態】本発明の一実施形態について図面
を参照して説明する。まず、図1を参照して、本発明の
情報フィルタリング装置を用いた情報フィルタリングシ
ステム全体の構成について説明する。
【0013】情報フィルタリングシステムは、新聞社、
通信社、または出版社などの複数の情報源2からテキス
ト記事の配信を受け、それを定期的に加入ユーザ端末3
それぞれに送信する情報提供システムであり、このシス
テムの情報提供サービスは情報フィルタリングセンタ1
によって実現されている。
【0014】情報フィルタリングセンタ1は、通信網を
介して複数の情報源2および複数の加入ユーザ端末3に
接続された1つの情報フィルタリング装置から構成さ
れ、ここには、情報フィルタリングのための制御や処理
を行う中央処理装置4、プログラム並びにデータを格納
する半導体メモリ、磁気ディスク、光ディスクなどの記
憶装置5、回線や電波などの通信網を介して情報源2か
らテキスト記事を受信する受信部6、回線や電波などの
通信網を介してユーザ端末3にテキスト記事を送信した
り、ユーザ端末3からの回答等を受信する送受信部7な
どから構成されている。
【0015】各ユーザ端末3は、例えばパーソナルコン
ピュータやワークステーションなどの情報処理端末であ
り、情報フィルタリングセンタ1から送信されたテキス
ト記事を受信したり、情報フィルタリングセンタ1にテ
キストデータを送信するテキスト情報送受信部8と、受
信したテキスト記事を画面表示する表示部9などを備え
ている。
【0016】情報フィルタリングセンタ1は、図2に示
されているように、ユーザプロファイル10と称する一
種の検索条件をユーザ毎に保持しており、そのユーザプ
ロファイル10に従って該当するユーザに提供すベき記
事を検索する。ユーザプロファイル10は、ユーザによ
って指定された複数のテーマ(トピック)などを基に構
成されており、それらテーマに合致する記事が検索およ
び選出されてユーザに送られる。
【0017】次に、図3を参照して情報フィルタリング
センタ1の構成について説明する。図3において、ユー
ザプロファイル格納部50には、記事を検索するための
検索条件に対応するプロファイルが格納されている。こ
こで、プロファイルの記憶形式とその具体例について図
4を参照して説明する。図4(a)に示すように、プロ
ファイルには、利用者がほしいと思う記事に含まれると
考えられる単語とその重みが記述されている。具体的に
は、図4(b)に示すように、各ユーザ毎に複数の単語
とその重みが記憶されている。なお、プロファイル作成
の方法は本発明の主眼ではなく、例えば、人が利用者か
らどのような記事がほしいかを聞き、該当する記事に含
まれると思われる単語を列挙する方法でもよい。
【0018】記事格納部51には、情報源2から配信さ
れ、受信部6で受信された記事が格納される。ここで、
記事格納部51に格納されている記事データの記憶形式
とその具体例について図5を参照して説明する。
【0019】図5(a)および(b)に示すように、記
事データは、センタ1が管理する全ての記事についてそ
の記事を識別するための記事ID(例えば、「00
1」、「002」、「003」…)、記事の発行元(例
えば、「A新聞社」、「B新聞社」、「C出版社」
…)、記事の見出し(例えば、「マルチメディアパソコ
ン発売」、「半導体売行き好調」…)、およびその記事
の本文の格納位置を示す記事格納部51に対するポイン
タ(例えば、123456、123457、12345
8)から構成されて、記事格納部51に記憶されてい
る。
【0020】記事検索部52は、ユーザプロファイル格
納部50に記憶されているユーザプロファイルを用い
て、記事格納部51に格納されている記事を検索する。
ここでの検索方法としては、例えば「SMART情報検
索システム」(ジェラルド・サルトン編、神保健二監
訳、企画センター)に記載されている公知の方法を用い
ることができる。すなわち、この方法(ベクトル空間
法)よれば、たとえば、プロファイルに記憶されている
各単語のベクトル空間を仮定し、このベクトル空間上に
おいて各単語の重みベクトルと検索対象の記事における
対応する単語の出現回数ベクトルとの内積を求めること
によりプロファイルに対する類似度を算出し、この類似
度の大きい順にランク付けされ、検索された記事を並べ
て出力することが可能である。
【0021】図6に記事検索部52から出力される検索
結果の具体例を示す。図6には、あるユーザプロファイ
ルに対して4件の記事が検索された場合について示して
いる。すなわち、ユーザプロファイルのIDとともに、
算出された類似度に基づく記事のランク(例えば、
「1」、「2」、「3」、「4」)と記事IDから構成
される検索結果が、検索結果格納部53に格納される。
【0022】従来のフィルタリングシステムでは、検索
結果格納部53に格納された結果と、記事格納部51に
格納された記事データから、最終的に利用者へ送るフィ
ルタリング結果が作成されて、検索結果格納部53の所
定の記憶領域に記憶されるようになっている。
【0023】図7は、利用者へ送られる従来のフィルタ
リング結果の具体例を示したもので、記事のランク、記
事の見出し、その記事の本文などから構成されている。
抄録生成部100は、検索結果格納部53に格納された
フィルタリング結果について、フィルタリング結果に含
まれる記事の抄録を生成するものである。抄録生成部1
00は、図3に示すように、抄録生成制御部101、記
事特徴検出部102、および複数(ここでは、例えば3
つ)の生成部103−1、103−2、103−3から
構成される。
【0024】記事特徴検出部102は、記事検索部52
で検索された記事から、例えば、記事の文字数、段落数
といった記事の特徴を検出するようになっている。第1
の作成部103−1、第2の作成部103−2、第3の
作成部103−3は、それぞれ記事特徴検出部102で
検出された記事の特徴に適した抄録を生成するようにな
っている。
【0025】抄録生成制御部101は、抄録生成部10
0全体の制御を司るものである。次に、図8に示すフロ
ーチャートを参照して、抄録生成制御部101の処理動
作について説明する。
【0026】抄録生成制御部101は、例えば、記事の
ランク(n)が高い順に検索結果格納部53に格納され
ているフィルタリング結果を取り出し(ステップS1〜
ステップS3)、当該のフィルタリング結果の記事ID
について、順に以下の処理を行なう。まず、記事IDを
記事特徴検出部102へ渡し、記事特徴検出部102か
ら選択すべき生成部の番号(この場合、「1」(第1の
生成部103−1)、「2」(第2の生成部103−
2)、「3」(第3の生成部103−3)のいずれか)
を受け取る(ステップS4〜ステップS5)。
【0027】次に、当該の番号の生成部へ、記事IDと
ユーザプロファイルのIDを渡す(ステップS6)。そ
して、当該の生成部で生成された抄録を受け取り(ステ
ップS7)、当該の記事について、図6に示したような
検索結果格納部53に格納されたフィルタリング結果に
含まれる記事のランク、記事IDにより記事格納部51
から取り出した記事見出し、および、当該記事の抄録が
検索結果格納部53の所定の記憶領域に記憶され、最終
的に利用者へ配信するフィルタリング結果が生成され
る。
【0028】次に、図9に示すフローチャートを参照し
て記事特徴検出部102の処理動作について説明する。
記事特徴検出部102は、抄録生成制御部101から渡
された記事IDを用いて、記事格納部51から、記事本
文へのポインタをたどって、記事本文を取り出す(ステ
ップS10)。次に、取り出した記事本文の文字数と段
落数をカウントする(ステップS11)。段落は、行の
先頭が空白文字であることを検出して、段落の始まりで
あるとすることができる。さらに、予め格納されている
抄録生成条件テーブルを参照しながら処理を進める。
【0029】図10に、記事特徴検出部102に記憶さ
れている抄録生成条件テーブルの形式(図10(a))
とその具体例(図10(b))を示す。抄録生成条件テ
ーブルは、複数の生成部を識別するID番号(例えば、
「1」、「2」、「3」)と、その生成部にて適用され
る記事の文字数の最大値(例えば、「400」、「80
0」、「10000」)および段落数の最大値(例え
ば、「5」、「10」、「100」)が格納されてい
る。
【0030】さて、記事特徴検出部102は、図10に
示したような抄録生成条件テーブルの最初の行に示され
ているID番号「1」の第1の生成部103−1の文字
数および段落数を取り出し、当該の記事本文の文字数お
よび段落数と比較する(ステップS12)。当該の記事
本文の文字数と段落数の両方が、抄録作成部1のそれぞ
れの値より小さい場合には「1」を返して終了する(ス
テップS13)。
【0031】もし、この条件に合わない場合には、抄録
生成条件テーブルの次の行、すなわち、ID番号「2」
の第2の生成部103−2の文字数および段落数を取り
出して同様の処理を行ない、条件に合う場合には「2」
を返して終了する(ステップS14〜ステップS1
5)。さらに、この条件に合わない場合には第3の生成
部103−3のID番号「3」を返して終了する(ステ
ップS16)。
【0032】抄録生成制御部101は、記事特徴検出部
102から返された数字に対応して、第1〜第3の生成
部のうちの1つを選択し、選択した生成部へ記事IDと
ユーザプロファイルを渡す。
【0033】次に、第1〜第3の生成部(103−1〜
103−3)の処理動作について説明する。まず、第1
の生成部103−1の処理動作について説明する。第1
の生成部103−1は、抄録生成制御部101から渡さ
れた記事IDを用いて、記事格納部51から記事の最初
の段落を取り出す。文字数や段落数が少ない記事では、
第1段落に主な情報が書かれていることが多いので、記
事格納部51から取り出された記事の第1段落を取り出
す処理を行なっている。
【0034】次に、第2の生成部103−2の処理動作
について図11に示すフローチャートを参照して説明す
る。第2の生成部103−2は、まず、抄録生成制御部
101から渡された記事IDを用いて、記事格納部51
から記事の本文を取り出し格納し(ステップS20)、
その本文について各段落の類似度を算出する(ステップ
S21)。
【0035】ここで、段落類似度の算出処理動作につい
て、図12に示すフローチャートを参照して説明する。
まず、記事格納部51から取り出された記事本文の第1
段落から順に、ひとつずつ段落を取り出し(ステップS
30〜ステップS33)、ユーザプロファイルのIDを
用いてユーザプロファイル格納部50から所望のユーザ
プロファイルを取り出して、このユーザプロファイルを
用いて段落の類似度を算出し(ステップS34)、その
結果を蓄えていく(ステップS35)。
【0036】段落の類似度の算出は、前述の記事検索部
52が記事全体を対象として行なう類似度の算出処理
(ベクトル空間法)を、段落を対象にして行なうことに
よって実現できる。
【0037】全ての段落について類似度を算出してその
結果が蓄えられたら(ステップS36、ステップS3
1)、最後に、蓄えた結果を段落の類似度の順に並べ換
える(ステップS32)。なお、この段落類似度の算出
結果は、第2の生成部103−2に割り当てられた検索
結果格納部53の所定の記憶領域に、例えば、図13に
示すように記憶される。図13(a)に示すように、段
落類似度の算出結果は、段落の番号、段落の類似度、段
落の内容から構成されていて、段落の類似度が高いもの
から順に並んでいる(図13(b))。
【0038】図11の説明にもどり、第2の生成部10
3−2は、図13に示したような段落類似度算出結果を
基に、最も類似度が高かった段落の番号を取り出す(ス
テップS22)。もし、当該の段落の番号が「1」であ
る場合には、第1段落のみを抄録生成制御部101へ返
す(ステップS23、ステップS25)。そうでないな
い場合には、格納しておいた第1段落と、最も類似度が
高かった段落の両方を、抄録生成制御部101へ返す
(ステップS23、ステップS24)。
【0039】このように、第2の生成部103−2で
は、主な情報が書かれている第1段落と、利用者の関心
が高い(類似度の最も高い)段落の両方を取り出す処理
を行なっている。これは、例えば、国や地方自治体の予
算に関する記事では、予算全体に関する情報が最初の段
落に書かれ、予算の個々の細目については、第2段落以
降の段落に分けて書かれるので、ある利用者がマルチメ
ディアに関心がある場合、プロファイルを用いることに
よって、マルチメディアに関する予算の割当などについ
て書かれた段落を取り出すことができ、第1段落ととも
に利用者へ送られることになる。従って、利用者は、第
1段落により、記事の全体の情報を得るとともに、自分
の関心がある情報についても知ることができる。
【0040】なお、第1段落の他には、最も類似度の高
い段落だけでなく、最も類似度の高い段落から複数の段
落を選ぶようにすることは容易に実現できる。次に、第
3の生成部103−3の処理動作について図14に示す
フローチャートを参照して説明する。
【0041】第3の生成部103−3は、抄録生成制御
部101から受け取った記事IDを用いて、記事格納部
51から記事本文を取り出し(ステップS40)、図1
2に示したユーザプロファイルを用いた段落類似度算出
処理を行って、全ての段落の類似度を算出し、第3の生
成部103−2に割り当てられた検索結果格納部53の
所定の記憶領域に、例えば、図13に示すように記憶さ
れる(ステップS41)。
【0042】その結果をもとに、次に、例えば、段落の
総数を3で割った値(整数)の数だけ、類似度の最も大
きい段落から順に取り出す。段落の総数を「3」で割っ
た値を用いることにより、約1/3の長さの抄録を生成
することができる(ステップS42)。例えば、記事の
全体が14の段落からなる場合には、類似度の最も高い
段落から4つの段落が取り出されることになる。このよ
うに第3の生成部103−3は、雑誌の記事のように、
記事全体の長さが長い場合に、利用者が関心のある情報
が含まれると考えられる段落を取り出して抄録を作成す
る処理を行なっている。
【0043】なお、段落の総数を割る値は「3」に限る
ものではなく、他の値でもよい。また、利用者が予め指
定した値を設定するようにすることも容易に実現でき
る。以上の第1〜第3の生成部103−1〜103−3
のいづれかの生成部で生成された抄録を抄録生成制御部
101が受け取り(図8のステップS7)、当該の記事
についての記事ランク、記事見出し、および、当該記事
の抄録等が、検索結果格納部53の所定の記憶領域に記
憶され、最終的に各ユーザへ配信されるフィルタリング
結果が生成される。
【0044】図15に抄録生成部100で生成されたフ
ィルタリング結果の具体例を示す。図15に示すよう
に、フィルタリング結果は、記事のランク、記事の見出
し、記事の全文から一部の段落を取り出して作成した抄
録から構成されている。
【0045】このような構成で検索結果格納部53に記
憶されたフィルタリング結果は、テキスト情報送受信部
7および所定の通信網を介して、例えば、電子メールや
FAXで利用者へ送られる。利用者は、送られてきた記
事を読み、自分にとって関心がある記事であるかどうか
の観点で「○」や「×」を付けて情報フィルタリングセ
ンタ1へ送り返すことができる。すなわち、ユーザ端末
から所定の通信網およびテキスト情報送受信部7を介し
て送り返されてきた回答は、ユーザ回答格納部60へ格
納される。
【0046】図16にユーザ回答格納部60に格納され
たユーザの回答データの具体例を示す。利用者は、関心
のあった記事に「○」、関心のなかった記事に「×」、
どちらでもない記事はそのままとしている。ユーザの回
答は、さらにユーザが必要とする記事を選択できるよう
に、プロファイルを修正するために利用される。
【0047】プロファイル修正部61は、図16に示し
たようなユーザの回答と、ユーザ回答中の記事IDを用
いて記事格納部51から取り出した記事本文とから、ユ
ーザプロファイル格納部50に格納されているユーザプ
ロファイルを修正する。プロファイルを修正する方法
は、例えば、「SMART情報検索システム」(ジェラ
ルド・サルトン編、神保健二監訳、企画センター)に記
載されている方法が適用できよう。すなわち、この方法
は、ユーザが関心のあった記事の中から単語の出現頻度
を計数して、その計数値が最も大きい単語をユーザプロ
ファイルに新たに追加するというものである。
【0048】以上説明したように、上記実施形態によれ
ば、ユーザプロファイル格納部50に格納されている各
ユーザ毎のプロファイルは、ユーザの回答に基づいて常
に修正・調整され、このプロファイルを用いて記事検索
部52で記事格納庫51に格納された記事との類似度を
算出してユーザが所望する情報を含んだ記事の検索を行
い、さらに、この検索された記事について、抄録生成部
100で同じくプロファイルを用いて類似度を算出する
ことにより抄録を生成することにより、ユーザが必要と
する情報を含んだ抄録の作成が容易に行える。
【0049】また、抄録生成部100で検索された記事
の抄録を生成する際、まず、記事特徴検出部102で、
その記事の特徴、具体的には、例えば、文字数、段落数
を求めて、第1〜第3の生成部103−1〜103−3
のうちの1つを選択して、その記事の特徴に適した抄録
生成方法を選択することにより、ユーザが必要とする情
報を含んだ抄録の作成が容易に行える。
【0050】さらに、このようにして生成された抄録を
各ユーザに配信することにより、情報フィルタリングに
より検索されて配信された記事内容から各利用者が情報
を得るための時間を短縮し、労力を軽減することができ
る。
【0051】
【発明の効果】以上説明したように、本発明によれば、
情報フィルタリングにより検索された記事について、ユ
ーザが必要とする情報を含んだ抄録の作成が容易に行え
る情報フィルタリング方法および情報フィルタリング装
置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る情報フィルタリング
装置のシステム全体の構成を示すブロック図。
【図2】図1のシステムの運用形態を概念的に示す図。
【図3】情報フィルタリング装置の構成を示したブロッ
ク図。
【図4】ユーザプロファイルの記憶形式とその具体例に
ついて説明するための図。
【図5】記事格納部に格納される記事データの記憶形式
とその具体例について説明するための図。
【図6】記事検索部から出力され、検索結果格納部に格
納される検索結果の記憶形式とその具体例について説明
するための図。
【図7】従来のフィルタリング装置の出力形態の具体例
を示した図。
【図8】抄録生成制御部の処理動作を説明するためのフ
ローチャート。
【図9】抄録生成部の記事特徴検出部の処理動作を説明
するためのフローチャート。
【図10】記事特徴検出部が参照する抄録生成条件テー
ブルの記憶形式とその具体例について説明するための
図。
【図11】抄録生成部の第2の生成部の処理動作を説明
するためのフローチャート。
【図12】段落類似度算出処理について説明するための
フローチャート。
【図13】段落類似度の算出結果の記憶形式とその具体
例について説明するための図。
【図14】抄録生成部の第3の生成部の処理動作につい
て説明するためのフローチャート。
【図15】抄録生成部で生成された抄録に基づき生成さ
れて検索結果格納部に格納され各ユーザに配信される情
報フィルタリング結果の具体例を示した図。
【図16】ユーザ回答格納部に格納されたユーザの回答
データの具体例を示した図。
【符号の説明】
1…情報フィルタリングセンタ、2…情報源、3…ユー
ザ端末、4…中央処理部、5…記憶部、6…テキスト情
報受信部、7…テキスト情報送受信部、50…ユーザプ
ロファイル格納部、51…記事格納部、52…記事検索
部、53…検索結果格納部、60…ユーザ回答格納部、
61…プロファイル修正部、100…抄録生成部、10
1…抄録生成制御部、102…記事特徴検出部、103
−1…第1の生成部、103−2…第2の生成部、10
3−3…第3の生成部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小野 顕司 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 住田 一男 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数の情報源からテキストやイメージな
    どの記事の配信を受け、それら配信された記事の中か
    ら、ユーザ毎に予め指定されたテーマに関する記事を検
    索してユーザに配信する情報フィルタリング方法におい
    て、 ユーザ毎に予め指定されたテーマに基づく検索情報を基
    に、前記情報源から配信された記事からユーザが所望す
    る記事を検索し、この検索された記事の抄録を前記検索
    情報を基に生成し、この生成された抄録をユーザに配信
    することを特徴とする情報フィルタリング方法。
  2. 【請求項2】 複数の情報源からテキストやイメージな
    どの記事の配信を受け、それら配信された記事の中か
    ら、ユーザ毎に予め指定されたテーマに関する記事を検
    索してユーザに配信する情報フィルタリング方法におい
    て、 ユーザ毎に予め指定されたテーマに基づく検索情報を基
    に、前記情報源から配信された記事からユーザが所望す
    る記事を検索し、この検索された記事の特徴と前記検索
    情報を基に前記検索された記事の抄録を生成し、この生
    成された抄録をユーザに配信することを特徴とする情報
    フィルタリング方法。
  3. 【請求項3】 複数の情報源からテキストやイメージな
    どの記事の配信を受け、それら配信された記事の中か
    ら、ユーザ毎に予め指定されたテーマに関する記事を検
    索してユーザに配信する情報フィルタリング装置におい
    て、 ユーザ毎に予め指定されたテーマに基づく検索情報を基
    に、前記情報源から配信された記事からユーザが所望す
    る記事を検索する検索手段と、 前記検索情報を基に前記検索手段で検索された記事の抄
    録を生成する抄録生成手段と、 この抄録生成手段で生成された抄録をユーザに配信する
    配信手段と、 を具備したことを特徴とする情報フィルタリング装置。
  4. 【請求項4】 複数の情報源からテキストやイメージな
    どの記事の配信を受け、それら配信された記事の中か
    ら、ユーザ毎に予め指定されたテーマに関する記事を検
    索してユーザに配信する情報フィルタリング装置におい
    て、 ユーザ毎に予め指定されたテーマに基づく検索情報を基
    に、前記情報源から配信された記事からユーザが所望す
    る記事を検索する検索手段と、 この検索手段で検索された記事の特徴に応じて、前記検
    索情報を基に前記検索された記事の抄録を生成する複数
    の抄録生成手段と、 前記検索手段で検索された記事の特徴を検出する特徴検
    出手段と、 この特徴検出手段で検出された記事の特徴に基づき前記
    複数の抄録生成手段のうちの1つを選択する選択手段
    と、 この選択手段で選択された抄録生成手段で生成された抄
    録をユーザに配信する配信手段と、 を具備したことを特徴とする情報フィルタリング装置。
JP32590795A 1995-12-14 1995-12-14 情報フィルタリング方法および情報フィルタリング装置 Expired - Fee Related JP3612125B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP32590795A JP3612125B2 (ja) 1995-12-14 1995-12-14 情報フィルタリング方法および情報フィルタリング装置
US08/766,859 US6052714A (en) 1995-12-14 1996-12-13 Information filtering apparatus and method for retrieving a selected article from information sources

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32590795A JP3612125B2 (ja) 1995-12-14 1995-12-14 情報フィルタリング方法および情報フィルタリング装置

Publications (2)

Publication Number Publication Date
JPH09167164A true JPH09167164A (ja) 1997-06-24
JP3612125B2 JP3612125B2 (ja) 2005-01-19

Family

ID=18181933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32590795A Expired - Fee Related JP3612125B2 (ja) 1995-12-14 1995-12-14 情報フィルタリング方法および情報フィルタリング装置

Country Status (2)

Country Link
US (1) US6052714A (ja)
JP (1) JP3612125B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319768A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 要点抽出方法
JP2000020678A (ja) * 1998-06-26 2000-01-21 Hitachi Software Eng Co Ltd 仮想地理空間オブジェクト生成システム及び記録媒体
JP2000067067A (ja) * 1998-08-20 2000-03-03 Sky Com:Kk 配信サーバ及び配信システム
JP2000242654A (ja) * 1999-02-18 2000-09-08 Just Syst Corp 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001034625A (ja) * 1999-07-19 2001-02-09 Nippon Telegr & Teleph Corp <Ntt> 文献情報提供方法、文献情報提供装置及び文献情報提供プログラムを記録した記録媒体
JP2003308318A (ja) * 2002-04-17 2003-10-31 Hitachi Ltd 文書読解支援方法
WO2008062552A1 (fr) * 2006-11-20 2008-05-29 Access Co., Ltd. Dispositif d'affichage d'informations, programme d'affichage d'informations, et système d'affichage d'informations
JP2010020703A (ja) * 2008-07-14 2010-01-28 Canon Inc 文書管理装置、文書管理方法及びプログラム
US11036815B2 (en) 2016-07-10 2021-06-15 Ken-ichi YOKOTE Distribution method and system for content

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3270351B2 (ja) 1997-01-31 2002-04-02 株式会社東芝 電子化文書処理装置
US7236969B1 (en) 1999-07-08 2007-06-26 Nortel Networks Limited Associative search engine
JP4198786B2 (ja) * 1998-06-30 2008-12-17 株式会社東芝 情報フィルタリングシステム、情報フィルタリング装置、映像機器および情報フィルタリング方法
US6229524B1 (en) * 1998-07-17 2001-05-08 International Business Machines Corporation User interface for interaction with video
WO2000017784A1 (en) 1998-09-18 2000-03-30 Tacit Knowledge Systems Method of constructing and displaying an entity profile constructed utilizing input from entities other than the owner
US6377949B1 (en) 1998-09-18 2002-04-23 Tacit Knowledge Systems, Inc. Method and apparatus for assigning a confidence level to a term within a user knowledge profile
US6115709A (en) 1998-09-18 2000-09-05 Tacit Knowledge Systems, Inc. Method and system for constructing a knowledge profile of a user having unrestricted and restricted access portions according to respective levels of confidence of content of the portions
US8380875B1 (en) 1998-09-18 2013-02-19 Oracle International Corporation Method and system for addressing a communication document for transmission over a network based on the content thereof
WO2000017727A2 (en) 1998-09-18 2000-03-30 Tacit Knowledge Systems Method and apparatus for querying a user knowledge profile
US6253202B1 (en) * 1998-09-18 2001-06-26 Tacit Knowledge Systems, Inc. Method, system and apparatus for authorizing access by a first user to a knowledge profile of a second user responsive to an access request from the first user
US6154783A (en) 1998-09-18 2000-11-28 Tacit Knowledge Systems Method and apparatus for addressing an electronic document for transmission over a network
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6393417B1 (en) * 1999-10-15 2002-05-21 De Le Fevre Patrick Y. Method for providing a rapid internet search
US6546387B1 (en) * 1999-11-15 2003-04-08 Transcom Software Inc. Computer network information management system and method using intelligent software agents
US7213062B1 (en) 2000-06-01 2007-05-01 General Instrument Corporation Self-publishing network directory
US6879998B1 (en) * 2000-06-01 2005-04-12 Aerocast.Com, Inc. Viewer object proxy
US6904460B1 (en) * 2000-06-01 2005-06-07 Aerocast.Com, Inc. Reverse content harvester
US7577683B2 (en) * 2000-06-08 2009-08-18 Ingenuity Systems, Inc. Methods for the construction and maintenance of a knowledge representation system
US6772160B2 (en) * 2000-06-08 2004-08-03 Ingenuity Systems, Inc. Techniques for facilitating information acquisition and storage
US6741986B2 (en) 2000-12-08 2004-05-25 Ingenuity Systems, Inc. Method and system for performing information extraction and quality control for a knowledgebase
US6996768B1 (en) * 2000-06-15 2006-02-07 International Business Machines Corporation Electric publishing system and method of operation generating web pages personalized to a user's optimum learning mode
US6807568B1 (en) * 2000-07-27 2004-10-19 Union Beach, L.P. Recipient selection of information to be subsequently delivered
JP2002049562A (ja) * 2000-08-03 2002-02-15 Nec Access Technica Ltd 電子メールサービスシステム
US6684217B1 (en) * 2000-11-21 2004-01-27 Hewlett-Packard Development Company, L.P. System and method for generating a profile from which a publication may be created
US20040111386A1 (en) * 2001-01-08 2004-06-10 Goldberg Jonathan M. Knowledge neighborhoods
US20020103876A1 (en) * 2001-01-29 2002-08-01 Masayuki Chatani System and computer-based method for providing transformed information in response to a client search request
US6850934B2 (en) * 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
JP2002283301A (ja) * 2001-03-26 2002-10-03 Makita Corp 際切りマルノコ
JPWO2002097691A1 (ja) * 2001-05-29 2004-09-16 富士通株式会社 情報提供装置
JP2003196270A (ja) * 2001-12-27 2003-07-11 Sharp Corp 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
US7356461B1 (en) * 2002-01-14 2008-04-08 Nstein Technologies Inc. Text categorization method and apparatus
US8793073B2 (en) 2002-02-04 2014-07-29 Ingenuity Systems, Inc. Drug discovery methods
EP1490822A2 (en) 2002-02-04 2004-12-29 Ingenuity Systems Inc. Drug discovery methods
US9805373B1 (en) 2002-11-19 2017-10-31 Oracle International Corporation Expertise services platform
US7207004B1 (en) * 2004-07-23 2007-04-17 Harrity Paul A Correction of misspelled words
WO2008014495A2 (en) * 2006-07-28 2008-01-31 Ingenuity Systems, Inc. Genomics based targeted advertising
US7945566B2 (en) * 2007-08-10 2011-05-17 Sap Ag System and method of information filtering
JP2010000632A (ja) * 2008-06-18 2010-01-07 Canon Inc インクジェットヘッド用基板および該基板を具えるインクジェットヘッド
US20100299691A1 (en) * 2009-05-20 2010-11-25 Genieo Innovation Ltd. System and Method for Personalization of Television Content Provided by a Set-Top Box Based on a User's Context and Uniquifiers
US8504569B2 (en) * 2009-05-20 2013-08-06 Genieo Innovation Ltd. Apparatus and methods for providing answers to queries respective of a user based on user uniquifiers
US8407212B2 (en) * 2009-05-20 2013-03-26 Genieo Innovation Ltd. System and method for generation of a customized web page based on user identifiers
US20100299140A1 (en) * 2009-05-22 2010-11-25 Cycorp, Inc. Identifying and routing of documents of potential interest to subscribers using interest determination rules

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281566A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH04281559A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH0612454A (ja) * 1992-06-26 1994-01-21 Canon Inc 文書検索方法及び装置
JPH06215049A (ja) * 1993-01-20 1994-08-05 Sharp Corp 文書要約装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5530852A (en) * 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
US5699513A (en) * 1995-03-31 1997-12-16 Motorola, Inc. Method for secure network access via message intercept
US5907836A (en) * 1995-07-31 1999-05-25 Kabushiki Kaisha Toshiba Information filtering apparatus for selecting predetermined article from plural articles to present selected article to user, and method therefore
US5649186A (en) * 1995-08-07 1997-07-15 Silicon Graphics Incorporated System and method for a computer-based dynamic information clipping service
US5867799A (en) * 1996-04-04 1999-02-02 Lang; Andrew K. Information system and method for filtering a massive flow of information entities to meet user information classification needs

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281566A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH04281559A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH0612454A (ja) * 1992-06-26 1994-01-21 Canon Inc 文書検索方法及び装置
JPH06215049A (ja) * 1993-01-20 1994-08-05 Sharp Corp 文書要約装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319768A (ja) * 1996-05-29 1997-12-12 Oki Electric Ind Co Ltd 要点抽出方法
JP2000020678A (ja) * 1998-06-26 2000-01-21 Hitachi Software Eng Co Ltd 仮想地理空間オブジェクト生成システム及び記録媒体
JP2000067067A (ja) * 1998-08-20 2000-03-03 Sky Com:Kk 配信サーバ及び配信システム
JP2000242654A (ja) * 1999-02-18 2000-09-08 Just Syst Corp 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001034625A (ja) * 1999-07-19 2001-02-09 Nippon Telegr & Teleph Corp <Ntt> 文献情報提供方法、文献情報提供装置及び文献情報提供プログラムを記録した記録媒体
JP2003308318A (ja) * 2002-04-17 2003-10-31 Hitachi Ltd 文書読解支援方法
WO2008062552A1 (fr) * 2006-11-20 2008-05-29 Access Co., Ltd. Dispositif d'affichage d'informations, programme d'affichage d'informations, et système d'affichage d'informations
JP5160442B2 (ja) * 2006-11-20 2013-03-13 株式会社Access 情報表示装置、情報表示プログラムおよび情報表示システム
JP2010020703A (ja) * 2008-07-14 2010-01-28 Canon Inc 文書管理装置、文書管理方法及びプログラム
US11036815B2 (en) 2016-07-10 2021-06-15 Ken-ichi YOKOTE Distribution method and system for content

Also Published As

Publication number Publication date
US6052714A (en) 2000-04-18
JP3612125B2 (ja) 2005-01-19

Similar Documents

Publication Publication Date Title
JPH09167164A (ja) 情報フィルタリング方法および情報フィルタリング装置
US6754873B1 (en) Techniques for finding related hyperlinked documents using link-based analysis
CN1761963B (zh) 标识相关信息指定内容和/或呈现与内容相关广告有关的相关信息
JP5662961B2 (ja) レビュー処理方法およびシステム
US8843479B1 (en) Methods and apparatus for ranking documents
US9087129B2 (en) Methods, systems, and software for automated growth of intelligent on-line communities
US6044376A (en) Content stream analysis
US6366956B1 (en) Relevance access of Internet information services
US6804659B1 (en) Content based web advertising
CN100535904C (zh) 检索在线广告资源的方法和装置
US8311875B1 (en) Content item location arrangement
US20020161838A1 (en) Method and apparatus for targeting information
KR20060135929A (ko) 이메일을 이용한 콘텐트 타켓 광고들의 렌더링
US20050216823A1 (en) Assigning textual ads based on article history
US20040243565A1 (en) Methods and systems for understanding a meaning of a knowledge item using information associated with the knowledge item
US8782074B1 (en) Method and system for identifying information relevant to content
CN101583945A (zh) 提供虚拟的真正简单聚合(rss)订阅源
EP0756420A3 (en) Information provider apparatus enabling selective playing of multimedia information by interactive input based on displayed hypertext information
JP2002108924A (ja) 情報選択装置とその方法および情報提供装置
US20020046203A1 (en) Method and apparatus for providing ratings of web sites over the internet
KR20050050016A (ko) 온라인 광고 시스템 및 방법
US20030115200A1 (en) Wireless application protocol for real estate data access
JPH11296461A (ja) ユーザ間情報交換システム及び方法、ユーザ端末、サーバ計算機、並びに、ユーザ間情報交換プログラムを記録した記録媒体
JP2005515521A (ja) インテリジェント・オンライン・コミュニティの自動化成長方法、システム及びソフトウェア
JPH11282874A (ja) 情報フィルタリング方法および装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041022

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091029

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101029

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees