JP2011065633A

JP2011065633A - 情報提供システム、情報提供方法、及び情報提供プログラム

Info

Publication number: JP2011065633A
Application number: JP2010164880A
Authority: JP
Inventors: Motoharu Miyake; 基治三宅; Hiroshi Inamura; 浩稲村
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2009-09-15
Filing date: 2010-07-22
Publication date: 2011-03-31
Anticipated expiration: 2030-07-22
Also published as: JP5591608B2

Abstract

【課題】時期に応じた適切な範囲の記事をユーザに提供すること。
【解決手段】情報提供システム１は、更新された記事を収集してユーザの携帯端末２０に表示する。この情報提供システム１の一部を成すサーバ１０は、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する単語データベース１３と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する評価部１４と、算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる送信部１５と、所定の時間が経過した単語データの単語興味度を下げるように単語データベース１３を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新部１７と、を備えている。
【選択図】図１

Description

本発明は、ＲＳＳ（Really SimpleSyndication）により提供されるデータ（ＲＳＳフィード）の集約を各個人に合わせて実行するものである。本発明は、情報提供システム、情報提供方法、及び情報提供プログラムに関する。

ＲＳＳは、ブログの投稿やニュース・ヘッドライン、画像、オーディオ、ビデオなどのような、頻繁に更新されるウェブ・コンテンツ（以下では「記事」という）をユーザに提供するために用いられるデータ形式である。ＲＳＳフィードは、タイトルや要約文などの最新の記事情報を提供するＲＳＳリーダにより、オリジナルの記事にアクセスすることなく読み出される。一般には、ウェブベース型とクライアントソフト型という二種類のＲＳＳリーダが存在する（図１９，２０参照）。ウェブベース型はＲＳＳフィードをインターネットの所定のウェブサイトに集約するように設計されており、ユーザはそのウェブサイトにアクセスすることですべての更新を確認することができる（図２１参照）。一方、クライアントソフト型はユーザのパーソナルコンピュータ（ＰＣ）や携帯電話機にてＲＳＳフィードを集約するように設計されており、ユーザは当該ＰＣあるいは携帯電話機を使ってすべての更新を確認することができる（図２２参照）。

ユーザが興味を持つウェブサイトの登録が増えることで、ＲＳＳフィードはユーザにとって有用な記事だけでなく、ユーザにとって興味のない記事までも含むようになってしまう。そのことで、ユーザはＲＳＳフィードで提供された大量の記事に目を通して、自分にとって有用で価値のある記事をその中から選ぶために、さらなる時間を使わざるを得なくなる可能性がある。

ユーザにとって優先度が高く且つ有用な記事を提供するために、ソーシャル・ブックマーク（ＳＢＭ）のウェブサイトでは、ウェブサイトで保存あるいは投票された「ブックマーク」や「ディグ（ｄｉｇｇ）」を用いて、記事に対するユーザの興味を表そうとする試みが行われている。その結果、ユーザは、特定のウェブサイトが他人によりどのくらい頻繁にアクセスされているか、あるいは興味ある記事として投票されているかを知ることができる。これにより、通常よりも簡単に記事を評価することができる。

米国特許出願公開第２００８／００１０３３７号明細書

これらのメカニズムだと適切な数の記事を提供するために更なる時間を要するので、そのような手法は時間をずらして記事を読むユーザにのみ有用である（図２３参照）。しかも、ブックマークや投票の数は大勢の人の見識によるものであり、パーソナライズされた（個人向けに特化した）サービスに対してはそれほど有用でない。

そこで本発明は、時期に応じた適切な範囲の記事をユーザに提供することが可能な情報提供システム、情報提供方法、及び情報提供プログラムを提供することを目的とする。

本発明の情報提供システムは、更新された記事を収集してユーザの端末に表示するための情報提供システムであって、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する算出手段と、算出手段により算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる表示手段と、所定の時間が経過した単語データの単語興味度を下げるように記憶手段を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新手段と、を備えることを特徴とする。

本発明の情報提供方法は、更新された記事を収集してユーザの端末に表示するための情報提供システムにより実行される情報提供方法であって、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段を参照して、収集した記事と単語データとを比較し、該記事に対するユーザの記事興味度を算出する算出ステップと、算出ステップにおいて算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる表示ステップと、所定の時間が経過した単語データの単語興味度を下げるように記憶手段を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新ステップと、を含むことを特徴とする。

本発明の情報提供プログラムは、コンピュータを、更新された記事を収集してユーザの端末に表示するための情報提供システムとして機能させる情報提供プログラムであって、コンピュータに、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段の機能と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する算出機能と、算出機能により算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる表示機能と、所定の時間が経過した単語データの単語興味度を下げるように記憶手段を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新機能と、を実現させることを特徴とする。

このような発明によれば、収集した記事の興味度を算出する際にその記事と比較する単語について所定の時間が経過すると、その単語の興味度を下げるように更新処理が行われ、その単語が記事興味度の算出に与える影響度が下がる。これにより、上記のような比較処理における過去の単語（ある時期よりも前の単語）の影響度を下げることができる。その結果、時期に応じた適切な範囲の記事をユーザに提供することが可能になる。

本発明の情報提供システムでは、更新手段が、単語を含む記事の収集時期に応じた重みをカウント値に乗じた値を累計することで該単語の単語興味度を算出し、算出した単語興味度により単語データを更新し、収集時期に関する第１の時間範囲における重みよりも、該第１の収集時期よりも過去の第２の時間範囲における重みの方が小さくてもよい。

本発明の情報提供システムでは、重みが、所定の時点から収集時期を遡るにしたがって線形的に小さくなっていってもよい。

本発明の情報提供システムでは、重みが、所定の時点から収集時期を遡るにしたがって指数関数的に小さくなっていってもよい。

本発明の情報提供システムでは、重みが、現時点を含む第１の時間範囲では０より大きい固定値であり、第２の時間範囲では０であってもよい。

本発明の情報提供システムでは、第１の時間範囲と第２の時間範囲とが周期的に繰り返され、重みが、第１の時間範囲では０より大きい固定値であり、第２の時間範囲では０であってもよい。

本発明の情報提供システムでは、重みが、第１の時間範囲では０より大きく、第２の時間範囲では０より小さく、該第２の収集時期よりも過去の第３の時間範囲では０であってもよい。

本発明の情報提供システムでは、更新手段が、対応する単語を含む記事が収集されなくなってから所定の時間が経過した単語データの単語興味度を０に更新するか又は該単語データを記憶手段から削除してもよい。

本発明の情報提供システムでは、更新手段が、対応する単語を含む記事が端末に表示されなくなってから所定の時間が経過した単語データの単語興味度を０に更新するか又は該単語データを記憶手段から削除してもよい。

このような情報提供システム、情報提供方法、及び情報提供プログラムによれば、記事と比較する単語のうち過去のものの影響度が下がるように記憶手段が更新されるので、ユーザに適切な範囲の記事を提供することができる。

実施形態に係る情報提供システムの機能構成を示す図である。図１に示すサーバのハードウェア構成を示す図である。単語データの例を示す図である。（ａ）〜（ｄ）は、図１に示す更新部による単語興味度の更新手法を説明するための図である。図１に示す携帯端末のハードウェア構成を示す図である。図１に示す情報提供システムにより実行される記事の評価及び配信の処理を示すフローチャートである。（ａ），（ｂ）は、図１に示す情報提供システムにより実行される単語データ更新処理を示すフローチャートである。実施形態に係る情報提供プログラムの構成を示す図である。提案する個人向けＲＳＳフィード収集システムによるデータフローを示す図である。ウェブベース型のＲＳＳリーダに関して提案するＲＳＳフィード収集メカニズムを示すブロック図である。クライアントソフトウェア型のＲＳＳリーダに関して提案するＲＳＳフィード収集メカニズムを示すブロック図である。ウェブベース型のＲＳＳリーダに関して提案するＲＳＳフィード収集メカニズムの処理フローを示す図である。クライアントソフトウェア型のＲＳＳリーダに関して提案するＲＳＳフィード収集メカニズムの処理フローを示す図である。ある時間の経過後にコーパス辞書から出現率の低い単語を除外する処理を示す図である。（ａ）は、時間に基づいて影響度を線形的に下げる処理を示す図であり、（ｂ）は、ある時間が経過したか又はある記事数を満たした後に単語の影響度を下げる処理を示す図であり、（ｃ）は制限時間又は記事数に基づいて影響度を一律にする処理を示す図である。（ａ）は、周期的に且つ間欠的に影響度を一律にする処理を示す図であり、（ｂ）は、ある時間の経過後に“興味あり”から“興味なし”に状態を変える処理を示す図である。選択された単語を除外する処理を示す図である。選択された記事内の単語を除外する処理を示す図である。ウェブベース型のＲＳＳリーダの系統図である。クライアントソフトウェア型のＲＳＳリーダの系統図である。ウェブベース型のＲＳＳリーダを基礎とする従来のＲＳＳフィード収集メカニズムを示すブロック図である。クライアントソフトウェア型のＲＳＳリーダを基礎とする従来のＲＳＳフィード収集メカニズムを示すブロック図である。従来のＲＳＳフィード収集システムの処理フローを示す図である。

以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。

まず、図１〜５を用いて、実施形態に係る情報提供システム１の機能及び構成を説明する。情報提供システム１は、インターネット上のウェブサイトにアップロードされた記事を収集してユーザに配信するためのコンピュータシステムであり、収集した記事をユーザに配信するサーバ１０と、ユーザが所有する携帯端末２０とを備えている。サーバ１０と携帯端末２０とは、移動体通信網やインターネットなどにより構成されたネットワーク（図示せず）を介して互いに通信可能である。なお、図１では携帯端末２０を一つのみしか示していないが、当然ながら情報提供システム１内に携帯端末２０もしくはＰＣが複数存在してもよい。

まず、サーバ１０について説明する。図１に示すように、サーバ１０は機能的構成要素として収集部１１、記事データベース１２、単語データベース（記憶手段）１３、評価部（算出手段）１４、送信部（表示手段）１５、監視部１６、及び更新部（更新手段）１７を備えている。

このサーバ１０は、図２に示すように、オペレーティングシステムやアプリケーション・プログラムなどを実行するＣＰＵ１０１と、ＲＯＭ及びＲＡＭで構成される主記憶部１０２と、ハードディスクなどで構成される補助記憶部１０３と、ネットワークカードなどで構成される通信制御部１０４と、キーボードやマウスなどの入力部１０５と、モニタなどの出力部１０６とで構成される。なお、サーバ１０は１台のマシンで構成してもよいし、複数のマシンで構成してもよい。

図１に示すサーバ１０の各機能は、ＣＰＵ１０１や主記憶部１０２の上に所定のソフトウェアを読み込ませ、ＣＰＵ１０１の制御の下で通信制御部１０４や入力部１０５、出力部１０６などを動作させ、主記憶部１０２や補助記憶部１０３におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部１０２や補助記憶部１０３内に格納される。

図１に戻って、収集部１１は、インターネット上のウェブサイトから、更新された記事（ウェブ・コンテンツ）のＲＳＳフィードを収集する手段である。ＲＳＳフィードは、ウェブサイト内の新着記事の一覧や個々の記事に関する情報（更新日や記事内容など）をＸＭＬ形式で記述したデータである。上述したように、収集されるＲＳＳフィードとしてはブログの投稿やニュース・ヘッドライン、画像、オーディオ、ビデオなどに関するものが挙げられるが、当然ながら、ＲＳＳフィードの内容はこれらに限定されない。収集部１１はＲＳＳフィード（記事内容）を直接的に収集してもよいし、記事がアップロードされているＵＲＬ（Uniform Resource Locator）をまず取得し、そのＵＲＬにアクセスして記事を収集してもよい。収集部１１は受信したＲＳＳフィードを記事データベース１２に記憶する。

また、収集部１１は収集した記事（ＲＳＳフィード）に対してテキスト分割や形態素解析などの処理を施すことで記事内の単語を抽出し、抽出した一以上の単語を単語情報として更新部１７に出力する。

記事データベース１２は、収集部から入力されたＲＳＳフィードを記憶する手段である。記事データベース１２はユーザごとに作成される。

単語データベース１３は、記事から抽出した単語に関する情報を記憶する手段であり、コーパスということもできる。単語データベース１３はユーザごとに作成される。具体的には、単語データベース１３は、単語と、その単語を含む記事を収集した回数（収集回数）と、その単語を含む記事が収集された日時（収集日時）のリストと、その単語を含む記事がユーザにより読まれた日時（参照日時）のリストとが関連付けられた単語データを記憶する。

単語が収集されるということは、その単語が単語データベース１３に追加されることを意味するので、収集回数及び収集日時をそれぞれ追加回数、追加日時ということもできる。また、単語が多く収集されるほどそれに関連する記事をユーザが多く読んでいると推定できるので、収集回数は、その単語に対してユーザが興味を示す度合い、すなわち単語興味度を示しているといえる。

単語データベース１３及び単語データの例を図３に示す。この例から、例えば単語Ａを含む記事が２００９年１月１日から２００９年８月１日にかけて合計１００回収集され、単語Ａを含む記事が２００９年１月１日から２００９年８月１日にかけて複数回読まれていることがわかる。

単語データの更新については後で詳細に説明するが、ここでは図３を用いていくつかの更新例を示す。収集部１１が２００９年１０月１日に単語Ｃを含む記事を収集したとすると、単語Ｃの収集回数が３に更新され、収集日時のリストに２００９年１０月１日が追加される。また、２００９年１０月１０日に携帯端末２０が単語Ｃを含む記事を表示した（携帯端末２０のユーザが当該記事を読んだ）場合には、単語Ｃの参照日時のリストに２００９年１０月１０日が追加される。

評価部１４は、収集した記事と、“興味あり”として登録されている単語の単語データとを比較して記事の興味度を算出する手段である。ここで、記事興味度とはユーザがその記事に興味を示す度合いの推定値である。具体的には、評価部１４は記事データベース１２内に格納された記事と単語データベース１３内の単語データとに基づいて、ベイジアン・フィルタを用いて記事の興味度を算出する。記事興味度の具体的な求め方としては、下記に示すようにポール・グラハム・メソッド、ゲイリー・ロビンソン・メソッド、ゲイリー・ロビンソン・フィッシャー・メソッドなどがあるが、具体的な計算方法はこれらに限定されない。

評価部１４は、算出した興味度が所定の閾値Ｔａ以上の記事をユーザにとって“興味あり”の記事と評価し、興味度が閾値Ｔａ未満の記事をユーザにとって“興味なし”の記事と評価する。したがって、最終的に評価部１４は記事の興味度を二値で表すともいえる。なお、閾値Ｔａは任意に決めてよい。例えば、興味度が０から１までの範囲で求まるならば、閾値Ｔａを０．５や０．６などに設定してもよい。

続いて、評価部１４は、携帯端末２０において“興味あり”の記事が“興味なし”の記事よりも優先して表示されるように、一以上の配信記事を記事セットとしてまとめ、その記事セットを送信部１５に出力する。例えば、評価部は記事興味度の降順に記事を並べた記事セットを作成してもよいし、“興味あり”と評価された記事のみを含む記事セットを作成してもよい。

送信部１５は、評価部１４から入力された記事セットを携帯端末２０に送信する手段である。記事セットとして送られる一以上の記事は携帯端末２０で表示されるから、送信部１５は表示手段の一部であるといえる。

監視部１６は、記事に対する操作の内容を示す操作情報を携帯端末２０から受信する手段である。具体的には、監視部１６は、ユーザがある特定の記事を表示したことを示す操作情報（以下では「表示操作情報」という）や、携帯端末２０上に表示された記事に対してユーザが評価したことを示す操作情報（以下では「評価操作情報」という）を受信する。監視部１６は受信した操作情報を更新部１７に出力する。

更新部１７は、単語データベース１３内の単語データを更新する手段である。単語データの更新はユーザに適切な範囲の記事、言い換えればユーザにとって時期に応じた適切な量の記事を提供するために行われるので、その意味で更新部１７は単語の学習部であるということもできる。本明細書において、更新部１７による単語データあるいは単語データベース１３の更新とは、単語データの登録、上書き、及び削除を含む概念である。

収集部１１から単語情報が入力された場合には、更新部１７はその単語情報で示される一以上の単語のそれぞれについて単語データの登録又は更新を行う。処理対象の単語が既に単語データとして単語データベース１３に記憶されているならば、更新部１７はその単語の収集回数を１だけ増やすと共に、収集日時のリストに現在日時を追加する。一方、処理対象の単語が未だ単語データベース１３に存在しないならば、更新部１７はその単語と、収集回数「１」と、現在日時のみを含む収集日時リストとを関連付けることで単語データを生成し、単語データベース１３に格納する。

監視部１６から表示操作情報が入力された場合には、更新部１７は上記収集部１１と同様の手法で、その表示操作情報で示される記事から単語を抽出する。続いて、更新部１７は抽出した一以上の単語のそれぞれについて、単語データ内の参照日時リストに現在日時を追加する。

このような更新処理に加えて、更新部１７は、単語データベース１３への格納から所定の時間が経過した単語データの興味度（単語興味度）を下げるための更新を行う。この更新は、その単語データが評価部１４における記事興味度の算出に与える影響度を下げることを目的とする。以下に、この更新の具体的な手法をいくつか示す。

第一の手法として、更新部１７は、収集時に抽出されたり携帯端末２０上に表示されたりすることなく所定の期間が経過した単語のデータを単語データベース１３から削除する。例えば図３の例においてその所定の期間を３ヶ月とすれば、単語Ｃに関する単語データは２００９年８月１日に削除され、単語Ｄに関する単語データは２００９年９月１日に削除されることになる。

このような第一の手法において、更新部１７は単語データを削除する代わりにその単語データの収集回数（単語興味度）を０にリセットしてもよい。どちらの方法を採ったとしても、このように更新された単語の興味度は０又は空値（ｎｕｌｌ）となり、当該単語は記事興味度の算出に影響を全く及ぼさなくなる。

第二の手法として、更新部１７は、単語の評価に関する評価操作情報に基づいて、“興味なし”と設定された単語や評価ランクの低い単語のデータを単語データベース１３から削除するか、あるいはその単語の収集回数を０にリセットする（図１７，１８参照）。このように、第二の手法では単語データベース１３の更新自体は第一の手法と同じである。

第三の手法として、更新部１７は、単語が収集される毎に収集回数を単純に１ずつカウントするのではなく、一収集あたりのカウント数（収集回数に加算する値）に対して収集時期に応じた重みを乗ずる補正を行うことで、単語興味度を示す合計収集回数を動的に更新してもよい。更新部１７は、このような処理を単語毎に実行する。この第三の手法としては、例えば以下のような手法３−１〜３−４があり、各手法について図４を用いて説明する。図４内の各グラフにおいて、縦軸は一収集あたりのカウント数であり、横軸は時間であり、縦棒はある時点でカウント対象の単語が記事内に存在したこと、すなわち単語の出現を示している。

図４（ａ）に示す手法３−１は、現時点から過去に遡るにしたがって、カウント回数に乗ずる重みを徐々に減少させることで、単語データが記事興味度の算出に与える影響度を下げる手法である。破線ｗは、一収集あたりのカウント数に乗ずる重みである。この重みｗは、現時点を１として過去に遡るにしたがって線形的に減少し、現時点から所定の時間離れたところで０となっている。したがって、図４（ａ）のグラフにおける区間ｔ１１内の出現Ｖａに関するカウント数は０となり、区間ｔ１２内の出現Ｖｂに関するカウント数は、０より大きく１以下の値となる。その結果、４（ａ）のグラフに基づく合計収集回数は単純に８とならず、例えば４．５などとなる。出現Ｖａは記事興味度の算出に全く影響を及ぼさない。これに対して、出現Ｖｂは記事興味度を上げるような影響を及ぼし、その影響度は現在に近い出現Ｖｂほど強くなる。

この手法３−１において、重みを減少させる態様は図４（ａ）の例に限定されない。例えば、その重みを現時点から過去に遡るにしたがって指数関数的に減少させてもよいし、現時点から過去の所定の時点までは重みを１に固定し、当該所定の時点から過去に遡るにしたがって線形的又は指数関数的に重みを減少させてもよい（例えば図１５（ｂ）参照）。

図４（ｂ）に示す手法３−２は、現時点から過去の所定の時点までの間の出現についてのみカウントする手法である。区間ｔ２１における重みｗは一律に０なので、出現Ｖａは記事興味度の算出に全く影響を及ぼさない。これに対して、区間ｔ２２における重みｗは一律に１なので、出現Ｖｂは記事興味度を上げるような影響を及ぼす。なお、区間ｔ２２における重みｗは、０より大きければ１以外の値であってもよい。

図４（ｃ）に示す手法３−３は、カウントする出現を周期的に且つ間欠的に抽出する手法である。区間ｔ３１，ｔ３３，ｔ３５における重みｗは一律に０なので、出現Ｖａは記事興味度の算出に全く影響を及ぼさない。これに対して、区間ｔ３２，３４，３６における重みｗは一律に１なので、出現Ｖｂは記事興味度を上げるような影響を及ぼす。なお、区間ｔ３２，３４，３６における重みｗは、０より大きければ１以外の値であってもよい。

図４（ｄ）に示す手法３−４は、現時点から過去の第１の時点（区間ｔ４３）までは正の重みを設定し、当該第１の時点からそれより過去の第２の時点（区間ｔ４２）までは負の重みを設定し、当該第２の時点よりも過去（区間ｔ４１）においては重みを０に設定するという手法である。区間ｔ４１における出現Ｖａは記事興味度の算出に全く影響を及ぼさず、区間ｔ４２における出現Ｖｂは記事興味度を下げるような影響を及ぼし、区間ｔ４３における出現Ｖｃは記事興味度を上げるような影響を及ぼす。このように負の重みを設定することで、単語の出現が記事興味度の算出に及ぼす影響度を迅速に緩和することができる。

なお、更新部１７は上記第１〜第３の手法のうちのいずれか一つのみを用いて更新処理を行ってもよいし、これらの手法を併用して更新処理を行ってもよい。

次に、携帯端末２０について説明する。図１に示すように、携帯端末２０は機能的構成要素として記憶部２１及び表示制御部２２を備えている。記憶部２１及び表示制御部２２は共に表示手段の一部として機能する。

この携帯端末２０は、図５に示すように、オペレーティングシステムやアプリケーション・プログラムなどを実行するＣＰＵ２０１と、ＲＯＭ及びＲＡＭで構成される主記憶部２０２と、メモリなどで構成される補助記憶部２０３と、データ通信を行う通信制御部２０４と、液晶画面などで構成されるモニタ２０５と、入力キーなどで構成される操作部２０６とで構成される。図１に示す各機能は、ＣＰＵ２０１及び主記憶部２０２の上に所定のプログラムを読み込ませ、ＣＰＵ２０１の制御の下で通信制御部２０４、モニタ２０５及び操作部２０６を動作させるとともに、主記憶部２０２や補助記憶部２０３に対してデータの読み出し又は書き込みを行うことで実現される。データベースや処理に必要なデータは主記憶部２０２または補助記憶部２０３内に格納されている。

なお、携帯端末２０の例としては携帯電話機や携帯情報端末（ＰＤＡ）などが挙げられるが、携帯端末の種類はこれらに限定されない。

図１に戻って、記憶部２１は、サーバ１０から送られてきた記事セットを取得して記憶する手段である。

表示制御部２２は、操作部２０６を介して行われたユーザ入力に従って、サーバ１０から配信された記事をモニタ２０５上に表示したり、その記事に関する情報をサーバ１０に送信したりする手段である。

記事をモニタ２０５上に表示する操作が行われると、表示制御部２２は表示する記事を記憶部２１から読み出してモニタ２０５に表示する。また、表示制御部２２はその記事を表示する操作が行われたことを示す表示操作情報を生成してサーバ１０に送信する。この表示操作情報は、表示された記事を特定する情報と、携帯端末２０またはユーザを特定するための情報とを含んでいる。

記事を評価する操作が行われると、表示制御部２２はその操作に基づいて評価操作情報を生成しサーバ１０に送信する。この評価操作情報は、評価された記事を特定する情報と、その記事の評価内容と、携帯端末２０またはユーザを特定するための情報とを含んでいる。記事の評価内容は、例えば「興味あり」「興味なし」の二値で示される情報であってもよいし、３段階以上のランクで示される情報であってもよい。なお、記事を評価する操作は、下記で示すように、クリック操作やタップ操作、タップ及びホールドの操作、スワイプ操作、指を使ったジェスチャ、ピンチ操作などであってもよい。

次に、図６，７を用いて、図１に示す情報提供システム１の動作を説明するとともに本実施形態に係る情報提供方法について説明する。

記事を収集してその興味度を評価し、ユーザにとって“興味あり”と評価された記事を携帯端末２０上に表示させる処理は図６に示す通りである。まず、収集部１１がインターネット上から記事を収集する（ステップＳ１１）。続いて、評価部１４がその記事と単語データベース１３内の単語データとを比較することで記事の興味度を算出し（ステップＳ１２、算出ステップ）、その結果に基づいて、“興味あり”の記事が携帯端末２０上で優先して表示されるように記事セットを生成する（ステップＳ１３）。続いて、送信部１５がその記事セットを携帯端末２０に送信する（ステップＳ１４、表示ステップ）。

携帯端末２０では、記憶部２１がその記事セットを記憶し、表示制御部２２がユーザ操作に基づいて記憶部２１から記事を読出しモニタ２０５に表示する（ステップＳ１５、表示ステップ）。このとき、表示された記事に対してユーザ操作が行われた場合には、表示制御部２２はその操作に従って次の表示処理を実行したりサーバ１０に操作情報を送信したりする。

単語データベース１３を更新する処理（更新ステップ）は図７に示すとおりである。この更新処理については、所定の実行タイミングに到達した時にサーバ１０側で自動的に実行される場合（自動実行）と、ユーザ操作に従って実行される場合（手動実行）との二種類がある。

図７（ａ）に示す自動実行の場合には、所定の実行タイミング（例えば所定の周期毎に来るタイミング）に到達すると（ステップＳ２１）、更新部１７が、所定の時間が経過した単語の興味度を下げるように単語データベース１３を更新する（ステップＳ２２）。この場合には、更新部１７は上記第１の手法や第３の手法を用いる。

一方、図７（ｂ）に示す手動実行の場合には、所定のユーザ操作に基づく評価操作情報を監視部１６が携帯端末２０から受信し（ステップＳ３１）、更新部１７がその評価操作情報で指定されている単語の興味度を下げるように単語データベース１３を更新する（ステップＳ３２）。この場合には、更新部１７は上記第２の手法を用いることになる。

次に、図８を用いて、一又は複数のコンピュータを情報提供システム１として機能させるための情報提供プログラムを説明する。

情報提供プログラムＰ１は、上記サーバ１０の機能をコンピュータに実行させるためのサーバ側プログラムＰａと、上記携帯端末２０の機能をコンピュータに実行させるための端末側プログラムＰｂとから成る。

サーバ側プログラムＰａは、サーバ側メインモジュールＰ１０、収集モジュールＰ１１、記事記憶モジュールＰ１２、単語記憶モジュールＰ１３、評価モジュールＰ１４、送信モジュールＰ１５、監視モジュールＰ１６、及び更新モジュールＰ１７を備えている。

サーバ側メインモジュールＰ１０は、サーバ１０における情報提供の処理を統括的に制御する部分である。収集モジュールＰ１１、記事記憶モジュールＰ１２、単語記憶モジュールＰ１３、評価モジュールＰ１４、送信モジュールＰ１５、監視モジュールＰ１６、及び更新モジュールＰ１７を実行することにより実現される機能はそれぞれ、サーバ１０の収集部１１、記事データベース１２、単語データベース１３、評価部１４、送信部１５、監視部１６、及び更新部１７の機能と同様である。

端末側プログラムＰｂは、端末側メインモジュールＰ２０、記憶モジュールＰ２１、及び表示制御モジュールＰ２２を備えている。

端末側メインモジュールＰ２０は、携帯端末２０における情報提供の処理を統括的に制御する部分である。記憶モジュールＰ２１及び表示制御モジュールＰ２２を実行することにより実現される機能はそれぞれ、携帯端末２０の記憶部２１及び表示制御部２２の機能と同様である。

情報提供プログラムＰ１は、例えば、ＣＤ−ＲＯＭやＤＶＤ、ＲＯＭ等の記憶媒体または半導体メモリに格納されたかたちで提供される。また、情報提供プログラムＰ１は、搬送波に重畳されたコンピュータデータ信号として通信ネットワークを介して提供されてもよい。いずれの場合でもサーバ側プログラムＰａと端末側プログラムＰｂとが同時に提供されてもよいし、個別に提供されてもよい。

以上説明したように、本実施形態によれば、収集した記事の興味度を算出する際にその記事と比較する単語について所定の時間が経過すると、その単語の興味度を下げるように更新処理が行われ、その単語が記事興味度の算出に与える影響度が下がる。これにより、上記のような比較処理における過去の単語（ある時期よりも前の単語）の影響度を下げることができる。その結果、時期に応じた適切な範囲の記事をユーザに提供することが可能になる。例えば、最近の流行に沿った適度な数（多過ぎない数）の記事をユーザに提供することができる。

また、このような更新処理により、ユーザに優先的に表示される“興味あり”の記事の配信量が適度に抑えられるので、通信リソースを節約したり計算速度を上げたりすることができる。このような利点は、ユーザが所有する端末の処理能力が低かったり、ネットワークの通信速度が低かったりする場面で特に言えることである。

以下、実施例に基づいて本発明を具体的に説明するが、本発明はそれらに何ら限定されるものではない。

本発明は、携帯電話機のように画面の小さい携帯装置において得に重要な、ＲＳＳフィードの集約をパーソナライズすること、及びユーザの興味の移り変わりをサポートすることを具現化するものである（図９参照）。ユーザのやり取りを監視した結果に基づいて記事及びＲＳＳフィードを順位付けするＲＳＳリーダが上記特許文献１に提案されている。このＲＳＳリーダはコンテンツベースの順位、情報源ベースの順位、あるいはスケジュールベースの順位により記事の的確さを改善することに焦点を合わせている。

ここで、本発明で提案する個人向けのＲＳＳフィードの集約は、ユーザが過去に選択した記事をコーパスとして用いて記事の類似性を評価するベイジアン・フィルタを配している（図１０，１１参照）。コーパス内の単語数は演算速度に関係するので、コーパス内で適当な単語数を維持することは複雑さや待ち時間を小さくすることを保証するために重要である。したがって、出現率が低い単語を単に周期的に減らすだけでは不十分である。本発明はこの課題を解決することを目的とする。ここで、提案する技術は、単語をコーパスに追加する時期と、記事評価のための参照時期とを管理する。そして、出現率、追加時期、及び参照時期を用いてコーパス内の単語を減ずる。

本発明はユーザの過去の選択を考慮することでユーザの興味の移り変わりをサポートすることも行う。ユーザがトピックに関する一連の記事を選択すると、ベイジアン・フィルタが記事内の単語を次の評価のためにコーパスに記録して、高い確率で同様の記事を提示する。このような提示はある程度の期間だけ続く。したがって、提案する技術により、ユーザは次の評価への影響を緩和する単語をコーパスから選ぶことができる。更に、提案する技術により、ユーザはその影響を緩和する単語を含んでいる記事を選ぶこともできる。よって、本発明は興味の移り変わりを柔軟にサポートし、計算コストを低く抑えつつ個人向けのＲＳＳフィードを効果的に管理することができる。

特に、本発明は、携帯電話機などのような、処理能力が低く画面サイズが小さい無線携帯装置に適している。これはおそらく、大画面を備えるパーソナル・コンピュータのユーザには問題とならず、当然ながら携帯端末の利用者に限られるであろう。したがって、本発明で提案するより強いフィルタリング処理が非常に望ましい。

（システム構成）
個人向けのＲＳＳフィードとユーザの興味の移り変わりのサポートとを実現するために、収集処理、評価処理、表示処理、学習処理、及び操作処理という５段階の処理が存在する（図１２，１３参照）。システムはＲＳＳフィードを収集して格納し、ユーザの過去の選択を用いて記事の興味度を算出する。その後、システムはＲＳＳフィード及びその興味度を表示する。そして、システムはユーザ操作を監視し、“興味あり”又は“興味なし”として選択された記事内の単語を次の記事評価のためにコーパスに追加する。

（収集処理）
ＲＳＳフィードを集約して格納するために、周期的に又はユーザリクエストにより収集処理がスケジュールされる。ＲＳＳフィードはＸＭＬ（Extensible Markup Language）形式で記述された情報を含んでおり、システムはその情報を解析することで、タイトル、要約、日付、及びＵＲＬ（Uniform Resource Locator）という有用な情報を選択する。

（評価処理）
ＲＳＳフィードを取得すると、記事のタイトル及び要約がテキスト分割を用いて取り除かれる。これは、意味のある実語（full word）を分割するための処理である。ＲＳＳフィードが日本語又は中国語を含んでいる場合には、システムは下記参考文献１〜４などに示されているような形態素解析のサポートを要求する。続いて、記事の単語が過去の二種類の記事（“興味あり”の記事と“興味なし”の記事）と比較され、ベイジアン・フィルタを用いてコーパスとして抽象化される。ベイジアン・フィルタは記事を評価するためのいくつかの手法を備えている。

（参考文献１）David Yarowsky, Joseph Olive,and Julia Hirschberg, editors, "Homograph disambiguation in text-to-speechsynthesis," Progress in Speech Synthesis, pages 159-174. Springer-Verlag,New York, 1996
（参考文献２）KAKASI - Kanji Kana Simple Inverter ,http://kakasi.namazu.org/index.html.en
（参考文献３）Masayuki Asahara and Yuji Matsumoto,"Extended models and tools for high-performance part-of-speechtagger," In Proceedings of the 18th International Conference onComputational Linguistics, pages 21-27, 2000
（参考文献４）Taku Kudo, Kaoru Yamamoto, and YujiMatsumoto, "Applying conditional random fields to Japanese morphologicalanalysis," In Proceedings of the 2004 Conference on Empirical Methods inNatural Language Processing, pages 230-237, Barcelona, 2004

ポール・グラハム・メソッド（下記参考文献５，６参照）では、まず下記式（１）により全単語についての興味度を求める。
ｐ（ｗ）は、本文中に含まれる単語群に基づく、評価対象の記事と過去の記事との関連度合いを示す値である。ｇｗ（ｗ）及びｂｗ（ｗ）は単語数であり、ｗは“興味あり”の記事及び“興味なし”の記事の双方に出現する単語を示す。ｇａ（ｗ）及びｂａ（ｗ）はそれぞれ、単語ｗを含む“興味あり”の記事、“興味なし”の記事の個数である。

続いて、記事の興味度を下記式（２）により求める。
ここで、ｐ_ｉ（ｗ）は０．５から最も離れている上位１５位までのｐ（ｗ）である。

（参考文献５）Paul Graham, "A plan for spam," WWW Page, 2002.http://www.paulgraham.com/spam.html.
（参考文献６）PaulGraham, "Better bayesian filtering," WWW Page, 2003.http://www.paulgraham.com/better.html.

ゲイリー・ロビンソン・メソッド（下記参考文献７参照）では、全単語についての興味度を下記式（３）により求める。
ここで、ｓ，ｒｏｂｓは定数であり、ｒｏｂｘはｐ（ｗ）の平均値であり、ｍは単語ｗを含む記事の個数である。

続いて、記事の興味度Ｓ_２を下記式（４）〜（７）により求める。
ここで、ｎはすべての記事における単語ｗの出現回数である。

（参考文献７）G. Robinson, “A statisticalapproach to the spam problem,” In Linux Journal 107, March 2003,http://www.linuxjournal.com/article/6467

ゲイリー・ロビンソン・フィッシャー・メソッド（下記参考文献８）では、記事の興味度Ｓ_Ｆを下記式（８）〜（１２）により求める。

（参考文献８）Greg Louis, "BogofilterCalculations: Comparing Bayes Chain Rule with Fisher's Method for CombiningProbabilities, " WWW Page, 2003.http://www.bgl.nu/bogofilter/BcrFisher.html

記事が“興味あり”の記事に近いようであれば、その記事の興味度は１になる傾向がある。一方、記事が“興味なし”の記事に近いようであれば、その記事の興味度は０になる傾向がある。このような類似性の傾向の結果は各アルゴリズムを用いて得ることができるが、各アルゴリズムは演算能力と記事の興味度の精度とが二律背反するという問題を抱えている。したがって、アプリケーションに応じてどのアルゴリズムを使うかは実装者に委ねられるが、このようなアルゴリズムの決定方法は本発明とは関係ない。

（表示処理）
個人向けのＲＳＳフィードの集約はベイジアン・フィルタを組み込んだものであり、収集処理後に記事の興味度を計算することができるものである。したがって、システムは興味度が高い記事を強調して表示し、興味度が低い記事の優先度を下げるか又は表示すらしないようにする。このような効果を実現するために、システムは未読の記事を興味度の降順にソートし表示する。表示する記事の範囲は、未読記事すべてから、直近１時間、２４時間、一週間、任意の１日、あるいは任意の一週間などの間にアクセスされた記事まで様々である。更に、システムは、“興味あり”又は“興味なし”の記事として表示される単語数毎に、フォントサイズや色の濃度に応じて調整されたコーパス内の単語を含むタググラフを表示する。

（学習処理）
（演算負荷の削減）
ベイジアン・フィルタは次の記事評価のために単語を“興味あり”及び“興味なし”の記事から二種類のコーパスに正す必要がある。単語数が増えると不正確な評価の回数が減る。演算の観点からすると、システムはこれらの計算を実行するために時間を要し、評価処理中に記事からすべてのコーパスを取得して保持するならばメモリを消費する。

スクリーンサイズが小さい上に処理能力が低くメモリ容量も制限される携帯電話機では、より強いフィルタリング処理が強く望まれる。これはおそらく大画面を有するコンピュータのユーザにとっては問題ではなく、携帯端末のユーザに限った問題である。したがって、評価処理を速める為に、システムは優先度が低い単語をコーパス内から探し、オリジナルのコーパスからそのような単語を効率的に除外する。したがって、システムは単語をコーパスに追加するのに必要な時期や記事評価のための参照時期を管理する。そして、システムは出現率、追加時期、及び参照時期を用いてそのような削除を行う（図１４参照）。

（ユーザ入力の緩和）
システムは基本的にコーパス内の“興味あり”の単語および“興味なし”の単語のすべてを保持するが、長期間の学習処理により、ある程度時間が経つと興味度が高いコンテンツに偏るおそれがある。このような結果はユーザの意図に反するものとなってしまう。過去の選択の影響を緩和するために、システムは、下記のいずれかの手法を用いてある期間においてコーパスに単語を追加したり記事数を追加したりする制御メカニズムを用いてもよい。

（ｉ）時間又は記事数に基づいて影響度を線形的に減少させること（図１５（ａ））
（ｉｉ）ある時間の経過後に又は記事数に基づいて、影響度を指数関数的に減少させること
（ｉｉｉ）ある時間の経過後に又は記事数に基づいて、影響度を線形的に減少させること（図１５（ｂ））
（ｉｖ）制限時間又は記事数に基づいて影響度を一律に減少させること（図１５（ｃ））
（ｖ）周期的に且つ間欠的に影響度を一律に減少させること（図１６（ａ））
（ｖｉ）影響度を迅速に緩和するために、ある時間の経過後に又は記事数に基づいて、“興味あり”の記事を“興味なし”の記事に変えること（図１６（ｂ））

このような方法を用いることで、システムが過去の記事をコーパスに反映する割合を下げることが可能となる。

別の手法としては、選択された単語やユーザが“興味なし”と判断した単語、あるいは、コーパス辞書内の単語を含み且つ好まれなかった記事を除外する方法がある（図１７，１８）。この手法はキーワードベースのシステムにおいて非常に重要であり、そのような単語を含む記事は決して優先されない。一方、ベイジアン・フィルタはコーパスの組合せを利用して記事の類似性を評価するので影響度を緩和し、そのような単語を含む記事が優先される確率は低くなる。

（操作処理）
ユーザが自身のＰＣを用いてＲＳＳフィードを見る場合には、システムは、好き／嫌い、スター（０〜５）、あるいはタグ付けなどといった何らかの評価手法を用いて、ユーザの“興味ある”の記事又は“興味ない”の記事を詳細に捉えることができる。他には、ユーザが興味あると判断した単語やその単語を含む記事をコーパス辞書に追加する手法がある。ユーザの選択をより効果的に配するために、システムは、記事が読まれるまで時間が経った場合に、評価する割合を下げてもよい。さらに、ユーザが何らかのポインティング・デバイスを用いて記事を選択した場合には、クリックされた領域内のタイトルあるいは概要の単語は他のものよりも高く評価されてもよい。

携帯電話機の場合にはスクリーンサイズや入力が制限されるので、システムは記事を評価するためにユーザ入力を要求することができない。よって、その代わりにシステムはユーザの行動を監視する必要がある。

・興味あり：ユーザがオリジナルのウェブサイトからオリジナルの記事を読むために記事を選んだ場合には、システムはその記事を“興味のある記事”と判定する。
・興味なし：ユーザが記事を読むために選ばなかった場合には、システムはその記事を「興味のない記事」と判定する。
“興味なし”の記事が“興味あり”の記事として学習されるのを避けるために、システムは取消メカニズムを追加して、オリジナルの記事の閲読後に“興味あり”とされた記事を“興味なし”として緩和する。
・取消し：ユーザがオリジナルの記事を読んだ後にその記事に対して当てが外れたと感じた場合には、システムは“興味あり”の記事の選択を“興味なし”の記事として取り消すことを許容する。

システムは、“興味なし”の記事が他のソースにて既読であるために非常に高い評価値を持っていたとしても、“興味なし”の記事として学習するためにスキップしてもよい。

クライアントソフトウェアが決定（興味あり／興味なし／取消し）のためにクリック操作やタップ操作を利用している場合には、クリックあるいはタップの回数や、十分な時間のタップ及びホールド操作、複数の指でのスワイプ操作、パームにより開発された、グラフィティのような、指を使ったジェスチャ、ピンチ操作によるフォーカスまたはアンフォーカスなどは、以下に示すように“興味あり”、“興味なし”、“取消し”のレベルを反映することができる。

(i)興味あり：タップ操作、興味なし：操作なし、取消し：２回のタップ操作
(ii)興味あり：タップ操作、興味なし：操作なし、取消し：二本指でのスワイプ操作
(iii)興味あり：２回のタップ操作、興味なし：二本指でのスワイプ操作、取消し：指で「ｘ」を描くジェスチャ
(iv)興味あり：２回のタップ操作、興味なし：二本指でのスワイプ操作、取消し：３回のタップ操作
(v)興味あり：２回のタップ操作、興味なし：操作なし、取消し：二本指でのスワイプ操作
(vi)（通常よりも）興味あり：２回のタップ操作、興味なし：操作なし、取消し：二本指でのスワイプ操作
(vii)（通常よりもはるかに）興味あり：３回のタップ操作、興味なし：操作なし、取消し：二本指でのスワイプ操作
(viii)興味あり：２回のタップ操作、（通常よりも）興味なし：三本指でのスワイプ操作、取消し：３回のタップ操作
(ix)興味あり：２回のタップ操作、（通常よりもはるかに）興味なし：四本指でのスワイプ操作：取消し：３回のタップ操作

上記のような手法を用いることで、ユーザは画面表示に頼ることなく記事を自然に評価することができる。

（実装）
（ウェブベース型）
この発明はウェブベース及びクライアントソフトウェア（図１９，２０）のどちらにも実装可能である。ウェブベース型のシステムは、ウェブサイト内のＲＳＳフィード及びウェブサイトへのユーザアクセスを集約して、すべての更新をチェックする（図２１）。ＲＳＳフィードの集約及び記事の算出はユーザアクセスに基づいて互いに独立して予定される。評価処理では、システムの記憶手段に格納されている、過去のユーザ選択に基づいたコーパスが用いられる。これによりユーザは、評価値が付された最新のＲＳＳフィードや、最も興味のある記事のＲＳＳフィードを得ることができる。ここでＲＳＳフィードは、他のユーザの行動に関係なくシステムから提供される日付、ウェブサイト、又は確率により区分けされる。更にユーザは、ＲＳＳフィードの集約のスケジュールにより記事が周期的に更新されていても、記事を見逃すことなく閲覧ことができる。

ユーザの選択を取得するために、システムは集約後にＲＳＳフィードに追加のＵＲＬを設定してシステムのプロキシを作成したり、何らかのアプリケーションコードを追加してユーザ操作を監視及び報告したりする。

（クライアントソフトウェア型）
クライアントソフトウェア型システムは、ユーザのＰＣや携帯電話機内のＲＳＳフィードを集約し、ユーザに対してディレクトリを表示する（図２２）。このシステムは、ウェブベース型のようにＲＳＳフィードを修正することなく、ユーザの選択ディレクトリを取得する。システムが収集及び評価の処理をバックグラウンドで実行できるならば、ウェブベース型と同様に処理を行っているように見える。それ以外の場合には、システムは収集及び評価処理をユーザ要求の後に開始する。

（効果）
本発明は主に二つの主要な効果を奏する。第一に、本発明により個人向けのＲＳＳフィードが可能になる。よって、ユーザは有用な記事を効果的に特定することができる。システムの観点からすると、このシステムは不要な記事の提供を避けることができ、これによりユーザは、同じ帯域幅の下で別のデータを送信したり、パケットベースの課金の場合に費用を節約したりすることができる。このような特徴は特に、一般に処理能力が低く画面が小さい携帯用アプリケーションにとって重要である。第二に、本発明では、ウェブベース型のシステムが当該システム内のすべてのデータを管理するので、ＰＣや携帯電話機を用いたウェブの閲覧が補完される。その結果、環境や装置に応じて、閲覧の形態を広範囲にわたる記事の乱読と記事の精読とに分けることができる。

以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。

上記実施形態における情報処理システム１は、いわばウェブベース型のシステムであったが、上記サーバ１０の機能をユーザの端末に実装して、クライアントソフトウェア型の情報処理システムを構築してもよい。

上記実施形態では端末として携帯端末２０を示したが、端末は据置型のもの（例えばデスクトップ・コンピュータなど）でもよい。

１…情報提供システム、１０…サーバ、１１…収集部、１２…記事データベース、１３…単語データベース（記憶手段）、１４…評価部（算出手段）、１５…送信部（表示手段）、１６…監視部、１７…更新部（更新手段）、２０…携帯端末、２１…記憶部（表示手段）、２２…表示制御部（表示手段）、Ｐ１…情報提供プログラム、Ｐａ…サーバ側プログラム、Ｐｂ…端末側プログラム、Ｐ１０…サーバ側メインモジュール、Ｐ１１…収集モジュール、Ｐ１２…記事記憶モジュール、Ｐ１３…単語記憶モジュール、Ｐ１４…評価モジュール、Ｐ１５…送信モジュール、Ｐ１６…監視モジュール、Ｐ１７…更新モジュール、Ｐ２０…端末側メインモジュール、Ｐ２１…記憶モジュール、Ｐ２２…表示制御モジュール。

Claims

更新された記事を収集してユーザの端末に表示するための情報提供システムであって、
過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段と、
収集した記事と前記単語データとを比較して、該記事に対する前記ユーザの記事興味度を算出する算出手段と、
前記算出手段により算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示手段と、
所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新手段と、
を備えることを特徴とする情報提供システム。
前記更新手段が、前記単語を含む記事の収集時期に応じた重みをカウント値に乗じた値を累計することで該単語の単語興味度を算出し、算出した単語興味度により前記単語データを更新し、
収集時期に関する第１の時間範囲における前記重みよりも、該第１の収集時期よりも過去の第２の時間範囲における前記重みの方が小さい、
ことを特徴とする請求項１に記載の情報提供システム。
前記重みが、所定の時点から前記収集時期を遡るにしたがって線形的に小さくなってゆく、
ことを特徴とする請求項２に記載の情報提供システム。
前記重みが、所定の時点から前記収集時期を遡るにしたがって指数関数的に小さくなってゆく、
ことを特徴とする請求項２に記載の情報提供システム。
前記重みが、現時点を含む前記第１の時間範囲では０より大きい固定値であり、前記第２の時間範囲では０である、
ことを特徴とする請求項２に記載の情報提供システム。
前記第１の時間範囲と前記第２の時間範囲とが周期的に繰り返され、
前記重みが、前記第１の時間範囲では０より大きい固定値であり、前記第２の時間範囲では０である、
ことを特徴とする請求項２に記載の情報提供システム。
前記重みが、前記第１の時間範囲では０より大きく、前記第２の時間範囲では０より小さく、該第２の収集時期よりも過去の第３の時間範囲では０である、
ことを特徴とする請求項２に記載の情報提供システム。
前記更新手段が、対応する単語を含む記事が収集されなくなってから所定の時間が経過した単語データの単語興味度を０に更新するか又は該単語データを前記記憶手段から削除する、
請求項１〜７のいずれか一項に記載の情報提供システム。
前記更新手段が、対応する単語を含む記事が前記端末に表示されなくなってから所定の時間が経過した単語データの単語興味度を０に更新するか又は該単語データを前記記憶手段から削除する、
請求項１〜８のいずれか一項に記載の情報提供システム。
更新された記事を収集してユーザの端末に表示するための情報提供システムにより実行される情報提供方法であって、
過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段を参照して、収集した記事と前記単語データとを比較し、該記事に対する前記ユーザの記事興味度を算出する算出ステップと、
前記算出ステップにおいて算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示ステップと、
所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新ステップと、
を含むことを特徴とする情報提供方法。
コンピュータを、更新された記事を収集してユーザの端末に表示するための情報提供システムとして機能させる情報提供プログラムであって、
前記コンピュータに、
過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段の機能と、
収集した記事と前記単語データとを比較して、該記事に対する前記ユーザの記事興味度を算出する算出機能と、
前記算出機能により算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示機能と、
所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新機能と、
を実現させることを特徴とする情報提供プログラム。