JP2011065633A - 情報提供システム、情報提供方法、及び情報提供プログラム - Google Patents

情報提供システム、情報提供方法、及び情報提供プログラム Download PDF

Info

Publication number
JP2011065633A
JP2011065633A JP2010164880A JP2010164880A JP2011065633A JP 2011065633 A JP2011065633 A JP 2011065633A JP 2010164880 A JP2010164880 A JP 2010164880A JP 2010164880 A JP2010164880 A JP 2010164880A JP 2011065633 A JP2011065633 A JP 2011065633A
Authority
JP
Japan
Prior art keywords
word
article
interest
user
information providing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010164880A
Other languages
English (en)
Other versions
JP5591608B2 (ja
Inventor
Motoharu Miyake
基治 三宅
Hiroshi Inamura
浩 稲村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2011065633A publication Critical patent/JP2011065633A/ja
Application granted granted Critical
Publication of JP5591608B2 publication Critical patent/JP5591608B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】時期に応じた適切な範囲の記事をユーザに提供すること。
【解決手段】情報提供システム1は、更新された記事を収集してユーザの携帯端末20に表示する。この情報提供システム1の一部を成すサーバ10は、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する単語データベース13と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する評価部14と、算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる送信部15と、所定の時間が経過した単語データの単語興味度を下げるように単語データベース13を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新部17と、を備えている。
【選択図】図1

Description

本発明は、RSS(Really SimpleSyndication)により提供されるデータ(RSSフィード)の集約を各個人に合わせて実行するものである。本発明は、情報提供システム、情報提供方法、及び情報提供プログラムに関する。
RSSは、ブログの投稿やニュース・ヘッドライン、画像、オーディオ、ビデオなどのような、頻繁に更新されるウェブ・コンテンツ(以下では「記事」という)をユーザに提供するために用いられるデータ形式である。RSSフィードは、タイトルや要約文などの最新の記事情報を提供するRSSリーダにより、オリジナルの記事にアクセスすることなく読み出される。一般には、ウェブベース型とクライアントソフト型という二種類のRSSリーダが存在する(図19,20参照)。ウェブベース型はRSSフィードをインターネットの所定のウェブサイトに集約するように設計されており、ユーザはそのウェブサイトにアクセスすることですべての更新を確認することができる(図21参照)。一方、クライアントソフト型はユーザのパーソナルコンピュータ(PC)や携帯電話機にてRSSフィードを集約するように設計されており、ユーザは当該PCあるいは携帯電話機を使ってすべての更新を確認することができる(図22参照)。
ユーザが興味を持つウェブサイトの登録が増えることで、RSSフィードはユーザにとって有用な記事だけでなく、ユーザにとって興味のない記事までも含むようになってしまう。そのことで、ユーザはRSSフィードで提供された大量の記事に目を通して、自分にとって有用で価値のある記事をその中から選ぶために、さらなる時間を使わざるを得なくなる可能性がある。
ユーザにとって優先度が高く且つ有用な記事を提供するために、ソーシャル・ブックマーク(SBM)のウェブサイトでは、ウェブサイトで保存あるいは投票された「ブックマーク」や「ディグ(digg)」を用いて、記事に対するユーザの興味を表そうとする試みが行われている。その結果、ユーザは、特定のウェブサイトが他人によりどのくらい頻繁にアクセスされているか、あるいは興味ある記事として投票されているかを知ることができる。これにより、通常よりも簡単に記事を評価することができる。
米国特許出願公開第2008/0010337号明細書
これらのメカニズムだと適切な数の記事を提供するために更なる時間を要するので、そのような手法は時間をずらして記事を読むユーザにのみ有用である(図23参照)。しかも、ブックマークや投票の数は大勢の人の見識によるものであり、パーソナライズされた(個人向けに特化した)サービスに対してはそれほど有用でない。
そこで本発明は、時期に応じた適切な範囲の記事をユーザに提供することが可能な情報提供システム、情報提供方法、及び情報提供プログラムを提供することを目的とする。
本発明の情報提供システムは、更新された記事を収集してユーザの端末に表示するための情報提供システムであって、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する算出手段と、算出手段により算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる表示手段と、所定の時間が経過した単語データの単語興味度を下げるように記憶手段を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新手段と、を備えることを特徴とする。
本発明の情報提供方法は、更新された記事を収集してユーザの端末に表示するための情報提供システムにより実行される情報提供方法であって、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段を参照して、収集した記事と単語データとを比較し、該記事に対するユーザの記事興味度を算出する算出ステップと、算出ステップにおいて算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる表示ステップと、所定の時間が経過した単語データの単語興味度を下げるように記憶手段を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新ステップと、を含むことを特徴とする。
本発明の情報提供プログラムは、コンピュータを、更新された記事を収集してユーザの端末に表示するための情報提供システムとして機能させる情報提供プログラムであって、コンピュータに、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段の機能と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する算出機能と、算出機能により算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる表示機能と、所定の時間が経過した単語データの単語興味度を下げるように記憶手段を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新機能と、を実現させることを特徴とする。
このような発明によれば、収集した記事の興味度を算出する際にその記事と比較する単語について所定の時間が経過すると、その単語の興味度を下げるように更新処理が行われ、その単語が記事興味度の算出に与える影響度が下がる。これにより、上記のような比較処理における過去の単語(ある時期よりも前の単語)の影響度を下げることができる。その結果、時期に応じた適切な範囲の記事をユーザに提供することが可能になる。
本発明の情報提供システムでは、更新手段が、単語を含む記事の収集時期に応じた重みをカウント値に乗じた値を累計することで該単語の単語興味度を算出し、算出した単語興味度により単語データを更新し、収集時期に関する第1の時間範囲における重みよりも、該第1の収集時期よりも過去の第2の時間範囲における重みの方が小さくてもよい。
本発明の情報提供システムでは、重みが、所定の時点から収集時期を遡るにしたがって線形的に小さくなっていってもよい。
本発明の情報提供システムでは、重みが、所定の時点から収集時期を遡るにしたがって指数関数的に小さくなっていってもよい。
本発明の情報提供システムでは、重みが、現時点を含む第1の時間範囲では0より大きい固定値であり、第2の時間範囲では0であってもよい。
本発明の情報提供システムでは、第1の時間範囲と第2の時間範囲とが周期的に繰り返され、重みが、第1の時間範囲では0より大きい固定値であり、第2の時間範囲では0であってもよい。
本発明の情報提供システムでは、重みが、第1の時間範囲では0より大きく、第2の時間範囲では0より小さく、該第2の収集時期よりも過去の第3の時間範囲では0であってもよい。
本発明の情報提供システムでは、更新手段が、対応する単語を含む記事が収集されなくなってから所定の時間が経過した単語データの単語興味度を0に更新するか又は該単語データを記憶手段から削除してもよい。
本発明の情報提供システムでは、更新手段が、対応する単語を含む記事が端末に表示されなくなってから所定の時間が経過した単語データの単語興味度を0に更新するか又は該単語データを記憶手段から削除してもよい。
このような情報提供システム、情報提供方法、及び情報提供プログラムによれば、記事と比較する単語のうち過去のものの影響度が下がるように記憶手段が更新されるので、ユーザに適切な範囲の記事を提供することができる。
実施形態に係る情報提供システムの機能構成を示す図である。 図1に示すサーバのハードウェア構成を示す図である。 単語データの例を示す図である。 (a)〜(d)は、図1に示す更新部による単語興味度の更新手法を説明するための図である。 図1に示す携帯端末のハードウェア構成を示す図である。 図1に示す情報提供システムにより実行される記事の評価及び配信の処理を示すフローチャートである。 (a),(b)は、図1に示す情報提供システムにより実行される単語データ更新処理を示すフローチャートである。 実施形態に係る情報提供プログラムの構成を示す図である。 提案する個人向けRSSフィード収集システムによるデータフローを示す図である。 ウェブベース型のRSSリーダに関して提案するRSSフィード収集メカニズムを示すブロック図である。 クライアントソフトウェア型のRSSリーダに関して提案するRSSフィード収集メカニズムを示すブロック図である。 ウェブベース型のRSSリーダに関して提案するRSSフィード収集メカニズムの処理フローを示す図である。 クライアントソフトウェア型のRSSリーダに関して提案するRSSフィード収集メカニズムの処理フローを示す図である。 ある時間の経過後にコーパス辞書から出現率の低い単語を除外する処理を示す図である。 (a)は、時間に基づいて影響度を線形的に下げる処理を示す図であり、(b)は、ある時間が経過したか又はある記事数を満たした後に単語の影響度を下げる処理を示す図であり、(c)は制限時間又は記事数に基づいて影響度を一律にする処理を示す図である。 (a)は、周期的に且つ間欠的に影響度を一律にする処理を示す図であり、(b)は、ある時間の経過後に“興味あり”から“興味なし”に状態を変える処理を示す図である。 選択された単語を除外する処理を示す図である。 選択された記事内の単語を除外する処理を示す図である。 ウェブベース型のRSSリーダの系統図である。 クライアントソフトウェア型のRSSリーダの系統図である。 ウェブベース型のRSSリーダを基礎とする従来のRSSフィード収集メカニズムを示すブロック図である。 クライアントソフトウェア型のRSSリーダを基礎とする従来のRSSフィード収集メカニズムを示すブロック図である。 従来のRSSフィード収集システムの処理フローを示す図である。
以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
まず、図1〜5を用いて、実施形態に係る情報提供システム1の機能及び構成を説明する。情報提供システム1は、インターネット上のウェブサイトにアップロードされた記事を収集してユーザに配信するためのコンピュータシステムであり、収集した記事をユーザに配信するサーバ10と、ユーザが所有する携帯端末20とを備えている。サーバ10と携帯端末20とは、移動体通信網やインターネットなどにより構成されたネットワーク(図示せず)を介して互いに通信可能である。なお、図1では携帯端末20を一つのみしか示していないが、当然ながら情報提供システム1内に携帯端末20もしくはPCが複数存在してもよい。
まず、サーバ10について説明する。図1に示すように、サーバ10は機能的構成要素として収集部11、記事データベース12、単語データベース(記憶手段)13、評価部(算出手段)14、送信部(表示手段)15、監視部16、及び更新部(更新手段)17を備えている。
このサーバ10は、図2に示すように、オペレーティングシステムやアプリケーション・プログラムなどを実行するCPU101と、ROM及びRAMで構成される主記憶部102と、ハードディスクなどで構成される補助記憶部103と、ネットワークカードなどで構成される通信制御部104と、キーボードやマウスなどの入力部105と、モニタなどの出力部106とで構成される。なお、サーバ10は1台のマシンで構成してもよいし、複数のマシンで構成してもよい。
図1に示すサーバ10の各機能は、CPU101や主記憶部102の上に所定のソフトウェアを読み込ませ、CPU101の制御の下で通信制御部104や入力部105、出力部106などを動作させ、主記憶部102や補助記憶部103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶部102や補助記憶部103内に格納される。
図1に戻って、収集部11は、インターネット上のウェブサイトから、更新された記事(ウェブ・コンテンツ)のRSSフィードを収集する手段である。RSSフィードは、ウェブサイト内の新着記事の一覧や個々の記事に関する情報(更新日や記事内容など)をXML形式で記述したデータである。上述したように、収集されるRSSフィードとしてはブログの投稿やニュース・ヘッドライン、画像、オーディオ、ビデオなどに関するものが挙げられるが、当然ながら、RSSフィードの内容はこれらに限定されない。収集部11はRSSフィード(記事内容)を直接的に収集してもよいし、記事がアップロードされているURL(Uniform Resource Locator)をまず取得し、そのURLにアクセスして記事を収集してもよい。収集部11は受信したRSSフィードを記事データベース12に記憶する。
また、収集部11は収集した記事(RSSフィード)に対してテキスト分割や形態素解析などの処理を施すことで記事内の単語を抽出し、抽出した一以上の単語を単語情報として更新部17に出力する。
記事データベース12は、収集部から入力されたRSSフィードを記憶する手段である。記事データベース12はユーザごとに作成される。
単語データベース13は、記事から抽出した単語に関する情報を記憶する手段であり、コーパスということもできる。単語データベース13はユーザごとに作成される。具体的には、単語データベース13は、単語と、その単語を含む記事を収集した回数(収集回数)と、その単語を含む記事が収集された日時(収集日時)のリストと、その単語を含む記事がユーザにより読まれた日時(参照日時)のリストとが関連付けられた単語データを記憶する。
単語が収集されるということは、その単語が単語データベース13に追加されることを意味するので、収集回数及び収集日時をそれぞれ追加回数、追加日時ということもできる。また、単語が多く収集されるほどそれに関連する記事をユーザが多く読んでいると推定できるので、収集回数は、その単語に対してユーザが興味を示す度合い、すなわち単語興味度を示しているといえる。
単語データベース13及び単語データの例を図3に示す。この例から、例えば単語Aを含む記事が2009年1月1日から2009年8月1日にかけて合計100回収集され、単語Aを含む記事が2009年1月1日から2009年8月1日にかけて複数回読まれていることがわかる。
単語データの更新については後で詳細に説明するが、ここでは図3を用いていくつかの更新例を示す。収集部11が2009年10月1日に単語Cを含む記事を収集したとすると、単語Cの収集回数が3に更新され、収集日時のリストに2009年10月1日が追加される。また、2009年10月10日に携帯端末20が単語Cを含む記事を表示した(携帯端末20のユーザが当該記事を読んだ)場合には、単語Cの参照日時のリストに2009年10月10日が追加される。
評価部14は、収集した記事と、“興味あり”として登録されている単語の単語データとを比較して記事の興味度を算出する手段である。ここで、記事興味度とはユーザがその記事に興味を示す度合いの推定値である。具体的には、評価部14は記事データベース12内に格納された記事と単語データベース13内の単語データとに基づいて、ベイジアン・フィルタを用いて記事の興味度を算出する。記事興味度の具体的な求め方としては、下記に示すようにポール・グラハム・メソッド、ゲイリー・ロビンソン・メソッド、ゲイリー・ロビンソン・フィッシャー・メソッドなどがあるが、具体的な計算方法はこれらに限定されない。
評価部14は、算出した興味度が所定の閾値Ta以上の記事をユーザにとって“興味あり”の記事と評価し、興味度が閾値Ta未満の記事をユーザにとって“興味なし”の記事と評価する。したがって、最終的に評価部14は記事の興味度を二値で表すともいえる。なお、閾値Taは任意に決めてよい。例えば、興味度が0から1までの範囲で求まるならば、閾値Taを0.5や0.6などに設定してもよい。
続いて、評価部14は、携帯端末20において“興味あり”の記事が“興味なし”の記事よりも優先して表示されるように、一以上の配信記事を記事セットとしてまとめ、その記事セットを送信部15に出力する。例えば、評価部は記事興味度の降順に記事を並べた記事セットを作成してもよいし、“興味あり”と評価された記事のみを含む記事セットを作成してもよい。
送信部15は、評価部14から入力された記事セットを携帯端末20に送信する手段である。記事セットとして送られる一以上の記事は携帯端末20で表示されるから、送信部15は表示手段の一部であるといえる。
監視部16は、記事に対する操作の内容を示す操作情報を携帯端末20から受信する手段である。具体的には、監視部16は、ユーザがある特定の記事を表示したことを示す操作情報(以下では「表示操作情報」という)や、携帯端末20上に表示された記事に対してユーザが評価したことを示す操作情報(以下では「評価操作情報」という)を受信する。監視部16は受信した操作情報を更新部17に出力する。
更新部17は、単語データベース13内の単語データを更新する手段である。単語データの更新はユーザに適切な範囲の記事、言い換えればユーザにとって時期に応じた適切な量の記事を提供するために行われるので、その意味で更新部17は単語の学習部であるということもできる。本明細書において、更新部17による単語データあるいは単語データベース13の更新とは、単語データの登録、上書き、及び削除を含む概念である。
収集部11から単語情報が入力された場合には、更新部17はその単語情報で示される一以上の単語のそれぞれについて単語データの登録又は更新を行う。処理対象の単語が既に単語データとして単語データベース13に記憶されているならば、更新部17はその単語の収集回数を1だけ増やすと共に、収集日時のリストに現在日時を追加する。一方、処理対象の単語が未だ単語データベース13に存在しないならば、更新部17はその単語と、収集回数「1」と、現在日時のみを含む収集日時リストとを関連付けることで単語データを生成し、単語データベース13に格納する。
監視部16から表示操作情報が入力された場合には、更新部17は上記収集部11と同様の手法で、その表示操作情報で示される記事から単語を抽出する。続いて、更新部17は抽出した一以上の単語のそれぞれについて、単語データ内の参照日時リストに現在日時を追加する。
このような更新処理に加えて、更新部17は、単語データベース13への格納から所定の時間が経過した単語データの興味度(単語興味度)を下げるための更新を行う。この更新は、その単語データが評価部14における記事興味度の算出に与える影響度を下げることを目的とする。以下に、この更新の具体的な手法をいくつか示す。
第一の手法として、更新部17は、収集時に抽出されたり携帯端末20上に表示されたりすることなく所定の期間が経過した単語のデータを単語データベース13から削除する。例えば図3の例においてその所定の期間を3ヶ月とすれば、単語Cに関する単語データは2009年8月1日に削除され、単語Dに関する単語データは2009年9月1日に削除されることになる。
このような第一の手法において、更新部17は単語データを削除する代わりにその単語データの収集回数(単語興味度)を0にリセットしてもよい。どちらの方法を採ったとしても、このように更新された単語の興味度は0又は空値(null)となり、当該単語は記事興味度の算出に影響を全く及ぼさなくなる。
第二の手法として、更新部17は、単語の評価に関する評価操作情報に基づいて、“興味なし”と設定された単語や評価ランクの低い単語のデータを単語データベース13から削除するか、あるいはその単語の収集回数を0にリセットする(図17,18参照)。このように、第二の手法では単語データベース13の更新自体は第一の手法と同じである。
第三の手法として、更新部17は、単語が収集される毎に収集回数を単純に1ずつカウントするのではなく、一収集あたりのカウント数(収集回数に加算する値)に対して収集時期に応じた重みを乗ずる補正を行うことで、単語興味度を示す合計収集回数を動的に更新してもよい。更新部17は、このような処理を単語毎に実行する。この第三の手法としては、例えば以下のような手法3−1〜3−4があり、各手法について図4を用いて説明する。図4内の各グラフにおいて、縦軸は一収集あたりのカウント数であり、横軸は時間であり、縦棒はある時点でカウント対象の単語が記事内に存在したこと、すなわち単語の出現を示している。
図4(a)に示す手法3−1は、現時点から過去に遡るにしたがって、カウント回数に乗ずる重みを徐々に減少させることで、単語データが記事興味度の算出に与える影響度を下げる手法である。破線wは、一収集あたりのカウント数に乗ずる重みである。この重みwは、現時点を1として過去に遡るにしたがって線形的に減少し、現時点から所定の時間離れたところで0となっている。したがって、図4(a)のグラフにおける区間t11内の出現Vaに関するカウント数は0となり、区間t12内の出現Vbに関するカウント数は、0より大きく1以下の値となる。その結果、4(a)のグラフに基づく合計収集回数は単純に8とならず、例えば4.5などとなる。出現Vaは記事興味度の算出に全く影響を及ぼさない。これに対して、出現Vbは記事興味度を上げるような影響を及ぼし、その影響度は現在に近い出現Vbほど強くなる。
この手法3−1において、重みを減少させる態様は図4(a)の例に限定されない。例えば、その重みを現時点から過去に遡るにしたがって指数関数的に減少させてもよいし、現時点から過去の所定の時点までは重みを1に固定し、当該所定の時点から過去に遡るにしたがって線形的又は指数関数的に重みを減少させてもよい(例えば図15(b)参照)。
図4(b)に示す手法3−2は、現時点から過去の所定の時点までの間の出現についてのみカウントする手法である。区間t21における重みwは一律に0なので、出現Vaは記事興味度の算出に全く影響を及ぼさない。これに対して、区間t22における重みwは一律に1なので、出現Vbは記事興味度を上げるような影響を及ぼす。なお、区間t22における重みwは、0より大きければ1以外の値であってもよい。
図4(c)に示す手法3−3は、カウントする出現を周期的に且つ間欠的に抽出する手法である。区間t31,t33,t35における重みwは一律に0なので、出現Vaは記事興味度の算出に全く影響を及ぼさない。これに対して、区間t32,34,36における重みwは一律に1なので、出現Vbは記事興味度を上げるような影響を及ぼす。なお、区間t32,34,36における重みwは、0より大きければ1以外の値であってもよい。
図4(d)に示す手法3−4は、現時点から過去の第1の時点(区間t43)までは正の重みを設定し、当該第1の時点からそれより過去の第2の時点(区間t42)までは負の重みを設定し、当該第2の時点よりも過去(区間t41)においては重みを0に設定するという手法である。区間t41における出現Vaは記事興味度の算出に全く影響を及ぼさず、区間t42における出現Vbは記事興味度を下げるような影響を及ぼし、区間t43における出現Vcは記事興味度を上げるような影響を及ぼす。このように負の重みを設定することで、単語の出現が記事興味度の算出に及ぼす影響度を迅速に緩和することができる。
なお、更新部17は上記第1〜第3の手法のうちのいずれか一つのみを用いて更新処理を行ってもよいし、これらの手法を併用して更新処理を行ってもよい。
次に、携帯端末20について説明する。図1に示すように、携帯端末20は機能的構成要素として記憶部21及び表示制御部22を備えている。記憶部21及び表示制御部22は共に表示手段の一部として機能する。
この携帯端末20は、図5に示すように、オペレーティングシステムやアプリケーション・プログラムなどを実行するCPU201と、ROM及びRAMで構成される主記憶部202と、メモリなどで構成される補助記憶部203と、データ通信を行う通信制御部204と、液晶画面などで構成されるモニタ205と、入力キーなどで構成される操作部206とで構成される。図1に示す各機能は、CPU201及び主記憶部202の上に所定のプログラムを読み込ませ、CPU201の制御の下で通信制御部204、モニタ205及び操作部206を動作させるとともに、主記憶部202や補助記憶部203に対してデータの読み出し又は書き込みを行うことで実現される。データベースや処理に必要なデータは主記憶部202または補助記憶部203内に格納されている。
なお、携帯端末20の例としては携帯電話機や携帯情報端末(PDA)などが挙げられるが、携帯端末の種類はこれらに限定されない。
図1に戻って、記憶部21は、サーバ10から送られてきた記事セットを取得して記憶する手段である。
表示制御部22は、操作部206を介して行われたユーザ入力に従って、サーバ10から配信された記事をモニタ205上に表示したり、その記事に関する情報をサーバ10に送信したりする手段である。
記事をモニタ205上に表示する操作が行われると、表示制御部22は表示する記事を記憶部21から読み出してモニタ205に表示する。また、表示制御部22はその記事を表示する操作が行われたことを示す表示操作情報を生成してサーバ10に送信する。この表示操作情報は、表示された記事を特定する情報と、携帯端末20またはユーザを特定するための情報とを含んでいる。
記事を評価する操作が行われると、表示制御部22はその操作に基づいて評価操作情報を生成しサーバ10に送信する。この評価操作情報は、評価された記事を特定する情報と、その記事の評価内容と、携帯端末20またはユーザを特定するための情報とを含んでいる。記事の評価内容は、例えば「興味あり」「興味なし」の二値で示される情報であってもよいし、3段階以上のランクで示される情報であってもよい。なお、記事を評価する操作は、下記で示すように、クリック操作やタップ操作、タップ及びホールドの操作、スワイプ操作、指を使ったジェスチャ、ピンチ操作などであってもよい。
次に、図6,7を用いて、図1に示す情報提供システム1の動作を説明するとともに本実施形態に係る情報提供方法について説明する。
記事を収集してその興味度を評価し、ユーザにとって“興味あり”と評価された記事を携帯端末20上に表示させる処理は図6に示す通りである。まず、収集部11がインターネット上から記事を収集する(ステップS11)。続いて、評価部14がその記事と単語データベース13内の単語データとを比較することで記事の興味度を算出し(ステップS12、算出ステップ)、その結果に基づいて、“興味あり”の記事が携帯端末20上で優先して表示されるように記事セットを生成する(ステップS13)。続いて、送信部15がその記事セットを携帯端末20に送信する(ステップS14、表示ステップ)。
携帯端末20では、記憶部21がその記事セットを記憶し、表示制御部22がユーザ操作に基づいて記憶部21から記事を読出しモニタ205に表示する(ステップS15、表示ステップ)。このとき、表示された記事に対してユーザ操作が行われた場合には、表示制御部22はその操作に従って次の表示処理を実行したりサーバ10に操作情報を送信したりする。
単語データベース13を更新する処理(更新ステップ)は図7に示すとおりである。この更新処理については、所定の実行タイミングに到達した時にサーバ10側で自動的に実行される場合(自動実行)と、ユーザ操作に従って実行される場合(手動実行)との二種類がある。
図7(a)に示す自動実行の場合には、所定の実行タイミング(例えば所定の周期毎に来るタイミング)に到達すると(ステップS21)、更新部17が、所定の時間が経過した単語の興味度を下げるように単語データベース13を更新する(ステップS22)。この場合には、更新部17は上記第1の手法や第3の手法を用いる。
一方、図7(b)に示す手動実行の場合には、所定のユーザ操作に基づく評価操作情報を監視部16が携帯端末20から受信し(ステップS31)、更新部17がその評価操作情報で指定されている単語の興味度を下げるように単語データベース13を更新する(ステップS32)。この場合には、更新部17は上記第2の手法を用いることになる。
次に、図8を用いて、一又は複数のコンピュータを情報提供システム1として機能させるための情報提供プログラムを説明する。
情報提供プログラムP1は、上記サーバ10の機能をコンピュータに実行させるためのサーバ側プログラムPaと、上記携帯端末20の機能をコンピュータに実行させるための端末側プログラムPbとから成る。
サーバ側プログラムPaは、サーバ側メインモジュールP10、収集モジュールP11、記事記憶モジュールP12、単語記憶モジュールP13、評価モジュールP14、送信モジュールP15、監視モジュールP16、及び更新モジュールP17を備えている。
サーバ側メインモジュールP10は、サーバ10における情報提供の処理を統括的に制御する部分である。収集モジュールP11、記事記憶モジュールP12、単語記憶モジュールP13、評価モジュールP14、送信モジュールP15、監視モジュールP16、及び更新モジュールP17を実行することにより実現される機能はそれぞれ、サーバ10の収集部11、記事データベース12、単語データベース13、評価部14、送信部15、監視部16、及び更新部17の機能と同様である。
端末側プログラムPbは、端末側メインモジュールP20、記憶モジュールP21、及び表示制御モジュールP22を備えている。
端末側メインモジュールP20は、携帯端末20における情報提供の処理を統括的に制御する部分である。記憶モジュールP21及び表示制御モジュールP22を実行することにより実現される機能はそれぞれ、携帯端末20の記憶部21及び表示制御部22の機能と同様である。
情報提供プログラムP1は、例えば、CD−ROMやDVD、ROM等の記憶媒体または半導体メモリに格納されたかたちで提供される。また、情報提供プログラムP1は、搬送波に重畳されたコンピュータデータ信号として通信ネットワークを介して提供されてもよい。いずれの場合でもサーバ側プログラムPaと端末側プログラムPbとが同時に提供されてもよいし、個別に提供されてもよい。
以上説明したように、本実施形態によれば、収集した記事の興味度を算出する際にその記事と比較する単語について所定の時間が経過すると、その単語の興味度を下げるように更新処理が行われ、その単語が記事興味度の算出に与える影響度が下がる。これにより、上記のような比較処理における過去の単語(ある時期よりも前の単語)の影響度を下げることができる。その結果、時期に応じた適切な範囲の記事をユーザに提供することが可能になる。例えば、最近の流行に沿った適度な数(多過ぎない数)の記事をユーザに提供することができる。
また、このような更新処理により、ユーザに優先的に表示される“興味あり”の記事の配信量が適度に抑えられるので、通信リソースを節約したり計算速度を上げたりすることができる。このような利点は、ユーザが所有する端末の処理能力が低かったり、ネットワークの通信速度が低かったりする場面で特に言えることである。
以下、実施例に基づいて本発明を具体的に説明するが、本発明はそれらに何ら限定されるものではない。
本発明は、携帯電話機のように画面の小さい携帯装置において得に重要な、RSSフィードの集約をパーソナライズすること、及びユーザの興味の移り変わりをサポートすることを具現化するものである(図9参照)。ユーザのやり取りを監視した結果に基づいて記事及びRSSフィードを順位付けするRSSリーダが上記特許文献1に提案されている。このRSSリーダはコンテンツベースの順位、情報源ベースの順位、あるいはスケジュールベースの順位により記事の的確さを改善することに焦点を合わせている。
ここで、本発明で提案する個人向けのRSSフィードの集約は、ユーザが過去に選択した記事をコーパスとして用いて記事の類似性を評価するベイジアン・フィルタを配している(図10,11参照)。コーパス内の単語数は演算速度に関係するので、コーパス内で適当な単語数を維持することは複雑さや待ち時間を小さくすることを保証するために重要である。したがって、出現率が低い単語を単に周期的に減らすだけでは不十分である。本発明はこの課題を解決することを目的とする。ここで、提案する技術は、単語をコーパスに追加する時期と、記事評価のための参照時期とを管理する。そして、出現率、追加時期、及び参照時期を用いてコーパス内の単語を減ずる。
本発明はユーザの過去の選択を考慮することでユーザの興味の移り変わりをサポートすることも行う。ユーザがトピックに関する一連の記事を選択すると、ベイジアン・フィルタが記事内の単語を次の評価のためにコーパスに記録して、高い確率で同様の記事を提示する。このような提示はある程度の期間だけ続く。したがって、提案する技術により、ユーザは次の評価への影響を緩和する単語をコーパスから選ぶことができる。更に、提案する技術により、ユーザはその影響を緩和する単語を含んでいる記事を選ぶこともできる。よって、本発明は興味の移り変わりを柔軟にサポートし、計算コストを低く抑えつつ個人向けのRSSフィードを効果的に管理することができる。
特に、本発明は、携帯電話機などのような、処理能力が低く画面サイズが小さい無線携帯装置に適している。これはおそらく、大画面を備えるパーソナル・コンピュータのユーザには問題とならず、当然ながら携帯端末の利用者に限られるであろう。したがって、本発明で提案するより強いフィルタリング処理が非常に望ましい。
(システム構成)
個人向けのRSSフィードとユーザの興味の移り変わりのサポートとを実現するために、収集処理、評価処理、表示処理、学習処理、及び操作処理という5段階の処理が存在する(図12,13参照)。システムはRSSフィードを収集して格納し、ユーザの過去の選択を用いて記事の興味度を算出する。その後、システムはRSSフィード及びその興味度を表示する。そして、システムはユーザ操作を監視し、“興味あり”又は“興味なし”として選択された記事内の単語を次の記事評価のためにコーパスに追加する。
(収集処理)
RSSフィードを集約して格納するために、周期的に又はユーザリクエストにより収集処理がスケジュールされる。RSSフィードはXML(Extensible Markup Language)形式で記述された情報を含んでおり、システムはその情報を解析することで、タイトル、要約、日付、及びURL(Uniform Resource Locator)という有用な情報を選択する。
(評価処理)
RSSフィードを取得すると、記事のタイトル及び要約がテキスト分割を用いて取り除かれる。これは、意味のある実語(full word)を分割するための処理である。RSSフィードが日本語又は中国語を含んでいる場合には、システムは下記参考文献1〜4などに示されているような形態素解析のサポートを要求する。続いて、記事の単語が過去の二種類の記事(“興味あり”の記事と“興味なし”の記事)と比較され、ベイジアン・フィルタを用いてコーパスとして抽象化される。ベイジアン・フィルタは記事を評価するためのいくつかの手法を備えている。
(参考文献1)David Yarowsky, Joseph Olive,and Julia Hirschberg, editors, "Homograph disambiguation in text-to-speechsynthesis," Progress in Speech Synthesis, pages 159-174. Springer-Verlag,New York, 1996
(参考文献2)KAKASI - Kanji Kana Simple Inverter ,http://kakasi.namazu.org/index.html.en
(参考文献3)Masayuki Asahara and Yuji Matsumoto,"Extended models and tools for high-performance part-of-speechtagger," In Proceedings of the 18th International Conference onComputational Linguistics, pages 21-27, 2000
(参考文献4)Taku Kudo, Kaoru Yamamoto, and YujiMatsumoto, "Applying conditional random fields to Japanese morphologicalanalysis," In Proceedings of the 2004 Conference on Empirical Methods inNatural Language Processing, pages 230-237, Barcelona, 2004
ポール・グラハム・メソッド(下記参考文献5,6参照)では、まず下記式(1)により全単語についての興味度を求める。
p(w)は、本文中に含まれる単語群に基づく、評価対象の記事と過去の記事との関連度合いを示す値である。gw(w)及びbw(w)は単語数であり、wは“興味あり”の記事及び“興味なし”の記事の双方に出現する単語を示す。ga(w)及びba(w)はそれぞれ、単語wを含む“興味あり”の記事、“興味なし”の記事の個数である。
続いて、記事の興味度を下記式(2)により求める。
ここで、p(w)は0.5から最も離れている上位15位までのp(w)である。
(参考文献5)Paul Graham, "A plan for spam," WWW Page, 2002.http://www.paulgraham.com/spam.html.
(参考文献6)PaulGraham, "Better bayesian filtering," WWW Page, 2003.http://www.paulgraham.com/better.html.
ゲイリー・ロビンソン・メソッド(下記参考文献7参照)では、全単語についての興味度を下記式(3)により求める。
ここで、s,robsは定数であり、robxはp(w)の平均値であり、mは単語wを含む記事の個数である。
続いて、記事の興味度Sを下記式(4)〜(7)により求める。
ここで、nはすべての記事における単語wの出現回数である。
(参考文献7)G. Robinson, “A statisticalapproach to the spam problem,” In Linux Journal 107, March 2003,http://www.linuxjournal.com/article/6467
ゲイリー・ロビンソン・フィッシャー・メソッド(下記参考文献8)では、記事の興味度Sを下記式(8)〜(12)により求める。
(参考文献8)Greg Louis, "BogofilterCalculations: Comparing Bayes Chain Rule with Fisher's Method for CombiningProbabilities, " WWW Page, 2003.http://www.bgl.nu/bogofilter/BcrFisher.html
記事が“興味あり”の記事に近いようであれば、その記事の興味度は1になる傾向がある。一方、記事が“興味なし”の記事に近いようであれば、その記事の興味度は0になる傾向がある。このような類似性の傾向の結果は各アルゴリズムを用いて得ることができるが、各アルゴリズムは演算能力と記事の興味度の精度とが二律背反するという問題を抱えている。したがって、アプリケーションに応じてどのアルゴリズムを使うかは実装者に委ねられるが、このようなアルゴリズムの決定方法は本発明とは関係ない。
(表示処理)
個人向けのRSSフィードの集約はベイジアン・フィルタを組み込んだものであり、収集処理後に記事の興味度を計算することができるものである。したがって、システムは興味度が高い記事を強調して表示し、興味度が低い記事の優先度を下げるか又は表示すらしないようにする。このような効果を実現するために、システムは未読の記事を興味度の降順にソートし表示する。表示する記事の範囲は、未読記事すべてから、直近1時間、24時間、一週間、任意の1日、あるいは任意の一週間などの間にアクセスされた記事まで様々である。更に、システムは、“興味あり”又は“興味なし”の記事として表示される単語数毎に、フォントサイズや色の濃度に応じて調整されたコーパス内の単語を含むタググラフを表示する。
(学習処理)
(演算負荷の削減)
ベイジアン・フィルタは次の記事評価のために単語を“興味あり”及び“興味なし”の記事から二種類のコーパスに正す必要がある。単語数が増えると不正確な評価の回数が減る。演算の観点からすると、システムはこれらの計算を実行するために時間を要し、評価処理中に記事からすべてのコーパスを取得して保持するならばメモリを消費する。
スクリーンサイズが小さい上に処理能力が低くメモリ容量も制限される携帯電話機では、より強いフィルタリング処理が強く望まれる。これはおそらく大画面を有するコンピュータのユーザにとっては問題ではなく、携帯端末のユーザに限った問題である。したがって、評価処理を速める為に、システムは優先度が低い単語をコーパス内から探し、オリジナルのコーパスからそのような単語を効率的に除外する。したがって、システムは単語をコーパスに追加するのに必要な時期や記事評価のための参照時期を管理する。そして、システムは出現率、追加時期、及び参照時期を用いてそのような削除を行う(図14参照)。
(ユーザ入力の緩和)
システムは基本的にコーパス内の“興味あり”の単語および“興味なし”の単語のすべてを保持するが、長期間の学習処理により、ある程度時間が経つと興味度が高いコンテンツに偏るおそれがある。このような結果はユーザの意図に反するものとなってしまう。過去の選択の影響を緩和するために、システムは、下記のいずれかの手法を用いてある期間においてコーパスに単語を追加したり記事数を追加したりする制御メカニズムを用いてもよい。
(i)時間又は記事数に基づいて影響度を線形的に減少させること(図15(a))
(ii)ある時間の経過後に又は記事数に基づいて、影響度を指数関数的に減少させること
(iii)ある時間の経過後に又は記事数に基づいて、影響度を線形的に減少させること(図15(b))
(iv)制限時間又は記事数に基づいて影響度を一律に減少させること(図15(c))
(v)周期的に且つ間欠的に影響度を一律に減少させること(図16(a))
(vi)影響度を迅速に緩和するために、ある時間の経過後に又は記事数に基づいて、“興味あり”の記事を“興味なし”の記事に変えること(図16(b))
このような方法を用いることで、システムが過去の記事をコーパスに反映する割合を下げることが可能となる。
別の手法としては、選択された単語やユーザが“興味なし”と判断した単語、あるいは、コーパス辞書内の単語を含み且つ好まれなかった記事を除外する方法がある(図17,18)。この手法はキーワードベースのシステムにおいて非常に重要であり、そのような単語を含む記事は決して優先されない。一方、ベイジアン・フィルタはコーパスの組合せを利用して記事の類似性を評価するので影響度を緩和し、そのような単語を含む記事が優先される確率は低くなる。
(操作処理)
ユーザが自身のPCを用いてRSSフィードを見る場合には、システムは、好き/嫌い、スター(0〜5)、あるいはタグ付けなどといった何らかの評価手法を用いて、ユーザの“興味ある”の記事又は“興味ない”の記事を詳細に捉えることができる。他には、ユーザが興味あると判断した単語やその単語を含む記事をコーパス辞書に追加する手法がある。ユーザの選択をより効果的に配するために、システムは、記事が読まれるまで時間が経った場合に、評価する割合を下げてもよい。さらに、ユーザが何らかのポインティング・デバイスを用いて記事を選択した場合には、クリックされた領域内のタイトルあるいは概要の単語は他のものよりも高く評価されてもよい。
携帯電話機の場合にはスクリーンサイズや入力が制限されるので、システムは記事を評価するためにユーザ入力を要求することができない。よって、その代わりにシステムはユーザの行動を監視する必要がある。
・興味あり:ユーザがオリジナルのウェブサイトからオリジナルの記事を読むために記事を選んだ場合には、システムはその記事を“興味のある記事”と判定する。
・興味なし:ユーザが記事を読むために選ばなかった場合には、システムはその記事を「興味のない記事」と判定する。
“興味なし”の記事が“興味あり”の記事として学習されるのを避けるために、システムは取消メカニズムを追加して、オリジナルの記事の閲読後に“興味あり”とされた記事を“興味なし”として緩和する。
・取消し:ユーザがオリジナルの記事を読んだ後にその記事に対して当てが外れたと感じた場合には、システムは“興味あり”の記事の選択を“興味なし”の記事として取り消すことを許容する。
システムは、“興味なし”の記事が他のソースにて既読であるために非常に高い評価値を持っていたとしても、“興味なし”の記事として学習するためにスキップしてもよい。
クライアントソフトウェアが決定(興味あり/興味なし/取消し)のためにクリック操作やタップ操作を利用している場合には、クリックあるいはタップの回数や、十分な時間のタップ及びホールド操作、複数の指でのスワイプ操作、パームにより開発された、グラフィティのような、指を使ったジェスチャ、ピンチ操作によるフォーカスまたはアンフォーカスなどは、以下に示すように“興味あり”、“興味なし”、“取消し”のレベルを反映することができる。
(i)興味あり:タップ操作、興味なし:操作なし、取消し:2回のタップ操作
(ii)興味あり:タップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(iii)興味あり:2回のタップ操作、興味なし:二本指でのスワイプ操作、取消し:指で「x」を描くジェスチャ
(iv)興味あり:2回のタップ操作、興味なし:二本指でのスワイプ操作、取消し:3回のタップ操作
(v)興味あり:2回のタップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(vi)(通常よりも)興味あり:2回のタップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(vii)(通常よりもはるかに)興味あり:3回のタップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(viii)興味あり:2回のタップ操作、(通常よりも)興味なし:三本指でのスワイプ操作、取消し:3回のタップ操作
(ix)興味あり:2回のタップ操作、(通常よりもはるかに)興味なし:四本指でのスワイプ操作:取消し:3回のタップ操作
上記のような手法を用いることで、ユーザは画面表示に頼ることなく記事を自然に評価することができる。
(実装)
(ウェブベース型)
この発明はウェブベース及びクライアントソフトウェア(図19,20)のどちらにも実装可能である。ウェブベース型のシステムは、ウェブサイト内のRSSフィード及びウェブサイトへのユーザアクセスを集約して、すべての更新をチェックする(図21)。RSSフィードの集約及び記事の算出はユーザアクセスに基づいて互いに独立して予定される。評価処理では、システムの記憶手段に格納されている、過去のユーザ選択に基づいたコーパスが用いられる。これによりユーザは、評価値が付された最新のRSSフィードや、最も興味のある記事のRSSフィードを得ることができる。ここでRSSフィードは、他のユーザの行動に関係なくシステムから提供される日付、ウェブサイト、又は確率により区分けされる。更にユーザは、RSSフィードの集約のスケジュールにより記事が周期的に更新されていても、記事を見逃すことなく閲覧ことができる。
ユーザの選択を取得するために、システムは集約後にRSSフィードに追加のURLを設定してシステムのプロキシを作成したり、何らかのアプリケーションコードを追加してユーザ操作を監視及び報告したりする。
(クライアントソフトウェア型)
クライアントソフトウェア型システムは、ユーザのPCや携帯電話機内のRSSフィードを集約し、ユーザに対してディレクトリを表示する(図22)。このシステムは、ウェブベース型のようにRSSフィードを修正することなく、ユーザの選択ディレクトリを取得する。システムが収集及び評価の処理をバックグラウンドで実行できるならば、ウェブベース型と同様に処理を行っているように見える。それ以外の場合には、システムは収集及び評価処理をユーザ要求の後に開始する。
(効果)
本発明は主に二つの主要な効果を奏する。第一に、本発明により個人向けのRSSフィードが可能になる。よって、ユーザは有用な記事を効果的に特定することができる。システムの観点からすると、このシステムは不要な記事の提供を避けることができ、これによりユーザは、同じ帯域幅の下で別のデータを送信したり、パケットベースの課金の場合に費用を節約したりすることができる。このような特徴は特に、一般に処理能力が低く画面が小さい携帯用アプリケーションにとって重要である。第二に、本発明では、ウェブベース型のシステムが当該システム内のすべてのデータを管理するので、PCや携帯電話機を用いたウェブの閲覧が補完される。その結果、環境や装置に応じて、閲覧の形態を広範囲にわたる記事の乱読と記事の精読とに分けることができる。
以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
上記実施形態における情報処理システム1は、いわばウェブベース型のシステムであったが、上記サーバ10の機能をユーザの端末に実装して、クライアントソフトウェア型の情報処理システムを構築してもよい。
上記実施形態では端末として携帯端末20を示したが、端末は据置型のもの(例えばデスクトップ・コンピュータなど)でもよい。
1…情報提供システム、10…サーバ、11…収集部、12…記事データベース、13…単語データベース(記憶手段)、14…評価部(算出手段)、15…送信部(表示手段)、16…監視部、17…更新部(更新手段)、20…携帯端末、21…記憶部(表示手段)、22…表示制御部(表示手段)、P1…情報提供プログラム、Pa…サーバ側プログラム、Pb…端末側プログラム、P10…サーバ側メインモジュール、P11…収集モジュール、P12…記事記憶モジュール、P13…単語記憶モジュール、P14…評価モジュール、P15…送信モジュール、P16…監視モジュール、P17…更新モジュール、P20…端末側メインモジュール、P21…記憶モジュール、P22…表示制御モジュール。

Claims (11)

  1. 更新された記事を収集してユーザの端末に表示するための情報提供システムであって、
    過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段と、
    収集した記事と前記単語データとを比較して、該記事に対する前記ユーザの記事興味度を算出する算出手段と、
    前記算出手段により算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示手段と、
    所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新手段と、
    を備えることを特徴とする情報提供システム。
  2. 前記更新手段が、前記単語を含む記事の収集時期に応じた重みをカウント値に乗じた値を累計することで該単語の単語興味度を算出し、算出した単語興味度により前記単語データを更新し、
    収集時期に関する第1の時間範囲における前記重みよりも、該第1の収集時期よりも過去の第2の時間範囲における前記重みの方が小さい、
    ことを特徴とする請求項1に記載の情報提供システム。
  3. 前記重みが、所定の時点から前記収集時期を遡るにしたがって線形的に小さくなってゆく、
    ことを特徴とする請求項2に記載の情報提供システム。
  4. 前記重みが、所定の時点から前記収集時期を遡るにしたがって指数関数的に小さくなってゆく、
    ことを特徴とする請求項2に記載の情報提供システム。
  5. 前記重みが、現時点を含む前記第1の時間範囲では0より大きい固定値であり、前記第2の時間範囲では0である、
    ことを特徴とする請求項2に記載の情報提供システム。
  6. 前記第1の時間範囲と前記第2の時間範囲とが周期的に繰り返され、
    前記重みが、前記第1の時間範囲では0より大きい固定値であり、前記第2の時間範囲では0である、
    ことを特徴とする請求項2に記載の情報提供システム。
  7. 前記重みが、前記第1の時間範囲では0より大きく、前記第2の時間範囲では0より小さく、該第2の収集時期よりも過去の第3の時間範囲では0である、
    ことを特徴とする請求項2に記載の情報提供システム。
  8. 前記更新手段が、対応する単語を含む記事が収集されなくなってから所定の時間が経過した単語データの単語興味度を0に更新するか又は該単語データを前記記憶手段から削除する、
    請求項1〜7のいずれか一項に記載の情報提供システム。
  9. 前記更新手段が、対応する単語を含む記事が前記端末に表示されなくなってから所定の時間が経過した単語データの単語興味度を0に更新するか又は該単語データを前記記憶手段から削除する、
    請求項1〜8のいずれか一項に記載の情報提供システム。
  10. 更新された記事を収集してユーザの端末に表示するための情報提供システムにより実行される情報提供方法であって、
    過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段を参照して、収集した記事と前記単語データとを比較し、該記事に対する前記ユーザの記事興味度を算出する算出ステップと、
    前記算出ステップにおいて算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示ステップと、
    所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新ステップと、
    を含むことを特徴とする情報提供方法。
  11. コンピュータを、更新された記事を収集してユーザの端末に表示するための情報提供システムとして機能させる情報提供プログラムであって、
    前記コンピュータに、
    過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段の機能と、
    収集した記事と前記単語データとを比較して、該記事に対する前記ユーザの記事興味度を算出する算出機能と、
    前記算出機能により算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示機能と、
    所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新機能と、
    を実現させることを特徴とする情報提供プログラム。
JP2010164880A 2009-09-15 2010-07-22 情報提供システム、情報提供方法、及び情報提供プログラム Active JP5591608B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US24269609P 2009-09-15 2009-09-15
US61/242,696 2009-09-15

Publications (2)

Publication Number Publication Date
JP2011065633A true JP2011065633A (ja) 2011-03-31
JP5591608B2 JP5591608B2 (ja) 2014-09-17

Family

ID=43951756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010164880A Active JP5591608B2 (ja) 2009-09-15 2010-07-22 情報提供システム、情報提供方法、及び情報提供プログラム

Country Status (1)

Country Link
JP (1) JP5591608B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3226185A1 (en) 2016-03-31 2017-10-04 Fujitsu Limited Search program, search method, and information processing apparatus
JP2019503014A (ja) * 2016-01-25 2019-01-31 アリババ グループ ホウルディング リミテッド ユーザ挙動データの処理方法及び装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010337A1 (en) * 2006-07-07 2008-01-10 Attensa, Inc. Analysis and selective display of rss feeds
JP2008108105A (ja) * 2006-10-26 2008-05-08 Ntt Comware Corp 情報提供装置、情報提供方法および情報提供プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010337A1 (en) * 2006-07-07 2008-01-10 Attensa, Inc. Analysis and selective display of rss feeds
JP2008108105A (ja) * 2006-10-26 2008-05-08 Ntt Comware Corp 情報提供装置、情報提供方法および情報提供プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019503014A (ja) * 2016-01-25 2019-01-31 アリババ グループ ホウルディング リミテッド ユーザ挙動データの処理方法及び装置
JP7085486B2 (ja) 2016-01-25 2022-06-16 アリババ グループ ホウルディング リミテッド ユーザ挙動データの処理方法及び装置
EP3226185A1 (en) 2016-03-31 2017-10-04 Fujitsu Limited Search program, search method, and information processing apparatus

Also Published As

Publication number Publication date
JP5591608B2 (ja) 2014-09-17

Similar Documents

Publication Publication Date Title
US11347752B2 (en) Personalized user feed based on monitored activities
US9043259B2 (en) Systems and methods for recommending media content items
KR101728927B1 (ko) 사회적 거리에 기초한 콘텐츠 항목의 사전 인출
US8631001B2 (en) Systems and methods for weighting a search query result
US7895227B1 (en) System and method for detecting trends in network-based content
US9098572B1 (en) Magazine edition recommendations
US10909148B2 (en) Web crawling intake processing enhancements
US20190266257A1 (en) Vector similarity search in an embedded space
US8527585B2 (en) Prereading method and system for web browser
US11294974B1 (en) Golden embeddings
US20050234848A1 (en) Methods and systems for information capture and retrieval
US20180246973A1 (en) User interest modeling
US20180246974A1 (en) Enhanced search for generating a content feed
US8639687B2 (en) User-customized content providing device, method and recorded medium
US20070282797A1 (en) Systems and methods for refreshing a content display
US10929036B2 (en) Optimizing static object allocation in garbage collected programming languages
US20180246972A1 (en) Enhanced search to generate a feed based on a user's interests
US9378299B1 (en) Browsing pages in an electronic document
TWI417751B (zh) Information providing device, information providing method, information application program, and information recording medium
US20160371708A1 (en) Method and apparatus for determining a user's level of interest in web-based content
US9256343B1 (en) Dynamically modifying an electronic article based on commentary
US9152948B2 (en) Method and system for providing a structured topic drift for a displayed set of user comments on an article
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
JP5591608B2 (ja) 情報提供システム、情報提供方法、及び情報提供プログラム
JP2014222474A (ja) 情報処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140730

R150 Certificate of patent or registration of utility model

Ref document number: 5591608

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250