JP2011065633A - 情報提供システム、情報提供方法、及び情報提供プログラム - Google Patents
情報提供システム、情報提供方法、及び情報提供プログラム Download PDFInfo
- Publication number
- JP2011065633A JP2011065633A JP2010164880A JP2010164880A JP2011065633A JP 2011065633 A JP2011065633 A JP 2011065633A JP 2010164880 A JP2010164880 A JP 2010164880A JP 2010164880 A JP2010164880 A JP 2010164880A JP 2011065633 A JP2011065633 A JP 2011065633A
- Authority
- JP
- Japan
- Prior art keywords
- word
- article
- interest
- user
- information providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
【解決手段】情報提供システム1は、更新された記事を収集してユーザの携帯端末20に表示する。この情報提供システム1の一部を成すサーバ10は、過去に収集された記事内の単語と該単語に対するユーザの単語興味度とが関連付けられた単語データを記憶する単語データベース13と、収集した記事と単語データとを比較して、該記事に対するユーザの記事興味度を算出する評価部14と、算出された記事興味度が所定の閾値以上の記事を優先的に端末に表示させる送信部15と、所定の時間が経過した単語データの単語興味度を下げるように単語データベース13を更新することで、該単語データが記事興味度の算出に与える影響度を下げる更新部17と、を備えている。
【選択図】図1
Description
個人向けのRSSフィードとユーザの興味の移り変わりのサポートとを実現するために、収集処理、評価処理、表示処理、学習処理、及び操作処理という5段階の処理が存在する(図12,13参照)。システムはRSSフィードを収集して格納し、ユーザの過去の選択を用いて記事の興味度を算出する。その後、システムはRSSフィード及びその興味度を表示する。そして、システムはユーザ操作を監視し、“興味あり”又は“興味なし”として選択された記事内の単語を次の記事評価のためにコーパスに追加する。
RSSフィードを集約して格納するために、周期的に又はユーザリクエストにより収集処理がスケジュールされる。RSSフィードはXML(Extensible Markup Language)形式で記述された情報を含んでおり、システムはその情報を解析することで、タイトル、要約、日付、及びURL(Uniform Resource Locator)という有用な情報を選択する。
RSSフィードを取得すると、記事のタイトル及び要約がテキスト分割を用いて取り除かれる。これは、意味のある実語(full word)を分割するための処理である。RSSフィードが日本語又は中国語を含んでいる場合には、システムは下記参考文献1〜4などに示されているような形態素解析のサポートを要求する。続いて、記事の単語が過去の二種類の記事(“興味あり”の記事と“興味なし”の記事)と比較され、ベイジアン・フィルタを用いてコーパスとして抽象化される。ベイジアン・フィルタは記事を評価するためのいくつかの手法を備えている。
(参考文献2)KAKASI - Kanji Kana Simple Inverter ,http://kakasi.namazu.org/index.html.en
(参考文献3)Masayuki Asahara and Yuji Matsumoto,"Extended models and tools for high-performance part-of-speechtagger," In Proceedings of the 18th International Conference onComputational Linguistics, pages 21-27, 2000
(参考文献4)Taku Kudo, Kaoru Yamamoto, and YujiMatsumoto, "Applying conditional random fields to Japanese morphologicalanalysis," In Proceedings of the 2004 Conference on Empirical Methods inNatural Language Processing, pages 230-237, Barcelona, 2004
(参考文献6)PaulGraham, "Better bayesian filtering," WWW Page, 2003.http://www.paulgraham.com/better.html.
個人向けのRSSフィードの集約はベイジアン・フィルタを組み込んだものであり、収集処理後に記事の興味度を計算することができるものである。したがって、システムは興味度が高い記事を強調して表示し、興味度が低い記事の優先度を下げるか又は表示すらしないようにする。このような効果を実現するために、システムは未読の記事を興味度の降順にソートし表示する。表示する記事の範囲は、未読記事すべてから、直近1時間、24時間、一週間、任意の1日、あるいは任意の一週間などの間にアクセスされた記事まで様々である。更に、システムは、“興味あり”又は“興味なし”の記事として表示される単語数毎に、フォントサイズや色の濃度に応じて調整されたコーパス内の単語を含むタググラフを表示する。
(演算負荷の削減)
ベイジアン・フィルタは次の記事評価のために単語を“興味あり”及び“興味なし”の記事から二種類のコーパスに正す必要がある。単語数が増えると不正確な評価の回数が減る。演算の観点からすると、システムはこれらの計算を実行するために時間を要し、評価処理中に記事からすべてのコーパスを取得して保持するならばメモリを消費する。
システムは基本的にコーパス内の“興味あり”の単語および“興味なし”の単語のすべてを保持するが、長期間の学習処理により、ある程度時間が経つと興味度が高いコンテンツに偏るおそれがある。このような結果はユーザの意図に反するものとなってしまう。過去の選択の影響を緩和するために、システムは、下記のいずれかの手法を用いてある期間においてコーパスに単語を追加したり記事数を追加したりする制御メカニズムを用いてもよい。
(ii)ある時間の経過後に又は記事数に基づいて、影響度を指数関数的に減少させること
(iii)ある時間の経過後に又は記事数に基づいて、影響度を線形的に減少させること(図15(b))
(iv)制限時間又は記事数に基づいて影響度を一律に減少させること(図15(c))
(v)周期的に且つ間欠的に影響度を一律に減少させること(図16(a))
(vi)影響度を迅速に緩和するために、ある時間の経過後に又は記事数に基づいて、“興味あり”の記事を“興味なし”の記事に変えること(図16(b))
ユーザが自身のPCを用いてRSSフィードを見る場合には、システムは、好き/嫌い、スター(0〜5)、あるいはタグ付けなどといった何らかの評価手法を用いて、ユーザの“興味ある”の記事又は“興味ない”の記事を詳細に捉えることができる。他には、ユーザが興味あると判断した単語やその単語を含む記事をコーパス辞書に追加する手法がある。ユーザの選択をより効果的に配するために、システムは、記事が読まれるまで時間が経った場合に、評価する割合を下げてもよい。さらに、ユーザが何らかのポインティング・デバイスを用いて記事を選択した場合には、クリックされた領域内のタイトルあるいは概要の単語は他のものよりも高く評価されてもよい。
・興味なし:ユーザが記事を読むために選ばなかった場合には、システムはその記事を「興味のない記事」と判定する。
“興味なし”の記事が“興味あり”の記事として学習されるのを避けるために、システムは取消メカニズムを追加して、オリジナルの記事の閲読後に“興味あり”とされた記事を“興味なし”として緩和する。
・取消し:ユーザがオリジナルの記事を読んだ後にその記事に対して当てが外れたと感じた場合には、システムは“興味あり”の記事の選択を“興味なし”の記事として取り消すことを許容する。
(ii)興味あり:タップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(iii)興味あり:2回のタップ操作、興味なし:二本指でのスワイプ操作、取消し:指で「x」を描くジェスチャ
(iv)興味あり:2回のタップ操作、興味なし:二本指でのスワイプ操作、取消し:3回のタップ操作
(v)興味あり:2回のタップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(vi)(通常よりも)興味あり:2回のタップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(vii)(通常よりもはるかに)興味あり:3回のタップ操作、興味なし:操作なし、取消し:二本指でのスワイプ操作
(viii)興味あり:2回のタップ操作、(通常よりも)興味なし:三本指でのスワイプ操作、取消し:3回のタップ操作
(ix)興味あり:2回のタップ操作、(通常よりもはるかに)興味なし:四本指でのスワイプ操作:取消し:3回のタップ操作
(ウェブベース型)
この発明はウェブベース及びクライアントソフトウェア(図19,20)のどちらにも実装可能である。ウェブベース型のシステムは、ウェブサイト内のRSSフィード及びウェブサイトへのユーザアクセスを集約して、すべての更新をチェックする(図21)。RSSフィードの集約及び記事の算出はユーザアクセスに基づいて互いに独立して予定される。評価処理では、システムの記憶手段に格納されている、過去のユーザ選択に基づいたコーパスが用いられる。これによりユーザは、評価値が付された最新のRSSフィードや、最も興味のある記事のRSSフィードを得ることができる。ここでRSSフィードは、他のユーザの行動に関係なくシステムから提供される日付、ウェブサイト、又は確率により区分けされる。更にユーザは、RSSフィードの集約のスケジュールにより記事が周期的に更新されていても、記事を見逃すことなく閲覧ことができる。
クライアントソフトウェア型システムは、ユーザのPCや携帯電話機内のRSSフィードを集約し、ユーザに対してディレクトリを表示する(図22)。このシステムは、ウェブベース型のようにRSSフィードを修正することなく、ユーザの選択ディレクトリを取得する。システムが収集及び評価の処理をバックグラウンドで実行できるならば、ウェブベース型と同様に処理を行っているように見える。それ以外の場合には、システムは収集及び評価処理をユーザ要求の後に開始する。
本発明は主に二つの主要な効果を奏する。第一に、本発明により個人向けのRSSフィードが可能になる。よって、ユーザは有用な記事を効果的に特定することができる。システムの観点からすると、このシステムは不要な記事の提供を避けることができ、これによりユーザは、同じ帯域幅の下で別のデータを送信したり、パケットベースの課金の場合に費用を節約したりすることができる。このような特徴は特に、一般に処理能力が低く画面が小さい携帯用アプリケーションにとって重要である。第二に、本発明では、ウェブベース型のシステムが当該システム内のすべてのデータを管理するので、PCや携帯電話機を用いたウェブの閲覧が補完される。その結果、環境や装置に応じて、閲覧の形態を広範囲にわたる記事の乱読と記事の精読とに分けることができる。
Claims (11)
- 更新された記事を収集してユーザの端末に表示するための情報提供システムであって、
過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段と、
収集した記事と前記単語データとを比較して、該記事に対する前記ユーザの記事興味度を算出する算出手段と、
前記算出手段により算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示手段と、
所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新手段と、
を備えることを特徴とする情報提供システム。 - 前記更新手段が、前記単語を含む記事の収集時期に応じた重みをカウント値に乗じた値を累計することで該単語の単語興味度を算出し、算出した単語興味度により前記単語データを更新し、
収集時期に関する第1の時間範囲における前記重みよりも、該第1の収集時期よりも過去の第2の時間範囲における前記重みの方が小さい、
ことを特徴とする請求項1に記載の情報提供システム。 - 前記重みが、所定の時点から前記収集時期を遡るにしたがって線形的に小さくなってゆく、
ことを特徴とする請求項2に記載の情報提供システム。 - 前記重みが、所定の時点から前記収集時期を遡るにしたがって指数関数的に小さくなってゆく、
ことを特徴とする請求項2に記載の情報提供システム。 - 前記重みが、現時点を含む前記第1の時間範囲では0より大きい固定値であり、前記第2の時間範囲では0である、
ことを特徴とする請求項2に記載の情報提供システム。 - 前記第1の時間範囲と前記第2の時間範囲とが周期的に繰り返され、
前記重みが、前記第1の時間範囲では0より大きい固定値であり、前記第2の時間範囲では0である、
ことを特徴とする請求項2に記載の情報提供システム。 - 前記重みが、前記第1の時間範囲では0より大きく、前記第2の時間範囲では0より小さく、該第2の収集時期よりも過去の第3の時間範囲では0である、
ことを特徴とする請求項2に記載の情報提供システム。 - 前記更新手段が、対応する単語を含む記事が収集されなくなってから所定の時間が経過した単語データの単語興味度を0に更新するか又は該単語データを前記記憶手段から削除する、
請求項1〜7のいずれか一項に記載の情報提供システム。 - 前記更新手段が、対応する単語を含む記事が前記端末に表示されなくなってから所定の時間が経過した単語データの単語興味度を0に更新するか又は該単語データを前記記憶手段から削除する、
請求項1〜8のいずれか一項に記載の情報提供システム。 - 更新された記事を収集してユーザの端末に表示するための情報提供システムにより実行される情報提供方法であって、
過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段を参照して、収集した記事と前記単語データとを比較し、該記事に対する前記ユーザの記事興味度を算出する算出ステップと、
前記算出ステップにおいて算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示ステップと、
所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新ステップと、
を含むことを特徴とする情報提供方法。 - コンピュータを、更新された記事を収集してユーザの端末に表示するための情報提供システムとして機能させる情報提供プログラムであって、
前記コンピュータに、
過去に収集された記事内の単語と該単語に対する前記ユーザの単語興味度とが関連付けられた単語データを記憶する記憶手段の機能と、
収集した記事と前記単語データとを比較して、該記事に対する前記ユーザの記事興味度を算出する算出機能と、
前記算出機能により算出された記事興味度が所定の閾値以上の記事を優先的に前記端末に表示させる表示機能と、
所定の時間が経過した単語データの単語興味度を下げるように前記記憶手段を更新することで、該単語データが前記記事興味度の算出に与える影響度を下げる更新機能と、
を実現させることを特徴とする情報提供プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24269609P | 2009-09-15 | 2009-09-15 | |
US61/242,696 | 2009-09-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011065633A true JP2011065633A (ja) | 2011-03-31 |
JP5591608B2 JP5591608B2 (ja) | 2014-09-17 |
Family
ID=43951756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010164880A Active JP5591608B2 (ja) | 2009-09-15 | 2010-07-22 | 情報提供システム、情報提供方法、及び情報提供プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5591608B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3226185A1 (en) | 2016-03-31 | 2017-10-04 | Fujitsu Limited | Search program, search method, and information processing apparatus |
JP2019503014A (ja) * | 2016-01-25 | 2019-01-31 | アリババ グループ ホウルディング リミテッド | ユーザ挙動データの処理方法及び装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080010337A1 (en) * | 2006-07-07 | 2008-01-10 | Attensa, Inc. | Analysis and selective display of rss feeds |
JP2008108105A (ja) * | 2006-10-26 | 2008-05-08 | Ntt Comware Corp | 情報提供装置、情報提供方法および情報提供プログラム |
-
2010
- 2010-07-22 JP JP2010164880A patent/JP5591608B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080010337A1 (en) * | 2006-07-07 | 2008-01-10 | Attensa, Inc. | Analysis and selective display of rss feeds |
JP2008108105A (ja) * | 2006-10-26 | 2008-05-08 | Ntt Comware Corp | 情報提供装置、情報提供方法および情報提供プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019503014A (ja) * | 2016-01-25 | 2019-01-31 | アリババ グループ ホウルディング リミテッド | ユーザ挙動データの処理方法及び装置 |
JP7085486B2 (ja) | 2016-01-25 | 2022-06-16 | アリババ グループ ホウルディング リミテッド | ユーザ挙動データの処理方法及び装置 |
EP3226185A1 (en) | 2016-03-31 | 2017-10-04 | Fujitsu Limited | Search program, search method, and information processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP5591608B2 (ja) | 2014-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11347752B2 (en) | Personalized user feed based on monitored activities | |
US9043259B2 (en) | Systems and methods for recommending media content items | |
KR101728927B1 (ko) | 사회적 거리에 기초한 콘텐츠 항목의 사전 인출 | |
US8631001B2 (en) | Systems and methods for weighting a search query result | |
US7895227B1 (en) | System and method for detecting trends in network-based content | |
US9098572B1 (en) | Magazine edition recommendations | |
US10909148B2 (en) | Web crawling intake processing enhancements | |
US20190266257A1 (en) | Vector similarity search in an embedded space | |
US8527585B2 (en) | Prereading method and system for web browser | |
US11294974B1 (en) | Golden embeddings | |
US20050234848A1 (en) | Methods and systems for information capture and retrieval | |
US20180246973A1 (en) | User interest modeling | |
US20180246974A1 (en) | Enhanced search for generating a content feed | |
US8639687B2 (en) | User-customized content providing device, method and recorded medium | |
US20070282797A1 (en) | Systems and methods for refreshing a content display | |
US10929036B2 (en) | Optimizing static object allocation in garbage collected programming languages | |
US20180246972A1 (en) | Enhanced search to generate a feed based on a user's interests | |
US9378299B1 (en) | Browsing pages in an electronic document | |
TWI417751B (zh) | Information providing device, information providing method, information application program, and information recording medium | |
US20160371708A1 (en) | Method and apparatus for determining a user's level of interest in web-based content | |
US9256343B1 (en) | Dynamically modifying an electronic article based on commentary | |
US9152948B2 (en) | Method and system for providing a structured topic drift for a displayed set of user comments on an article | |
TWI399657B (zh) | A provider, a method of providing information, a program, and an information recording medium | |
JP5591608B2 (ja) | 情報提供システム、情報提供方法、及び情報提供プログラム | |
JP2014222474A (ja) | 情報処理装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140730 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5591608 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |