JP5535193B2 - 重複を最低限に抑えるWebフィードを集約するための方法 - Google Patents
重複を最低限に抑えるWebフィードを集約するための方法 Download PDFInfo
- Publication number
- JP5535193B2 JP5535193B2 JP2011504433A JP2011504433A JP5535193B2 JP 5535193 B2 JP5535193 B2 JP 5535193B2 JP 2011504433 A JP2011504433 A JP 2011504433A JP 2011504433 A JP2011504433 A JP 2011504433A JP 5535193 B2 JP5535193 B2 JP 5535193B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- feed
- stored
- updated
- updated content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000004931 aggregating effect Effects 0.000 title claims description 4
- 239000013589 supplement Substances 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9577—Optimising the visualization of content, e.g. distillation of HTML documents
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Description
・予め定められたWebフィードから更新されたコンテンツを取り出すステップと、
・前記更新されたコンテンツを、以前取り出された(および例えばフィード履歴データベース内に入力として格納されている)格納済みコンテンツと比較するステップと、
・格納済みコンテンツとは異なると考えられる場合、更新されたコンテンツを格納するステップと、
・格納済みコンテンツと同じと考えられる場合、更新されたコンテンツを削除するステップと
を含む。
・格納済みコンテンツを補うと考えられる場合、更新されたコンテンツを格納済みコンテンツに追加するステップと、
・更新されたコンテンツと格納済みコンテンツとの間の類似度を示すための類似度指数sk jを計算するステップと、
・前記類似度指数sk jを1つまたは複数の閾値と比較するステップとが提供され得る。より詳細には、類似度指数sk jが2つの閾値SminおよびSmaxと比較され、それによって
・類似度指数sk jがSmin未満である場合、更新されたコンテンツが格納済みコンテンツとは異なると考えられ、
・類似度指数sk jがSmaxを上回る場合、更新されたコンテンツが格納済みコンテンツと同じであると考えられ、したがってそれに追加され、
・類似度指数sk jがSminとSmaxとの間に含まれる場合、更新されたコンテンツが格納済みコンテンツを補うと考えられる。
・予め定められたWebフィードから、更新されたコンテンツをチェックし、取り出すように構成されたフィード・リーダと、
・前記更新されたコンテンツと以前取り出された格納済みコンテンツとの比較を管理するように構成されたフィルタ・モジュールと、
・コンテンツを格納するためのフィード履歴データベースと
を含むフィード・アグリゲータを提供する。
・更新されたコンテンツと格納済みコンテンツとの間の類似度を示す類似度指数sk jを計算し、
・前記類似度指数を1つまたは複数の閾値と比較して、更新されたコンテンツがフィード履歴データベースから削除されるべきか、それに追加されるべきかを判定する
ように構成され得る。
・フィード・アグリゲータ1から削除すべきであるか
・新しい入力としてデータベース5内に格納すべきであるか
・またはデータベース5内の既存の入力に追加すべきであるか
を決定するように構成されている。
・タイトルの基本的な文字列比較
・比較されたコンテンツ間の共通のキーワードを決定するための構文解析
・比較されたコンテンツで使用される共通のオントロジ概念を決定するためのセマンティックベースの分析
を介して実現することができる。比較の分野を限定するために、オントロジ領域は、入力Ekに関連付けられた予め定められたタグによって制限することができる。
・sk j<Sの場合、FjはEkとは異なると考えられ、
・sk j≧の場合、FjはEkと同じであると考えられる。
・sk j≦Sminの場合、FjはEkとは異なると考えられ、
・sk j≧Smaxの場合、FjはEkと同じであると考えられ、
・Smin<sk j<Smaxの場合、FjはEkを補うと考えられる。
・FjがEkとは異なると考えられる(sk j≦Smin)場合、Fjは、次の入力と比較されるものとする。より詳細には、kは1ずつ増分され(150)、比較プロセスはFjおよびEk+1を使用して反復される。入力Ekが最後のもの(k=N)である場合、Fjは、すべての入力Ek(1≦k≦N)とは異なると考えられるので、フィルタ・モジュール4によって履歴アクセス・モジュール7に提供されて、新しい入力EN+1としてフィード履歴データベース5内に格納される(160)。
・FjがEkと同じであると考えられる(sk j≧Smax)場合、これは、FjがEkと重複している(したがって役に立たない)ことを意味し、Fjがフィルタ・モジュール4によって削除される(すなわちフィード・アグリゲータ1から消去される)(170)。
・FjがEkを補うと考えられる(Smin<sk j<Smax)場合、フィルタ・モジュール4によってEkに追加されるか、それと結合され、これは、既存の入力Ekを修正し、履歴アクセス・モジュール7に修正された入力Ekを提供して、フィード履歴データベース5内で以前格納された入力Ekと置き換えるようにする。
Claims (10)
- シンジケートされたWebコンテンツを集約する方法であって、
予め定められたWebフィードから更新されたコンテンツを取り出すステップ(100)と、
前記更新されたコンテンツを、以前取り出された格納済みコンテンツと比較するステップ(120)と、
前記格納済みコンテンツとは異なると考えられる場合、前記更新されたコンテンツを格納するステップ(160)と、
前記格納済みコンテンツと同じと考えられる場合、前記更新されたコンテンツを削除するステップ(170)とを含み、
前記更新されたコンテンツと前記格納済みコンテンツとの間の類似度を示すための類似度指数sk jが2つの閾値SminおよびSmaxと比較され、
前記類似度指数sk jがSmin未満である場合、前記更新されたコンテンツが前記格納済みコンテンツとは異なると考えられ、
前記類似度指数sk jがSmaxを上回る場合、前記更新されたコンテンツが前記格納済みコンテンツと同じであると考えられ、
前記閾値S min およびS max がユーザ間で異なり得る、方法。 - 格納済みコンテンツを補うと考えられる場合、前記更新されたコンテンツを格納済みコンテンツに追加するステップ(180)をさらに含む、請求項1に記載の方法。
- 前記更新されたコンテンツと前記格納済みコンテンツとの間の類似度を示すための類似度指数sk jを計算するステップ(130)を含む、請求項1または2のいずれか1項に記載の方法。
- 前記類似度指数sk jを1つまたは複数の閾値と比較するステップを含む、請求項3に記載の方法。
- 前記類似度指数sk jがSminとSmaxとの間にある場合、前記更新されたコンテンツが前記格納済みコンテンツを補うと考えられる、請求項4に記載の方法。
- 格納済みコンテンツと同じであると考えられる更新されたコンテンツが前記格納済みコンテンツに追加される、請求項1乃至5のいずれか1項に記載の方法。
- 以前取り出されたコンテンツがフィード履歴データベース内の入力として格納される、請求項1乃至6のいずれか1項に記載の方法。
- 予め定められたWebフィード(3)から、更新されたコンテンツをチェックし、取り出すように構成されたフィード・リーダ(2)と、
前記更新されたコンテンツと以前取り出された格納済みコンテンツとの比較を管理するように構成されたフィルタ・モジュール(4)と、
コンテンツを格納するためのフィード履歴データベース(5)とを含み、
前記フィルタ・モジュールが、前記更新されたコンテンツと前記格納済みコンテンツとの間の類似度を示すための類似度指数sk jが2つの閾値SminおよびSmaxと比較し、
前記類似度指数sk jがSmin未満である場合、前記更新されたコンテンツが前記格納済みコンテンツとは異なると考えられ、
前記類似度指数sk jがSmaxを上回る場合、前記更新されたコンテンツが前記格納済みコンテンツと同じであると考えられ、
前記閾値S min およびS max がユーザ間で異なり得る、
フィード・アグリゲータ(1)。 - 前記更新されたコンテンツを格納済みコンテンツと比較するように構成された、前記フィルタ・モジュール(4)にリンクされた1つまたは複数の入力アナライザ(6)をさらに含む、請求項8に記載のフィード・アグリゲータ(1)。
- 前記1つまたは複数の入力アナライザ(6)が前記更新されたコンテンツと前記格納済みコンテンツとの間の類似度を示す類似度指数sk jを計算するように構成され、前記フィルタ・モジュール(4)が、前記類似度指数を1つまたは複数の閾値と比較して、前記更新されたコンテンツが前記フィード履歴データベース(5)から削除されるべきか、それに追加されるべきかを判定するように構成される、請求項9に記載のフィード・アグリゲータ(1)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP08290366A EP2110760A1 (en) | 2008-04-14 | 2008-04-14 | Method for aggregating web feed minimizing redudancies |
EP08290366.7 | 2008-04-14 | ||
PCT/EP2009/054324 WO2009144078A1 (en) | 2008-04-14 | 2009-04-09 | Method for aggregating web feed minimizing redundancies |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011517822A JP2011517822A (ja) | 2011-06-16 |
JP5535193B2 true JP5535193B2 (ja) | 2014-07-02 |
Family
ID=39720679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011504433A Expired - Fee Related JP5535193B2 (ja) | 2008-04-14 | 2009-04-09 | 重複を最低限に抑えるWebフィードを集約するための方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8521702B2 (ja) |
EP (1) | EP2110760A1 (ja) |
JP (1) | JP5535193B2 (ja) |
KR (1) | KR101595748B1 (ja) |
CN (1) | CN102037465B (ja) |
WO (1) | WO2009144078A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2952203B1 (fr) | 2009-11-05 | 2012-08-17 | Canon Kk | Procede de generation d'un flux web et un systeme associe |
US9098311B2 (en) | 2010-07-01 | 2015-08-04 | Sap Se | User interface element for data rating and validation |
US9208252B1 (en) * | 2011-01-31 | 2015-12-08 | Symantec Corporation | Reducing multi-source feed reader content redundancy |
CA2802739C (en) * | 2011-04-11 | 2014-08-12 | Scribble Technologies Inc. | System and method for syndicating dynamic content for online publication |
US8832301B2 (en) * | 2011-07-21 | 2014-09-09 | Parlant Technology | System and method for enhanced event participation |
US9288165B1 (en) | 2011-07-21 | 2016-03-15 | Parlant Technology, Inc. | System and method for personalized communication network |
US9195771B2 (en) * | 2011-08-09 | 2015-11-24 | Christian George STRIKE | System for creating and method for providing a news feed website and application |
US8443003B2 (en) * | 2011-08-10 | 2013-05-14 | Business Objects Software Limited | Content-based information aggregation |
CN103106585B (zh) * | 2011-11-11 | 2016-05-04 | 阿里巴巴集团控股有限公司 | 产品信息的实时去重方法和装置 |
US9953079B2 (en) | 2013-09-17 | 2018-04-24 | International Business Machines Corporation | Preference based system and method for multiple feed aggregation and presentation |
CN106339374A (zh) * | 2015-07-06 | 2017-01-18 | 天津九洲云物联科技有限公司 | 用于嵌入式系统中的文件型实时历史数据库算法 |
CN105912615A (zh) * | 2016-04-05 | 2016-08-31 | 重庆大学 | 一种基于人类语音内容索引的音频和视频文件管理方法 |
CN111787390B (zh) * | 2020-09-07 | 2020-11-24 | 武汉工程大学 | 基于信息分发系统的内容分发装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3810463B2 (ja) * | 1995-07-31 | 2006-08-16 | 株式会社ニューズウオッチ | 情報フィルタリング装置 |
JPH1185779A (ja) * | 1997-09-03 | 1999-03-30 | Matsushita Electric Ind Co Ltd | 電子ファイル管理装置、電子ファイル管理方法及びその方法を記録した記録媒体 |
JP2002215676A (ja) * | 2001-01-12 | 2002-08-02 | Hitachi Tohoku Software Ltd | 関連情報検索方法、関連情報蓄積方法、関連情報検索装置および関連情報検索のための記録媒体 |
JP3894428B2 (ja) * | 2002-02-20 | 2007-03-22 | 日本ビクター株式会社 | 情報抽出方法、情報検索方法及び情報抽出コンピュータプログラム |
US20080034058A1 (en) | 2006-08-01 | 2008-02-07 | Marchex, Inc. | Method and system for populating resources using web feeds |
US20080046543A1 (en) | 2006-08-18 | 2008-02-21 | Realnetworks | System and method for automatically obtaining web feed content |
JP2008071296A (ja) * | 2006-09-15 | 2008-03-27 | Ricoh Co Ltd | データ管理装置、データ管理方法およびデータ管理プログラム |
WO2008065679A2 (en) * | 2006-11-27 | 2008-06-05 | Gautam Dharamdas Goradia | An interactive system |
US20090089380A1 (en) * | 2007-09-28 | 2009-04-02 | Microsoft Corporation | Aggregating and Delivering Information |
-
2008
- 2008-04-14 EP EP08290366A patent/EP2110760A1/en not_active Ceased
-
2009
- 2009-04-09 JP JP2011504433A patent/JP5535193B2/ja not_active Expired - Fee Related
- 2009-04-09 WO PCT/EP2009/054324 patent/WO2009144078A1/en active Application Filing
- 2009-04-09 CN CN200980118076.1A patent/CN102037465B/zh active Active
- 2009-04-09 KR KR1020107025292A patent/KR101595748B1/ko not_active IP Right Cessation
- 2009-04-09 US US12/937,795 patent/US8521702B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8521702B2 (en) | 2013-08-27 |
EP2110760A1 (en) | 2009-10-21 |
CN102037465A (zh) | 2011-04-27 |
JP2011517822A (ja) | 2011-06-16 |
KR20110009142A (ko) | 2011-01-27 |
WO2009144078A1 (en) | 2009-12-03 |
CN102037465B (zh) | 2015-03-04 |
KR101595748B1 (ko) | 2016-02-29 |
US20110119239A1 (en) | 2011-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5535193B2 (ja) | 重複を最低限に抑えるWebフィードを集約するための方法 | |
CN103339623B (zh) | 涉及因特网搜索的方法和设备 | |
US8832058B1 (en) | Systems and methods for syndicating and hosting customized news content | |
US9594826B2 (en) | Co-selected image classification | |
CN102368262B (zh) | 一种提供与查询序列相对应的搜索建议的方法与设备 | |
US20080082486A1 (en) | Platform for user discovery experience | |
US20080005091A1 (en) | Visual and multi-dimensional search | |
US20080005105A1 (en) | Visual and multi-dimensional search | |
Shi et al. | Learning-to-rank for real-time high-precision hashtag recommendation for streaming news | |
US20080077494A1 (en) | Advertisement Selection For Peer-To-Peer Collaboration | |
WO2009108576A2 (en) | Prioritizing media assets for publication | |
US20140201203A1 (en) | System, method and device for providing an automated electronic researcher | |
US9860337B1 (en) | Machine-based identification of content with differing opinions | |
WO2010014082A1 (en) | Method and apparatus for relating datasets by using semantic vectors and keyword analyses | |
US20100125781A1 (en) | Page generation by keyword | |
US20100094826A1 (en) | System for resolving entities in text into real world objects using context | |
US20080140607A1 (en) | Pre-cognitive delivery of in-context related information | |
US20080077580A1 (en) | Content Searching For Peer-To-Peer Collaboration | |
US20080077669A1 (en) | Peer-To-Peer Learning For Peer-To-Peer Collaboration | |
CN106462588B (zh) | 来自所提取的内容的内容创建 | |
US20160299972A1 (en) | Providing app store search results | |
CN107025261B (zh) | 主题网络语料库 | |
US20080077576A1 (en) | Peer-To-Peer Collaboration | |
CN111723201A (zh) | 一种用于文本数据聚类的方法和装置 | |
CN112016017A (zh) | 确定特征数据的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120406 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140228 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5535193 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |