CN102037465A - 使冗余最小化的Web馈送聚合方法 - Google Patents

使冗余最小化的Web馈送聚合方法 Download PDF

Info

Publication number
CN102037465A
CN102037465A CN2009801180761A CN200980118076A CN102037465A CN 102037465 A CN102037465 A CN 102037465A CN 2009801180761 A CN2009801180761 A CN 2009801180761A CN 200980118076 A CN200980118076 A CN 200980118076A CN 102037465 A CN102037465 A CN 102037465A
Authority
CN
China
Prior art keywords
update content
memory contents
content
think
similarity index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801180761A
Other languages
English (en)
Other versions
CN102037465B (zh
Inventor
P·雅博
G·比尔恩西德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Alcatel Optical Networks Israel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel Optical Networks Israel Ltd filed Critical Alcatel Optical Networks Israel Ltd
Publication of CN102037465A publication Critical patent/CN102037465A/zh
Application granted granted Critical
Publication of CN102037465B publication Critical patent/CN102037465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种用于聚合联合Web内容的方法,包括步骤:从预定Web馈送获取(100)更新内容;将所述更新内容与先前获取的已存储内容进行比较(120);如果认为该更新内容不同于已存储内容,则存储(160)该更新内容;如果认为该更新内容与已存储内容相同,则删除(170)该更新内容。

Description

使冗余最小化的Web馈送聚合方法
技术领域
本发明涉及Web馈送(feed)的聚合。
背景技术
自从开始于20世纪90年代早期起,万维网(World Wide Web)已经变得非常流行,它现在包括数以亿计的Web页面,这些Web页面包括诸如文本、图像、视频以及去往其他Web页面的链接(也称为超链接)等各种内容。数以亿计的Web冲浪者每天在使用着万维网。
现在,上线是非常简单的,既不需要专门技艺也不需要国家或国际机构前的专门过程,事实上也不存在这样的机构。令人惊讶的是,尽管任何人都将受益于这种分类,但并没有尝试对Web进行分类以便将Web站点按类分组(基于预定标准)。因此,Web冲浪者获取重要、可靠的更新信息变得越来越难。当然,Web浏览器是有帮助的,但是随着Web页面的数目增加,大量语义搜索请求得到的是未加工的内容,这些内容大多数未经分类,常常是冗余的,不明确的,最后简单来说,是没有用的。
在21世纪的早些时候,提出了一种称为联合(syndication)的解决方案,以帮助冲浪者在正确的时刻得到正确的信息。在联合中,一个Web站点的部分可用于其他Web站点。更具体地,在Web联合中,内容(通常称为Web馈送)以特定格式——通常是基于XML的格式(XML为可扩展标记语言),诸如RSS(真正简易联合)或Atom——被置于Web站点上,并且与馈送链接相关联,另一用户(客户端)可以订阅馈送链接,以借助于称为馈送聚合器(也称为馈送阅读器或新闻阅读器)的、在客户端的终端或服务器上本地运行的特定应用来获取相应的内容。
在已经订阅馈送的情况下,馈送聚合器可以配置用于以预定的间隔(可以是用户定义的)检查和获取更新的内容。现代Web浏览器通常包括内置的聚合器,诸如iGoogleTM和My YahooTM。美国专利申请号US 2008/0034058(已转让给Marchex公司)和US2008/0046543(已转让给RealNetworks)都示出了用于获得Web馈送的方法。
尽管馈送聚合器是用于从万维网获取更新信息并通过用户友好的图形接口(GUI)使其可由最终用户获得的强大资源,但是文章的量有时可能是压倒性的,特别是当用户已经订阅了很多Web馈送时。为了解决这一问题,某些馈送聚合器包括允许用户利用关键词为馈送添加标签的功能,以便将可用的文章分类和过滤到易于导航的类别中。然而,该方式是耗时的,因为用户必须对他希望从其获得更新内容的馈送进行预先分类。而且,当要获取的内容随着每次更新改变主题时(例如,在报纸网站中),为Web馈送添加标签是完全无用的。
发明内容
显然,需要一种允许Web冲浪者以完全可行的方式自动地获得从Web馈送获取的信息的方案。
本发明的目的是提供这样的方案。
由此,根据一个方面,本发明提供一种用于聚合联合Web内容的方法,包括步骤:
-从预定Web馈送获取更新内容;
-将所述更新内容与先前获取的已存储内容(例如,存储为馈送历史数据库中的条目)进行比较;
-如果认为更新内容不同于已存储内容,则存储更新内容;
-如果认为更新内容与已存储内容相同,则删除更新内容。
可以提供进一步的步骤,即如下步骤:
-如果认为更新内容是已存储内容的补充,则向该已存储内容添加该更新内容;
-计算相似性索引
Figure BPA00001256733700031
其表示更新内容与已存储内容之间的相似性程度;
-将所述相似性索引
Figure BPA00001256733700032
与一个或多个阈值进行比较。更具体地,将相似性索引
Figure BPA00001256733700033
与两个阈值Smin和Smax进行比较,由此
-如果相似性索引
Figure BPA00001256733700034
低于Smin,则认为更新内容不同于已存储内容;
-如果相似性索引
Figure BPA00001256733700035
大于Smax,则认为更新内容与已存储内容相同,并可以因此向已存储内容添加该更新内容;
-如果相似性索引
Figure BPA00001256733700036
在Smin与Smax之间,则认为更新内容是已存储内容的补充。
根据另一方面,本发明提供一种馈送聚合器,包括:
-馈送阅读器,配置用于检查和获取来自预定Web馈送的更新内容;
-过滤模块,配置用于管理所述更新内容与先前获取的已存储内容的比较;
-馈送历史数据库,用于存储内容。
馈送聚合器还可以包括一个或多个条目分析器,其链接至过滤模块,配置用于将所述更新内容与已存储内容进行比较。更具体地,一个或多个条目分析器可以配置用于:
-计算相似性索引
Figure BPA00001256733700037
其表示更新内容与已存储内容之间的相似性程度;以及
-将所述相似性索引与一个或多个阈值进行比较,以确定更新内容应被移除还是被添加至馈送历史数据库。
通过结合附图考虑对优选实施方式的详细描述,本发明的上述以及其他目的和优点将变得显然。
附图说明
图1是示出根据本发明的馈送聚合器的结构的图示。
图2是根据本发明的用于聚合联合Web内容的方法的流程图。
具体实施方式
现在转到附图,在图1中示出了一个馈送聚合器1,其实现为诸如个人计算机(PC)、服务器、通信个人数字助理(PDA)、智能电话等计算机设备的处理单元上的计算机程序。
馈送聚合器1包括馈送读取器模块2,其配置用于检查和获取来自远程Web站点上提供的Web馈送3的更新联合Web内容。尽管馈送聚合器1优选地配置用于处理RSS馈送,但是也可以使用任何其他格式(诸如,Atom)。在图1中绘出了三个Web馈送3,这仅仅是出于说明目的,馈送聚合器1可以链接至若干Web馈送,该Web馈送的数目可多达用户可配置的数目。
馈送聚合器1还包括过滤模块4,其链接至馈送读取器2,并且馈送读取器2向过滤模块4传送获取到的更新内容,以便进一步处理从而消除冗余,这将在此后公开。
馈送聚合器1还包括馈送历史数据库5,先前获取的馈送内容作为条目存储在其中。
馈送聚合器1还可以包括至少一个条目分析器6,其链接至过滤模块4,配置用于将更新内容与先前获取的内容进行比较,并且将其作为条目存储在馈送历史数据库5中,以便确定更新内容是否应当:
-从馈送聚合器1被移除,
-作为新条目存储在数据库5中,
-或者被添加到数据库5中的已有条目。
馈送聚合器1还包括历史访问模块7,其插入在过滤模块4与馈送历史数据库5之间,并且配置用于访问和管理馈送历史数据库5,以便存储已由过滤模块4确定为适于存储为新条目或者向已有条目添加的更新内容。
现在将描述馈送聚合器1的精确操作。
每当用户配置时,馈送读取器2检查和获取来自用户所订阅的预定Web馈送3的更新内容(100)。在下文描述中,假设馈送读取器2配置有P个订阅,P是大于或等于1的整数(P≥1)。Fj表示从第j个Web馈送3获取的更新内容,其中j是小于或等于P的整数(1≤j≤P)。Fj可以包括完整的Web页面或其部分:文本、图像、视频、超链接,等等。还假设,馈送历史数据库5包括数目为N的条目,N是大于或等于1的整数(N≥1)。Ek表示馈送历史数据库5中存储的第k个条目,其中k是小于或等于N的整数(1≤k≤N)。
更新内容Fj由馈送读取器2向过滤模块4传送,其临时存储于过滤模块4中。过滤模块4通过历史访问模块7获取应当与更新内容Fj进行比较的已存储条目Ek的列表。更准确地,过滤模块4在已存储条目Ek的列表上进行迭代,更新内容Fj应当与这些已存储条目Ek进行比较,以便被分入以下类别:将被移除(删除);将被添加至已存储条目Ek;将被存储为新条目EN+1
更准确地,通过将k初始设为1(110),更新内容Fj由至少一个条目分析器6与已存储条目Ek进行比较。比较可以通过各种方法来完成:
-标题的基本字符串比较;
-语法分析,以确定所比较内容之间的共同关键词;
-基于语义的分析,以确定在所比较内容中使用的共同本体概念。为了限制比较的领域,可以通过与条目Ek相关联的预定标签来限制本体域。
这些比较方法可以单独使用,或者可以相结合来作为整个比较过程的不同步骤。比较方法的结合使用可以是层级式的。换言之,可以仅在标题的基本字符串比较步骤引起断言标题相同的情况下加载语法分析步骤,以便确定具有相同标题的内容是否可能是不同的。进而,可以仅在语法分析步骤已经确定语法类似的情况下加载基于语义的分析步骤,以便进一步增加比较的准确程度。比较的每个步骤可以在不同的条目分析器6上运行。
在实现了更新内容Fj与已存储条目Ek的比较之后,条目分析器6计算(130)相似性索引
Figure BPA00001256733700061
其表示Fj与Ek之间的相似性程度。向过滤模块4提供相似性索引
Figure BPA00001256733700062
过滤模块4首先基于
Figure BPA00001256733700063
的值来确定应认为Fj与Ek相同还是不同,其次由此做出关于Fj的相应决策。基本上,表示Fj与Ek将被认为不同,而
Figure BPA00001256733700065
表示Fj与Ek将被认为相同。
Figure BPA00001256733700066
可以不同于0和100二者,这表示不能认为Fj与Ek相同,但是也不能认为它们不同。为了做出关于更新内容Fj的适当决策,过滤模块4可以实现有至少一阈值S,使得:
-如果
Figure BPA00001256733700067
认为Fj不同于Ek
-如果认为Fj与Ek相同。
在一个优选实施方式中,过滤模块4实现有两个阈值,Smin和Smax,其中Smin<Smax,由此:
-如果
Figure BPA00001256733700069
认为Fj不同于Ek
-如果
Figure BPA000012567337000610
认为Fj与Ek相同;
-如果
Figure BPA000012567337000611
认为Fj是Ek的补充。
阈值Smin和Smax可以根据随用户改变的所需准确程度来设置。默认值可以设为Smin=20%以及Smax=80%。
过滤模块将相似性索引
Figure BPA000012567337000612
与阈值Smin和Smax进行比较(140),并且在以下选项中计算关于Fj的决策:
-如果认为Fj不同于
Figure BPA000012567337000613
则应当将Fj与下一条目进行比较。更具体地,k增1(150),并且针对Fj和Ek+1重新迭代比较过程。如果条目Ek是最后一个(k=N),则由于Fj被认为不同于所有条目Ek(1≤k≤N),其将由过滤模块4提供给历史访问模块7,以便作为新条目Ek+1存储在馈送历史数据库5中。
-如果认为Fj与Ek相同
Figure BPA000012567337000614
表示Fj对于Ek是冗余的(因此是无用的),则由过滤模块4移除Fj(也即,从馈送聚合器1删除)(170);
-如果认为Fj是Ek的补充则由过滤模块4将Fj添加至Ek或与其结合,其中过滤模块4将修改已有条目Ek,并且将修改的条目Ek提供给历史访问模块7,以替换馈送历史数据库5中先前存储的条目Ek
对于所有更新内容Fj,1≤j≤P,重复此比较过程。
前文公开的方法避免了冗余,因为只有被认为不同于已存储内容的内容被存储为新条目。公开的聚合器1实现了真正的馈送聚合,从而合并类似的内容而不是简单地将其并置。

Claims (10)

1.一种用于聚合联合Web内容的方法,包括步骤:
-从预定Web馈送获取(100)更新内容;
-将所述更新内容与先前获取的已存储内容进行比较(120);
-如果认为所述更新内容不同于所述已存储内容,则存储(160)所述更新内容;
-如果认为所述更新内容与所述已存储内容相同,则删除(170)所述更新内容。
2.根据权利要求1所述的方法,还包括步骤:如果认为所述更新内容是所述已存储内容的补充,则向所述已存储内容添加(180)所述更新内容。
3.根据权利要求1或2所述的方法,包括步骤:计算(130)相似性索引
Figure FPA00001256733600011
以表示所述更新内容与所述已存储内容之间的相似性程度。
4.根据权利要求3所述的方法,包括步骤:将所述相似性索引
Figure FPA00001256733600012
与一个或多个阈值进行比较。
5.根据权利要求4所述的方法,其中将所述相似性索引
Figure FPA00001256733600013
与两个阈值Smin和Smax进行比较,由此
-如果所述相似性索引
Figure FPA00001256733600014
低于Smin,则认为所述更新内容不同于所述已存储内容;
-如果所述相似性索引
Figure FPA00001256733600015
大于Smax,则认为所述更新内容与所述已存储内容相同;
-如果所述相似性索引在Smin与Smax之间,则认为所述更新内容是所述已存储内容的补充。
6.根据权利要求1-5任一项所述的方法,其中被认为与已存储内容相同的更新内容被添加至所述已存储内容。
7.根据权利要求1-6任一项所述的方法,其中先前获取的内容作为条目存储在馈送历史数据库中。
8.一种馈送聚合器(1),包括:
-馈送阅读器(2),配置用于检查和获取来自预定Web馈送(3)的更新内容;
-过滤模块(4),配置用于管理所述更新内容与先前获取的已存储内容的比较;
-馈送历史数据库(5),用于存储内容。
9.根据权利要求8所述的馈送聚合器(1),还包括:一个或多个条目分析器(6),其链接至所述过滤模块(4),配置用于将所述更新内容与已存储内容进行比较。
10.根据权利要求8或9任一项所述的馈送聚合器(1),其中所述一个或多个条目分析器(6)配置用于计算相似性索引
Figure FPA00001256733600021
其表示所述更新内容与所述已存储内容之间的相似性程度,并且其中所述过滤模块(6)配置用于将所述相似性索引与一个或多个阈值进行比较,以确定所述更新内容将被移除还是被添加至所述馈送历史数据库(5)。
CN200980118076.1A 2008-04-14 2009-04-09 使冗余最小化的Web馈送聚合方法 Active CN102037465B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08290366A EP2110760A1 (en) 2008-04-14 2008-04-14 Method for aggregating web feed minimizing redudancies
EP08290366.7 2008-04-14
PCT/EP2009/054324 WO2009144078A1 (en) 2008-04-14 2009-04-09 Method for aggregating web feed minimizing redundancies

Publications (2)

Publication Number Publication Date
CN102037465A true CN102037465A (zh) 2011-04-27
CN102037465B CN102037465B (zh) 2015-03-04

Family

ID=39720679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980118076.1A Active CN102037465B (zh) 2008-04-14 2009-04-09 使冗余最小化的Web馈送聚合方法

Country Status (6)

Country Link
US (1) US8521702B2 (zh)
EP (1) EP2110760A1 (zh)
JP (1) JP5535193B2 (zh)
KR (1) KR101595748B1 (zh)
CN (1) CN102037465B (zh)
WO (1) WO2009144078A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106585A (zh) * 2011-11-11 2013-05-15 阿里巴巴集团控股有限公司 产品信息的实时去重方法和装置
CN105912615A (zh) * 2016-04-05 2016-08-31 重庆大学 一种基于人类语音内容索引的音频和视频文件管理方法
CN106339374A (zh) * 2015-07-06 2017-01-18 天津九洲云物联科技有限公司 用于嵌入式系统中的文件型实时历史数据库算法
CN111787390A (zh) * 2020-09-07 2020-10-16 武汉工程大学 基于信息分发系统的内容分发装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2952203B1 (fr) 2009-11-05 2012-08-17 Canon Kk Procede de generation d'un flux web et un systeme associe
US9098311B2 (en) 2010-07-01 2015-08-04 Sap Se User interface element for data rating and validation
US9208252B1 (en) * 2011-01-31 2015-12-08 Symantec Corporation Reducing multi-source feed reader content redundancy
CA2802739C (en) * 2011-04-11 2014-08-12 Scribble Technologies Inc. System and method for syndicating dynamic content for online publication
US8832301B2 (en) * 2011-07-21 2014-09-09 Parlant Technology System and method for enhanced event participation
US9288165B1 (en) 2011-07-21 2016-03-15 Parlant Technology, Inc. System and method for personalized communication network
US9195771B2 (en) * 2011-08-09 2015-11-24 Christian George STRIKE System for creating and method for providing a news feed website and application
US8443003B2 (en) * 2011-08-10 2013-05-14 Business Objects Software Limited Content-based information aggregation
US9953079B2 (en) 2013-09-17 2018-04-24 International Business Machines Corporation Preference based system and method for multiple feed aggregation and presentation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016997A2 (en) * 2006-08-01 2008-02-07 Marchex, Inc. Populating resources using web feeds
US20080046543A1 (en) * 2006-08-18 2008-02-21 Realnetworks System and method for automatically obtaining web feed content

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3810463B2 (ja) * 1995-07-31 2006-08-16 株式会社ニューズウオッチ 情報フィルタリング装置
JPH1185779A (ja) * 1997-09-03 1999-03-30 Matsushita Electric Ind Co Ltd 電子ファイル管理装置、電子ファイル管理方法及びその方法を記録した記録媒体
JP2002215676A (ja) * 2001-01-12 2002-08-02 Hitachi Tohoku Software Ltd 関連情報検索方法、関連情報蓄積方法、関連情報検索装置および関連情報検索のための記録媒体
JP3894428B2 (ja) * 2002-02-20 2007-03-22 日本ビクター株式会社 情報抽出方法、情報検索方法及び情報抽出コンピュータプログラム
JP2008071296A (ja) * 2006-09-15 2008-03-27 Ricoh Co Ltd データ管理装置、データ管理方法およびデータ管理プログラム
WO2008065679A2 (en) * 2006-11-27 2008-06-05 Gautam Dharamdas Goradia An interactive system
US20090089380A1 (en) * 2007-09-28 2009-04-02 Microsoft Corporation Aggregating and Delivering Information

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016997A2 (en) * 2006-08-01 2008-02-07 Marchex, Inc. Populating resources using web feeds
US20080046543A1 (en) * 2006-08-18 2008-02-21 Realnetworks System and method for automatically obtaining web feed content

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IAN GARCIA ET AL: "ELIMINATING REDUNDANT AND LESS-INFORMATIVE RSS NEWS ARTICLES BASED ON WORD SIMILARITY AND A FUZZY EQUIVALENCE RELATION", 《TOOLS WITH ARTIFICIAL INTELLIGENCE,18TH IEEE INTERNATIONAL CONFERENCE ON ,IEEE,PI 》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106585A (zh) * 2011-11-11 2013-05-15 阿里巴巴集团控股有限公司 产品信息的实时去重方法和装置
CN103106585B (zh) * 2011-11-11 2016-05-04 阿里巴巴集团控股有限公司 产品信息的实时去重方法和装置
CN106339374A (zh) * 2015-07-06 2017-01-18 天津九洲云物联科技有限公司 用于嵌入式系统中的文件型实时历史数据库算法
CN105912615A (zh) * 2016-04-05 2016-08-31 重庆大学 一种基于人类语音内容索引的音频和视频文件管理方法
CN111787390A (zh) * 2020-09-07 2020-10-16 武汉工程大学 基于信息分发系统的内容分发装置

Also Published As

Publication number Publication date
US8521702B2 (en) 2013-08-27
EP2110760A1 (en) 2009-10-21
JP2011517822A (ja) 2011-06-16
JP5535193B2 (ja) 2014-07-02
KR20110009142A (ko) 2011-01-27
WO2009144078A1 (en) 2009-12-03
CN102037465B (zh) 2015-03-04
KR101595748B1 (ko) 2016-02-29
US20110119239A1 (en) 2011-05-19

Similar Documents

Publication Publication Date Title
CN102037465B (zh) 使冗余最小化的Web馈送聚合方法
US20220044139A1 (en) Search system and corresponding method
US11853334B2 (en) Systems and methods for generating and using aggregated search indices and non-aggregated value storage
US9619563B2 (en) Search engine optimization using page anchors
US20140059185A1 (en) Processing Data Feeds
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
US9275128B2 (en) Method and system for document indexing and data querying
US10489473B2 (en) Generating information describing interactions with a content item presented in multiple collections of content
CN102436513A (zh) 分布式检索方法和系统
WO2021043088A1 (zh) 文件查询方法、装置、计算机设备及存储介质
CN107526746B (zh) 管理文档索引的方法和设备
CN107851108A (zh) 使用位向量搜索索引的匹配文档
US20140280086A1 (en) Method and apparatus for document representation enhancement via social information integration in information retrieval systems
US20110184956A1 (en) Accessing digitally published content using re-indexing of search results
JP2008217157A (ja) 操作履歴を利用した自動情報整理装置、方法、およびプログラム
CN106294417A (zh) 一种数据排序方法、装置及电子设备
US8032521B2 (en) Managing structured content stored as a binary large object (BLOB)
WO2022093263A1 (en) Multi-modal hierarchical semantic search engine
US8495025B2 (en) Foldering by stable query
CN103646034A (zh) 一种基于内容可信的Web搜索引擎系统及搜索方法
US11687514B2 (en) Multimodal table encoding for information retrieval systems
CN117520112A (zh) 计算任务的提效分析处理方法、装置、设备和存储介质
US20120117449A1 (en) Creating and Modifying an Image Wiki Page
US20060179046A1 (en) Web operation language
US20240289356A1 (en) Structured document access for electronic documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Paris France

Patentee after: Alcatel Lucent Co., Ltd.

Address before: Paris France

Patentee before: Alcatel Optical Networks Israe

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20170912

Address after: Beijing City, Haidian District Qinghe Street No. 68 Huarun colorful city shopping center two 9 floor room 01

Patentee after: BEIJING XIAOMI MOBILE SOFTWARE Co.,Ltd.

Address before: Paris France

Patentee before: Alcatel Lucent Co., Ltd.

TR01 Transfer of patent right