CN104834684A - 用于集群化的方法和系统 - Google Patents

用于集群化的方法和系统 Download PDF

Info

Publication number
CN104834684A
CN104834684A CN201510184296.1A CN201510184296A CN104834684A CN 104834684 A CN104834684 A CN 104834684A CN 201510184296 A CN201510184296 A CN 201510184296A CN 104834684 A CN104834684 A CN 104834684A
Authority
CN
China
Prior art keywords
cluster
project
search
search inquiry
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510184296.1A
Other languages
English (en)
Inventor
鲁普纳斯·格兰德海
尼拉科坦·萨达瑞森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
eBay Inc
Original Assignee
eBay Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by eBay Inc filed Critical eBay Inc
Publication of CN104834684A publication Critical patent/CN104834684A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了用于集群化的方法和系统。描述了用于搜索引擎索引集群化的方法和系统。在实施例中,基于从客户端机器接收的搜索查询执行搜索以获得项目的列表。从集群索引取回集群及其描述,将搜索查询与集群描述之一相关联。利用相关联的集群描述查询项目数据库以识别集群之中的项目集合,并且基于所识别的项目集合向客户端机器提供对搜索查询的响应。

Description

用于集群化的方法和系统
本申请是申请日为2009年6月12日,题为“用于集群化的方法和系统”的发明专利申请No.200980131720.9的分案申请。
技术领域
本申请总地涉及基于网络的查询的领域,更具体而言涉及搜索引擎的领域。
背景技术
搜索引擎可以对文档中的字词编制索引以形成倒排索引,以便当用户键入查询时,可以基于查询中的字词取回合格的文档。流行的搜索查询可能返回数千的结果,很难在这些结果中巡览以找到相关的结果。另外,由于许多查询是一般化的,因此很难确定用户希望按什么样的顺序给出结果。
附图说明
在以下对本发明的示例性实施例的详细描述中,参考了形成本文的一部分的附图,这些附图仅是作为例示而示出的,其中示出了实现本发明的具体实施例。要理解的是,在不脱离本发明的范围的情况下,也可利用其他实施例,并且可以做出结构改变。
在附图中作为示例而不是限制图示了一些实施例,其中:
图1是根据示例性实施例的示例性的基于网络的系统的框图;
图2是根据示例性实施例的可部署在图1的系统内的示例性查询子系统的框图;
图3和4是示出根据示例性实施例的用于查询处理的方法的流程图;
图5是根据示例性实施例的示例性查询集群化图;
图6和7是示出根据示例性实施例的用于查询处理的方法的流程图;
图8-10是根据示例性实施例的示例性查询集群化图;
图11是示出根据实施例的网络系统的网络图,该网络系统具有被配置用于通过网络交换数据的客户端-服务器体系结构;
图12是示出作为基于网络的市场的一部分提供的多个网络和市场应用的示例性实施例的框图;并且
图13是采取计算机系统的示例性形式的机器的框图表示,在其内可以运行用于使得该机器执行这里论述的方法之中的任何一种或多种的一组指令。
具体实施方式
描述了用于集群化的示例性方法和系统。在以下描述中,出于说明目的,记载了许多具体细节以帮助透彻理解示例性实施例。然而,对于本领域的技术人员来说很明显的,没有这些具体细节也可以实现本发明的实施例。
因此,以下描述包括体现本发明的例示性系统、方法、技术、指令序列和计算机器程序产品。在以下描述中,出于说明目的,记载了许多具体细节以帮助透彻理解发明主题的各种实施例。然而,对于本领域的技术人员来说很明显的,没有这些具体细节也可以实现发明主题的实施例。另外,没有详细示出公知的指令实例、协议、结构和技术。
这里使用的术语“或”可以被解释为包含性的或排他性的。类似地,术语“示例性”仅被解释为表示某事物的示例或样本,但不一定是实现一个目标的优选或理想手段。此外,虽然以下论述的各种示例性实施例关注的是集群化的各个方面,但是给出这些实施例只是为了公开的清晰。
在一个示例性实施例中,接收搜索查询。基于该搜索查询来执行搜索以获得项目的列表。将项目的列表提供给集群化引擎。从集群化引擎接收多个项目集合。基于对所述多个项目集合的接收而提供对该搜索查询的响应。
在另一示例性实施例中,接收搜索查询。基于该搜索查询来执行搜索以获得项目的列表。基于集群化技术从项目的列表识别多个项目集合。基于对所述多个项目集合的识别来提供对该搜索查询的响应。
在另一示例性实施例中,接收搜索查询。基于该搜索查询来执行搜索以获得项目的列表。将项目的列表提供给集群化引擎。从集群化引擎接收多个项目集合。对针对该搜索查询的所述多个项目集合编制索引。接收另外一搜索查询。基于对所述多个项目集合的索引编制来执行搜索。基于对该搜索的执行来提供对该搜索查询的响应。
在另一示例性实施例中,接收搜索查询。基于该搜索查询来执行搜索以获得项目的列表。基于集群化技术从项目的列表识别多个项目集合。对针对该搜索查询的所述多个项目集合编制索引。接收另外一搜索查询。基于对所述多个项目集合的索引编制来执行搜索。基于对该搜索的执行来提供对该搜索查询的响应。
在另一示例性实施例中,搜索结果被集群化成相似项目的群组并且每个集群被命名。在两级接口中,第一级可示出集群名称,并且点击这些集群名称可以示出集群中的项目。此外,集群可以是层次化的。可以动态地(实时地)创建集群,或者可以创建静态集群索引并且实时地根据索引识别集群。
在另一示例性实施例中,所创建的索引被用于搜索、导航、促销、分类、广告等等。
图1示出了示例性系统100,其中,客户端机器102通过网络104与提供者106通信。操作客户端机器102的用户可以与提供者106或数据源108通信以向提供者106提出查询。
客户端机器102的示例包括机顶盒(STB)、接收机卡、移动电话、个人数字助理(PDA)、显示设备、便携式游戏单元以及计算系统;然而也可使用其他设备。
客户端机器102和提供者106用来通信的网络104可包括全球移动通信系统(GSM)网络、因特网协议(IP)网络、无线应用协议(WAP)网络、WiFi网络或IEEE 802.11标准网络,以及其各种组合。也可使用其他传统的或以后开发的有线和无线网络。
提供者106还可与数据源108通信。数据源108可包括用户数据114或项目116。用户数据114可包括关于提供者106的用户的信息。项目可包括通过提供者106可供销售的项目,例如文档、视频等等。
提供者106或客户端机器102可包括接收搜索查询并提供对搜索查询的响应的查询子系统110。集群化引擎112可接收项目的列表并基于对集群化技术(例如K均值)的应用来提供来自提供者106的接收项目集合(例如集群)。
图2示出了查询子系统110的示例性实施例,该查询子系统110被部署在系统100(参见图1)的提供者106或客户端机器102中或者以其他方式部署在另一系统(未示出)中。查询子系统110可包括搜索查询接收模块202、搜索模块204、列出项提供模块206、项目集合接收模块208、项目集合识别模块210、索引编制模块212、集群识别模块214或响应提供模块216。也可包括其他模块。
搜索查询接收模块202接收一搜索查询或另外一搜索查询。搜索模块204基于该搜索查询执行搜索以获得项目(或记录)的列表、集群标识符,或者基于对项目集合的索引编制执行搜索。
列表提供模块206将项目(或记录)的列表提供给集群化引擎112。项目集合接收模块208从集群化引擎112接收项目集合。项目集合识别模块210基于集群化技术从项目的列表识别项目集合。
索引编制模块212针对搜索查询对项目集合编制索引。集群识别模块214将集群标识符与被编制索引项目集合关联起来或者基于该描述来为另外一搜索查询识别集群标识符。
响应提供模块216基于对项目集合的接收、对项目集合的识别或对搜索的执行来提供对搜索查询的响应。
现在同时参考图1和3,示出了根据示例性实施例的用于查询处理的方法300。方法300是由系统100(参见图1)的提供者106或客户端机器102执行的或者是以其他方式执行的。
在块302,接收搜索查询。在块304,基于该搜索查询来执行搜索以获得项目的列表。
在块306,将项目的列表提供给集群化引擎112。在块308,从集群化引擎112接收多个项目集合。
在块310,基于对项目集合的接收而提供对搜索查询的响应。
图4示出了根据示例性实施例的用于查询处理的方法400。方法400是由系统100(参见图1)的提供者106或客户端机器102执行的或者是以其他方式执行的。
在块402,接收搜索查询。在块404,基于该搜索查询来执行搜索以获得项目(或记录)的列表。
在块406,基于集群化技术从项目的列表识别项目集合。单个因素或多个因素可用于集群化技术。例如,这些因素可包括项目标题、项目类别、项目属性、项目价格,等等。
在块408,基于对多个项目集合的识别来提供对搜索查询的响应。在示例性实施例中,对集群化的使用可以改善对由该响应提供的搜索结果的巡览。
在示例性实施例中,在对方法300、400的执行期间可以不存储信息。而是可以根据需要对给定的项目列表提供集群化。
图5示出了根据示例性实施例的示例性查询集群化图500。查询集群化图500在示例性实施例中可反映对方法300、400的执行。然而,不同的集群化图也可反映方法300、400。
查询集群化图500是在向针对搜索查询502的搜索结果项目的列表504即时地应用集群化技术时的实时集群化的示例。集群化技术506可输出集群508-512,其中每个集群与来自搜索结果项目的列表504的一组项目相关联。
图6示出了根据示例性实施例的用于查询处理的方法600。方法600是由系统100(参见图1)的提供者106(图1)或客户端机器102执行的或者是以其他方式执行的。
在块602,接收搜索查询。在块604,基于该搜索查询来执行搜索以获得项目(或记录)的列表。
在块606,将项目的列表提供给集群化引擎112(图1)。在块608,从集群化引擎112接收项目集合。
在块610,对针对该搜索查询的项目集合编制索引。在块612,将标识符与对项目集合的索引编制的描述相关联。
在块614,接收另外一搜索查询。在块616,基于该描述来为该另外一搜索查询识别集群标识符。
在块618,基于对项目集合的索引编制或集群标识符来执行搜索。在块620,基于对搜索的执行来提供对搜索查询的响应。
图7示出了根据示例性实施例的用于查询处理的方法700。方法700是由系统100(参见图1)的提供者106(图1)或客户端机器102执行的或者是以其他方式执行的。
在块702,接收搜索查询。在块704,基于该搜索查询来执行搜索以获得项目(或记录)的列表。
在块706,基于集群化技术从项目的列表识别项目集合。在块708,对针对该搜索查询的项目集合编制索引。在块710,将集群标识符与对项目集合的索引编制的描述关联起来。
在块712,接收另外一搜索查询。在块714,基于该描述来为该另外一搜索查询识别集群标识符。
在块716,基于对项目集合的索引编制或集群标识符来执行搜索。
在块718,基于对搜索的执行来提供对搜索查询的响应。
图8示出了根据示例性实施例的示例性查询集群化图500。查询集群化图500在示例性实施例中可反映对方法600、700的执行。然而,不同的集群化图也可反映方法600、700。
在离线集群化中,离线项目的列表以成批模式被处理,并且集群id和描述与每个集群相关联。图8提供了离线处理的示例,其利用集群化技术806将搜索查询Qi 802关联到集群C1,C2...Cm 810-814。每个集群Ci与唯一的集群id Cid和集群的描述did相关联。每个集群由该集群的若干属性来描述,例如可以是:
{关键字:
属性:
类别:
产品参考id:
等等}
这些集群属性可对应于在项目列出项中找到的元数据。
图8示出了集群索引编制的两个不同方案。第一方案是将与集群Ci相关联的项目的列表804与该集群的描述一起存储。在此方案中,如果项目过期或变得无效,则对新的项目列表再次运行集群化过程,以获得附于集群的项目信息。
另一方案是将集群描述808存储在集群索引中。实时地,当搜寻属于一集群的项目时,利用集群描述来查询项目数据库以获得属于该集群的当前活动项目。例如,如果集群描述仅由关键字构成,则可以对项目数据库进行实时搜索查询以获得属于该集群的当前活动项目。
图9示出了根据示例性实施例的示例性查询集群化图900。查询集群化图900在示例性实施例中可反映对方法600、700的执行。然而,不同的集群化图也可反映方法600、700。
图9描述了如何通过对每个唯一的搜索查询Qi 902,904,906重复离线过程来生成集群索引。与搜索查询902,904,906和相关联的集群908,910,912相关联的映射被存储在数据源108(图1)中作为集群索引或者可以以不同的方式被另外存储。
每个集群描述联同集群的属性可以包括权重。例如,一个这种权重可以是决定集群Ci与查询Qi有多相关的相关性权重。
图10示出了根据示例性实施例的示例性查询集群化图1000。查询集群化图1000在示例性实施例中可反映对方法600、700的执行。然而,不同的集群化图也可反映方法600、700。
图10描述了集群索引1004如何被用于实时执行集群化。当实时接收到搜索查询Qi 1002时,从集群索引1004取回相关联的集群id和描述1006,然后利用集群描述来对项目数据库1008做出查询以便利用项目来填充相关联的集群1010、1012、1014。
图11是示出其内部署了一个示例性实施例的客户端-服务器系统1100的网络图。作为示例,网络1104可包括网络104的功能,提供者106或集群化引擎112被部署在应用服务器1118内,并且客户端机器102可包括客户端机器1110或客户端机器1112的功能。系统100也可被部署在其他系统中。
采取基于网络的市场或发布系统的示例性形式的联网系统1102经由网络1104(例如因特网或广域网(WAN))向一个或多个客户端提供服务器侧功能。图11例如示出了web客户端1106(例如浏览器,比如由华盛顿州Redmond的公司开发的Internet浏览器),以及在各客户端机器1110和1112上运行的编程式客户端1108。
应用程序接口(API)服务器1114和web服务器1116耦合到一个或多个应用服务器1118并分别向其提供编程式接口和web接口。应用服务器1118容宿着一个或多个市场应用1120和认证提供者1122。应用服务器1118进而被示为耦合到帮助访问一个或多个数据库1126的一个或多个数据库服务器1124。
市场应用1120可向访问联网系统1102的用户提供若干个市场功能和服务。认证提供者1122可类似地向用户提供若干个支付服务和功能。认证提供者1122可允许用户在账户中积累价值(例如以商业货币的形式,比如美元,或者以专有货币的形式,比如“积分”),并且随后用积累的价值来兑换经由市场应用1120提供的产品(例如商品或服务)。虽然市场1120和认证1122提供者在图11中被示为都形成联网系统1102的一部分,但是在替换实施例中,认证提供者1122可形成与联网系统1102分离且不同的支付服务的一部分。
另外,虽然图11中所示的客户端-服务器系统1100采用了客户端-服务器体系结构,但是本发明的实施例当然不限于这种体系结构,而是也可同样很好地应用在例如分布式或对等式体系结构系统中。市场1120和认证1122提供者也可实现为独立的软件程序,这些独立的软件程序不需要具有联网能力。
web客户端1106经由web服务器1116所支持的web接口访问市场1120和认证1122提供者。类似地,编程式客户端1108经由API服务器1114所提供的编程式接口访问市场1120和认证1122提供者所提供的各种服务和功能。编程式客户端1108例如可以是卖家应用(例如由加州SanJose的eBay公司开发的TurboListerTM应用),用于使得卖家能够以离线方式编写和管理联网系统1102上的列出项,以及在编程式客户端1108与联网系统1102之间执行成批模式的通信。
图11还示出了在第三方服务器机器1130上运行的第三方应用1128经由API服务器1114所提供的编程式接口能够对联网系统1102进行编程式访问。例如,第三方应用1128可以利用从联网系统1102取回的信息来支持第三方所容宿的网站上的一个或多个特征或功能。第三方例如可以提供一个或多个由联网系统1102的相关应用所支持的推广、市场或支付功能。
图12是示出在一个示例性实施例中作为联网系统1102(参见图11)的一部分提供的多个应用(例如市场应用1120和认证提供者1122)的框图。这些应用可被容宿在专用或共享的服务器机器(未示出)上,这些服务器机器通信地耦合以使得这些服务器机器之间能够通信。这些应用本身(例如经由适当的接口)相互通信地耦合并且通信地耦合到各种数据源,以便允许在这些应用之间传递信息或者允许这些应用共享和访问共同的数据。这些应用还可经由一个或多个数据库服务器1124来访问一个或多个数据库1126。
联网系统1102可提供若干个发布、列出和价格设定机制,藉此卖家可列出商品或服务以供销售(或者发布关于这些商品或服务的信息),买家可以表达购买这种商品或服务的兴趣或表示购买这种商品或服务的愿望,并且与商品或服务有关的交易的价格可以被设定。为此,市场应用1120被示为包括至少一个发布应用1200和一个或多个拍卖应用1202,它们支持拍卖格式的列出和价格设定机制(例如,英式、荷兰式、维克瑞、中式、双向、反向拍卖等等)。拍卖应用1202之中的各种应用还可以提供若干个特征以支持这种拍卖格式的列出项,例如卖家可用来指定与列出项有关的最低价格的最低价格特征,或者竞价者可用来调用自动代理竞价的代理竞价特征。
若干个固定价格应用1204支持固定价格列出项格式(例如,传统的分类广告型列出项或目录列出项)以及买断型列出项。具体而言,买断型列出项(例如包括由加州San Jose的eBay公司开发的Buy-It-Now(BIN)技术)可以联同拍卖格式列出项一起被提供,并且使得买家可以用通常高于拍卖的起始价格的固定价格来购买也经由拍卖提供销售的商品或服务。
商店应用1206使得卖家可以将列出项聚集在一个“虚拟”商店内,该商店可以是有品牌的或者以其他方式被卖家个性化或针对卖家而个性化。这种虚拟商店还可以提供依相关卖家而定的、针对其而个性化的推广、激励和特征。
声誉应用1208使得进行交易的用户可以利用联网系统1102来建立、构建和维护声誉,这种声誉可以为潜在贸易伙伴所用并被发布给潜在贸易伙伴。考虑在例如联网系统1102支持个人之间的贸易的情况下,如果没有这种声誉用户就没有可用来评估潜在贸易伙伴的可信性和可靠性的历史或其他参考信息。声誉应用1208使得用户例如可以通过由其他交易伙伴提供的反馈来随着时间的流逝在联网系统1102内建立声誉。其他潜在贸易伙伴随后可以参考这种声誉来评估可靠性和可信性。
个性化应用1210使得联网系统1102的用户可以对其与联网系统1102的交互的各种方面进行个性化。例如,用户可以利用个性化应用1210之中的适当的一个来创建个性化的参考页面,在该参考页面处可以查看关于用户所参与(或曾参与)的交易的信息。另外,个性化应用1210之中的适当的一个可使得用户能够对列出项和其与联网系统1102和其他当事人的交互的其他方面进行个性化。
联网系统1102可以支持针对例如特定的地理区域而定制的若干个市场。联网系统1102的一个版本可以针对英国而定制,而联网系统1102的另一个版本可以针对美国而定制。这些版本中的每一个可以作为独立的市场操作,或者可以是一个共同的基本市场的被定制的(或者国际化的或地方化的)呈现。联网系统1102从而可以包括若干个国际化应用1212,这些国际化应用根据预定的标准(例如,地理、人口统计或市场标准)来对联网系统1102的信息(或信息的呈现)进行定制。例如,国际化应用1212可用于支持对由联网系统1102操作的并经由相应的web服务器1116可访问的若干个地区网站的信息的定制。
一个或多个巡览应用1214可以帮助对联网系统1102的巡览。例如,搜索应用(作为巡览应用的示例)可以使得能够对经由联网系统1102发布的列出项进行关键字搜索。浏览应用可使得用户可以浏览据以在联网系统1102内对列出项分类的各种类别、目录或系统库存结构。可以提供各种其他巡览应用来补充搜索和浏览应用。
为了尽可能以一种视觉上有信息量和吸引力的方式经由联网系统1102提供列出项,市场应用1120可包括一个或多个图像应用1216,利用这些图像应用,用户可以上载图像以便包括在列出项内。图像应用1216还进行操作以将图像结合在所查看的列出项内。图像应用1216还可支持一个或多个推广特征,例如呈现给潜在买家的图像库。例如,卖家可以支付额外的费用以将图像包括在用于推广的项目的图像库内。
列出项创建应用1218使得卖家可以方便地编写与其希望经由联网系统1102交易的商品或服务有关的列出项,并且列出项管理应用1220使得卖家可以管理这种列出项。具体而言,当特定的卖家编写或发布了大量的列出项时,对这种列出项的管理可能成为一种挑战。列出项管理应用1220提供了若干个特征(例如自动重列出,库存级别监视等等)来帮助卖家管理这种列出项。一个或多个列出后管理应用1222也帮助卖家进行通常在列出后发生的若干种活动。例如,在完成由一个或多个拍卖应用1202促成的拍卖之后,卖家可能希望留下关于特定买家的反馈。为此,列出后管理应用1222中的一个或多个可以提供到一个或多个声誉应用1208的接口,以便允许卖家方便地向声誉应用1208提供关于多个买家的反馈。
争端解决应用1224提供了用来解决交易当事人之间发生的争端的机制。例如,争端解决应用1224可以提供有引导的过程,藉此引导当事人经过一系列步骤以尝试调解争端。在经由这些有引导的过程无法调解争端的情况下,可以将争端升级到商家调停者或仲裁者。
若干个欺骗防止应用12206实现了欺骗检测和防止机制以减少联网系统1102内欺骗的发生。
消息传递应用1228负责生成和递送消息到联网系统1102的用户,这种消息例如将列出项在联网系统1102处的状态告知用户(例如,在拍卖过程期间向竞价者提供“出价较高”通知,或者向用户提供推广和促销信息)。各个消息传递应用1228可利用若干个消息递送网络和平台中的任何一个来向用户递送消息。例如,消息传递应用1228可递送电子邮件消息(e-mail)、即时消息(IM)、短消息服务(SMS)、文本、传真或者经由有线(例如因特网)、普通老式电话服务(POTS)或无线(例如移动、蜂窝、WiFi、WiMAX)网络的语音(例如IP语音(VoIP)消息。
促销应用1230支持各种促销功能,这些功能可供卖家使用来使卖家能够增加经由联网系统1102的销售。促销应用1230还操作可由卖家调用的各种促销功能,并且可以监视和跟踪卖家所采用的促销策略的成功。
联网系统1102自身或者经由联网系统1102交易的一方或者多方可以操作由一个或多个忠诚度/促进应用1232所支持的忠诚度程序。例如,对于与特定卖家之间建立或者达成的每次交易买家可以获得忠诚度或者促进,或者可以向买家提供奖励,对于这种奖励可以补偿累积的忠诚点。
集群化应用1234可用在图11的联网系统1102中,用于搜索结果、促销、广告等等。集群化应用1234在示例性实施例中可以被应用在项目的列表上,其中这些项目被映射到查询上下文。可以生成将查询上下文映射到集群描述的集群索引。在查询上下文发生时,可以实时地从集群索引取回相应的集群描述。例如,如果特定的使用情况是巡览由特定卖家所销售的项目,则查询上下文可以是卖家id,并且将卖家id映射到集群描述的集群索引可以在离线处理中生成。在运行时,当巡览由特定卖家销售的项目时,可以从集群索引取回相应的集群描述并且可以利用该特定卖家所销售的相应项目来填充集群。集群索引从而可用于模拟动态或实时集群化。
图13示出了采取计算机系统1300的示例性形式的机器的图示,在其内可以运行用于使得该机器执行这里论述的方法、过程、操作或办法之中的任何一种或多种的一组指令。提供者106可在一个或多个计算机系统1300上操作。客户端机器102可包括一个或多个计算机系统1300的功能。提供者106或集群化引擎112可被部署在一个或多个计算机系统1300上。
在示例性实施例中,机器作为独立的设备操作或者可以连接(例如联网)到其他机器。在联网部署中,机器可在服务器-客户端网络环境中作为服务器或客户端机器操作,或者在对等(或分布式)网络环境中作为对等机器操作。机器可以是服务器计算机、客户端计算机、个人计算机(PC)、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web用具、网络路由器、交换机或网桥或者能够运行规定该机器应采取的动作的一组指令(顺序的或者其他形式的)的任何机器。另外,虽然只示出单个机器,但是术语“机器”应当也被理解为包括单独或联合运行一组(或多组)指令以执行这里论述的方法中的任何一种或多种的机器的任何集合。
示例性计算机系统1300包括处理器1302(例如,中央处理单元(CPU)或图形处理单元(GPU)或两者)、主存储器1304和静态存储器1306,它们经由总线1308相互通信。计算机系统1300还可包括视频显示单元1310(例如液晶显示器(LCD)或阴极射线管(CRT))。计算机系统1300还包括字母数字输入设备1312(例如,键盘)、光标控制设备1314(例如,鼠标)、驱动单元1316、信号生成设备1318(例如,扬声器)以及网络接口设备1320。
驱动单元1316包括机器可读介质1322,其上存储着体现这里描述的方法或功能中的任何一种或多种的一组或多组指令(例如软件1324)。软件1324在其被计算机系统1300运行期间可以完全或至少部分地驻留在主存储器1304内和/或处理器1302内,主存储器1304和处理器1302也构成机器可读介质。
软件1324还经由网络接口设备1320通过网络1326被发送或接收。
虽然机器可读介质1322在示例性实施例中被示为单个介质,但是术语“机器可读介质”应当被理解为包括存储一组或多组指令的单个介质或多个介质(例如,集中式或分布式数据库,或相关联的缓存和服务器)。术语“机器可读介质”还应被理解为包括能够存储、编码或携带一组指令以供机器运行并且使得机器执行本发明的方法中的任何一种或多种的任何介质。术语“机器可读介质”因此应当被理解为包括但不限于固态存储器、光和磁介质以及载波信号。
某些系统、装置、应用或过程在这里被描述为包括若干个模块或机制。模块或机制可以是可向其他模块提供信息和从其他模块接收信息的独特功能的单元。因此,所描述的模块可以视为是通信地耦合的。模块还可发起与输入或输出设备的通信,并且可对资源(例如信息的集合)进行操作。根据各种实施例的特定实现的需要,模块可实现为硬件电路、光学组件、单处理器或多处理器电路、存储器电路、软件程序模块和对象、固件及其组合。
从而,描述了用于集群化的方法和系统的各种示例性实施例。虽然已经参考特定示例性实施例来描述了本发明的实施例,但是很明显,在不脱离本发明的实施例的范围的情况下可对这些实施例进行各种修改和变化。因此,说明书和附图应当被认为是例示性的而不是限制性的。

Claims (2)

1.一种用于对搜索结果进行集群化的基于网络的方法,该方法包括:
从客户端机器接收搜索查询;
基于所述搜索查询访问项目数据库中的多个项目的多个集群;
将所述搜索查询与所述多个集群中一个集群的集群描述相匹配;
基于利用所匹配的集群描述查询所述项目数据库来识别所述多个集群中的多个项目集合;
提供对所述搜索查询的响应,所述响应包括所述多个项目集合中的至少一个项目。
2.一种用于对搜索结果进行集群化的基于网络的系统,该系统包括:
用于从客户端机器接收搜索查询的装置;
用于基于所述搜索查询访问项目数据库中的多个项目的多个集群的装置;
用于将所述搜索查询与所述多个集群中一个集群的集群描述相匹配的装置;
用于基于利用所匹配的集群描述查询所述项目数据库来识别所述多个集群中的多个项目集合的装置;
用于提供对所述搜索查询的响应的装置,所述响应包括所述多个项目集合中的至少一个项目。
CN201510184296.1A 2008-06-13 2009-06-12 用于集群化的方法和系统 Pending CN104834684A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US6146108P 2008-06-13 2008-06-13
US61/061,461 2008-06-13
CN200980131720.9A CN102124439B (zh) 2008-06-13 2009-06-12 用于集群化的方法和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980131720.9A Division CN102124439B (zh) 2008-06-13 2009-06-12 用于集群化的方法和系统

Publications (1)

Publication Number Publication Date
CN104834684A true CN104834684A (zh) 2015-08-12

Family

ID=41415692

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200980131720.9A Active CN102124439B (zh) 2008-06-13 2009-06-12 用于集群化的方法和系统
CN201510184296.1A Pending CN104834684A (zh) 2008-06-13 2009-06-12 用于集群化的方法和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200980131720.9A Active CN102124439B (zh) 2008-06-13 2009-06-12 用于集群化的方法和系统

Country Status (5)

Country Link
US (1) US20090313228A1 (zh)
EP (1) EP2304544A4 (zh)
CN (2) CN102124439B (zh)
AU (1) AU2010101427A4 (zh)
WO (1) WO2009151640A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170751A (zh) * 2017-12-21 2018-06-15 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110179013A1 (en) * 2010-01-21 2011-07-21 Microsoft Corporation Search Log Online Analytic Processing
US9443008B2 (en) * 2010-07-14 2016-09-13 Yahoo! Inc. Clustering of search results
US8751496B2 (en) 2010-11-16 2014-06-10 International Business Machines Corporation Systems and methods for phrase clustering
US10083230B2 (en) 2010-12-13 2018-09-25 International Business Machines Corporation Clustering a collection using an inverted index of features
US9026519B2 (en) 2011-08-09 2015-05-05 Microsoft Technology Licensing, Llc Clustering web pages on a search engine results page
US10216842B2 (en) 2013-06-03 2019-02-26 Google Llc Method for clustering results from a same channel
US9727906B1 (en) * 2014-12-15 2017-08-08 Amazon Technologies, Inc. Generating item clusters based on aggregated search history data
EP3298516A4 (en) * 2015-05-20 2018-10-24 eBay Inc. Multi-faceted entity identification in search
US10146829B2 (en) 2015-09-28 2018-12-04 Google Llc Query composition system
US20170118406A1 (en) * 2015-10-21 2017-04-27 Ebay Inc. Methods, systems, and apparatus for creating an item publication
US10452688B2 (en) * 2016-11-08 2019-10-22 Ebay Inc. Crowd assisted query system
CN111666342B (zh) * 2020-06-04 2023-08-18 重庆英楼维兴信息科技有限公司 一种基于微服务架构的数据采样方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5838964A (en) * 1995-06-26 1998-11-17 Gubser; David R. Dynamic numeric compression methods
CN1609859A (zh) * 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
CN1722870A (zh) * 2004-07-12 2006-01-18 华为技术有限公司 一种标识不同集群组的方法
CN101000624A (zh) * 2007-01-10 2007-07-18 华为技术有限公司 实现数据挖掘模型转换和应用的方法、系统及装置
CN101055585A (zh) * 2006-04-13 2007-10-17 Lg电子株式会社 文档聚类系统和方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7082426B2 (en) * 1993-06-18 2006-07-25 Cnet Networks, Inc. Content aggregation method and apparatus for an on-line product catalog
US7251637B1 (en) * 1993-09-20 2007-07-31 Fair Isaac Corporation Context vector generation and retrieval
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
AU4954000A (en) * 1999-06-04 2000-12-28 Seiko Epson Corporation Information sorting method, information sorter, recorded medium on which information sorting program is recorded
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US6873990B2 (en) * 2001-02-07 2005-03-29 International Business Machines Corporation Customer self service subsystem for context cluster discovery and validation
US20020174051A1 (en) * 2001-05-15 2002-11-21 Daniel Wise Matching system
US6910037B2 (en) * 2002-03-07 2005-06-21 Koninklijke Philips Electronics N.V. Method and apparatus for providing search results in response to an information search request
US8229957B2 (en) * 2005-04-22 2012-07-24 Google, Inc. Categorizing objects, such as documents and/or clusters, with respect to a taxonomy and data structures derived from such categorization
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7620628B2 (en) * 2004-12-06 2009-11-17 Yahoo! Inc. Search processing with automatic categorization of queries
US20060136451A1 (en) * 2004-12-22 2006-06-22 Mikhail Denissov Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
CN100481077C (zh) * 2006-01-12 2009-04-22 国际商业机器公司 用于增强搜索结果导航的可视化方法及装置
US7720850B2 (en) * 2006-05-26 2010-05-18 Campus 1, Inc. Self-uploaded indexing and data clustering method and apparatus
US7813561B2 (en) * 2006-08-14 2010-10-12 Microsoft Corporation Automatic classification of objects within images
EP2062171A4 (en) * 2006-09-14 2010-10-06 Veveo Inc METHOD AND SYSTEMS FOR THE DYNAMIC REORGANIZATION OF SEARCH RESULTS IN HIERARCHICALLY ORGANIZED CLAUSE CLUSTERS
US8131722B2 (en) * 2006-11-20 2012-03-06 Ebay Inc. Search clustering
US8676802B2 (en) * 2006-11-30 2014-03-18 Oracle Otc Subsidiary Llc Method and system for information retrieval with clustering

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5838964A (en) * 1995-06-26 1998-11-17 Gubser; David R. Dynamic numeric compression methods
CN1722870A (zh) * 2004-07-12 2006-01-18 华为技术有限公司 一种标识不同集群组的方法
CN1609859A (zh) * 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
CN101055585A (zh) * 2006-04-13 2007-10-17 Lg电子株式会社 文档聚类系统和方法
CN101000624A (zh) * 2007-01-10 2007-07-18 华为技术有限公司 实现数据挖掘模型转换和应用的方法、系统及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宋春芳 等: "《一种基于关联规则的搜索引擎结果聚类算法》", 《山东大学学报(理学版)》 *
高劲松 等: "《几种典型网格搜索引擎系统的结构体系分析》", 《图书情报工作》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170751A (zh) * 2017-12-21 2018-06-15 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置

Also Published As

Publication number Publication date
CN102124439A (zh) 2011-07-13
WO2009151640A1 (en) 2009-12-17
AU2010101427A4 (en) 2011-01-20
CN102124439B (zh) 2015-05-20
EP2304544A4 (en) 2011-08-24
EP2304544A1 (en) 2011-04-06
US20090313228A1 (en) 2009-12-17

Similar Documents

Publication Publication Date Title
CN102124439B (zh) 用于集群化的方法和系统
CN104704522B (zh) 推荐原生应用
US8832060B2 (en) Shopping context engine
US8145638B2 (en) Multi-pass data organization and automatic naming
JP5241839B2 (ja) 従来の小売りに適する電子商取引の方法、システム、及び装置
CN104978393B (zh) 用于移动公布的方法和系统
US10176450B2 (en) Mapping transactions between the real world and a virtual world
US20130117380A1 (en) Dynamic content generation in email messages
CN101689264A (zh) 上下文相关内容发布系统和方法
US20090055263A1 (en) Promoting shopping information on a network based social platform
US20080147479A1 (en) Proprietor currency assignment system and method
CN105814595A (zh) 识别购买意向的系统和方法
CN102084391A (zh) 用于图像识别服务的方法和设备
CN102132301A (zh) 使用用户社会信息进行在线广告的系统和方法
US20110015981A1 (en) Systems and methods to incentivize transactions to enhance social goodness
US20190318388A1 (en) Systems and methods to search with a mobile device
US11003698B2 (en) Item matching
US20210256042A1 (en) Item matching
US20100235848A1 (en) System and method for providing automatic advertising distribution for online computer users
US20090222356A1 (en) Proposal submission system and method
KR20160032726A (ko) 트랜잭션 데이터에 기초한 추천 생성
US20140279616A1 (en) System and method of utilizing information from a social media service in an ecommerce service
US20100121649A1 (en) Methods and systems for user registration
US20130091020A1 (en) System and method for enabling revenue from advertisers to publishers in an ad network
KR20030058966A (ko) 통신 네트워크를 이용한 상품 직거래 정보 공유 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20151105

Address after: American California

Applicant after: EBAY INC

Address before: American California

Applicant before: Electonic Bay

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150812