CN108701014A - 用于尾部查询的查询数据库 - Google Patents

用于尾部查询的查询数据库 Download PDF

Info

Publication number
CN108701014A
CN108701014A CN201780015583.7A CN201780015583A CN108701014A CN 108701014 A CN108701014 A CN 108701014A CN 201780015583 A CN201780015583 A CN 201780015583A CN 108701014 A CN108701014 A CN 108701014A
Authority
CN
China
Prior art keywords
product
list
search
term
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780015583.7A
Other languages
English (en)
Other versions
CN108701014B (zh
Inventor
马诺伊库马·兰加萨米·卡纳达萨恩
安喰基亚·戈拉克纳特·卡莱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
eBay Inc
Original Assignee
eBay Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by eBay Inc filed Critical eBay Inc
Publication of CN108701014A publication Critical patent/CN108701014A/zh
Application granted granted Critical
Publication of CN108701014B publication Critical patent/CN108701014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0603Catalogue ordering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

在各种示例实施例中,呈现了用于使用尾部查询来查询发布系统的数据库中的产品的技术。应用接口模块从用户的设备接收发布系统中的产品的尾部查询。尾部查询有常用术语和不常用术语。数据存储接口模块可以从搜索度量数据库访问与常用术语关联的多个产品类别,并访问用户行为数据,其中用户行为数据包括与发布系统中的过去搜索查询对应的产品视图。类别预测器可以基于用户行为数据和从搜索度量数据库导出的信息,从尾部查询的多个产品类别中确定第一产品类别。列表生成器可以基于用户行为数据生成与第一产品类别关联的产品列表的有序列表。

Description

用于尾部查询的查询数据库
优先权声明
本申请要求2016年3月9日提交的美国申请第15/064,701号的优先权的益处,其整体以引用方式并入本文中。
技术领域
本公开的实施例通常涉及用于数据库查询的数据处理的技术领域,并且具体地涉及基于尾部查询来发布准确的产品列表。更具体地,但不作为限制,描述了通过将产品类别与尾部查询中的术语关联来查询数据库的技术。
背景技术
产品列表存储在发布系统的数据库中。常规地,用户可以提交所列产品的搜索查询。发布系统可以基于搜索查询生成产品列表。例如,搜索查询最初可以列出要查看的产品项目。
发布系统允许用户使用具有多个术语的搜索查询来搜索物品。在一些情况下,搜索查询中的术语可以是新术语或不常用术语。具有新术语或不常用术语的搜索查询称为尾部查询。替代地,仅具有常用术语的搜索查询被称为头部查询。在一些情况下,由发布系统生成的产品列表对于尾部查询搜索可能不准确。
附图说明
附图中的各种附图仅示出了本公开的示例实施例,并且不能被视为限制其范围。
图1是示出根据一些示例实施例的联网系统的方框图。
图2是示出根据一些示例实施例的类别预测器的示例实施例的方框图。
图3示出了根据一些实施例的使用类别预测器确定头部查询的产品类别的示例过程图。
图4示出了根据一些实施例的使用机器学习技术训练类别预测器150的示例过程图。
图5示出了根据一些实施例的确定尾部查询中的不常用术语的类别的示例过程图。
图6是示出根据一些实施例的为尾部查询生成产品列表的示例方法的流程图。
图7是示出根据一些示例实施例的能够从机器可读介质读取指令并执行本文所讨论的任何一种或多种方法的机器的组件的方框图。
具体实施方式
以下描述包括具体实施说明性实施例的系统、方法、技术、指令序列和计算机程序产品。在以下描述中,出于解释的目的,阐述了许多具体细节以便提供对本文所讨论的主题的各种实施例的理解。然而,对于本领域技术人员显而易见的是,可以在没有这些具体细节的情况下实践本发明主题的实施例。通常,不一定详细示出公知的指令实例、协议、结构和技术。
根据一些实施例,发布系统可以基于对发布系统的搜索查询以及随后的用户与对应于搜索查询的搜索结果的交互来生成搜索度量。发布系统可以是在线市场、搜索引擎(例如,到第三方网站的链接以购买或销售产品、评论网站(例如,产生产品的评论)等等。
搜索查询可以具有多个搜索术语。尾部查询具有多个术语,包括常用术语和不常用术语。替代地,头部查询可能只有常用术语。常用术语是在搜索度量(例如,搜索度量数据库)中具有术语-类别关联的术语。不常用术语在搜索度量中没有术语-类别关联。新搜索术语或未被经常搜索的搜索术语是不常用术语的示例。本文描述的技术允许发布系统生成用于尾部查询搜索的准确产品列表。
根据一些实施例,发布系统训练机器学习算法以通过挖掘响应于头部令牌搜索而点击的物品详情来检测头部查询中的关键字令牌(例如,常用术语)与物品之间的关联。此外,使用向量代数组合查询中的多个令牌类别关联,以返回具有不常用术语的尾部查询的相关类别的排名。例如,当用户搜索“船鞋尺寸10”时,类别预测器可以确定“船”与“鞋类”产品类别关联,而不是实际的船只。在另一示例中,当用户搜索“人字拖尺寸10绿松石”并且术语“绿松石”是新术语时,类别预测器可以确定“绿松石”是“人字拖”或“鞋类”的产品描述(例如,颜色)。在一些情况下,尾部查询中的不常用术语被忽略,并而基于常用术语生成列表。
搜索度量数据库存储所生成的搜索度量,诸如搜索术语与产品类别之间的关联。在一些情况下,搜索术语可以与多个产品类别关联。
此外,用户行为数据库响应于接收搜索结果而存储用户交互。可以基于预定时间段(例如,一天、一周)内的用户交互来生成用户行为数据。
根据一些实施例,发布者基于用户行为数据和搜索度量生成更准确的搜索结果。发布者可以离线和在运行时处理搜索度量和用户行为数据,以便生成更快的搜索。例如,可以使用在预定时间段(例如,一周)期间针对每个查询收集的搜索度量来基于发布系统上的用户交互和购买来确定用户感兴趣的一组类别。可以基于新搜索数据和用户行为数据定期刷新或更新搜索度量和该组类别。
关于头部查询,容易确定与头部查询关联的产品类别的原因之一是因为已经频繁地搜索或最近搜索了定义的头部查询。例如,头部查询可能必须最近由用户搜索(例如,在最近几周),并且用户与搜索结果的交互允许类别预测器确定产品类别并将其与头部查询关联。另外或替代地,可能必须以预定的最小次数(例如,至少20次、100次、5000次)搜索头部查询,以便为类别预测器生成高置信度以准确地确定产品类别与头部查询的关联。
因此,类别预测器可以准确地确定头部查询搜索的一组产品类别。使用头部查询的该组产品类别,列表生成器可以在运行时使用搜索度量来使用静态查找表,以通过快速生成产品列表的列表来增强用户的搜索体验。随后,发布系统可以在头部查询搜索的搜索结果中发布产品列表的列表。
相反,在当前实现方式下,列表生成器可能无法使用静态查找表进行尾部查询搜索,因为不常用术语可能不与产品类别关联。因此,减弱了用户的搜索体验。例如,发布尾部查询搜索的搜索结果可能会更慢。此外,列表生成器可以生成不准确的产品列表(例如,与用户无关的列表)以进行尾部查询搜索。
如上所述,尾部查询可能不与用于改善发布系统处的搜索体验的搜索度量关联。例如,搜索度量包括与术语关联的产品类别。在一些情况下,产品类别可能不与尾部查询中的搜索术语关联,因为搜索术语不经常被搜索,因此缺少搜索度量。由于缺少搜索度量,在当前实现方式下,类别预测器可能无法确定尾部查询的一组产品类别。因此,对于尾部查询或新查询,发布系统中运行时的搜索体验可能会很慢。
本文描述的技术可以通过确定尾部查询中的搜索术语的产品类别来改进尾部查询的搜索体验。例如,类别预测器可以确定尾部查询的产品类别。产品类别来自发布系统中的产品类别列表。例如,发布系统具有包含多个产品类别的目录。产品类别具有在发布系统中列出的类似类型的产品。类别预测器可以使用搜索度量和用户行为数据基于机器学习技术确定感兴趣的产品类别。稍后在图4中描述机器学习技术的示例。
参考图1,示出了基于客户端-服务器的高级网络架构105的示例实施例。以基于网络的发布系统142或列表生成器144的示例形式的联网系统102经由网络104(例如,互联网或广域网(WAN))向一个或多个用户设备110(也称为“客户端设备”)提供服务器端功能。图1示出了例如在用户设备110上执行的web客户端112、客户端应用程序114和编程客户端116。网络104的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线局域网(WLAN)、广域网、无线广域网(WWAN)、城域网(MAN)、互联网的一部分、公用电话交换网络(PSTN)的一部分、蜂窝电话网络、无线网络、WiFi网络、WiMax网络、另一种类型的网络,或两个或更多个这种网络的组合。
用户设备110可以包括但不限于移动电话、台式计算机、膝上型计算机、个人数字助理(PDA)、智能电话、平板计算机、超簿本、上网本、便携式计算机、多处理器系统、基于微处理器或可编程的消费电子器件、游戏控制台、机顶盒或用户可用于访问联网系统102的任何其它通信设备。在一些实施例中,用户设备110可包括显示信息的显示模块(例如,以用户界面的形式)。在另外的示例实施例中,用户设备110可以包括触摸屏、加速度计、陀螺仪、摄像头、麦克风、全球定位系统(GPS)设备等中的一个或多个。用户设备110可以是用户106用来执行涉及联网系统102内的物品的交易的设备。在一个实施例中,联网系统102是响应于产品列表请求的基于网络的市场,发布包括基于网络的市场上可用产品的产品列表(例如,物品列表)的发布,并且管理这些市场交易的支付。
每个用户设备110可以包括一个或多个应用程序(也称为“应用”),诸如但不限于web浏览器、消息应用、电子邮件(email)应用、市场应用等。在一些实施例中,如果应用程序被包括在给定用户设备110中,则该应用程序被配置成在本地提供用户界面和至少一些功能,其中该应用程序被配置成根据需要与联网系统102通信以用于本地不可用的数据或处理能力(例如,访问可供销售的物品的数据库、认证用户、验证支付方法等)。相反地,如果电子商务网站应用程序不包括在用户设备110中,则用户设备110可以使用其web浏览器来访问托管在联网系统102中的电子商务网站(或其变体)。
一个或多个用户106可以是与用户设备110交互的人、机器或其它手段。在示例实施例中,用户106不是网络架构105的一部分,但是可以经由用户设备110或其它手段与网络架构105交互。例如,用户106向用户设备110提供输入(例如,触摸屏输入或字母数字输入),并且输入经由网络104传递到联网系统102。在这种情况下,联网系统102响应于从用户106接收到输入而经由网络104将信息传递到用户设备110以呈现给用户106。如此,用户106使用用户设备110与联网系统102交互。
应用程序接口(API)服务器120和web服务器122耦合到一个或多个应用服务器140,并且分别向一个或多个应用服务器140提供编程和web接口。应用服务器140托管发布系统142、列表生成器144和类别预测器150,其中每个可包括一个或多个模块或应用程序,并且其中每个可以具体实施为硬件、软件、固件或其任何组合。又将应用服务器140示出为耦合到一个或多个数据库服务器124,该数据库服务器利于访问信息存储库(例如,用户行为数据126、搜索度量127、产品类别列表128、列表数据库等)。
用户行为数据库存储用户行为数据126。用户行为数据126包括但不限于用户基于先前交易的评级、与其它成员的通信消息、用户先前销售的物品、用户先前购买的物品、用户最近在当前会话中搜索的物品、用户在先前会话中搜索的物品,以及其它导出信息。在一些情况下,当前会话的用户交互被称为当前会话数据,并且先前会话的用户交互被称为用户行为数据126。
此外,用户行为数据包括使用日志,日志是用户与搜索结果页面和产品描述页面的交互。在一些情况下,发布系统已记录使用日志,以便调试问题、协调和其它脱机分析。在搜索体验引擎的客户端(例如,客户端设备)或服务器端(例如,在线市场)上访问使用日志。此外,合并用户行为数据以避免重复并在用户的搜索会话内将所有搜索上下文保持在一起。在用户登录到发布系统的连续时间段期间,搜索会话可以包括多个搜索请求。
搜索度量数据库存储搜索度量127。搜索度量包括但不限于产品类别关联、类别需求、印象、产品视图、购买的产品数量、点击率等等。搜索度量包括对类别需求、印象、产品视图、购买的产品数量和点击率的统计数据(例如,平均值、中值、标准偏差)。产品类别关联是与特定搜索术语关联的一组产品类别。在发出给定搜索查询之后用户感兴趣的类别列表是类别需求的示例。在发布系统的搜索引擎中发布搜索上下文的次数是印象的示例。产品视图表示在呈现搜索查询的产品列表的列表后用户查看产品的视图数量。所购买的产品表示在发布搜索上下文(例如,呈现搜索查询的产品列表的列表)之后购买的特定产品的数量。点击率表示用户针对搜索查询呈现的产品列表的列表中的产品列表的点击率(例如,比例)。此外,用户行为数据可以包括在搜索结果页面上显示的其它内容上收集的类似度量和统计数据。
根据一些实施例,搜索度量127被实时收集并用于优化后续搜索响应。例如,类别预测器150可以确定给定查询的感兴趣类别,并从所确定的类别中推销产品列表。因此,为用户改进了搜索体验,因为用户能够查看更相关的产品列表。
产品类别列表128包括发布系统中的不同产品类别。例如,发布系统具有在某些产品类别中标记的产品列表的目录。产品类别具有在发布系统中列出的类似类型的产品。产品类别的示例包括鞋类、裤子、毛衣、电子产品、手提包等。此外,产品类别可以包含子类别。例如,电子产品的子类别可以包括智能手机、电视、台式计算机、膝上型计算机等。
可以从列表数据库访问的信息导出产品类别列表128。列表数据库是存储设备,其将要发布的信息(例如,发布内容或列表)存储到发布系统142。根据示例实施例,列表数据库包括当前在发布系统上列出的物品的信息,诸如产品类别。列表数据库可以包括特定物品的物品属性,诸如产品信息、产品类别、产品子类别、历史价格数据和特定物品的产品描述。
发布系统142向访问联网系统102的用户106提供多个发布功能和服务。列表生成器144基于搜索查询生成产品列表。例如,列表生成器144使用搜索术语的产品类别关联来生成产品列表的排序列表。虽然图1中示出了发布系统142和列表生成器144,两者都形成联网系统102的一部分,但应当理解,在替代实施例中,每个系统142和144可以形成与联网系统102分离且不同的服务的一部分。在一些实施例中,列表生成器144可以形成发布系统142的一部分。
根据一些实施例,类别预测器150提供可操作以确定搜索术语的产品类别的功能。如本文所述,类别预测器150访问用户行为数据126和搜索度量127以确定搜索查询的多组产品类别。产品类别从产品类别列表128导出。随后,列表生成器144基于搜索术语的该组确定的产品类别产生产品列表的有序列表。发布系统142响应于搜索查询发布搜索结果。搜索结果包括由列表生成器144生成的产品列表的有序列表。此外,当搜索查询是尾部查询时,应用服务器140更新搜索度量127以包括与尾部查询关联的该组确定的产品类别。
此外,虽然图1中示出的基于客户端-服务器的网络架构100采用客户端-服务器架构,但是本主题当然不限于这种架构,并且例如可以同样在分布式或对等架构系统中得以良好应用。发布系统142、列表生成器144和类别预测器150也可以实现为独立软件程序,其不一定具有联网能力。
在示例实施例中,web客户端112经由web服务器122支持的web接口访问应用服务器140。类似地,编程客户端116经由API服务器120提供的编程接口访问由应用服务器140提供的各种服务和功能。编程客户端116例如可以是卖家应用程序(例如,由加利福尼亚州圣何塞市的公司开发的Turbo Lister应用程序)以使卖家能够以离线方式发起并管理联网系统102上的列表,并且执行编程客户端116与联网系统102之间的批量模式通信。
图2是示出图1的类别预测器150的示例实施例的方框图,包括形成图1的网络架构105的至少一部分的多个模块。所示类别预测器150的模块210-260包括应用接口模块210、数据存储接口模块220、类别关联模块230、聚合器模块240、排名分数计算模块250和产品列表排名模块260。在一些实施例中,类别预测器150的组件包括在图1的应用服务器140中。然而,将理解,在替代实施例中,附加地或替代地,在下面描述的类别预测器150的一个或多个组件被包括在其它设备中,诸如图1的一个或多个用户设备110。还将理解,类别预测器150部署在除了发布系统之外的系统中。
类别预测器150的模块210-260被托管在专用或共享服务器机器上,所述服务器机器通信地耦合以实现服务器机器之间的通信。模块210-260中的一个或多个部署在一个或多个数据中心中。模块210-260中的每一个通信地耦合到其它模块210-260和各种数据源,以便允许信息在类别预测器150的模块210-260之间传递或者以便允许模块210-260共享和访问通用数据。
应用接口模块210是硬件实现的模块,其利于类别预测器、列表生成器144、发布系统142、用户设备110和连接到网络104的其它设备之间的数据通信。具体地,应用接口模块210提供用于与一个或多个用户设备110对接的面向用户的图形用户界面(GUI),从而提供双向接口。例如,应用接口模块210与API服务器120对接以向用户设备110提供编程接口或向用户设备110提供web接口。如此,应用接口模块210利于提供类别预测器150和用户设备110之间的功能、网页、数据、代码或其它web资源。例如,类别预测器150使用应用接口模块210从用户设备110接收搜索查询。
在操作中,类别预测器150从一个或多个用户设备110接收数据(例如,经由应用接口模块210)。从用户设备110接收的数据对应于搜索查询。搜索查询可以包括多个搜索术语。如前所述,尾部查询包括作为不常用术语或新术语的搜索术语。
数据存储接口模块220是利于访问类别预测器150的数据的硬件实现的模块。在示例实施例中,数据存储接口模块220与图1的用户行为数据126、搜索度量127和产品类别列表128对接。
类别关联模块230是硬件实现的模块,其确定与搜索术语关联的一组产品类别。该组产品类别是从图1的产品类别列表128中导出的。类别关联模块230从应用接口模块210接收搜索查询。搜索查询可以包括多个搜索术语,其中一个或多个搜索术语是不常用的或新的。此外,类别关联模块230经由数据存储接口模块220访问搜索度量127和用户行为数据126,以确定搜索术语的产品类别。
聚合器模块240是硬件实现的模块,其聚合搜索查询中的每个搜索术语的一组产品类别,以生成主产品类别组。在一些情况下,该主产品类别组仅包括每个术语的每组产品类别中的产品类别。替代地,该主产品类别组可以仅包括一个主产品类别。例如,类别预测器基于搜索查询确定用户意欲在主产品类别中搜索产品。在操作中,聚合器模块240从类别关联模块230接收每个搜索术语的一组产品类别,以便生成主产品类别组。
排名分数计算模块250是硬件实现的模块,其基于用户行为数据126和搜索度量127计算该主产品类别组中的每个产品列表的排名分数。该主产品类别组从聚合器模块240接收产品列表。从列表数据库访问产品列表。
产品列表排名模块260是硬件实现的模块,其基于该主产品类别组中的每个产品列表的排名分数来对产品列表进行排序。产品列表排名模块260生成产品列表的有序列表。从排名分数计算模块250接收排名分数。此外,有序列表被传输到图1中的列表生成器144。
在一些实例中,用户使用应用接口模块210登录到发布系统并发起搜索查询。发布系统142呈现具有响应于搜索查询的产品列表的列表的搜索结果。搜索结果也基于搜索上下文。搜索上下文包括用户的位置、搜索查询文本、感兴趣的类别以及与产品列表关联的各种属性的组合。搜索查询可以是由用户输入的自由格式文本,或者是自由格式文本和由搜索引擎提供的结构化元数据的组合。在一些情况下,搜索上下文中的类别表示分组的分层分类中的产品列表的组织。搜索引擎提供的产品列表属性因产品而异。例如,产品列表属性包括品牌、颜色、型号、尺寸、适合度、价格等。
基于搜索上下文,从列表数据库生成产品列表。在一些情况下,列表数据库包括存储库或存储索引,以便更快地检索产品列表。此外,基于搜索上下文中存在的各种因素,由排名分数计算模块250对产品列表进行排名。然后使用产品列表排名模块260将产品列表作为有序列表显示给用户。在一些实例中,除了产品列表之外,还在搜索结果页面中呈现附加内容。
附加内容包括用于改变搜索上下文的用户界面、与当前搜索上下文相关的促销列表、广告(例如,文本和图形)、专用产品交易、与搜索上下文相关的信息内容以及与用户相关的个性化内容。信息内容包括产品列表的历史定价。个性化内容包括该用户专用的目标内容,诸如历史搜索上下文、历史查看的产品列表、为用户推荐的产品列表等。
如前所述,发布系统可以包括存储搜索度量127和用户行为数据126的多个数据库。类别预测器可以基于搜索度量127和用户行为数据126来确定与搜索查询关联的产品类别。使用所确定的产品类别,列表生成器144和发布系统142在用户设备110上呈现相关的产品列表。
此外,相关产品列表呈现在搜索结果页面上。例如,搜索结果页面是与搜索查询相关的产品列表的呈现。搜索结果页面包含在web、移动设备或可穿戴设备上的任何此类呈现。搜索结果页面也可以视为产品描述页面的精简版本列表。在一些情况下,用户106通过点击搜索结果页面中存在的产品列表中的一个而导航到产品描述页面。
图3示出了根据一些实施例的使用类别预测器150确定头部查询310的产品类别的示例过程300。在示例实施例中,类别预测器150通过将来自过去的用户交互(例如,用户行为数据126)的查询度量与搜索结果页面和产品描述页面进行聚合来计算类别需求。使用与头部查询310(例如,经常搜索的术语)关联的行为数据126,类别预测器150可以将头部查询310中的搜索术语与特定产品类别关联。在一些情况下,搜索术语可以与多个产品类别关联。随后,类别预测器150将搜索术语与产品类别之间的关联存储在搜索度量127中。在将来的头部查询310中,搜索术语与产品类别之间的关联用于提高发布搜索结果的准确性和响应时间。
图4示出了根据一些实施例的使用机器学习技术训练类别预测器150的示例过程400。在一些情况下,过程400可以在预定的基础上(例如,每晚)离线执行。在示例实施例中,在操作410中,从所接收的头部查询中提取搜索术语。例如,图2的应用接口模块210可以从接收的头部查询中提取文本术语。提取的一个或多个术语是新术语或不常用术语。每个提取的文本术语是搜索术语的示例。
在操作420中,通过类别预测器150从搜索度量127访问术语-类别关联。例如,术语-类别关联是与已知搜索术语关联的一组产品类别。此外,类别预测器150访问用户行为数据126以预测尾部查询的术语-类别关联。
在操作430中,类别预测器150训练机器学习模型以使用在操作420中访问的数据来预测在操作410中提取的术语的术语-类别关联。在一些情况下,类别预测器150可以基于用户行为数据127和与类似术语的术语-类别关联确定与新的或不常用术语关联的一组产品类别。例如,“人字拖”可以是新的或不常用术语,并且类别预测器150可以确定“人字拖”与“鞋类”类别关联。
机器学习模型的示例包括递归神经网络(RNN)模型、Word2Vec模型、最近邻居、长短期记忆(LSTM)模型、隐式马尔可夫模型(HMM)、卷积神经网络(CNN)模型、支持向量机(SVM)、逻辑回归模型等。例如,类别预测器150可以使用机器学习模型基于尾部查询中的已知搜索术语的术语-类别关联来确定尾部查询中的未知搜索术语的类别。
随后,术语-类别关联(例如,与尾部查询关联的一组产品类别)可以存储在搜索度量127中。
图5示出了根据一些实施例的确定尾部查询的术语-类别关联的示例过程500。在操作510中,类别预测器150接收尾部查询。在操作520中,尾部查询被分成单独的查询令牌。例如,查询令牌是单个搜索术语的示例。在操作530中,类别预测器150从搜索度量127访问已知的单独术语的术语-类别关联。如前所述,搜索度量127包括已知术语(例如,头部查询)的一组产品类别。在操作540中,类别预测器150从用户行为数据126访问用户106的当前搜索会话数据。例如,当前搜索会话数据包括针对用户106登录到发布系统的当前会话捕获的用户数据(例如,先前搜索术语、先前购买的物品、先前查看的物品)。在操作550中,类别预测器150基于已知术语的术语-类别关联和当前搜索会话数据来确定尾部查询的术语-类别关联。例如,类别预测器确定尾部查询的产品类别。随后,可以使用在操作550中确定的新术语类别来更新搜索度量127。
本文描述的技术允许使用多个机器学习模型和从发布系统导出的用户行为信息来对尾部查询或新查询进行类别预测。
在一些情况下,发布者在用户的搜索体验中并入类别预测以增强用户体验。例如,典型的搜索系统可以具有用于存储查询度量的存储库或度量存储系统。可以在离线分析和搜索查询的运行时行为期间使用度量。此外,查询度量优化和增强用户的搜索体验。
此外,存储在搜索度量127中的术语-类别关联可以通过并入单独术语中存在的上下文(例如,查询令牌)来预测尾部和新查询的产品类别,从而进一步增强搜索体验。类别预测器150通过访问单独查询令牌的术语-类别关联来确定运行时尾部查询的产品类别。例如,头尾查询具有带有预定类别特征的单独查询令牌。
图6是示出根据一些示例实施例的发布系统在执行用于确定尾部查询的产品类别的方法600中的操作的流程图。方法600中的操作可以由发布系统使用上面参考图1和图2描述的发布系统142、列表生成器144和类别预测器150来执行。如图6中所示,方法600包括操作610、620、630、640、650和660。以下将通过解释将示例方法600描述为由类别预测器150执行。然而,将理解的是,示例方法600的操作可以通过图1、图2和图7中所示的任意数量的模块以任何合适的顺序执行。除非另有明确说明,否则如在专利文献中常见的那样,在本文使用的术语“一”或“一个”包括一个或一个以上实例。如本文所使用,除非另有明确说明,否则连词“或”是指非排它性的“或”,诸如“和/或”。
在操作610中,应用接口模块210从用户(例如,用户106)的设备(例如,用户设备110)接收对发布系统中的产品的尾部查询。尾部查询具有多个术语,包括常用术语和不常用术语。替代地,头部查询可能只有常用术语。如前所述,常用术语是在搜索度量127中具有术语-类别关联的术语。不常用术语在搜索度量127中没有术语-类别关联。新搜索术语或不经常搜索的搜索术语是不常用术语的示例。应用服务器140经由网络104从用户设备110接收尾部查询。
在操作620中,类别预测器150从搜索度量数据库(例如,搜索度量127)访问与常用术语关联的多个产品类别。例如,多个产品类别中的产品类别(例如,鞋类、裤子、睡衣、夹克、西装)具有在发布系统中列出的类似类型的产品。搜索度量127存储常用术语的术语-类别关联。此外,当类别预测器150确定不常用术语的新术语-类别关联时,新术语-类别关联也存储在搜索度量127中。图3描述了根据示例实施例的用于确定头部查询的术语-类别关联的技术。搜索度量127可以由图2的数据存储接口模块220访问。
在操作630中,类别预测器150从用户行为数据库访问用户行为数据(例如,用户行为数据126)。在一些情况下,用户行为数据包括与发布系统中的过去搜索查询对应的产品视图。用户行为数据126可以包括与发布系统的用户(例如,所有用户)关联的行为数据。另外或替代地,用户行为数据127可以仅是执行搜索的用户106的行为数据。行为数据126可以由图2的数据存储接口模块220访问。例如,类别预测器150可以基于当前会话中先前点击的产品列表、当前会话中的先前搜索查询、先前购买的物品等来确定(例如,预测)尾部查询中的未知搜索术语的类别。
如前所述,用户行为数据库响应于接收搜索结果而存储用户交互。基于预定时间段(例如,一天、一周)内的用户交互生成用户行为数据。类别预测器可以基于用户行为数据126和搜索度量127来确定更准确的产品类别,并因此确定更好的搜索结果。在一些情况下,搜索度量127和用户行为数据126由发布者在离线和运行时处理,以便生成更快的搜索结果。例如,在操作620中,可以使用在预定时间段(例如,一周)期间针对每个查询收集的搜索度量127来确定该组产品类别。
用户行为数据126包括但不限于基于先前交易的用户评级、与其他会员的通信消息、用户先前销售的物品、用户先前购买的物品、在当前会话中用户最近搜索的物品、在先前会话中用户搜索的物品以及其它导出信息。此外,用户行为数据包括使用日志,其是用户与搜索结果页面和产品描述页面的交互。在一些情况下,当前会话的用户106的用户交互被称为当前会话数据,并且来自先前会话的所有用户的用户交互被称为用户行为数据126。
例如,方法600还可以包括从用户设备110接收登录凭证以发起当前会话,以及应用服务器140使用登录凭证发起当前会话。
在操作640中,类别预测器150使用处理器基于用户行为数据127从尾部查询的多个产品类别中确定第一产品类别。图4和图5描述了根据一些实施例的用于使用搜索度量127和用户行为数据126确定尾部查询的产品类别(例如,第一产品类别)的技术。操作640可以由类别关联模块230或类别预测器150中的另一模块配置的处理器执行。在一些情况下,处理器可以是稍后在图7中描述的处理器702。
此外,操作640还可以包括类别预测器150基于用户行为数据126、搜索度量和当前会话数据从尾部查询的多个产品类别中确定第二产品类别。此外,稍后在操作650中生成的产品列表的有序列表可以包括与第二产品类别关联的产品列表。
在一些情况下,基于从搜索度量127导出的统计数据来确定第一产品类别和第二产品类别。搜索度量数据库存储搜索度量127。搜索度量包括但不限于术语-类别关联(例如,产品类别关联)、类别需求、印象、产品视图、购买的产品数量、点击率等。搜索度量包括类别需求、印象、产品视图、购买的产品数量和点击率的统计数据(例如,平均值、中值、标准偏差)。
在一些情况下,方法600还包括访问用户当前会话的当前会话数据。当前会话数据包括当前会话中的先前搜索查询、在当前会话中先前购买的物品,以及在当前会话中用户搜索的物品。此外,在操作640中确定第一产品类别和第二产品类别还基于所访问的会话数据。
在操作650中,列表生成器144基于用户行为数据127生成与第一产品类别关联的产品列表的有序列表。在一些情况下,基于搜索度量127(例如,从搜索度量数据库导出的统计数据)进一步生成产品列表的有序列表。此外,产品列表的有序列表还可以基于当前会话数据。
如前所述,可以从列表数据库中的产品列表的静态列表生成有序列表。产品列表的静态列表允许更快地检索搜索结果。鉴于大多数头部查询与产品列表的静态列表关联,因此搜索体验在头部查询时得到增强,因为搜索结果往往更准确并更快。此外,基于发布系统中的新用户行为数据,定期更新与第一产品类别关联的产品列表的静态列表。
替代地,在操作650中生成有序列表可以基于生成整体列表。整体列表具有第一产品类别中的产品列表。类别预测器150可以基于用户行为数据126、当前会话数据和搜索度量127来计算整体列表中的每个产品列表的排名分数。随后,基于整体列表中每个产品列表的计算的排名分数来生成产品列表的有序列表。
在操作660中,发布系统142使得呈现生成的产品列表的有序列表。例如,生成的产品列表的有序列表可以包括在搜索结果中。该呈现显示在用户106的用户设备110上。产品列表的有序列表可以由应用服务器140经由网络104传输给用户设备110。
随后,在由类别预测器150确定了尾部查询的第一产品类别之后,类别预测器150将与不常用术语和第一产品类别的关联存储在搜索度量127中。此外,类别预测器150可以将与尾部查询和第一产品类别的关联存储在搜索度量127中。此外,当已经确定尾部查询的第二产品类别时,第二产品类别与尾部查询之间的关联以及第二产品类别与不常用术语之间的关联也可以存储在搜索度量中。
在一些情况下,应用服务器140可以将用户行为数据126存储在用户行为数据库中。用户行为数据还包括用户与搜索结果页面和产品描述页面的交互。
在一些情况下,搜索度量127包括术语-类别关联。术语-类别关联是与常用术语关联的一组产品类别。
在一些情况下,搜索度量127包括印象,其中印象是在发布系统中搜索常用术语和不常用术语的次数。
在一些情况下,搜索度量127包括产品视图,其中产品视图是查看与常用术语关联的产品列表的次数。
在一些情况下,搜索度量127包括在呈现与常用术语关联的产品列表的列表之后购买的产品数量。
在一些情况下,搜索度量127包括点击率,其中点击率是在呈现与常用术语关联的产品列表的列表之后用户对产品列表的点击率。
图7是示出根据一些示例实施例的机器700的各组件的方框图,该机器能够从机器可读介质722(例如,非暂时性机器可读介质、机器可读存储介质、计算机可读存储介质或其任何合适的组合)读取指令724并且全部或部分地执行本文讨论的任何一个或多个方法。具体而言,图7示出了呈计算机系统(例如,计算机)的示例形式的机器700,在该机器内可全部或部分地执行用于使机器700执行本文讨论的任何一个或多个方法的指令724(例如,软件、程序、应用、小应用程序、app或其它可执行代码)。类别预测器150是机器700的示例。
在替代实施例中,机器700作为独立设备进行操作或者可以连接(例如,联网)到其它机器。在联网部署中,机器700可以在服务器-客户端网络环境中以服务器机器或客户端机器的资格进行操作,或者在分布式(例如,对等)网络环境中作为对等机器进行操作。机器700可以是服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、蜂窝电话、智能手机、机顶盒(STB)、PDA、web器械、网络路由器、网络交换机、网络桥接器或能够按顺序或以其它方式执行指定要由该机器执行的动作的指令724的任何机器。此外,虽然仅示出了单个机器,但术语“机器”也应被理解为包括单独或联合执行指令724以执行本文讨论的任何一个或多个方法中的全部或部分的机器的任何集合。
机器700包括处理器702(例如,中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)或其任何合适的组合)、主存储器704和静态存储器706,其被配置成经由总线708彼此通信。处理器702可以包含由指令724中的一些或全部暂时或永久地可配置的微电路,使得处理器702可配置成全部或部分地执行本文所述的任何一个或多个方法。例如,处理器702的一组一个或多个微电路可经配置以执行本文中所描述的一个或多个模块(例如,软件模块)。
机器700还可以包括图形显示器710(例如,等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪、阴极射线管(CRT)或任何其它能够显示图形或视频的显示器)。机器700还可以包括字母数字输入设备712(例如,键盘或小键盘)、光标控制设备714(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器、眼睛跟踪设备或其它指向仪器)、存储单元716、音频生成设备718(例如,声卡、放大器、扬声器、耳机插孔或其任何适当的组合)以及网络接口设备720。
存储单元716包括机器可读介质722(例如,有形和非暂时性机器可读存储介质),其上存储具体实施本文描述的方法或功能中的任何一个或多个的指令724。指令724还可以在由机器700执行之前或期间,完全或至少部分地驻留在主存储器704内,在处理器702内(例如,处理器的高速缓冲存储器内)或两者内。因此,主存储器704和处理器702可以被认为是机器可读介质722(例如,有形和非暂时性机器可读介质)。指令724可以经由网络接口设备720通过网络104进行传输或接收。例如,网络接口设备720可以使用任何一个或多个传送协议(例如,超文本传送协议(HTTP))来传递指令724。
机器可读介质722可以包括磁性或光盘存储设备、诸如闪存的固态存储设备,或者其它一个或多个非易失性存储设备。存储在计算机可读存储介质722上的计算机可读指令724是源代码、汇编语言代码、目标代码或由一个或多个处理器702解译的另一种指令格式。
在一些示例实施例中,机器700可以是便携式计算设备,诸如智能手机或平板计算机,并且具有一个或多个附加输入组件730(例如,传感器或仪表)。这类输入组件730的示例包括图像输入组件(例如,一个或多个摄像头)、音频输入组件(例如,麦克风)、方向输入组件(例如,罗盘)、位置输入组件(例如,GPS接收器)、定向组件(例如,陀螺仪)、运动检测组件(例如,一个或多个加速度计)、高度检测组件(例如,高度计)和气体检测组件(例如,气体传感器)。由这些输入组件中的任何一个或多个收集的输入可以由本文描述的任何模块访问和使用。
如本文所使用,术语“存储器”是指能够暂时或永久存储数据的机器可读介质722,并且可以被认为包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、缓冲存储器、闪存和高速缓冲存储器。虽然机器可读介质722在示例实施例中被示出为单个介质,但是术语“机器可读介质”应该被理解为包括能够存储指令724的单个介质或多个介质(例如,集中式或分布式数据库,或者相关联的高速缓存)。术语“机器可读介质”还应被理解为包括任何介质或多个介质的组合,其能够存储或执行由机器700执行的指令724,使得当指令724由机器700的一个或多个处理器702(例如,处理器702)执行时,使机器700全部或部分地执行本文描述的任何一个或多个方法。因此,“机器可读介质”是指单个存储装置或设备,以及包括多个存储装置或设备的基于云的存储系统或存储网络。因此,术语“机器可读介质”应被理解为包括但不限于以固态存储器、光学介质、磁性介质或其任何适当组合,以及暂时性信号或传输介质的形式的一个或多个有形(例如,非暂时性)数据存储库。
为了解释的目的,已经参考具体实施例描述了上述描述。然而,上面的说明性讨论并非旨在穷举或将本发明限制于所公开的确切形式。鉴于上述教导,许多修改和变化是可能的。选择并描述实施例以便最好地解释本公开的原理及其实际应用,从而使本领域的其它技术人员能够最佳地利用本公开和各种实施例,其中各种修改适合于预期的特定使用。
在整个说明书中,多个实例可以实现被描述为单个实例的组件、操作或结构。虽然一个或多个方法的单独操作被示出和描述为单独的操作,但是单个操作中的一个或多个可以同时执行,并且可以以与所示不同的顺序执行操作。在示例配置中作为独立组件呈现的结构和功能可以实现为组合结构或组件。类似地,作为单个组件呈现的结构和功能可以被实现为单独的组件。这些和其它变化、修改、添加和改进落入本文主题的范围内。
本文将某些实施例描述为包括逻辑或许多组件、模块或机制。模块可以构成软件模块(例如,存储或以其它方式具体实施在机器可读介质722中(例如传输介质中)的代码)、硬件模块或其任何适当的组合。“硬件模块”是能够执行某些操作并且可以以某种物理方式配置或布置的有形(例如,非暂时性)单元。在各种示例实施例中,一个或多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或多个硬件模块(例如,处理器或一组处理器702)可以由软件(例如,应用程序或应用程序部分)配置成硬件模块,该硬件模块用于执行如本文所述的某些操作。
在一些实施例中,硬件模块可以机械地、电子地或其任何适当的组合来实现。例如,硬件模块可以包括被永久配置成执行某些操作的专用电路或逻辑。例如,硬件模块可以是专用处理器,诸如现场可编程门阵列(FPGA)或ASIC。硬件模块还可以包括由软件临时配置以执行某些操作的可编程逻辑或电路。例如,硬件模块可以包括包含在通用处理器702或其它可编程处理器702内的软件。将理解,在专用和永久配置的电路中,或者在临时配置的电路中(例如,由软件配置的)机械地实现硬件模块的决定可以由成本和时间考虑因素来驱使。
因此,短语“硬件模块”应该被理解为包括有形实体,并且这类有形实体可以物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或执行本文描述的某些操作。如本文所使用,“硬件实现的模块”是指硬件模块。考虑到硬件模块被临时配置(例如,编程)的实施例,每个硬件模块不需要在任何一个时刻被配置或例示。例如,在硬件模块包括由软件配置成专用处理器的通用处理器702的情况下,通用处理器702可以在不同的时间被配置成各自不同的专用处理器(例如,包括不同的硬件模块)。软件(例如,软件模块)可以相应地将一个或多个处理器702配置成例如在一个时刻构成特定的硬件模块以及在不同的时刻构成不同的硬件模块。
硬件模块可以向其它硬件模块提供信息并从其接收信息。因此,所描述的硬件模块可以被视为通信地耦合。在同时存在多个硬件模块的情况下,可以通过两个或更多个硬件模块之间或其中的信号传输(例如,通过适当的电路和总线)来实现通信。在多个硬件模块在不同时间被配置或例示的实施例中,可以例如通过存储和检索多个硬件模块可访问的存储器结构中的信息来实现这类硬件模块之间的通信。例如,一个硬件模块可以执行操作并将该操作的输出存储在其通信地耦合到的存储器设备中。然后另一个硬件模块可以在稍后时间访问存储器设备以检索和处理存储的输出。硬件模块也可以启动与输入或输出设备的通信,并且可以对资源(例如,信息的集合)进行操作。
本文描述的示例方法的各种操作可以至少部分地由临时配置(例如,通过软件)或永久配置成执行相关操作的一个或多个处理器702来执行。无论是临时配置还是永久配置,这类处理器702都可以构成处理器实现的模块,其操作来执行本文描述的一个或多个操作或功能。如这里所使用,“处理器实现的模块”是指使用一个或多个处理器702实现的硬件模块。
类似地,本文描述的方法可以至少部分地由处理器实现,处理器702是硬件的示例。例如,方法的至少一些操作可以由一个或多个处理器702或处理器实现的模块来执行。如本文所使用,“处理器实现的模块”是指其中硬件包括一个或多个处理器702的硬件模块。此外,一个或多个处理器702还可以操作以支持“云计算”环境中的相关操作的执行或作为“软件即服务”(SaaS)。例如,可以通过一组计算机(作为包括处理器702的机器的示例)执行至少一些操作,这些操作可经由网络104(例如,互联网)以及经由一个或多个适当的接口(例如,API)来访问。
某些操作的执行可以分布在一个或多个处理器702中,不仅仅驻留在单个机器内,还可以跨多个机器部署。在一些示例实施例中,一个或多个处理器702或处理器实现的模块可以位于单个地理位置中(例如,在家庭环境、办公室环境或服务器场内)。在其它示例实施例中,一个或多个处理器702或处理器实现的模块可以分布在多个地理位置。
以下编号的示例是实施例。
1.一种系统,包括:
具有一个或多个处理器的类别预测器,被配置成:
从用户设备接收对发布系统中的产品的尾部查询,所述尾部查询具有常用术语和不常用术语;
从搜索度量数据库访问与所述常用术语关联的多个产品类别,所述多个产品类别中的产品类别具有在所述发布系统中列出的类似类型的产品;
访问用户行为数据,所述用户行为数据包括与所述发布系统中的过去搜索查询对应的产品视图;以及
基于所述用户行为数据从所述尾部查询的所述多个产品类别中确定第一产品类别;
列表生成器,被配置成基于所述用户行为数据生成与所述第一产品类别关联的产品列表的有序列表;以及
发布系统,被配置成在所述设备的显示器上呈现所生成的产品列表的有序列表。
2.根据示例1所述的系统,其中所述类别预测器还被配置成:
基于从所述搜索度量数据库导出的统计数据确定所述第一产品类别;以及
所述列表生成器还被配置成基于从所述搜索度量数据库导出的所述统计数据来生成所述有序列表。
3.根据示例1或示例2所述的系统,其中所述类别预测器还被配置成:
访问所述用户的当前会话的当前会话数据,所述当前会话数据包括所述当前会话中的先前搜索查询;以及
确定所述第一产品类别是基于所访问的会话数据。
4.根据示例3所述的系统,其中所述产品列表的有序列表还基于所述当前会话数据。
5.根据示例3或示例4所述的系统,其中所述列表生成器还被配置成:
生成整体列表,所述整体列表具有所述第一产品类别中的产品列表;
基于所述用户行为数据和所述当前会话数据,计算所述整体列表中每个产品列表的排名分数;以及
基于所述整体列表中每个产品列表的所计算的排名分数,生成所述产品列表的有序列表。
6.根据示例1-5中任一项所述的系统,其中所述类别预测器还被配置成:
从所述用户设备接收登录凭证以发起所述当前会话;以及
使用所述登录凭证发起所述当前会话。
7.根据示例1-6中任一项所述的系统,其中所述类别预测器还被配置成:
基于所述用户行为数据从所述多个产品类别中确定第二产品类别;以及
其中所生成的产品列表的有序列表包括与所述第二产品类别关联的产品列表。
8.根据示例1-7中任一项所述的系统,其中所述类别预测器还被配置成:
将与所述不常用术语和所确定的第一产品类别的关联存储在所述搜索度量数据库中。
9.根据示例1-8中任一项所述的系统,其中所述有序列表是从列表数据库中的产品列表的静态列表生成的。
10.根据示例9所述的系统,其中基于新用户行为数据定期更新与所述第一产品类别关联的所述产品列表的静态列表。
11.根据示例1-10中任一项所述的系统,其中所述类别预测器还被配置成:
将所述用户行为数据存储在用户行为数据库中,所述用户行为数据还包括用户与搜索结果页面和产品描述页面的交互。
12.根据示例1-11中任一项所述的系统,其中所述搜索度量包括术语-类别关联,所述术语-类别关联是与所述常用术语关联的一组产品类别。
13.根据示例1-12中任一项所述的系统,其中所述搜索度量包括印象,所述印象是在所述发布系统中搜索所述常用术语和所述不常用术语的次数。
14.根据示例1-13中任一项所述的系统,其中所述搜索度量包括产品视图,所述产品视图是与所述常用术语关联的产品列表被查看的视图数量。
15.根据示例1-14中任一项所述的系统,其中所述搜索度量包括在呈现与所述常用术语关联的产品列表的列表之后购买的产品数量。
16.根据示例1-15中任一项所述的系统,其中所述搜索度量包括点击率,所述点击率是在呈现与所述常用术语关联的产品列表的列表之后用户对产品列表的点击率。
17.一种用于在发布系统中查询数据库的方法,所述方法包括:
从用户设备接收对所述发布系统中的产品的尾部查询,所述尾部查询具有常用术语和不常用术语;
从搜索度量数据库访问与所述常用术语关联的多个产品类别,所述多个产品类别中的产品类别具有在所述发布系统中列出的类似类型的产品;
访问用户行为数据,所述用户行为数据包括与所述发布系统中的过去搜索查询对应的产品视图;
基于所述用户行为数据,使用处理器从所述尾部查询的所述多个产品类别中确定第一产品类别;
基于所述用户行为数据生成与所述第一产品类别关联的产品列表的有序列表;以及
使得在所述设备的显示器上呈现所生成的产品列表的有序列表。
18.根据示例17所述的方法,所述方法还包括:
访问所述用户的当前会话的当前会话数据,所述当前会话数据包括所述当前会话中的先前搜索查询;以及
其中确定所述第一产品类别还基于所访问的会话数据;以及
其中所述产品列表的有序列表还基于所述当前会话数据。
19.一种非暂时性机器可读存储介质,包括在由机器的一个或多个处理器执行时使所述机器执行包括以下的操作的指令:
从用户设备接收对发布系统中的产品的尾部查询,所述尾部查询具有常用术语和不常用术语;
从搜索度量数据库访问与所述常用术语关联的多个产品类别,所述多个产品类别中的产品类别具有在所述发布系统中列出的类似类型的产品;
访问用户行为数据,所述用户行为数据包括与所述发布系统中的过去搜索查询对应的产品视图;
基于所述用户行为数据从所述尾部查询的所述多个产品类别中确定第一产品类别;
基于所述用户行为数据生成与所述第一产品类别关联的产品列表的有序列表;以及
使得在所述设备的显示器上呈现所生成的产品列表的有序列表。
20.根据示例19所述的存储介质,其中所述操作还包括:
访问所述用户的当前会话的当前会话数据,所述当前会话数据包括所述当前会话中的先前搜索查询;以及
其中确定所述第一产品类别还基于所访问的会话数据;以及
其中所述产品列表的有序列表还基于所述当前会话数据。
21.一种携带指令的机器可读介质,所述指令在由机器的一个或多个处理器执行时使所述机器作为根据示例1至16中任一项所述的系统进行操作。
可以根据对作为位或二进制数字信号存储在机器存储器(例如,计算机存储器)内的数据的操作的算法或符号表示来呈现本文讨论的主题的一些部分。这类算法或符号表示是数据处理领域的普通技术人员用来将他们的工作的实质内容传达给本领域其它技术人员的技术的示例。如本文所使用,“算法”是导致期望结果的操作或类似处理的自洽序列。在该上下文中,算法和操作涉及物理量的物理操纵。典型地但不一定地,这类量可以采取能够被机器存储、访问、传递、组合、比较或以其它方式操纵的电、磁或光信号的形式。有时主要出于常用的原因,使用诸如“数据”、“内容”、“位”、“值”、“元素”、“符号”、“字符”、“术语”、“数字”、“数值”等词语来指代这类信号是很方便的。然而,这些词语只是方便的标签,并且与适当的物理量相关联。
除非另有特别说明,否则本文中使用诸如“处理”、“计算”、“估算”、“确定”、“呈现”、“显示”等的词语的讨论可以指机器(例如,计算机)的动作或过程,其操纵或转换在一个或多个存储器(例如,易失性存储器、非易失性存储器或其任何适当的组合)、寄存器,或接收、存储、传输或显示信息的其它机器组件内表示为物理(例如,电子、磁或光)量的数据。此外,除非另有特别说明,否则如在专利文献中所常见,本文使用的术语“一”或“一个”包括一个或多于一个的实例。最后,如本文所使用,连词“或”是指非排它性的“或”,诸如“和/或”,除非另有特别说明。

Claims (21)

1.一种系统,包括:
具有一个或多个处理器的类别预测器,被配置成:
从用户设备接收对发布系统中的产品的尾部查询,所述尾部查询具有常用术语和不常用术语;
从搜索度量数据库访问与所述常用术语关联的多个产品类别,所述多个产品类别中的产品类别具有在所述发布系统中列出的类似类型的产品;
访问用户行为数据,所述用户行为数据包括与所述发布系统中的过去搜索查询对应的产品视图;以及
基于所述用户行为数据从针对所述尾部查询的所述多个产品类别中确定第一产品类别;
列表生成器,被配置成基于所述用户行为数据生成与所述第一产品类别关联的产品列表的有序列表;以及
发布系统,被配置成在所述设备的显示器上呈现所生成的产品列表的有序列表。
2.根据权利要求1所述的系统,其中所述类别预测器还被配置成:
基于从所述搜索度量数据库导出的统计数据确定所述第一产品类别;以及
所述列表生成器还被配置成基于从所述搜索度量数据库导出的所述统计数据来生成所述有序列表。
3.根据权利要求1所述的系统,其中所述类别预测器还被配置成:
访问所述用户的当前会话的当前会话数据,所述当前会话数据包括所述当前会话中的先前搜索查询;以及
基于所访问的会话数据确定所述第一产品类别。
4.根据权利要求3所述的系统,其中所述产品列表的有序列表还基于所述当前会话数据。
5.根据权利要求3所述的系统,其中所述列表生成器还被配置成:
生成整体列表,所述整体列表具有所述第一产品类别中的产品列表;
基于所述用户行为数据和所述当前会话数据,计算所述整体列表中每个产品列表的排名分数;以及
基于所述整体列表中每个产品列表的所计算的排名分数,生成所述产品列表的有序列表。
6.根据权利要求1所述的系统,其中所述类别预测器还被配置成:
从所述用户设备接收登录凭证以发起所述当前会话;以及
使用所述登录凭证发起所述当前会话。
7.根据权利要求1所述的系统,其中所述类别预测器还被配置成:
基于所述用户行为数据从所述多个产品类别中确定第二产品类别;以及
其中所生成的产品列表的有序列表包括与所述第二产品类别关联的产品列表。
8.根据权利要求1所述的系统,其中所述类别预测器还被配置成:
将与所述不常用术语和所确定的第一产品类别的关联存储在所述搜索度量数据库中。
9.根据权利要求1所述的系统,其中所述有序列表是从列表数据库中的产品列表的静态列表生成的。
10.根据权利要求9所述的系统,其中基于新用户行为数据定期更新与所述第一产品类别关联的所述产品列表的静态列表。
11.根据权利要求1所述的系统,其中所述类别预测器还被配置成:
将所述用户行为数据存储在用户行为数据库中,所述用户行为数据还包括用户与搜索结果页面和产品描述页面的交互。
12.根据权利要求1所述的系统,其中所述搜索度量包括术语-类别关联,所述术语-类别关联是与所述常用术语关联的一组产品类别。
13.根据权利要求1所述的系统,其中所述搜索度量包括印象,所述印象是在所述发布系统中搜索所述常用术语和所述不常用术语的次数。
14.根据权利要求1所述的系统,其中所述搜索度量包括产品视图,所述产品视图是与所述常用术语关联的产品列表被查看的视图数量。
15.根据权利要求1所述的系统,其中所述搜索度量包括在呈现与所述常用术语关联的产品列表的列表之后购买的产品数量。
16.根据权利要求1所述的系统,其中所述搜索度量包括点击率,所述点击率是在呈现与所述常用术语关联的产品列表的列表之后用户对产品列表的点击率。
17.一种用于在发布系统中查询数据库的方法,所述方法包括:
从用户设备接收对所述发布系统中的产品的尾部查询,所述尾部查询具有常用术语和不常用术语;
从搜索度量数据库访问与所述常用术语关联的多个产品类别,所述多个产品类别中的产品类别具有在所述发布系统中列出的类似类型的产品;
访问用户行为数据,所述用户行为数据包括与所述发布系统中的过去搜索查询对应的产品视图;
基于所述用户行为数据,使用处理器从针对所述尾部查询的所述多个产品类别中确定第一产品类别;
基于所述用户行为数据生成与所述第一产品类别关联的产品列表的有序列表;以及
使得在所述设备的显示器上呈现所生成的产品列表的有序列表。
18.根据权利要求17所述的方法,所述方法还包括:
访问所述用户的当前会话的当前会话数据,所述当前会话数据包括所述当前会话中的先前搜索查询;以及
其中确定所述第一产品类别还基于所访问的会话数据;以及
其中所述产品列表的有序列表还基于所述当前会话数据。
19.一种非暂时性机器可读存储介质,包括在由机器的一个或多个处理器执行时使所述机器执行包括以下操作的操作的指令:
从用户设备接收对发布系统中的产品的尾部查询,所述尾部查询具有常用术语和不常用术语;
从搜索度量数据库访问与所述常用术语关联的多个产品类别,所述多个产品类别中的产品类别具有在所述发布系统中列出的类似类型的产品;
访问用户行为数据,所述用户行为数据包括与所述发布系统中的过去搜索查询对应的产品视图;
基于所述用户行为数据从针对所述尾部查询的所述多个产品类别中确定第一产品类别;
基于所述用户行为数据生成与所述第一产品类别关联的产品列表的有序列表;以及
使得在所述设备的显示器上呈现所生成的产品列表的有序列表。
20.根据权利要求19所述的存储介质,其中所述操作还包括:
访问所述用户的当前会话的当前会话数据,所述当前会话数据包括所述当前会话中的先前搜索查询;以及
其中确定所述第一产品类别还基于所访问的会话数据;以及
其中所述产品列表的有序列表还基于所述当前会话数据。
21.一种携带指令的机器可读介质,所述指令在由机器的一个或多个处理器执行时使所述机器作为根据权利要求1至16中任一项所述的系统进行操作。
CN201780015583.7A 2016-03-09 2017-03-08 用于尾部查询的查询数据库 Active CN108701014B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/064,701 2016-03-09
US15/064,701 US10636075B2 (en) 2016-03-09 2016-03-09 Methods and apparatus for querying a database for tail queries
PCT/US2017/021276 WO2017156065A1 (en) 2016-03-09 2017-03-08 Querying a database for tail queries

Publications (2)

Publication Number Publication Date
CN108701014A true CN108701014A (zh) 2018-10-23
CN108701014B CN108701014B (zh) 2022-11-08

Family

ID=59786759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780015583.7A Active CN108701014B (zh) 2016-03-09 2017-03-08 用于尾部查询的查询数据库

Country Status (4)

Country Link
US (1) US10636075B2 (zh)
EP (1) EP3427146A4 (zh)
CN (1) CN108701014B (zh)
WO (1) WO2017156065A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10636075B2 (en) 2016-03-09 2020-04-28 Ebay Inc. Methods and apparatus for querying a database for tail queries
CN112884537A (zh) * 2019-11-29 2021-06-01 北京沃东天骏信息技术有限公司 数据处理方法、装置、设备和计算机可读介质
US11593855B2 (en) 2015-12-30 2023-02-28 Ebay Inc. System and method for computing features that apply to infrequent queries

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180107720A1 (en) * 2016-10-14 2018-04-19 Target Brands, Inc. Dynamic assignment of search parameters to search phrases
US10600104B2 (en) * 2017-05-25 2020-03-24 Walmart Apollo, Llc Systems and methods for determining product search results based on product attribute scores
US11276089B1 (en) 2017-12-20 2022-03-15 Groupon, Inc. Method, apparatus, and computer program product for adaptive tail digital content object bid value generation
US11593844B1 (en) * 2017-12-20 2023-02-28 Groupon, Inc. Method, apparatus, and computer program product for predictive initial electronic bid value generation for new digital content objects
EP3747165B1 (en) * 2018-02-03 2022-09-14 Nokia Technologies Oy Application based routing of data packets in multi-access communication networks
GB201805067D0 (en) * 2018-03-28 2018-05-09 Benevolentai Tech Limited Search tool using a relationship tree
US11127064B2 (en) 2018-08-23 2021-09-21 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
US11232163B2 (en) * 2018-08-23 2022-01-25 Walmart Apollo, Llc Method and apparatus for ecommerce search ranking
CN112084416A (zh) * 2020-09-21 2020-12-15 哈尔滨理工大学 基于CNN和LSTM的Web服务推荐方法
US20220269705A1 (en) * 2021-02-24 2022-08-25 Discovery Communications, Llc System and method for generating a research reporting narrative
US20240169411A1 (en) * 2022-11-18 2024-05-23 Coupang Corp. Systems and methods for dynamically generating modified user interfaces for similar product recommendations

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101114294A (zh) * 2007-08-22 2008-01-30 杭州经合易智控股有限公司 自助式智能垂直搜索方法
CN101203856A (zh) * 2005-06-20 2008-06-18 电子湾有限公司 用于生成相关搜索查询的系统
CN101216853A (zh) * 2008-01-11 2008-07-09 孟小峰 一种智能Web查询接口系统及其方法
US20080244429A1 (en) * 2007-03-30 2008-10-02 Tyron Jerrod Stading System and method of presenting search results
US20110258149A1 (en) * 2010-04-19 2011-10-20 Microsoft Corporation Ranking search results using click-based data
CN102332025A (zh) * 2011-09-29 2012-01-25 奇智软件(北京)有限公司 一种智能垂直搜索方法和系统
CN102339313A (zh) * 2010-09-24 2012-02-01 微软公司 用户查询结果的视觉提示细化
CN102375856A (zh) * 2010-08-23 2012-03-14 腾讯科技(深圳)有限公司 一种商品搜索方法和装置
CN102667768A (zh) * 2009-10-15 2012-09-12 A9.Com有限公司 动态搜索建议和类别特定完成
US8364709B1 (en) * 2010-11-22 2013-01-29 Google Inc. Determining word boundary likelihoods in potentially incomplete text
CN103235786A (zh) * 2013-03-28 2013-08-07 北京百度网讯科技有限公司 一种用于提供长尾搜索结果的方法与设备
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN103970857A (zh) * 2014-05-07 2014-08-06 百度在线网络技术(北京)有限公司 推荐内容确定系统和方法
US20140258330A1 (en) * 2013-03-11 2014-09-11 Wal-Mart Stores, Inc. Search result ranking using query clustering
CN104063513A (zh) * 2011-09-29 2014-09-24 北京奇虎科技有限公司 一种智能垂直搜索方法和系统
CN104424291A (zh) * 2013-09-02 2015-03-18 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104572958A (zh) * 2014-12-29 2015-04-29 中国科学院计算机网络信息中心 一种基于事件抽取的敏感信息监控方法
CN104866474A (zh) * 2014-02-20 2015-08-26 阿里巴巴集团控股有限公司 个性化数据搜索方法及装置
CN104994424A (zh) * 2015-06-30 2015-10-21 北京奇艺世纪科技有限公司 一种构建音视频标准数据集的方法和装置
CN105335391A (zh) * 2014-07-09 2016-02-17 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置
CN105378718A (zh) * 2013-03-14 2016-03-02 微软技术许可有限责任公司 针对嵌入式应用上下文中的搜索的查询意图表达

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8515966B2 (en) 2009-01-09 2013-08-20 Ebay Inc. Analyzing queries to generate product intention rules
US20100257171A1 (en) * 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
US9020936B2 (en) 2009-08-14 2015-04-28 Microsoft Technology Licensing, Llc Using categorical metadata to rank search results
US8954422B2 (en) * 2010-07-30 2015-02-10 Ebay Inc. Query suggestion for E-commerce sites
US20120123863A1 (en) * 2010-11-13 2012-05-17 Rohit Kaul Keyword publication for use in online advertising
US9342582B2 (en) 2010-11-22 2016-05-17 Microsoft Technology Licensing, Llc Selection of atoms for search engine retrieval
US8458213B2 (en) 2011-02-28 2013-06-04 Ebay Inc. Method and system for classifying queries to improve relevance of search results
US9384278B2 (en) 2011-04-07 2016-07-05 Ebay Inc. Methods and systems for assessing excessive accessory listings in search results
US9965547B2 (en) 2014-05-09 2018-05-08 Camelot Uk Bidco Limited System and methods for automating trademark and service mark searches
US9754037B2 (en) 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US10984056B2 (en) 2015-04-30 2021-04-20 Walmart Apollo, Llc Systems and methods for evaluating search query terms for improving search results
US11593855B2 (en) 2015-12-30 2023-02-28 Ebay Inc. System and method for computing features that apply to infrequent queries
US10636075B2 (en) 2016-03-09 2020-04-28 Ebay Inc. Methods and apparatus for querying a database for tail queries

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101203856A (zh) * 2005-06-20 2008-06-18 电子湾有限公司 用于生成相关搜索查询的系统
US20080244429A1 (en) * 2007-03-30 2008-10-02 Tyron Jerrod Stading System and method of presenting search results
CN101114294A (zh) * 2007-08-22 2008-01-30 杭州经合易智控股有限公司 自助式智能垂直搜索方法
CN101216853A (zh) * 2008-01-11 2008-07-09 孟小峰 一种智能Web查询接口系统及其方法
CN102667768A (zh) * 2009-10-15 2012-09-12 A9.Com有限公司 动态搜索建议和类别特定完成
US20110258149A1 (en) * 2010-04-19 2011-10-20 Microsoft Corporation Ranking search results using click-based data
CN102375856A (zh) * 2010-08-23 2012-03-14 腾讯科技(深圳)有限公司 一种商品搜索方法和装置
CN102339313A (zh) * 2010-09-24 2012-02-01 微软公司 用户查询结果的视觉提示细化
US8364709B1 (en) * 2010-11-22 2013-01-29 Google Inc. Determining word boundary likelihoods in potentially incomplete text
CN102332025A (zh) * 2011-09-29 2012-01-25 奇智软件(北京)有限公司 一种智能垂直搜索方法和系统
CN104063513A (zh) * 2011-09-29 2014-09-24 北京奇虎科技有限公司 一种智能垂直搜索方法和系统
US20140258330A1 (en) * 2013-03-11 2014-09-11 Wal-Mart Stores, Inc. Search result ranking using query clustering
CN105378718A (zh) * 2013-03-14 2016-03-02 微软技术许可有限责任公司 针对嵌入式应用上下文中的搜索的查询意图表达
CN103235786A (zh) * 2013-03-28 2013-08-07 北京百度网讯科技有限公司 一种用于提供长尾搜索结果的方法与设备
CN104424291A (zh) * 2013-09-02 2015-03-18 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104866474A (zh) * 2014-02-20 2015-08-26 阿里巴巴集团控股有限公司 个性化数据搜索方法及装置
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN103970857A (zh) * 2014-05-07 2014-08-06 百度在线网络技术(北京)有限公司 推荐内容确定系统和方法
CN105335391A (zh) * 2014-07-09 2016-02-17 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置
CN104572958A (zh) * 2014-12-29 2015-04-29 中国科学院计算机网络信息中心 一种基于事件抽取的敏感信息监控方法
CN104994424A (zh) * 2015-06-30 2015-10-21 北京奇艺世纪科技有限公司 一种构建音视频标准数据集的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岑荣伟: "基于用户行为分析的搜索引擎评价研究", 《中国博士学位论文全文数据库 (信息科技辑)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11593855B2 (en) 2015-12-30 2023-02-28 Ebay Inc. System and method for computing features that apply to infrequent queries
US10636075B2 (en) 2016-03-09 2020-04-28 Ebay Inc. Methods and apparatus for querying a database for tail queries
CN112884537A (zh) * 2019-11-29 2021-06-01 北京沃东天骏信息技术有限公司 数据处理方法、装置、设备和计算机可读介质

Also Published As

Publication number Publication date
EP3427146A4 (en) 2019-08-28
US10636075B2 (en) 2020-04-28
US20170262925A1 (en) 2017-09-14
CN108701014B (zh) 2022-11-08
EP3427146A1 (en) 2019-01-16
WO2017156065A1 (en) 2017-09-14

Similar Documents

Publication Publication Date Title
CN108701014A (zh) 用于尾部查询的查询数据库
US11830031B2 (en) Methods and apparatus for detection of spam publication
US11132405B2 (en) Method of identifying temporal demand of queries and metadata to give better autocomplete queries and improved search results
US20180349387A1 (en) Computerized system and method for search query auto-completion
US20230177579A1 (en) System and method for computing features that apply to infrequent queries
US11397873B2 (en) Enhanced processing for communication workflows using machine-learning techniques
US10031976B2 (en) Personalization platform
US12001435B2 (en) Managing database offsets with time series
KR102150572B1 (ko) 무한 검색 결과 페이지
WO2023050732A1 (zh) 对象推荐方法和装置
US20220351251A1 (en) Generating accompanying text creative
US11397614B2 (en) Enhanced processing for communication workflows using machine-learning techniques
US20230239377A1 (en) System and techniques to autocomplete a new protocol definition
EP4381492A1 (en) System and method for providing an intelligent learning experience
CN114581188A (zh) 用于对象推荐的神经网络模型的训练方法及装置
CN113722523A (zh) 对象推荐方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant