CN114168843A - 搜索词推荐方法、设备及存储介质 - Google Patents

搜索词推荐方法、设备及存储介质 Download PDF

Info

Publication number
CN114168843A
CN114168843A CN202111306577.1A CN202111306577A CN114168843A CN 114168843 A CN114168843 A CN 114168843A CN 202111306577 A CN202111306577 A CN 202111306577A CN 114168843 A CN114168843 A CN 114168843A
Authority
CN
China
Prior art keywords
target
search
commodity
page
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111306577.1A
Other languages
English (en)
Inventor
刘森
罗昭慧
金林波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Alibaba Overseas Internet Industry Co ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202111306577.1A priority Critical patent/CN114168843A/zh
Publication of CN114168843A publication Critical patent/CN114168843A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种搜索词推荐方法、设备及存储介质。在本申请实施例中,以当前展示页面关联的目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐;在推荐过程中,结合可控文本生成模型,以及商品类目对搜索词的属性偏好,生成实体类型和顺序可控的多个候选搜索词;最后,结合多个候选搜索词的质量得分和长度信息从中选择目标搜索词并展示,以供用户基于所推荐的目标搜索词直接发起搜索操作,提高搜索效率。在目标搜索词的推荐过程中,既考虑了目标搜索词中包含的实体词的实体类型及其顺序与商品类目适配性,又考虑了目标搜索词的质量和简洁程度,使得目标搜索词的准确度更高。

Description

搜索词推荐方法、设备及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种搜索词推荐方法、设备及存储介质。
背景技术
在电商搜索领域,用户可基于搜索词(query)进行商品搜索。一方面用户可以手动输入所需搜索词发起搜索操作,另一方面,电商平台也可以自动向用户推荐搜索词,用户直接使用平台推荐的搜索词发起搜索操作,以提高搜索效率。
通常,电商平台是在搜索日志中基于各用户对商品的点击、搜索等行为获取热门商品的搜索词作为推荐搜索词,这种方式简洁有效,但是这种方式对商品覆盖不够全面,所推荐搜索词的准确度也有待进一步提高。
发明内容
本申请的多个方面提供一种搜索词推荐方法、设备及存储介质,用以推荐更加准确的搜索词。
本申请实施例提供一种搜索词推荐方法,包括:展示第一页面,第一页面关联目标商品,目标商品属于目标类目,与目标类目适配的多个实体类型及其顺序形成目标控制参数;将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词;基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词;在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
本申请实施例还提供一种搜索词推荐方法,包括:展示第一页面,第一页面关联至少一个商品,至少一个商品属于至少一个类目;在至少一个商品中包含特定商品的情况下,将特定商品作为目标商品,获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数;将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词;基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词;在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
本申请实施例还提供一种计算机设备,包括:存储器和处理器;存储器,用于存储计算机程序;处理器耦合至存储器,用于执行计算机程序以用于执行本申请实施例提供的搜索词推荐方法中的步骤。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当计算机程序被处理器执行时,致使处理器能够实现本申请实施例提供的搜索词推荐方法中的步骤。
在本申请实施例中,以当前展示页面关联的目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐;进一步,在推荐过程中,结合可控文本生成模型,以及商品类目对搜索词的属性偏好,生成实体类型和顺序可控的多个候选搜索词;最后,结合多个候选搜索词的质量得分和长度信息从中选择目标搜索词并展示,以供用户基于所推荐的目标搜索词直接发起搜索操作,提高搜索效率。在目标搜索词的推荐过程中,既考虑了目标搜索词中包含的实体词的实体类型及其顺序与商品类目适配性,又考虑了目标搜索词的质量和简洁程度,这样的目标搜索词的准确度更高,能够更加准确地反映本端用户的搜索意愿/需求,进而召回更多的商品,带来更多的点击、点击转化和询盘转化等。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一示例性实施例提供的终端设备所展示的不同页面;
图2为本申请一示例性实施例提供的一种搜索词推荐方法的流程示意图;
图3为本申请一示例性实施例提供的另一种搜索词推荐方法的流程示意图;
图4为本申请一示例性实施例提供的搜索词推荐方法所适用的模型架构图;
图5为本申请一示例性实施例提供的另一种搜索词推荐方法的流程示意图;
图6为本申请一示例性实施例提供的一种搜索词推荐装置的结构示意图;
图7为本申请一示例性实施例提供的另一种搜索词推荐装置的结构示意图;
图8为本申请一示例性实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在电商场景中,用户可以通过其终端设备安装电商应用,并通过电商应用在线浏览和购买各种商品。其中,电商应用可以向用户提供各种页面,例如首页面、商品详情页面、搜索结果页面、购物车页面、评论页面、订单详情页面等等。为了方便用户随时随地搜索所需商品,在一些页面上设置了搜索框,用户可以在搜索框内输入相关搜索词,并通过点击与搜索框适配的搜索控件发起搜索操作。为了提高搜索效率,在本申请实施例中,可以自动为用户推荐搜索词,并将自动推荐的搜索词显示在搜索框中,以便用户直接点击与搜索框适配的搜索控件发起搜索操作,节约用户输入搜索词的操作,提高搜索效率。
进一步,为了提高所推荐搜索词的准确度,本申请实施例提供一种搜索词推荐方法、设备及存储介质,在本申请实施例中,以当前展示页面关联的目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐;进一步,在推荐过程中,结合可控文本生成模型,以及商品类目对搜索词的属性偏好,生成实体类型和顺序可控的多个候选搜索词;最后,结合多个候选搜索词的质量得分和长度信息从中选择目标搜索词并展示,以供用户基于所推荐的目标搜索词直接发起搜索操作,提高搜索效率。在目标搜索词的推荐过程中,既考虑了目标搜索词中包含的实体词的实体类型及其顺序与商品类目适配性,又考虑了目标搜索词的质量和简洁程度,这样的目标搜索词的准确度更高,能够更加准确地反映本端用户的搜索意愿/需求,进而召回更多的商品,带来更多的点击、点击转化和询盘转化等。
在本申请实施例中,并不限定当前展示页面的实现形态,例如可以是首页面、搜索结果页面、购物车页面、商品详情页面等等。为了便于描述,在本申请实施例中,将当前展示的页面称为第一页面。参见图1,终端设备可响应本端用户的触发操作,向本端用户展示第一页面,与此同时,可采用本申请上述或下述实施例中提供的搜索词推荐方法为本端用户推荐目标搜索词,并在第一页面的搜索框内自动显示所推荐的目标搜索词,例如“纯棉薄款某品牌儿童内衣”,本端用户可直接点击“搜索”按钮发起针对“纯棉薄款某品牌儿童内衣”的搜索操作,电商应用响应该搜索操作,向服务器发起搜索请求,搜索请求中携带搜索词“纯棉薄款某品牌儿童内衣”,服务器根据该搜索请求中的搜索词在商品信息库中进行搜索,并向用户的终端设备返回搜索结果页面,用户的终端设备从第一页面跳转至搜索结果页面。进一步,在从第一页面跳转至搜索结果页面的过程中,还可以采用本申请实施例提供的搜索词推荐方法为本端用户继续推荐目标搜索词,并将搜索结果页面重新作为第一页面,在搜索结果页面上的搜索框内自动显示新的目标搜索词,例如“纯棉春秋薄款某品牌儿童内衣”,以供本端用户在不满足当前搜索结果的情况下继续发起搜索操作。其中,关于本申请实施例提供的搜索词推荐方法的详细实现过程可参见后续实施例的描述。
值得注意的是,用户的终端设备例如可以是手机、平板电脑、笔记本电脑、可穿戴设备、车载设备,但并不以此为限。
图2为本申请一示例性实施例提供的一种搜索词推荐方法的流程示意图。如图2所示,该方法可以包括以下步骤:
201、展示第一页面,第一页面关联目标商品,目标商品属于目标类目,与目标类目适配的多个实体类型及其顺序形成目标控制参数。
202、将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词。
203、基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词。
204、在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
在本申请实施例中,本端用户的用户终端上安装有电商应用,本端用户可以在电商应用上发起针对商品的浏览操作、点击操作、加入购物车操作、购买操作、评价操作、支付操作或退款操作等。
在本端用户通过电商应用享受电商平台提供的服务过程中,其终端设备上展示该电商应用的多个页面中的任一个页面。为了便于理解和区分,将终端设备当前展示的电商应用的页面称作为第一页面,第一页面例如可以包括但不限于以下页面:电商应用的首页面、商品详情页面、购物车页面或者搜索结果页面。
在本申请实施例中,为了能够在第一页面上推荐更加符合本端用户的搜索意愿的目标搜索词,首先,确定第一页面关联的目标商品,并获取目标商品的描述信息,以目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐,与基于用户行为的搜索词推荐方法相比,本实施例从商品维度进行搜索词推荐,不再受该商品是否具有足够的用户行为数据的限制,可以针对任何商品进行搜索词推荐,对商品的覆盖面更广。其中,目标商品的描述信息能够刻画目标商品的特征的信息,目标商品的描述信息可以包括目标商品的标题、目标商品的详情信息和/或目标商品的评论信息、目标商品的产品参数信息等。产品参数信息例如包括品牌名、材质、图案、风格、尺寸、颜色、内部结构等。在本申请实施例中,目标商品的描述信息主要是指文本信息。
在本申请实施例中,并不限定第一页面的实现形态,根据第一页面的实现形态可以将第一页面划分为不同类型。进一步可选的,在确定第一页面关联的目标商品时,可以根据第一页面的类型,确定第一页面关联的目标商品。下面分情形介绍如何根据第一页面的类型,确定第一页面关联的目标商品。
情形1:若第一页面是电商应用的首页面,则可以根据本端用户在电商应用中产生的网络行为数据,从本端用户发生过历史行为的商品中选择一个商品作为第一页面关联的目标商品。
具体而言,可以对本端用户在电商应用中产生的诸如点击商品详情页的点击行为、加入购物车行为、购买商品行为或收藏商品行为等网络行为数据进行分析,根据网络行为数据的分析结果从本端用户发生过历史行为的商品中选择第一页面关联的目标商品。第一页面关联的目标商品例如包括但不限于:本端用户点击次数最多的商品、本端用户浏览时间最长的商品、最近发生过诸如加入购物车、购买或收藏等行为的商品。
值得注意的是,从本端用户发生过历史行为的商品中选择第一页面关联的目标商品,这样选择出来的目标商品是本地用户较为感兴趣的商品,后续在向本端用户推荐与目标商品相关的搜索词,能够更加准确地反映本端用户的搜索意愿/需求,可提高用户基于所推荐的搜索词发起搜索操作的概率。
情形2:若第一页面是商品详情页面,则可以将商品详情页面上展示的商品作为第一页面关联的目标商品。
情形3:第一页面是第一搜索词对应的搜索结果页面,则根据本端用户在电商应用中产生的网络行为数据,从搜索结果页面上展示的商品中选择一个商品作为第一页面关联的目标商品。
具体而言,可以对本端用户在电商应用中产生的诸如点击商品详情页的点击行为、加入购物车行为、购买商品行为或收藏商品行为等网络行为数据进行分析,确定本端用户对搜索结果页面上展示的各个商品的兴趣度,并选择兴趣度最高的商品作为第一页面关联的目标商品。这样选择出来的目标商品是本地用户较为感兴趣的商品,后续在向本端用户推荐与目标商品相关的搜索词,能够更加准确地反映本端用户的搜索意愿/需求,进而召回更多的商品,带来更多的点击、点击转化和询盘转化等。
情形4:若第一页面是购物车页面,则可以将购物车页面上展示的每个商品均作为第一页面关联的目标商品。在该情形4中,需要采用本申请实施例提供的方法针对购物车页面上的每个商品进行搜索词推荐。
在第一页面是购物车页面的情况下,情形4所示确定第一页面关联的目标商品的方式仅为一种示例,但并不限于此。例如,在第一页面是购物车页面的情况下,还可以根据购物车页面上展示的各商品的属性信息,选择一个商品作为目标商品。属性信息例如可以是商品在购物车页面上的显示位置、商品加入购物车的时间点或商品加入购物车的时间长度,相应地,目标商品可以是显示在购物车页面中最靠前位置的第一个商品,或者是最近加入购物车的商品,或者是加入购物车中时间最长的商品。
在本申请实施例中,进一步考虑到用户在针对不同商品类目进行搜索时,所使用的搜索词中实体类型的分布会有所不同,例如用户在搜索电子产品的时候,搜索词中出现描述型号、类型的实体词更多;而搜索美妆产品的时候,搜索词中出现描述使用方式的实体词更多。此外,针对同一行业,不同类目下的实体类型偏好分布也不同。服装行业下,在搜索裙装类目时用户更关注产品的风格,故搜索词中出现描述产品风格的实体词更多,而在搜索婚纱类目时用户更偏好于材料,故在搜索词中出现描述材料、材质的实体词更多。基于此,在本申请实施例中,在从商品维度进行搜索词推荐时,进一步,结合商品类目对搜索词的属性偏好,其中搜索词的属性可通过搜索词包含的实体类型和顺序进行表征,采用可控文本技术进行搜索词推荐,这样可以控制所推荐搜索词中包含的实体类型和顺序与商品类目适配,有利于向用户推荐更加符合搜索需求的搜索词,搜索词能够更加准确地反映本端用户的搜索意愿/需求,进而可召回更多的商品,带来更多的点击、点击转化和询盘转化等。
在具体实现上,可以预先收集并得到各商品类目比较偏好的实体类型及其顺序,作为可控文本生成技术中的控制信号;以及预先训练出可控文本生成模型,用于为各商品类目下的商品生成实体类型和顺序可控的候选搜索词。基于此,在确定第一页面关联的目标商品之后,可识别目标商品所属的商品类目,为便于描述和区分,将目标商品所属的商品类目记为目标类目。其中,目标类目例如包括但不限于母婴用品、服饰鞋包、节庆礼品、粮油调味、电器数码等。
接着,确定目标类目适配的多个实体类型以及实体类型之间的顺序,根据目标类目适配的多个实体类型以及实体类型之间的顺序形成用于对搜索词进行文本控制的控制信号,在本实施例中将该控制信号记为目标控制参数。实体类型是指后续生成的搜索词中涉及的实体词的类型,实体类型例如包括但不限于材料(material)、风格(style)、产品名(product)、地名、品牌、使用方式、型号或类型等。该目标控制参数不仅包括实体类型还包括实体类型之间的顺序。例如,目标控制参数的一种示例包括{材料(material);风格(style);商品名(product)},材料、风格、产品属于不同的实体类型,这三个实体类型的顺序依次是材料、风格和产品。在上述目标控制参数控制下,采用可控文本生成模型生成的搜索词的一种示例为“纯棉修身牛仔裤”,显然,纯棉是具体的商品材料,修身是具体的商品风格,牛仔裤是具体的商品名称,且纯棉、修身、牛仔裤出现在搜索词中的顺序与对应三种实体类型的顺序一致。
值得注意的是,目标控制参数中各个实体类型的顺序可以反映后续生成的搜索词中包含的各实体词出现的先后顺序,也就是后续生成的搜索词中包含的实体的展示顺序。进一步可选地,在基于推荐的搜索词进行搜索时,可以根据该搜索词中包含的各实体词依次进行搜索,其中,针对下一个实体词进行搜索是指采用下一个实体词在前一个搜索词的搜索结果中进行搜索。在该可选实施例中,各个实体类型的顺序也可以反映后续生成的搜索词中涉及的实体的重要度。可选地,排序越靠前的实体类型,其所对应的实体词的优先级越高,在基于相应搜索词进行搜索时可优先根据该实体词进行搜索。或者,排序越靠后的实体类型,其所对应的实体词的优先级越高,基于相应搜索词进行搜索时可优先根据该实体词进行搜索。例如,目标控制参数的一种示例是{material;style;product},则后续生成的搜索词中属于商品名的实体词比属于风格的实体词更为重要,属于风格的实体比属于材料的实体词更为重要。需要说明的是,在基于推荐的搜索词进行搜索时,也可以根据该搜索词中包含的各实体词同时作为搜索条件进行搜索,此时实体词之间不再区分优先级。
在确定第一页面关联的目标商品、并获取目标商品的描述信息以及对应的目标控制参数之后,可将目标商品的描述信息和目标控制参数输入至预先训练出的可控文本生成模型中进行搜索词生成,以得到由可控文本生成模型输出的多个候选搜索词。
在本申请实施例中,在使用可控文本生成模型之前,需预先训练可控文本生成模型,并基于该可控文本生成模型的控制信号可控制推荐query中实体类型和实体类型对应的实体词的出现顺序,进而实现推荐query的可控性。可控文本生成模型能够生成实体类型和实体顺序可控的query,这样的目标搜索词的准确度更高,能够更加准确地反映本端用户的搜索意愿/需求,进而召回更多的商品,带来更多的点击、点击转化和询盘转化等。
其中,可控文本生成模型能够执行文本生成(Text Generation)任务,且在执行文本生成任务过程中,能够控制生成的文本序列的属性。在搜索词推荐场景中,可控文本生成模型按照目标控制参数,从目标商品的描述信息中抽取出实体类型可控且实体类型对应的实体词出现顺序可控的搜索词。具体的,可控文本生成模型生成的搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词。实体词出现在搜索词的顺序与目标控制参数中对应的实体类型的顺序一致。关于可控文本生成模型的训练过程将在后文进行介绍。
在可控文本生成模型生成多个候选搜索词之后,可以对多个候选搜索词进行质量评估,并基于质量评估结果从多个候选搜索词中筛选出质量较好的目标搜索词。具体而言,可以基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分。其中,历史搜索词的效能指标数据包括但不限于:点击通过率(Click Through Rate,CTR)、点击转化率(Conversion Rate,CVR)、点击量(Page View,PV)和询盘量等中的至少一种。其中,点击通过率是指历史搜索词对应的搜索结果页面的实际点击次数与展现次数的比值。点击转化率是指历史搜索词对应的搜索结果页面的转化量与展现次数的比值。点击量是指历史搜索词对应的搜索结果页面的点击次数。询盘量是指消费者在历史搜索词对应的搜索结果页面上发起咨询商家操作并最终下单的订单笔数。
进一步可选的,为了更为客观准确地预测多个候选搜索词的质量得分,基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分的一种实施过程是:预先以历史搜索词及其质量得分作为训练样本进行模型训练得到的价值评估模型;将多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到多个候选搜索词的质量得分。
其中,历史搜索词的质量得分是根据历史搜索词的效能指标数据计算得到的。在一可选实施方式中,历史搜索词的效能指标数据同时包括历史搜索词的点击通过率、点击转化率、点击量和询盘量,基于此,根据历史搜索词的效能指标数据计算历史搜索词的质量得分的一种实施过程是:根据历史搜索词的点击通过率和点击转化率,计算历史搜索词对应的商品转化得分;根据历史搜索词的点击量和询盘量,计算历史搜索词对应的用户粘性得分;根据历史搜索词对应的商品转化得分和用户粘性得分,得到历史搜索词的质量得分。
在计算商品转化得分时,可以对历史搜索词的点击通过率和点击转化率进行求平均值得到,也可以对历史搜索词的点击通过率和点击转化率进行加权求和得到,但并不以此为限。在计算用户粘性得分时,可以对历史搜索词的点击量和询盘量进行求平均值得到,也可以对历史搜索词的点击量和询盘量进行加权求和得到,但并不以此为限。
在计算历史搜索词的质量得分时,可以对历史搜索词对应的商品转化得分和用户粘性得分进行求平均值得到,也可以对历史搜索词对应的商品转化得分和用户粘性得分进行加权求和得到,但并不以此为限。
进一步可选的,还可以按照以下公式(1)计算每个历史搜索词的质量得分;
value(q)=σ(z_score(CTR+α×CVR))+σ(z_score(PV+β×FB)) (1)
其中,value(q)为每个历史搜索词的质量得分,σ(z_score(CTR+α×CVR))记为每个历史搜索词的商品转化得分,σ(z_score(PV+β×FB))记为每个历史搜索词的用户粘性得分;α、β为取经验值,例如α、β均取10。PV为点击量,FB为询盘量,CTR为点击通过率、CVR为点击转化率。
其中,z_score(x)可以根据实际应用需求设置,例如,z_score(x)按照公式(2)进行定义:
Figure BDA0003340509370000091
在计算每个历史搜索词的商品转化得分时,x取该历史搜索词的点击通过率和点击转化率的量化结果也即CTR+α×CVR;mean(x)是全部的历史搜索词对应的CTR+α×CVR计算出来的平均值;std(x)是全部的历史搜索词对应的CTR+α×CVR计算出来的标准差。
在计算每个历史搜索词的用户粘性得分时,x取该历史搜索词的点击量和询盘量的量化结果也即PV+β×FB;mean(x)是全部的历史搜索词对应的PV+β×FB计算出来的平均值;std(x)是全部的历史搜索词对应的PV+β×FB计算出来的标准差。
其中,σ(y)可以根据实际应用需求设置,例如,σ(y)按照公式(3)进行定义:
Figure BDA0003340509370000092
值得注意的是,在计算每个历史搜索词的商品转化得分时,y取z_score(PV+β×FB);在计算每个历史搜索词的用户粘性得分,y取z_score(CTR+α×CVR))+σ(z_score(PV+β×FB)。
在本申请实施例中,在预测出多个候选搜索词的质量得分之后,可以结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词。具体而言,候选搜索词的质量得分反映候选搜索词的质量程度,候选搜索词的长度信息能够反映候选搜索词的简洁程度。候选搜索词的长度信息可以用候选搜索词包括的单词数量进行量化。其中,候选搜索词的长度与选搜索词的简洁程度成反比,候选搜索词的长度越长,候选搜索词越不简洁;候选搜索词的长度越短,候选搜索词越简洁。
实际应用中,本申请实施对结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词的方式并不做限制。例如,可以从多个候选搜索词中选择质量得分高于预设质量得分且长度短于预设长度的候选搜索词作为目标搜索词。又如,也可以从多个候选搜索词中筛选出长度短于预设长度的候选搜索词,在对筛选出的长度短于预设长度的候选搜索词中,选择质量得分最高的候选搜索词作为目标搜索词。又如,也可以从多个候选搜索词中筛选出质量得分高于预设质量得分的候选搜索词,在从筛选出的质量得分高于预设质量得分的候选搜索词中,选择长度最短的候选搜索词作为目标搜索词。
在一可选实施例中,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词的一种实施过程是:根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分,候选搜索词的长度越短,其对应的长度惩罚分越大;根据多个候选搜索词的长度惩罚分和质量得分,得到多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。
具体而言,可以对每个候选搜索词的长度信息进行量化,得到该候选搜索词的长度惩罚分。例如,可以设置长度信息与长度惩罚分的对应关系,基于长度信息与长度惩罚分的对应关系确定与每个候选搜索词的长度信息匹配的长度惩罚分。
在得到每个候选搜索词的长度惩罚分之后,可以将该候选搜索词的质量得分减去长度惩罚分,得到修正后的候选搜索词的质量得分,并将修正后的候选搜索词的质量得分作为该候选搜索词的整体得分。在得到各个候选搜索词的整体得分之后,选择整体得分最大的候选搜索词作为目标搜索词。
进一步可选的,根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分的一种实施过程可以是:针对每个候选搜索词,计算候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算候选搜索词的出现概率;利用候选搜索词的长度信息的负倒数,对候选搜索词的出现概率进行修正,得到候选搜索词的长度惩罚分;其中,实体词的条件概率是指实体词在以目标商品的描述信息和目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在候选搜索词中的概率。
假设每个候选搜索词的长度惩罚分记为Score(y≤T|x),按照公式(4)计算每个候选搜索词的长度惩罚分。
Figure BDA0003340509370000101
其中,α是控制长度惩罚项影响程度的超参数,α是一个经验值,例如α取0.7。T是候选搜索词yT的长度,t为1至T之间的正整数,yt表示预测出的第t个词语,y<t表示由t-1个词语组成的预测搜索词。P(yt|x,y<t)表示在输入文本序列x和已经解码出搜索词y<t的前提下,预测出现第t个词语yt的概率。
值得注意的是,在采用公式(4)计算任一候选搜索词的长度惩罚分Score(y≤T|x)时,由于考虑了候选搜索词的长度惩罚,使得更为简洁的搜索词的长度惩罚分越小,进而可以帮助选择更符合用户表达习惯且更精炼简洁的query,从而能够召回更多数量的商品。
值得注意的是,在计算每个候选搜索词的长度惩罚分时,P(yt|x,y<t)可以由可控文本生成模型提供,可控文本生成模型能够给出各个候选搜索词对应的P(yt|x,y<t)。
在选择出目标搜索词之后,将该目标搜索词展示第一页面上,以供本端用户基于目标搜索词发起搜索。需要说明的是,上述从生成候选搜索词并从候选搜索词中选择出目标搜索词的处理速度很快,整个过程可以在展示第一页面的过程中完成,对本端用户来说,在看到第一页面的同时,可看到第一页面上展示的目标搜索词。
实际应用中,与第一页面关联的目标商品可能是一个,也可能是多个。在存在多个目标商品的情况下,可以在第一页面上展示本端用户最感兴趣的目标商品的搜索词。
在一可选实施例中,在第一页面是购物车页面且购物车页面上展示有多个商品的情况下,如果将购物车页面上展示的每个商品都作为目标商品,则目标商品为多个,在该情况下,在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索的一种实施过程是:根据本端用户在电商应用中产生的网络行为数据,生成本端用户对多个目标商品的兴趣度;针对兴趣度最大的目标商品,在购物车页面上展示其对应的目标搜索词,以供本端用户基于目标搜索词发起搜索。例如,兴趣度可以采用商品在购物车页面上的显示位置、商品加入购物车的时间点、商品加入购物车的时间长度等信息进行体现。例如,商品在购物车页面上的显示位置越靠前,本端用户对该商品的兴趣度越大;商品加入购物车的时间点越晚,本端用户对该商品的兴趣度越大;商品加入购物车的时间长度越长,本端用户对该商品的兴趣度越大。
值得注意的是,由于本申请实施例在搜索词推荐过程中,采用了可控文本生成模型,依赖商品的描述信息生成query,不依赖于商品的点击行为,因此可以针对传统搜索词推荐方案覆盖不了的商品进行query推荐,特别地能够解决长尾商品的数据冷启动问题。另外,由于用户在搜索不同类目下的商品时,所使用的搜索词中的实体类型分布显著不同。本申请实施例提供的搜索词推荐方案通过实体类型可控和实体顺序可控,能够为商品针对其所在类目生成更符合用户偏好的query,能够保证推荐query的点击转化。
本申请实施例提供的搜索词推荐方法,以当前展示页面关联的目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐;进一步,在推荐过程中,结合可控文本生成模型,以及商品类目对搜索词的属性偏好,生成实体类型和顺序可控的多个候选搜索词;最后,结合多个候选搜索词的质量得分和长度信息从中选择目标搜索词并展示,以供用户基于所推荐的目标搜索词直接发起搜索操作,提高搜索效率。在目标搜索词的推荐过程中,既考虑了目标搜索词中包含的实体词的实体类型及其顺序与商品类目适配性,又考虑了目标搜索词的质量和简洁程度,这样的目标搜索词的准确度更高,能够更加准确地反映本端用户的搜索意愿/需求,进而召回更多的商品,带来更多的点击、点击转化和询盘转化等。
值得注意的是,在电商搜索领域,基于商品的query推荐方案通常使用基于对商品的点击行为关联的方案。然而,网站流量的二八定律导致多数商品流量覆盖不足,故此行为类方案无法为长尾商品提供推荐合适的query。本申请实施例提供的搜索词推荐方法实现了实体类型可控、实体顺序可控、召回数量可控、query价值可控,能够为长尾商品乃至全部商品提供用户更愿意点击的、召回商品数量更多的、潜在转化价值更高的query。
在本申请一些可选实施例中,可以将商品分为两类,一类是特定商品,一类是非特定商品。针对特定商品,可采用本申请实施例提供的搜索词推荐方法;针对非特定商品,可采用传统搜索词推荐方案;基于此,本申请实施例提供的另一种搜索词推荐方法,如图3所示,包括:
301、展示第一页面,第一页面关联目标商品,从搜索日志中获取与目标商品相关的网络行为数据作为目标网络行为数据。
302、根据目标网络行为数据确定目标商品是否满足特定商品条件,即判断目标商品是否属于特定商品;针对满足特定商品条件的目标商品,执行步骤303-305和307;针对不满足特定商品条件的目标商品,执行步骤306和307。
303、确定目标商品所属的目标类目,将与目标类目适配的多个实体类型及其顺序形成目标控制参数。
304、将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词。
305、基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词,并跳转至307。
306、采用传统搜索词推荐方案推荐与目标商品相关的目标搜索词,并跳转至307。其中,传统搜索词推荐方案包括基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
307、在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
关于301、303、304、305、307步骤的详细说明可参见前述实施例中的201至204步骤,在此不再赘述。
具体而言,搜索日志记录了电商平台提供的各个商品的网络行为数据,例如,各个商品详细页的点击量和浏览时长、各个商品的加入购物车的次数、各个商品被购买的次数、各个商品的访客数、各个商品的询盘转化率等。从搜索日志中筛选出与目标商品相关的目标网络行为数据,基于目标网络行为数据可以分析目标商品是否为满足特定商品条件的特定商品。其中,特定商品条件可以根据实际应用需求设置。特定商品例如为短尾商品、中尾商品或者长尾商品。其中,短尾商品是指需求频繁而且稳定的产品;中尾商品是指需求频繁,但很不稳定的产品;短尾商品是指需求非常不频繁且需求变动也很大的产品。
在目标商品属于特定商品时,采用本申请实施例提供的搜索词推荐方法推荐与目标商品相关的目标搜索词。在目标商品不属于特定商品时,采用传统搜索词推荐方案推荐与目标商品相关的目标搜索词。其中,传统搜索词推荐方案例如包括但不限于:基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
基于行为驱动的搜索词推荐方案是基于用户点击行为使用改进的TF-IDF(termfrequency–inverse document frequency,词频-逆向文件频率)算法在搜索日志中寻找与某商品关联最紧密的搜索词,并将与某商品关联最紧密的搜索词作为推荐的目标query。该方案简洁有效,且以用户对商品的点击、浏览等行为为基础,可有效覆盖短尾商品和中尾商品的query推荐,但是对于长尾商品的覆盖不够到位。
基于商品的描述信息相似度拓展的搜索词推荐方案是:利用基于行为驱动的搜索词推荐方案获取若干个商品的推荐query,根据若干个商品与其他商品的商品描述信息之间的相似度,关联相似商品,并基于相似商品的描述信息进行推荐query的拓展。该方案能够提高对商品的覆盖率,可以针对更为广泛的商品进行query推荐,而且基于商品描述信息的相关性,还有可能覆盖到一些长尾商品,但依旧存在覆盖不到位的问题。进一步可选的,商品描述信息可以是商品主图。商品主图根据品牌的定位、商品的特点来决定,商品主图是影响商品和店铺点击率的主要因素。
针对基于商品的描述信息抽取实体作为搜索词的推荐方案,例如可以从商品的标题中抽取指定类型的实体作为query。因为每个商品都有标题,所以每个商品都能抽取出内容来,而与商品的点击行为无关,因此在一定程度上行能够弥补“基于行为驱动的搜索词推荐方案”的缺陷,但抽取出的多个实体之间的搭配不太可控,容易出现混乱或错误表达。
以长尾商品和非长尾产品为例,采用本申请实施例提供的搜索词推荐方法和传统搜索词推荐方案的结合,可以有针对性对不同类型的商品采用各自适配的推荐方案进行搜索词推荐,在搜索词推荐上可以更为全面的覆盖各种商品,进而基于所推荐的搜索词保证各商品均能达到较好的搜索效果。
图4为本申请一示例性实施例提供的搜索词推荐方法所适用的一种模型架构图。如图4所示,该模型架构包括可控文本生成模型、价值评估模型以及选择器模型。针对用户的终端设备上所展示的第一页面,如图4中的①所示,将该第一页面关联的目标商品的描述信息和目标控制参数输入至可控文本生成模型中,可控文本生成模型利用编码器对目标商品的描述信息和目标控制参数进行编码,并利用解码器对编码器输出的编码信息进行解码,得到多个候选搜索词,如图4中的②所示;可控文本生成模型将多个候选搜索词分别输出给价值评估模型和选择器模型。价值评估模型对多个候选搜索词进行价值评估,并将多个候选搜索词的质量得分输出给选择器模型,如图4中的③和④所示。选择器模型同时结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词,并输出目标搜索词,如图4中的⑤和⑥所示。选择器模型输出的目标搜索词展现至第一页面上,以向用户展示。关于可控文本生成模型和价值评估模型的介绍可以参见前述内容。另外,选择器模型从多个候选搜索词中选择目标搜索词的具体实现方式可以参见前述内容,该选择器模型可以通过软件、硬件或者软硬件结合的方式实现。在本申请的上述或下述实施例中,可控文本生成模型可以是利用海量语料自监督地训练出的大体量的语言模型(LanguageModel,LM)。进一步可选的,为了提高训练效率和模型性能,可控文本生成模型可以是按照“预训练-精调”模式训练得到,也即可控文本生成模型是在预训练语言模型(Pre-trainedLanguage Model,PLM)上进行再次训练得到的,其中,预训练语言模型是在海量语料上自监督地训练出的大体量的语言模型。进一步可选的,可控文本生成模型可以是在基于BART(Bidirectional and Auto-Regressive Transformers,双向自回归变压器)的预训练语言模型上训练得到的。值得注意的是,在可控文本生成模型是在预训练语言模型上训练得到时,基于这样的可控文本生成模型不仅利用上了预训练阶段学习到的知识,并且在可控的数据集的训练下,能够学到query的高频表达。进而使得本申请实施例提供的搜索词推荐方案在实体搭配、错误纠正、表达通俗、抓取重点等方面有显著提升。
在训练用于生成搜索词的可控文本生成模型时,首先,准备数据集D,数据集D中包括多个样本,每个样本包括样本商品的描述信息及其对应的控制参数以及从样本商品的描述信息中提出的样本搜索词。接着,将样本商品的描述信息及其控制参数作为模型输入参数,将样本商品对应样本搜索词作为模型期望输出结果,不断迭代训练,得到损失函数收敛的可控文本生成模型。
为了实现可控文本生成模型生成query中的实体类型和实体词顺序的可控,在准备数据集中D中的每个样本时,按照样本商品的控制参数构造对应样本搜索词。具体来说,一个样本由三部分组成,包括样本商品的描述信息及其控制参数、样本商品对应样本搜索词。以样本商品的描述信息为样本商品的标题为例,商品标题为纯棉男童宽松某品牌内衣1件装出售百件,控制参数{material;style;product},样本搜索词为“纯棉男童宽松某品牌内衣”,某品牌内衣是product产品词对应的实体词,男童宽松是style风格对应的实体词,纯棉是material材料对应的实体词。为了增强可控文本生成模型捕捉实体、实体之间顺序的能力,对训练数据进行数据增强,即得到种类更多、更丰富的样本数据,能够提高模型的学习能力。本申请实施例对数据增强方式不做限制。例如,针对一个样本信号中的控制参数,可以随机删除控制参数中包含的实体类型或随机打乱实体类型间的顺序进行控制参数的增强,进而生成与之增强的控制参数适配的样本搜索词,得到更为更丰富的样本数据,实现对样本数据的增强。具体应用时,针对任一样本,可以随机删除控制参数中的一个或多个实体类型,对应的删除样本搜索词中的一个或多个实体词,进而得到一个或多个新的样本。同样地,针对任一样本,可以随机调换控制参数中的实体类型之间的顺序,并同步调换样本搜索词中的实体词之间的顺序。举例来说,样本1为:商品标题“纯棉男童宽松某品牌内衣1件装出售百件”、控制参数{material;style;product}、样本搜索词为“纯棉男童宽松某品牌内衣”。经过数据增强后,在样本1的基础上可以得到表1中更为丰富的样本数据。
表1
Figure BDA0003340509370000151
在训练可控文本生成模型时,定义如公式(5)所示的损失函数L:
Figure BDA0003340509370000161
以商品描述信息为商品标题为例,针对数据集D中第i个样本,假设数据集D的样本总数记为|D|,第i个样本的商品标题记为title_i,第i个样本的控制参数记为codes_i,第i个样本的样本搜索词的长度记为Ti,第i个样本的样本搜索词记为yi,将第i个样本的商品标题title_i和第i个样本的控制参数codes_i进行拼接,得到第i个样本对应的源文本xi=[codes_i|title_i],于是,(xi,yi)∈D表示数据集D中的第i个样本的样本数据。值得注意的是,t为1至Ti之间的正整数。yi t表示第i个样本对应的第t个词语,yi <t表示第i个样本对应的由t-1个词语组成的预测搜索词。
值得注意的是,P(yi t|xi,yi <t)表示在输入参数为xi和已经解码出搜索词yi <t的前提下,预测出现第t个词语yi t的概率。logP(yi t|xi,yi <t)表示对P(yi t|xi,yi <t)进行取对数运算。
值得注意的是,由于采用公式(5)所示的损失函数训练可控文本生成模型时,由于搜索词yi t的概率考虑了输入参数xi,也即是可控文本生成模型生成的query考虑了与商品的描述信息的相关性,使得可控文本生成模型可以推荐出更加准确的query,帮助召回更多商品推荐给用户。
本申请实施例对可控文本生成模型的解码算法不做限制。进一步可选的,可以采用Beam Search(集束搜索)算法进行解码。Beam Search算法在每一解码步都仅维护k个似然得分最高的候选文本序列及其得分,在k个候选文本序列的基础上进行下一步解码获得k2个候选文本序列,再根据k2个候选文本序列各自的似然得分进行采样,保留k个候选文本序列直到解码过程终止。其中,k为正整数。应理解,由于Beam Search算法可以控制候选文本序列的数量,于是,基于Beam Search(集束搜索)算法进行解码的可控文本生成模型能够实现召回数量可控,也即实现控制候选搜索词的数量。
图5为本申请一示例性实施例提供的另一种搜索词推荐方法的流程示意图。如图5所示,该方法可以包括以下步骤:
501、展示第一页面,第一页面关联至少一个商品,至少一个商品属于至少一个类目。
502、在至少一个商品中包含特定商品的情况下,将特定商品作为目标商品,获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数。
503、将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词。
504、基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词。
505、在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
关于501至505步骤的详细说明可参见前述实施例中的201至204步骤以及302步骤,在此不再赘述。
进一步可选的,基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分,包括:
将多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到多个候选搜索词的质量得分;其中,价值评估模型是以历史搜索词及其质量得分作为训练样本进行模型训练得到的,历史搜索词的质量得分是根据历史搜索词的效能指标数据计算得到的。
进一步可选的,历史搜索词的效能指标数据包括点击通过率、点击转化率、点击量和询盘量;上述方法还包括:根据历史搜索词的点击通过率和点击转化率,计算历史搜索词对应的商品转化得分;根据历史搜索词的点击量和询盘量,计算历史搜索词对应的用户粘性得分;根据历史搜索词对应的商品转化得分和用户粘性得分,得到历史搜索词的质量得分。
进一步可选的,结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词,包括:根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分,候选搜索词的长度越短,其对应的长度惩罚分越大;根据多个候选搜索词的长度惩罚分和质量得分,得到多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。
进一步可选的,根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分,包括:针对每个候选搜索词,计算候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算候选搜索词的出现概率;利用候选搜索词的长度信息的负倒数,对候选搜索词的出现概率进行修正,得到候选搜索词的长度惩罚分;其中,实体词的条件概率是指实体词在以目标商品的描述信息和目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在候选搜索词中的概率。
进一步可选的,在获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数之前,还包括:从搜索日志中获取与目标商品相关的网络行为数据作为目标网络行为数据,并根据目标网络行为数据确定目标商品是否满足特定商品条件;将满足特定商品条件的特定商品作为目标商品,并执行获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数及后续操作。
进一步可选的,上述方法还包括:针对不满足特定商品条件的目标商品,采用传统搜索词推荐方案推荐与目标商品相关的目标搜索词;其中,传统搜索词推荐方案包括基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
进一步可选的,上述方法还包括:根据第一页面的类型,确定第一页面关联的目标商品。
进一步可选的,根据第一页面的类型,确定第一页面关联的目标商品,包括:若第一页面是电商应用的首页面,则根据本端用户在电商应用中产生的网络行为数据,从本端用户发生过历史行为的商品中选择一个商品作为第一页面关联的目标商品;若第一页面是商品详情页面,则将商品详情页面上展示的商品作为第一页面关联的目标商品;若第一页面是第一搜索词对应的搜索结果页面,则根据本端用户在电商应用中产生的网络行为数据,从搜索结果页面上展示的商品中选择一个商品作为第一页面关联的目标商品;若第一页面是购物车页面,则将购物车页面上展示的每个商品均作为第一页面关联的目标商品。
进一步可选的,在第一页面是购物车页面且购物车页面上展示有多个商品的情况下,目标商品为多个,则在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索,包括:根据本端用户在电商应用中产生的网络行为数据,生成本端用户对多个目标商品的兴趣度;针对兴趣度最大的目标商品,在购物车页面上展示其对应的目标搜索词,以供本端用户基于目标搜索词发起搜索。
本申请实施例提供的搜索词推荐方法,以当前展示页面关联的满足特定商品条件的目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐;进一步,在推荐过程中,结合可控文本生成模型,以及商品类目对搜索词的属性偏好,生成实体类型和顺序可控的多个候选搜索词;最后,结合多个候选搜索词的质量得分和长度信息从中选择目标搜索词并展示,以供用户基于所推荐的目标搜索词直接发起搜索操作,提高搜索效率。在目标搜索词的推荐过程中,既考虑了目标搜索词中包含的实体词的实体类型及其顺序与商品类目适配性,又考虑了目标搜索词的质量和简洁程度,这样的目标搜索词的准确度更高,能够更加准确地反映本端用户的搜索意愿/需求,进而召回更多的商品,带来更多的点击、点击转化和询盘转化等。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤201至步骤204的执行主体可以为设备A;又比如,步骤201和202的执行主体可以为设备A,步骤204的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如201、202等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
图6为本申请一示例性实施例提供的一种搜索词推荐装置的结构示意图。该装置可以通过软件、硬件或者软硬件结合的方式实现,如图6所示,该装置包括:
展示模块61,用于展示第一页面,第一页面关联目标商品,目标商品属于目标类目,与目标类目适配的多个实体类型及其顺序形成目标控制参数。
生成模块62,用于将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词。
预测模块63,用于基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分。
选择模块64,用于结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词。
展示模块61,还用于在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
进一步可选的,预测模块63基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分时,具体用于:将多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到多个候选搜索词的质量得分;其中,价值评估模型是以历史搜索词及其质量得分作为训练样本进行模型训练得到的,历史搜索词的质量得分是根据历史搜索词的效能指标数据计算得到的。
进一步可选的,历史搜索词的效能指标数据包括点击通过率、点击转化率、点击量和询盘量;装置还包括计算模块,用于根据历史搜索词的点击通过率和点击转化率,计算历史搜索词对应的商品转化得分;根据历史搜索词的点击量和询盘量,计算历史搜索词对应的用户粘性得分;根据历史搜索词对应的商品转化得分和用户粘性得分,得到历史搜索词的质量得分。
进一步可选的,选择模块64结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词时,具体用于:根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分,候选搜索词的长度越短,其对应的长度惩罚分越大;根据多个候选搜索词的长度惩罚分和质量得分,得到多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。
进一步可选的,选择模块64根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分时,具体用于:针对每个候选搜索词,计算候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算候选搜索词的出现概率;利用候选搜索词的长度信息的负倒数,对候选搜索词的出现概率进行修正,得到候选搜索词的长度惩罚分;其中,实体词的条件概率是指实体词在以目标商品的描述信息和目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在候选搜索词中的概率。
进一步可选的,上述装置还包括:处理模块;处理模块,用于在将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词之前,从搜索日志中获取与目标商品相关的网络行为数据作为目标网络行为数据,并根据目标网络行为数据确定目标商品是否满足特定商品条件;针对满足特定商品条件的目标商品,触发生成模块执行将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词的操作。
进一步可选的,处理模块,还用于:针对不满足特定商品条件的目标商品,采用传统搜索词推荐方案推荐与目标商品相关的目标搜索词;其中,传统搜索词推荐方案包括基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
进一步可选的,上述装置还包括:确定模块;确定模块,用于根据第一页面的类型,确定第一页面关联的目标商品。
进一步可选的,确定模块根据第一页面的类型,确定第一页面关联的目标商品时,具体用于:若第一页面是电商应用的首页面,则根据本端用户在电商应用中产生的网络行为数据,从本端用户发生过历史行为的商品中选择一个商品作为第一页面关联的目标商品;若第一页面是商品详情页面,则将商品详情页面上展示的商品作为第一页面关联的目标商品;若第一页面是第一搜索词对应的搜索结果页面,则根据本端用户在电商应用中产生的网络行为数据,从搜索结果页面上展示的商品中选择一个商品作为第一页面关联的目标商品;若第一页面是购物车页面,则将购物车页面上展示的每个商品均作为第一页面关联的目标商品。
进一步可选的,在第一页面是购物车页面且购物车页面上展示有多个商品的情况下,目标商品为多个,则展示模块61,在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索时,具体用于:根据本端用户在电商应用中产生的网络行为数据,生成本端用户对多个目标商品的兴趣度;针对兴趣度最大的目标商品,在购物车页面上展示其对应的目标搜索词,以供本端用户基于目标搜索词发起搜索。
关于图6所示的搜索词推荐装置的具体实现方式已经在有关搜索词推荐方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7为本申请一示例性实施例提供的另一种搜索词推荐装置的结构示意图。该装置可以通过软件、硬件或者软硬件结合的方式实现,如图7所示,该装置包括:
展示模块71,用于展示第一页面,第一页面关联至少一个商品,至少一个商品属于至少一个类目。
获取模块72,用于在至少一个商品中包含特定商品的情况下,将特定商品作为目标商品,获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数。
生成模块73,用于将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词。
预测模块74,用于基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分。
选择模块75,用于结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词。
展示模块71,还用于在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
进一步可选的,预测模块74基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分时,具体用于:将多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到多个候选搜索词的质量得分;其中,价值评估模型是以历史搜索词及其质量得分作为训练样本进行模型训练得到的,历史搜索词的质量得分是根据历史搜索词的效能指标数据计算得到的。
进一步可选的,历史搜索词的效能指标数据包括点击通过率、点击转化率、点击量和询盘量;上述装置还包括计算模块:计算模块,用于根据历史搜索词的点击通过率和点击转化率,计算历史搜索词对应的商品转化得分;根据历史搜索词的点击量和询盘量,计算历史搜索词对应的用户粘性得分;根据历史搜索词对应的商品转化得分和用户粘性得分,得到历史搜索词的质量得分。
进一步可选的,选择模块75结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词时,具体用于:根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分,候选搜索词的长度越短,其对应的长度惩罚分越大;根据多个候选搜索词的长度惩罚分和质量得分,得到多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。
进一步可选的,选择模块75根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分时,具体用于:针对每个候选搜索词,计算候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算候选搜索词的出现概率;利用候选搜索词的长度信息的负倒数,对候选搜索词的出现概率进行修正,得到候选搜索词的长度惩罚分;其中,实体词的条件概率是指实体词在以目标商品的描述信息和目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在候选搜索词中的概率。
进一步可选的,上述装置还包括处理模块,用于从搜索日志中获取与目标商品相关的网络行为数据作为目标网络行为数据,并根据目标网络行为数据确定目标商品是否满足特定商品条件;将满足特定商品条件的特定商品作为目标商品,并触发获取模块执行获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数的操作。
进一步可选的,处理模块还用于:针对不满足特定商品条件的目标商品,采用传统搜索词推荐方案推荐与目标商品相关的目标搜索词;其中,传统搜索词推荐方案包括基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
进一步可选的,上述装置还包括确定模块,用于根据第一页面的类型,确定第一页面关联的目标商品。关于确定模块根据第一页面的类型确定第一页面关联的目标商品的详细实施方式可参见前述实施例,在此不再赘述。
进一步可选的,在第一页面是购物车页面且购物车页面上展示有多个商品的情况下,目标商品为多个,则展示模块71在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索时,具体用于:根据本端用户在电商应用中产生的网络行为数据,生成本端用户对多个目标商品的兴趣度;针对兴趣度最大的目标商品,在购物车页面上展示其对应的目标搜索词,以供本端用户基于目标搜索词发起搜索。
关于图7所示的搜索词推荐装置的具体实现方式已经在有关搜索词推荐方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8为本申请一示例性实施例提供的一种计算机设备的结构示意图。参见图8,该计算机设备包括:存储器81和处理器82。
存储器81,用于存储计算机程序,并可被配置为存储其它各种数据以支持在计算平台上的操作。这些数据的示例包括用于在计算平台上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器81可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器82,与存储器81耦合,用于执行存储器81中的计算机程序,以用于:展示第一页面,第一页面关联目标商品,目标商品属于目标类目,与目标类目适配的多个实体类型及其顺序形成目标控制参数;将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词;基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分;结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词;在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
进一步可选的,处理器82基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分时,具体用于:将多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到多个候选搜索词的质量得分;其中,价值评估模型是以历史搜索词及其质量得分作为训练样本进行模型训练得到的,历史搜索词的质量得分是根据历史搜索词的效能指标数据计算得到的。
进一步可选的,历史搜索词的效能指标数据包括点击通过率、点击转化率、点击量和询盘量;处理器82还用于根据历史搜索词的点击通过率和点击转化率,计算历史搜索词对应的商品转化得分;根据历史搜索词的点击量和询盘量,计算历史搜索词对应的用户粘性得分;根据历史搜索词对应的商品转化得分和用户粘性得分,得到历史搜索词的质量得分。
进一步可选的,处理器82结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词时,具体用于:根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分,候选搜索词的长度越短,其对应的长度惩罚分越大;根据多个候选搜索词的长度惩罚分和质量得分,得到多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。
进一步可选的,处理器82根据多个候选搜索词的长度信息,生成多个候选搜索词的长度惩罚分时,具体用于:针对每个候选搜索词,计算候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算候选搜索词的出现概率;利用候选搜索词的长度信息的负倒数,对候选搜索词的出现概率进行修正,得到候选搜索词的长度惩罚分;其中,实体词的条件概率是指实体词在以目标商品的描述信息和目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在候选搜索词中的概率。
进一步可选的,处理器82还用于:在将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词之前,从搜索日志中获取与目标商品相关的网络行为数据作为目标网络行为数据,并根据目标网络行为数据确定目标商品是否满足特定商品条件;针对满足特定商品条件的目标商品,触发生成模块执行将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词的操作。
进一步可选的,处理器82还用于:针对不满足特定商品条件的目标商品,采用传统搜索词推荐方案推荐与目标商品相关的目标搜索词;其中,传统搜索词推荐方案包括基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
进一步可选的,处理器82还用于:根据第一页面的类型,确定第一页面关联的目标商品。
进一步可选的,处理器82根据第一页面的类型,确定第一页面关联的目标商品时,具体用于:若第一页面是电商应用的首页面,则根据本端用户在电商应用中产生的网络行为数据,从本端用户发生过历史行为的商品中选择一个商品作为第一页面关联的目标商品;若第一页面是商品详情页面,则将商品详情页面上展示的商品作为第一页面关联的目标商品;若第一页面是第一搜索词对应的搜索结果页面,则根据本端用户在电商应用中产生的网络行为数据,从搜索结果页面上展示的商品中选择一个商品作为第一页面关联的目标商品;若第一页面是购物车页面,则将购物车页面上展示的每个商品均作为第一页面关联的目标商品。
进一步可选的,在第一页面是购物车页面且购物车页面上展示有多个商品的情况下,目标商品为多个,则处理器82在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索时,具体用于:根据本端用户在电商应用中产生的网络行为数据,生成本端用户对多个目标商品的兴趣度;针对兴趣度最大的目标商品,在购物车页面上展示其对应的目标搜索词,以供本端用户基于目标搜索词发起搜索。
进一步,如图8所示,该计算机设备还包括:通信组件83、显示器84、电源组件85、音频组件86等其它组件。图8中仅示意性给出部分组件,并不意味着计算机设备只包括图8所示组件。另外,图8中虚线框内的组件为可选组件,而非必选组件,具体可视排产设备的产品形态而定。本实施例的计算机设备可以实现为台式电脑、笔记本电脑、智能手机或IOT设备等终端设备,也可以是常规服务器、云服务器或服务器阵列等服务端设备。若本实施例的计算机设备实现为台式电脑、笔记本电脑、智能手机等终端设备,可以包含图8中虚线框内的组件;若本实施例的计算机设备实现为常规服务器、云服务器或服务器阵列等服务端设备,则可以不包含图8中虚线框内的组件。
本申请实施例还提供一种计算机设备,该计算机设备的结构与图8所示的计算机设备的结构相同,但是处理逻辑不同。具体而言,该计算机设备包括:存储器和处理器。处理器,与存储器耦合,用于执行存储器中的计算机程序,以用于:展示第一页面,第一页面关联至少一个商品,至少一个商品属于至少一个类目;在至少一个商品中包含特定商品的情况下,将特定商品作为目标商品,获取与目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数;将目标商品的描述信息和目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照顺序出现的与多个实体类型对应的多个实体词;基于历史搜索词的效能指标数据,预测多个候选搜索词的质量得分;结合多个候选搜索词的质量得分和长度信息,从多个候选搜索词中选择目标搜索词;在第一页面上展示目标搜索词,以供本端用户基于目标搜索词发起搜索。
关于处理器执行各动作的详细实施过程可参见前述方法实施例或设备实施例中的相关描述,在此不再赘述。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由计算机设备执行的各步骤。
相应地,本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,致使处理器能够实现上述方法实施例中可由计算机设备执行的各步骤。
上述图8中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
上述图8中的显示器包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。
上述图8中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述图8中的音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (13)

1.一种搜索词推荐方法,其特征在于,包括:
展示第一页面,所述第一页面关联目标商品,所述目标商品属于目标类目,与所述目标类目适配的多个实体类型及其顺序形成目标控制参数;
将所述目标商品的描述信息和所述目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照所述顺序出现的与所述多个实体类型对应的多个实体词;
基于历史搜索词的效能指标数据,预测所述多个候选搜索词的质量得分,结合所述多个候选搜索词的质量得分和长度信息,从所述多个候选搜索词中选择目标搜索词;
在所述第一页面上展示所述目标搜索词,以供本端用户基于所述目标搜索词发起搜索。
2.根据权利要求1所述的方法,其特征在于,基于历史搜索词的效能指标数据,预测所述多个候选搜索词的质量得分,包括:
将所述多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到所述多个候选搜索词的质量得分;
其中,所述价值评估模型是以所述历史搜索词及其质量得分作为训练样本进行模型训练得到的,所述历史搜索词的质量得分是根据所述历史搜索词的效能指标数据计算得到的。
3.根据权利要求2所述的方法,其特征在于,所述历史搜索词的效能指标数据包括点击通过率、点击转化率、点击量和询盘量;所述方法还包括:
根据所述历史搜索词的点击通过率和点击转化率,计算所述历史搜索词对应的商品转化得分;
根据所述历史搜索词的点击量和询盘量,计算所述历史搜索词对应的用户粘性得分;
根据所述历史搜索词对应的商品转化得分和用户粘性得分,得到所述历史搜索词的质量得分。
4.根据权利要求1所述的方法,其特征在于,结合所述多个候选搜索词的质量得分和长度信息,从所述多个候选搜索词中选择目标搜索词,包括:
根据所述多个候选搜索词的长度信息,生成所述多个候选搜索词的长度惩罚分,所述候选搜索词的长度越短,其对应的长度惩罚分越大;
根据所述多个候选搜索词的长度惩罚分和质量得分,得到所述多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。
5.根据权利要求4所述的方法,其特征在于,根据所述多个候选搜索词的长度信息,生成所述多个候选搜索词的长度惩罚分,包括:
针对每个候选搜索词,计算所述候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算所述候选搜索词的出现概率;
利用所述候选搜索词的长度信息的负倒数,对所述候选搜索词的出现概率进行修正,得到所述候选搜索词的长度惩罚分;
其中,所述实体词的条件概率是指所述实体词在以所述目标商品的描述信息和所述目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在所述候选搜索词中的概率。
6.根据权利要求1所述的方法,其特征在于,在将所述目标商品的描述信息和所述目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词之前,还包括:
从搜索日志中获取与所述目标商品相关的网络行为数据作为目标网络行为数据,并根据所述目标网络行为数据确定所述目标商品是否满足特定商品条件;
针对满足特定商品条件的目标商品,执行将所述目标商品的描述信息和所述目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词的操作及后续操作。
7.根据权利要求6所述的方法,其特征在于,还包括:
针对不满足特定商品条件的目标商品,采用传统搜索词推荐方案推荐与所述目标商品相关的目标搜索词;其中,所述传统搜索词推荐方案包括基于行为驱动的搜索词推荐方案、基于商品描述信息相似度拓展的搜索词推荐方案或基于商品描述信息抽取实体作为搜索词的推荐方案。
8.根据权利要求1-7任一项所述的方法,其特征在于,还包括:
根据所述第一页面的类型,确定所述第一页面关联的目标商品。
9.根据权利要求8所述的方法,其特征在于,根据所述第一页面的类型,确定所述第一页面关联的目标商品,包括:
若所述第一页面是电商应用的首页面,则根据本端用户在电商应用中产生的网络行为数据,从本端用户发生过历史行为的商品中选择一个商品作为所述第一页面关联的目标商品;
若所述第一页面是商品详情页面,则将所述商品详情页面上展示的商品作为所述第一页面关联的目标商品;
若所述第一页面是第一搜索词对应的搜索结果页面,则根据本端用户在电商应用中产生的网络行为数据,从所述搜索结果页面上展示的商品中选择一个商品作为所述第一页面关联的目标商品;
若所述第一页面是购物车页面,则将所述购物车页面上展示的每个商品均作为所述第一页面关联的目标商品。
10.根据权利要求9所述的方法,其特征在于,在所述第一页面是购物车页面且所述购物车页面上展示有多个商品的情况下,所述目标商品为多个,则在所述第一页面上展示所述目标搜索词,以供本端用户基于所述目标搜索词发起搜索,包括:
根据本端用户在电商应用中产生的网络行为数据,生成本端用户对多个目标商品的兴趣度;针对兴趣度最大的目标商品,在所述购物车页面上展示其对应的目标搜索词,以供本端用户基于所述目标搜索词发起搜索。
11.一种搜索词推荐方法,其特征在于,包括:
展示第一页面,所述第一页面关联至少一个商品,所述至少一个商品属于至少一个类目;
在所述至少一个商品中包含特定商品的情况下,将所述特定商品作为目标商品,获取与所述目标商品所属目标类目适配的多个实体类型及其顺序形成目标控制参数;
将所述目标商品的描述信息和所述目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照所述顺序出现的与所述多个实体类型对应的多个实体词;
基于历史搜索词的效能指标数据,预测所述多个候选搜索词的质量得分,结合所述多个候选搜索词的质量得分和长度信息,从所述多个候选搜索词中选择目标搜索词;
在所述第一页面上展示所述目标搜索词,以供本端用户基于所述目标搜索词发起搜索。
12.一种计算机设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器耦合至所述存储器,用于执行所述计算机程序以用于执行权利要求1-11任一项所述方法中的步骤。
13.一种存储有计算机程序的计算机存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器能够实现权利要求1-11任一项所述方法中的步骤。
CN202111306577.1A 2021-11-05 2021-11-05 搜索词推荐方法、设备及存储介质 Pending CN114168843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111306577.1A CN114168843A (zh) 2021-11-05 2021-11-05 搜索词推荐方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111306577.1A CN114168843A (zh) 2021-11-05 2021-11-05 搜索词推荐方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114168843A true CN114168843A (zh) 2022-03-11

Family

ID=80478125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111306577.1A Pending CN114168843A (zh) 2021-11-05 2021-11-05 搜索词推荐方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114168843A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114676308A (zh) * 2022-03-16 2022-06-28 北京达佳互联信息技术有限公司 搜索词推荐方法、装置、电子设备、存储介质及产品
CN116089729A (zh) * 2023-03-31 2023-05-09 浙江口碑网络技术有限公司 搜索推荐方法、设备及存储介质
CN116521906A (zh) * 2023-04-28 2023-08-01 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质
WO2023185449A1 (zh) * 2022-03-29 2023-10-05 北京字节跳动网络技术有限公司 一种信息推荐方法、装置、计算机设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114676308A (zh) * 2022-03-16 2022-06-28 北京达佳互联信息技术有限公司 搜索词推荐方法、装置、电子设备、存储介质及产品
WO2023185449A1 (zh) * 2022-03-29 2023-10-05 北京字节跳动网络技术有限公司 一种信息推荐方法、装置、计算机设备和存储介质
CN116089729A (zh) * 2023-03-31 2023-05-09 浙江口碑网络技术有限公司 搜索推荐方法、设备及存储介质
CN116521906A (zh) * 2023-04-28 2023-08-01 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质
CN116521906B (zh) * 2023-04-28 2023-10-24 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质

Similar Documents

Publication Publication Date Title
US11640408B2 (en) Search guidance
US20200117675A1 (en) Obtaining of Recommendation Information
CN111080413A (zh) 电商平台商品的推荐方法、装置、服务器和存储介质
CN114168843A (zh) 搜索词推荐方法、设备及存储介质
JP6279756B2 (ja) 通信セッションの状態の保存
US20190018900A1 (en) Method and Apparatus for Displaying Search Results
WO2017071251A1 (zh) 信息推送方法和装置
CN106557480B (zh) 查询改写的实现方法及装置
CN107644036B (zh) 一种数据对象推送的方法、装置及系统
CN108230009B (zh) 一种用户偏好的预测方法及装置,电子设备
KR20200003106A (ko) 정보 검색 방법, 장치 및 시스템
CN108537596B (zh) 搜索框内车型推荐的方法、装置、系统及存储器
US20180165746A1 (en) Network Interaction System
US20140146082A1 (en) Augmented reality information system
CN110322305B (zh) 数据对象信息提供方法、装置及电子设备
WO2017114198A1 (zh) 一种数据处理方法和装置
US20130254025A1 (en) Item ranking modeling for internet marketing display advertising
CN111695960A (zh) 一种对象推荐系统、方法、电子设备及存储介质
CN111967892A (zh) 一种信息推荐方法及装置
US20180260738A1 (en) Adaptive search refinement
CN110766456A (zh) 商品推荐方法及装置
CA3111094C (en) Noise contrastive estimation for collaborative filtering
WO2022156589A1 (zh) 一种直播点击率的确定方法和装置
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN116089745A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240307

Address after: Room 303, 3rd Floor, Building 5, No. 699 Wangshang Road, Changhe Street, Binjiang District, Hangzhou City, Zhejiang Province, 310052

Applicant after: Hangzhou Alibaba Overseas Internet Industry Co.,Ltd.

Country or region after: China

Address before: 310052 room 508, 5th floor, building 4, No. 699 Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant before: Alibaba (China) Co.,Ltd.

Country or region before: China