CN113761352A - 信息推送方法、装置、设备和存储介质 - Google Patents

信息推送方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113761352A
CN113761352A CN202110322526.1A CN202110322526A CN113761352A CN 113761352 A CN113761352 A CN 113761352A CN 202110322526 A CN202110322526 A CN 202110322526A CN 113761352 A CN113761352 A CN 113761352A
Authority
CN
China
Prior art keywords
scene
recommended
task
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110322526.1A
Other languages
English (en)
Inventor
张璨璨
郑妍
王冬月
丁卓冶
包勇军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110322526.1A priority Critical patent/CN113761352A/zh
Publication of CN113761352A publication Critical patent/CN113761352A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种信息推送方法、装置、设备和存储介质,其中,该方法包括:获取客户端当前所展示的推荐场景对应的场景模型,根据推荐场景对应的场景模型,预估用户在推荐场景中偏好的产品,在推荐场景中推荐用户偏好的产品的信息。该技术方案中,通过使用多个推荐场景的联合数据和场景任务训练得到的场景模型,预估用户在每个推荐场景中偏好的产品,能够实现不同推荐场景的数据共享,充分考虑不同推荐场景下每个场景任务之间的关联性,更加符合用户反馈数据的实际情况,能够更加准确的预估出用户的产品偏好,提升信息的推荐效果。

Description

信息推送方法、装置、设备和存储介质
技术领域
本申请涉及机器学习技术领域,尤其涉及一种信息推送方法、装置、设备和存储介质。
背景技术
随着大数据和机器学习技术的发展,其在个性化推荐技术领域得到应用,个性化推荐是指通过挖掘用户的历史行为特征,分析用户的偏好,从而可以通过客户端的推荐页面,向用户推荐其偏好的信息和产品等。
现有技术中,点击通过率(CTR,Click-Through-Rate)预估模型被广泛的应用于个性化推荐系统,CTR预估模型用来学习和预测用户的反馈,通过收集海量的训练预料,进行学习训练,预测出用户偏好的信息和产品。
但是,在多推荐场景中,不同的场景任务之间存在有相互关联性,由于CTR预估模型使用的是单任务学习方式,其未考虑场景任务之间的互相联系,忽略了用户在不同推荐场景下的行为数据,导致在多推荐场景下,使用CTR预估模型无法准确的推送用户偏好的信息和产品。
发明内容
本申请提供一种信息推送方法、装置、设备和存储介质,用于解决现有的预估模型无法在多推荐场景下,准确的推送用户偏好的信息和产品的问题。
第一方面,本申请实施例提供一种信息推送方法,包括:
获取客户端当前所展示的推荐场景对应的场景模型,所述推荐场景用于表征客户端的产品推荐页,所述场景模型通过多个推荐场景的联合数据和场景任务训练得到,所述场景任务包括点击任务和下单任务;
根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品;
在所述推荐场景中推荐用户偏好的产品的信息。
第二方面,本申请实施例提供一种信息推送装置,包括:
获取模块,用于获取客户端当前所展示的推荐场景对应的场景模型,所述推荐场景用于表征客户端的产品推荐页,所述场景模型通过多个推荐场景的联合数据和场景任务训练得到,所述场景任务包括点击任务和下单任务;
预估模块,用于根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品;
推送模块,用于在所述推荐场景中推荐用户偏好的产品的信息。
第三方面,本申请实施例提供一种处理设备,包括存储器和至少一个处理器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如上述的方法。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上述的方法。
本申请实施例提供的信息推送方法、装置、设备和存储介质,通过使用多个推荐场景的联合数据和场景任务训练得到的场景模型,预估用户在每个推荐场景中偏好的产品,能够实现不同推荐场景的数据共享,充分考虑不同推荐场景下每个场景任务之间的关联性,更加符合用户反馈数据的实际情况,能够更加准确的预估出用户的产品偏好,提升信息的推荐效果。
附图说明
图1为本申请实施例提供的信息推送方法的应用场景示意图;
图2为本申请实施例提供的信息推送方法的流程示意图;
图3为本申请实施例提供的预设模型的结构示意图;
图4为本申请实施例提供的信息推送装置的结构示意图;
图5为本申请实施例提供的处理设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下,对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解:
推荐场景:用户通过在移动终端中安装客户端,在客户端中可以调出不同的产品推荐页面,每一个产品推荐页面上都可以推荐产品和信息供用户查看,推荐场景即用于表征产品推荐页面。
场景任务:场景任务是预测用户在推荐场景中的交互行为,例如场景任务包括有点击任务和下单任务,点击任务表示预测用户是否会点击推荐场景中推荐的产品,下单任务表示预测用户是否会下单购买推荐场景中推荐的产品。
图1为本申请实施例提供的信息推送方法的应用场景示意图,如图1所示,在个性化推荐中,用户可以在移动终端11(例如手机、计算机和平板电脑)上安装应用程序(APP,Application),以APP作为客户端为例,APP包括有APP首页、订单页、商品详情页等产品推荐页面,这些产品推荐页面一般会展示有产品和信息,供用户浏览、点击、加购、下单等等,其中,用户的浏览、点击、加购和下单等行为都可以被平台的服务器监测到,作为用户的历史行为特征。
示例性的,用户的历史行为特征可以是用户过去七天所产生的历史行为特征或者过去一个月所产生的历史行为特征。
服务器12根据用户的历史行为特征,进行学习和训练,对场景任务进行优化,预估出用户感兴趣的产品和信息,反馈给客户端以将这些感兴趣的产品和信息推荐到不同的产品推荐页面。
目前,在个性化推荐中,主要有如下两种方式:
1、采用点击通过率(CTR,Click-Through-Rate)预估模型进行学习和预测,CTR预估模型采用的是单任务学习方式,通过用户的点击行为,学习预测出用户是否会点击某一产品,这种方式没有考虑场景任务之间的相互联系,并且CTR预估模型在进行学习训练时需要大量的训练预料,预测效果需要海量的训练预料做支撑,不能够适用于一些训练预料不足的推荐场景中。
2、采用多任务学习方式,个性化推荐系统在关注CTR指标的同时,还需要优化转化率(CVR,Conversion Rate)、浏览深度、度养性等多个角度的指标,多任务学习能够多多个场景任务同时训练,通过共享结果将多个互相影响的场景任务联系在一起,使得多个目标都达到整体最优,泛化能力比单任务要好,但是多任务学习方式中,由于用户的浏览、加购和下单等行为是有可能分布在不同的推荐场景下完成的,这种多任务学习的方式没有考虑不同场景间的联系,即使是相同的场景任务(例如点击任务、浏览任务),在不同推荐场景上用户反馈效果也存在差异,没有权衡不同推荐场景见的相似性和相关性,导致推荐效果也不够理想。
综上,现有技术中还没有针对多推荐场景下,准确的预估用户的产品偏好,进行信息推送的方法。
针对上述问题,本申请提供一种信息推送方法、装置、设备和存储介质,通过利用多个推荐场景的联合数据和场景任务,进行训练得到的不同推荐场景对应的场景模型,既增加了训练数据,而且不同推荐场景下的数据可以互相影响,有效的权衡不同推荐场景见的相似性和相关性,同时还可以实现一次训练,迭代生成多个推荐场景对应的场景模型,模型的训练效率更高,当用户在浏览某一个推荐场景时,使用该推荐场景对应的场景模型,对用户在该推荐场景下的产品偏好进行预测,并推荐产品的信息至该推荐场景下,最终能够达到更好的推荐效果,提高产品的转化率。
下面,通过具体实施例对本申请的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请实施例提供的信息推送方法的流程示意图,该方法可以应用于网络平台中的服务器或者本地的处理设备中,如图2所示,该方法包括如下步骤:
S201、获取客户端当前所展示的推荐场景对应的场景模型。
其中,推荐场景用于表征客户端的产品推荐页,场景模型通过多个推荐场景的联合数据和场景任务训练得到,联合数据包括场景标识、任务标识和用户的历史行为特征,场景任务包括点击任务和下单任务。
示例性的,用户可以在移动终端上安装客户端,例如APP,APP中可以包括有APP首页、猜你喜欢页、产品详情页、购物车、下单页等产品推荐页面,当用户打开APP进入到APP首页时,此时客户端当前所展示的推荐场景即为APP首页,在APP首页中可以推荐一些产品和信息,例如“手机-优惠信息”,用户还可以点击首页中的“购物车”标识,进入到购物车,此时客户端当前所展示的推荐场景即为购物车页面。
示例性的,在不同的推荐场景下用户的历史行为特征可以不同,例如用户在购物页的历史行为主要包括有下单行为,在商品详情页的历史行为主要有加购行为,而在APP首页的历史行为主要有浏览和点击行为。
在本实施例中,在对场景模型进行训练时,输入的训练预料融合了各个推荐场景各自的历史行为特征、场景标识、任务标识,其中,场景标识用于对不同的推荐场景进行标识,任务标识用于对不同的推荐场景中各个场景任务进行标识。示例性的,不同的推荐场景的场景任务可以相同,例如不同的推荐场景都具有相同的点击任务和浏览任务。
可选的,场景模型可以根据多个推荐场景的联合数据,学习不同推荐场景的重要性以及每个推荐场景不同场景任务的重要性,即确定每个推荐场景的权重以及每个场景任务的权重,训练得到不同推荐场景对应的场景模型。
S202、根据推荐场景对应的场景模型,预估用户在推荐场景中偏好的产品。
具体的,每个推荐场景都对应有一个训练好的场景模型,每一个推荐场景的场景任务包括有点击任务和下单任务,其中,点击任务用于预测用户是否会点击推荐至该推荐场景的产品,下单任务用户预测用户是否会下单购买推荐至该推荐场景下的产品。
在本实施例中,通过训练好的场景模型,结合每一个场景任务的权重,以确定用户在该推荐场景中偏好的产品。
示例性的,可以通过场景模型输出用户对某一产品的偏好程度的打分,根据不同产品的偏好程度的打分,对每个产品进行排序,根据排序前后关系,确定用户在该推荐场景下偏好的产品。
S203、在推荐场景中推荐用户偏好的产品的信息。
示例性的,推荐场景中可以推荐多个用户偏好的产品的信息,根据用户对每个产品的偏好程度,选择出N(N为正整数)个偏好程度较高的产品,并在该推荐场景中推荐N个产品的信息。
本申请实施例通过事先使用多个推荐场景的联合数据和场景任务进行学习训练,得到每个推荐场景对应的场景模型,结合多个推荐场景的联合数据训练得到的场景模型能够更加准确预测出用户偏好的产品,以提高产品的推荐效果。
在一些实施例中,在上述步骤S201之前,上述方法还包括如下步骤:
获取客户端提交的多个推荐场景的场景任务和联合数据;
根据预设损失函数、场景任务和联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型。
具体的,联合数据包括有推荐场景的场景标识、任务标识和用户的历史行为特征,场景标识可以用于区分不同的推荐场景,任务标识可以用于区分不同的场景任务,用户在不同的推荐场景中可以进行浏览、点击、加购和下单等,这些可以作为用户的历史行为特征,客户端可以定时将用户的历史行为特征上传至服务器。
示例性的,预设损失函数可以为:
Figure BDA0002993356010000061
上式中,
Figure BDA0002993356010000062
表示样本i是否属于场景任务t对应的推荐场景St,ωt表示场景任务t的权重,
Figure BDA0002993356010000063
为加权交叉熵。
在本实施例中,加权交叉熵是一种常见的损失函数,其中,
Figure BDA0002993356010000064
为样本i的模型预测值,
Figure BDA0002993356010000065
为样本i的真实数据值,
Figure BDA0002993356010000066
表示计算加权交叉熵时正样本的系数。
本申请实施例通过将多个推荐场景的场景任务和联合数据作为输入,通过预设的损失函数对预设模型进行训练,能够通过一次训练得到迭代生成多个推荐场景对应的场景模型,提高模型的训练效率,并且训练的过程能够对不同的推荐场景和场景任务进行权重,学习不同推荐场景的相似性和相关性,提高不同推荐场景的推荐效果。
图3为本申请实施例提供的预设模型的结构示意图,如图3所示,该预设模型包括有输入层31、共享层32和塔层33,上述“根据预设损失函数、场景任务和联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型”,具体可以通过如下步骤实现:
根据场景标识和任务标识,对推荐场景和场景任务进行识别;
根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重;
根据自适应权重,对每个推荐场景的场景任务进行加权求和,分别输入至每个场景任务对应的塔层;
根据塔层,对每个推荐场景的场景任务进行解耦,得到每个推荐场景对应的场景模型。
示例性的,输入层31用于输入推荐场景的联合数据,共享层32包括有专家网络expert和门控网络gate,塔层33包括有多个塔网络TOWER,示例性的,如图3所示,推荐位A、B、C、D即指的是四个推荐场景,每一个推荐场景包括有点击任务(click)和下单任务(order),专家网络包括有expert1至expert8,每一个场景任务对应有一个单独的门控网络gate,且每一个场景任务对应有一个单独的塔网络TOWER学习,示例性的,图3中gate推荐位A click表示推荐位A的点击任务对应的门控网络,TOWER推荐位A click表示推荐位A的点击任务对应的塔网络TOWER。
在本实施例中,在对共享层进行训练时,通过门控网络gate,不同的场景任务的输入会得到不同的自适应权重,以实现对专家网络expert的选择性利用,使得不同场景任务可以学习到不同的组合expert的模型,效果类似于加权求和,然后由塔层中的每一个塔网络TOWER单独学习,解耦每一个推荐位下需要优化的场景任务,输出场景模型。
本申请实施例通过对共享层进行训练,能够学习共享层的集成方式,融合每个推荐场景的场景任务的互相关系,提升泛化能力,并且通过一次训练,可以得到多个推荐场景对应的场景模型,模型训练的效率更高。
进一步的,在一些实施例中,在对共享层进行训练时,可以将联合数据输入至专家网络expert和门控网络gate,并根据预设损失函数,对专家网络expert和门控网络gate进行训练,得到不同场景任务的自适应权重。
具体的,专家网络Experts根据联合数据学习出向量序列(embedding序列),而门控网络gate学习自适应的权重并对专家网络Experts的输出进行加权求和,得到对应的结果之后再分别输入到各个场景任务对应的塔网络TOWER中,由塔网络TOWER进行解耦合并输出场景模型。
本申请实施例通过专家网络学习不同推荐场景的相似性和相关性模型,并通过门控网络学习共享层的集成方式,能够学习不同规模和不同类型的场景任务,适应各种不同的推荐场景的场景任务。
可选的,在一些实施例中,在根据损失函数和联合数据,对共享层进行训练之前,上述的信息推送方法还可以包括如下步骤:
获取场景任务t的正样本数量和场景任务t的负样本数量;
根据预设权重策略、正样本数量和负样本数量,对预设损失函数进行权重分配。
在本实施例中,对于不同的推荐场景的场景任务,损失函数尺度会有很大的差异,示例性的,在不同的推荐场景中的联合数据即训练语料的量级可能会存在较大差距,对不同量级的场景任务,在学习过程中,需要通过对损失函数进行权重分配,以使得不同量级的场景任务在学习过程中被合理的考虑。
示例性的,预设权重策略为:
Figure BDA0002993356010000081
Figure BDA0002993356010000082
上式中,
Figure BDA0002993356010000083
表示场景任务t的正样本数量,
Figure BDA0002993356010000084
表示场景任务t的负样本数量,
Figure BDA0002993356010000085
为计算加权交叉熵时正样本的系数。
本申请实施例通过预设权重策略对损失函数进行权重分配,在后续进行学习训练时,可以充分的考虑不同量级的场景任务之间的差异,避免损失函数在有些场景任务上的表现好,而在有些场景任务上的表现差。
示例性的,在一些实施例中,上述步骤S202具体可以通过如下步骤实现:
根据场景模型,获取推荐场景的场景任务的输出,场景任务的输出用于指示场景任务的重要性得分;
根据预设融合策略,对推荐场景的场景任务进行融合,得到推荐场景的输出,推荐场景的输出用于指示用户对推荐场景中的不同产品的偏好程度;
根据推荐场景的输出,得到用户在推荐场景中偏好的产品。
在本实施例中,每一个推荐场景可以对应有多个场景任务,不同的场景任务的重要性得分可以不同,示例性的,某一个推荐场景的点击任务的重要性得分可以为0.8,而该推荐场景的下单任务的重要性得分可以为0.2。
示例性的,预设融合策略为:
Figure BDA0002993356010000091
上式中,
Figure BDA0002993356010000092
表示推荐场景s的输出,Ts表示推荐场景s的所有场景任务,
Figure BDA0002993356010000093
表示场景任务t输出的权重,
Figure BDA0002993356010000094
表示场景任务t的输出。
示例性的,
Figure BDA0002993356010000095
可以由操作人员根据实际情况进行调节,推荐场景的输出表示的是预测得到的用户对所有商品的偏好程度的排序,从该排序中可以选取排序最前的N个产品最为用户在该推荐场景中的偏好产品,其中,N为正整数,示例性的,N可以取值为10。
本申请实施例通过将推荐场景的场景任务进行融合,使得推荐场景的输出融合了多个推荐任务的表现,从而最后能够达到整体推荐效果的最优。
可选的,在一些实施例中,若产品推荐页包括有括非空购物车、空购物车、订单详情页和订单跟踪页中的至少一个,则上述步骤S203具体可以通过如下步骤实现:
在非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐用户偏好的产品的信息。
在本实施例中,用户可以在客户端上进行操作,将某一个产品推荐页中推荐的产品加购至购物车,也可以在购物车这一产品推荐页中,将加购至购物车中的产品删除,还可以下单购买加购至购物车中的产品,并在订单详情页查看订单信息,以及在订单跟踪页查看订单的物流动态等。
示例性的,当用户在订单详情页查看订单信息时,可以在订单详情页预设产品推荐区域,并在该产品推荐区域推荐用户偏好的产品。
本申请实施例通过设置多个推荐场景,即产品推荐页,可以融合多个推荐场景的联合数据,能够得到更多的训练语料,使得由于训练语料较小的小流量推荐场景能够借鉴其他推荐场景的训练语料,从而提高每一个推荐场景的推荐效果。
在上述实施例的基础上,上述步骤“在非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐用户偏好的产品的信息”,具体可以包括如下步骤:
获取产品的价格信息、图片信息和参数信息;
在非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐产品的价格信息、图片信息和参数信息。
示例性的,产品的价格信息包括有产品当前价格和历史价格,图片信息包括有产品的展示图片,参数信息包括有产品的型号、规格、数量、颜色等。
可选的,可以在推荐区域(即产品推荐页)中划分出两个虚拟区域,其中的一个虚拟区域用于展示产品的图片信息,另一个虚拟区域用于展示产品的参数信息和价格信息。
本申请实施例通过推荐产品的价格信息、图片信息以及参数信息至相应的推荐场景,方便用户直观快速的了解产品的相关信息,提高推荐效果。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图4为本申请实施例提供的信息推送装置的结构示意图,可选的,该信息推送装置40可以应用于服务器,也可以独立服务器且与服务器协同工作实现本申请的技术方案,如图4所示,该信息推送装置包括:获取模块41、预估模块42和推送模块43。
其中,获取模块41用于获取客户端当前所展示的推荐场景对应的场景模型;预估模块42用于根据推荐场景对应的场景模型,预估用户在推荐场景中偏好的产品;推送模块43用于在推荐场景中推荐用户偏好的产品的信息。
其中,推荐场景用于表征客户端的产品推荐页,场景模型通过多个推荐场景的联合数据和场景任务训练得到,场景任务包括点击任务和下单任务。
在一些实施例中,上述的信息推送装置40还包括训练模块,用于:
获取客户端提交的多个推荐场景的场景任务和联合数据;
根据预设损失函数、场景任务和联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型。
在上述实施例的基础上,在一些实施例中,若预设模型包括共享层和与每个场景任务对应的塔层,则上述训练模块具体用于:
根据场景标识和任务标识,对推荐场景和场景任务进行识别;
根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重;
根据自适应权重,对每个推荐场景的场景任务进行加权求和,分别输入至每个场景任务对应的塔层;
根据塔层,对每个推荐场景的场景任务进行解耦,得到每个推荐场景对应的场景模型。
可选的,在一些实施例中,若共享层包括专家网络和门控网络,则上述训练模块具体用于:
将联合数据输入至专家网络和门控网络;
根据预设损失函数,对专家网络和门控网络进行训练,得到不同场景任务的自适应权重。
在一些实施例中,上述的预设损失函数可以为:
Figure BDA0002993356010000111
上式中,
Figure BDA0002993356010000112
表示样本i是否属于场景任务t对应的推荐场景St,ωt表示场景任务t的权重,
Figure BDA0002993356010000113
为加权交叉熵。
在一些实施例中,上述的信息推荐装置40还包括分配模块,用于:
获取场景任务t的正样本数量和场景任务t的负样本数量;
根据预设权重策略、正样本数量和负样本数量,对预设损失函数进行权重分配。
在一些实施例中,上述的预设权重策略可以为:
Figure BDA0002993356010000114
Figure BDA0002993356010000115
上式中,
Figure BDA0002993356010000116
表示场景任务t的正样本数量,
Figure BDA0002993356010000117
表示场景任务t的负样本数量,
Figure BDA0002993356010000118
为计算加权交叉熵时正样本的系数。
示例性的,
Figure BDA0002993356010000119
可以由操作人员输入,并在后续根据实际情况进行调整。
在一些实施例中,预估模块42具体用于:
根据场景模型,获取推荐场景的场景任务的输出;
根据预设融合策略,对推荐场景的场景任务进行融合,得到推荐场景的输出;
根据推荐场景的输出,得到用户在推荐场景中偏好的产品。
其中,场景任务的输出用于指示场景任务的重要性得分,推荐场景的输出用于指示用户对推荐场景中的不同产品的偏好程度。
示例性的,在一些实施例中,上述预设融合策略可以为:
Figure BDA0002993356010000121
上式中,
Figure BDA0002993356010000122
表示推荐场景s的输出,Ts表示推荐场景s的所有场景任务,
Figure BDA0002993356010000123
表示场景任务t输出的权重,
Figure BDA0002993356010000124
表示场景任务t的输出。
在一些实施例中,若产品推荐页包括非空购物车、空购物车、订单详情页和订单跟踪页中的至少一个,则上述推送模块43具体用于:
在非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐用户偏好的产品的信息。
在一些实施例中,上述推送模块43具体用于:
获取产品的价格信息、图片信息和参数信息;
在非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐产品的价格信息、图片信息和参数信息。
本申请实施例提供的装置,可用于执行上述实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,预估模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上预估模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
图5为本申请实施例提供的处理设备的结构示意图,如图5所示,该处理设备包括有存储器51和至少一个处理器52;
存储器51存储计算机执行指令,该处理设备50还包括有总线53,其中,存储器51通过总线53与处理器52连接。
在具体的实现过程中,至少一个处理器52执行存储器51存储的计算机执行指令,使得至少一个处理器52执行如上述的方法。
示例性的,存储器51还可以用于存储预设的短策略的风控规则以及长策略的风控规则等,存储器51可以是云存储或者本地存储。
示例性的,处理设备可以是计算机设备或者服务器。
示例性的,总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
处理器的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
可选的,本申请还提供一种可读存储介质,可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上述的方法的步骤。
可选的,本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序被处理器执行时实现上述方法的步骤。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本申请实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。在本申请的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (15)

1.一种信息推送方法,其特征在于,所述方法包括:
获取客户端当前所展示的推荐场景对应的场景模型,所述推荐场景用于表征客户端的产品推荐页,所述场景模型通过多个推荐场景的联合数据和场景任务训练得到,所述联合数据包括场景标识、任务标识和用户的历史行为特征,所述场景任务包括点击任务和下单任务;
根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品;
在所述推荐场景中推荐用户偏好的产品的信息。
2.根据权利要求1所述的方法,其特征在于,所述获取客户端当前所展示的推荐场景对应的场景模型之前,所述方法还包括:
获取客户端提交的多个推荐场景的场景任务和联合数据;
根据预设损失函数、所述场景任务和所述联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型。
3.根据权利要求2所述的方法,其特征在于,所述预设模型包括共享层和与每个场景任务对应的塔层,所述根据预设损失函数、所述场景任务和所述联合数据,对预设模型进行训练,得到每个推荐场景对应的场景模型,包括:
根据所述场景标识和任务标识,对推荐场景和场景任务进行识别;
根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重;
根据所述自适应权重,对每个推荐场景的场景任务进行加权求和,分别输入至每个场景任务对应的塔层;
根据所述塔层,对每个推荐场景的场景任务进行解耦,得到每个推荐场景对应的场景模型。
4.根据权利要求3所述的方法,其特征在于,所述预设损失函数为:
Figure FDA0002993355000000011
上式中,
Figure FDA0002993355000000012
表示样本i是否属于场景任务t对应的推荐场景St,ωt表示场景任务t的权重,
Figure FDA0002993355000000013
为加权交叉熵。
5.根据权利要求4所述的方法,其特征在于,所述根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重之前,所述方法还包括:
获取场景任务t的正样本数量和场景任务t的负样本数量;
根据预设权重策略、所述正样本数量和负样本数量,对所述预设损失函数进行权重分配。
6.根据权利要求5所述的方法,其特征在于,所述预设权重策略为:
Figure FDA0002993355000000021
Figure FDA0002993355000000022
上式中,
Figure FDA0002993355000000023
表示场景任务t的正样本数量,
Figure FDA0002993355000000024
表示场景任务t的负样本数量,
Figure FDA0002993355000000025
为计算加权交叉熵时正样本的系数。
7.根据权利要求3所述的方法,其特征在于,所述共享层包括专家网络和门控网络,所述根据预设损失函数和联合数据,对共享层进行训练,获取每个推荐场景的场景任务的自适应权重,包括:
将所述联合数据输入至所述专家网络和门控网络;
根据所述预设损失函数,对所述专家网络和门控网络进行训练,得到不同场景任务的自适应权重。
8.根据权利要求1所述的方法,其特征在于,所述根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品,包括:
根据所述场景模型,获取所述推荐场景的场景任务的输出,所述场景任务的输出用于指示所述场景任务的重要性得分;
根据预设融合策略,对所述推荐场景的场景任务进行融合,得到所述推荐场景的输出,所述推荐场景的输出用于指示用户对所述推荐场景中的不同产品的偏好程度;
根据所述推荐场景的输出,得到用户在所述推荐场景中偏好的产品。
9.根据权利要求8所述的方法,其特征在于,所述预设融合策略为:
Figure FDA0002993355000000026
上式中,
Figure FDA0002993355000000027
表示推荐场景s的输出,Ts表示推荐场景s的所有场景任务,
Figure FDA0002993355000000031
表示场景任务t输出的权重,
Figure FDA0002993355000000032
表示场景任务t的输出。
10.根据权利要求1至9任一项所述的方法,其特征在于,所述产品推荐页包括非空购物车、空购物车、订单详情页和订单跟踪页中的至少一个,所述在所述推荐场景中推荐用户偏好的产品的信息,包括:
在所述非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐用户偏好的产品的信息。
11.根据权利要求10所述的方法,其特征在于,所述在所述非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐用户偏好的产品的信息,包括:
获取所述产品的价格信息、图片信息和参数信息;
在所述非空购物车、空购物车、订单详情页和订单跟踪页的至少一个中推荐所述产品的价格信息、图片信息和参数信息。
12.一种信息推送装置,其特征在于,包括:
获取模块,用于获取客户端当前所展示的推荐场景对应的场景模型,所述推荐场景用于表征客户端的产品推荐页,所述场景模型通过多个推荐场景的联合数据和场景任务训练得到,所述场景任务包括点击任务和下单任务;
预估模块,用于根据所述推荐场景对应的场景模型,预估用户在所述推荐场景中偏好的产品;
推送模块,用于在所述推荐场景中推荐用户偏好的产品的信息。
13.一种处理设备,其特征在于,包括存储器和至少一个处理器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-11任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如权利要求1-11任一项所述的方法。
15.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现如权利要求1-11任一项所述的方法。
CN202110322526.1A 2021-03-25 2021-03-25 信息推送方法、装置、设备和存储介质 Pending CN113761352A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110322526.1A CN113761352A (zh) 2021-03-25 2021-03-25 信息推送方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110322526.1A CN113761352A (zh) 2021-03-25 2021-03-25 信息推送方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN113761352A true CN113761352A (zh) 2021-12-07

Family

ID=78786771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110322526.1A Pending CN113761352A (zh) 2021-03-25 2021-03-25 信息推送方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113761352A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970882A (zh) * 2022-05-19 2022-08-30 支付宝(杭州)信息技术有限公司 适于多场景多任务的模型预测方法及模型系统
WO2023185925A1 (zh) * 2022-03-30 2023-10-05 华为技术有限公司 一种数据处理方法及相关装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023185925A1 (zh) * 2022-03-30 2023-10-05 华为技术有限公司 一种数据处理方法及相关装置
CN114970882A (zh) * 2022-05-19 2022-08-30 支付宝(杭州)信息技术有限公司 适于多场景多任务的模型预测方法及模型系统

Similar Documents

Publication Publication Date Title
CN110825957B (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US10904360B1 (en) Method and apparatus for real-time personalization
TWI597614B (zh) 用於客製化網站之方法及系統
US11334758B2 (en) Method and apparatus of data processing using multiple types of non-linear combination processing
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN103324619A (zh) 一种基于互联网的推荐方法及推荐系统
CN113761352A (zh) 信息推送方法、装置、设备和存储介质
CN114117216A (zh) 推荐概率预测方法及装置、计算机存储介质和电子设备
CN112381607A (zh) 一种网络商品排序方法、装置、设备及介质
CN113191378A (zh) 图像搜索的预测方法、装置和系统
CN111340522B (zh) 资源推荐方法、装置、服务器及存储介质
CN112883265A (zh) 信息推荐方法、装置、服务器及计算机可读存储介质
CN115186192A (zh) 信息处理方法、装置、存储介质及设备
CN113592593B (zh) 序列推荐模型的训练及应用方法、装置、设备及存储介质
CN112269943B (zh) 一种信息推荐系统及方法
CN108614845B (zh) 基于媒体文件的行为预估方法和装置
CN115640454A (zh) 一种产品推荐方法、系统、电子设备及存储介质
CN112231546A (zh) 异构文档的排序方法、异构文档排序模型训练方法及装置
Smirnov et al. Multicriteria Context-Driven Recommender Systems: Model and Method
CN116070009A (zh) 一种资讯推荐方法、装置、设备以及存储介质
CN116992158B (zh) 资源配置的推荐方法和装置、存储介质及电子装置
CN116911912B (zh) 一种交互对象和交互结果的预测方法及装置
CN117009556A (zh) 一种基于评估模型的内容推荐方法及相关装置
CN114764445A (zh) 一种内容推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination