CN110796513A - 多任务学习方法、装置、电子设备及存储介质 - Google Patents
多任务学习方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110796513A CN110796513A CN201910913422.0A CN201910913422A CN110796513A CN 110796513 A CN110796513 A CN 110796513A CN 201910913422 A CN201910913422 A CN 201910913422A CN 110796513 A CN110796513 A CN 110796513A
- Authority
- CN
- China
- Prior art keywords
- price
- probability
- prediction
- click
- training sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 172
- 230000006870 function Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 239000003550 marker Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0611—Request for offers or quotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种多任务学习方法、装置、电子设备及存储介质,该方法包括:确定训练样本集对应的成单价格范围,将成单价格范围划分为预设数量的价格类别,确定每个训练样本对应的价格类别标记、点击结果标记和成单结果标记;根据所述训练样本集和对应的价格类别标记、点击结果标记和成单结果标记,对价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型进行训练;通过多任务预测模型确定预测样本的点击概率、成单概率和价格类别对应的概率,基于价格类别对应的价格期望和概率确定当前用户的消费期望;根据点击概率、成单概率和消费期望确定推荐目标的预测分。本申请实施例提高了训练的效率,减少了对计算资源的消耗。
Description
技术领域
本申请实施例涉及互联网技术领域,特别是涉及一种多任务学习方法、装置、电子设备及存储介质。
背景技术
深度学习已经成为电商场景常用的推荐方法,而基于深度学习的多任务学习方法鉴于其强大的学习能力更是成为各大公司争相实验的方案。常见的方法有使用共享网络同时学习用户的点击行为和成单行为,两个任务之间共享网络结构,如图1所示。
同时学习用户的点击率和转化率(图1网络结构),能够很好的收敛学习到用户的点击率和成单率,但是无法考量用户的成单价格信息。在考虑用户的成单价格并和点击率、成单率共享网络结构时,由于价格是一个回归问题,而点击和成单是一个分类问题,学习过程中存在损失冲突,导致网络结构无法收敛;为了解决这种问题更多的做法是将价格单独作为一个网络来学习,如图2所示,这样做无法有效得在网络间共享参数。
发明内容
本申请实施例提供一种多任务学习方法、装置、电子设备及存储介质,有助于解决损失冲突的问题,提高训练的效率,并减少对计算资源的消耗。
为了解决上述问题,第一方面,本申请实施例提供了一种多任务学习方法,包括:
根据训练样本集中成单的训练样本的成单价格,确定所述训练样本集对应的成单价格范围;
将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定所述训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记;
从所述训练样本集中选取当前训练样本,将所述当前训练样本输入价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果;
根据所述价格类别、点击概率和成单概率的输出结果,以及所述当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,对所述多任务预测模型中的网络参数进行调整,循环执行上述选取当前训练样本以及根据当前训练样本训练所述多任务预测模型的操作,直至网络参数收敛,得到训练完成的多任务预测模型;
根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望;
获取当前用户针对推荐目标的预测样本,并将所述预测样本输入所述训练完成的多任务预测模型,得到对应的点击概率、成单概率和所述预设数量的价格类别对应的概率;
根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望;
根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分。
第二方面,本申请实施例提供了一种多任务学习装置,包括:
价格范围确定模块,用于根据训练样本集中成单的训练样本的成单价格,确定所述训练样本集对应的成单价格范围;
价格类别划分模块,用于将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定所述训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记;
输出结果获取模块,用于从所述训练样本集中选取当前训练样本,将所述当前训练样本输入价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果;
模型参数调整模块,用于根据所述价格类别、点击概率和成单概率的输出结果,以及所述当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,对所述多任务预测模型中的网络参数进行调整,循环执行上述选取当前训练样本以及根据当前训练样本训练所述多任务预测模型的操作,直至网络参数收敛,得到训练完成的多任务预测模型;
价格期望确定模块,用于根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望;
多任务预测模块,用于获取当前用户针对推荐目标的预测样本,并将所述预测样本输入所述训练完成的多任务预测模型,得到对应的点击概率、成单概率和所述预设数量的价格类别对应的概率;
消费期望确定模块,用于根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望;
预测分确定模块,用于根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分。
第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的多任务学习方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的多任务学习方法的步骤。
本申请实施例公开的多任务学习方法、装置、电子设备及存储介质,通过根据训练样本集中成单的训练样本的成单价格,确定训练样本集对应的成单价格范围,将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记,从而可以对价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型进行训练,由于将价格预测问题转换为了价格分类问题,从而点击预测、成单预测和价格类别预测同时为分类问题,解决了价格预测和点击、成单之间的损失函数冲突的问题,实现了价格预测和点击、成单共享网络参数,而且可以同时训练价格类别、点击预测和成单预测组成的多个任务,提高了训练的效率,不必单独训练每个任务,减少了训练的过程,降低了训练过程中对计算资源的消耗。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是现有技术中点击率和成单率共享网络结构的示意图;
图2是现有技术中点击率和成单率共享网络结构而价格单独一个网络结构的示意图;
图3是本申请实施例一的多任务学习方法的流程图;
图4是本申请实施例中的多任务预测模型的网络结构示意图;
图5是本申请实施例二的多任务学习装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本实施例公开的一种多任务学习方法,如图3所示,该方法包括:步骤301至步骤310。
步骤301,根据训练样本集中成单的训练样本的成单价格,确定所述训练样本集对应的成单价格范围。
其中,训练样本集包括成单的训练样本、点击未成单的训练样本以及未点击未成单的训练样本,成单的训练样本有对应的成单价格。
统计训练样本集中成单的每个训练样本的成单价格,确定最低的成单价格和最高的成单价格,由最低的成单价格和最高的成单价格组成的成单价格范围为训练样本集对应的成单价格范围。
步骤302,将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定所述训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记。
按照等区间的方式或者等频的方式对成单价格范围进行划分,将成单价格范围划分为预设数量的价格区间,每个价格区间对应一个价格类别,确定每个价格类别的标识,用于标识对应的价格类别。根据成单的每个训练样本所在的价格区间,确定成单的每个训练样本对应的价格类别标记,而点击未成单的训练样本以及未点击未成单的训练样本的价格类别标记为空。确定成单的训练样本的点击结果标记为是,成单结果标记为是;确定点击未成单的训练样本的点击结果标记为是,成单结果标记为否;确定未点击未成单的训练样本的点击结果标记为否,成单结果标记为否。
在本申请的一个实施例中,所述将所述成单价格范围划分为预设数量的价格区间,包括:将所述成单价格范围按照训练样本等频划分为预设数量的价格区间。
在成单价格范围内,大部分训练样本的成单价格会集中在一个小区间内,如果通过等区间的方式划分,有的区间内训练样本的数量较少,而有的区间内训练样本的数量较多,导致各个区间内训练样本的分布不均匀,会导致最后的统计信息不准确,为了避免这种问题,采用等频的方式来划分价格区间,使得每个价格区间内的训练样本的数量相同,可以提高统计信息的准确性,提高多任务预测模型的预测准确性。
例如,对于300个训练样本,成单价格范围为0-100,而大部分训练样本的成单价格集中在30-40之间,预设数量为3,如果按照等区间进行划分,则三个价格区间分别为(0,33.3)、(33.3,66.7)、(66.7,100),则区间(66.7,100)对应的训练样本数量较少,区间(33.3,66.7)对应的训练样本数量较多,导致统计信息不准确;而如果按照等频进行划分,则三个价格区间分别为(0,32)、(32,38)、(38,100),这样得到的每个区间的训练样本数量相同,使得训练完成的多任务预测模型的预测结果更加准确。
步骤303,从所述训练样本集中选取当前训练样本,将所述当前训练样本输入价格预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果。
其中,多任务预测模型可以同时预测价格类别、点击概率和成单概率,而且价格类别预测、点击预测和成单预测共享网络结构。价格预测是多分类预测,即预测各个价格类别的概率;点击预测是二分类预测,即预测点击概率和未点击概率;成单预测也是二分类预测,即预测成单概率和未成单概率。
图4是本申请实施例中的多任务预测模型的网络结构示意图,如图4所示,多任务预测模型包括输入层、共享网络结构层和输出层,输出层包括点击预测输出子层、成单预测输出子层和价格类别预测输出子层。输入层接收输入数据,输入数据包括连续特征和离散特征,所述连续特征是指具有小数类型的特征值,包括价格、历史成单率和商家月销售额等;所述离散特征是指具有整数类型的特征值,包括用户性别和商家品类等,输入层还用于对连续特征和离散特征进行连接处理(CONCAT),得到连接特征,并将连接特征输入到共享网络结构层。共享网络结构层包括多个全连接层,由多个全连接层分别对上一层的处理结果进行非线性变换以及sigmod函数处理,得到处理结果,共享网络结构层的处理结果分别输入到点击预测输出子层、成单预测输出子层和价格类别预测输出子层。点击预测输出子层包括全连接层和输出结果,全连接层用于对共享网络结构层的处理结果进行进一步的非线性变换及sigmod函数处理,将输出结果映射到0和1之间,得到点击概率和未点击概率的输出结果。成单预测输出子层包括全连接层和输出结果,全连接层用于对共享网络结构层的处理结果进行进一步的非线性变换及sigmod函数处理,将输出结果映射到0和1之间,得到成单概率和未成单概率的输出结果。价格类别预测输出子层包括全连接层和输出结果,全连接层用于对共享网络结构层的处理结果进行进一步的非线性变换及sigmod函数处理,将每个价格类别的输出结果映射到0和1之间,得到各个价格类别的输出结果。
对价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型进行初始化,从所述训练样本集中选取一个或一批训练样本,作为当前训练样本,将当前训练样本输入价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果。如果当前训练样本为成单的训练样本,则价格类别、点击概率和成单概率均有对应的输出结果;如果当前训练样本为点击未成单的训练样本,则不考虑价格类别的输出结果,只获取点击概率和成单概率的输出结果;如果当前训练样本为未点击未成单的训练样本,则不考虑价格类别的输出结果,只获取点击概率和成单概率的输出结果。
步骤304,根据所述价格类别、点击概率和成单概率的输出结果,以及所述当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,对多任务预测模型中的网络参数进行调整。
根据价格类别、点击概率和成单概率的输出结果,以及当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,通过反向传播对多任务预测模型中的网络参数进行调整。如果当前训练样本为成单的训练样本,则可以针对价格类别预测、点击预测和成单预测对应的损失函数之和进行反向传播以调整共享网络结构的网络参数,并单独调整对应的价格类别预测、点击预测和成单预测的输出层中的全连接层的网络参数。如果当前训练样本为点击未成单的训练样本或未点击未成单的训练样本,则可以针对点击预测和成单预测的损失函数之和进行反向传播以调整共享网络结构的网络参数,并单独调整对应的点击预测和成单预测的输出层中的全连接层的网络参数。
其中,所述多任务预测模型的损失函数表示如下:
Loss=Lossclick+Losspay+Lossprice
其中,Loss为所述多任务预测模型的损失函数,Lossclick为所述多任务预测模型中点击预测对应的损失函数,Losspay为所述多任务预测模型中成单预测对应的损失函数,Lossprice为所述多任务预测模型中价格类别预测对应的损失函数,n表示样本数量,yc_i表示第i个样本的点击结果标记,y′c_i表示第i个样本的预测点击概率,yp_i表示第i个样本的成单结果标记,y′p_i表示第i个样本的预测成单概率,N为价格类别的数量,ypri_ij表示第i个样本在第j个价格类别的标记,y′pri_ij表示第i个样本在第j个价格类别的预测概率。
从上述公式可以看出,价格类别预测、点击预测和成单预测的损失函数形式相同,因此,可以同时收敛。
步骤305,判断网络参数是否收敛,如果否,则执行步骤303,如果是,则执行步骤306。
分别确定价格类别、点击率和成单率的损失函数,确定三个损失函数是否收敛,如果均收敛,则确定网络参数已收敛,则可以执行步骤360;如果三个损失函数中有至少一个损失函数不收敛,则确定网络参数不收敛,则循环执行步骤303-步骤305,直至网络参数收敛。
步骤306,结束训练,得到训练完成的多任务预测模型。
在网络参数收敛时,结束训练,得到训练完成的多任务预测模型。
步骤307,根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望。
在本申请的一个实施例中,根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望,包括:确定每个价格类别对应的训练样本的集合,作为类别训练样本集;将所述类别训练样本集中成单价格的平均值或者中位数作为相应价格类别对应的价格期望。对成单的训练样本进行统计,确定成单的训练样本的成单价格所在的价格区间,得到成单的训练样本所在的价格类别,从而得到每个价格类别对应的训练样本的集合,该训练样本的集合作为每个价格类别对应的类别训练样本集,将类别训练样本集中成单价格的平均值或者中位数作为该类别训练样本集对应价格类别的价格期望,实现对每个价格类别中的价格的统计。
步骤308,获取当前用户针对推荐目标的预测样本,并将所述预测样本输入所述训练完成的多任务预测模型,得到对应的点击概率、成单概率和所述预设数量的价格类别对应的概率。
其中,所述推荐目标可以是商品或者商家。所述预测样本为输入数据,包括离散特征和连续特征。
获取当前用户的用户数据、推荐目标的相关数据以及当前用户与所述推荐目标的历史交互数据,并将这些数据组织为预测样本,将预测样本输入多任务预测模型,获取多任务预测模型的输出,得到预测的点击概率、成单概率和各个价格类别对应的概率。
步骤309,根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望。
在本申请的一个实施例中,所述根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望,包括:根据所述预设数量的价格类别分别对应的价格期望和概率,按照如下公式确定所述当前用户的消费期望:
将每个价格类别对应的价格期望和概率的乘积之和,作为当前用户的消费期望,使得消费期望更加符合当前用户的兴趣,提高后续推荐的准确性。
步骤310,根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分。
在本申请的一个实施例中,根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分,包括:将所述点击概率、成单概率和价格期望的乘积,作为所述推荐目标的预测分。点击概率、成单概率和价格期望均是通过当前用户的预测样本得到的,从而将三者的数值乘积作为预测分,更加能够体现出用户的兴趣度,可以提高推荐结果的准确性。需要注意的是,在本申请实施例中,价格类别、价格期望和消费期望等和价格相关的术语,在使用时单位是统一的,比如单位都是元,而且在对多个推荐目标进行预测时,这些术语的单位也是相同的,从而保证预测分的一致性。
在向当前用户推荐推荐目标时综合考虑了点击概率、成单概率和价格,使得推荐的推荐目标更加符合用户的期望,推荐准确性更高。
在上述技术方案的基础上,在所述根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分之后,还包括:根据多个推荐目标的预测分,对所述多个推荐目标进行排序,并将排序结果作为推荐结果。
在根据用户的推荐请求召回多个推荐目标后,对每个推荐目标分别按照上述方式确定对应的预测分,并按照预测分从高到低的顺序,对多个推荐目标进行排序,将排序结果作为推荐结果,从而得到的推荐结果更加准确。
本申请实施例公开的多任务学习方法,通过根据训练样本集中成单的训练样本的成单价格,确定训练样本集对应的成单价格范围,将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记,从而可以对价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型进行训练,由于将价格预测问题转换为了价格分类问题,从而点击预测、成单预测和价格类别预测均同时为分类问题,解决了价格预测和点击、成单之间的损失函数冲突的问题,实现了价格预测和点击、成单共享网络参数,而且可以同时训练价格类别、点击预测和成单预测组成的多个任务,提高了训练的效率,不必单独训练每个任务,减少了训练的过程,降低了训练过程中对计算资源的消耗,并且在训练得到多任务预测模型后,可以结合用户对推荐目标的点击概率、成单概率和价格类别向用户进行推荐,提高推荐结果的准确性。
实施例二
本实施例公开的一种多任务学习装置,如图5所示,所述多任务学习装置500包括:
价格范围确定模块501,用于根据训练样本集中成单的训练样本的成单价格,确定所述训练样本集对应的成单价格范围;
价格类别划分模块502,用于将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定所述训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记;
输出结果获取模块503,用于从所述训练样本集中选取当前训练样本,将所述当前训练样本输入价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果;
模型参数调整模块504,用于根据所述价格类别、点击概率和成单概率的输出结果,以及所述当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,对所述多任务预测模型中的网络参数进行调整,循环执行上述选取当前训练样本以及根据当前训练样本训练所述多任务预测模型的操作,直至网络参数收敛,得到训练完成的多任务预测模型;
价格期望确定模块505,用于根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望;
多任务预测模块506,用于获取当前用户针对推荐目标的预测样本,并将所述预测样本输入所述训练完成的多任务预测模型,得到对应的点击概率、成单概率和所述预设数量的价格类别对应的概率;
消费期望确定模块507,用于根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望;
预测分确定模块508,用于根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分。
可选的,所述消费期望确定模块具体用于:
根据所述预设数量的价格类别分别对应的价格期望和概率,按照如下公式确定所述当前用户的消费期望:
其中,Exp是所述当前用户的消费期望,N是所述预设数量,Pk是第k个价格类别对应的概率,Pricek是第k个价格类别对应的价格期望。
可选的,所述预测分确定模块具体用于:
将所述点击概率、成单概率和价格期望的乘积,作为所述推荐目标的预测分。
可选的,所述价格期望确定模块,包括:
类别样本确定单元,用于确定每个价格类别对应的训练样本的集合,作为类别训练样本集;
价格期望确定单元,用于将所述类别训练样本集中成单价格的平均值或者中位数作为相应价格类别对应的价格期望。
可选的,所述装置还包括:
推荐结果确定模块,用于根据多个推荐目标的预测分,对所述多个推荐目标进行排序,并将排序结果作为推荐结果。
可选的,所述价格类别划分模块包括:
价格区间划分单元,用于将所述成单价格范围按照训练样本等频划分为预设数量的价格区间。
本申请实施例提供的多任务学习装置,用于实现本申请实施例一中所述的多任务学习方法的各步骤,装置的各模块的具体实施方式参见相应步骤,此处不再赘述。
可选的,所述多任务预测模型的损失函数表示如下:
Loss=Lossclick+Losspay+Lossprice
其中,Loss为所述多任务预测模型的损失函数,Lossclick为所述多任务预测模型中点击预测对应的损失函数,Losspay为所述多任务预测模型中成单预测对应的损失函数,Lossprice为所述多任务预测模型中价格类别预测对应的损失函数,n表示样本数量,yc_i表示第i个样本的点击结果标记,y′c_i表示第i个样本的预测点击概率,yp_i表示第i个样本的成单结果标记,y′p_i表示第i个样本的预测成单概率,N为价格类别的数量,ypri_ij表示第i个样本在第j个价格类别的标记,y′pri_ij表示第i个样本在第j个价格类别的预测概率。
本申请实施例公开的多任务学习装置,通过价格范围确定模块根据训练样本集中成单的训练样本的成单价格,确定训练样本集对应的成单价格范围,价格类别划分模块将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记,从而可以对价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型进行训练,由于将价格预测问题转换为了价格分类问题,从而点击预测、成单预测和价格类别预测均同时为分类问题,解决了价格预测和点击、成单之间的损失函数冲突的问题,实现了价格预测和点击、成单共享网络参数,而且可以同时训练价格类别、点击预测和成单预测组成的多个任务,提高了训练的效率,不必单独训练每个任务,减少了训练的过程,降低了训练过程中对计算资源的消耗,并且在训练得到多任务预测模型后,可以结合用户对推荐目标的点击概率、成单概率和价格类别向用户进行推荐,提高推荐结果的准确性。
相应的,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例一所述的多任务学习方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。
本申请实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一所述的多任务学习方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请实施例提供的一种多任务学习方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
Claims (10)
1.一种多任务学习方法,其特征在于,包括:
根据训练样本集中成单的训练样本的成单价格,确定所述训练样本集对应的成单价格范围;
将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定所述训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记;
从所述训练样本集中选取当前训练样本,将所述当前训练样本输入价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果;
根据所述价格类别、点击概率和成单概率的输出结果,以及所述当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,对所述多任务预测模型中的网络参数进行调整,循环执行上述选取当前训练样本以及根据当前训练样本训练所述多任务预测模型的操作,直至网络参数收敛,得到训练完成的多任务预测模型;
根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望;
获取当前用户针对推荐目标的预测样本,并将所述预测样本输入所述训练完成的多任务预测模型,得到对应的点击概率、成单概率和所述预设数量的价格类别对应的概率;
根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望;
根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分。
3.根据权利要求1所述的方法,其特征在于,根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分,包括:
将所述点击概率、成单概率和价格期望的乘积,作为所述推荐目标的预测分。
4.根据权利要求1所述的方法,其特征在于,根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望,包括:
确定每个价格类别对应的训练样本的集合,作为类别训练样本集;
将所述类别训练样本集中成单价格的平均值或者中位数作为相应价格类别对应的价格期望。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分之后,还包括:
根据多个推荐目标的预测分,对所述多个推荐目标进行排序,并将排序结果作为推荐结果。
6.根据权利要求1所述的方法,其特征在于,所述将所述成单价格范围划分为预设数量的价格区间,包括:
将所述成单价格范围按照训练样本等频划分为预设数量的价格区间。
7.根据权利要求1所述的方法,其特征在于,所述多任务预测模型的损失函数表示如下:
Loss=Lossclic+Losspay+Lossprice
其中,Loss为所述多任务预测模型的损失函数,Lossclick为所述多任务预测模型中点击预测对应的损失函数,Losspay为所述多任务预测模型中成单预测对应的损失函数,Lossprice为所述多任务预测模型中价格类别预测对应的损失函数,n表示样本数量,yc_i表示第i个样本的点击结果标记,y′c_i表示第i个样本的预测点击概率,yp_i表示第i个样本的成单结果标记,y′p_i表示第i个样本的预测成单概率,N为价格类别的数量,ypri_ij表示第i个样本在第j个价格类别的标记,y′pri_ij表示第i个样本在第j个价格类别的预测概率。
8.一种多任务学习装置,其特征在于,包括:
价格范围确定模块,用于根据训练样本集中成单的训练样本的成单价格,确定所述训练样本集对应的成单价格范围;
价格类别划分模块,用于将所述成单价格范围划分为预设数量的价格区间,将每个价格区间作为一个价格类别,并确定所述训练样本集中每个训练样本对应的价格类别标记、点击结果标记和成单结果标记;
输出结果获取模块,用于从所述训练样本集中选取当前训练样本,将所述当前训练样本输入价格类别预测、点击预测和成单预测共享网络结构的多任务预测模型,获取价格类别、点击概率和成单概率的输出结果;
模型参数调整模块,用于根据所述价格类别、点击概率和成单概率的输出结果,以及所述当前训练样本对应的价格类别标记、点击结果标记和成单结果标记,对所述多任务预测模型中的网络参数进行调整,循环执行上述选取当前训练样本以及根据当前训练样本训练所述多任务预测模型的操作,直至网络参数收敛,得到训练完成的多任务预测模型;
价格期望确定模块,用于根据所述训练样本集,确定所述预设数量的价格类别分别对应的价格期望;
多任务预测模块,用于获取当前用户针对推荐目标的预测样本,并将所述预测样本输入所述训练完成的多任务预测模型,得到对应的点击概率、成单概率和所述预设数量的价格类别对应的概率;
消费期望确定模块,用于根据所述预设数量的价格类别分别对应的价格期望和概率,确定所述当前用户的消费期望;
预测分确定模块,用于根据所述点击概率、成单概率和消费期望,确定所述推荐目标的预测分。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述的多任务学习方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7任意一项所述的多任务学习方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913422.0A CN110796513A (zh) | 2019-09-25 | 2019-09-25 | 多任务学习方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910913422.0A CN110796513A (zh) | 2019-09-25 | 2019-09-25 | 多任务学习方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110796513A true CN110796513A (zh) | 2020-02-14 |
Family
ID=69439727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910913422.0A Pending CN110796513A (zh) | 2019-09-25 | 2019-09-25 | 多任务学习方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110796513A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401963A (zh) * | 2020-03-20 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 训练用户行为预测模型的方法和装置 |
CN112163676A (zh) * | 2020-10-13 | 2021-01-01 | 北京百度网讯科技有限公司 | 多任务服务预测模型训练方法、装置、设备以及存储介质 |
CN112381314A (zh) * | 2020-11-24 | 2021-02-19 | 京东数字科技控股股份有限公司 | 模型训练、出险率预测方法、装置、电子设备及存储介质 |
CN112381607A (zh) * | 2020-11-12 | 2021-02-19 | 杭州时趣信息技术有限公司 | 一种网络商品排序方法、装置、设备及介质 |
WO2023274213A1 (zh) * | 2021-06-29 | 2023-01-05 | 华为技术有限公司 | 一种数据处理方法及相关装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184806A1 (en) * | 2010-01-27 | 2011-07-28 | Ye Chen | Probabilistic recommendation of an item |
US20120303412A1 (en) * | 2010-11-24 | 2012-11-29 | Oren Etzioni | Price and model prediction system and method |
CN107678845A (zh) * | 2017-09-30 | 2018-02-09 | 广东欧珀移动通信有限公司 | 应用程序管控方法、装置、存储介质及电子设备 |
CN107895213A (zh) * | 2017-12-05 | 2018-04-10 | 北京三快在线科技有限公司 | 消费额度的预测方法、装置及电子设备 |
CN109408731A (zh) * | 2018-12-27 | 2019-03-01 | 网易(杭州)网络有限公司 | 一种多目标推荐方法、多目标推荐模型生成方法以及装置 |
US20190205761A1 (en) * | 2017-12-28 | 2019-07-04 | Adeptmind Inc. | System and method for dynamic online search result generation |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
-
2019
- 2019-09-25 CN CN201910913422.0A patent/CN110796513A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184806A1 (en) * | 2010-01-27 | 2011-07-28 | Ye Chen | Probabilistic recommendation of an item |
US20120303412A1 (en) * | 2010-11-24 | 2012-11-29 | Oren Etzioni | Price and model prediction system and method |
CN107678845A (zh) * | 2017-09-30 | 2018-02-09 | 广东欧珀移动通信有限公司 | 应用程序管控方法、装置、存储介质及电子设备 |
WO2019062414A1 (zh) * | 2017-09-30 | 2019-04-04 | Oppo广东移动通信有限公司 | 应用程序管控方法、装置、存储介质及电子设备 |
CN107895213A (zh) * | 2017-12-05 | 2018-04-10 | 北京三快在线科技有限公司 | 消费额度的预测方法、装置及电子设备 |
US20190205761A1 (en) * | 2017-12-28 | 2019-07-04 | Adeptmind Inc. | System and method for dynamic online search result generation |
CN109408731A (zh) * | 2018-12-27 | 2019-03-01 | 网易(杭州)网络有限公司 | 一种多目标推荐方法、多目标推荐模型生成方法以及装置 |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
Non-Patent Citations (2)
Title |
---|
BISWAS, A 等: "MRNet-Product2Vec: A Multi-task Recurrent Neural Network for Product Embeddings", 《MACHINE LEARNING AND KNOWLEDGE DISCOVERY IN DATABASES》, 28 December 2018 (2018-12-28), pages 153 - 156 * |
李家华: "基于大数据的人工智能跨境电商导购平台信息个性化推荐算法", 《科学技术与工程》, vol. 19, no. 14, 18 May 2019 (2019-05-18), pages 280 - 285 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401963A (zh) * | 2020-03-20 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 训练用户行为预测模型的方法和装置 |
CN111401963B (zh) * | 2020-03-20 | 2022-06-07 | 支付宝(杭州)信息技术有限公司 | 训练用户行为预测模型的方法和装置 |
CN112163676A (zh) * | 2020-10-13 | 2021-01-01 | 北京百度网讯科技有限公司 | 多任务服务预测模型训练方法、装置、设备以及存储介质 |
CN112163676B (zh) * | 2020-10-13 | 2024-04-05 | 北京百度网讯科技有限公司 | 多任务服务预测模型训练方法、装置、设备以及存储介质 |
CN112381607A (zh) * | 2020-11-12 | 2021-02-19 | 杭州时趣信息技术有限公司 | 一种网络商品排序方法、装置、设备及介质 |
CN112381607B (zh) * | 2020-11-12 | 2023-11-24 | 杭州时趣信息技术有限公司 | 一种网络商品排序方法、装置、设备及介质 |
CN112381314A (zh) * | 2020-11-24 | 2021-02-19 | 京东数字科技控股股份有限公司 | 模型训练、出险率预测方法、装置、电子设备及存储介质 |
WO2023274213A1 (zh) * | 2021-06-29 | 2023-01-05 | 华为技术有限公司 | 一种数据处理方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Using Bayesian deep learning to capture uncertainty for residential net load forecasting | |
CN110796513A (zh) | 多任务学习方法、装置、电子设备及存储介质 | |
US11663493B2 (en) | Method and system of dynamic model selection for time series forecasting | |
CN110070391B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN110866628A (zh) | 利用动态时间上下文学习进行多界限时间序列预测的系统和方法 | |
WO2023040494A1 (zh) | 资源推荐方法、多目标融合模型的训练方法及装置 | |
US20210103858A1 (en) | Method and system for model auto-selection using an ensemble of machine learning models | |
EP3893169A2 (en) | Method, apparatus and device for generating model and storage medium | |
CN111340244B (zh) | 预测方法、训练方法、装置、服务器及介质 | |
Makridakis et al. | Statistical, machine learning and deep learning forecasting methods: Comparisons and ways forward | |
CN110852881B (zh) | 风险账户识别方法、装置、电子设备及介质 | |
CN110751326B (zh) | 一种光伏日前功率预测方法、装置以及存储介质 | |
WO2019214455A1 (zh) | 一种数据序列预测方法及计算设备 | |
Briola et al. | Deep learning modeling of limit order book: A comparative perspective | |
CN111695024A (zh) | 对象评估值的预测方法及系统、推荐方法及系统 | |
CN112598472A (zh) | 产品推荐方法、装置、系统、介质和程序产品 | |
CN115439192A (zh) | 医疗商品信息的推送方法及装置、存储介质、计算机设备 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN114118570A (zh) | 业务数据预测方法及装置、电子设备和存储介质 | |
Wang et al. | Decomposition-based multi-objective evolutionary algorithm for virtual machine and task joint scheduling of cloud computing in data space | |
CN116739649A (zh) | 一种用户响应潜力评估方法和装置 | |
CN110851600A (zh) | 基于深度学习的文本数据处理方法及装置 | |
CN115905558A (zh) | 基于知识图谱的xai模型评价方法、装置、设备及介质 | |
Zhang | Forecasting Short-Term Electricity Load with Combinations of Singular Spectrum Analysis | |
CN113869596A (zh) | 任务预测处理方法、设备、产品和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |