CN112163676A - 多任务服务预测模型训练方法、装置、设备以及存储介质 - Google Patents
多任务服务预测模型训练方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN112163676A CN112163676A CN202011090846.0A CN202011090846A CN112163676A CN 112163676 A CN112163676 A CN 112163676A CN 202011090846 A CN202011090846 A CN 202011090846A CN 112163676 A CN112163676 A CN 112163676A
- Authority
- CN
- China
- Prior art keywords
- service
- user
- task
- feature
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 title claims abstract description 46
- 239000013598 vector Substances 0.000 claims abstract description 37
- 238000006243 chemical reaction Methods 0.000 claims abstract description 18
- 230000015654 memory Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000010801 machine learning Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了多任务服务预测模型训练方法、装置、设备以及存储介质,涉及机器学习、大数据技术领域。该多任务服务预测模型训练方法包括:基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;将用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练多任务服务预测模型,得到训练完成的多任务服务预测模型,从而将多任务学习技术应用到了长周期服务场景,统一了长周期服务场景各个转换阶段的目标之间的相关性。
Description
技术领域
本申请涉及计算机技术领域,具体涉及机器学习、大数据技术领域,尤其涉及多任务服务预测模型训练方法、装置、设备以及存储介质。
背景技术
对于一些服务场景如卖车、卖房、卖保险等,可以基于历史成交数据进行建模,以帮助客户找到潜在的目标用户。现有的方案是根据目标用户的成交行为单独建模,预测用户的购买概率,从而进行全流程的圈人服务。
发明内容
本申请实施例提供了多任务服务预测模型训练方法、装置、设备以及存储介质。
第一方面,本申请实施例提供了多任务服务预测模型训练方法,包括:基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型。
第二方面,本申请实施例提供了多任务服务预测模型训练装置,包括:用户服务特征向量确定模块,被配置为基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;用户深度共享特征确定模块,被配置为将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;多任务服务预测模型训练模块,被配置为将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型。
第三方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。
本申请实施例提供的多任务服务预测模型训练方法、装置、设备以及存储介质,首先基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;之后将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;最后将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型,从而将多任务学习技术应用到了长周期服务场景,统一了长周期服务场景各个转换阶段的目标之间的相关性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的多任务服务预测模型训练方法的一个实施例的流程示意图;
图3是根据本申请的训练完成的多任务服务预测模型的一个应用场景示意图;
图4是本申请的多任务服务预测模型训练装置的一个实施例的结构示意图;
图5是用来实现本申请实施例的多任务服务预测模型训练方法的电子设备的框图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的多任务服务预测模型训练方法或多任务服务预测模型训练装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、网络102、服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101可以通过网络102与服务器103交互。终端设备101中可以提供用户特征数据和服务场景的多维度特征数据,包括但不限于数据库、用户终端等等。
服务器103可以提供各种服务,例如服务器103可以对从终端设备101获取到的用户特征和服务场景的多维度特征等数据进行分析等处理,生成处理结果(例如得到训练完成的多任务服务预测模型)。
需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的多任务服务预测模型训练方法一般由服务器103执行,相应地,多任务服务预测模型训练装置一般设置于服务器103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的多任务服务预测模型训练方法的一个实施例的流程200。该方法,包括以下步骤:
步骤201,基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本。
在本实施例中,多任务服务预测模型训练方法的执行主体(例如图1所示的服务器103)可以基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本。
其中,用户特征包括用户基本属性特征和用户行为特征。用户基本属性特征是指示用户自身的客观属性的特征,可以包括以下至少一项:用户性别、年龄段、用户地域、消费能力等。
用户行为特征包括用户行为中与服务达成相关联的特征。例如,用户行为特征可以包括以下至少一项:用户浏览特征、下单特征、收藏特征以及加购特征等。
服务场景的多维度特征是指影响服务达成的各个维度信息的特征。例如,服务场景的多维度特征可以包括服务对象特征、服务环境特征、预先推送信息特征等等。
服务对象特征可以是用于服务的货品特征,例如在卖车、卖房的服务场景中,服务对象可以是房屋、汽车。具体地,货品特征包括货品价格、销量、货品曝光量、货品页面点击数以及同类目候选货品数等与服务达成相关联的特征。
服务环境特征可以是季节特征,包括月份、节假日以及季节等货品销量关联特征。服务环境特征还可以是能影响货品销量的外部影响因素相关的外部环境特征,包括经济形势、社会关注度以及热点货品等与服务达成的数量相关联的特征。预先推送信息特征可以是预先确定的、向用户推送的信息的特征。例如,广告特征,包括广告推广、优惠策略以及投放力度等与服务达成相关联的特征。
其中,确定完用户特征和服务场景的多维度特征后,可以将用户特征和服务场景的多维度特征进行融合,得到用户服务特征向量。例如,可以将用户特征和服务场景的多维度特征拼接成用户服务特征向量;也可以将用户特征和服务场景的多维度特征这两个特征向量组合成复向量,对于输入特征x和y,输出特征z=x+iy,其中i是虚数单位,得到用户服务特征向量;还可以采用特征融合模型来完成用户特征和服务场景的多维度特征的融合,得到用户服务特征向量。
步骤202,将用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本。
在本实施例中,上述执行主体可以将用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本。
其中,多个学习任务对应于服务的多个中间过程。例如,在卖房这种长周期服务中,通常包括目标用户在线上对房源信息的点击查看阶段、目标用户在线上留下个人资料阶段、针对目标用户的电话服务阶段、目标用户签约阶段等多个中间过程。那么每个中间过程都可以对应一项学习任务,例如对于目标用户在线上对房源信息的点击查看阶段可以学习目标用户的点击通过率(CTR),对于目标用户在线上留下个人资料阶段可以学习目标用户的转化率(CVR),对于针对目标用户的电话服务阶段可以学习目标用户的电话接听率,对于目标用户签约阶段可以学习目标用户的服务达成率等等。
值得一提的是,根据真实的服务数据的不同,服务的中间过程也不相同。例如,在卖房这种长周期服务中,目标客户可能在线上对房源信息点击看后,便直接进入签约阶段,那么此时只需要学习目标用户的点击通过率(CTR)和目标用户的服务达成率即可。
在本实施例中,深度共享网络模型可以用来提取用户服务特征向量的深度共享特征。深度共享网络模型的结构可以是人工神经网络,例如卷积神经网络、深度学习网络、循环神经网络等。该网络模型可以由不同数量的卷积层、池化层构成,每个学习任务具有对应的卷积层、池化层结构。深度共享特征包含对应于每个学习任务的单独特征向量。示例性地,在卖房这种长周期服务中,提取的深度共享特征为:FCNN=【Ftask1,Ftask2,Ftask3】,其中,Ftask1,Ftask2,Ftask3分别表示目标用户的点击意向、目标用户的转化(例如留存资料)意向、目标用户的服务达成意向的特征向量表达。
在实际的场景中,服务的不同的中间过程,其训练样本数量也不同。例如,以卖房这种长周期服务为例,往往存在大量目标用户点击查看房源的数据,但目标用户转化的样本数据量可能较少,目标用户进入签约阶段的数据量就更稀缺了。如果采用现有技术中的单独建模方法,会忽略长周期服务场景转化路径中受众的差异。在本实施例中,如果服务的某个中间过程样本数量较少,可以通过用户深度共享特征将服务的多个中间过程一起建模,从而解决服务的某个中间过程训练数据量小的问题。
步骤203,将用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练多任务服务预测模型,得到训练完成的多任务服务预测模型。
在本实施例中,上述执行主体可以以各个学习任务的标签为约束,训练多任务服务预测模型,得到训练完成的多任务服务预测模型。其中,首先构建多任务服务预测模型的独立特征学习网络模型,然后基于N个不同的学习任务设置N个不同的独立特征学习网络模型,并设置相应的损失函数,将融合有对应于每个学习任务的单独特征向量的用户深度共享特征输入独立特征学习网络模型进行训练,通过优化损失函数直至损失最小,得到训练完成的多任务服务预测模型。
在本实施例中,独立特征学习网络模型的训练采用的是有监督的方式。具体地,每个学习任务包含标签信息,例如将达成服务的目标用户样本标记为正样本,将未达成服务的目标用户样本标记为负样本。独立特征学习网络模型可以采用基于CTR或CVR预估的模型,包括FM、FFM、GBDT+LR、Wide&Deep、DeepFM算法。这些算法的思路是获取每个学习任务的单独特征向量(X),然后从历史数据中获取每个样本的标签Y(正样本或负样本),并利用监督式模型去学习X和Y之间的联系。
本申请的上述实施例提供的多任务服务预测模型训练方法,解决了现有技术中因忽略长周期服务场景转化路径中受众的差异,而导致最终转化率较低的问题。通过将多任务学习技术应用到长周期服务场景,统一了长周期服务场景各个转换阶段的目标之间的相关性。
在本实施例的一些可选的实现方式中,上述步骤201中的用户服务场景的多维度特征样本包括服务对象特征、服务环境特征、预先推送信息特征中的至少一种。服务对象特征可以是货品特征,包括货品价格、销量、货品曝光量、货品页面点击数以及同类目在售货品数等销售关联特征。服务环境特征可以是能影响服务的外部影响因素相关的外部环境特征,包括经济形势、社会关注度以及热点程度等服务关联特征。预先推送信息特征可以是广告特征,包括广告推广、优惠策略以及投放力度等推广关联特征。通过将服务场景的多维度特征融合至用户特征,可以提高模型预估概率的准确性。
在本实施例的一些可选的实现方式中,上述步骤202中的多个学习任务包括点击获得率(CTR)预估、转化率(CVR)预估、服务达成率预估中的至少两种。点击通过率,即:CTR(Click-Through-Rate)为货品/服务详情页到达率,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击通过率,即该广告的实际点击次数(严格的来说,可以是到达目标页面的数量)除以广告的展现量(Show content)。转化率,即:CVR(Conversion Rate)为目标用户留下个人资料的概率,CVR=(转化量/点击量)*100%。如果个人资料是一个有效的手机号码注册用户,那么转化率就是:CVR=渠道带来的手机号码注册用户数/渠道带来的点击数,一般而言,0≤CVR≤100%。服务达成率即(签约量/点击量)*100%。
在本实施例的一些可选的实现方式中,独立特征学习网络模型为多层感知器。多层感知器(MLP,Multilayer Perceptron)是一种前馈人工神经网络模型,其将输入的多个数据集映射到单一的输出的数据集上。多层感知机层与层之间是全连接的。通过多层感知器,可以学习非线性关系。
继续参考图3,其示出了根据本申请的训练完成的多任务服务预测模型的一个应用场景示意图。
如图3所示,将训练得到的多任务服务预测模型应用到推销领域的步骤包括:
步骤301,获取用户特征和服务场景的多维度特征。
步骤302,将用户特征和用户服务场景的多维度特征输入至训练完成的多任务服务预测模型,得到用户针对各个学习任务达成服务的概率。
在本实施例中,每个服务的中间过程都对应一个达成服务的概率。例如,在卖房这种长周期服务场景中,将用户特征和服务场景的多维度特征输入至多任务服务预测模型中后,可以得到该用户的预估点击率、预估转化率、预估服务达成率等。
步骤303,若用户针对各个学习任务达成服务的概率中存在大于预设阈值的概率,则将该大于预设阈值的概率所对应的学习任务的推送信息发送至用户。
在本实施例中,将上述步骤302中得到的达成服务的概率与阈值(例如50%)作比对,如果大于预设的阈值,则针对该用户进行精准推销。通过采用上述步骤203中训练完成的多任务服务预测模型,可以指导客户精细化控制服务中每一步服务转换路径上的效果,并找到精准的目标用户。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种多任务服务预测模型的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的多任务服务预测模型训练装置400可以包括:用户服务特征向量确定模块401、用户深度共享特征确定模块402、多任务服务预测模型训练模块403。其中,用户服务特征向量确定模块401,被配置为基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;用户深度共享特征确定模块402,被配置为将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;多任务服务预测模型训练模块403,被配置为将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型。
在本实施例中,多任务服务预测模型训练装置400中:用户服务特征向量确定模块401、用户深度共享特征确定模块402、多任务服务预测模型训练模块403的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,所述服务场景的多维度特征包括服务对象特征、服务环境特征、预先推送信息特征中的至少一种。
在本实施例的一些可选的实现方式中,所述多个学习任务包括点击获得率(CTR)预估、转化率(CVR)预估、服务达成率预估中的至少两种。
在本实施例的一些可选的实现方式中,所述独立特征学习网络模型为多层感知器。
在本实施例的一些可选的实现方式中,所述装置包括:获取模块,被配置为获取用户特征和用户服务场景的多维度特征;
预测模型应用模块,被配置为将所述用户特征和用户服务场景的多维度特征输入至训练完成的多任务服务预测模型,得到用户针对各个学习任务达成服务的概率;推销信息发送模块,被配置为若所述用户针对各个学习任务达成服务的概率中存在大于预设阈值的概率,则将该大于预设阈值的概率所对应的学习任务的推送信息发送至用户。
如图5所示,是根据本申请实施例多任务服务预测模型训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的多任务服务预测模型训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的多任务服务预测模型训练方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的多任务服务预测模型训练方法对应的程序指令/模块(例如,附图4所示的用户服务特征向量确定模块401、用户深度共享特征确定模块402、多任务服务预测模型训练模块403)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的多任务服务预测模型训练方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据多任务服务预测模型训练方法的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至多任务服务预测模型训练方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
多任务服务预测模型训练方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与多任务服务预测模型训练方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请的技术方案,首先基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;之后将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;最后将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型,从而将多任务学习技术应用到了长周期服务场景,统一了长周期服务场景各个转换阶段的目标之间的相关性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (12)
1.一种多任务服务预测模型训练方法:
基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;
将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;
将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型。
2.根据权利要求1所述的方法,所述服务场景的多维度特征包括服务对象特征、服务环境特征、预先推送信息特征中的至少一种。
3.根据权利要求1所述的方法,所述多个学习任务包括点击通过率(CTR)预估、转化率(CVR)预估、服务达成率服务达成率预估中的至少两种。
4.根据权利要求1所述的方法,所述独立特征学习网络模型为多层感知器。
5.根据权利要求1-4任一项所述的方法,包括:
获取用户特征和用户服务场景的多维度特征;
将所述用户特征和用户服务场景的多维度特征输入至训练完成的多任务服务预测模型,得到用户针对各个学习任务达成服务的概率;
若所述用户针对各个学习任务达成服务的概率中存在大于预设阈值的概率,则将该大于预设阈值的概率所对应的学习任务的推送信息发送至用户。
6.一种多任务服务预测模型训练装置,其特征在于,所述装置包括:
用户服务特征向量确定模块,被配置为基于用户特征样本和用户服务场景的多维度特征样本,确定用户服务特征向量样本;
用户深度共享特征确定模块,被配置为将所述用户服务特征向量样本输入至多任务服务预测模型中的深度共享网络模型,确定针对多个学习任务的用户深度共享特征样本;
多任务服务预测模型训练模块,被配置为将所述用户深度共享特征样本作为多任务服务预测模型中的独立特征学习网络模型的输入,将针对各个学习任务达成服务的概率作为期望输出,并以各个学习任务的标签为约束,训练所述多任务服务预测模型,得到训练完成的多任务服务预测模型。
7.根据权利要求6所述的装置,其中,所述服务场景的多维度特征包括服务对象特征、服务环境特征、预先推送信息特征中的至少一种。
8.根据权利要求6所述的装置,其中,所述多个学习任务包括点击通过率(CTR)预估、转化率(CVR)预估、服务达成率服务达成率预估中的至少两种。
9.根据权利要求6所述的装置,所述独立特征学习网络模型为多层感知器。
10.根据权利要求6-9任一项所述的装置,包括:
获取模块,被配置为获取用户特征和用户服务场景的多维度特征;
预测模型应用模块,被配置为将所述用户特征和用户服务场景的多维度特征输入至训练完成的多任务服务预测模型,得到用户针对各个学习任务达成服务的概率;
推销信息发送模块,被配置为若所述用户针对各个学习任务达成服务的概率中存在大于预设阈值的概率,则将该大于预设阈值的概率所对应的学习任务的推送信息发送至用户。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011090846.0A CN112163676B (zh) | 2020-10-13 | 2020-10-13 | 多任务服务预测模型训练方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011090846.0A CN112163676B (zh) | 2020-10-13 | 2020-10-13 | 多任务服务预测模型训练方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163676A true CN112163676A (zh) | 2021-01-01 |
CN112163676B CN112163676B (zh) | 2024-04-05 |
Family
ID=73866669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011090846.0A Active CN112163676B (zh) | 2020-10-13 | 2020-10-13 | 多任务服务预测模型训练方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163676B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766490A (zh) * | 2021-01-13 | 2021-05-07 | 深圳前海微众银行股份有限公司 | 特征变量学习方法、装置、设备及计算机可读存储介质 |
CN112801203A (zh) * | 2021-02-07 | 2021-05-14 | 新疆爱华盈通信息技术有限公司 | 基于多任务学习的数据分流训练方法及系统 |
CN113313314A (zh) * | 2021-06-11 | 2021-08-27 | 北京沃东天骏信息技术有限公司 | 模型训练方法、装置、设备及存储介质 |
CN113436682A (zh) * | 2021-06-30 | 2021-09-24 | 平安科技(深圳)有限公司 | 风险人群的预测方法、装置、终端设备及存储介质 |
CN113591573A (zh) * | 2021-06-28 | 2021-11-02 | 北京百度网讯科技有限公司 | 多任务学习深度网络模型的训练及目标检测方法、装置 |
CN114240506A (zh) * | 2021-12-21 | 2022-03-25 | 北京有竹居网络技术有限公司 | 多任务模型的建模方法、推广内容处理方法及相关装置 |
CN114742645A (zh) * | 2022-05-19 | 2022-07-12 | 北京淇瑀信息科技有限公司 | 基于多阶段时序多任务的用户安全等级识别方法及装置 |
CN114936881A (zh) * | 2022-06-01 | 2022-08-23 | 北京奇艺世纪科技有限公司 | 模型训练和转化率确定方法、装置、设备及存储介质 |
CN115145730A (zh) * | 2022-07-05 | 2022-10-04 | 小米汽车科技有限公司 | 运行监测方法、装置、电子设备和存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100241698A1 (en) * | 2009-03-18 | 2010-09-23 | Talk3, Inc. | Methods and systems for auto-generating models of networks for network management purposes |
CN106529402A (zh) * | 2016-09-27 | 2017-03-22 | 中国科学院自动化研究所 | 基于多任务学习的卷积神经网络的人脸属性分析方法 |
US20190114416A1 (en) * | 2017-10-12 | 2019-04-18 | Cisco Technology, Inc. | Multiple pairwise feature histograms for representing network traffic |
US20190114528A1 (en) * | 2017-10-13 | 2019-04-18 | Facebook, Inc. | Flexible multi-task neutral network for content ranking |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110096526A (zh) * | 2019-04-30 | 2019-08-06 | 秒针信息技术有限公司 | 一种用户属性标签的预测方法及预测装置 |
CN110119689A (zh) * | 2019-04-18 | 2019-08-13 | 五邑大学 | 一种基于多任务迁移学习的人脸美丽预测方法 |
US20200051549A1 (en) * | 2017-11-24 | 2020-02-13 | Tencent Technology (Shenzhen) Company Limited | Speech signal processing model training method, electronic device and storage medium |
CN110796513A (zh) * | 2019-09-25 | 2020-02-14 | 北京三快在线科技有限公司 | 多任务学习方法、装置、电子设备及存储介质 |
CN111311328A (zh) * | 2020-02-20 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 用于确定在广告渠道下的产品的广告点击率的方法及装置 |
CN111401963A (zh) * | 2020-03-20 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 训练用户行为预测模型的方法和装置 |
-
2020
- 2020-10-13 CN CN202011090846.0A patent/CN112163676B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100241698A1 (en) * | 2009-03-18 | 2010-09-23 | Talk3, Inc. | Methods and systems for auto-generating models of networks for network management purposes |
CN106529402A (zh) * | 2016-09-27 | 2017-03-22 | 中国科学院自动化研究所 | 基于多任务学习的卷积神经网络的人脸属性分析方法 |
US20190114416A1 (en) * | 2017-10-12 | 2019-04-18 | Cisco Technology, Inc. | Multiple pairwise feature histograms for representing network traffic |
US20190114528A1 (en) * | 2017-10-13 | 2019-04-18 | Facebook, Inc. | Flexible multi-task neutral network for content ranking |
US20200051549A1 (en) * | 2017-11-24 | 2020-02-13 | Tencent Technology (Shenzhen) Company Limited | Speech signal processing model training method, electronic device and storage medium |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110119689A (zh) * | 2019-04-18 | 2019-08-13 | 五邑大学 | 一种基于多任务迁移学习的人脸美丽预测方法 |
CN110096526A (zh) * | 2019-04-30 | 2019-08-06 | 秒针信息技术有限公司 | 一种用户属性标签的预测方法及预测装置 |
CN110796513A (zh) * | 2019-09-25 | 2020-02-14 | 北京三快在线科技有限公司 | 多任务学习方法、装置、电子设备及存储介质 |
CN111311328A (zh) * | 2020-02-20 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 用于确定在广告渠道下的产品的广告点击率的方法及装置 |
CN111401963A (zh) * | 2020-03-20 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 训练用户行为预测模型的方法和装置 |
Non-Patent Citations (2)
Title |
---|
郭丽丽;丁世飞;: "深度学习研究进展", 计算机科学, no. 05, 15 May 2015 (2015-05-15) * |
高伟波;李仲琴;: "人工智能在网络安全领域的辅助应用和面临的挑战", 网络空间安全, no. 07, 25 July 2020 (2020-07-25) * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766490A (zh) * | 2021-01-13 | 2021-05-07 | 深圳前海微众银行股份有限公司 | 特征变量学习方法、装置、设备及计算机可读存储介质 |
CN112766490B (zh) * | 2021-01-13 | 2024-05-24 | 深圳前海微众银行股份有限公司 | 特征变量学习方法、装置、设备及计算机可读存储介质 |
CN112801203A (zh) * | 2021-02-07 | 2021-05-14 | 新疆爱华盈通信息技术有限公司 | 基于多任务学习的数据分流训练方法及系统 |
CN113313314A (zh) * | 2021-06-11 | 2021-08-27 | 北京沃东天骏信息技术有限公司 | 模型训练方法、装置、设备及存储介质 |
CN113313314B (zh) * | 2021-06-11 | 2024-05-24 | 北京沃东天骏信息技术有限公司 | 模型训练方法、装置、设备及存储介质 |
CN113591573A (zh) * | 2021-06-28 | 2021-11-02 | 北京百度网讯科技有限公司 | 多任务学习深度网络模型的训练及目标检测方法、装置 |
CN113436682A (zh) * | 2021-06-30 | 2021-09-24 | 平安科技(深圳)有限公司 | 风险人群的预测方法、装置、终端设备及存储介质 |
CN113436682B (zh) * | 2021-06-30 | 2024-05-24 | 平安科技(深圳)有限公司 | 风险人群的预测方法、装置、终端设备及存储介质 |
CN114240506A (zh) * | 2021-12-21 | 2022-03-25 | 北京有竹居网络技术有限公司 | 多任务模型的建模方法、推广内容处理方法及相关装置 |
CN114742645A (zh) * | 2022-05-19 | 2022-07-12 | 北京淇瑀信息科技有限公司 | 基于多阶段时序多任务的用户安全等级识别方法及装置 |
CN114936881A (zh) * | 2022-06-01 | 2022-08-23 | 北京奇艺世纪科技有限公司 | 模型训练和转化率确定方法、装置、设备及存储介质 |
CN115145730A (zh) * | 2022-07-05 | 2022-10-04 | 小米汽车科技有限公司 | 运行监测方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112163676B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112163676B (zh) | 多任务服务预测模型训练方法、装置、设备以及存储介质 | |
KR102472572B1 (ko) | 사용자 의도 프로파일링 방법 및 이를 위한 장치 | |
US10354184B1 (en) | Joint modeling of user behavior | |
CN105493057B (zh) | 利用精确性控制的内容选择 | |
CN112261423B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
US11127032B2 (en) | Optimizing and predicting campaign attributes | |
US20180308128A1 (en) | Intelligent location based knowledge | |
CN111259222A (zh) | 物品推荐方法、系统、电子设备及存储介质 | |
US10290040B1 (en) | Discovering cross-category latent features | |
CN112036509A (zh) | 用于训练图像识别模型的方法和装置 | |
US10909606B2 (en) | Real-time in-venue cognitive recommendations to user based on user behavior | |
CN114787814A (zh) | 指代解析 | |
KR20190007875A (ko) | 유통과 물류의 최적화를 위한 마케팅 관리 데이터 제공 방법 및 이를 위한 장치 | |
US11170411B2 (en) | Advanced bidding for optimization of online advertising | |
US20160092771A1 (en) | Analysis of social media messages | |
CN114036398B (zh) | 内容推荐和排序模型训练方法、装置、设备以及存储介质 | |
US20210350202A1 (en) | Methods and systems of automatic creation of user personas | |
CN111950593A (zh) | 一种推荐模型训练的方法及装置 | |
CN111680517A (zh) | 用于训练模型的方法、装置、设备以及存储介质 | |
CN113781149B (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN111339406A (zh) | 个性化推荐方法、装置、设备及存储介质 | |
US10332161B2 (en) | Retrieving reviews based on user profile information | |
CN112348592A (zh) | 广告推荐方法、装置、电子设备及介质 | |
US20170132728A1 (en) | Method and system of automatically generating an online-real estate magazine | |
US20220198487A1 (en) | Method and device for processing user interaction information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |