CN116521979A

CN116521979A - 一种目标对象的展示方法、装置、电子设备及存储介质

Info

Publication number: CN116521979A
Application number: CN202310138968.XA
Authority: CN
Inventors: 刘元震
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2023-02-14
Filing date: 2023-02-14
Publication date: 2023-08-01

Abstract

本申请提出一种目标对象的展示方法、装置、电子设备及存储介质，该方法收集得到输入特征，输入特征包括用户历史行为数据、用户属性数据、物品属性数据和上下文数据；通过预先训练的多业务多任务学习模型对输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，目标对象包括应用软件中的业务类别和业务类别下的子业务类别；根据评估得分对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序；根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别。通过预先训练的多业务多任务学习模型对输入特征进行预测，能够确保将点击率较高的目标对象展示在应用软件的相应界面，能够增强对相应目标对象的推荐准确度。

Description

一种目标对象的展示方法、装置、电子设备及存储介质

技术领域

本申请涉及机器学习技术领域，尤其涉及一种目标对象的展示方法、装置、电子设备及存储介质。

背景技术

在APP产品中，推荐业务基本都位于APP的首页，其直接影响用户粘性，与用户的留存。在半展示页下，也都会存在相关推荐的业务。

在推荐领域，多目标已经成为了业界的主流，各大公司的各种业务场景，基本都是基于多目标的框架来搭建推荐系统。然而在现有的多目标模型中，很难同时对多个业务场景下的多目标进行优化，通常会出现负迁移(negat i ve transfer)和跷跷板现象(seesawphenomenon)。

发明内容

本申请实施例的主要目的在于提出一种目标对象的展示方法、装置、电子设备及存储介质。旨在能够通过多业务多任务学习模型对输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，然后根据评估得分对各个目标对象进行排序及根据排序结果，在应用软件的相应展示界面展示各个目标对象，从而能够确保展示在应用软件的目标对象是用户点击率较高的业务类别或子业务类别，便于应用软件的用户维护。

为实现上述目的，本申请实施例的第一方面提出了一种目标对象的展示方法，所述方法包括：

收集得到输入特征，所述输入特征包括用户历史行为数据、用户属性数据、物品属性数据和上下文数据；

通过预先训练的多业务多任务学习模型对所述输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，所述目标对象包括应用软件中的业务类别和业务类别下的子业务类别；

根据所述评估得分对各个所述业务类别进行排序及对各个所述业务类别下的子业务类别进行排序；

根据排序结果，在所述应用软件的相应展示界面展示各个所述业务类别和各个所述子业务类别。

在一些实施例，在训练得到所述多业务多任务学习模型之后，所述方法还包括：

获取与搜索关键词匹配的各个目标对象的第一排序结果；

通过预先训练的多业务多任务学习模型对各个所述目标对象进行预测，得到各个所述目标对象的评分结果；

根据所述评分结果，对所述第一排序结果进行修正，得到第二排序结果；

根据所述第二排序结果，在所述应用软件的相应展示界面展示各个所述目标对象。

在一些实施例，根据所述评估得分对各个所述业务类别进行排序及对各个所述业务类别下的子业务类别进行排序包括：

对各个所述业务类别对应的所述评估得分按照数值从大到小的顺序进行排序，得到第一排序列表；

或者，对各个所述业务类别对应的所述评估得分按照数值从小到大的顺序进行排序，得到第二排序列表；

对各个所述子业务类别对应的所述评估得分按照数值从大到小的顺序进行排序，得到第三排序列表；

或者，对各个所述子业务类别对应的所述评估得分按照数值从小到大的顺序进行排序，得到第四排序列表。

在一些实施例，所述根据排序结果，在所述应用软件的相应展示界面展示各个所述业务类别和各个所述子业务类别，包括：

选取所述第一排序列表中排序处于前N个的业务类别在相应展示界面进行展示；

或者，选取所述第二排序列表中排序处于后N个的业务类别在相应展示界面进行展示，N为正整数；

选取所述第三排序列表中排序处于前M个的子业务类别在相应展示界面进行展示；

或者，选取所述第四排序列表中排序处于后M个的子业务类别在相应展示界面进行展示，M为正整数。

在一些实施例，预先训练所述多业务多任务学习模型包括：

基于用户历史行为数据，构建训练样本集；

获取所述训练样本集对所述多业务多任务学习模型进行训练；

确定损失函数；

根据所述损失函数，通过反向传播更新所述多业务多任务学习模型的参数；

判断所述多业务多任务学习模型训练是否满足结束条件，若满足结束条件，则输出所述多业务多任务学习模型，若不满足结束条件，则继续训练。

在一些实施例，所述确定损失函数包括：

确定各个业务对应的权重和各个任务对应的权重；

获取各个业务下各个任务的样本空间；

计算各个业务下各个任务的损失函数；

根据各个业务对应的权重、各个任务对应的权重、各个业务下各个任务的样本空间和各个业务下各个任务的损失函数，计算得到损失函数。

在一些实施例，所述根据各个业务对应的权重、各个任务对应的权重、各个业务下各个任务的样本空间和各个业务下各个任务的损失函数，计算得到损失函数通过以下公式执行：

其中，

式中，L_N,K(θ_N,K,θ_s)表示多业务多任务学习模型的损失函数，θ_N,K表示N个业务K个任务的特征，N表示业务的总数量，K表示任务的总数量，θ_n,k表示第n个业务下第k个任务的特征，θ_s表示共享特征，ω_n表示业务n的权重，ω_k表示任务k的权重，L_n,k(θ_n,k,θ_s)表示第n个业务下第k个任务的损失函数，为指示函数，表示样本i是否为第n个业务下第k个任务的样本，若是，则计入第n个业务下第k个任务的损失，/>表示多业务多任务学习模型对样本i的预测结果，/>表示样本i的标签。

为实现上述目的，本申请实施例的第二方面提出了一种目标对象的展示装置，所述装置包括：

收集模块，用于收集得到输入特征，所述输入特征包括用户历史行为数据、用户属性数据、物品属性数据和上下文数据；

处理模块，用于通过预先训练的多业务多任务学习模型对所述输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，所述目标对象包括应用软件中的业务类别和业务类别下的子业务类别；

排序模块，用于根据所述评估得分对各个所述业务类别进行排序及对各个所述业务类别下的子业务类别进行排序；

展示模块，用于根据排序结果，在所述应用软件的相应展示界面展示各个所述业务类别和各个所述子业务类别。

为实现上述目的，本申请实施例的第三方面提出了一种电子设备，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的方法。

为实现上述目的，本申请实施例的第四方面提出了一种计算机可读存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述第一方面所述的方法。

本申请提出的一种目标对象的展示方法、装置、电子设备及存储介质，收集得到输入特征，输入特征包括用户历史行为数据、用户属性数据、物品属性数据和上下文数据；通过预先训练的多业务多任务学习模型对输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，目标对象包括应用软件中的业务类别和业务类别下的子业务类别；根据评估得分对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序；根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别。通过预先训练的多业务多任务学习模型对输入特征进行预测，使得当多个目标之间存在一定程度的冲突时，仍然能够保证多个目标行为预测值的精度，同时能够确保将点击率较高的目标对象展示在应用软件的相应界面，能够增强对相应目标对象的推荐准确度。

附图说明

图1是本申请实施例中提供的目标对象的展示方法的流程图；

图2是本申请实施例提供的推荐算法的建模流程图；

图3为本申请实施例中提供的多业务多任务学习模型的结构示意图；

图4是本申请实施例提供的CGC网络结构示意图；

图5是本申请实施例提供的PLE网络的结构示意图；

图6是本申请实施例提供的预先训练多业务多任务学习模型的步骤流程图；

图7是本申请实施例提供的根据评估得分对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序的步骤流程图；

图8是本申请实施例提供的根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别的步骤流程图；

图9为本申请实施例提供的在训练得到多业务多任务学习模型之后还可执行的步骤流程图；

图10是本申请实施例提供的第一排序结果的示例图；

图11是本申请实施例提供的第二排序结果的示例图；

图12是本申请实施例提供的目标对象的展示装置的结构示意图；

图13是本申请实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

需要说明的是，在本申请的各个具体实施方式中，当涉及到需要根据用户信息、用户行为数据，用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时，都会先获得用户的许可或者同意，而且，对这些数据的收集、使用和处理等，都会遵守相关国家和地区的相关法律法规和标准。此外，当本申请实施例需要获取用户的敏感个人信息时，会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意，在明确获得用户的单独许可或者单独同意之后，再获取用于使本申请实施例能够正常运行的必要的用户相关数据。

推荐系统旨在帮助用户在众多信息中快速发现最感兴趣的信息，如：音乐、新闻资讯等。目前大部分推荐技术只进行单目标训练，例如使用LR(逻辑回归)、GBDT(梯度提升决策树)、深度学习等算法的点击率(CTR)预估技术。但是，对多个目标进行建模是推荐系统的常见需求，例如，因为用户的反馈是多种类型的，包括点击、完整播放等，只对单一反馈进行单目标优化的推荐算法推荐出的信息很可能有偏差，单独优化点击率的模型容易推荐出来标题党，单独优化完整播放率的模型可能短音乐短视频就容易被推荐出来，所以多目标推荐的需求应运而生，有必要同时优化点击率、完整播放率。

多目标推荐问题与单目标推荐问题不同，单目标推荐问题只优化单一目标，例如提高平台的点击率，但是平台的完整播放率等其他指标可能会变差，多目标推荐问题有多个目标函数，其目的是找到一种推荐方法使得多个目标达到整体最优，例如同时提高平台的点击率、完整播放率等。以音乐推荐系统为例，为了分析用户对推荐结果的满意性，推荐系统的业务指标不只是用户播放率，还有分享率、下载率、播放时长等指标，用户播放了某首歌曲不代表会完整播放也不代表会分享或下载，播放率与播放时长、分享率、下载率的关系并非是同步提升，有时候甚至呈现出此消彼长的趋势，因此，需要对多目标联合训练，通过多目标推荐模型尽可能地去求解多目标的共同最优解，希望同时提高系统中音乐的播放率、完整播放率、分享率、下载率等，更好地满足用户需求才能提高用户的留存率和活跃度。

然而，虽然目前多任务算法(MTL)和多场景学习(MSL)在学术界和工业界被广泛的研究和应用，通过多任务联合训练可提升应用效果，如ESMM、MMoE、PLE等。但它们都没有考虑多业务加多任务的情况，从而会导致业务场景丰富的上下文信息，会受到跷跷板和负迁移影响。若为每个业务场景中每个任务分别开发模型，则开发和维护成本都会大大增加。

基于此，本申请实施例提出一种目标对象的展示方法。旨在能够通过多业务多任务学习模型对输入特征进行预测得到评估得分，然后根据评估得分对各个目标对象进行排序及根据排序结果，在应用软件的相应展示界面展示各个目标对象，从而能够使得当多个目标之间存在一定程度的冲突时，仍然能够保证多个目标行为预测值的精度，同时能够确保将点击率较高的目标对象展示在应用软件的相应界面，能够增强对相应目标对象的推荐准确度。

参照图1，图1是本申请实施例中提供的目标对象的展示方法的流程图，图1中的方法可以包括但不限于步骤S101至步骤S104。

步骤S101，收集得到输入特征，输入特征包括用户历史行为数据、用户属性特征、物品属性特征和上下文特征。

推荐系统是机器学习的一个子领域，因此推荐系统处理问题的方式遵循机器学习的一般思路。将机器学习过程看成一个打造生产某种产品的机器的过程，根据过往的生产经验来制造一款生产该产品的机器，过往的生产经验就是训练集，构建好的机器就是机器学习模型。将原材料加工好，按照某种方式灌入这个机器，这个机器的最终输出就是需要的预测结果，构建的机器是否完善、能否生产出误差在可接受范围内的商品，代表了模型的精准度。根据上述的简单类比，推荐算法为用户进行个性化推荐的一般流程如图2所示。图2是本申请实施例提供的推荐算法的建模流程图；通过收集不同来源的数据汇聚成推荐算法需要的原始数据，通过特征工程对原始数据处理生成最终特征，再通过选择合适的推荐算法对特征进行训练获得最终的推荐模型，在预测/推断阶段，根据某个用户的特征，将特征灌入模型获得该用户的推荐结果。由此可见，数据和特征工程在整个推荐系统业务流的起点，是非常重要的。数据是原材料，原材料(推荐数据源)是否齐备、质量是否优良直接决定是否可以生产出好的产品，而对原材料的处理加工(特征工程)决定了是否可以高效、快速、高质量地生产出好的产品。

推荐系统根据用户在产品(APP、网站等)上的操作行为，猜测用户的兴趣偏好，最终给用户做个性化推荐。在整个推荐过程中，涉及到可能产生数据的地方有用户自身、目标物品、用户的操作行为、用户所在的场景(上下文)等4个部分。

用户历史行为数据就是用户在产品上的各种操作，比如浏览、点击、播放、购买、搜索、收藏、点赞、转发、加购物车、甚至滑动、在某个位置的停留时长、快进等等一切操作行为。用户的操作行为是用户最真实意图的反馈，这些行为反应了用户的兴趣状态，通过分析用户行为，可以获得对用户的兴趣偏好的深刻洞察。根据用户的行为是否直接表明用户对目标物品的兴趣偏好，用户行为一般分为显式行为和隐式行为。显式行为是直接表明用户兴趣的行为，比如点赞、评分等。隐式行为虽不是直接表示用户的兴趣，但是该行为可以间接反馈用户的兴趣变化，只要不是用户直接评分、点赞的操作行为都算隐式反馈，包括浏览、点击、播放、收藏、评论、转发等等。

用户属性数据也叫做用户人口统计学数据，就是用户自身所带的属性，比如年龄、性别、地域、学历、家庭组成、职业等等。这些数据一般是稳定不变(如性别)或者缓慢变化(如年龄)的。人类是一个社会化物种，用户的不同属性决定了用户处在不同的阶层或者生活圈，不同的阶层或生活圈又有不同的行为特征、生活方式、偏好特点，在同一圈层具备一定的相似性，这种相似性为个性化推荐提供了一定的保证。

推荐系统中最重要的一个“参与方”是待推荐的目标对象(如物品)，物品自身是包含很多特征和属性的。对于视频来说，出品方、导演、演职员、主演、国别、年代、语言、是否获奖、剧情、海报图等等都是视频的元数据。对于电商商品来说，品类、用途、价格、产地、品牌等等也是非常重要的属性。通过用户对物品的操作行为，可以将物品所具备的特征按照某种权重赋予用户，这些特征就构建了用户的兴趣偏好，相当于给用户打上了相关的标签(比如喜欢看“恐怖片”的人)。从这些兴趣偏好出发，又可以给用户进行个性化推荐。

上下文数据是用户在对物品进行操作时所处的环境特征及状态的总称，比如用户所在地理位置、当时的时间、当时的天气、用户当时的心情、用户所在产品的路径等等。这些上下文数据对用户的决策是非常重要的、甚至是起决定作用的。比如，美团饿了么这类基于地理位置服务的产品，给用户推荐餐厅是一定要是在用户所在位置或者用户指定位置附近的。合适地使用上下文数据，将该类数据整合到推荐算法中，可以更加精准、场景化地为用户进行个性化推荐。

步骤S102，通过预先训练的多业务多任务学习模型对输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，目标对象包括应用软件中的业务类别和业务类别下的子业务类别。

本申请实施例中，多业务场景学习旨在解决多个相同的任务标签，且空间结构类似的业务场景。例如通过星型拓扑捕获业务场景相关性，其中包括共享中心参数和业务场景特定参数。多任务学习侧重于建模任务间相关性和区别。例如，点击率(CTR)预测任务和转化率(CVR)预测任务、信用风险预测任务和信用额度预测任务。对于视频而言还包括VTR(是否看完整个视频)任务和VCR(看了整个视频总长的比率)任务等。本申请实施例以多任务学习模型PLE为基础，构建多业务多任务学习模型，自动学习业务场景任务间的关联，并使得各个业务场景都有正向收益。

本申请实施例中，以点击率(CTR)预测任务和转化率(CVR)预测任务为例，点击率为用户点击目标对象的概率，转化信息包括转化率或者转化时长，转化率为用户点击目标对象后对目标对象进行转化操作的概率，转化时长包括用户点击目标对象后对目标对象进行转化操作后停留的时长。因此，本申请实施例中可对多个业务目标和多个业务下的多个子目标同时进行多任务学习，从而能够预测出各个业务场景的评估得分和各个业务场景下各个子目标的评估得分。

需要说明的是，本申请实施例中，评估得分是由打分函数计算得到，打分函数表示各个指标的加权求和。

参照图3，图3是本申请实施例提供的多业务多任务学习模型的结构示意图。如图3所示，收集得到的输入特征先输入到Embedd i ng层，将输入特征都变成同等维度向量。然后再输入concate层，将所有同等维度向量通过卷积核的卷积操作拼接在一起，然后再输入到FC全连接层中进行非线性变换，最后输入到多业务PLE网络中。本申请实施例中，先确定业务数量为N，然后对每一个业务场景都基于CGC网络构建多任务学习PLE网络，再将各个业务场景的多任务学习PLE网络进行叠加，构建得到多业务PLE网络。最后，将多业务PLE网络层的输出和FC全连接层的输出一起输入至merge层，以对多业务PLE网络层的输出特征和FC全连接层的输出特征进行融合。

具体地，参照图4，图4是本申请实施例提供的CGC网络的结构示意图。CGC的底层网络主要包括共享专家网络(shared experts)和任务专有专家网络(task-specificexperts)。其中对于任务A，有m_A个任务专有专家网络；对于任务B，有m_B个任务专有专家网络；还有m_S个任务A、B所共享的共享专家网络。每个子任务tower的输入是对任务专有专家网络和共享专家网络两部分的若干个expert vector进行加权求和(也是通过gate决定attent ion权重)。这样对专家网络(expert)做一个显式的分割，可以让任务专有(task-specific)的专家网络只受自己任务梯度的影响，不会受到其他任务的干扰；而只有共享专家网络受多个任务的混合梯度影响。这里的gat i ng network是以i nput作为裁判(se lector)，通过单层全连接和softmax得到分配给不同专家网络的attent ion权重。

PLE就是上述CGC网络的多层叠加，以获得更加丰富的表征能力。具体网络结构如图5所示，在底层的Extract ion网络中，除了各个任务专有专家网络有门控网络外，共享专家网络也有门控网络。这样，任务专有专家网络的输出只融合了任务本身的专家网络和共享专家网络；而共享专家网络的输出是融合了所有专家网络。将任务A、任务B和共享专家网络的输出输入到下一层，下一层的gat i ng network是以这三个上一层输出的结果作为sel ector，而不是用i nput作为se l ector，这样可以利用好更加抽象的高层信息。

本申请实施例中，基于每一个业务场景都构建如图5所示的多任务学习PLE网络，然后再将各个业务场景的多任务学习PLE网络进行叠加，即可构建得到多业务多任务学习模型。

参照图6，图6是本申请实施例提供的预先训练多业务多任务学习模型的步骤流程图。本申请实施例中，构建得到多业务多任务学习模型之后，需要对多业务多任务学习模型进行训练，包括但不限于步骤S601至步骤S605。

步骤S601，基于用户历史行为数据，构建训练样本集；

步骤S602，获取训练样本集对多业务多任务学习模型进行训练；

步骤S603，确定损失函数；

步骤S604，根据损失函数，通过反向传播更新多业务多任务学习模型的参数；

步骤S605，判断多业务多任务学习模型训练是否满足结束条件，若满足结束条件，则输出多业务多任务学习模型，若不满足结束条件，则继续训练。

本申请实施例中，基于用户的历史行为数据，可构建得到若干个训练样本集，然后将训练样本集输入到多业务多任务学习模型中进行训练。训练过程中最重要的就是参数的更新，首先需要确定损失函数，再根据损失函数，通过反向传播更新多业务多任务学习模型的参数。具体地，先确定各个业务对应的权重和各个任务对应的权重；然后获取各个业务下各个任务的样本空间；计算各个业务下各个任务的损失函数；根据各个业务对应的权重、各个任务对应的权重、各个业务下各个任务的样本空间和各个业务下各个任务的损失函数，计算得到损失函数。最后判断多业务多任务学习模型训练是否满足结束条件，若满足结束条件，则输出多业务多任务学习模型，若不满足结束条件，则继续训练。

本申请实施例中，不同业务下不同任务之间的权重采用自适应方案，在训练过程中不断调整不同业务下不同任务之间的权重。其中，业务n对应的权重为式中，ω_n,0表示业务n的样本的初始权重，t为训练迭代次数，γ_n表示业务n的样本权重更新因子，ω_n,0和γ_n均为网络超参数。同样地，任务k对对应的权重为/>式中，ω_k,0表示任务k的样本的初始权重，t为训练迭代次数，γ_k表示任务k的样本权重更新因子，ω_k,0和γ_k均为网络超参数。同时，考虑到不同业务下不同任务之间的样本空间不同，本申请实施例还将所有样本统一到同一个样本空间，即所有业务所有任务共同构成的样本空间。再确定损失函数的表达式为：

其中，

本申请实施例中，经过训练后的多业务多任务学习模型还需要应用到具体的下游任务中进行参数的调优操作，比如，应用到电商子网络，此时，针对于电商子网络，设置多个任务包括点击率(CTR)预测任务和转化率(CVR)预测任务，需要通过共享专家网络提取电商子网络的共享特征，并通过任务专有专家网络提取电商子网络的专有特征进行学习，然后通过反向传播不断的最小化损失函数来对模型的参数进行调优，以得到最终的可应用到电商子网络的多业务多任务学习模型。同样地，也可以将多业务多任务学习模型应用至保险子网络中，此时，针对于保险子网络，可设置多个任务包括信用风险预测任务和信用额度预测任务，需要通过共享专家网络提取保险子网络的共享特征，并通过任务专有专家网络提取保险子网络的专有特征进行学习，然后通过反向传播不断的最小化损失函数来对模型的参数进行调优，以得到最终的可应用到保险子网络的多业务多任务学习模型。

步骤S103，根据评估得分对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序。

本申请实施例中，通过预先训练的多业务多任务模型对输入特征进行处理之后，可以预测得到应用软件中各个目标对象的评估得分，目标对象包括应用软件中的业务类别和业务类别下的子业务类别。然后根据评估得分，对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序。

参照图7，图7是本申请实施例提供的根据评估得分对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序的步骤流程图，包括但不限于步骤S701至步骤S704。

步骤S701，对各个业务类别对应的评估得分按照数值从大到小的顺序进行排序，得到第一排序列表；

步骤S702，或者，对各个业务类别对应的评估得分按照数值从小到大的顺序进行排序，得到第二排序列表；

步骤S703，对各个子业务类别对应的评估得分按照数值从大到小的顺序进行排序，得到第三排序列表；

步骤S704，或者，对各个子业务类别对应的评估得分按照数值从小到大的顺序进行排序，得到第四排序列表。

本申请实施例中，评估得到由打分函数计算得到，打分函数为各个任务指标的加权求和。通过打分函数，可以得到各个业务类别对应的评估得分和各个业务类别下的子业务类别的评估得分。

示例性地，以平安数字银行APP为例，基于用户的历史行为数据，通过多业务多任务学习模型，能够预测得到平安数字银行APP中各个应用业务的评估得分，比如能够预测得到用户A在使用平安数字银行APP中的过程中，点击率较高的应用业务为财务服务、法律服务、采购服务、贷款服务和账户服务等。此时，由于应用业务中的财务服务、法律服务、采购服务、贷款服务和账户服务等各自有相应的评估得分，因此，可对各个应用业务类别对应的评估得分按照数值从大到小的顺序进行排序，得到第一排序列表，也可以对各个应用业务类别对应的评估得分按照数值从小到大的顺序进行排序，得到第二排序列表。通过第一排序列表或第二排序列表，能够清晰地获取到用户A点击率较高的应用业务排序情况。同样地，基于用户的历史行为数据，通过多业务多任务学习模型，能够预测得到平安数字银行APP中各个应用业务下的子业务类别的评估得分，比如可以预测得到法律服务下的法规检索、案例检索、智能问答和法律计算器等子业务的评估得分，然后，可对各个子业务类别对应的评估得分按照数值从大到小的顺序进行排序，得到第三排序列表，或者，可对各个子业务类别对应的评估得分按照数值从小到大的顺序进行排序，得到第四排序列表。同样地，通过第三排序列表或第四排序列表，能够清晰地获取到用户A点击率较高的法律服务下的各个子业务的排序情况。

步骤S104，根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别。

本申请实施例中，在对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序之后，可根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别。

参照图8，图8是本申请实施例提供的根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别的步骤流程图，包括但不限于步骤S801至步骤S804。

步骤S801，选取第一排序列表中排序处于前N个的业务类别在相应展示界面进行展示；

步骤S802，或者，选取第二排序列表中排序处于后N个的业务类别在相应展示界面进行展示，N为正整数；

步骤S803，选取第三排序列表中排序处于前M个的子业务类别在相应展示界面进行展示；

步骤S804，或者，选取第四排序列表中排序处于后M个的子业务类别在相应展示界面进行展示，M为正整数。

本申请实施例中，可根据排序结果，将评估得分排在前的多个应用业务展示在应用软件相应的界面。同样地，可将应用业务下评估得分排在前的多个应用子业务展示在应用软件相应的界面。

示例性地，同样以平安数字银行APP为例，由于步骤S103已对平安数字银行APP中的多个应用业务进行了排序，此时，只需要选取第一排序列表中的前5个应用业务，比如为财务服务、法律服务、采购服务、贷款服务和账户服务，展示在平安数字银行APP的第一显示界面。而关于其他的应用业务，可隐藏在第一显示界面“更多”图标中，即当用户点击了“更多”图标，跳转的显示界面才能够显示其他的应用业务。同样地，比如对法律服务下的各个应用子业务也进行了相应地排序处理，此时，只需要选取排序列表中的前5个应用子业务，比如为法规检索、案例检索、智能问答、法律计算器和律师服务，展示在在平安数字银行APP的第二显示界面。通过这种显示方式，能够在有限的显示界面上尽可能地显示用户A最有可能点击的应用业务和应用子业务。

参照图9，图9为本申请实施例提供的在训练得到多业务多任务学习模型之后还可执行的步骤流程图，包括但不限于步骤S901至步骤S904。

步骤S901，获取与搜索关键词匹配的各个目标对象的第一排序结果；

步骤S902，通过预先训练的多业务多任务学习模型对各个目标对象进行预测，得到各个目标对象的评分结果；

步骤S903，根据评分结果，对第一排序结果进行修正，得到第二排序结果；

步骤S904，根据第二排序结果，在应用软件的相应展示界面展示各个目标对象。

本申请实施例中，基于用户的历史行为数据，通过训练好的多业务多任务学习模型，不仅可以预测得到用户最有可能点击的多个应用业务或者多个应用子业务，还能够应用在用户搜索流程的精排处理中。具体地，基于排序模型，获取与搜索关键词匹配的各个目标对象的第一排序结果，然后通过预先训练的多业务多任务学习模型对各个目标对象进行预测，得到各个目标对象的评分结果，再根据评分结果，对第一排序结果进行修正，得到第二排序结果。最后根据第二排序结果，在应用软件的相应展示界面展示各个目标对象。

示例性地，同样以平安数字银行APP为例，参照图10，图10是本申请实施例提供的第一排序结果的示例图。当用户输入“保险”搜索词时，通过排序模型处理之后，跳转的显示界面会相应展示与“保险”相匹配的多个目标对象，其中，目标对象包括应用业务及应用业务下的应用子业务。比如，显示界面中显示了企业保险产品及企业保险产品下的雇主安心保和小微企业保、保险服务下的保单和保险理赔、保险专区下的平安学平险、个人保险产品下的平安-驾乘全员意外险、平安-全家福、平安-交通工具意外等。其中，企业保险产品、保险服务、保险专区和个人保险产品为应用业务，雇主安心保和小微企业保为企业保险产品这一应用业务下的应用子业务。保单和保险理赔为保险服务这一应用业务下的应用子业务。平安学平险为保险专区这一应用业务下的应用子业务。平安-驾乘全员意外险、平安-全家福、平安-交通工具意外为个人保险产品这一应用业务下的应用子业务。然后，通过预先训练的多业务多任务学习模型对图图10中所示的各个应用业务和各个应用业务下的应用子业务进行预测，得到各个应用业务和各个应用业务下的各应用子业务的评分结果，再根据评分结果，对第一排序结果进行修正，得到第二排序结果。最后，根据第二排序结果，在应用软件的相应展示界面展示的各个目标对象如图11所示。

本申请实施例中，通过训练好的多业务多任务学习模型还能够应用于搜索结果的排序中。能够对排序模型处理的粗排结果进行修正，能够通过用户的历史行为数据获取用户兴趣偏好，从而在有限的显示界面展示与搜索词匹配的用户更可能感兴趣的应用业务和应用子业务。

请参阅图12，本申请实施例还提供一种目标对象的展示装置120，可以实现上述目标对象的展示方法，该装置包括：

收集模块121，用于收集得到输入特征，输入特征包括用户历史行为数据、用户属性数据、物品属性数据和上下文数据；

处理模块122，用于通过预先训练的多业务多任务学习模型对输入特征进行处理，预测得到应用软件中各个目标对象的评估得分，目标对象包括应用软件中的业务类别和业务类别下的子业务类别；

排序模块123，用于根据评估得分对各个业务类别进行排序及对各个业务类别下的子业务类别进行排序；

展示模块124，用于根据排序结果，在应用软件的相应展示界面展示各个业务类别和各个子业务类别。

该目标对象的展示装置的具体实施方式与上述目标对象的展示方法的具体实施例基本相同，在此不再赘述。

本申请实施例还提供了一种电子设备，电子设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述目标对象的展示方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。

请参阅图13，图13示意了另一实施例的电子设备的硬件结构，电子设备包括：

处理器1301，可以采用通用的CPU(Centra l Process i ngUn it，中央处理器)、微处理器、应用专用集成电路(App l i cat i onSpec i f i c I ntegratedCi rcu it，AS I C)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的技术方案；

存储器1302，可以采用只读存储器(ReadOn l yMemory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(RandomAccessMemory，RAM)等形式实现。存储器1302可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1302中，并由处理器1301来调用执行本申请实施例的目标对象的展示方法；

输入/输出接口1303，用于实现信息输入及输出；

通信接口1304，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WI F I、蓝牙等)实现通信；

总线1305，在设备的各个组件(例如处理器1301、存储器1302、输入/输出接口1303和通信接口1304)之间传输信息；

其中处理器1301、存储器1302、输入/输出接口1303和通信接口1304通过总线1305实现彼此之间在设备内部的通信连接。

本申请实施例还提供了一种存储介质，存储介质为计算机可读存储介质，该存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述目标对象的展示方法。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图中示出的技术方案并不构成对本申请实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-On ly Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序的介质。

以上参照附图说明了本申请实施例的优选实施例，并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本申请实施例的权利范围之内。

Claims

1.一种目标对象的展示方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在训练得到所述多业务多任务学习模型之后，所述方法还包括：

获取与搜索关键词匹配的各个目标对象的第一排序结果；

3.根据权利要求1所述的方法，其特征在于，根据所述评估得分对各个所述业务类别进行排序及对各个所述业务类别下的子业务类别进行排序包括：

4.根据权利要求3所述的方法，其特征在于，所述根据排序结果，在所述应用软件的相应展示界面展示各个所述业务类别和各个所述子业务类别，包括：

5.根据权利要求1所述的方法，其特征在于，预先训练所述多业务多任务学习模型包括：

基于用户历史行为数据，构建训练样本集；

确定损失函数；

6.根据权利要求5所述的方法，其特征在于，所述确定损失函数包括：

确定各个业务对应的权重和各个任务对应的权重；

获取各个业务下各个任务的样本空间；

计算各个业务下各个任务的损失函数；

7.根据权利要求6所述的方法，其特征在于，所述根据各个业务对应的权重、各个任务对应的权重、各个业务下各个任务的样本空间和各个业务下各个任务的损失函数，计算得到损失函数通过以下公式执行：

其中，

8.一种目标对象的展示装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。