CN116956204A - 多任务模型的网络结构确定方法、数据预测方法及装置 - Google Patents
多任务模型的网络结构确定方法、数据预测方法及装置 Download PDFInfo
- Publication number
- CN116956204A CN116956204A CN202310261645.XA CN202310261645A CN116956204A CN 116956204 A CN116956204 A CN 116956204A CN 202310261645 A CN202310261645 A CN 202310261645A CN 116956204 A CN116956204 A CN 116956204A
- Authority
- CN
- China
- Prior art keywords
- task
- prediction
- feature
- network
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000006243 chemical reaction Methods 0.000 claims description 53
- 238000000605 extraction Methods 0.000 claims description 36
- 238000012216 screening Methods 0.000 claims description 19
- 230000004927 fusion Effects 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 abstract description 22
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 230000000875 corresponding effect Effects 0.000 description 194
- 238000010586 diagram Methods 0.000 description 15
- 230000006399 behavior Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种多任务模型的网络结构确定方法、数据预测方法及装置,涉及人工智能技术领域。该方法包括:基于第一特征表示和第二特征表示之间的相关性,以及第一任务标签与第二任务标签之间的相关性,确定第一预测任务和第二预测任务之间的相关性系数;在相关性系数符合任务相关性要求的情况下,确定与第一预测任务和第二预测任务对应的候选多任务模型的网络结构。对第一预测任务和第二预测任务分配其对应的私有网络和共享网络,使得候选多任务模型能够通过提取多个任务的共性特征以及单个任务对应的个性特征,提升了进行任务预测的特征表示的细粒度和质量,提高了基于该网络结构训练得到的多任务模型在对多个任务进行预测时的准确度。
Description
技术领域
本申请实施例涉及人工智能技术领域,特别涉及一种多任务模型的网络结构确定方法、数据预测方法及装置。
背景技术
随着人工智能技术的发展,深度模型可以用于同时处理多个不同的任务,这样的深度模型即为多任务模型,目前多任务模型在推荐系统(例如:新闻推荐系统、商品推荐系统等)中已经得到了广泛的应用。多任务模型中的任务众多,确定模型的网络结构使得多任务模型适用多个任务,是每个多任务模型所面临的首要问题。
相关技术中,会结合业务逻辑的情况,确定多任务模型的网络结构,例如:在广告推荐场景下,业务逻辑的情况可以理解为激活(预测点击率)和下单(也测转化率),激活和下单具有一定的关联,因此在多任务模型中,可设计一个共享网络层,同时学习预测点击率和预测转化率的任务。
然而,基于业务逻辑对多任务模型的网络结构的确定方法主观性较强,无法确保确定的多任务模型的预测结果的准确性。
发明内容
本申请实施例提供了一种多任务模型的网络结构确定方法、数据预测方法及装置,能够根据多个任务之间的相关性确定多任务模型的网络结构,确保得到的多任务模型在多个任务上的预测准确性,所述技术方案如下:
一方面,提供了一种多任务模型的网络结构确定方法,所述方法包括:
获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据,所述第一样本数据标注有第一任务标签,所述第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果;
通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示;
基于所述第一特征表示和所述第二特征表示之间的相关性,以及所述第一任务标签与所述第二任务标签之间的相关性,确定所述第一预测任务和所述第二预测任务之间的相关性系数;
在所述相关性系数符合任务相关性要求的情况下,确定与所述第一预测任务和所述第二预测任务对应的候选多任务模型的网络结构;
其中,所述候选多任务模型的网络结构中包括候选共享专家网络、所述第一预测任务对应的候选第一专家网络和候选第一门控网络、所述第二预测任务对应的候选第二专家网络和候选第二门控网络,所述候选共享专家网络用于将输出的特征表示应用于所述第一预测任务和所述第二预测任务。
另一方面,提供了一种多任务模型的数据预测方法,所述方法包括:
获取任务数据,所述任务数据用于在第一预测任务中进行数据预测,所述多任务模型用于执行包含所述第一预测任务的多个任务,所述多个任务之间符合任务相关性要求,所述多任务模型中包括共享专家网络以及与所述第一预测任务对应的第一专家网络和第一门控网络,所述共享专家网络用于将输出的特征表示应用于所述多个任务;
通过所述第一专家网络和所述共享专家网络对所述任务数据进行特征提取,得到所述第一专家网络输出的第一特征表示和所述共享专家网络输出的共享特征表示;
通过所述第一门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第一特征表示进行融合,得到第一融合特征表示;
通过所述第一预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述第一预测任务对应的第一预测结果。
另一方面,提供了一种多任务模型的网络结构确定装置,所述装置包括:
获取模块,用于获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据,所述第一样本数据标注有第一任务标签,所述第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果;
提取模块,用于通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示;
确定模块,用于基于所述第一特征表示和所述第二特征表示之间的相关性,以及所述第一任务标签与所述第二任务标签之间的相关性,确定所述第一预测任务和所述第二预测任务之间的相关性系数;
所述确定模块,还用于在所述相关性系数符合任务相关性要求的情况下,确定与所述第一预测任务和所述第二预测任务对应的候选多任务模型的网络结构;
其中,所述候选多任务模型的网络结构中包括候选共享专家网络、所述第一预测任务对应的候选第一专家网络和候选第一门控网络、所述第二预测任务对应的候选第二专家网络和候选第二门控网络,所述候选共享专家网络用于将输出的特征表示应用于所述第一预测任务和所述第二预测任务。
另一方面,提供了一种多任务模型的数据预测装置,所述装置包括:
数据获取模块,用于获取任务数据,所述任务数据用于在第一预测任务中进行数据预测,所述多任务模型用于执行包含所述第一预测任务的多个任务,所述多个任务之间符合任务相关性要求,所述多任务模型中包括共享专家网络以及与所述第一预测任务对应的第一专家网络和第一门控网络,所述共享专家网络用于将输出的特征表示应用于所述多个任务;
特征提取模块,用于通过所述第一专家网络和所述共享专家网络对所述任务数据进行特征提取,得到所述第一专家网络输出的第一特征表示和所述共享专家网络输出的共享特征表示;
特征调整模块,用于通过所述第一门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第一特征表示进行融合,得到第一融合特征表示;
数据预测模块,用于通过所述第一预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述第一预测任务对应的第一预测结果。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述实施例中任一所述多任务模型的网络结构确定方法或者数据预测方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述实施例中任一所述的多任务模型的网络结构确定方法或者数据预测方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的多任务模型的网络结构确定方法或者数据预测方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过多个样本数据和多个样本数据分别对应的任务标签,获取多个任务之间的相关性系数,在多个任务中的第一预测任务和第二预测任务之间符合任务相关性条件的情况下,确定候选多任务模型的网络结构。一方面,候选多任务模型的网络结构是在已知任务相关性的基础上进行确定的,确保该网络结构的合理性;另一方面,对第一预测任务和第二预测任务分别分配其对应的私有网络和共享网络,使得候选多任务模型能够通过提取多个任务对应的共性特征以及单个任务对应的个性特征,提升了进行任务预测的特征表示的细粒度和质量,最终提高了基于该网络结构训练得到的多任务模型在对多个任务进行预测时的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的实施环境示意图;
图2是本申请一个示例性实施例提供的多任务模型的网络结构确定方法的流程图;
图3是本申请一个示例性实施例提供的相关性矩阵的示意图;
图4是本申请一个示例性实施例提供的候选多任务模型的网络结构示意图;
图5是本申请另一个示例性实施例提供的候选多任务模型的网络结构示意图;
图6是本申请又一个示例性实施例提供的候选多任务模型的网络结构示意图;
图7是本申请另一个示例性实施例提供的多任务模型的网络结构确定方法的流程图;
图8是本申请一个示例性实施例提供的多任务模型的数据预测方法的流程图;
图9是本申请一个示例性实施例提供的多任务模型的网络结构确定装置的结构框图;
图10是本申请一个示例性实施例提供的多任务模型的数据预测装置的结构框图;
图11是本申请一个示例性实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中术语“第一”、“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
相关技术中,会结合业务逻辑的情况,确定多任务模型的网络结构,例如:在广告推荐场景下,业务逻辑的情况可以理解为激活(预测点击率)和下单(也测转化率),激活和下单具有一定的关联,因此在多任务模型中,可设计一个共享网络层,同时学习预测点击率和预测转化率的任务。然而,基于业务逻辑对多任务模型的网络结构的确定方法主观性较强,无法确保确定的多任务模型的预测结果的准确性。
本申请实施例提供了一种多任务模型的网络结构确定方法,通过多个样本数据和多个样本数据分别对应的任务标签,获取多个任务之间的相关性系数,在多个任务中的第一预测任务和第二预测任务之间符合任务相关性条件的情况下,确定候选多任务模型的网络结构。一方面,候选多任务模型的网络结构是在已知任务相关性的基础上进行确定的,确保该网络结构的合理性;另一方面,对第一预测任务和第二预测任务分别分配其对应的私有网络和共享网络,使得候选多任务模型能够通过提取多个任务对应的共性特征以及单个任务对应的个性特征,提升了进行任务预测的特征表示的细粒度和质量,最终提高了基于该网络结构训练得到的多任务模型在对多个任务进行预测时的准确度。
根据本申请实施例提供的多任务模型的网络结构确定方法,可在模型的训练之前确定待训练的候选多任务模型的网络结构,从而训练得到可用于进行数据预测的多任务模型,该多任务模型可应用于电商场景、新闻场景、视频场景等多种场景下的推荐系统中,以电商场景下的推荐系统为例进行说明,通过本申请实施例提供的多任务模型可针对目标推荐对象,预测其对于多个商品的点击率、浏览时间、点击转化率等,从而基于多任务模型的预测结果对多个商品进行筛选和推荐排序,将多个置信度(即目标推荐对象最有可能下单)较高的商品推荐给目标推荐对象,提高商品的成交量。需要进行说明的是,上述对应用场景的举例仅为示意性的说明,本申请实施例对多任务模型的网络结构确定方法的应用场景不加以限定。
图1是本申请一个示例性实施例提供的实施环境示意图,如图1所示,该实施环境中涉及终端110、服务器120,终端110和服务器120之间通过通信网络130连接。其中,通信网络130可以是有限网络,还可以是无线网络,本申请实施例对此不加以限定。
在一些可选的实施例中,终端110中安装和运行有目标应用程序。该目标应用程序可以实现为购物应用程序、新闻应用程序、即时通讯应用程序、金融应用程序、游戏应用程序等中的任意一种,本申请实施例对此不加以限定。可选地,该目标应用程序提供有推荐系统,该推荐系统可实现为广告推荐系统、商品推荐系统、新闻推荐系统、视频推荐系统等中的至少一种。
在一些可选的实施例中,服务器120用于为终端110中安装的目标应用程序中的推荐系统提供后台服务。示意性的,服务器120可从终端110中获取标注有任务标签的多个样本数据;或者,服务器120从其他终端中获取该多个样本数据;或者,服务器120中存储有该多个样本数据。服务器120获取得到该多个样本数据后,根据多个样本数据和多个样本数据分别对应的任务标签,获取多个任务之间的相关性系数,并在多个任务中的第一预测任务和第二预测任务对应的相关性系数符合任务相关性条件的情况下,确定与第一预测任务和第二预测任务对应的候选多任务模型的网络结构。可选地,服务器120在确定候选多任务模型的网络结构之后,可获取候选多任务模型对应的训练数据,对候选多任务模型进行训练,从而得到可用于进行数据预测的多任务模型。
服务器120得到该多任务模型后,将该多任务模型发送至终端110,终端110能够基于该多任务模型为终端110中安装的推荐系统提供推荐排序服务;或者,该多任务模型设置在服务器120中,服务器120从终端110中获取需要进行数据预测的任务数据后,基于该多任务模型得到该任务数据的预测结果,并将该预测结果发送至终端110处。
值得注意的是,服务器120能够是独立的物理服务器,也能够是多个物理服务器构成的服务器集群或者分布式系统,还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模型应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。可选地,服务器120还可以实现为区块链系统中的节点。
需要进行说明的是,本申请在收集用户的相关数据(例如:样本数据)之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的,且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
结合上述介绍和实施环境,图2是本申请实施例提供的一种多任务模型的网络结构确定方法的流程图,该方法可以由服务器或者终端执行,也可以由服务器和终端共同执行,本申请实施例中,以该方法由服务器执行为例进行说明,如图2所示,该方法包括:
步骤201,获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据。
其中,第一样本数据标注有第一任务标签,第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果。
可选地,第一样本数据中样本数据的数量可以是一个,也可以是多个;第二样本数据中样本数据的数量可以是一个,也可以是多个。
上述样本数据(包括第一样本数据和第二样本数据)为与预测任务的应用场景相关的数据,其中预测任务的应用场景包括电商场景、新闻推荐场景等。
示意性的,以电商场景为例进行说明,样本数据可实现为对象数据(如对象的性别、年龄、位置、历史订单数据等对象属性)、商品数据(如商品类目、品牌、材质、价格、历史销量等商品详情)、对象历史行为数据(如对象对商品的历史点击、历史购买、历史收藏等历史交互行为)、上下文数据(如当前时间、当前对象使用的设备信息、当前用户的地理位置等实时数据)等中的至少一种。
以新闻推荐场景为例进行说明,样本数据可实现为对象数据(如对象的性别、年龄、位置等对象属性)、新闻数据(如新闻标题、正文内容、历史点击量等新闻详情)、对象历史行为数据(如对象对新闻的历史点击、历史收藏、历史阅读时长、历史评论等历史交互行为)、上下文数据(如当前时间、当前对象使用的设备信息、当前用户的地理位置等实时数据)等中的至少一种。
示意性的,在电商场景下,预测任务包括:商品的点击率(Click Through Rate,CTR)预测任务、商品的点击转化率(Conversion Rate,CVR)预测任务以及商品的收藏率预测任务、商品对应的页面停留时间预测任务等;在新闻推荐场景下,预测任务包括:新闻的点击率预测任务、新闻的观看时间预测任务等。
上述任务标签用于即为样本数据在指定任务中的实际结果,例如:在预测广告点击率任务中,某条广告对应的实际点击率即为该条广告(即样本数据)的任务标签。
步骤202,通过第一预测任务对应的第一任务模型对第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对第二样本数据进行特征提取,得到第二特征表示。
可选地,第一任务模型和第二任务模型都是训练好的单任务模型,示意性的,第一任务模型可实现为广告点击率预测模型,则将与某广告相关的样本数据输入广告点击率预测模型后,输出该广告的预测点击率。
可选地,第一特征表示是指在第一预测任务的预测过程中,通过第一任务模型对第一样本数据进行提取后,得到的特征表示中重要度大于或者等于重要度阈值的特征表示;或者,得到的特征表示中重要度排名大于或者等于预设排名的特征表示。也即,第一特征表示是指第一样本数据中对第一预测任务的任务预测过程影响较大的特征表示。
可选地,第二特征表示是指在第二预测任务的预测过程中,通过第二任务模型对第二样本数据进行提取后,得到的特征表示中重要度大于或者等于重要度阈值的特征表示;或者,得到的特征表示中重要度排名大于或者等于预设排名的特征表示。也即,第二特征表示是指第二样本数据中对第二预测任务的任务预测过程影响较大的特征表示。
可选地,在第一特征表示和第二特征表示中表征的特征的数量大于1的情况下,得到第一特征表示和第二特征表示的步骤还包括:
通过第一预测任务对应的第一任务模型对第一样本数据进行特征提取,得到至少两个第一子特征表示;对至少两个第一子特征表示进行特征拼接,得到第一特征表示;通过第二预测任务对应的第二任务模型对第二样本数据进行特征提取,得到至少两个第二子特征表示;对至少两个第二子特征表示进行特征拼接,得到第二特征表示。
步骤203,基于第一特征表示和第二特征表示之间的相关性,以及第一任务标签与第二任务标签之间的相关性,确定第一预测任务和第二预测任务之间的相关性系数。
可选地,对第一特征表示和第二特征表示分别进行哈希值计算,确定第一特征表示对应的第一特征哈希值以及第二特征表示对应的第二特征哈希值;在第一特征哈希值和第二特征哈希值之间符合相似度条件的情况下,基于第一任务标签和第二任务标签之间的相关性,确定相关性系数。
其中,对特征表示进行哈希值计算的方法可通过MurmurHash算法。
示意性的,若第一特征表示或者第二特征表示是对多个特征表示进行拼接得到的特征表示,则特征哈希值的计算如下公式一所示:
公式一:featurehash
=MurmurHash(conCat(feature1,eature2,…,featuren))
其中,n为进行拼接的特征表示的数量,concat(feature1,feature2,…,featuren)是指将特征1至特征n进行拼接处理。
可选地,在第一特征哈希值和第二特征哈希值之间的差值小于或者等于预设阈值的情况下,基于第一任务标签和第二任务标签之间的皮尔逊系数,确定相关性系数。
示意性的,下面以第一特征哈希值和第二特征哈希值相同,基于第一任务标签和第二任务标签之间的皮尔逊系数,确定相关性系数为例进行说明:
第一预测任务实现为点击率预测任务、第二预测任务实现为点击转化率预测任务。假设第一样本数据包括:样本1(参考点击转化率1)、样本2(参考点击转化率2)、样本3(参考点击转化率3),其中,括号中内容表示的是样本的任务标签,即该组样本对应的任务为预测点击转化率任务;对于该组样本,将其输入到预测点击转化率的单任务模型中,提取该组样本分别对应的特征表示,对样本1、样本2、样本3分别对应的特征表示计算哈希值,得到的该组样本分别对应的特征哈希值1、特征哈希值2和特征哈希值3。
假设第二样本数据包括:样本4(参考点击率1)、样本5(参考点击率2)、样本6(参考点击率3),其中,括号中内容表示的是样本的任务标签,即该组样本对应的任务为预测点击率任务;对于该组样本,将其输入到预测点击率的单任务模型中,提取该组样本分别对应的特征表示,对样本4、样本5、样本6分别对应的特征表示计算哈希值,得到该组样本分别对应的特征哈希值4、特征哈希值5和特征哈希值6。
那么,在特征哈希值相同的情况下,若样本对应的标签相关性较高,则说明预测点击转化率任务和预测点击率任务之间的相关性很高。
假设特征哈希值1和特征哈希值4相同,特征哈希值3和特征哈希值6相同,则可确定样本数据对(样本1、样本4)、(样本3、样本6)。
本申请实施例中,相关性系数的计算公式如下公式二所示:
公式二:
其中,N为样本数据对的数量m,即为2,x的取值依次为预测转化率任务对应的标签值(参考点击转化率1和参考点击转化率3),y的取值依次为预测点击率任务对应的标签(参考点击率1和参考点击率3)。∑x表示参考点击转化率1和参考点击转化率3之和,∑y表示参考点击率1和参考点击率3之和,∑xy表示参考点击转化率1与参考点击率1的乘积+参考点击转化率3与参考点击率3的乘积。
步骤204,在相关性系数符合任务相关性要求的情况下,确定与第一预测任务和第二预测任务对应的候选多任务模型的网络结构。
可选地,在相关性系数的绝对值大于或者等于相关性阈值的情况下,确定相关性系数符合任务相关性要求。
可选地,上述第一预测任务和第二预测任务之间的相关性包括正相关和负相关,示意性的,当任务1和任务2之间的相关性系数指示正值较大(例如:0.7),则任务1和任务2呈现的是较为正相关的关系;当任务1和任务2之间的相关性系数指示负值较大(例如:-0.7),则任务1和任务2呈现的是较为负相关的关系。
其中,候选多任务模型的网络结构中包括候选共享专家网络、第一预测任务对应的候选第一专家网络和候选第一门控网络、第二预测任务对应的候选第二专家网络和候选第二门控网络,候选共享专家网络用于将输出的特征表示应用于第一预测任务和第二预测任务。
示意性的,通过计算多个任务中任意两个任务之间的相关性系数,可确定所有任务之间的相关性系数的邻接矩阵,请参考图3,其示出了一种相关性系数的邻接矩阵示意图,如图3所示:
在相关性矩阵300中,任务9和任务11之间的相关性系数为-0.58,呈现比较负相关的关系;任务7和任务12之间的相关性系数为0.45,呈现比较正相关的关系;若相关性阈值为0.4,则任务9和任务11之间的相关性系数的绝对值大于或者等于相关性阈值,对任务9和任务11进行候选多任务模型的网络结构的确定;并且,任务7和任务12之间的相关性系数的绝对值也大于或者等于相关性阈值,对任务7和任务12进行候选多任务模型的网络结构的确定。
示意性的,在电商场景下,以任务7(即第一预测任务)实现为商品的点击率预测任务、任务12(即第二预测任务)实现为商品的点击转化率预测任务为例,上述第一预测网络输出的第一预测结果用于表征该商品的点击率,第二预测网络输出的第一预测结果用于表征该商品的点击转化率(例如:点击商品后购买该商品的概率)。
请参考图4,其示出了一种候选多任务模型的网络结构示意图,如图4所示,候选多任务模型401中包括输入层网络402、共享专家网络403、第一专家网络404、第二专家网络405、第一门控网络406、第二门控网络407、第一预测网络408和第二预测网络409,候选多任务模型401用于执行任务7和任务12。
在一些实施例中,在第一预测任务和第二预测任务之间不符合任务相关性要求的情况下,可通过单个专家网络对任务结果进行预测。
可选地,在第一预测任务和第二预测任务之间的相关性系数的绝对值小于相关性阈值的情况下,确定第一预测任务和第二预测任务之间不符合任务相关性要求。请参考图5,其示出了另一种候选多任务模型的模型结构示意图,如图5所示,候选多任务模型501中包括输入层网络502、第一专家网络503、第二专家网络504、第一预测网络505和第二预测网络506,候选多任务模型501用于执行第一预测任务和第二预测任务。
需要进行说明的是:
(一)图4展示的是两个任务符合任务相关性要求时候选多任务模型的网络结构示意图,图5展示的是两个任务不符合任务相关性要求时候选多任务模型的网络结构示意图,实际上,若候选多任务模型为用于执行大于两个任务的模型时,例如:任务1、任务2和任务3,那么可能存在其中仅有一对任务或者两对任务符合任务相关性要求的情况,以任务1和任务2符合任务相关性要求,任务1和任务3不符合任务相关性要求、任务2和任务3不符合相关性要求为例进行说明,则此时候选多任务模型的网络结构可如图6所示的候选多任务模型601,其中,任务1对应第一专家网络602、任务2对应第二专家网络603、任务3对应第三专家网络604、任务1和任务2还共享有共享专家网络605。
对于候选多任务模型401、候选多任务模型501和候选多任务模型601的数据预测流程可参考步骤804中的数据预测流程,此处不再赘述。
(二)若任务1、任务2和任务3中的任意一对任务都满足任务相关性要求,那么候选多任务模型的网络结构包括如下情况中的至少一种:
情况一:候选多任务模型中包括任务1对应第一专家网络、任务2对应第二专家网络、任务3对应第三专家网络;任务1、任务2和任务3还共享有共享专家网络。
情况二:候选多任务模型中包括任务1对应第一专家网络,任务2对应第二专家网络、任务3对应第三专家网络;任务1和任务2共享有共享专家网络A、任务1和任务3共享有共享专家网络B、任务2和任务3共享有共享专家网络C。
在一些实施例中,确定候选多任务模型对应的网络结构后,还需要对候选多任务模型进行训练,得到用于进行多任务数据预测的多任务模型。
可选地,基于训练数据对对候选多任务模型进行训练,得到多任务模型。
其中,训练数据对中包括构成数据对的训练数据和多个参考任务结果,多个参考任务结果是训练数据在多个任务中的参考结果。
也即,多个参考任务结果为基于训练数据执行多个任务后,多个任务分别对应的参考任务执行结果。
示意性的,以多个任务实现为点击率预测任务(对应第一预测任务)和点击转化率预测任务(对应第二预测任务)为例进行说明,训练数据可实现为对象数据、商品数据、对象历史行为数据以及上下文数据等;且训练数据中标注有参考点击率和参考点击转化率。将训练数据输入候选多任务模型中,预测得到训练数据对应的预测点击率和预测点击转化率,通过预测点击率和参考点击率之间的差距以及参考点击转化率和预测点击转化率之间的差距对候选多任务模型进行更新,得到多任务模型。
在对候选多任务模型进行训练时,可根据预测点击率和参考点击率之间的差距,确定第一损失;根据参考点击转化率和预测点击转化率之间的差距,确定第二损失,以最小化第一损失和第二损失之间的加权和为目标,对候选多任务模型的参数进行更新;或者,以最小化第一损失为目标,对候选多任务模型中的候选共享专家网络、候选第一专家网络和候选第一门控网络的网络参数进行更新;同时,以最小化第二损失为目标,对候选多任务模型中的候选共享专家网络、候选第二专家网络和候选第二门控网络的网络参数进行更新。
综上所述,本申请实施例提供的候选多任务模型的网络结构确定方法通过多个样本数据和多个样本数据分别对应的任务标签,获取多个任务之间的相关性系数,在多个任务中的第一预测任务和第二预测任务之间符合任务相关性条件的情况下,确定候选多任务模型的网络结构。一方面,候选多任务模型的网络结构是在已知任务相关性的基础上进行确定的,确保该网络结构的合理性;另一方面,对第一预测任务和第二预测任务分别分配其对应的私有网络和共享网络,使得候选多任务模型能够通过提取多个任务对应的共性特征以及单个任务对应的个性特征,提升了进行任务预测的特征表示的细粒度和质量,最终提高了基于该网络结构训练得到的多任务模型在对多个任务进行预测时的准确度。
本申请实施例提供的方法,通过对特征进行哈希值计算,通过对比特征哈希值的相似度代替直接对比特征之间的相似度,提高了在相关性系数计算过程中的计算效率。
本申请实施例提供的方法,在对特征进行哈希值计算之前,对提取得到的多个特征进行拼接后再进行特征哈希值计算,减少了使用哈希算法的频率,进一步提高了在进行相关性系数计算过程中的计算效率。
在一些可选的实施例中,在确定第一特征表示或者第二特征表示时,需要第一样本数据或者第二样本数据提取得到的特征提取进行筛选,得到重要度较高的特征表示,从而提高计算得到的任务相关性系数的置信度。图7是本申请实施例提供的一种多任务模型的网络结构确定方法的流程图,该方法可以由服务器或者终端执行,也可以由服务器和终端共同执行,本申请实施例中,以该方法由服务器执行为例进行说明,如图7所示,该方法包括:
步骤701,获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据。
其中,第一样本数据标注有第一任务标签,第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果。
可选地,第一样本数据中样本数据的数量可以是一个,也可以是多个;第二样本数据中样本数据的数量可以是一个,也可以是多个。
步骤702,通过第一预测任务对应的第一任务模型对第一样本数据进行特征提取,得到多个第一候选特征表示;对多个第一候选特征表示进行重要度特征筛选,得到第一特征表示。
可选地,对多个第一候选特征表示进行重要度特征筛选,得到第一特征表示的方法包括以下方法中的至少一种:
方法一:基于AUC的评估方法。
AUC被定义为基准受试者工作特征曲线(Receiver Operating Characteristiccurve,ROC曲线)下与坐标轴围成的面积,该面积的数值不会大于1。
其中,AUC值表征的是正样本的预测结果大于负样本的预测结果的概率。
示意性的,从所有正样本中随机选取一个样本A,所有负样本中随机选取一个样本B,然后根据分类器对两个随机样本进行预测,把样本A预测为正类的概率为p1,把样本B预测为正类的概率为p0,p1>p0的概率即为AUC值。
可选地,第一样本数据中包括i个子样本数据,多个第一候选特征表示中包括w个第一候选特征表示,i为正整数,w为大于1的正整数。i个子样本数据各自对应有第一特征表示,则得到第一特征表示的步骤还包括:
对w个第一候选特征表示在第一预测任务中进行预测,得到i个子样本数据分别对应的基准预测任务结果;基于i个子样本数据分别对应的基准预测任务结果与i个子样本数分别对应的任务标签,确定基准受试者工作特征曲线下与坐标轴围成的面积AUC值;对w个候选特征表示中除第w-j个候选特征表示之外的特征表示在第一预测任务中进行预测,得到i个子样本数据分别对应的第w-j个预测任务结果,j小于或者等于w的正整数;基于i个子样本数据分别对应的基准预测任务结果与i个子样本数据分别对应的任务标签,确定第j个AUC值;根据第j个AUC值与基准AUC值之间的差距,对w个候选特征表示进行重要度特征筛选,得到i个子样本数据分别对应的第一特征表示。
示意性的,以第一预测任务实现为点击率预测任务为例进行说明,则i个子样本数据为:样本1(参考点击转化率1)、样本2(参考点击转化率2)、样本3(参考点击转化率3),其中,括号中内容表示的是样本的标签,即该组样本对应的任务为预测点击转化率任务;对于该组样本,将其输入到预测点击转化率的单任务模型中,提取该组样本分别对应的全量特征表示(假设为200个特征表示),对该全量特征表示进行预测,得到预测点击转化率1、预测点击转化率2、预测点击转化率3,将参考点击转化率1、参考点击转化率2、参考点击转化率3以及预测点击转化率1、预测点击转化率2、预测点击转化率3输入AUC计算模块中,计算该组样本对应的AUC值,将该AUC值作为基准AUC值。
然后,依次减少样本对应的特征表示,例如:减少200个特征表示中的第1个特征表示,对剩下的199个特征表示进行预测,得到该组样本分别对应的预测点击转化率,将其与该组样本分别对应的参考点击转化率输入AUC计算模块中,输出第一AUC值;同理,减少200个特征表示中的第2个特征表示,对剩下的199个特征表示进行预测,得到第二AUC值;最终计算得到200个AUC值。
计算这200个AUC值对基准AUC值的抬升降低的情况,将使得基准AUC值降低最多的20个AUC值对应的特征表示进行拼接得到的特征表示,即为该组样本对应的目标特征表示。
或者,使得基准AUC值降低最多的AUC值对应的特征表示即为该组样本对应的目标特征表示。
或者,将使得基准AUC降低值大于或者等于预设阈值的20个特征表示进行拼接得到的特征表示,即为该组样本对应的目标特征表示。
方法二:基于压缩与激励网络(Squeeze-and-Excitation Networks,SeNet)的评估方法。
可选地,第一预测任务对应的第一任务模型中包括特征权重层,特征权重层用于在模型的预测过程中确定提取得到的特征的权重。则得到第一特征表示的步骤还包括:
将多个候选特征表示输入特征权重层,输出多个候选特征表示分别对应的权重;基于多个候选特征表示分别对应的权重,对多个候选特征表示进行重要度特征筛选,得到第一特征表示。
以第一预测任务实现为点击率预测任务为例进行说明,在点击率预测模型中增加SeNet网络层(即为特征权重层),在通过点击率预测模型提取样本数据对应的w个候选特征表示之后,通过SeNet网络层计算w个候选特征表示分别对应的权重,将w个候选特征表示中权重最高的候选特征表示作为目标特征表示。
或者,将w个候选特征表示中权重最高的g个候选特征进行拼接,得到目标数据特征表示。
或者,将w个候选特征表示中权重大于或者等于置信度阈值的g个特征表示进行拼接,得到目标数据特征表示。
其中,g为大于1的正整数。
步骤703,通过第二预测任务对应的第二任务模型对第二样本数据进行特征提取,得到多个第二候选特征表示;对多个第二候选特征表示进行重要度特征筛选,得到第二特征表示。
其中,确定第二特征表示的具体方法可参考步骤702,此处不再赘述。
步骤704,对第一特征表示和第二特征表示分别进行哈希值计算,确定第一特征表示对应的第一特征哈希值以及第二特征表示对应的第二特征哈希值。
其中,对特征表示进行哈希值计算的方法可通过MurmurHash算法。
示意性的,假设第一样本数据或者第二样本数据中包括3个样本数据,则需要对这3个样本数据分别对应的第一特征表示进行哈希值计算,确定这3个样本数据分别对应的特征哈希值。
步骤705,在第一特征哈希值和第二特征哈希值之间符合相似度条件的情况下,基于第一任务标签和第二任务标签之间的相关性,确定相关性系数。
可选地,在第一特征哈希值和第二特征哈希值之间的差值小于或者等于预设阈值的情况下,基于第一任务标签和第二任务标签之间的皮尔逊系数,确定相关性系数。
示意性的,在第一特征哈希值和第二特征哈希值之间相同的情况下,基于第一任务标签和第二任务标签之间的皮尔逊系数,确定相关性系数。
步骤706,在相关性系数符合任务相关性要求的情况下,确定与第一预测任务和第二预测任务对应的候选多任务模型的网络结构。
可选地,在相关性系数的绝对值大于或者等于相关性阈值的情况下,确定相关性系数符合任务相关性要求。
可选地,上述第一预测任务和第二预测任务之间的相关性包括正相关和负相关,示意性的,当任务1和任务2之间的相关性系数指示正值较大(例如:0.7),则任务1和任务2呈现的是较为正相关的关系;当任务1和任务2之间的相关性系数指示负值较大(例如:-0.7),则任务1和任务2呈现的是较为负相关的关系。
其中,候选多任务模型的网络结构中包括候选共享专家网络、第一预测任务对应的候选第一专家网络和候选第一门控网络、第二预测任务对应的候选第二专家网络和候选第二门控网络,候选共享专家网络用于将输出的特征表示应用于第一预测任务和第二预测任务。
综上所述,本申请实施例提供的方法通过多个样本数据和多个样本数据分别对应的任务标签,获取多个任务之间的相关性系数,在多个任务中的第一预测任务和第二预测任务之间符合任务相关性条件的情况下,确定候选多任务模型的网络结构。一方面,候选多任务模型的网络结构是在已知任务相关性的基础上进行确定的,确保该网络结构的合理性;另一方面,对第一预测任务和第二预测任务分别分配其对应的私有网络和共享网络,使得候选多任务模型能够通过提取多个任务对应的共性特征以及单个任务对应的个性特征,提升了进行任务预测的特征表示的细粒度和质量,最终提高了基于该网络结构训练得到的多任务模型在对多个任务进行预测时的准确度。
本申请实施例提供的方法,通过特征重要度筛选,筛选重要度较高的特征作为进行特征比对的特征,一方面,减少了需要进行对比的特征量,提高了相关系系数的计算效率;另一方面,在计算相关性系数时,引入特征重要度筛选的过程,该重要度筛选过程包括AUC评估过程和特征权重层筛选过程中的至少一种,提高了筛选得到的特征的置信度,从而增加了计算得到的相关性系数的可信度。
图8是本申请实施例提供的一种多任务模型的数据预测方法的流程图,该方法可以由服务器或者终端执行,也可以由服务器和终端共同执行,本申请实施例中,以该方法由服务器执行为例进行说明,如图8所示,该方法包括:
步骤801,获取任务数据。
其中,任务数据用于在第一预测任务中进行数据预测,多任务模型用于执行包含第一预测任务的多个任务,多个任务之间符合任务相关性要求,多任务模型中包括共享专家网络以及与第一预测任务对应的第一专家网络和第一门控网络,共享专家网络用于将输出的特征表示应用于多个任务。
可选地,任务数据还用于在除第一预测任务之外的多个任务中进行预测,示意性的,将任务数据输入多任务模型中,可输出得到多个不同的数据预测结果,这多个不同的数据预测结果即为多个任务分别对应的任务执行结果。
可选地,任务数据与多任务模型的应用场景相关联,其中多任务模型的应用场景包括电商场景、新闻推荐场景等。
示意性的,以电商场景为例进行说明,任务数据可实现为对象数据(如对象的性别、年龄、位置、历史订单数据等对象属性)、商品数据(如商品类目、品牌、材质、价格、历史销量等商品详情)、对象历史行为数据(如对象对商品的历史点击、历史购买、历史收藏等历史交互行为)、上下文数据(如当前时间、当前对象使用的设备信息、当前用户的地理位置等实时数据)等中的至少一种。
以新闻推荐场景为例进行说明,任务数据可实现为对象数据(如对象的性别、年龄、位置等对象属性)、新闻数据(如新闻标题、正文内容、历史点击量等新闻详情)、对象历史行为数据(如对象对新闻的历史点击、历史收藏、历史阅读时长、历史评论等历史交互行为)、上下文数据(如当前时间、当前对象使用的设备信息、当前用户的地理位置等实时数据)等中的至少一种。
需要进行说明的是,上述对多任务模型的应用场景和任务数据的举例仅为示意性的说明,本申请实施例对多任务模型的应用场景和任务数据不加以限定。
可选地,多个任务中还包含第二预测任务,则多个任务之间符合任务相关性要求包括第一预测任务和第二预测任务之间符合任务相关性要求。
其中,第二预测任务为多个任务中除第一预测任务之外的任一预测任务。
可选地,第一预测任务和第二预测任务存在正相关关系和负相关关系,当第一预测任务和第二预测任务呈现正相关关系时,相关性系数的取值为正,当相关性系数取值为正时,相关性系数越大,第一预测任务和第二预测任务越正相关;当第一预测任务和第二预测任务呈现负相关关系时,相关性系数的取值为负,当相关性系数取值为负时,相关性系数越小,第一预测任务和第二预测任务越负相关。
可选地,第一预测任务和第二预测任务之间的相关性系数的绝对值大于或者等于相关性阈值,即确定第一预测任务和第二预测任务之间符合任务相关性要求。
示意性的,在电商场景下,包括多个预测任务,例如:商品的点击率(ClickThrough Rate,CTR)预测任务、商品的点击转化率(Conversion Rate,CVR)预测任务以及商品的收藏率预测任务、商品对应的页面停留时间预测任务等;在这多个预测任务中,商品的点击率预测任务和商品的点击转化率预测任务之间的相关性系数的绝对值大于或者等于相关性阈值,则这两个预测任务可作为多任务模型中的第一预测任务和第二预测任务。
上述共享专家网络用于对输入网络的数据进行特征提取,得到用于表征多个任务之间的共性的通用特征表示;第一专家网络用于对输入网络的数据进行特征提取,得到用于表征第一预测任务的个性的特征表示。可选地,共享专家网络和第一专家网络可实现为全连接网络等特征提取网络,本申请实施例对此不加以限定。
上述第一门控网络用于对共享专家网络输出的特征表示进行特征调整,得到应用于第一预测任务的特征表示。
可选地,上述多任务模型中还包括第二预测任务对应的第二专家网络和第二门控网络,则上述多任务模型中的共享专家网络用于将输出的特征表示应用于第一预测任务和第二预测任务。
在一些实施例中,若多个任务中包含除第一预测任务和第二预测任务之外的第三预测任务,在第一预测任务、第二预测任务和第三预测任务之中任意两个预测任务之间的相关性系数的绝对值大于或者等于相关性阈值的情况下:
多任务模型中包括第一预测任务对应的第一专家网络和第一门控网络,第二预测任务对应的第二专家网络和第二门控网络,以及第三预测任务对应的第三专家网络和第三门控网络;多任务模型中的共享专家网络输出的特征表示应用于第一预测任务、第二预测任务和第三预测任务的结果预测中。
或者,多任务模型中包括第一预测任务对应的第一专家网络和第一门控网络,第二预测任务对应的第二专家网络和第二门控网络,以及第三预测任务对应的第三专家网络和第三门控网络;多任务模型中的共享专家网络包括第一共享网络、第二共享网络和第三共享网络,其中,第一共享网络输出的特征表示应用于第一预测任务和第二预测任务的结果预测中,第二共享网络输出的特征表示应用于第一预测任务和第三预测任务的结果预测中,第三共享网络输出的特征表示应用于第二预测任务和第三预测任务的结果预测中。
步骤802,通过第一专家网络和共享专家网络对任务数据进行特征提取,得到第一专家网络输出的第一特征表示和共享专家网络输出的共享特征表示。
其中,第一特征表示用于表征第一预测任务在任务数据上的个性化特征,共享特征表示用于表征第一预测任务与其他任务在任务数据上的共性特征。
可选地,多任务模型中还包括输入层网络,将任务数据输入多任务模型中,通过输入层网络对任务数据进行特征编码,得到任务数据对应的输入特征表示。
示意性的,在电商场景下,将对象数据、商品数据、对象历史行为数据以及上下文数据输入多任务模型,通过输入层网络生成用于表征对象数据的对象特征向量、用于表征商品数据的商品特征向量、用于表征对象历史行为数据的行为特征向量以及用于表征上下文数据的上下文特征向量;将生成的对象特征向量、商品特征向量、行为特征向量和上下文特征向量进行拼接,得到最终用于表征任务数据整体属性的输入特征表示。
在得到任务数据对应的输入特征表示之后,将输入特征表示输入第一专家网络中,对输入特征表示进行特征提取,得到第一特征表示;将输入特征表示输入共享专家网络中,对输入特征表示进行特征提取,得到共享特征表示。
在一些实施例中,任务数据还用于在第二预测任务中进行预测,那么,在通过第一专家网络对任务数据进行特征提取的同时,还包括:
通过第二专家网络对任务数据进行特征提取,得到第二专家网络输出的第二特征表示。
其中,第二特征表示用于表征第一预测任务在任务数据上的个性化特征;可选地,共享特征表示用于表征第一预测任务与第二预测任务在任务数据上的共性特征。
可选地,在得到任务数据对应的输入特征表示之后,将输入特征表示输入第二专家网络中,对输入特征表示进行特征提取,得到第二特征表示。
步骤803,通过第一门控网络对共享特征表示进行特征调整,并将调整得到的门控特征表示与第一特征表示进行融合,得到第一融合特征表示。
其中,共享特征表示虽然表征的是多个任务之间的共享,但共享特征表示对于多个任务的任务预测结果的影响程度是不同的,因此,可采用多个任务分别对应的门控网络对共享特征表示进行调整,得到多个任务分别对应的门控特征表示。
在得到任务数据对应的输入特征表示之后,还需要将该输入特征表示输入到多个任务分别对应的门控网络中。可选地,对共享特征表示进行特征调整的方法还包括:
将输入特征表示输入到第一预测任务对应的第一门控网络中,确定第一预测任务对应的第一特征权重,通过第一特征权重对共享特征表示进行加权,得到第一预测任务对应的门控特征表示;将第一预测任务对应的门控特征表示与第一特征表示进行融合,得到第一融合特征表示。
在一些实施例中,任务数据还用于在第二预测任务中进行预测,那么,在通过第一门控网络对共享特征表示进行特征调整的同时,还包括:
通过第二门控网络对共享特征表示进行特征调整,并将调整得到的门控特征表示与第二特征表示进行融合,得到第二融合特征表示。
可选地,将输入特征表示输入到第二预测任务对应的第二门控网络中,确定第二预测任务对应的第二特征权重,通过第二特征权重对共享特征表示进行加权,得到第二预测任务对应的门控特征表示;将第二预测任务对应的门控特征表示与第二特征表示进行融合,得到第二融合特征表示。
步骤804,通过第一预测任务对应的第一预测网络对第一融合特征表示进行数据预测,得到第一预测任务对应的第一预测结果。
其中,第一预测网络是第一预测任务对应的网络,用于对任务数据在第一预测任务中的任务执行结果进行预测。
在一些实施例中,任务数据还用于在第二预测任务中进行预测,那么通过第一预测任务对应的第一预测网络对第一融合特征表示进行数据预测的同时,还包括:
通过第二预测任务对应的第二预测网络对第二融合特征表示进行数据预测,得到第二预测任务对应的第二预测结果。
其中,第二预测网络是第二预测任务对应的网络,用于对任务数据在第二预测任务中的任务执行结果进行预测。
示意性的,在电商场景下,以第一预测任务实现为商品的点击率预测任务、第二预测任务实现为商品的点击转化率预测任务为例,通过点击率预测任务对应的第一预测网络对第一融合特征表示进行数据预测,得到点击率预测任务对应的预测点击率;通过点击转化率预测任务对应的第二预测网络对第二融合特征表示进行数据预测,得到点击率预测任务对应的预测点击转化率。
上述预测点击率用于表征商品的点击率,预测点击转化率用于表征商品的点击转化率(例如:点击商品后购买该商品的概率)。
请参考图4,其示出了一种候选多任务模型的网络结构示意图,通过该候选多任务模型训练得到多任务模型的网络结构不变,对输入其中的数据的预测流程进行说明:
将任务数据A输入到输入层网络402中,提取得到输入特征表示,将该输入特征表示分别输入共享专家网络403、第一专家网络404、第二专家网络405、第一门控网络406、第二门控网络407中;通过共享专家网络403提取输入特征表示中的共享特征表示、通过第一专家网络404提取输入特征表示中的第一特征表示、通过第二专家网络405提取输入特征表示中的第二特征表示、通过第一门控网络406确定第一权重,通过第二门控网络407确定第二权重;基于第一权重对共享特征表示进行加权,得到第一预测任务对应的门控特征表示,并将该门控特征表示和第一特征表示进行融合,得到第一融合特征表示,将第一融合特征表示输入到第一预测网络408中,输出任务数据A在第一预测任务上的任务执行结果;基于第二权重对共享特征表示进行加权,得到第二预测任务对应的门控特征表示,并将该门控特征表示和第二特征表示进行融合,得到第二融合特征表示,将第二融合特征表示输入到第二预测网络409中,输出任务数据A在第二预测任务上的任务执行结果。
在一些实施例中,在第一预测任务和第二预测任务之间不符合任务相关性要求的情况下,可通过单个专家网络对任务执行结果进行预测,示意性的,请参考图5,其示出了另一种候选多任务模型的模型结构示意图,过该候选多任务模型训练得到多任务模型的网络结构不变,对输入其中的数据的预测流程进行说明:
将任务数据B输入到输入层网络502中,提取得到输入特征表示,将该输入特征表示分别输入第一专家网络503和第二专家网络504中;通过第一专家网络503提取输入特征表示中的第一特征表示、通过第二专家网络504提取输入特征表示中的第二特征表示;将第一特征表示输入到第一预测网络505中,输出任务数据B在第一预测任务上的任务执行结果;将第二特征表示输入到第二预测网络506中,输出任务数据B在第二预测任务上的任务执行结果。
综上所述,本申请实施例提供的多任务模型的数据预测方法通过多任务模型中的第一专家网络和共享专家网络对任务数据进行特征提取,得到第一特征表示和共享特征表示,并通过第一门控网络对共享特征表示进行特征调整,从而将调整得到的门控调整表示与第一特征表示进行融合,得到第一融合特征表示,最后通过第一预测网络对第一融合特征表示进行数据预测,得到第一预测任务对应的预测结果。一方面,多任务模型中执行的多个任务是满足任务相关性要求的任务,即,本申请中的多任务模型是建立在已知任务相关性的基础上进行网络结构的确定的,确保了网络结构的确定得到的多任务模型的合理性;另一方面,在多个任务满足任务相关性要求的情况下,对指定任务分配其对应的私有网络和共享网络,使得多任务模型能够通过提取多个任务对应的共性特征以及指定任务对应的个性特征,并对其中的共性特征进行调整,最终提升了输入指定任务预测网络中的特征表示的细粒度和质量,提高了多任务模型在对多个任务进行预测时的准确度。
图9是本申请一个示例性实施例提供的多任务模型的网络结构确定装置的结构框图,如图9所示,该装置包括如下部分:
获取模块900,用于获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据,所述第一样本数据标注有第一任务标签,所述第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果;
提取模块910,用于通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示;
确定模块920,用于基于所述第一特征表示和所述第二特征表示之间的相关性,以及所述第一任务标签与所述第二任务标签之间的相关性,确定所述第一预测任务和所述第二预测任务之间的相关性系数;
所述确定模块920,还用于在所述相关性系数符合任务相关性要求的情况下,确定与所述第一预测任务和所述第二预测任务对应的候选多任务模型的网络结构;
其中,所述候选多任务模型的网络结构中包括候选共享专家网络、所述第一预测任务对应的候选第一专家网络和候选第一门控网络、所述第二预测任务对应的候选第二专家网络和候选第二门控网络,所述候选共享专家网络用于将输出的特征表示应用于所述第一预测任务和所述第二预测任务。
在一些实施例中,所述确定模块920,还用于对所述第一特征表示和所述第二特征表示分别进行哈希值计算,确定所述第一特征表示对应的第一特征哈希值以及所述第二特征表示对应的第二特征哈希值;所述确定模块920,还用于在所述第一特征哈希值和所述第二特征哈希值之间符合相似度条件的情况下,基于所述第一任务标签和所述第二任务标签之间的相关性,确定所述相关性系数。
在一些实施例中,所述提取模块910,用于通过所述第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到至少两个第一子特征表示;对所述至少两个第一子特征表示进行特征拼接,得到第一特征表示;所述提取模块910,用于通过所述第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到至少两个第二子特征表示;对所述至少两个第二子特征表示进行特征拼接,得到第二特征表示。
在一些实施例中,所述提取模块910,用于通过所述第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到多个第一候选特征表示;对所述多个第一候选特征表示进行重要度特征筛选,得到所述第一特征表示;所述提取模块910,用于通过所述第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到多个第二候选特征表示;对所述多个第二候选特征表示进行重要度特征筛选,得到所述第二特征表示。
在一些实施例中,所述第一样本数据中包括i个子样本数据,所述多个第一候选特征表示中包括w个第一候选特征表示,i为正整数,w为大于1的正整数;所述提取模块910,用于对所述w个第一候选特征表示在所述第一预测任务中进行预测,得到所述i个子样本数据分别对应的基准预测任务结果;所述提取模块910,用于基于所述i个子样本数据分别对应的基准预测任务结果与所述i个子样本数分别对应的任务标签,确定基准受试者工作特征曲线下与坐标轴围成的面积AUC值;所述提取模块910,用于对所述w个候选特征表示中除第w-j个候选特征表示之外的特征表示在所述第一预测任务中进行预测,得到所述i个子样本数据分别对应的第w-j个预测任务结果,j小于或者等于w的正整数;所述提取模块910,用于基于所述i个子样本数据分别对应的基准预测任务结果与所述i个子样本数据分别对应的任务标签,确定第j个AUC值;所述提取模块910,用于根据所述第j个AUC值与所述基准AUC值之间的差距,对所述w个候选特征表示进行重要度特征筛选,得到所述i个子样本数据分别对应的第一特征表示。
在一些实施例中,所述第一预测任务对应的第一任务模型中包括特征权重层,所述特征权重层用于在模型的预测过程中确定提取得到的特征的权重;所述提取模块910,用于将所述多个候选特征表示输入所述特征权重层,输出所述多个候选特征表示分别对应的权重;所述提取模块910,用于基于所述多个候选特征表示分别对应的权重,对所述多个候选特征表示进行重要度特征筛选,得到所述第一特征表示。
综上所述,本申请实施例提供的多任务模型的网络结构确定装置通过多个样本数据和多个样本数据分别对应的任务标签,获取多个任务之间的相关性系数,在多个任务中的第一预测任务和第二预测任务之间符合任务相关性条件的情况下,确定候选多任务模型的网络结构。一方面,候选多任务模型的网络结构是在已知任务相关性的基础上进行确定的,确保该网络结构的合理性;另一方面,对第一预测任务和第二预测任务分别分配其对应的私有网络和共享网络,使得候选多任务模型能够通过提取多个任务对应的共性特征以及单个任务对应的个性特征,提升了进行任务预测的特征表示的细粒度和质量,最终提高了基于该网络结构训练得到的多任务模型在对多个任务进行预测时的准确度。
图10是本申请一个示例性实施例提供的多任务模型的数据预测装置的结构框图,如图10所示,该装置包括如下部分:
数据获取模块1000,用于获取任务数据,所述任务数据用于在第一预测任务中进行数据预测,所述多任务模型用于执行包含所述第一预测任务的多个任务,所述多个任务之间符合任务相关性要求,所述多任务模型中包括共享专家网络以及与所述第一预测任务对应的第一专家网络和第一门控网络,所述共享专家网络用于将输出的特征表示应用于所述多个任务;
特征提取模块1010,用于通过所述第一专家网络和所述共享专家网络对所述任务数据进行特征提取,得到所述第一专家网络输出的第一特征表示和所述共享专家网络输出的共享特征表示;
特征调整模块1020,用于通过所述第一门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第一特征表示进行融合,得到第一融合特征表示;
数据预测模块1030,用于通过所述第一预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述第一预测任务对应的第一预测结果。
在一些实施例中,所述多个任务中包含第二预测任务,所述任务数据还用于在第二预测任务中进行数据预测,所述多任务模型中包括所述第二预测任务对应的第二专家网络和第二门控网络;所述特征提取模块1010,用于通过所述第二专家网络对所述任务数据进行特征提取,得到所述第二专家网络输出的第二特征表示;所述特征调整模块1020,用于通过所述第二门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第二特征表示进行融合,得到第二融合特征表示;所述数据预测模块1030,用于通过所述第二预测任务对应的第二预测网络对所述第二融合特征表示进行数据预测,得到所述第二预测任务对应的第二预测结果。
在一些实施例中,所述多个任务包括点击率预测任务和点击转化率预测任务;所述数据预测模块1030,用于通过所述点击率预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述点击率预测任务对应的预测点击率;所述数据预测模块1030,用于通过所述点击转化率预测任务对应的第二预测网络对所述第二融合特征表示进行数据预测,得到所述点击率预测任务对应的预测点击转化率。
综上所述,本申请实施例提供的多任务模型的数据预测装置通过多任务模型中的第一专家网络和共享专家网络对任务数据进行特征提取,得到第一特征表示和共享特征表示,并通过第一门控网络对共享特征表示进行特征调整,从而将调整得到的门控调整表示与第一特征表示进行融合,得到第一融合特征表示,最后通过第一预测网络对第一融合特征表示进行数据预测,得到第一预测任务对应的预测结果。一方面,多任务模型中执行的多个任务是满足任务相关性要求的任务,即,本申请中的多任务模型是建立在已知任务相关性的基础上进行网络结构的确定的,确保了网络结构的确定得到的多任务模型的合理性;另一方面,在多个任务满足任务相关性要求的情况下,对指定任务分配其对应的私有网络和共享网络,使得多任务模型能够通过提取多个任务对应的共性特征以及指定任务对应的个性特征,并对其中的共性特征进行调整,最终提升了输入指定任务预测网络中的特征表示的细粒度和质量,提高了多任务模型在对多个任务进行预测时的准确度。
需要说明的是:上述实施例提供的多任务模型的网络结构确定装置或者数据预测装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的多任务模型的网络结构确定装置与多任务模型的网络结构确定方法实施例、多任务模型的数据预测装置和多任务模型的数据预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图11示出了本申请一个示例性实施例提供的计算机设备1100的结构框图。该计算机设备1100可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。计算机设备1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,计算机设备1100包括有:处理器1101和存储器1102。
处理器1101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1101可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1101还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1102中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1101所执行以实现本申请中方法实施例提供的多任务模型的网络结构确定方法或者数据预测方法。
在一些实施例中,计算机设备1100还可选包括其他组件,本领域技术人员可以理解,图11中示出的结构并不构成对计算机设备1100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述实施例中任一所述的多任务模型的网络结构确定方法或者数据预测方法。
可选的,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (14)
1.一种多任务模型的网络结构确定方法,其特征在于,所述方法包括:
获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据,所述第一样本数据标注有第一任务标签,所述第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果;
通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示;
基于所述第一特征表示和所述第二特征表示之间的相关性,以及所述第一任务标签与所述第二任务标签之间的相关性,确定所述第一预测任务和所述第二预测任务之间的相关性系数;
在所述相关性系数符合任务相关性要求的情况下,确定与所述第一预测任务和所述第二预测任务对应的候选多任务模型的网络结构;
其中,所述候选多任务模型的网络结构中包括候选共享专家网络、所述第一预测任务对应的候选第一专家网络和候选第一门控网络、所述第二预测任务对应的候选第二专家网络和候选第二门控网络,所述候选共享专家网络用于将输出的特征表示应用于所述第一预测任务和所述第二预测任务。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征表示和所述第二特征表示之间的相关性,以及所述第一任务标签与所述第二任务标签之间的相关性,确定所述第一预测任务和所述第二预测任务之间的相关性系数,包括:
对所述第一特征表示和所述第二特征表示分别进行哈希值计算,确定所述第一特征表示对应的第一特征哈希值以及所述第二特征表示对应的第二特征哈希值;
在所述第一特征哈希值和所述第二特征哈希值之间符合相似度条件的情况下,基于所述第一任务标签和所述第二任务标签之间的相关性,确定所述相关性系数。
3.根据权利要求1或2所述的方法,其特征在于,所述通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示,包括:
通过所述第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到至少两个第一子特征表示;对所述至少两个第一子特征表示进行特征拼接,得到第一特征表示;
通过所述第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到至少两个第二子特征表示;对所述至少两个第二子特征表示进行特征拼接,得到第二特征表示。
4.根据权利要求1或2所述的方法,其特征在于,所述通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示,包括:
通过所述第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到多个第一候选特征表示;对所述多个第一候选特征表示进行重要度特征筛选,得到所述第一特征表示;
通过所述第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到多个第二候选特征表示;对所述多个第二候选特征表示进行重要度特征筛选,得到所述第二特征表示。
5.根据权利要求4所述的方法,其特征在于,所述第一样本数据中包括i个子样本数据,所述多个第一候选特征表示中包括w个第一候选特征表示,i为正整数,w为大于1的正整数;
所述对所述多个第一候选特征表示进行重要度特征筛选,得到所述第一特征表示,包括:
对所述w个第一候选特征表示在所述第一预测任务中进行预测,得到所述i个子样本数据分别对应的基准预测任务结果;
基于所述i个子样本数据分别对应的基准预测任务结果与所述i个子样本数分别对应的任务标签,确定基准受试者工作特征曲线下与坐标轴围成的面积AUC值;
对所述w个候选特征表示中除第w-j个候选特征表示之外的特征表示在所述第一预测任务中进行预测,得到所述i个子样本数据分别对应的第w-j个预测任务结果,j小于或者等于w的正整数;
基于所述i个子样本数据分别对应的基准预测任务结果与所述i个子样本数据分别对应的任务标签,确定第j个AUC值;
根据所述第j个AUC值与所述基准AUC值之间的差距,对所述w个候选特征表示进行重要度特征筛选,得到所述i个子样本数据分别对应的第一特征表示。
6.根据权利要求4所述的方法,其特征在于,所述第一预测任务对应的第一任务模型中包括特征权重层,所述特征权重层用于在模型的预测过程中确定提取得到的特征的权重;
所述对所述多个第一候选特征表示进行重要度特征筛选,得到所述第一特征表示,包括:
将所述多个候选特征表示输入所述特征权重层,输出所述多个候选特征表示分别对应的权重;
基于所述多个候选特征表示分别对应的权重,对所述多个候选特征表示进行重要度特征筛选,得到所述第一特征表示。
7.一种多任务模型的数据预测方法,其特征在于,所述方法包括:
获取任务数据,所述任务数据用于在第一预测任务中进行数据预测,所述多任务模型用于执行包含所述第一预测任务的多个任务,所述多个任务之间符合任务相关性要求,所述多任务模型中包括共享专家网络以及与所述第一预测任务对应的第一专家网络和第一门控网络,所述共享专家网络用于将输出的特征表示应用于所述多个任务;
通过所述第一专家网络和所述共享专家网络对所述任务数据进行特征提取,得到所述第一专家网络输出的第一特征表示和所述共享专家网络输出的共享特征表示;
通过所述第一门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第一特征表示进行融合,得到第一融合特征表示;
通过所述第一预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述第一预测任务对应的第一预测结果。
8.根据权利要求7所述的方法,其特征在于,所述多个任务中包含第二预测任务,所述任务数据还用于在第二预测任务中进行数据预测,所述多任务模型中包括所述第二预测任务对应的第二专家网络和第二门控网络;
所述方法还包括:
通过所述第二专家网络对所述任务数据进行特征提取,得到所述第二专家网络输出的第二特征表示;
通过所述第二门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第二特征表示进行融合,得到第二融合特征表示;
通过所述第二预测任务对应的第二预测网络对所述第二融合特征表示进行数据预测,得到所述第二预测任务对应的第二预测结果。
9.根据权利要求8所述的方法,其特征在于,所述多个任务包括点击率预测任务和点击转化率预测任务;
所述通过所述第一预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述第一预测任务对应的第一预测结果,包括:
通过所述点击率预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述点击率预测任务对应的预测点击率;
所述通过所述第二预测任务对应的第二预测网络对所述第二融合特征表示进行数据预测,得到所述第二预测任务对应的第二预测结果,包括:
通过所述点击转化率预测任务对应的第二预测网络对所述第二融合特征表示进行数据预测,得到所述点击率预测任务对应的预测点击转化率。
10.一种多任务模型的网络结构确定装置,其特征在于,所述装置包括:
获取模块,用于获取第一预测任务对应的第一样本数据和第二预测任务对应的第二样本数据,所述第一样本数据标注有第一任务标签,所述第二样本数据标注有第二任务标签,任务标签用于指示样本数据在任务中的参考结果;
提取模块,用于通过第一预测任务对应的第一任务模型对所述第一样本数据进行特征提取,得到第一特征表示,以及通过第二预测任务对应的第二任务模型对所述第二样本数据进行特征提取,得到第二特征表示;
确定模块,用于基于所述第一特征表示和所述第二特征表示之间的相关性,以及所述第一任务标签与所述第二任务标签之间的相关性,确定所述第一预测任务和所述第二预测任务之间的相关性系数;
所述确定模块,还用于在所述相关性系数符合任务相关性要求的情况下,确定与所述第一预测任务和所述第二预测任务对应的候选多任务模型的网络结构;
其中,所述候选多任务模型的网络结构中包括候选共享专家网络、所述第一预测任务对应的候选第一专家网络和候选第一门控网络、所述第二预测任务对应的候选第二专家网络和候选第二门控网络,所述候选共享专家网络用于将输出的特征表示应用于所述第一预测任务和所述第二预测任务。
11.一种多任务模型的数据预测装置,其特征在于,所述装置包括:
数据获取模块,用于获取任务数据,所述任务数据用于在第一预测任务中进行数据预测,所述多任务模型用于执行包含所述第一预测任务的多个任务,所述多个任务之间符合任务相关性要求,所述多任务模型中包括共享专家网络以及与所述第一预测任务对应的第一专家网络和第一门控网络,所述共享专家网络用于将输出的特征表示应用于所述多个任务;
特征提取模块,用于通过所述第一专家网络和所述共享专家网络对所述任务数据进行特征提取,得到所述第一专家网络输出的第一特征表示和所述共享专家网络输出的共享特征表示;
特征调整模块,用于通过所述第一门控网络对所述共享特征表示进行特征调整,并将调整得到的门控特征表示与所述第一特征表示进行融合,得到第一融合特征表示;
数据预测模块,用于通过所述第一预测任务对应的第一预测网络对所述第一融合特征表示进行数据预测,得到所述第一预测任务对应的第一预测结果。
12.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至6任一所述的多任务模型的网络结构确定方法,或者实现如权利要求7至9任一所述的多任务模型的数据预测方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现如权利要求1至6任一所述的多任务模型的网络结构确定方法,或者实现如权利要求7至9任一所述的多任务模型的数据预测方法。
14.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一所述的多任务模型的网络结构确定方法,或者实现如权利要求7至9任一所述的多任务模型的数据预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310261645.XA CN116956204A (zh) | 2023-03-09 | 2023-03-09 | 多任务模型的网络结构确定方法、数据预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310261645.XA CN116956204A (zh) | 2023-03-09 | 2023-03-09 | 多任务模型的网络结构确定方法、数据预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116956204A true CN116956204A (zh) | 2023-10-27 |
Family
ID=88445045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310261645.XA Pending CN116956204A (zh) | 2023-03-09 | 2023-03-09 | 多任务模型的网络结构确定方法、数据预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116956204A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118332392A (zh) * | 2024-06-14 | 2024-07-12 | 江西财经大学 | 融合先验知识和专家网络的多任务心理健康识别方法与系统 |
-
2023
- 2023-03-09 CN CN202310261645.XA patent/CN116956204A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118332392A (zh) * | 2024-06-14 | 2024-07-12 | 江西财经大学 | 融合先验知识和专家网络的多任务心理健康识别方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522483B (zh) | 用于推送信息的方法和装置 | |
JP7564332B2 (ja) | 融合パラメータの特定方法及び装置、情報推奨方法及び装置、パラメータ測定モデルのトレーニング方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
US9064212B2 (en) | Automatic event categorization for event ticket network systems | |
CN110110233B (zh) | 信息处理方法、装置、介质和计算设备 | |
WO2021155691A1 (zh) | 用户画像生成方法、装置、存储介质及设备 | |
CN114036398B (zh) | 内容推荐和排序模型训练方法、装置、设备以及存储介质 | |
CN113641835B (zh) | 多媒体资源推荐方法、装置、电子设备及介质 | |
WO2024041483A1 (zh) | 一种推荐方法及相关装置 | |
WO2024002167A1 (zh) | 一种操作预测方法及相关装置 | |
CN111429214B (zh) | 一种基于交易数据的买卖双方匹配方法及装置 | |
CN113641916B (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
CN116956204A (zh) | 多任务模型的网络结构确定方法、数据预测方法及装置 | |
WO2023050143A1 (zh) | 一种推荐模型训练方法及装置 | |
CN113822734B (zh) | 用于生成信息的方法和装置 | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN117573973A (zh) | 资源推荐方法、装置、电子设备以及存储介质 | |
CN111860870A (zh) | 交互行为确定模型的训练方法、装置、设备及介质 | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
CN113159877B (zh) | 数据处理方法、装置、系统、计算机可读存储介质 | |
CN112487277B (zh) | 数据分配方法、装置、可读存储介质和电子设备 | |
CN114491093A (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN111915339A (zh) | 数据的处理方法、装置及设备 | |
CN118096308A (zh) | 产品推荐方法、装置、设备、介质及程序产品 | |
CN117033757A (zh) | 信息选取方法、装置、电子设备及存储介质 | |
CN113918810A (zh) | 基于机器学习模型的信息推送方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |