CN116244517A - 一种基于层次化信息抽取网络的多场景多任务推荐方法 - Google Patents

一种基于层次化信息抽取网络的多场景多任务推荐方法 Download PDF

Info

Publication number
CN116244517A
CN116244517A CN202310197028.8A CN202310197028A CN116244517A CN 116244517 A CN116244517 A CN 116244517A CN 202310197028 A CN202310197028 A CN 202310197028A CN 116244517 A CN116244517 A CN 116244517A
Authority
CN
China
Prior art keywords
scene
task
network
expert
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310197028.8A
Other languages
English (en)
Other versions
CN116244517B (zh
Inventor
罗川
周杰
于茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202310197028.8A priority Critical patent/CN116244517B/zh
Publication of CN116244517A publication Critical patent/CN116244517A/zh
Application granted granted Critical
Publication of CN116244517B publication Critical patent/CN116244517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于层次化信息抽取网络的多场景多任务推荐方法,包括:将分类特征映射至低维特征空间得到低维特征向量;将低维特征向量进行合并后得到特征输入x,将特征输入x输入至场景信息导出层提取场景信息得到场景高阶特征;将场景高阶特征输入至任务信息导出层提取任务信息得到任务高阶特征;将任务高阶特征输入至塔单元进行多层感知机计算,得到CTR预估值和CTCVR预估值。通过将场景和任务进行分层信息抽取,能够将复杂的多任务场景关联关系进行充分捕捉,实现了多场景多任务的推荐。

Description

一种基于层次化信息抽取网络的多场景多任务推荐方法
技术领域
本发明涉及大规模推荐技术领域,更具体的说是涉及一种基于层次化信息抽取网络的多场景多任务推荐方法。
背景技术
随着网络信息和服务的爆炸式增长,推荐系统已经成为一种关键技术为不同的互联网企业的用户提供个性化服务。在传统的互联网业务解决方案中,由于数据分布和特征空间的特殊性,个性化排序模型往往是为特定的业务场景单独部署提供在线排序服务的。然而,在真实的互联网平台中,存在多种需要进行商品排序并展示给用户的场景。目前,已经有许多多场景多任务推荐的工作被应用到大型互联网业务中,然而受到多任务学习方法的影响,主流的多场景多任务推荐方法均是将所有的原始特征信息输入映射到同一个特征空间进行优化,这使得上述推荐方法无法对不同的场景进行区分优化。
因此,如何提供一种基于层次化信息抽取网络的多场景多任务推荐方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于层次化信息抽取网络的多场景多任务推荐方法,通过将场景和任务进行分层信息抽取,能够将复杂的多任务场景关联关系进行充分捕捉,实现了多场景多任务的推荐。
为了实现上述目的,本发明采用如下技术方案:
一种基于层次化信息抽取网络的多场景多任务推荐方法,包括:
将分类特征映射至低维特征空间得到低维特征向量;
将低维特征向量进行合并后得到特征输入x,将特征输入x输入至场景信息导出层提取场景信息得到场景高阶特征;
将场景高阶特征输入至任务信息导出层提取任务信息得到任务高阶特征;
将任务高阶特征输入至塔单元进行多层感知机计算,得到CTR预估值和CTCVR预估值。
优选地,将特征输入x输入至场景信息导出层提取场景信息得到场景高阶特征具体包括:
场景信息导出层包括场景共享专家网络、场景特有专家网络和场景感知注意力网络;
场景共享专家网络处理过程为:
将输入特征x输入至多个共享子专家网络进行矩阵乘法计算,并将输入特征x投影至每个共享子专家网络的高阶特征空间输出高阶特征向量,将每个共享子专家网络输出的高阶特征向量进行加权求和,得到场景层共享高阶特征;
场景特有专家网络处理过程为:
将输入特征x输入至多个特有子专家网络进行矩阵乘法计算,并将输入特征x投影至每个特有子专家网络的高阶特征空间输出高阶特征向量,将每个特有子专家网络输出的高阶特征向量进行加权求和,得到场景层特有高阶特征;
场景感知注意力网络处理过程为:
将输入特征x输入至不同的场景特有专家网络中,生成不同场景对应的场景层特有高阶特征,将场景指示特征投影至不同场景对应的场景层特有高阶特征,并将结果进行加权求和,得到场景层感知高阶特征;
将场景层共享高阶特征、场景层特有高阶特征和场景层感知高阶特征合并,输出场景高阶特征。
优选地,场景共享专家网络输出场景层共享高阶特征G计算公式为:
Figure BDA0004107554410000031
其中,
Figure BDA0004107554410000032
表示第k个共享子专家网络,Ks表示共享子专家网络的个数,/>
Figure BDA0004107554410000033
表示场景共享专家网络中门控网络的权重输出:
Figure BDA0004107554410000034
其中,
Figure BDA0004107554410000035
是一个参数矩阵,R表示实数集,D表示x的维度。
优选地,场景特有专家网络输出场景层特有高阶特征计算公式为:
Figure BDA0004107554410000036
其中,Si表示第i个场景的场景特有专家网络输出,Ki表示第i个场景的特有子专家网络个数,
Figure BDA0004107554410000037
和/>
Figure BDA0004107554410000038
分别表示场景特有专家网络中门控网络权重输出和第k个特有子专家网络。
优选地,场景感知注意力网络输出场景层感知高阶特征Ai计算公式为:
Figure BDA0004107554410000039
Figure BDA00041075544100000310
其中,si表示特有子专家网络的场景表示,
Figure BDA00041075544100000311
表示场景感知注意力网络中门控网络的权重输出,Emb(·)表示将指示特征映射到低维向量表示的函数,
Figure BDA00041075544100000312
是一个参数矩阵,R表示实数集,d表示Emb(·)的维度,M表示场景个数。
优选地,CTR预估值和CTCVR预估值具体生成过程为:
任务信息导出层包括CTR任务特有专家网络、CTCVR任务特有专家网络和任务共享专家网络,输入均是场景信息层层导出的当前场景的场景高阶特征;
将CTR任务特有专家网络和任务共享专家网络的输出输入至CTR任务的塔单元进行处理后输出CTR预估值;
将CTCVR任务特有专家网络和任务共享专家网络的输出输入至CTCVR任务的塔单元进行处理后输出CTCVR预估值。
优选地,第i个场景的第j个任务的塔单元的输入为:
Figure BDA0004107554410000041
其中,
Figure BDA0004107554410000042
和/>
Figure BDA0004107554410000043
分别表示场景i对应的任务共享专家网络和场景i下任务j的任务特有专家网络,任务特有专家网络为CTR任务特有专家网络或CTCVR任务特有专家网络,/>
Figure BDA0004107554410000044
表示门控网络,/>
Figure BDA0004107554410000045
表示第i个场景的任务j的塔单元的输入,单元塔对应为CTR任务的塔单元或CTCVR任务的塔单元。
优选地,第i个场景的第j个任务的塔单元输出为:
Figure BDA0004107554410000046
其中,
Figure BDA0004107554410000047
表示由带有激活函数的多层感知机组成的塔单元模块,/>
Figure BDA0004107554410000048
表示第i个场景的任务j的塔单元的输入,当/>
Figure BDA0004107554410000049
表示为第i个场景的任务j的CTR任务的单元塔输入数据时,/>
Figure BDA00041075544100000410
为CTR任务的塔单元,当/>
Figure BDA00041075544100000411
表示为第i个场景的任务j的CTCVR任务的单元塔输入数据时,/>
Figure BDA00041075544100000412
为CTCVR任务的塔单元。
优选地,分类特征包括用户画像特征、用户行为特征、商品特征、场景特征、商品ID特征和场景指示特征。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于层次化信息抽取网络的多场景多任务推荐方法,通过将场景和任务进行分层信息抽取,能够将复杂的多任务场景关联关系进行充分捕捉,实现了多场景多任务的推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的一种基于层次化信息抽取网络的多场景多任务推荐方法原理框图。
图2附图为本发明提供的场景感知注意力网络示意图。
图3附图为本发明提供的子专家网络示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于层次化信息抽取网络的多场景多任务推荐方法,如图1所示,层次化信息抽取网络包括场景信息导出层和任务信息导出层,具体处理过程为:
将分类特征映射至低维特征空间得到低维特征向量;分类特征包括用户画像特征、用户行为特征、商品特征、场景特征、商品ID特征和场景指示特征,这些特征中包含的数值类特征首先被转换为分类特征,然后所有的分类特征经过低维特征空间映射为向量。
将低维特征向量进行合并后得到特征输入x,将特征输入x输入至场景信息导出层提取场景信息得到场景高阶特征;
将场景高阶特征输入至任务信息导出层提取任务信息得到任务高阶特征;
将任务高阶特征输入至塔单元进行多层感知机计算,得到点击率(click-throughrate,CTR)预估值和点击后转化率(click-through&conversion rate,CTCVR)预估值。
在本实施例中,场景信息导出层包括场景共享专家网络、场景特有专家网络和场景感知注意力网络;
考虑到不同场景下存在用户穿插交互和物品的重叠,多个场景下的数据之间存在共享信息,所以设计了场景共享专家网络,如图3所示,处理过程为:
将输入特征x输入至多个共享子专家网络进行矩阵乘法计算,并将输入特征x投影至每个共享子专家网络的高阶特征空间输出高阶特征向量,将每个共享子专家网络输出的高阶特征向量进行加权求和,得到场景层共享高阶特征;值得注意的是,由于共享子专家网络表征的是所有场景的共享信息,因此其会参与所有场景信息的表征;
场景层共享高阶特征G计算公式为:
Figure BDA0004107554410000061
其中,
Figure BDA0004107554410000062
表示第k个共享子专家网络(由带有激活函数的多层感知机构成),Ks表示共享子专家网络的个数,/>
Figure BDA0004107554410000063
表示场景共享专家网络中门控网络(由一个带有softmax激活函数的线性转换生成)的权重输出:
Figure BDA0004107554410000064
其中,
Figure BDA0004107554410000071
是一个参数矩阵,K表示子专家网络个数,D表示x的维度。
场景特有专家网络处理过程为:
将输入特征x输入至多个特有子专家网络进行矩阵乘法计算,并将输入特征x投影至每个特有子专家网络的高阶特征空间输出高阶特征向量,将每个特有子专家网络输出的高阶特征向量进行加权求和,得到场景层特有高阶特征;对于每个特定的场景,都有一组特征的子专家网络来表征,其不会参与其他场景的信息表征;
场景层特有高阶特征计算公式为:
Figure BDA0004107554410000072
其中,Si表示第i个场景的场景特有专家网络输出,Ki表示第i个场景的特有子专家网络个数,
Figure BDA0004107554410000073
和/>
Figure BDA0004107554410000074
分别表示场景特有专家网络中门控网络权重输出和第k个特有子专家网络。
由于情景之间存在相关性,其他情景的信息也可以补充到当前情景的表示中,对当前情景的表示起到表征增强的作用。考虑到场景对其他场景的贡献不同,设计了场景感知注意力网络,衡量来自其他场景的信息对当前场景的重要性。包含两个输入:一个是场景指示特征的低维向量表征结果,用来计算其他场景对当前场景信息表征的重要性权重;另外一个是S=[S1,…,Si-1,Si+1,…,SM]对应于一系列特有子专家网络所获得的场景表示。具体处理过程为:将输入特征x输入至不同的场景特有专家网络中,生成不同场景对应的场景层特有高阶特征,将场景指示特征投影至不同场景对应的场景层特有高阶特征,并将结果进行加权求和,得到场景层感知高阶特征;场景层感知高阶特征Ai计算公式为:
Figure BDA0004107554410000081
Figure BDA0004107554410000082
其中,si表示特有子专家网络的场景表示,
Figure BDA0004107554410000083
表示场景感知注意力网络中门控网络的权重输出,Emb(·)表示将指示特征映射到低维向量表示的函数,
Figure BDA0004107554410000084
是一个参数矩阵,d表示Emb(·)的维度,M表示场景个数。
如图2所示,场景感知注意力网络(SAN模块)可以根据复杂的场景相关性,能够不同程度地完成跨场景信息的传递,有效地加强了场景表示学习,提高了层次化信息抽取网络的性能。
最终场景i对应的场景信息导出层可以表示为:Ci=Concat[G,Si,Ai]。
在本实施例中,任务信息导出层主要的作用是在当前场景信息表示一定的条件下,对当前场景的多个任务目标进行建模。为了缓解多任务中负迁移的问题,使用自定义门控网络模块来作为层次化信息抽取网络中任务信息导出层。任务信息导出层包括CTR任务特有专家网络、CTCVR任务特有专家网络和任务共享专家网络,它们的输入完全一样,均是场景层导出的当前场景的场景高阶特征。
注意到,假设在多任务学习模型中,任务之间存在共享信息的同时,各自任务也具有当前任务特有的信息表征,因此根据图1,将任务共享专家网络作为两个任务的共享信息参与两个任务的学习,而对于各自任务对应的特有专家网络仅表达对应任务的特有信息输入到对应的任务中。
因此,CTR任务的塔单元输入为CTR任务特有专家网络和任务共享专家网络的输出,而CTCVR任务的塔单元的输入为CTCVR任务特有专家网络和任务共享专家网络的输出。
第i个场景的第j个任务的塔单元的输入为:
Figure BDA0004107554410000085
其中,
Figure BDA0004107554410000091
和/>
Figure BDA0004107554410000092
分别表示场景i对应的任务共享专家网络和场景i下任务j的任务特有专家网络,任务特有专家网络为CTR任务特有专家网络或CTCVR任务特有专家网络,/>
Figure BDA0004107554410000093
表示门控网络,/>
Figure BDA0004107554410000094
表示第i个场景的任务j的塔单元的输入,当/>
Figure BDA0004107554410000095
为场景i下CTR任务特有专家网络时,对应为CTR任务的塔单元输入,反之为CTCVR任务的塔单元输入。
第i个场景的第j个任务的塔单元输出为:
Figure BDA0004107554410000096
其中,
Figure BDA0004107554410000097
表示由带有激活函数的多层感知机组成的塔单元模块,/>
Figure BDA0004107554410000098
表示第i个场景的任务j的塔单元的输入,当/>
Figure BDA0004107554410000099
表示为第i个场景的任务j的CTR任务的单元塔输入数据时,/>
Figure BDA00041075544100000910
为CTR任务的塔单元,当/>
Figure BDA00041075544100000911
表示为第i个场景的任务j的CTCVR任务的单元塔输入数据时,/>
Figure BDA00041075544100000912
为CTCVR任务的塔单元。
在本实施例中,层次化信息抽取网络的损失函数为:
Figure BDA00041075544100000913
其中,M表示场景个数,Ni表示当前场景下的任务个数,Loss表示交叉熵损失函数。
为了说明本发明方法的效果,进行了如下实验:
从某本地生活业务中的真实用户日志中收集了六个场景的数据集(a到f),详细的数据集统计如表1。
表1:某本地生活所有场景的数据集统计
Figure BDA00041075544100000914
所有模型的离线效果可以参考表2,并且从离线实验结果来看,本发明提出的层次化信息抽取网络在所有场景中的CTR和CTCVR任务指标上,均超过了其他先进的模型,这说明层次化信息抽取网络在多场景多任务中的优越性。
表2:在所有场景下的模型的性能比较
Figure BDA0004107554410000101
表2中,多任务模型:
1)Shared Bottom,是一个带有硬参数共享的多任务模型。
2)MMoE,通过一个灵活的门控网络来调整专家网络表示信息,最终使用塔单元来融合每个任务的所有专家网络表示信息。
3)PLE,基于MMoE,将专家网络明确划分为任务共享专家和任务特有专家,有效缓解了跷跷板现象带来的负迁移问题。
多场景模型:
1)HMoE,由MMoE演变而来,对多个场景的预测值进行建模,使用多个场景的预测值来联合建模当前场景的预估。
2)STAR,通过星型拓扑构造一个共享的、场景化的网络,用于当前场景的学习。
将部署在某本地生活的两个场景(a和b)进行在线效果比较,从表3中可以看出,相比之前的在线基线模型,本发明模型在订单收益上均有不错的线上表现。
表3:层次化信息抽取网络与在线基线策略的效果比较
Figure BDA0004107554410000111
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,包括:
将分类特征映射至低维特征空间得到低维特征向量;
将低维特征向量进行合并后得到特征输入x,将特征输入x输入至场景信息导出层提取场景信息得到场景高阶特征;
将场景高阶特征输入至任务信息导出层提取任务信息得到任务高阶特征;
将任务高阶特征输入至塔单元进行多层感知机计算,得到CTR预估值和CTCVR预估值。
2.根据权利要求1所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,将特征输入x输入至场景信息导出层提取场景信息得到场景高阶特征具体包括:
场景信息导出层包括场景共享专家网络、场景特有专家网络和场景感知注意力网络;
场景共享专家网络处理过程为:
将输入特征x输入至多个共享子专家网络进行矩阵乘法计算,并将输入特征x投影至每个共享子专家网络的高阶特征空间输出高阶特征向量,将每个共享子专家网络输出的高阶特征向量进行加权求和,得到场景层共享高阶特征;
场景特有专家网络处理过程为:
将输入特征x输入至多个特有子专家网络进行矩阵乘法计算,并将输入特征x投影至每个特有子专家网络的高阶特征空间输出高阶特征向量,将每个特有子专家网络输出的高阶特征向量进行加权求和,得到场景层特有高阶特征;
场景感知注意力网络处理过程为:
将输入特征x输入至不同的场景特有专家网络中,生成不同场景对应的场景层特有高阶特征,将场景指示特征投影至不同场景对应的场景层特有高阶特征,并将结果进行加权求和,得到场景层感知高阶特征;
将场景层共享高阶特征、场景层特有高阶特征和场景层感知高阶特征合并,输出场景高阶特征。
3.根据权利要求2所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,场景共享专家网络输出场景层共享高阶特征G计算公式为:
Figure FDA0004107554400000021
其中,
Figure FDA0004107554400000022
表示第k个共享子专家网络,Ks表示共享子专家网络的个数,/>
Figure FDA0004107554400000023
表示场景共享专家网络中门控网络的权重输出:
Figure FDA0004107554400000024
其中,
Figure FDA0004107554400000025
是一个参数矩阵,R表示实数集,D表示x的维度。
4.根据权利要求2所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,场景特有专家网络输出场景层特有高阶特征计算公式为:
Figure FDA0004107554400000026
/>
其中,Si表示第i个场景的场景特有专家网络输出,Ki表示第i个场景的特有子专家网络个数,
Figure FDA0004107554400000027
和/>
Figure FDA0004107554400000028
分别表示场景特有专家网络中门控网络权重输出和第k个特有子专家网络。
5.根据权利要求2所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,场景感知注意力网络输出场景层感知高阶特征Ai计算公式为:
Figure FDA0004107554400000031
Figure FDA0004107554400000032
其中,si表示特有子专家网络的场景表示,
Figure FDA0004107554400000033
表示场景感知注意力网络中门控网络的权重输出,Emb(·)表示将指示特征映射到低维向量表示的函数,/>
Figure FDA0004107554400000034
是一个参数矩阵,R表示实数集,d表示Emb(·)的维度,M表示场景个数。
6.根据权利要求1所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,CTR预估值和CTCVR预估值具体生成过程为:
任务信息导出层包括CTR任务特有专家网络、CTCVR任务特有专家网络和任务共享专家网络,输入均是场景信息层层导出的当前场景的场景高阶特征;
将CTR任务特有专家网络和任务共享专家网络的输出输入至CTR任务的塔单元进行处理后输出CTR预估值;
将CTCVR任务特有专家网络和任务共享专家网络的输出输入至CTCVR任务的塔单元进行处理后输出CTCVR预估值。
7.根据权利要求6所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,第i个场景的第j个任务的塔单元的输入为:
Figure FDA0004107554400000035
其中,
Figure FDA0004107554400000036
和/>
Figure FDA0004107554400000037
分别表示场景i对应的任务共享专家网络和场景i下任务j的任务特有专家网络,任务特有专家网络为CTR任务特有专家网络或CTCVR任务特有专家网络,/>
Figure FDA0004107554400000041
表示门控网络,/>
Figure FDA0004107554400000042
表示第i个场景的任务j的塔单元的输入,对应为CTR任务的塔单元输入或CTCVR任务的塔单元输入。
8.根据权利要求7所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,第i个场景的第j个任务的塔单元输出为:
Figure FDA0004107554400000043
其中,
Figure FDA0004107554400000044
表示由带有激活函数的多层感知机组成的塔单元模块,/>
Figure FDA0004107554400000045
表示第i个场景的任务j的塔单元的输入,当/>
Figure FDA0004107554400000046
表示为第i个场景的任务j的CTR任务的单元塔输入数据时,
Figure FDA0004107554400000047
为CTR任务的塔单元,当/>
Figure FDA0004107554400000048
表示为第i个场景的任务j的CTCVR任务的单元塔输入数据时,/>
Figure FDA0004107554400000049
为CTCVR任务的塔单元。
9.根据权利要求1所述的一种基于层次化信息抽取网络的多场景多任务推荐方法,其特征在于,分类特征包括用户画像特征、用户行为特征、商品特征、场景特征、商品ID特征和场景指示特征。
CN202310197028.8A 2023-03-03 2023-03-03 基于层次化信息抽取网络的多场景多任务的模型训练方法 Active CN116244517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310197028.8A CN116244517B (zh) 2023-03-03 2023-03-03 基于层次化信息抽取网络的多场景多任务的模型训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310197028.8A CN116244517B (zh) 2023-03-03 2023-03-03 基于层次化信息抽取网络的多场景多任务的模型训练方法

Publications (2)

Publication Number Publication Date
CN116244517A true CN116244517A (zh) 2023-06-09
CN116244517B CN116244517B (zh) 2023-11-28

Family

ID=86634748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310197028.8A Active CN116244517B (zh) 2023-03-03 2023-03-03 基于层次化信息抽取网络的多场景多任务的模型训练方法

Country Status (1)

Country Link
CN (1) CN116244517B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10915815B1 (en) * 2019-01-22 2021-02-09 Institute Of Automation, Chinese Academy Of Sciences Information processing method, system and device based on contextual signals and prefrontal cortex-like network
CN112765474A (zh) * 2021-01-28 2021-05-07 武汉大学 一种基于深度协同过滤的推荐方法及系统
CN112905648A (zh) * 2021-02-04 2021-06-04 北京邮电大学 一种基于多任务学习的多目标推荐方法及系统
CN113420879A (zh) * 2021-07-09 2021-09-21 支付宝(杭州)信息技术有限公司 多任务学习模型的预测方法及装置
US20210304497A1 (en) * 2017-08-11 2021-09-30 Jing Jin Incident site investigation and management support system based on unmanned aerial vehicles
CN113515942A (zh) * 2020-12-24 2021-10-19 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备及存储介质
CN114117216A (zh) * 2021-11-23 2022-03-01 广州博冠信息科技有限公司 推荐概率预测方法及装置、计算机存储介质和电子设备
CN114579869A (zh) * 2022-05-05 2022-06-03 腾讯科技(深圳)有限公司 模型训练方法以及相关产品
CN114970882A (zh) * 2022-05-19 2022-08-30 支付宝(杭州)信息技术有限公司 适于多场景多任务的模型预测方法及模型系统
CN114997412A (zh) * 2022-05-17 2022-09-02 华为技术有限公司 一种推荐方法、训练方法以及装置
CN115526662A (zh) * 2022-09-28 2022-12-27 中国电信股份有限公司 一种物品信息推送方法、装置、电子设备及存储介质
CN115688920A (zh) * 2022-11-22 2023-02-03 百度国际科技(深圳)有限公司 知识抽取方法、模型的训练方法、装置、设备和介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210304497A1 (en) * 2017-08-11 2021-09-30 Jing Jin Incident site investigation and management support system based on unmanned aerial vehicles
US10915815B1 (en) * 2019-01-22 2021-02-09 Institute Of Automation, Chinese Academy Of Sciences Information processing method, system and device based on contextual signals and prefrontal cortex-like network
CN113515942A (zh) * 2020-12-24 2021-10-19 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备及存储介质
CN112765474A (zh) * 2021-01-28 2021-05-07 武汉大学 一种基于深度协同过滤的推荐方法及系统
CN112905648A (zh) * 2021-02-04 2021-06-04 北京邮电大学 一种基于多任务学习的多目标推荐方法及系统
CN113420879A (zh) * 2021-07-09 2021-09-21 支付宝(杭州)信息技术有限公司 多任务学习模型的预测方法及装置
CN114117216A (zh) * 2021-11-23 2022-03-01 广州博冠信息科技有限公司 推荐概率预测方法及装置、计算机存储介质和电子设备
CN114579869A (zh) * 2022-05-05 2022-06-03 腾讯科技(深圳)有限公司 模型训练方法以及相关产品
CN114997412A (zh) * 2022-05-17 2022-09-02 华为技术有限公司 一种推荐方法、训练方法以及装置
CN114970882A (zh) * 2022-05-19 2022-08-30 支付宝(杭州)信息技术有限公司 适于多场景多任务的模型预测方法及模型系统
CN115526662A (zh) * 2022-09-28 2022-12-27 中国电信股份有限公司 一种物品信息推送方法、装置、电子设备及存储介质
CN115688920A (zh) * 2022-11-22 2023-02-03 百度国际科技(深圳)有限公司 知识抽取方法、模型的训练方法、装置、设备和介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SHULONG TAN: "Multi-Task and Multi-Scene Unified Ranking Model for Online Advertising", 《2021 IEEE INTERNATIONAL CONFERENCE ON BIG DATA (BIG DATA)》 *
ZHENG YE: "An Entire Space Multi-gate Mixture-of-Experts Model for Recommender Systems", 《2022 IEEE/WIC/ACM 》 *
张耐: "基于模型混合的证券交易行为异常检测研究", 《中国优秀硕士毕业生论文集合》 *
王静: "基于社交媒体评论的客户需求分析", 《中国优秀博士毕业生论文集》 *

Also Published As

Publication number Publication date
CN116244517B (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
Luo et al. A novel approach to large-scale dynamically weighted directed network representation
CN111339433B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN109885756B (zh) 基于cnn和rnn的序列化推荐方法
Wan et al. Deep matrix factorization for trust-aware recommendation in social networks
CN109711483B (zh) 一种基于Sparse Autoencoder的电力系统运行方式聚类方法
CN106874355A (zh) 同时融入社交关系和用户相似度的协同过滤方法
CN107247753B (zh) 一种相似用户选取方法及装置
Mukherjee et al. Development of an ensemble decision tree-based power system dynamic security state predictor
CN110263236B (zh) 基于动态多视图学习模型的社交网络用户多标签分类方法
CN113609398A (zh) 一种基于异构图神经网络的社交推荐方法
CN110245228A (zh) 确定文本类别的方法和装置
CN113157919B (zh) 语句文本方面级情感分类方法及系统
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及系统
Kongsorot et al. Multi-label classification with extreme learning machine
CN116095089A (zh) 遥感卫星数据处理方法及系统
Zhao et al. Improving Top-N Recommendation with Heterogeneous Loss.
CN114781503A (zh) 一种基于深度特征融合的点击率预估方法
CN114462670A (zh) 一种基于lstm模型的用电量预测方法
CN116244517B (zh) 基于层次化信息抽取网络的多场景多任务的模型训练方法
Wu et al. A Federated Deep Learning Framework for Privacy-Preserving Consumer Electronics Recommendations
Chen et al. Attributed community mining using joint general non-negative matrix factorization with graph Laplacian
Hu et al. Learning Multi-expert Distribution Calibration for Long-tailed Video Classification
CN114662658A (zh) 一种基于lstm神经网络的片上光网络热点预测方法
CN112561599A (zh) 一种融合域特征交互的基于注意力网络学习的点击率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant