CN115080856A - 推荐方法及装置、推荐模型的训练方法及装置 - Google Patents

推荐方法及装置、推荐模型的训练方法及装置 Download PDF

Info

Publication number
CN115080856A
CN115080856A CN202210764376.4A CN202210764376A CN115080856A CN 115080856 A CN115080856 A CN 115080856A CN 202210764376 A CN202210764376 A CN 202210764376A CN 115080856 A CN115080856 A CN 115080856A
Authority
CN
China
Prior art keywords
information
hypergraph
recommendation
training
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210764376.4A
Other languages
English (en)
Inventor
李勇
宋洋
朱子瑞
高宸
常健新
牛亚男
金德鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Tsinghua University
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Beijing Dajia Internet Information Technology Co Ltd filed Critical Tsinghua University
Priority to CN202210764376.4A priority Critical patent/CN115080856A/zh
Publication of CN115080856A publication Critical patent/CN115080856A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开关于一种推荐方法及装置、推荐模型的训练方法及装置。该训练方法包括:获取待推荐对象的用户账户和至少两个待推荐对象的对象标识;将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户对对象产生的行为的行为标识,超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图;将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到推荐网络,得到每个待推荐对象的推荐信息;基于推荐信息向用户账户推荐至少两个待推荐对象。

Description

推荐方法及装置、推荐模型的训练方法及装置
技术领域
本公开涉及人工智能领域,尤其涉及一种推荐方法及装置、推荐模型的训练方法及装置。
背景技术
目前,推荐系统可以根据用户的历史行为数据来学习用户的兴趣,提供个性化的信息访问。传统的协同过滤(CF)只针对一种行为(如购买或点击)进行操作,然而,只针对一种行为进行建模在现实世界的推荐引擎中是有局限性的。例如,在电子商务网站,用户的购买记录总是比点击行为稀少得多,这就导致了数据稀少的问题。
为了解决这个问题,一般是将传统的协同过滤扩展到多行为推荐,具体来说,多行为推荐是指利用多种类型的行为,包括目标行为(target behavior)和辅助行为,来提高目标行为的推荐效果。目前已有的最先进的利用图神经网络的多行为推荐算法,依赖的是多行为图卷积网络(Multi-Behavior Graph Convolutional Network,缩写为MBGCN),以为用户推荐视频为例说明,MBGCN是通过包含用户节点和视频节点的超图进行卷积来为用户推荐视频,使得各种行为独立的通过卷积进行建模,忽略了行为之间的强相关性,例如,在短视频平台上,用户看过视频觉得视频很有趣,决定点赞和收藏,这样的“点赞-收藏”表征了这两种行为之间的强相关性,而MBGCN忽略了这两种行为的强相关性,因此在语义复杂的场景下难以捕捉全局信息。
发明内容
本公开提供一种推荐方法及装置、推荐模型的训练方法及装置,以至少解决相关技术无法捕获全局信息导致推荐的对象没有很好的符合用户所需的问题。
根据本公开实施例的第一方面,提供了一种推荐方法,推荐方法基于推荐模型实现,推荐模型包括超图卷积网络和推荐网络,推荐方法包括:获取待推荐对象的用户账户和至少两个待推荐对象的对象标识;将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户对对象产生的行为的行为标识,超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图,超图的边为连接一个元组中训练用户账户、对象标识和行为标识中至少两个节点的线;将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到推荐网络,得到每个待推荐对象的推荐信息,其中,推荐信息表示用户账户对相应的待推荐对象产生的行为是目标行为的概率,训练数据包括目标行为;基于推荐信息向用户账户推荐至少两个待推荐对象。
可选地,超图包括以下至少之一:第一超图、第二超图,第一超图和第二超图通过如下方式构建:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。
可选地,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,包括:将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息和权重系数,得到嵌入表示信息。
可选地,超图还包括通过如下方式构建的第三超图:基于目标元组构建以用户账户和对象标识为节点的第三超图。
可选地,超图卷积网络还包括第三超图卷积网络,将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,包括:将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息和权重系数,得到嵌入表示信息,包括:基于第一嵌入表示信息、第二嵌入表示信息、第三嵌入表示信息和权重系数,得到嵌入表示信息。
可选地,推荐网络包括第一推荐网络和第二推荐网络,将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到推荐网络,得到每个待推荐对象的推荐信息,包括:将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到第一推荐网络,得到每个待推荐对象的第一推荐子信息,第一推荐子信息是基于用户账户和至少两个待推荐对象的对象标识在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;获取用户账户通过目标行为交互过的对象的对象标识集合、每个待推荐对象通过目标行为交互过的用户账户的用户账户集合;将嵌入表示信息、对象标识集合和每个用户账户集合输入到第二推荐网络,得到每个待推荐对象的第二推荐子信息,第二推荐子信息是基于对象标识集合和每个用户账户集合在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;基于第一推荐子信息和第二推荐子信息,得到每个待推荐对象的推荐信息。
根据本公开实施例的第二方面,提供了一种推荐模型的训练方法,推荐模型包括超图卷积网络和推荐网络,训练方法包括:获取训练数据,其中,训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户和对象之间的行为的行为标识;基于多个元组构建以用户账户、对象标识和行为标识为节点的超图;将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的预估嵌入表示信息;将任意目标元组中的第一训练用户账户和第一对象标识作为训练正样本,其中,目标元组是多个元组中包含目标行为的行为标识的元组;将任意非目标元组中的第二对象标识和第一训练用户账户作为训练负样本,其中,非目标元组是多个元组中除目标元组之外的元组;将训练正样本和和预估嵌入表示信息输入到推荐网络,得到第一对象标识对应的对象的第一预估推荐信息,其中,第一预估推荐信息表示第一训练用户账户对第一对象标识对应的对象产生的行为是目标行为的概率;将训练负样本分别和预估嵌入表示信息输入到推荐网络,得到第二对象标识对应的对象的第二预估推荐信息,其中,第二预估推荐信息表示第一训练用户账户对第二对象标识对应的对象产生的行为是目标行为的概率;通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
可选地,基于多个元组构建以用户账户、对象标识和行为标识为节点的超图,包括以下至少之一:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。
可选地,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,将超图的信息输入超图卷积网络,得到训练数据中用户账户、对象和行为的预估嵌入表示信息,包括:将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一预估嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息和权重系数,得到预估嵌入表示信息。
可选地,基于多个元组构建以用户账户、对象标识和行为标识为节点的超图,还包括:基于目标元组构建以用户账户和对象标识为节点的第三超图。
可选地,超图卷积网络还包括第三超图卷积网络,将超图的信息输入超图卷积网络,得到训练数据中用户账户、对象和行为的预估嵌入表示信息,包括:将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息和权重系数,得到预估嵌入表示信息,包括:基于第一预估嵌入表示信息、第二预估嵌入表示信息、第三预估嵌入表示信息和权重系数,得到预估嵌入表示信息。
可选地,训练数据还包括训练数据中每种行为的实际转换率,实际转化率是每种行为实际转换为目标行为的概率;通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练,包括:基于第一预估推荐信息和第二预估推荐信息确定第一损失;获取推荐模型的中间层输出的预估转化率,其中,预估转化率是训练数据中每种行为预估转换为目标行为的概率;基于预估转化率和实际转换率确定第二损失;基于最大化第一损失和最小化第二损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
根据本公开实施例的第三方面,提供了一种推荐装置,推荐装置基于推荐模型实现,推荐模型包括超图卷积网络和推荐网络,推荐装置包括:标识获取单元,被配置为获取待推荐对象的用户账户和至少两个待推荐对象的对象标识;嵌入表示信息获取单元,被配置为将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户对对象产生的行为的行为标识,超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图,超图的边为连接一个元组中训练用户账户、对象标识和行为标识中至少两个节点的线;推荐信息获取单元,被配置为将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到推荐网络,得到每个待推荐对象的推荐信息,其中,推荐信息表示用户账户对相应的待推荐对象产生的行为是目标行为的概率,训练数据包括目标行为;推荐单元,被配置为基于推荐信息向用户账户推荐至少两个待推荐对象。
可选地,超图包括以下至少之一:第一超图、第二超图,第一超图和第二超图通过如下方式构建:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。
可选地,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,嵌入表示信息获取单元,还被配置为将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息和权重系数,得到嵌入表示信息。
可选地,超图还包括通过如下方式构建的第三超图:基于目标元组构建以用户账户和对象标识为节点的第三超图。
可选地,超图卷积网络还包括第三超图卷积网络,嵌入表示信息获取单元,还被配置为将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息、第三嵌入表示信息和权重系数,得到嵌入表示信息。
可选地,推荐网络包括第一推荐网络和第二推荐网络,推荐信息获取单元,被配置为将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到第一推荐网络,得到每个待推荐对象的第一推荐子信息,第一推荐子信息是基于用户账户和至少两个待推荐对象的对象标识在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;获取用户账户通过目标行为交互过的对象的对象标识集合、每个待推荐对象通过目标行为交互过的用户账户的用户账户集合;将嵌入表示信息、对象标识集合和每个用户账户集合输入到第二推荐网络,得到每个待推荐对象的第二推荐子信息,第二推荐子信息是基于对象标识集合和每个用户账户集合在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;基于第一推荐子信息和第二推荐子信息,得到每个待推荐对象的推荐信息。
根据本公开实施例的第四方面,提供了一种推荐模型的训练装置,推荐模型包括超图卷积网络和推荐网络,训练装置包括:训练数据获取单元,被配置为获取训练数据,其中,训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户和对象之间的行为的行为标识;超图获取单元,被配置为基于多个元组构建以用户账户、对象标识和行为标识为节点的超图;预估嵌入表示信息获取单元,被配置为将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的预估嵌入表示信息;正样本获取单元,被配置为将任意目标元组中的第一训练用户账户和第一对象标识作为训练正样本,其中,目标元组是多个元组中包含目标行为的行为标识的元组;负样本获取单元,被配置为将任意非目标元组中的第二对象标识和第一训练用户账户作为训练负样本,其中,非目标元组是多个元组中除目标元组之外的元组;第一预估推荐信息获取单元,被配置为将训练正样本和和预估嵌入表示信息输入到推荐网络,得到第一对象标识对应的对象的第一预估推荐信息,其中,第一预估推荐信息表示第一训练用户账户对第一对象标识对应的对象产生的行为是目标行为的概率;第二预估推荐信息获取单元,被配置为将训练负样本分别和预估嵌入表示信息输入到推荐网络,得到第二对象标识对应的对象的第二预估推荐信息,其中,第二预估推荐信息表示第一训练用户账户对第二对象标识对应的对象产生的行为是目标行为的概率;训练单元,被配置为通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
可选地,超图获取单元,还被配置为以下至少之一:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。
可选地,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,预估嵌入表示信息获取单元,还被配置为将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一预估嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息和权重系数,得到预估嵌入表示信息。
可选地,超图获取单元,还被配置为基于目标元组构建以用户账户和对象标识为节点的第三超图。
可选地,超图卷积网络还包括第三超图卷积网络,预估嵌入表示信息获取单元,还被配置为将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息、第三预估嵌入表示信息和权重系数,得到预估嵌入表示信息。
可选地,训练数据还包括训练数据中每种行为的实际转换率,实际转化率是每种行为实际转换为目标行为的概率;训练单元,还被配置为基于第一预估推荐信息和第二预估推荐信息确定第一损失;获取推荐模型的中间层输出的预估转化率,其中,预估转化率是训练数据中每种行为预估转换为目标行为的概率;基于预估转化率和实际转换率确定第二损失;基于最大化第一损失和最小化第二损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
根据本公开实施例的第五方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现根据本公开的推荐方法和/或推荐模型的训练方法。
根据本公开实施例的第六方面,提供了一种计算机可读存储介质,当计算机可读存储介质中的指令被至少一个处理器运行时,促使至少一个处理器执行如上根据本公开的推荐方法和/或推荐模型的训练方法。
根据本公开实施例的第七方面,提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现根据本公开的推荐方法和/或推荐模型的训练方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
根据本公开的推荐方法及装置、推荐模型的训练方法及装置,不仅将用户、对象作为图中的节点,将每一种行为也视为图中的一个节点,也即在图中嵌入了行为节点,利用超图的框架重新定义了多行为推荐问题,行为的表征可以感知整个训练数据上的全局信息,以便拥有复杂的语义,从而在此基础上来确定即将推荐给用户的对象的推荐信息,提高了推荐的对象的准确性,使用户接受到的推荐对象更符合用户所需。因此,本公开解决了相关技术无法捕获全局信息导致推荐的对象没有很好的符合用户所需的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是示出根据本公开的示例性实施例的推荐模型的训练方法及推荐方法的实施场景示意图;
图2是根据一示例性实施例示出的一种推荐方法的流程图;
图3是根据一示例性实施例示出的一种推荐模型的训练方法的流程图;
图4是根据一示例性实施例示出的一种推荐模型的结构示意图;
图5是根据一示例性实施例示出的一种推荐装置的框图;
图6是根据一示例性实施例示出的一种推荐模型的训练装置的框图;
图7是根据本公开实施例的一种电子设备700的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。
本公开提供了一种推荐模型的训练方法和推荐方法,能够帮助推荐模型学习用户的偏好信息和对象的特征,为用户推荐更合适的对象,下面以为用户推荐感兴趣的视频的场景为例进行说明。
图1是示出根据本公开的示例性实施例的推荐模型的训练方法及推荐方法的实施场景示意图,如图1所述,该实施场景包括服务器100、用户终端110和用户终端120,其中,用户终端不限于2个,包括并不限于手机、个人计算机等设备,用户终端可以安装浏览视频的应用程序,服务器可以是一个服务器,也可以是若干个服务器组成服务器集群,还可以是云计算平台或虚拟化中心。
服务器100接收用户终端110或120发送的对推荐模型进行训练的请求之后,统计观看视频的用户、观看的视频和对视频的行为,基于上述信息获取训练数据,其中,训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练账户、一个视频的视频标识、训练用户账户和视频之间的行为的行为标识;服务器100基于多个元组构建以用户账户、视频标识和行为标识为节点的超图,并将超图的信息输入超图卷积网络,得到训练数据中训练用户、视频和行为的预估嵌入表示信息;服务器100将任意目标元组中的第一训练用户账户和第一视频标识作为训练正样本,其中,目标元组是多个元组中包含目标行为的行为标识的元组,并将任意非目标元组中的第二视频标识和第一训练用户账户作为训练负样本,其中,非目标元组是多个元组中除目标元组之外的元组;然后,将预估嵌入表示信息、训练正样本和训练负样本分别输入到推荐网络,得到第一视频标识对应的视频的第一预估推荐信息和第二视频标识对应的视频的第二预估推荐信息;通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
在训练好推荐模型后,在为用户推荐视频时,服务器100可以预先粗筛出一部分视频,即粗筛出至少两个待推荐视频,获取用户的用户账户和至少两个待推荐视频的视频标识,并将上述构建的超图的信息输入超图卷积网络,得到上述训练数据中训练用户、视频和行为的嵌入表示信息;将嵌入表示信息、用户账户和至少两个待推荐视频的视频标识输入到推荐网络,得到至少两个待推荐视频的推荐信息,其中,推荐信息表示用户账户对相应的待推荐对象产生的行为是目标行为的概率;基于推荐信息向用户终端110或120上的用户推荐至少两个待推荐视频,即可以将更合适的视频推荐给用户。
下面,将参照附图详细描述根据本公开的示例性实施例的推荐方法及装置、推荐模型的训练方法及装置。
图2是根据一示例性实施例示出的一种推荐方法的流程图,如图2所示,推荐方法基于推荐模型实现,推荐模型包括超图卷积网络和推荐网络,推荐方法包括以下步骤:
在步骤S201中,获取待推荐对象的用户账户和至少两个待推荐对象的对象标识。需要说明的是,本公开应用在精排阶段,故针对待推荐对象的用户会预先筛选出一定数量的对象,即上述至少两个待推荐对象,如预先筛选出100个对象。上述对象可以是商品,如视频、音乐等等。
在步骤S202中,将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户对对象产生的行为的行为标识,超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图,超图的边为连接一个元组中训练用户账户、对象标识和行为标识中至少两个节点的线。上述训练数据的元组可以是不定长元组,不定长元组的形式可以表征为“用户-对象-行为1-行为2-……”,每一个不定长元组的含义是用户和对象之间发生了行为1,行为2,……的交互,元组的具体的表征形式可以通过multi-hot编码的形式进行对齐和记录。需要说明的是,上述元组只需要用户、对象和行为的标识即可,不需要任何形式的用户和对象的实体内容。在本步骤中,在获取到训练数据后,将训练数据中元组的每一个用户、对象和行为都视为图中的一个节点,将训练数据中每一个元组视为一个超边,将训练数据重构为一整张超图,使用该超图进行建模的优势是能够有效的建模多种行为同时发生的复杂语义场景。例如,在线上系统中点赞和转发两种行为常常会关联在一起,那么在该超图中,就会有多条超边同时连接点赞和转发两个行为节点,在后续的卷积过程中,两节点之间就会有显著的信息传播,从而使得两节点在嵌入空间有强烈的相似性。
根据本公开的示例性实施例,上述超图包括以下至少之一:第一超图、第二超图,第一超图和第二超图通过如下方式构建:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。根据本实施例,通过目标行为划分出两个超图,即包含目标行为的超图和不包含目标行为的超图,将超图划分为更相关的第一超图,更不相关的第二超图,如此在获取嵌入表示信息时,通过相关性和不相关性的分类,可以方便后续更好的学习用户、商品和行为的嵌入表示信息,而且有助于推荐模型学习预测目标行为的关键信息。
例如,将训练数据划分为转化(Conversion)-辅助(Auxiliary)三个通道,也即上述实施例中的第一超图、第二超图,然后对两个超图分别进行卷积。具体地,从训练数据中挑选出含有目标行为的元组(超边),构建成一张超图,此即转化通道;从训练数据中挑选不含有目标行为的元组(超边),构建成一张超图,此即辅助通道,这样的通道划分有助于模型学习预测目标行为的关键信息。将两个通道的信息输入到卷积网络中,即可得到各自的嵌入表示信息,将各自的嵌入表示信息结合既可以得到更丰富的总的嵌入表示信息。
根据本公开的示例性实施例,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,包括:将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息和权重系数,得到嵌入表示信息。根据本实施例,分别对两个超图的信息进行超图卷积,得到各自的嵌入表示信息,将各自的嵌入表示信息结合既可以得到更丰富的总的嵌入表示信息,也即可以学习到更好的嵌入表示信息,且引入可学习权重信息,也可以辅助获取更好的嵌入表示信息。
例如,构建完两个通道的超图后,可以使用轻量图卷积网络(LightGCN)形式但不限于该形式的超图卷积网络,在两个通道上分别进行信息传播,每个通道可以通过如下卷积公式进行信息传播:
Figure BDA0003721708370000121
其中,
Figure BDA0003721708370000122
表示第l层的嵌入表示矩阵,Pl,Ql,Kl分别是用户、对象和行为的嵌入表示矩阵(也即上述嵌入表示信息),t代表通道,Ht是通道的关联矩阵(incidence matrix),Dt是对角化的节点度矩阵,Bt是对角化的边度矩阵。
每个通道各自经过L层卷积之后得到
Figure BDA0003721708370000123
通过可学习的权重系数进行加权融合。
Figure BDA0003721708370000124
其中,αt是可学习的参数。
根据本公开的示例性实施例,超图还包括通过如下方式构建的第三超图:基于目标元组构建以用户账户和对象标识为节点的第三超图。根据本实施例,通过目标行为进一步划分出第三超图,增加单独考虑目标行为对应的用户和对象的相关信息,辅助后续获取更好的学习用户、商品和行为的嵌入表示信息。
例如,处理将训练数据划分为转化(Conversion)-辅助(Auxiliary)两个通道外,还可以额外划分出一个协同过滤(CF)通道,也即上述实施例中第三超图,然后对三个通道分别进行卷积。具体地,从训练数据中挑选出含有目标行为的元组(超边),构建成一张超图,此即转化通道;从训练数据中挑选不含有目标行为的元组(超边),构建成一张超图,此即辅助通道;从训练数据中挑选出发生了目标行为的元组的用户-商品对,单独连接一条边,构建为一张图,此即协同过滤通道,这样的通道划分有助于模型学习预测目标行为的关键信息。将三个通道的信息输入到卷积网络中,即可得到各自的嵌入表示信息,将各自的嵌入表示信息结合在既可以得到更丰富的总的嵌入表示信息。
根据本公开的示例性实施例,超图卷积网络还包括第三超图卷积网络,将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,包括:将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息和权重系数,得到嵌入表示信息,包括:基于第一嵌入表示信息、第二嵌入表示信息、第三嵌入表示信息和权重系数,得到嵌入表示信息。根据本实施例,分别对三个超图的信息进行超图卷积,得到各自的嵌入表示信息,将各自的嵌入表示信息结合既可以得到更丰富的总的嵌入表示信息,也即可以学习到更好的嵌入表示信息,且引入可学习权重信息,也可以辅助获取更好的嵌入表示信息。
例如,构建完三个通道的超图后,可以使用LightGCN形式但不限于该形式的超图卷积网络,在三个通道上分别进行信息传播,每个通道可以通过如上公式(1)卷积公式进行信息传播,在得到各自的嵌入表示信息后,可以通过权重进行结合,也即每个通道各自经过L层卷积之后得到
Figure BDA0003721708370000131
通过可学习的权重系数进行加权融合。
返回图2,在步骤S203中,将所述嵌入表示信息、所述用户账户和所述至少两个待推荐对象的对象标识输入到所述推荐网络,得到每个待推荐对象的推荐信息,其中,所述推荐信息表示所述用户账户对相应的待推荐对象产生的行为是目标行为的概率,所述训练数据包括所述目标行为。在本步骤中,可以将上述100个对象分别与用户配对,得到100个用户-对象对,将个100个用户-对象对和嵌入表示信息输入到推荐模型中,得到每个对象的推荐信息。例如,可以采用打分的形式来确定每个对象的推荐信息,即上述推荐信息可以是分值,当然也可以采用其他任何形式,本公开对此并不进行限定。
根据本公开的示例性实施例,推荐网络包括第一推荐网络和第二推荐网络,将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到推荐网络,得到每个待推荐对象的推荐信息,可以包括:将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到第一推荐网络,得到每个待推荐对象的第一推荐子信息,第一推荐子信息是基于用户账户和至少两个待推荐对象的对象标识在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;获取用户账户通过目标行为交互过的对象的对象标识集合、每个待推荐对象通过目标行为交互过的用户账户的用户账户集合;将嵌入表示信息、对象标识集合和每个用户账户集合输入到第二推荐网络,得到每个待推荐对象的第二推荐子信息,第二推荐子信息是基于对象标识集合和每个用户账户集合在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;基于第一推荐子信息和第二推荐子信息,得到每个待推荐对象的推荐信息。根据本实施例,一方面通过超图卷积获取全局信息来确定第一预估推荐子信息和第一预估推荐子信息,另一方面通过局部的协同过滤信息(也即交互过的信息)确定第二预估推荐子信息,进而基于两部分推荐子信息确定出推荐信息,即考虑了全局信息,也考虑了局部信息,增加了推荐信息的准确性。
具体地,以推荐信息为分值为例,最终的打分模块(即推荐网络)可以分为两部分:
第一部分是多行为全局打分,也即获取第一预估推荐子信息的过程,具体的第一推荐网络可以如下:
Figure BDA0003721708370000141
其中,
Figure BDA0003721708370000142
表示点积,μ表示用户、ν表示对象,PL、QL分别是EL中用户、对象的嵌入表示矩阵,本公式的含义即用户μ、对象ν的嵌入表示矩阵进行点乘,这一部分的目标是利用之前的超图卷积获得全局信息。
第二部分是利用局部的协同过滤信息打分,也即获取第二预估推荐子信息的过程,具体的第二推荐网络可以如下:
Figure BDA0003721708370000143
其中,
Figure BDA0003721708370000144
表示用户用户账户u通过目标行为bT交互过的对象集合,
Figure BDA0003721708370000145
表示对象v通过目标行为bT交互过的用户用户账户集合,P、Q分别是E3(也即第三嵌入矩阵信息)中用户用户账户、对象的嵌入表示矩阵,本公式的含义即上述第三个通道得到的嵌入表示矩阵中信息进行相应的点乘处理。。
最终,对于用户u对于对象v发生目标行为bT的预测概率,也即用户μ对于对象ν的喜欢程度,是上述两部分的结合:
Figure BDA0003721708370000151
其中,
Figure BDA0003721708370000152
是通过超图捕获的全局结构信息的评分,
Figure BDA0003721708370000153
是通过局部的协同过滤信息的评分,通过这两项评分的结合,可以完成高效的推荐信息。
在步骤S204中,基于推荐信息向用户账户推荐至少两个待推荐对象。假设推荐信息是分值,在本步骤中可以分值的顺序为用户推荐这100个对象,或者从所有对象中挑选前50个得分靠前的对象推荐给用户。
图3是根据一示例性实施例示出的一种推荐模型的训练方法的流程图,如图3所示,推荐模型包括超图卷积网络和推荐网络,推荐模型的训练方法包括以下步骤:
在步骤S301中,获取训练数据,其中,训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户和对象之间的行为的行为标识。上述训练数据的元组可以是不定长元组,不定长元组的形式可以表征为“用户-对象-行为1-行为2-……”,每一个不定长元组的含义是用户和对象之间发生了行为1,行为2,……的交互,元组的具体的表征形式可以通过multi-hot编码的形式进行对齐和记录。上述对象可以是商品,如视频、音乐等等。需要说明的是,上述元组只需要用户、对象和行为的标识即可,不需要任何形式的用户和对象的实体内容。
在步骤S302中,基于多个元组构建以用户账户、对象标识和行为标识为节点的超图。例如,在获取到训练数据后,将训练数据中元组的每一个用户、对象和行为都视为图中的一个节点,将训练数据中每一个元组视为一个超边,将训练数据重构为一整张超图,使用该超图进行建模的优势是能够有效的建模多种行为同时发生的复杂语义场景。例如,在线上系统中点赞和转发两种行为常常会关联在一起,那么在该超图中,就会有多条超边同时连接点赞和转发两个行为节点,在后续的卷积过程中,两节点之间就会有显著的信息传播,从而使得两节点在嵌入空间有强烈的相似性。
根据本公开的示例性实施例,基于多个元组构建以用户账户、对象标识和行为标识为节点的超图,包括以下至少之一:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。根据本实施例,通过目标行为划分出两个超图,即包含目标行为的超图和不包含目标行为的超图,将超图划分为更相关的第一超图,更不相关的第二超图,如此在获取嵌入表示信息时,通过相关性和不相关性的分类,可以方便后续更好的学习用户、商品和行为的嵌入表示信息,而且有助于推荐模型学习预测目标行为的关键信息。
根据本公开的示例性实施例,基于多个元组构建以用户账户、对象标识和行为标识为节点的超图,还包括:基于目标元组构建以用户账户和对象标识为节点的第三超图。根据本实施例,通过目标行为进一步划分出第三超图,增加单独考虑目标行为对应的用户和对象的相关信息,辅助后续获取更好的学习用户、商品和行为的嵌入表示信息。
在步骤S303中,将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的预估嵌入表示信息。
根据本公开的示例性实施例,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,将超图的信息输入超图卷积网络,得到训练数据中用户账户、对象和行为的预估嵌入表示信息,包括:将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一预估嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息和权重系数,得到预估嵌入表示信息。根据本实施例,分别对两个超图的信息进行超图卷积,得到各自的嵌入表示信息,将各自的嵌入表示信息结合既可以得到更丰富的总的嵌入表示信息,也即可以学习到更好的嵌入表示信息,且引入可学习权重信息,也可以辅助获取更好的嵌入表示信息。
根据本公开的示例性实施例,超图卷积网络还包括第三超图卷积网络,将超图的信息输入超图卷积网络,得到训练数据中用户账户、对象和行为的预估嵌入表示信息,包括:将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息和权重系数,得到预估嵌入表示信息,包括:基于第一预估嵌入表示信息、第二预估嵌入表示信息、第三预估嵌入表示信息和权重系数,得到预估嵌入表示信息。根据本实施例,分别对三个超图的信息进行超图卷积,得到各自的嵌入表示信息,将各自的嵌入表示信息结合既可以得到更丰富的总的嵌入表示信息,也即可以学习到更好的嵌入表示信息,且引入可学习权重信息,也可以辅助获取更好的嵌入表示信息。
返回图3,在步骤S304中,将任意目标元组中的第一训练用户账户和第一对象标识作为训练正样本,其中,目标元组是多个元组中包含目标行为的行为标识的元组。例如,可以从训练数据中筛选出所有含有目标行为的任意一个元组中的“用户-对象”对,将其作为训练正样本。
在步骤S305中,将任意非目标元组中的第二对象标识和第一训练用户账户作为训练负样本,其中,非目标元组是多个元组中除目标元组之外的元组。例如,针对每一个训练正样本,可以同时进行一次负采样,即针对该用户随机抽取一个未发生过目标行为的对象,构成“用户-对象”对作为训练负样本。
在步骤S306中,将训练正样本和和预估嵌入表示信息输入到推荐网络,得到第一对象标识对应的对象的第一预估推荐信息,其中,第一预估推荐信息表示第一训练用户账户对第一对象标识对应的对象产生的行为是目标行为的概率。例如,可以采用打分的形式,即上述第一预估推荐信息可以是分值,当然也可以采用其他任何形式,本公开对此并不进行限定。
在步骤S307中,将训练负样本分别和预估嵌入表示信息输入到推荐网络,得到第二对象标识对应的对象的第二预估推荐信息,其中,第二预估推荐信息表示第一训练用户账户对第二对象标识对应的对象产生的行为是目标行为的概率。例如,可以采用打分的形式,即上述第二预估推荐信息可以是分值,当然也可以采用其他任何形式,本公开对此并不进行限定。
根据本公开的示例性实施例,推荐网络包括第一推荐网络和第二推荐网络,将预估嵌入表示信息、训练正样本和训练负样本输入到推荐网络,得到第一对象标识对应的对象的第一预估推荐信息和第二对象标识对应的对象的第二预估推荐信息,包括:将预估嵌入表示信息、训练正样本输入到第一推荐网络,得到第一预估推荐子信息;将预估嵌入表示信息、训练负样本输入到第一推荐网络,得到第二预估推荐子信息;获取第一用户标识对应的用户通过目标行为交互过的对象的对象标识集合、第一对象标识对应的对象通过目标行为交互过的用户的第一用户标识集合和第二对象标识对应的对象通过目标行为交互过的用户的第二用户标识集合;将第三预估嵌入表示信息、对象标识集合和第一用户标识集合输入到第二推荐网络,得到训练正样本的第三预估推荐子信息;将第三预估嵌入表示信息、对象标识集合和第二用户标识集合输入到第二推荐网络,得到训练负样本的第四预估推荐子信息;基于第一预估推荐子信息和第三预估推荐子信息,得到第一预估推荐信息;基于第二预估推荐子信息和第四预估推荐子信息,得到第二预估推荐信息。根据本实施例,一方面通过超图卷积获取全局信息来确定第一预估推荐子信息和第二预估推荐子信息,另一方面通过局部的协同过滤信息(也即交互过的信息)确定第三预估推荐子信息和第四预估推荐子信息,进而基于两部分推荐子信息确定第一推荐信息和第二推荐信息,即考虑了全局信息,也考虑了局部信息,增加了推荐信息的准确性。
返回图3,在步骤S308中,通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
根据本公开的示例性实施例,训练数据还包括训练数据中每种行为的实际转换率,实际转化率是每种行为实际转换为目标行为的概率;通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练,包括:基于第一预估推荐信息和第二预估推荐信息确定第一损失;获取推荐模型的中间层输出的预估转化率,其中,预估转化率是训练数据中每种行为预估转换为目标行为的概率;基于预估转化率和实际转换率确定第二损失;基于最大化第一损失和最小化第二损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。根据本实施例,通过训练数据中行为转化为目标行为的概率,辅助推荐模型的训练,由于目标行为可以根据需要设定,可以设定为用户感兴趣视频时所做的行为,所以通过行为是目标行为的概率来辅助训练推荐模型,可以使基于训练出的推荐模型得到的推荐信息所推荐的对象更符合用户所需。
例如,对推荐模型的训练可以分为两个部分进行协同训练:
第一部分是主要的推荐任务,这部分可以采用传统的正负采样和贝叶斯个性化排序(Bayesian Personalized Ranking,缩写为BPR)损失函数进行训练,即通过最大化训练正样本和训练负样本的评分差来优化推荐模型,同时还可以约束推荐模型所有参数的二范数,具体如下:
Figure BDA0003721708370000181
其中,yui是训练正样本的评分,yuj是训练负样本的评分,σ和λ是超参数,Θ代表推荐模型所有参数。
第二部分是辅助的转化率预测任务,这部分是利用行为的嵌入表示矩阵KL预测每种行为转化为目标行为的概率,预测器是一个单层的多层感知机(MultilayerPerceptron,缩写为MLP),损失函数
Figure BDA0003721708370000191
可以使用均方误差(Mean Square Error,缩写为MSE)。
最终的损失函数是两部分的损失函数的加权和:
Figure BDA0003721708370000192
其中,β是控制辅助任务尺度的超参数。
需要说明的是,图4是根据一示例性实施例示出的一种推荐模型的结构示意图,整体推荐模型的结构可以如图4所示,其中,μ1、μ2、μ3表示训练数据中的用户1、用户2和用户3,
Figure BDA0003721708370000193
表示训练数据中对象1、对象2、对象3和对象4,二者之间的不同灰度的线代表二者之间的行为,而εc、εa、εf表示转化通道、辅助通道和协同过滤通道,b1、b2、b3表示行为1、行为2和行为3,
Figure BDA0003721708370000194
表示第一嵌入表示矩阵、第二嵌入表示矩阵和第三嵌入表示矩阵,EL表示嵌入表示矩阵,
Figure BDA0003721708370000195
表示预测器,即预测训练数据中行为是目标行为的概率,Rb表示训练数据中行为是目标行为的实际概率,PL、QL分别表示EL中用户、对象的嵌入表示矩阵,
Figure BDA0003721708370000196
分别表示协同过滤通道上卷积得到的用户、对象的嵌入表示矩阵。
为了验证上述实施例,本公开在两个线上的真实数据集进行了试验,相比于目前最先进的基线模型,本公开拥有1.96%-23.19%的性能提升。在冷启动用户(目标行为交互数小于5的)上,本公开的性能表现最高可以达到28.19%,也即本公开的推荐模型大大的提升了复杂语义下的基于目标行为的推荐效果。具体地,相比于其他的多行为推荐模型,本公开的推荐模型在图中嵌入了行为节点,行为的表征可以感知整个数据集上的全局结构信息,拥有复杂的语义,通过下游任务的约束或者设计自监督的辅助任务,也可以提升推荐性能,以帮助下游任务。
综上,本公开将每一种行为也视为图中的一个节点,利用超图的框架重新定义了多行为推荐问题,完成了对于多行为的编码,进一步地,通过划分转化-辅助-协同过滤三个通道(Channel)进行卷积,高效的学习用户-商品-行为的嵌入表示信息,最终还引入了自监督学习模块,通过行为表示预测目标行为转化率的辅助任务,辅助推荐模型更好的学习用户的偏好信息和对象的特征。因此,本公开在复杂语义下的多行为推荐场景下,高效的编码多行为交互数据,并学习每种行为的嵌入表示,利用该嵌入表示可以高效的进行目标行为的推荐,提升了多行为推荐场景下目标行为的推荐性能,进而提升对象的推荐的准确性。
图5是根据一示例性实施例示出的一种推荐装置的框图,如图5所示,推荐装置基于推荐模型实现,推荐模型包括超图卷积网络和推荐网络,推荐装置包括:
标识获取单元50,被配置为获取待推荐对象的用户账户和至少两个待推荐对象的对象标识;嵌入表示信息获取单元52,被配置为将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户对对象产生的行为的行为标识,超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图,超图的边为连接一个元组中训练用户账户、对象标识和行为标识中至少两个节点的线;推荐信息获取单元54,被配置为将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到推荐网络,得到每个待推荐对象的推荐信息,其中,推荐信息表示用户账户对相应的待推荐对象产生的行为是目标行为的概率,训练数据包括目标行为;推荐单元56,被配置为基于推荐信息向用户账户推荐至少两个待推荐对象。
根据本公开的示例性实施例,超图包括以下至少之一:第一超图、第二超图,第一超图和第二超图通过如下方式构建:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。
根据本公开的示例性实施例,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,嵌入表示信息获取单元52,还被配置为将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息和权重系数,得到嵌入表示信息。
根据本公开的示例性实施例,超图还包括通过如下方式构建的第三超图:基于目标元组构建以用户账户和对象标识为节点的第三超图。
根据本公开的示例性实施例,超图卷积网络还包括第三超图卷积网络,嵌入表示信息获取单元52,还被配置为将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三嵌入表示信息;基于第一嵌入表示信息、第二嵌入表示信息、第三嵌入表示信息和权重系数,得到嵌入表示信息。
根据本公开的示例性实施例,推荐网络包括第一推荐网络和第二推荐网络,推荐信息获取单元54,被配置为将嵌入表示信息、用户账户和至少两个待推荐对象的对象标识输入到第一推荐网络,得到每个待推荐对象的第一推荐子信息,第一推荐子信息是基于用户账户和至少两个待推荐对象的对象标识在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;获取用户账户通过目标行为交互过的对象的对象标识集合、每个待推荐对象通过目标行为交互过的用户账户的用户账户集合;将嵌入表示信息、对象标识集合和每个用户账户集合输入到第二推荐网络,得到每个待推荐对象的第二推荐子信息,第二推荐子信息是基于对象标识集合和每个用户账户集合在超图中的信息,确定的用户账户对相应的待推荐对象产生的行为是目标行为的概率;基于第一推荐子信息和第二推荐子信息,得到每个待推荐对象的推荐信息。
图6是根据一示例性实施例示出的一种推荐模型的训练装置的框图,如图6所示,推荐模型包括超图卷积网络和推荐网络,推荐模型的训练装置包括:
训练数据获取单元60,被配置为获取训练数据,其中,训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练用户账户、一个对象的对象标识、训练用户账户和对象之间的行为的行为标识;超图获取单元62,被配置为基于多个元组构建以用户账户、对象标识和行为标识为节点的超图;预估嵌入表示信息获取单元64,被配置为将超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的预估嵌入表示信息;正样本获取单元66,被配置为将任意目标元组中的第一训练用户账户和第一对象标识作为训练正样本,其中,目标元组是多个元组中包含目标行为的行为标识的元组;负样本获取单元68,被配置为将任意非目标元组中的第二对象标识和第一训练用户账户作为训练负样本,其中,非目标元组是多个元组中除目标元组之外的元组;第一预估推荐信息获取单元610,被配置为将训练正样本和和预估嵌入表示信息输入到推荐网络,得到第一对象标识对应的对象的第一预估推荐信息,其中,第一预估推荐信息表示第一训练用户账户对第一对象标识对应的对象产生的行为是目标行为的概率;第二预估推荐信息获取单元612,被配置为将训练负样本分别和预估嵌入表示信息输入到推荐网络,得到第二对象标识对应的对象的第二预估推荐信息,其中,第二预估推荐信息表示第一训练用户账户对第二对象标识对应的对象产生的行为是目标行为的概率;训练单元614,被配置为通过最大化第一预估推荐信息和第二预估推荐信息的损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
根据本公开的示例性实施例,超图获取单元62,还被配置为以下至少之一:基于目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,目标元组是多个元组中包含目标行为的行为标识的元组;基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,非目标元组是多个元组中除目标元组之外的元组。
根据本公开的示例性实施例,在超图包括第一超图和第二超图的情况下,超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,预估嵌入表示信息获取单元64,还被配置为将第一超图的信息输入第一超图卷积网络,得到训练数据中训练用户账户、对象和行为的第一预估嵌入表示信息;将第二超图的信息输入第二超图卷积网络,得到训练数据中训练用户账户、对象和行为的第二预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息和权重系数,得到预估嵌入表示信息。
根据本公开的示例性实施例,超图获取单元62,还被配置为基于目标元组构建以用户账户和对象标识为节点的第三超图。
根据本公开的示例性实施例,超图卷积网络还包括第三超图卷积网络,预估嵌入表示信息获取单元64,还被配置为将第三超图的信息输入第三超图卷积网络,得到训练数据中训练用户账户和对象的第三预估嵌入表示信息;基于第一预估嵌入表示信息、第二预估嵌入表示信息、第三预估嵌入表示信息和权重系数,得到预估嵌入表示信息。
根据本公开的示例性实施例,训练数据还包括训练数据中每种行为的实际转换率,实际转化率是每种行为实际转换为目标行为的概率;训练单元614,还被配置为基于第一预估推荐信息和第二预估推荐信息确定第一损失;获取推荐模型的中间层输出的预估转化率,其中,预估转化率是训练数据中每种行为预估转换为目标行为的概率;基于预估转化率和实际转换率确定第二损失;基于最大化第一损失和最小化第二损失,调整超图卷积网络和推荐网络的参数,对推荐模型进行训练。
根据本公开的实施例,可提供一种电子设备。图7是根据本公开实施例的一种电子设备700的框图,该电子设备包括至少一个存储器701和至少一个处理器702,所述至少一个存储器中存储有计算机可执行指令集合,当计算机可执行指令集合被至少一个处理器执行时,执行根据本公开实施例的推荐模型的训练方法和/或推荐方法。
作为示例,电子设备700可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备1000并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备700还可以是集成控制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。
在电子设备700中,处理器702可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,处理器702还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
处理器702可运行存储在存储器中的指令或代码,其中,存储器701还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可采用任何已知的传输协议。
存储器701可与处理器702集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器701可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器701和处理器702可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器702能够读取存储在存储器701中的文件。
此外,电子设备700还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备的所有组件可经由总线和/或网络而彼此连接。
根据本公开的实施例,还可提供一种计算机可读存储介质,其中,当计算机可读存储介质中的指令被至少一个处理器运行时,促使至少一个处理器执行本公开实施例的推荐模型的训练方法和/或推荐方法。这里的计算机可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
根据本公开实施例,提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现本公开实施例的推荐模型的训练方法和/或推荐方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (17)

1.一种推荐方法,其特征在于,所述推荐方法基于推荐模型实现,所述推荐模型包括超图卷积网络和推荐网络,所述推荐方法包括:
获取待推荐对象的用户账户和至少两个待推荐对象的对象标识;
将超图的信息输入所述超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,所述训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、所述训练用户账户对所述对象产生的行为的行为标识,所述超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图,所述超图的边为连接一个元组中训练用户账户、对象标识和行为标识中至少两个节点的线;
将所述嵌入表示信息、所述用户账户和所述至少两个待推荐对象的对象标识输入到所述推荐网络,得到每个待推荐对象的推荐信息,其中,所述推荐信息表示所述用户账户对相应的待推荐对象产生的行为是目标行为的概率,所述训练数据包括所述目标行为;
基于所述推荐信息向所述用户账户推荐所述至少两个待推荐对象。
2.如权利要求1所述的推荐方法,其特征在于,所述超图包括以下至少之一:第一超图、第二超图,所述第一超图和所述第二超图通过如下方式构建:
基于所述目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,所述目标元组是所述多个元组中包含目标行为的行为标识的元组;
基于非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,所述非目标元组是所述多个元组中除所述目标元组之外的元组。
3.如权利要求2所述的推荐方法,其特征在于,在所述超图包括所述第一超图和所述第二超图的情况下,所述超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,
所述将所述超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,包括:
将所述第一超图的信息输入所述第一超图卷积网络,得到所述训练数据中训练用户账户、对象和行为的第一嵌入表示信息;
将所述第二超图的信息输入所述第二超图卷积网络,得到所述训练数据中训练用户账户、对象和行为的第二嵌入表示信息;
基于所述第一嵌入表示信息、所述第二嵌入表示信息和所述权重系数,得到所述嵌入表示信息。
4.如权利要求3所述的推荐方法,其特征在于,所述超图还包括通过如下方式构建的第三超图:
基于所述目标元组构建以用户账户和对象标识为节点的第三超图。
5.如权利要求4所述的推荐方法,其特征在于,所述超图卷积网络还包括第三超图卷积网络,
所述将所述超图的信息输入超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,包括:
将所述第三超图的信息输入所述第三超图卷积网络,得到所述训练数据中训练用户账户和对象的第三嵌入表示信息;
所述基于所述第一嵌入表示信息、所述第二嵌入表示信息和所述权重系数,得到所述嵌入表示信息,包括:
基于所述第一嵌入表示信息、所述第二嵌入表示信息、所述第三嵌入表示信息和所述权重系数,得到所述嵌入表示信息。
6.如权利要求2所述的推荐方法,其特征在于,所述推荐网络包括第一推荐网络和第二推荐网络,
所述将所述嵌入表示信息、所述用户账户和所述至少两个待推荐对象的对象标识输入到所述推荐网络,得到每个待推荐对象的推荐信息,包括:
将所述嵌入表示信息、所述用户账户和所述至少两个待推荐对象的对象标识输入到所述第一推荐网络,得到每个待推荐对象的第一推荐子信息,所述第一推荐子信息是基于所述用户账户和所述至少两个待推荐对象的对象标识在超图中的信息,确定的所述用户账户对相应的待推荐对象产生的行为是所述目标行为的概率;
获取所述用户账户通过所述目标行为交互过的对象的对象标识集合、每个待推荐对象通过所述目标行为交互过的用户账户的用户账户集合;
将所述嵌入表示信息、所述对象标识集合和每个用户账户集合输入到所述第二推荐网络,得到每个待推荐对象的第二推荐子信息,所述第二推荐子信息是基于所述对象标识集合和每个用户账户集合在超图中的信息,确定的所述用户账户对相应的待推荐对象产生的行为是所述目标行为的概率;
基于所述第一推荐子信息和所述第二推荐子信息,得到每个待推荐对象的推荐信息。
7.一种推荐模型的训练方法,其特征在于,所述推荐模型包括超图卷积网络和推荐网络,所述训练方法包括:
获取训练数据,其中,所述训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练用户账户、一个对象的对象标识、所述训练用户账户和所述对象之间的行为的行为标识;
基于所述多个元组构建以用户账户、对象标识和行为标识为节点的超图;
将所述超图的信息输入所述超图卷积网络,得到所述训练数据中训练用户账户、对象和行为的预估嵌入表示信息;
将任意目标元组中的第一训练用户账户和第一对象标识作为训练正样本,其中,所述目标元组是所述多个元组中包含所述目标行为的行为标识的元组;
将任意非目标元组中的第二对象标识和所述第一训练用户账户作为训练负样本,其中,所述非目标元组是所述多个元组中除所述目标元组之外的元组;
将所述训练正样本和和所述预估嵌入表示信息输入到所述推荐网络,得到所述第一对象标识对应的对象的第一预估推荐信息,其中,所述第一预估推荐信息表示所述第一训练用户账户对所述第一对象标识对应的对象产生的行为是所述目标行为的概率;
将所述训练负样本分别和所述预估嵌入表示信息输入到所述推荐网络,得到所述第二对象标识对应的对象的第二预估推荐信息,其中,所述第二预估推荐信息表示所述第一训练用户账户对所述第二对象标识对应的对象产生的行为是所述目标行为的概率;
通过最大化所述第一预估推荐信息和所述第二预估推荐信息的损失,调整所述超图卷积网络和所述推荐网络的参数,对所述推荐模型进行训练。
8.如权利要求7所述的训练方法,其特征在于,所述基于所述多个元组构建以用户账户、对象标识和行为标识为节点的超图,包括以下至少之一:
基于所述目标元组构建以用户账户、对象标识和行为标识为节点的第一超图,其中,所述目标元组是所述多个元组中包含目标行为的行为标识的元组;
基于所述非目标元组构建以用户账户、对象标识和行为标识为节点的第二超图,其中,所述非目标元组是所述多个元组中除所述目标元组之外的元组。
9.如权利要求8所述的训练方法,其特征在于,在所述超图包括所述第一超图和所述第二超图的情况下,所述超图卷积网络包括第一超图卷积网络、第二超图卷积网络和权重系数,
所述将所述超图的信息输入超图卷积网络,得到训练数据中用户账户、对象和行为的预估嵌入表示信息,包括:
将所述第一超图的信息输入所述第一超图卷积网络,得到所述训练数据中训练用户账户、对象和行为的第一预估嵌入表示信息;
将所述第二超图的信息输入所述第二超图卷积网络,得到所述训练数据中训练用户账户、对象和行为的第二预估嵌入表示信息;
基于所述第一预估嵌入表示信息、所述第二预估嵌入表示信息和所述权重系数,得到所述预估嵌入表示信息。
10.如权利要求9所述的训练方法,其特征在于,所述基于所述多个元组构建以用户账户、对象标识和行为标识为节点的超图,还包括:
基于所述目标元组构建以用户账户和对象标识为节点的第三超图。
11.如权利要求10所述的训练方法,其特征在于,所述超图卷积网络还包括第三超图卷积网络,
所述将所述超图的信息输入超图卷积网络,得到训练数据中用户账户、对象和行为的预估嵌入表示信息,包括:
将所述第三超图的信息输入所述第三超图卷积网络,得到所述训练数据中训练用户账户和对象的第三预估嵌入表示信息;
所述基于所述第一预估嵌入表示信息、所述第二预估嵌入表示信息和所述权重系数,得到所述预估嵌入表示信息,包括:
基于所述第一预估嵌入表示信息、所述第二预估嵌入表示信息、所述第三预估嵌入表示信息和所述权重系数,得到所述预估嵌入表示信息。
12.如权利要求7所述的训练方法,其特征在于,所述训练数据还包括所述训练数据中每种行为的实际转换率,所述实际转化率是每种行为实际转换为所述目标行为的概率;
所述通过最大化所述第一预估推荐信息和所述第二预估推荐信息的损失,调整所述超图卷积网络和所述推荐网络的参数,对所述推荐模型进行训练,包括:
基于所述第一预估推荐信息和所述第二预估推荐信息确定第一损失;
获取所述推荐模型的中间层输出的预估转化率,其中,所述预估转化率是所述训练数据中每种行为预估转换为所述目标行为的概率;
基于所述预估转化率和所述实际转换率确定第二损失;
基于最大化所述第一损失和最小化所述第二损失,调整所述超图卷积网络和所述推荐网络的参数,对所述推荐模型进行训练。
13.一种推荐装置,其特征在于,所述推荐装置基于推荐模型实现,所述推荐模型包括超图卷积网络和推荐网络,所述推荐装置包括:
标识获取单元,被配置为获取待推荐对象的用户账户和至少两个待推荐对象的对象标识;
嵌入表示信息获取单元,被配置为将超图的信息输入所述超图卷积网络,得到训练数据中训练用户账户、对象和行为的嵌入表示信息,其中,所述训练数据包括多个元组,每个元组包括一个训练用户账户、一个对象的对象标识、所述训练用户账户对所述对象产生的行为的行为标识,所述超图是基于训练数据中的多个元组构建的以训练用户账户、对象标识和行为标识为节点的图,所述超图的边为连接一个元组中训练用户账户、对象标识和行为标识中至少两个节点的线;
推荐信息获取单元,被配置为将所述嵌入表示信息、所述用户账户和所述至少两个待推荐对象的对象标识输入到所述推荐网络,得到每个待推荐对象的推荐信息,其中,所述推荐信息表示所述用户账户对相应的待推荐对象产生的行为是目标行为的概率,所述训练数据包括所述目标行为;
推荐单元,被配置为基于所述推荐信息向所述用户账户推荐所述至少两个待推荐对象。
14.一种推荐模型的训练装置,其特征在于,所述推荐模型包括超图卷积网络和推荐网络,所述训练装置包括:
训练数据获取单元,被配置为获取训练数据,其中,所述训练数据包括多个元组和目标行为的行为标识,每个元组包括一个训练用户账户、一个对象的对象标识、所述训练用户账户和所述对象之间的行为的行为标识;
超图获取单元,被配置为基于所述多个元组构建以用户账户、对象标识和行为标识为节点的超图;
预估嵌入表示信息获取单元,被配置为将所述超图的信息输入所述超图卷积网络,得到所述训练数据中训练用户账户、对象和行为的预估嵌入表示信息;
正样本获取单元,被配置为将任意目标元组中的第一训练用户账户和第一对象标识作为训练正样本,其中,所述目标元组是所述多个元组中包含所述目标行为的行为标识的元组;
负样本获取单元,被配置为将任意非目标元组中的第二对象标识和所述第一训练用户账户作为训练负样本,其中,所述非目标元组是所述多个元组中除所述目标元组之外的元组;
第一预估推荐信息获取单元,被配置为将所述训练正样本和和所述预估嵌入表示信息输入到所述推荐网络,得到所述第一对象标识对应的对象的第一预估推荐信息,其中,所述第一预估推荐信息表示所述第一训练用户账户对所述第一对象标识对应的对象产生的行为是所述目标行为的概率;
第二预估推荐信息获取单元,被配置为将所述训练负样本分别和所述预估嵌入表示信息输入到所述推荐网络,得到所述第二对象标识对应的对象的第二预估推荐信息,其中,所述第二预估推荐信息表示所述第一训练用户账户对所述第二对象标识对应的对象产生的行为是所述目标行为的概率;
训练单元,被配置为通过最大化所述第一预估推荐信息和所述第二预估推荐信息的损失,调整所述超图卷积网络和所述推荐网络的参数,对所述推荐模型进行训练。
15.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的推荐方法和/或如权利要求7至12中任一项所述的推荐模型的训练方法。
16.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1至6中任一项所述的推荐方法和/或如权利要求7至12中任一项所述的推荐模型的训练方法。
17.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现如权利要求1至6中任一项所述的推荐方法和/或如权利要求7至12中任一项所述的推荐模型的训练方法。
CN202210764376.4A 2022-06-29 2022-06-29 推荐方法及装置、推荐模型的训练方法及装置 Pending CN115080856A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210764376.4A CN115080856A (zh) 2022-06-29 2022-06-29 推荐方法及装置、推荐模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210764376.4A CN115080856A (zh) 2022-06-29 2022-06-29 推荐方法及装置、推荐模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN115080856A true CN115080856A (zh) 2022-09-20

Family

ID=83257885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210764376.4A Pending CN115080856A (zh) 2022-06-29 2022-06-29 推荐方法及装置、推荐模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN115080856A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116340643A (zh) * 2023-05-29 2023-06-27 苏州浪潮智能科技有限公司 对象推荐的调整方法及装置、存储介质、电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116340643A (zh) * 2023-05-29 2023-06-27 苏州浪潮智能科技有限公司 对象推荐的调整方法及装置、存储介质、电子设备

Similar Documents

Publication Publication Date Title
CN111931062B (zh) 一种信息推荐模型的训练方法和相关装置
CN110781321B (zh) 一种多媒体内容推荐方法及装置
TWI702844B (zh) 用戶特徵的生成方法、裝置、設備及儲存介質
US20190364123A1 (en) Resource push method and apparatus
US20180253657A1 (en) Real-time credit risk management system
CN111125428B (zh) 基于评分预测函数拟合结构的时间相关电影推荐方法
CN112989179B (zh) 模型训练、多媒体内容推荐方法和装置
CN112948681B (zh) 一种融合多维度特征的时间序列数据推荐方法
CN115080856A (zh) 推荐方法及装置、推荐模型的训练方法及装置
CN112269943B (zh) 一种信息推荐系统及方法
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
WO2023087933A1 (zh) 内容推荐方法、装置、设备、存储介质及程序产品
CN116662527A (zh) 用于生成学习资源的方法及相关产品
CN115618079A (zh) 会话推荐方法、装置、电子设备及存储介质
CN115409579A (zh) 一种基于元学习的响应式推荐方法、系统及设备
US20140324524A1 (en) Evolving a capped customer linkage model using genetic models
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
CN114254151A (zh) 搜索词推荐模型的训练方法、搜索词推荐方法和装置
CN115878839A (zh) 一种视频推荐方法、装置、计算机设备和计算机程序产品
CN112231546A (zh) 异构文档的排序方法、异构文档排序模型训练方法及装置
CN111860870A (zh) 交互行为确定模型的训练方法、装置、设备及介质
CN110929528A (zh) 对语句情感分析的方法、装置、服务器及存储介质
CN114125462B (zh) 视频处理方法及装置
CN115309975B (zh) 基于交互特征的产品推荐方法及系统
US11836168B1 (en) Systems and methods for generating dynamic human-like conversational responses using a modular architecture featuring layered data models in non-serial arrangements with gated neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination