CN112307256A - 一种跨域推荐及模型训练的方法和装置 - Google Patents

一种跨域推荐及模型训练的方法和装置 Download PDF

Info

Publication number
CN112307256A
CN112307256A CN202011176572.7A CN202011176572A CN112307256A CN 112307256 A CN112307256 A CN 112307256A CN 202011176572 A CN202011176572 A CN 202011176572A CN 112307256 A CN112307256 A CN 112307256A
Authority
CN
China
Prior art keywords
target
sample data
node
deep neural
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011176572.7A
Other languages
English (en)
Inventor
曾涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
You Peninsula Beijing Information Technology Co ltd
Original Assignee
You Peninsula Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by You Peninsula Beijing Information Technology Co ltd filed Critical You Peninsula Beijing Information Technology Co ltd
Priority to CN202011176572.7A priority Critical patent/CN112307256A/zh
Publication of CN112307256A publication Critical patent/CN112307256A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种跨域推荐及模型训练的方法和装置,其中所述模型训练方法包括:获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络;基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点;基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。本实施例通过图表示算法以及协同训练出的多个深度神经网络,能够挖掘出节点之间隐藏的高阶关系,提升模型的泛化能力和稳定性。

Description

一种跨域推荐及模型训练的方法和装置
技术领域
本申请实施例涉及自动化推荐技术,尤其涉及一种跨域推荐及模型训练的方法和装置。
背景技术
随着互联网技术的发展,越来越多的用户使用直播、短视频应用程序来观看直播或者短视频,虽然直播场景与短视频场景分别属于不同的域,消费行为习惯差异化较大,但两者会有一些共同用户,称为桥梁用户(bridge users),如果通过桥梁用户和直播、短视频这两个域里的用户的行为数据实现跨域推荐,例如给短视频域里的一些潜在用户推荐直播域里的相关直播,可以提升直播用户渗透。
在相关技术中,一种跨域推荐的方法为,通过用户偏好标签给短视频域里的潜在用户推荐相同偏好标签的主播,但由于直播内容经常变化,相应偏好标签需要实时更新,目前技术上比较难实现机器实时更新直播间标签,另一方面两种域里标签重合度比较低,泛化性比较差,推荐效果一般。
发明内容
本申请提供一种跨域推荐及模型训练的方法和装置,用以提高跨域推荐的推荐效果。
第一方面,本申请实施例提供了一种模型训练的方法,所述方法包括:
获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络;
基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点;
基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
第二方面,本申请实施例还提供了一种跨域推荐的方法,所述方法包括:
确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示,并存储所述向量表示;
当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;
计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;
根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
第三方面,本申请实施例还提供了一种模型训练装置,所述装置包括:
图网络建立模块,用于获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络;
样本数据生成模块,用于基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点;
模型训练模块,用于基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
第四方面,本申请实施例还提供了一种跨域推荐装置,所述装置包括:
向量确定模块,用于确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示,并存储所述向量表示;
向量查找模块,用于当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;
匹配度计算模块,用于计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;
推荐模块,用于根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
第五方面,本申请实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法。
第六方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的方法。
本申请具有如下有益效果:
在本实施例中,通过联合至少两种内容场景下各消费者账户的交互行为数据来建立目标图网络,并基于目标图网络进行采样,生成样本数据集合,该样本数据集合中的各样本数据包括目标图网络中的源节点,以及基于所述源节点采样生成的目标节点,从而丰富样本数量。然后基于样本数据集合协同训练多个深度神经网络模型,该深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型,通过图表示算法以及协同训练出的多个深度神经网络,能够挖掘出节点之间隐藏的高阶关系,提升模型的泛化能力和稳定性。
进一步地,通过深度神经网络模型确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示以后,当接收到某个内容场景下的目标消费者账户发送的请求时,可以快速查找出该目标消费者账户的向量表示,并根据其他内容场景下的各提供者账户的向量表示,计算与目标消费者账户的向量表示的匹配度,从而召回偏好相似的目标提供者账户提供给目标消费者账户,从而实现跨域推荐,提升用户在不同场景域的渗透。
附图说明
图1是本申请实施例一提供的一种模型训练的方法实施例的流程图;
图2是本申请实施例二提供的一种模型训练的方法实施例的流程图;
图3是本申请实施例二提供的目标图网络示意图;
图4是本申请实施例二提供的模型训练过程示意图;
图5是本申请实施例三提供的一种模型训练的方法实施例的流程图;
图6是本申请实施例四提供的一种跨域推荐的方法实施例的流程图;
图7是本申请实施例五提供的一种模型训练装置实施例的结构框图;
图8是本申请实施例六提供的一种跨域推荐装置实施例的结构框图;
图9是本申请实施例七提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
实施例一
图1为本申请实施例一提供的一种模型训练的方法实施例的流程图,具体可以包括如下步骤:
步骤101,获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络。
在一种示例中,至少两种内容场景可以为同一个应用程序APP中的至少两种类型内容或者至少两个功能模块。例如,在视频应用程序中,至少两种内容场景可以包括用于提供短视频的短视频场景,以及,用于提供直播的直播场景。则本实施例可以由该应用程序对应的服务进程执行。
交互行为数据可以为消费者账户在某个内容场景下发生交互的行为数据,例如,在短视频场景中,消费者账户的交互行为数据可以为用户对短视频拍客发布的短视频的播放、点赞、分享、评论、关注等行为;在直播场景中,消费者账户的交互行为数据可以为用户对主播发布的视频的观看、付费、关注等行为。
在本实施例中,可以联合至少两种内容场景下各消费者账户的交互行为数据来建立目标图网络,该目标图网络可以包括用于表示至少两种内容场景的多种节点类型以及多种边类型。例如,对于直播场景以及短视频场景这两种不同域的场景的目标图网络中,可以包括用户、主播和拍客等节点类型,以及,包括观看、付费、关注、点赞、分享等边类型。
在一种实施方式中,可以从该至少两种内容场景下各账户中查找出同属于该至少两种内容场景的桥梁账户,并根据桥梁账户来建立目标图网络。
步骤102,基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点。
在该步骤中,得到目标图网络以后,可以根据目标图网络中的各节点,生成用于进行模型训练的样本数据。为了丰富样本数据的数量,提升模型训练的充分程度以及提高模型的准确性,可以对目标图网络进行采样,针对该目标图网络中的各源节点生成多个目标节点,其中,目标节点可以包括正样本节点和负样本节点。
在一种实施方式中,可以采用深随机游走(如deep walk)技术来生成目标节点,对于目标节点中的正样本节点和负样本节点,可以满足如下两个原则:第一个原则是一致性原则,即负样本节点和正样本节点有着一致的分布,因为如果正样本节点和负样本节点有着不一样的分布,模型就会“偷懒”地倾向于记住正样本节点和负样本节点是什么,而不是去学习节点之间的关系。第二个原则是相关性原则,即负样本节点和源节点之间具有弱相关性,因为如果负样本节点和源节点完全无关,则会导致模型过于轻易地分辨出正负样本,并且,源节点与正样本节点的相关性远大于源节点与负样本节点的相关性。
步骤103,基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
在该步骤中,当得到由样本数据组成的样本数据集合以后,可以采用协同训练的方式根据该样本数据学习多个深度神经网络DNN模型。在本实施例中,DNN模型可以包括用于向量化源节点的第一DNN模型,以及用于向量化目标节点的第二DNN模型。
在一种实施方式中,可以基于不同的节点类型和不同的边类型的组合来生成多个第一DNN模型,各第一DNN模型可以采用对应的节点类型标识和边类型标识进行标识。以及,可以基于不同的节点类型生成多个第二DNN模型,各第二DNN模型可以采用对应的节点类型标识进行标识。
在本实施例中,通过联合至少两种内容场景下各消费者账户的交互行为数据来建立目标图网络,并基于目标图网络进行采样,生成样本数据集合,该样本数据集合中的各样本数据包括目标图网络中的源节点,以及基于所述源节点采样生成的目标节点,从而丰富样本数量。然后基于样本数据集合协同训练多个深度神经网络模型,该深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型,通过图表示算法以及协同训练出的多个深度神经网络,能够挖掘出节点之间隐藏的高阶关系,提升模型的泛化能力和稳定性。
实施例二
图2为本申请实施例二提供的一种模型训练的方法实施例的流程图,本实施例在实施例一的基础上进行更具体的说明,包括如下步骤:
步骤201,获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络。
在一种实施例中,目标图网络为异构图,本实施例可以采用至少两种内容场景下各消费者账户的交互行为数据构建一个大规模的目标图网络,其中,该目标图网络中可以包括多种节点类型以及多种边类型。
在一种实施方式中,假设内容场景包括位于不用场景域的第一内容场景以及第二内容场景,在一种例子中,第一内容场景与第二内容场景可以是同一个APP中的不同功能模块或者不同类型的内容;则步骤201可以包括如下步骤:
步骤201-1,获取第一内容场景下各第一消费者账户的第一交互行为数据,所述第一交互行为数据包括一种或多种第一交互行为类型以及所述第一消费者账户交互的第一提供者账户。
例如,如图3的目标图网络示意图所示,假设第一内容场景为直播场景,第一内容场景下各第一消费者账户交互的第一提供者账户可以为主播账户,一种或多种第一交互行为类型可以包括用户对主播账户的观看、付费、关注等。
在一种实现中,可以从针对第一内容场景的日志记录或者预先创建的行为数据库中,提取第一内容场景中各第一消费者账户的第一交互行为数据,当然,也可以采用其他方式来获取该场景下的行为数据,本实施例对此不作限制。
步骤201-2,以所述第一消费者账户以及所述第一提供者账户作为节点,以所述一种或多种第一交互行为类型作为边,构建第一异构图。
在该步骤中,可以以各第一消费者账户以及第一提供者账户作为节点,以各种第一交互行为类型作为边,采用图构建方式来构建第一异构图。例如,如图3所示直播域的异构图,以用户账户(如图3所示的“U”节点)和主播账户(如图3所示的“I”节点)作为节点,以用户对主播的观看、付费、关注等行为类型作为边,构建直播域的异构图,即第一异构图。
步骤201-3,获取第二内容场景下各第二消费者账户的第二交互行为数据,所述第二交互行为数据包括一种或多种第二交互行为类型以及所述第二消费者账户交互的第二提供者账户。
在一种例子中,假设第二内容场景为短视频场景,第二内容场景下各第二消费者账户交互的第二提供者账户可以为拍客账户,一种或多种第二交互行为类型可以包括用户对拍客提供的短视频的播放、点赞、关注、分享、评论等。
在一种实现中,可以从针对第二内容场景的日志记录或者预先创建的行为数据库中,提取第二内容场景中各第二消费者账户的第二交互行为数据,当然,也可以采用其他方式来获取该场景下的行为数据,本实施例对此不作限制。
步骤201-4,以所述第二消费者账户以及所述第二提供者账户作为节点,以所述一种或多种第二交互行为类型作为边,构建第二异构图。
在一种实现中,可以以各第二消费者账户以及第二提供者账户作为节点,以各种第二交互行为类型作为边,采用图构建方式来构建第二异构图。例如,如图3所示短视频域的异构图,以用户账户(如图3所示的“U”节点)和拍客账户(如图3所示的“I”节点)作为节点,以用户对拍客提供的短视频的播放、点赞、关注、分享、评论等等行为类型作为边,构建短视频域的异构图,即第二异构图。
步骤201-5,从所述第一异构图与所述第二异构图中确定桥梁账户,并根据所述桥梁账户将所述第一异构图与所述第二异构图连接成目标图网络。
在一种例子中,例如在直播场景以及短视频场景这两种场景域中,短视频场景的拍客账户开播的话则可能成为直播场景中的主播账户,而直播场景的主播也可以拍摄短视频上传到短视频场景中。类似的,一个用户在短视频场景下是消费者用户,在直播场景下可能就是主播账户,诸如此类,也就是说,这两个不同域的场景可能会存在一些相同的账户,本实施例将两个场景域中存在的相同账户称为桥梁账户。
通过提取两个场景域中的桥梁账户,可以将第一异构图和第二异构图关联起来,例如,如图3所示,通过将直播域和短视频域中的桥梁账户提取出来,桥梁账户节点通过一种或多种类型的边分别与直播域以及短视频域中的其他节点进行连接,从而构成一个复杂的目标图网络,目标图网络是对复杂的连接关系建模,通过用户行为数据,能够更好地学的各类账户的高阶相似关系。
步骤202,基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点。
在该实施例中,当确定目标图网络以后,可以根据目标图网络生成用于模型训练的样本数据集合,样本数据集合中包括若干样本数据,各样本数据可以包括目标图网络中的源节点以及基于该源节点进行采样生成的目标节点,除此以外,样本数据还可以包括源节点及目标节点对应的属性信息。
在一种实施方式中,目标节点可以包括正样本节点以及负样本节点,步骤202可以包括如下步骤:
步骤202-1,采用随机游走算法在所述目标图网络中游走,获得多个指定长度的游走序列。
示例性地,随机游走算法可以包括有偏的随机游走算法Node2vec Walk。在一种例子中,对于目标图网络G=(VP,EQ),包括P中类型的节点以及Q种类型的边,可以从每个节点v∈VP开始游走,对于每种边Eq,使用Node2vec Walk进行K次游走,每次游走可以得到长度为k的游走序列v1→v2→...→vk。其中,K和k可以根据实际需求设定,本实施例对此不作限定。
步骤202-2,通过滑窗在各游走序列中采样,生成正例对集合,其中,正例对集合中各正例对包括所述目标图网络中的源节点,以及所述源节点对应的正样本节点,其中,所述源节点以及所述正样本节点具有对应的属性信息。
在该步骤中,针对各个游走序列,可以利用一个固定大小的滑动窗在各个游走序列中采样,窗口内的节点均分别作为正例对提出,窗口内的节点都被认为是相关性强的。在各正例对中,可以将中心节点或者第一个节点作为源节点,其他节点可以作为该源节点对应的正样本节点。
例如,假设滑窗的大小设定为2,采用滑窗在各个游走序列中采样,滑窗内的节点可以组成正例对,其中,各正例对可以包括目标图网络中的源节点以及该源节点对应的正样本节点,例如,正例对中第一个节点可以视为源节点,第二个节点可以视为该源节点的正样本节点,该正例对可以表示为(src_node,pos_node),src_node表示源节点,pos_node表示正样本节点。比如,假如滑窗(窗口大小为2)中有A、B两个节点,A是源节点src_node,B则是正样本节点。
步骤202-3,对于每个正例对,使用带权负采样方式生成多个负样本节点,其中,所述负样本节点与对应的正样本节点有着一致的分布,且所述负样本节点与对应的源节点为弱相关性;所述负样本节点具有对应的属性信息。
在该步骤中,对于步骤202-2中获得的每个正例对,可以采用负采样算法生成M个负样本节点,在本实施例中,由于对向量的距离敏感,则在进行带权负采样时可以有两个原则:
一个是一致性原则,即负采样得到的负样本节点与对应的正样本节点有着一致的分布。因为如果正负节点有着不一样的分布,模型就会“偷懒”地倾向记住正负节点是什么,而不是去学习节点之间的关系。在一种实施方式中,可以采用Alias Method(别名方法)进行带权负采样,以确保负样本节点与正样本节点的一致性。
另一个相关性原则,即负样本节点与对应的源节点为弱相关性。因为如果负样本节点和源节点完全无关,则会导致模型过于轻易地分辨出正负样本。在一种实施方式中,可以采用辅助信息或属性信息(side information)来保证负样本节点和源节点之间有弱相关性,例如,可以将负样本节点和源节点设置的国家或者语言等属性相同,使得两者具有弱相关性。
步骤202-4,将当前正例对中的源节点、正样本节点、多个负样本节点以及对应的属性信息组织成样本数据。
在本实施例,一个源节点,具有一个正样本节点和M个负样本节点,共(M+1)个目标节点,则一条样本数据可以表示为:(src_node,pos_node,{neg_node}M),其中,neg_node为负样本节点。或者,
一条样本数据可以表示为(src_node,{dst_node}M+1),每个节点除了可以包括节点标识,还可以包括用于描述该节点的属性信息,例如,主播、拍客的国家、性别、年龄等,和节点标识相比,这些属性信息具有很好的泛化能力,能够帮助提高模型的稳定性。
例如,如图4所示,对于目标图网络的各个源节点,采用随机游走walk的方式可以生成正样本节点pos,然后采用负采样(negative sampling)的方式得到多个负样本节点neg,每个节点采用节点标识(node id)和对应的属性信息(attr1,attr2,…,attrn)来描述。
步骤203,根据各样本数据对应的节点类型和边类型,将节点类型和边类型均相同的样本数据进行聚合,得到多个第一子集合。
根据上述步骤202-1~步骤202-2可知,由于在生成正例对时,是通过游走序列进行滑窗的形式得到的,因此正例对中的源节点和目标节点之间存在关联的边,这个将源节点和目标节点连接起来的边的边类型就是样本数据对应的边类型,并且,由于源节点和正样本节点之间存在着强相关性,因此可以将源节点的节点类型作为样本数据的节点类型。
在该实施例中,当得到样本数据集合以后,可以将样本数据集合中的样本数据按照节点类型和边类型进行聚合,即,将节点类型和边类型均相同的样本数据聚合成第一子集合,最终可以得到多个第一子集合。
步骤204,针对各第一子集合,根据当前第一子集合中的各样本数据的源节点以及对应的第一属性信息,训练对应的第一深度神经网络模型,其中,所述第一深度神经网络模型以当前第一子集合的节点类型标识和边类型标识进行标识。
在该步骤中,针对各第一子集合,可以根据当前第一子集合中的各样本数据的源节点以及对应的第一属性信息,训练对应的第一DNN模型,且该第一DNN模型以当前第一子集合的节点类型标识和边类型标识进行标识,该第一DNN模型用于Embedding同一节点类型和边类型的源节点。
例如,假设第一子集合的节点类型为p,边类型为q,可以采用第一子集合的所有样本数据中的源节点以及对应的第一属性信息(如图4的“src”所示)训练第一DNN模型
Figure BDA0002748849000000111
其中,src表示源节点,p表示节点类型为p,q表示边类型为q,
Figure BDA0002748849000000112
用于向量化节点类型为p,边类型为q的样本数据中的源节点。
假设目标图网络为G=(VP,EQ),包括节点类型的数量为P以及边类型的数量为Q,通过步骤203及步骤204的将节点类型和边类型进行不同的组合,可以得到P*Q个第一子集合以及P*Q个第一DNN模型。
步骤205,根据各样本数据对应的节点类型,将节点类型相同的样本数据进行聚合,得到多个第二子集合。
在该实施例中,为了保证同一个节点通过不同类型的边Embedding得到的向量能够映射到同一低维空间,可以让所有目标节点(即正节点和负节点)在所有类型的边关系中,共享相同的DNN网络。因此,当得到样本数据集合以后,可以将样本数据集合中的样本数据按照节点类型进行聚合,即,将节点类型相同的样本数据聚合成第二子集合,最终可以得到多个第二子集合。
步骤206,针对各第二子集合,根据当前第二子集合中的各样本数据的目标节点以及对应的第二属性信息,训练对应的第二深度神经网络模型,其中,所述第二深度神经网络模型以当前第二子集合的节点类型标识进行标识。
在该步骤中,针对各第二子集合,可以根据当前第二子集合中的各样本数据的目标节点(包括正样本节点以及多个负样本节点)以及对应的第二属性信息(包括正样本节点的属性信息和各负样本节点的属性信息),训练对应的第二DNN模型,且该第二DNN模型以当前第二子集合的节点类型标识进行标识,该第二DNN模型用于Embedding同一节点类型的目标节点。
例如,假设第二子集合的节点类型为p,可以采用第二子集合的所有样本数据中的目标节点以及对应的第二属性信息(如图4的“pos”和“neg1、neg2、…negk”所示)训练第二DNN模型
Figure BDA0002748849000000121
其中,dst表示目标节点,p表示节点类型为p,
Figure BDA0002748849000000122
用于向量化节点类型为p的样本数据中的目标节点。
假设目标图网络为G=(VP,EQ),包括节点类型的数量为P,通过步骤205及步骤206的将节点类型进行划分,可以得到P个第二子集合以及P个第二DNN模型。
步骤207,针对各样本数据,通过当前样本数据匹配的第一深度神经网络模型确定该样本数据的源节点向量表示,以及,通过当前样本数据匹配的第二深度神经网络模型确定该样本数据的目标节点向量表示。
通过上述步骤得到P*Q+P个DNN模型以后,针对各样本数据,可以通过匹配的第一DNN模型确定当前样本数据的源节点向量表示,以及,通过匹配的第二DNN模型确定当前样本数据的目标节点向量表示。
在一种实施方式中,步骤207可以包括如下步骤:
步骤207-1,针对各样本数据,根据当前样本数据对应的节点类型和边类型查找匹配的第一深度神经网络模型,以及,根据当前样本数据对应的节点类型查找匹配的第二深度神经网络模型。
在该步骤中,当初步生成第一DNN模型和第二DNN模型以后,可以采用样本数据对对应的第一DNN模型和第二DNN模型进行校验。具体的,针对每条样本数据,可以根据当前样本数据对应的节点类型和边类型查找相同的节点类型和边类型的第一DNN模型,作为匹配的第一DNN模型;以及,根据当前样本数据对应的节点类型查找相同的节点类型的第二DNN模型,作为匹配的第二深度神经网络模型。
步骤207-2,将当前样本数据的源节点以及对应的第一属性信息输入至该匹配的第一深度神经网络模型,获得当前样本数据的源节点对应的源节点向量表示。
在该步骤中,当确定当前样本数据匹配的第一DNN模型以后,可以将当前样本数据的源节点以及对应的第一属性信息输入至该匹配的第一DNN模型,由第一DNN模型进行处理,并输出当前样本数据的源节点对应的源节点向量表示。
步骤207-3,将当前样本数据的目标节点以及对应的第二属性信息输入至该对应的第二深度神经网络模型,获得当前样本数据的目标节点对应的目标节点向量表示。
在该步骤中,当确定当前样本数据匹配的第二DNN模型以后,可以将当前样本数据的目标节点以及对应的第二属性信息输入至该匹配的第二DNN模型,由第二DNN模型进行处理,并输出当前样本数据的目标节点对应的目标节点向量表示。
进一步地,由于目标节点可以包括正样本节点以及多个负样本节点,则目标节点向量表示可以包括与正样本节点对应的正向量表示,以及,与负样本节点对应的负向量表示。即,将当前样本数据的正样本节点以及对应的属性信息输入至该匹配的第二DNN模型,可以获得该第二DNN模型输出的该正样本节点对应的正向量表示,以及,将当前样本数据的各负样本节点以及对应的属性信息分别输入至该匹配的第二DNN模型,可以获得该第二DNN模型输出的各负样本节点对应的负向量表示。
步骤208,确定当前样本数据的源节点向量表示和目标节点向量表示的差异值。
在该步骤中,差异值可以表示源节点与目标节点之间的差距程度。在一种实施方式中,步骤208可以包括如下步骤:
步骤208-1,计算所述源节点向量表示与所述正向量表示之间的第一相似度。
在一种实施方式中,可以使用Cosine距离刻画节点之间的相似性。例如,可以采用如下公式计算各样本数据中源节点向量表示与正向量表示之间的第一相似度:
Figure BDA0002748849000000141
其中,v∈Vp表示源节点,v'∈Vp'表示正样本节点,
Figure BDA0002748849000000142
表示源节点向量表示,
Figure BDA0002748849000000143
表示正向量表示,η表示相似度权重,
Figure BDA0002748849000000144
表示第一相似度。
步骤208-2,计算所述源节点向量表示与各负向量表示之间的第二相似度。
例如,可以采用如下公式计算各样本数据中源节点向量表示与各负向量表示之间的第二相似度:
Figure BDA0002748849000000145
其中,v∈Vp表示源节点,v”∈Vp'表示负样本节点,
Figure BDA0002748849000000146
表示源节点向量表示,
Figure BDA0002748849000000147
表示负向量表示,η表示相似度权重,
Figure BDA0002748849000000148
表示第二相似度。
步骤208-3,根据所述第一相似度以及各第二相似度,计算源节点向量表示和目标节点向量表示的差异值。
例如,根据第一相似度以及各第二相似度,可以采用如下公式,计算源节点向量表示和目标节点向量表示的差异值
Figure BDA0002748849000000149
Figure BDA00027488490000001410
步骤209,根据各样本数据的差异值,确定优化目标。
在该步骤中,当确定样本数据集合中各样本数据的差异值以后,可以根据各差异值使用Softmax交叉熵Loss作为Relevance优化目标。
例如,可以采用如下公式计算DNN模型的优化目标Orel
Figure BDA0002748849000000151
其中,N表示样本数据集合中的样本数量。
步骤210,根据所述优化目标对各第一深度神经网络模型以及各第二深度神经网络模型进行收敛。
在该步骤中,当确定优化目标以后,可以采用该优化目标对各第一DNN模型以及各第二DNN模型进行收敛优化,使得各第一DNN模型以及各第二DNN模型的损失最小。
在本实施例中,在根据至少两种内容场景下各消费者账户的交互行为数据构建成的目标图网络进行采样,得到样本数据集合以后,根据各样本数据对应的节点类型和边类型,将节点类型和边类型均相同的样本数据进行聚合,得到多个第一子集合,并采用各第一子集合的各样本数据的源节点以及对应的第一属性信息训练对应的用于向量化源节点的第一深度神经网络模型。同时,根据各样本数据对应的节点类型进行聚合得到多个第二子集合,并采用各第二子集合的各样本数据的目标节点以及对应的第二属性信息训练对应的用于向量化目标节点的第二深度神经网络模型,然后采用各样本数据匹配的第一深度神经网络模型确定该样本数据的源节点向量表示,以及,通过当前样本数据匹配的第二深度神经网络模型确定该样本数据的目标节点向量表示,通过刻画源节点向量表示和目标节点向量表示的差异值来确定优化目标,然后根据优化目标对各第一深度神经网络模型和各第二深度神经网络模型进行收敛优化,可以提高第一深度神经网络模型和第二深度神经网络模型的精准度。
实施例三
图5为本申请实施例三提供的一种模型训练的方法实施例的流程图,本实施例在实施例一的基础上进行更具体的说明,包括如下步骤:
步骤501,获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络。
步骤502,基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点。
步骤503,基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
步骤504,根据所述第一深度神经网络模型,确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示。
在该步骤中,当各第一深度神经网络模型训练完成以后,可以采用第一深度神经网络模型对样本数据集合中对应的样本数据进行向量化处理,获得各源节点的源节点向量表示,作为消费者账户或各提供者账户的向量表示。
步骤505,将各消费者账户以及各提供者账户的向量表示发送至线上服务进行存储。
在该步骤中,当获得各消费者账户以及各提供者账户的向量表示以后,则可以将各消费者账户以及各提供者账户的向量表示发送至线上服务中,由线上服务进行存储。
在一种例子中,线上服务用于当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找该目标消费者账户的向量表示;计算目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度,然后根据各匹配度,从其他内容场景下的各提供者账户中确定目标提供者账户,并将目标提供者账户推荐至所述目标消费者账户中。
在本实施例中,将至少两种场景域的行为关系直接通过图网络进行建模,实现了在异构图中构建不同场景域的不同账户的复杂关联关系,然后通过图采样和神经网络模型将不同场景域的不同账户映射到同一个向量空间,由于高效融合不同场景域的行为关系,使原本不在该域的用户也可以学到该域的偏好信息,然后通过将至少两种内容场景下各消费者账户以及各提供者账户的向量表示发送至线上服务进行存储,可以方便线上服务能够快速计算不同类型账户的相关性,进而实现跨域推荐。
实施例四
图6为本申请实施例四提供的一种跨域推荐的方法实施例的流程图,本实施例在线上服务侧进行说明,包括如下步骤:
步骤601,确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示,并存储所述向量表示。
在一种实现中,线上服务可以从APP端接收至少两种内容场景下各消费者账户以及各提供者账户的向量表示。具体的,APP端的服务进程在根据实施例一-实施例三任一实施例学习到第一DNN模型以后,根据该第一DNN模型向量化目标图网络中各源节点,各源节点表示至少两种内容场景下各消费者账户以及各提供者账户。当服务进程获得各消费者账户以及各提供者账户的向量表示以后,将其发送至线上服务。然后线上服务将接收到的各向量表示存储在本地或者其他存储区域。
为了后续能够快速查找消费者账户的向量表示,在一种实施方式中,线上服务可以将消费者账户的向量表示与提供者账户的向量表示进行分开存储,例如,将直播场景及短视频场景的消费者账户的向量表示存储在一个地方,提供者账户的向量表示存储在另一个地方,比如,可以将消费者账户的向量表示存储在本地,将提供者账户的向量表示存储在ANN(Approximate Nearest Neighbor,近似最近邻搜索)引擎中。
在其他实施方式中,线上服务还可以将不同场景域的消费者账户、提供者账户均进行分开存储。例如,将直播场景的消费者账户与短视频场景的消费者账户分开存储,将直播场景的提供者账户与短视频场景的提供者账户分开存储。
当然,本实施例并不限于上述的存储方式,本领域技术人员根据实际需求采用其他方式进行存储均是可以的。
步骤602,当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示。
在该实施例中,当线上服务接收到某一内容场景下的目标消费者账户发送的请求时,可以根据该目标消费者账户从存储的所有消费者账户的向量表示中查找该目标消费者账户的向量表示。
步骤603,计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度。
在一种实施方式中,当线上服务确定目标消费者账户的向量表示以后,可以将该目标消费者账户的向量表示以及对应的内容场景的标识发送至ANN引擎中,由ANN引擎计算该目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度。
步骤604,根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
在一种实施例中,当ANN引擎确定目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度以后,可以将匹配度最大的K(即topK)个提供者账户作为目标提供者账户,然后将目标提供者账户返回线上服务,由线上服务向目标消费者账户推荐该目标提供者账户或推荐该目标提供者账户提供的内容。
例如,当线上服务面对短视频用户的请求时,可以查找该短视频用户对应的向量表示,并将该短视频用户对应的向量表示发送至ANN引擎,由ANN引擎召回偏好的K个主播,从而实现了给跨域潜在用户推荐直播域里的主播,从而提升直播用户渗透率、用户付费率、用户观看时长、用户关注主播数等。
在本实施例中,线上服务通过接收并存储至少两种内容场景下各消费者账户以及各提供者账户的向量表示,当接收到某个内容场景下的目标消费者账户发送的请求时,可以快速查找出该目标消费者账户的向量表示,并根据其他内容场景下的各提供者账户的向量表示,计算与目标消费者账户的向量表示的匹配度,从而召回偏好相似的目标提供者账户提供给目标消费者账户,从而实现跨域推荐,提升用户在不同场景域的渗透。
实施例五
图7为本申请实施例五提供的一种模型训练装置实施例的结构框图,该模型训练装置可以位于应用程序中,可以包括如下模块:
图网络建立模块701,用于获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络;
样本数据生成模块702,用于基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点;
模型训练模块703,用于基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
在一种实施方式中,所述目标图网络包括多种节点类型以及多种边类型;所述样本数据还包括:当前样本数据对应的节点类型和边类型,以及各源节点的第一属性信息;
所述模型训练模块703可以包括如下子模块:
第一子集合确定子模块,用于根据各样本数据对应的节点类型和边类型,将节点类型和边类型均相同的样本数据进行聚合,得到多个第一子集合;
第一模型训练子模块,用于针对各第一子集合,根据当前第一子集合中的各样本数据的源节点以及对应的第一属性信息,训练对应的第一深度神经网络模型,其中,所述第一深度神经网络模型以当前第一子集合的节点类型标识和边类型标识进行标识。
在一种实施方式中,所述样本数据还包括:各目标节点的第二属性信息;所述模型训练模块703可以还包括如下子模块:
第二子集合确定子模块,用于根据各样本数据对应的节点类型,将节点类型相同的样本数据进行聚合,得到多个第二子集合;
第二模型训练子模块,用于针对各第二子集合,根据当前第二子集合中的各样本数据的目标节点以及对应的第二属性信息,训练对应的第二深度神经网络模型,其中,所述第二深度神经网络模型以当前第二子集合的节点类型标识进行标识。
在一种实施方式中,所述模型训练模块703可以还包括如下子模块:
向量获取子模块,用于针对各样本数据,通过当前样本数据匹配的第一深度神经网络模型确定该样本数据的源节点向量表示,以及,通过当前样本数据匹配的第二深度神经网络模型确定该样本数据的目标节点向量表示;
差异值确定子模块,用于确定当前样本数据的源节点向量表示和目标节点向量表示的差异值;
优化目标确定子模块,用于根据各样本数据的差异值,确定优化目标;
模型收敛子模块,用于根据所述优化目标对各第一深度神经网络模型以及各第二深度神经网络模型进行收敛。
在一种实施方式中,所述向量获取子模块具体用于:
针对各样本数据,根据当前样本数据对应的节点类型和边类型查找匹配的第一深度神经网络模型,以及,根据当前样本数据对应的节点类型查找匹配的第二深度神经网络模型;
将当前样本数据的源节点以及对应的第一属性信息输入至该匹配的第一深度神经网络模型,获得当前样本数据的源节点对应的源节点向量表示;
将当前样本数据的目标节点以及对应的第二属性信息输入至该对应的第二深度神经网络模型,获得当前样本数据的目标节点对应的目标节点向量表示。
在一种实施方式中,所述目标节点包括正样本节点以及多个负样本节点,所述目标节点向量表示包括与所述正样本节点对应的正向量表示,以及,与所述负样本节点对应的负向量表示;
所述差异值确定子模块具体用于:
计算所述源节点向量表示与所述正向量表示之间的第一相似度;
计算所述源节点向量表示与各负向量表示之间的第二相似度;
根据所述第一相似度以及各第二相似度,计算源节点向量表示和目标节点向量表示的差异值。
在一种实施方式中,所述样本数据生成模块702包括:
游走子模块,用于采用随机游走算法在所述目标图网络中游走,获得多个指定长度的游走序列;
正例对生成子模块,用于通过滑窗在各游走序列中采样,生成正例对集合,其中,各正例对包括所述目标图网络中的源节点,以及所述源节点对应的正样本节点,其中,所述源节点以及所述正样本节点具有对应的属性信息;
负采样子模块,用于对于每个正例对,使用带权负采样方式生成多个负样本节点,其中,所述负样本节点与对应的正样本节点有着一致的分布,且所述负样本节点与对应的源节点为弱相关性;所述负样本节点具有对应的属性信息;
样本组织子模块,用于将当前正例对中的源节点、正样本节点、多个负样本节点以及对应的属性信息组织成样本数据。
在一种实施方式中,所述内容场景包括第一内容场景以及第二内容场景;
所述图网络建立模块701包括:
第一交互数据获取子模块,用于获取第一内容场景下各第一消费者账户的第一交互行为数据,所述第一交互行为数据包括一种或多种第一交互行为类型以及所述第一消费者账户交互的第一提供者账户;
第一异构图构建子模块,用于以所述第一消费者账户以及所述第一提供者账户作为节点,以所述一种或多种第一交互行为类型作为边,构建第一异构图;
第二交互数据获取子模块,用于获取第二内容场景下各第二消费者账户的第二交互行为数据,所述第二交互行为数据包括一种或多种第二交互行为类型以及所述第二消费者账户交互的第二提供者账户;
第二异构图构建子模块,用于以所述第二消费者账户以及所述第二提供者账户作为节点,以所述一种或多种第二交互行为类型作为边,构建第二异构图;
异构图连接子模块,用于从所述第一异构图与所述第二异构图中确定桥梁账户,并根据所述桥梁账户将所述第一异构图与所述第二异构图连接成目标图网络。
在一种实施方式中,所述装置还包括:
账户向量确定模块,用于根据所述第一深度神经网络模型,确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示;
账户向量发送模块,用于将各消费者账户以及各提供者账户的向量表示发送至线上服务进行存储,所述线上服务用于当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
需要说明的是,本申请实施例所提供的上述装置可执行本申请实施例一至实施例三任一实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例六
图8为本申请实施例六提供的一种跨域推荐装置实施例的结构框图,该模型训练装置可以位于线上服务中,可以包括如下模块:
向量确定模块801,用于确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示,并存储所述向量表示;
向量查找模块802,用于当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;
匹配度计算模块803,用于计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;
推荐模块804,用于根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
需要说明的是,本申请实施例所提供的上述装置可执行本申请实施例四所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例七
图9为本申请实施例七提供的一种计算机设备的结构示意图,如图9所示,该计算机设备包括处理器901、存储器902、输入装置903和输出装置904;计算机设备中处理器901的数量可以是一个或多个,图9中以一个处理器901为例;计算机设备中的处理器901、存储器902、输入装置903和输出装置904可以通过总线或其他方式连接,图9中以通过总线连接为例。
存储器902作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请实施例中的方法实施例对应的程序指令/模块。处理器901通过运行存储在存储器902中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的方法。
存储器902可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器902可进一步包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置903可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置904可包括显示屏等显示设备。
实施例八
本申请实施例八还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由服务器的处理器执行时用于执行实施例一至实施例四中任一实施例中的方法。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
值得注意的是,上述装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (14)

1.一种模型训练的方法,其特征在于,所述方法包括:
获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络;
基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点;
基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述目标图网络包括多种节点类型以及多种边类型;所述样本数据还包括:当前样本数据对应的节点类型和边类型,以及各源节点的第一属性信息;
所述基于所述样本数据集合协同训练多个深度神经网络模型,包括:
根据各样本数据对应的节点类型和边类型,将节点类型和边类型均相同的样本数据进行聚合,得到多个第一子集合;
针对各第一子集合,根据当前第一子集合中的各样本数据的源节点以及对应的第一属性信息,训练对应的第一深度神经网络模型,其中,所述第一深度神经网络模型以当前第一子集合的节点类型标识和边类型标识进行标识。
3.根据权利要求2所述的方法,其特征在于,所述样本数据还包括:各目标节点的第二属性信息;所述基于所述样本数据集合协同训练多个深度神经网络模型,还包括:
根据各样本数据对应的节点类型,将节点类型相同的样本数据进行聚合,得到多个第二子集合;
针对各第二子集合,根据当前第二子集合中的各样本数据的目标节点以及对应的第二属性信息,训练对应的第二深度神经网络模型,其中,所述第二深度神经网络模型以当前第二子集合的节点类型标识进行标识。
4.根据权利要求3所述的方法,其特征在于,所述基于所述样本数据集合协同训练多个深度神经网络模型,还包括:
针对各样本数据,通过当前样本数据匹配的第一深度神经网络模型确定该样本数据的源节点向量表示,以及,通过当前样本数据匹配的第二深度神经网络模型确定该样本数据的目标节点向量表示;
确定当前样本数据的源节点向量表示和目标节点向量表示的差异值;
根据各样本数据的差异值,确定优化目标;
根据所述优化目标对各第一深度神经网络模型以及各第二深度神经网络模型进行收敛。
5.根据权利要求4所述的方法,其特征在于,所述针对各样本数据,通过当前样本数据匹配的第一深度神经网络模型确定该样本数据的源节点向量表示,以及,通过当前样本数据匹配的第二深度神经网络模型确定该样本数据的目标节点向量表示,包括:
针对各样本数据,根据当前样本数据对应的节点类型和边类型查找匹配的第一深度神经网络模型,以及,根据当前样本数据对应的节点类型查找匹配的第二深度神经网络模型;
将当前样本数据的源节点以及对应的第一属性信息输入至该匹配的第一深度神经网络模型,获得当前样本数据的源节点对应的源节点向量表示;
将当前样本数据的目标节点以及对应的第二属性信息输入至该对应的第二深度神经网络模型,获得当前样本数据的目标节点对应的目标节点向量表示。
6.根据权利要求4或5所述的方法,其特征在于,所述目标节点包括正样本节点以及多个负样本节点,所述目标节点向量表示包括与所述正样本节点对应的正向量表示,以及,与所述负样本节点对应的负向量表示;
所述确定当前样本数据的源节点向量表示和目标节点向量表示的差异值,包括:
计算所述源节点向量表示与所述正向量表示之间的第一相似度;
计算所述源节点向量表示与各负向量表示之间的第二相似度;
根据所述第一相似度以及各第二相似度,计算源节点向量表示和目标节点向量表示的差异值。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述目标图网络进行采样,生成样本数据集合,包括:
采用随机游走算法在所述目标图网络中游走,获得多个指定长度的游走序列;
通过滑窗在各游走序列中采样,生成正例对集合,其中,各正例对包括所述目标图网络中的源节点,以及所述源节点对应的正样本节点,其中,所述源节点以及所述正样本节点具有对应的属性信息;
对于每个正例对,使用带权负采样方式生成多个负样本节点,其中,所述负样本节点与对应的正样本节点有着一致的分布,且所述负样本节点与对应的源节点为弱相关性;所述负样本节点具有对应的属性信息;
将当前正例对中的源节点、正样本节点、多个负样本节点以及对应的属性信息组织成样本数据。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述内容场景包括第一内容场景以及第二内容场景;
所述获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络,包括:
获取第一内容场景下各第一消费者账户的第一交互行为数据,所述第一交互行为数据包括一种或多种第一交互行为类型以及所述第一消费者账户交互的第一提供者账户;
以所述第一消费者账户以及所述第一提供者账户作为节点,以所述一种或多种第一交互行为类型作为边,构建第一异构图;
获取第二内容场景下各第二消费者账户的第二交互行为数据,所述第二交互行为数据包括一种或多种第二交互行为类型以及所述第二消费者账户交互的第二提供者账户;
以所述第二消费者账户以及所述第二提供者账户作为节点,以所述一种或多种第二交互行为类型作为边,构建第二异构图;
从所述第一异构图与所述第二异构图中确定桥梁账户,并根据所述桥梁账户将所述第一异构图与所述第二异构图连接成目标图网络。
9.根据权利要求1所述的方法,其特征在于,在所述基于所述样本数据集合协同训练多个深度神经网络模型之后,还包括:
根据所述第一深度神经网络模型,确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示;
将各消费者账户以及各提供者账户的向量表示发送至线上服务进行存储,所述线上服务用于当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
10.一种跨域推荐的方法,其特征在于,所述方法包括:
确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示,并存储所述向量表示;
当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;
计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;
根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
11.一种模型训练装置,其特征在于,所述装置包括:
图网络建立模块,用于获取至少两种内容场景下各消费者账户的交互行为数据,并根据所述交互行为数据建立目标图网络;
样本数据生成模块,用于基于所述目标图网络进行采样,生成样本数据集合,其中,所述样本数据集合中的各样本数据包括所述目标图网络中的源节点,以及基于所述源节点采样生成的目标节点;
模型训练模块,用于基于所述样本数据集合协同训练多个深度神经网络模型,其中,所述深度神经网络模型包括用于向量化源节点的第一深度神经网络模型,以及用于向量化目标节点的第二深度神经网络模型。
12.一种跨域推荐装置,其特征在于,所述装置包括:
向量确定模块,用于确定至少两种内容场景下各消费者账户以及各提供者账户的向量表示,并存储所述向量表示;
向量查找模块,用于当接收到某一内容场景下的目标消费者账户发送的请求时,从存储的向量表示中查找所述目标消费者账户的向量表示;
匹配度计算模块,用于计算所述目标消费者账户的向量表示与其他内容场景下的各提供者账户的向量表示的匹配度;
推荐模块,用于根据所述匹配度,从所述其他内容场景下的各提供者账户中确定目标提供者账户,并将所述目标提供者账户推荐至所述目标消费者账户中。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-9中任一所述的方法,或实现如权利要求10所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法,或实现如权利要求10所述的方法。
CN202011176572.7A 2020-10-28 2020-10-28 一种跨域推荐及模型训练的方法和装置 Pending CN112307256A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011176572.7A CN112307256A (zh) 2020-10-28 2020-10-28 一种跨域推荐及模型训练的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011176572.7A CN112307256A (zh) 2020-10-28 2020-10-28 一种跨域推荐及模型训练的方法和装置

Publications (1)

Publication Number Publication Date
CN112307256A true CN112307256A (zh) 2021-02-02

Family

ID=74331824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011176572.7A Pending CN112307256A (zh) 2020-10-28 2020-10-28 一种跨域推荐及模型训练的方法和装置

Country Status (1)

Country Link
CN (1) CN112307256A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861963A (zh) * 2021-02-04 2021-05-28 北京三快在线科技有限公司 训练实体特征提取模型的方法、装置和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609116A (zh) * 2017-09-13 2018-01-19 星环信息科技(上海)有限公司 一种创建跨域迁移深度网络的方法及设备
CN109597844A (zh) * 2019-01-31 2019-04-09 中科人工智能创新技术研究院(青岛)有限公司 基于深度神经网络与图网络的核心用户挖掘方法及系统
CN111210008A (zh) * 2020-01-09 2020-05-29 支付宝(杭州)信息技术有限公司 利用lstm神经网络模型处理交互数据的方法及装置
CN111368205A (zh) * 2020-03-09 2020-07-03 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609116A (zh) * 2017-09-13 2018-01-19 星环信息科技(上海)有限公司 一种创建跨域迁移深度网络的方法及设备
CN109597844A (zh) * 2019-01-31 2019-04-09 中科人工智能创新技术研究院(青岛)有限公司 基于深度神经网络与图网络的核心用户挖掘方法及系统
CN111210008A (zh) * 2020-01-09 2020-05-29 支付宝(杭州)信息技术有限公司 利用lstm神经网络模型处理交互数据的方法及装置
CN111368205A (zh) * 2020-03-09 2020-07-03 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861963A (zh) * 2021-02-04 2021-05-28 北京三快在线科技有限公司 训练实体特征提取模型的方法、装置和存储介质

Similar Documents

Publication Publication Date Title
US20210027178A1 (en) Recommendation method and recommendation apparatus based on deep reinforcement learning, and non-transitory computer-readable recording medium
CN107609152B (zh) 用于扩展查询式的方法和装置
Jiang et al. Social recommendation with cross-domain transferable knowledge
CN111382283B (zh) 资源类别标签标注方法、装置、计算机设备和存储介质
Yao et al. Service recommendation for mashup composition with implicit correlation regularization
CN110096614B (zh) 信息推荐方法及装置、电子设备
CN111651671B (zh) 用户对象推荐方法、装置、计算机设备和存储介质
CN109271488B (zh) 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
US11200501B2 (en) Accurate and interpretable rules for user segmentation
CN112883265A (zh) 信息推荐方法、装置、服务器及计算机可读存储介质
CN112835995A (zh) 一种基于解析关系的域名图嵌入表示分析方法及装置
CN114281976A (zh) 一种模型训练方法、装置、电子设备及存储介质
CN110895656A (zh) 一种文本相似度计算方法、装置、电子设备及存储介质
CN113244627B (zh) 识别外挂的方法、装置、电子设备以及存储介质
CN112307256A (zh) 一种跨域推荐及模型训练的方法和装置
CN116956996A (zh) 数据处理方法、装置、介质及设备
CN117076763A (zh) 基于超图学习的会话推荐方法、装置、电子设备及介质
CN111597361A (zh) 多媒体数据处理方法、装置、存储介质及设备
CN113312523B (zh) 字典生成、搜索关键字推荐方法、装置和服务器
CN115858815A (zh) 确定映射信息的方法、广告推荐方法、装置、设备及介质
CN114547440A (zh) 基于互联网大数据的用户画像挖掘方法及人工智能云系统
CN116150429A (zh) 异常对象识别方法、装置、计算设备以及存储介质
CN114357242A (zh) 基于召回模型的训练评估方法及装置、设备、存储介质
Zhang et al. Non-negative multiple matrix factorization with social similarity for recommender systems
Wang et al. Representation learning for spatial graphs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination