CN113342998A - 一种多媒体资源推荐方法、装置、电子设备及存储介质 - Google Patents

一种多媒体资源推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113342998A
CN113342998A CN202110896434.4A CN202110896434A CN113342998A CN 113342998 A CN113342998 A CN 113342998A CN 202110896434 A CN202110896434 A CN 202110896434A CN 113342998 A CN113342998 A CN 113342998A
Authority
CN
China
Prior art keywords
node
multimedia resource
user account
clustering
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110896434.4A
Other languages
English (en)
Other versions
CN113342998B (zh
Inventor
焦宇航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110896434.4A priority Critical patent/CN113342998B/zh
Publication of CN113342998A publication Critical patent/CN113342998A/zh
Application granted granted Critical
Publication of CN113342998B publication Critical patent/CN113342998B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种多媒体资源推荐方法、装置、电子设备及存储介质,涉及互联网技术领域。该方法包括:获取用户账户节点的初始特征和多媒体资源节点的初始特征;基于用户账户节点的初始特征和每一次聚类后得到的聚类用户账户节点的特征,得到用户账户节点的目标特征,以及基于多媒体资源节点的初始特征和每一次聚类后得到的聚类多媒体资源节点的特征,得到多媒体资源节点的目标特征;基于用户账户节点的目标特征和多媒体资源节点的目标特征,确定用户账户节点表征的账户的待推荐多媒体资源,并向账户推荐该待推荐多媒体资源。本公开中,电子设备能够准确、有效地确定出账户的待推荐多媒体资源,可以提升用户体验。

Description

一种多媒体资源推荐方法、装置、电子设备及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种多媒体资源推荐方法、装置、电子设备及存储介质。
背景技术
目前,可以基于深度学习技术为某一用户推荐相关的视频。具体的,可以基于用户的历史浏览数据,确定该用户的兴趣特征,进而为该用户推荐与该兴趣特征相匹配的视频。
但是,上述只考虑用户的兴趣特征为用户进行视频推荐的方法,可能不能准确有效地确定出该用户的待推荐视频,进而影响用户对视频业务的体验程度。
发明内容
本公开提供一种多媒体资源推荐方法、装置、电子设备及存储介质,解决了现有技术中,为用户确定的待推荐视频不准确,进而影响用户对视频业务的体验程度的技术问题。
本公开实施例的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体资源推荐方法。该方法可以包括:获取用户账户节点的初始特征和多媒体资源节点的初始特征;对该用户账户节点的初始特征和该多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征,I∈[1,L],L为大于1的第一阈值;基于该用户账户节点的初始特征和该每一次聚类后得到的聚类用户账户节点的特征,得到该用户账户节点的目标特征,以及基于该多媒体资源节点的初始特征和该每一次聚类后得到的聚类多媒体资源节点的特征,得到该多媒体资源节点的目标特征;基于该用户账户节点的目标特征和该多媒体资源节点的目标特征,确定该用户账户节点表征的账户的待推荐多媒体资源,并向该账户推荐该待推荐多媒体资源。
可选地,上述用户账户节点的初始特征和该多媒体资源节点的初始特征均采用向量表征,上述,获取用户账户节点的初始特征和多媒体资源节点的初始特征具体包括:获取至少两个时间窗口中每一个时间窗口的交互记录,该交互记录至少用于记录每一用户账户执行过交互操作的多媒体资源及该交互操作的数量,该至少两个时间窗口为历史时间段内时长不同的时间窗口;基于获取到的交互记录,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量;拼接该每一个时间窗口中该用户账户节点的初始子向量,得到该用户账户节点的初始特征,以及拼接该每一个时间窗口中该多媒体资源节点的初始子向量,得到该多媒体资源节点的初始特征。
可选地,上述基于获取到的交互记录,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量具体包括:基于该获取到的交互记录,生成该每一个时间窗口对应的初始异构图,该初始异构图包括用户账户节点、多媒体资源节点以及边,该边用于连接具有交互操作关系的用户账户节点和多媒体资源节点;基于该每一个时间窗口对应的初始异构图,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量。
可选地,上述每一次聚类后得到的聚类用户账户节点的特征包括该聚类用户账户节点的向量,上述每一次聚类后得到的聚类多媒体资源节点的特征包括该聚类多媒体资源节点的向量,上述对该用户账户节点的初始特征和该多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征具体包括:对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图;基于该每一次聚类后得到的聚类异构图,确定该每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量。
可选地,上述对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图具体包括:执行聚类操作,该聚类操作包括:获取当前异构图对应的图神经网络模型,该当前异构图为初始异构图或上一次执行该聚类操作后得到的聚类异构图;基于该当前异构图对应的图神经网络模型提取该当前异构图中每一个节点的子向量;将每一类型的节点对应的子向量划分为多个类簇,该类型包括用户账户类型和多媒体资源类型;基于得到的类簇,生成聚类异构图。
可选地,上述基于得到的类簇,生成聚类异构图具体包括:将得到的每一个类簇,确定为该生成的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点;对该每一个类簇执行下述操作:当该每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定该每一个类簇与该其他类簇之间存在聚类边,该其他类簇为得到的所有类簇中除该每一个类簇以外的任一类簇。
可选地,上述基于该每一次聚类后得到的聚类异构图,确定该每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量具体包括:根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定该聚类用户账户节点对应的下M跳节点以及该聚类多媒体资源节点对应的下N跳节点,M≥1,N≥1;基于该聚类用户账户节点对应的下M跳节点确定该聚类用户账户节点的向量,以及基于该聚类多媒体资源节点对应的下N跳节点确定该聚类多媒体资源节点的向量。
可选地,目标异构图为该初始异构图或该聚类异构图,获取每一个时间窗口中与该目标异构图对应的图神经网络模型的方法包括:获取该每一个时间窗口中与该目标异构图对应的训练集和测试集;对该训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,以得到每一用户账户类型节点对应的下X跳节点,以及每一多媒体资源类型节点对应的下Y跳节点;当该目标异构图为该初始异构图时,该用户账户类型节点为该用户账户节点,该多媒体资源类型节点为该多媒体资源节点;当该目标异构图为该聚类异构图时,该用户账户类型节点为该聚类用户账户节点,该多媒体资源类型节点为该聚类多媒体资源节点,X≥1,Y≥1;将获取到的该下X跳节点和该下Y跳节点输入到初始神经网络模型中,得到该用户账户类型节点和该多媒体资源类型节点之间存在边的概率;根据该概率迭代训练该初始神经网络模型,直到该概率与该测试集对应的真实结果之间的误差小于第二阈值,将得到的神经网络模型确定为该目标异构图对应的图神经网络模型。
可选地,上述将获取到的该下X跳节点和该下Y跳节点输入到初始神经网络模型中,得到该用户账户类型节点和该多媒体资源类型节点之间存在边的概率具体包括:将该下X跳节点输入该初始神经网络模型,得到该用户账户类型节点当前的向量;将该下Y跳节点输入该初始神经网络模型,得到该多媒体资源类型节点当前的向量;基于该用户账户类型节点当前的向量和该多媒体资源类型节点当前的向量,确定该用户账户类型节点与该多媒体资源类型节点之间存在边的概率。
可选地,上述确定该每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量具体包括:对于每一次聚类后得到的聚类异构图中的每一个类簇而言,确定该每一个类簇中每一个节点的子向量,并根据确定出的子向量,确定该每一个节点的子向量的平均值,并将该平均值确定为该每一个类簇的向量。
可选地,上述基于该用户账户节点的目标特征和该多媒体资源节点的目标特征,确定该用户账户节点表征的账户的待推荐多媒体资源具体包括:确定该用户账户节点的目标特征与该多媒体资源节点的目标特征之间的相似度;对得到的相似度进行排序,并按照排序结果确定该待推荐多媒体资源。
根据本公开实施例的第二方面,提供一种多媒体资源推荐装置。该装置可以包括:获取模块、确定模块以及处理模块;该获取模块,被配置为获取用户账户节点的初始特征和多媒体资源节点的初始特征;该确定模块,被配置为对该用户账户节点的初始特征和该多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征,I∈[1,L],L为大于1的第一阈值;该处理模块,还被配置为基于该用户账户节点的初始特征和该每一次聚类后得到的聚类用户账户节点的特征,得到该用户账户节点的目标特征,以及基于该多媒体资源节点的初始特征和该每一次聚类后得到的聚类多媒体资源节点的特征,得到该多媒体资源节点的目标特征;该确定模块,还被配置为基于该用户账户节点的目标特征和该多媒体资源节点的目标特征,确定该用户账户节点表征的账户的待推荐多媒体资源,并向该账户推荐该待推荐多媒体资源。
可选地,该用户账户节点的初始特征和该多媒体资源节点的初始特征均采用向量表征;该获取模块,具体被配置为获取至少两个时间窗口中每一个时间窗口的交互记录,该交互记录至少用于记录每一用户账户执行过交互操作的多媒体资源及该交互操作的数量,该至少两个时间窗口为历史时间段内时长不同的时间窗口;该确定模块,具体被配置为基于获取到的交互记录,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量;该处理模块,具体被配置为拼接该每一个时间窗口中该用户账户节点的初始子向量,得到该用户账户节点的初始特征,以及拼接该每一个时间窗口中该多媒体资源节点的初始子向量,得到该多媒体资源节点的初始特征。
可选地,该处理模块,具体还被配置为基于该获取到的交互记录,生成该每一个时间窗口对应的初始异构图,该初始异构图包括用户账户节点、多媒体资源节点以及边,该边用于连接具有交互操作关系的用户账户节点和多媒体资源节点;该确定模块,具体还被配置为基于该每一个时间窗口对应的初始异构图,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量。
可选地,上述每一次聚类后得到的聚类用户账户节点的特征包括该聚类用户账户节点的向量,上述每一次聚类后得到的聚类多媒体资源节点的特征包括该聚类多媒体资源节点的向量;该获取模块,具体被配置为对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图;该确定模块,具体被配置为基于该每一次聚类后得到的聚类异构图,确定该每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量。
可选地,该处理模块,具体被配置为执行聚类操作,该聚类操作包括:获取当前异构图对应的图神经网络模型,该当前异构图为初始异构图或上一次执行该聚类操作后得到的聚类异构图;基于该当前异构图对应的图神经网络模型提取该当前异构图中每一个节点的子向量;将每一类型的节点对应的子向量划分为多个类簇,该类型包括用户账户类型和多媒体资源类型;基于得到的类簇,生成聚类异构图。
可选地,该确定模块,具体还被配置为将得到的每一个类簇,确定为该生成的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点;该处理模块,具体还被配置为对该每一个类簇执行下述操作:当该每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定该每一个类簇与该其他类簇之间存在聚类边,该其他类簇为得到的所有类簇中除该每一个类簇以外的任一类簇。
可选地,该确定模块,具体还被配置为根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定该聚类用户账户节点对应的下M跳节点以及该聚类多媒体资源节点对应的下N跳节点,M≥1,N≥1;该确定模块,具体还被配置为基于该聚类用户账户节点对应的下M跳节点确定该聚类用户账户节点的向量,以及基于该聚类多媒体资源节点对应的下N跳节点确定该聚类多媒体资源节点的向量。
可选地,目标异构图为该初始异构图或该聚类异构图;该获取模块,具体还被配置为获取每一个时间窗口中与该目标异构图对应的训练集和测试集;该处理模块,具体还被配置为对该训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,以得到每一用户账户类型节点对应的下X跳节点,以及每一多媒体资源类型节点对应的下Y跳节点;当该目标异构图为该初始异构图时,该用户账户类型节点为该用户账户节点,该多媒体资源类型节点为该多媒体资源节点;当该目标异构图为该聚类异构图时,该用户账户类型节点为该聚类用户账户节点,该多媒体资源类型节点为该聚类多媒体资源节点,X≥1,Y≥1;该处理模块,具体还被配置为将获取到的该下X跳节点和该下Y跳节点输入到初始神经网络模型中,得到该用户账户类型节点和该多媒体资源类型节点之间存在边的概率;该确定模块,具体还被配置为根据该概率迭代训练该初始神经网络模型,直到该概率与该测试集对应的真实结果之间的误差小于第二阈值,将得到的神经网络模型确定为该目标异构图对应的图神经网络模型。
可选地,该处理模块,具体还被配置为将该下X跳节点输入该初始神经网络模型,得到该用户账户类型节点当前的向量;该处理模块,具体还被配置为将该下Y跳节点输入该初始神经网络模型,得到该多媒体资源类型节点当前的向量;该确定模块,具体还被配置为基于该用户账户类型节点当前的向量和该多媒体资源类型节点当前的向量,确定该用户账户类型节点与该多媒体资源类型节点之间存在边的概率。
可选地,该确定模块,具体还被配置为对于每一次聚类后得到的聚类异构图中的每一个类簇而言,确定该每一个类簇中每一个节点的子向量,并根据确定出的子向量,确定该每一个节点的子向量的平均值,并将该平均值确定为该每一个类簇的向量。
可选地,该确定模块,具体被配置为确定该用户账户节点的目标特征与该多媒体资源节点的目标特征之间的相似度;该确定模块,具体还被配置为对得到的相似度进行排序,并按照排序结果确定该待推荐多媒体资源。
根据本公开实施例的第三方面,提供一种电子设备,可以包括:处理器和被配置为存储处理器可执行指令的存储器;其中,处理器被配置为执行所述指令,以实现上述第一方面中任一种可选地多媒体资源推荐方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当该计算机可读存储介质中的指令由电子设备执行时,使得该电子设备能够执行上述第一方面中任一种可选地多媒体资源推荐方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机指令,当该计算机指令在电子设备上运行时,使得该电子设备执行如第一方面中任一种可选地多媒体资源推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
基于上述任一方面,本公开中,电子设备可以对用户账户节点的初始特征和多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征,以及基于该用户账户节点的初始特征和该每一次聚类后得到的聚类用户账户节点的特征,得到该用户账户节点的目标特征,基于该多媒体资源节点的初始特征和该每一次聚类后得到的聚类多媒体资源节点的特征,得到该多媒体资源节点的目标特征。由于该用户账户节点的目标特征可以表征该用户账户节点在不同层次(例如初始特征层次以及每一次聚类之后得到的特征层次)中的特征信息,该多媒体资源节点的目标特征可以表征该多媒体资源节点在不同层次中的特征信息,因此基于该用户账户节点在不同层次中的特征信息和该多媒体资源节点在不同层次中的特征信息确定该用户账户节点表征(或对应)的账户对应的待推荐多媒体资源,能够准确、有效地确定出账户的待推荐多媒体资源,可以提升用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1示出了本公开实施例提供的一种异构图的基本结构示意图;
图2示出了本公开实施例提供的另一种异构图的基本结构示意图;
图3示出了本公开实施例提供的一种多媒体资源推荐方法的流程示意图;
图4示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图5示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图6示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图7示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图8示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图9示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图10示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图11示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图12示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图13示出了本公开实施例提供的又一种多媒体资源推荐方法的流程示意图;
图14示出了本公开实施例提供的一种多媒体资源推荐装置的结构示意图;
图15示出了本公开实施例提供的又一种多媒体资源推荐装置的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
还应当理解的是,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素和/或组件的存在或添加。
本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据。
下面对本公开实施例所涉及的一些概念做解释说明。
异构图:也被称为异构信息网络(HIN,heterogeneous information network)或异构图网络,其通常由多种类型的节点和边组成,节点表示实体,边表示实体间的关系,边将可以将各个节点连接起来形成网状结构。其中,每个节点可以对应一个唯一的身份标识(identity,ID),每条边也可以对应一个唯一的身份标识。异构图在链路预测、个性化推荐、节点分类等领域下可以得到广泛地应用。
示例性地,图1为一种异构图的基本结构。该异构图中包括节点101、边102以及节点103,具体的节点101和节点103通过边102连接。其中节点101用于表示实体A,边102用于表示关系B,节点103用于表示实体C。节点101、边102以及节点103形成“实体、关系、实体”的三元组,具体用于表示“实体A和实体C之间存在关系B”。
本公开实施例中的实体可以为用户账户和多媒体资源,关系可以为浏览关系、点赞关系以及留言关系等。本公开实施例中将该浏览关系、该点赞关系以及该留言关系统称为交互操作关系。
如图2所示,实体可以是用户账户A(节点201)和多媒体资源B(节点203),则边202用于连接具有交互操作关系的用户账户A和多媒体资源B,具体可以为用户账户A浏览了多媒体资源B。实体也可以是用户账户A和多媒体资源C(节点205),则边204用于连接具有交互操作关系的用户账户A和多媒体资源C。
如背景技术中所描述,由于现有技术中只考虑用户的兴趣特征为用户进行视频推荐,可能不能准确有效地确定出该用户的待推荐视频,进而影响用户对视频业务的体验程度。
基于此,本公开实施例提供一种多媒体资源推荐方法,电子设备可以对用户账户节点的初始特征和多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征,以及基于该用户账户节点的初始特征和该每一次聚类后得到的聚类用户账户节点的特征,得到该用户账户节点的目标特征,基于该多媒体资源节点的初始特征和该每一次聚类后得到的聚类多媒体资源节点的特征,得到该多媒体资源节点的目标特征。由于该用户账户节点的目标特征可以表征该用户账户节点在不同层次(例如初始特征层次以及每一次聚类之后得到的特征层次)中的特征信息,该多媒体资源节点的目标特征可以表征该多媒体资源节点在不同层次中的特征信息,因此基于该用户账户节点在不同层次中的特征信息和该多媒体资源节点在不同层次中的特征信息确定该用户账户节点表征(或对应)的账户对应的待推荐多媒体资源,能够准确、有效地确定出账户的待推荐多媒体资源,可以提升用户体验。
本公开实施例提供的多媒体资源推荐方法、装置、电子设备及存储介质,应用于向某一用户账户推荐多媒体资源的场景中。当获取到用户账户节点的初始特征和多媒体资源节点的初始特征时,可以依据本公开实施例提供的方法,确定该用户账户节点表征的账户的待推荐多媒体资源。
以下结合附图对本公开实施例提供的多媒体资源推荐方法进行示例性说明:
可以理解的是,执行本公开实施例提供的多媒体资源推荐方法的电子设备可以是手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(personaldigital assistant,PDA)、增强现实(augmented reality,AR)\虚拟现实(virtualreality,VR)设备等可以安装并使用内容社区应用的设备,本公开对该电子设备的具体形态不作特殊限制。其可以与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互。
如图3所示,本公开实施例提供的多媒体资源推荐方法可以包括S101-S104。
S101、获取用户账户节点的初始特征和多媒体资源节点的初始特征。
应理解,该用户账户节点的数量可以为多个,该多媒体资源节点的数量可以为多个。
本公开实施例中的多媒体资源可以包括视频、音频、文本以及图片等。
S102、对用户账户节点的初始特征和多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和每一次聚类后得到的聚类多媒体资源节点的特征。
其中,I∈[1,L],L为大于1的第一阈值。
可以理解的是,电子设备可以对用户账户节点的初始特征进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点,以及可以对多媒体资源节点的初始特征进行I次距离,并确定每一次聚类后得到的聚类多媒体资源的特征。
具体的,电子设备对用户账户节点的初始特征进行I次聚类包括:对用户账户节点的初始特征进行一次聚类,可以确定出第一次聚类后得到的聚类用户账户节点,然后对该第一次聚类后得到的聚类用户账户节点进行一次聚类,可以确定出第二次聚类后得到的聚类用户账户节点。电子设备对多媒体资源节点的初始特征进行I次聚类的过程是类似的。
S103、基于用户账户节点的初始特征和每一次聚类后得到的聚类用户账户节点的特征,得到用户账户节点的目标特征,以及基于多媒体资源节点的初始特征和每一次聚类后得到的聚类多媒体资源节点的特征,得到多媒体资源节点的目标特征。
在本公开实施例的一种实现方式中,用户账户节点的初始特征、聚类用户账户节点的特征、多媒体资源节点的初始特征、聚类多媒体资源节点的特征、用户账户节点的目标特征以及多媒体资源节点的目标特征均可以采用向量表征。具体的,电子设备可以拼接该用户账户节点的初始向量和该每一次聚类后得到的聚类用户账户节点的向量,得到该用户账户节点的目标向量;还可以拼接该多媒体资源节点的初始向量和该每一次聚类后得到的多媒体资源节点的向量,得到该多媒体资源节点的目标向量。
S104、基于用户账户节点的目标特征和多媒体资源节点的目标特征,确定用户账户节点表征的账户的待推荐多媒体资源,并向账户推荐待推荐多媒体资源。
应理解,电子设备可以基于每一个用户账户节点的目标特征和多个多媒体资源节点各自的目标特征,从该多个多媒体资源节点中选择(或确定)至少一个多媒体资源节点,并将该至少一个多媒体资源节点对应的多媒体资源,确定为该每一个用户账户节点对应(或表征)的账户的待推荐多媒体资源。
上述实施例提供的技术方案至少能够带来以下有益效果:由S101-S104可知,电子设备可以对用户账户节点的初始特征和多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征,以及基于该用户账户节点的初始特征和该每一次聚类后得到的聚类用户账户节点的特征,得到该用户账户节点的目标特征,基于该多媒体资源节点的初始特征和该每一次聚类后得到的聚类多媒体资源节点的特征,得到该多媒体资源节点的目标特征。由于该用户账户节点的目标特征可以表征该用户账户节点在不同层次(例如初始特征层次以及每一次聚类之后得到的特征层次)中的特征信息,该多媒体资源节点的目标特征可以表征该多媒体资源节点在不同层次中的特征信息,因此基于该用户账户节点在不同层次中的特征信息和该多媒体资源节点在不同层次中的特征信息确定该用户账户节点表征(或对应)的账户对应的待推荐多媒体资源,能够准确、有效地确定出账户的待推荐多媒体资源,可以提升用户体验。
结合图3,如图4所示,在本公开实施例的一种实现方式中,上述用户账户节点的初始特征和上述多媒体资源节点的初始特征均采用向量表征,上述获取用户账户节点的初始特征和多媒体资源节点的初始特征,具体包括S1011-S1013。
S1011、获取至少两个时间窗口中每一个时间窗口的交互记录。
其中,该交互记录至少用于记录每一用户执行过交互操作的多媒体资源以及该交互操作的数量,该至少两个时间窗口为历史时间段内时长不同的时间窗口。
应理解,该历史时间段为当前时刻之前的一段时间。一个时间窗口可以为距当前时刻最近的时间窗口,例如近5天,也可以为该历史时间段内的任意一个时间窗口(例如上一个月中的某个连续的5天,例如历史时间段内的第2天-第6天)。
可以理解的是,时长不同的时间窗口用于该至少两个时间窗口中的各个时间窗口分别具有不同的时间长度,例如一个时间窗口的时间长度可以为1天、3天、5天或者7天等。
在本公开实施例的一种实现方式中,上述至少两个时间窗口中包括的时间窗口的时间长度也可以相同。例如,电子设备可以获取多个5天(即第1天-第5天为一个时间窗口,第6天-第10天为另一个时间窗口)的交互记录。
可选地,上述至少两个时间窗口中可以包括短期时间窗口,例如1天、2天等,也可以包括长期时间窗口,例如20天、30天等。本公开实施例中,当上述至少两个时间窗口中即包括短期时间窗口,又包括长期时间窗口时,电子设备可以确定出用户账户节点的长短期特征和多媒体资源节点的长短期特征,即基于用户账户节点对应的长短期兴趣为用户账户节点表征的账户提供个性化的多媒体资源推荐服务。
结合上述实施例的描述,该交互操作可以包括浏览操作、点赞操作以及留言操作等。
可选地,该交互记录中可以包括某一用户账户对某一多媒体资源执行浏览操作(即该用户账户浏览该多媒体资源),以及执行该浏览操作(即该用户账户浏览该多媒体资源)的次数。例如,用户账户A与多媒体资源1在某一时间窗口执行过浏览操作,该浏览操作的数量为5,即用户账户A在该时间窗口浏览了5次该多媒体资源1。
S1012、基于获取到的交互记录,确定每一个时间窗口中用户账户节点的初始子向量和每一个时间窗口中多媒体资源节点的初始子向量。
应理解,对于不同的时间窗口而言,电子设备可能会获取到不同的交互记录,进而确定出的不同时间窗口中用户账户节点的初始子向量(和/或多媒体资源节点的初始子向量)也可能不同。该每一个时间窗口中该用户账户节点的初始子向量可以表征该用户账户节点在该时间窗口下的特征,该每一个时间窗口中该多媒体资源节点的初始子向量可以表征该多媒体资源节点在该时间窗口下的特征。
S1013、拼接每一个时间窗口中用户账户节点的初始子向量,得到用户账户节点的初始特征,以及拼接每一个时间窗口中多媒体资源节点的初始子向量,得到多媒体资源节点的初始特征。
可以理解的是,用户账户节点的初始特征可以为该用户账户节点在上述历史时间段内(或上述至少两个时间窗口下)的特征,电子设备可以拼接每一个时间窗口中该用户账户节点的初始子向量(即该用户账户节点在该每一个时间窗口下的特征),得到该用户账户节点在该历史时间段内的特征。同理,多媒体资源节点的初始特征可以为该多媒体资源节点在该历史时间段内(或该至少两个时间窗口下)的特征,该电子设备可以拼接每一个时间窗口中该多媒体资源的初始子向量(即该多媒体资源节点在该每一个时间窗口下的特征),得到该多媒体资源节点在该历史时间段内的特征。
示例性的,假设上述历史时间段内包括的时间窗口的数量为3,该3个时间窗口中用户账户节点的初始子向量均为一个100维的向量,电子设备拼接该3个时间窗口中该用户账户节点的初始子向量,即得到1个300维的向量,该300维的向量即为该用户账户节点的初始特征。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1011-S1013可知,电子设备可以获取至少两个时间窗口中每一个时间窗口的交互记录,并且基于获取到的交互记录,确定每一个时间窗口中用户账户节点的初始子向量和每一个时间窗口中多媒体资源节点的初始子向量。由于每一个时间窗口中用户账户节点的初始子向量可以表征该用户账户节点在该每一个时间窗口下的特征,该每一个时间窗口中多媒体资源节点的初始子向量可以表征该多媒体资源节点在该每一个时间窗口下的特征;因此,拼接该每一个时间窗口中用户账户节点的初始子向量可以得到该用户账户节点在该历史时间段内的特征(即用户账户节点的初始特征),拼接该每一个时间窗口中多媒体资源的初始子向量可以得到该多媒体资源节点在该历史时间段内的特征(即多媒体资源节点的初始特征),能够提升初始特征(包括用户账户节点的初始特征和多媒体资源节点的初始特征)的获取效率。
结合图4,如图5所示,在本公开实施例的一种实现方式中,上述基于获取到的交互记录,确定每一个时间窗口中用户账户节点的初始子向量和每一个时间窗口中多媒体资源节点的初始子向量,具体可以包括S1012a-S1012b。
S1012a、基于获取到的交互记录,生成每一个时间窗口对应的初始异构图。
其中,该初始异构图包括用户账户节点、多媒体资源节点以及边,该边用于连接具有交互操作关系的用户账户节点和多媒体资源节点。
应理解,一个用户账户节点可以表征一个用户账户,一个多媒体资源节点可以表征一个多媒体资源。若一个用户账户节点与一个多媒体资源节点之间存在边,说明该用户账户节点(或用户账户)与该多媒体资源节点(或多媒体资源)具有交互操作关系。
需要说明的是,关于本公开实施例中的异构图(包括初始异构图,和下述聚类异构图)中的内部结构(或组成)的解释说明,可以参见上述图1和图2中的示例和描述,此处不再赘述。
S1012b、基于每一个时间窗口对应的初始异构图,确定每一个时间窗口中用户账户节点的初始子向量和每一个时间窗口中多媒体资源节点的初始子向量。
在本公开实施例的一种实现方式中,电子设备可以获取每一初始异构图对应图神经网络模型,进而基于获取到的每一个图神经网络模型,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一时间窗口中该多媒体资源节点的初始子向量。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1012a-S1012b可知,电子设备可以基于获取到的交互记录,生成每一个时间窗口对应的初始异构图,并且基于该每一个时间窗口对应的初始异构图,确定该每一个时间窗口中用户账户节点的初始子向量和该每一个时间窗口中多媒体资源节点的初始子向量。能够提高子向量(包括用户账户节点的初始子向量和多媒体资源节点的初始子向量)的确定效率,进而提升上述初始特征的获取效率。
结合图3,如图6所示,在本公开实施例的一种实现方式中,上述每一次聚类后得到的聚类用户账户节点的特征包括该聚类用户账户节点的向量,上述每一次聚类后得到的聚类多媒体资源节点的特征包括该聚类多媒体资源节点的向量,上述对用户账户节点的初始特征和多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和每一次聚类后得到的聚类多媒体资源节点的特征,具体可以包括S1021-S1022。
S1021、对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图。
应理解,每一次聚类后得到的聚类异构图包括聚类用户账户节点、聚类多媒体资源以及聚类边,该聚类边用于连接具有交互操作关系的聚类用户账户节点和聚类多媒体资源节点。
可以理解的时候,电子设备可以根据每一初始异构图中每一个节点(包括用户账户节点和多媒体资源节点)的初始特征(或向量),将同一类型的节点聚类,即将多个用户账户节点和多个多媒体资源节点分别聚类。
示例性地,假设某一初始异构图中包括2000个用户账户节点和10000个多媒体资源节点,经过S1021得到的聚类异构图(例如进行一次聚类后得到的聚类异构图)中可以包括500个聚类用户账户节点和2500个聚类多媒体资源节点,该500个聚类用户账户节点可以理解为500个与用户账户相关的类簇,该2500个聚类多媒体资源节点可以理解为2500个与多媒体资源相关的类簇。
应理解,一个聚类用户账户节点可以理解为一个粗粒度的用户账户节点,一个聚类多媒体资源节点可以理解为一个粗粒度的多媒体资源节点。
可选地,电子设备可以基于kmeans聚类算法对上述每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类。
S1022、基于每一个聚类后得到的聚类异构图,确定每一次聚类后得到的聚类用户账户节点的向量和每一次聚类后得到的聚类多媒体资源节点的向量。
可以理解的是,电子设备基于每一个聚类后得到的聚类异构图,确定每一次聚类后得到的聚类用户账户节点的向量的方法与上述基于每一个时间窗口对应的初始异构图,确定每一个时间窗口中用户账户节点的初始子向量和每一个时间窗口中多媒体资源节点的初始子向量的方法是相同或类似的,此处不再赘述。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1021-S1022可知,电子设备可以对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图;并且基于该每一次聚类后得到的聚类异构图,确定该每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量。能够快速、有效地确定出每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征。进而能够提升得到目标特征(包括用户账户节点的目标特征和多媒体资源节点的目标特征)的效率。
结合图6,如图7所示,在本公开实施例的一种实现方式中,上述对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图,具体可以包括S1021a。
S1021a、执行聚类操作,该聚类操作包括:获取当前异构图对应的图神经网络模型;基于当前异构图对应的图神经网络模型提取当前异构图中每一个节点的子向量;将每一类型的节点对应的子向量划分为多个类簇;基于得到的类簇,生成聚类异构图。
其中,该当前异构图为初始异构图或上一次执行该聚类操作后得到的聚类异构图,该类型包括用户账户类型和多媒体资源类型。
应理解,该得到的类簇中的每一个类簇为该生成的聚类异构图中的一个聚类节点(即聚类用户账户节点或聚类多媒体资源节点)。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1021a可知,电子设备可以基于当前异构图对应的图神经网络模型提取该当前异构图中每一个节点的子向量,将每一类型对应的子向量划分为多个类簇,并且基于得到的类簇生成聚类异构图。可以有效地获取到每一次聚类后得到的聚类异构图,能够提升聚类异构图的生成(及获取)的效率。
结合图7,如图8所示,在公开实施例的一种实现方式中,上述基于得到的类簇,生成聚类异构图具体包括S1021a1-S1021a2。
S1021a1、将得到的每一个类簇,确定为生成的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点。
应理解,一个聚类异构图对应的一个类簇为该聚类异构图中包括的一个节点,该节点可以为聚类用户账户节点或者聚类多媒体资源节点。
S1021a2、对每一个类簇执行下述操作:当每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定每一个类簇与其他类簇之间存在聚类边。
其中,该其他类簇为得到的所有类簇中除该每一个类簇以外的任一类簇。
应理解,若某一用户账户节点与某一多媒体资源节点之间存在交互操作关系,则该用户账户节点对应的(或经聚类后得到的)聚类用户账户节点与该多媒体资源节点对应的(或经聚类后得到的)聚类多媒体资源节点之间存在交互操作关系。该聚类用户账户节点与该聚类多媒体资源节点之间存在交互操作关系即该聚类用户账户节点与该聚类多媒体资源节点之间存在聚类边。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1021a1-S1021a2可知,电子设备可以将得到的每一个类簇,确定为生成(或对应)的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点,并且对每一个类簇执行下述操作:当该每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定该每一个类簇与该其他类簇之间存在聚类边。本公开实施例中,电子设备可以确定每一次聚类后得到的聚类异构图中包括的节点(即聚类用户账户节点和聚类多媒体资源节点),以及每一聚类异构图中包括的聚类边。能够准确、有效地确定出聚类异构图,具体为聚类异构图中包括的节点和边,提升每一次得到的聚类节点(包括聚类用户账户节点和聚类多媒体资源节点)的特征的确定效率。
结合图6,如图9所示,在本公开实施例的一种实现方式中,上述基于每一个聚类后得到的聚类异构图,确定每一次聚类后得到的聚类用户账户节点的向量和每一次聚类后得到的聚类多媒体资源节点的向量,具体包括S1022a-S1022b。
S1022a、根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定聚类用户账户节点对应的下M跳节点以及聚类多媒体资源节点对应的下N跳节点。
其中,M≥1,N≥1。
应理解,对于每一个聚类异构图包括的每一个聚类用户账户节点而言,电子设备可以从该聚类用户账户节点对应的多个节点中选择(或确定)该聚类用户账户节点对应的下M跳节点,该聚类用户账户节点对应的多个节点包括:与该聚类用户账户节点存在交互操作关系的聚类多媒体资源节点(即该聚类用户账户节点对应的至少一个下一跳节点),与该存在交互操作关系的聚类多媒体资源节点存在交互操作关系的其他聚类用户账户节点(即该聚类用户账户节点对应的至少一个下二跳节点)等。对于该每一个聚类异构图包括的每一个聚类多媒体资源节点而言,电子设备还可以从该聚类多媒体资源节点对应的多个节点中选择(或确定)该多媒体资源节点对应的下N跳节点。
S1022b、基于聚类用户账户节点对应的下M跳节点确定聚类用户账户节点的向量,以及基于聚类多媒体资源节点对应的下N跳节点确定聚类多媒体资源节点的向量。
可以理解的是,电子设备可以获取该每一次聚类后得到的聚类异构图对应的图神经网络模型,然后将该聚类用户账户节点对应的下M跳节点输入该图神经网络模型以得到该聚类用户账户节点的向量,以及将该聚类多媒体资源节点对应的下N跳节点输入该图神经网络模型以得到该聚类多媒体资源节点的向量。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1022a-S1022b可知,电子设备可以根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定聚类用户账户节点对应的下M跳节点以及聚类多媒体资源节点对应的下N跳节点,并且基于该下M跳节点(具体为将该下M条节点输入到对应的图神经网络模型)确定(或得到)该聚类用户账户节点的向量,以及基于该下N跳节点(具体为将该下N跳节点输入到对应的图神经网络模型)确定(或得到)该聚类多媒体资源节点的向量。能够准确、有效地确定出每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量,进而提升目标特征的确定效率。
结合图7,如图10所示,在公开实施例的一种实现方式中,目标异构图为上述初始异构图或上述聚类异构图,获取每一个时间窗口中与目标异构图对应的图神经网络模型的方法可以包括S1021a3-S1021a6。
S1021a3、获取每一个时间窗口中与目标异构图对应的训练集和测试集。
可选地,电子设备可以将该该目标异构图中90%的边作为训练集,剩余10%的边作为测试集。
S1021a4、对训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,以得到每一用户账户类型节点的下X跳节点,以及每一多媒体资源类型节点对应的下Y跳节点。
其中,当该目标异构图为初始异构图时,该用户账户类型节点为上述用户账户节点,该多媒体资源类型节点为上述多媒体资源节点;当该目标异构图为聚类异构图时,该用户账户类型节点为上述聚类用户账户节点,该多媒体资源类型节点为上述聚类多媒体资源节点,X≥1,Y≥1。
可选地,电子设备可以基于GraphSage算法从测试集中得到上述下X跳节点以及下Y跳节点。
S1021a5、将获取到的下X跳节点和下Y跳节点输入到初始神经网络模型中,得到用户账户类型节点和多媒体资源类型节点之间存在边的概率。
示例性的,电子设备可以对该训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,得到某一用户账户类型节点的多个下X跳节点,以及某一多媒体资源类型节点对应的多个下Y跳节点,然后将该多个下X跳节点和该多个下Y跳节点输入到初始神经网络模型中。
可选地,上述用户账户类型节点的多个下X跳节点可以为跳数相同的多个节点,例如多个下一跳节点,该多个下X跳节点也可以为跳数不同的多个节点,例如包括1个下一跳节点、1个下二跳节点以及1个下三跳节点等。同理,上述多媒体资源类型节点的多个下Y跳节点可以为跳数相同的多个节点,也可以为跳数不同的多个节点。
需要说明的是,上述X和Y的取值可以相同,也可以不同。即电子设备可以得到相同跳数的下X跳节点和下Y跳节点,也可以得到不同跳数的下X跳节点和下Y跳节点。上述M与X的取值可以相同,也可以不同,上述N与Y的取值可以相同,也可以不同。即电子设备在模型训练过程(S1021a3-S1021a6)中得到和输入的节点,与确定聚类用户账户节点的向量和聚类多媒体资源节点的向量的过程(S1022a-S1022b)确定和基于的节点可以相同,也可以不同,本公开实施例不作具体限定。
S1021a6、根据概率迭代训练初始神经网络模型,直到概率与测试集对应的真实结果之间的误差小于第二阈值,将得到的神经网络模型确定为目标异构图对应的图神经网络模型。
应理解,该概率为上述用户账户类型节点和多媒体资源类型节点之间存在边的概率,测试集对应的真实结果可以理解为该测试集中包括了该用户账户类型节点和该多媒体资源类型节点之间是否存在边的真实结果。该概率与该真实结果之间的误差小于第二阈值,说明该概率已经无限接近于该真实结果,即此时得到的神经网络模型的预测准确度已经达到预测需求(可以预测或得到趋于真实结果的概率或结果),可以将该神经网络模型作为该目标异构图对应的图神经网络模型,进而基于该图神经网络模型,得到该目标异构图包括的各个节点的特征(向量)。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1021a3-S1021a6可知,电子设备可以对训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,得到上述下X跳节点和下Y跳节点,并将该下X跳节点和该下Y跳节点输入到初始神经网络模型中,得到该用户账户类型节点和该多媒体资源类型节点之间存在边的概率;然后该电子设备基于该概率迭代训练该初始神经网络模型,得到目标异构图的图神经网络模型。能够得到预测准确度较高的图神经网络模型,进而基于该图神经网络模型能够准确地确定出该目标构图中包括的各个节点的向量。
结合图10,如图11所示,上述将获取到的下X跳节点和下Y跳节点输入到初始神经网络模型中,得到用户账户类型节点和多媒体资源类型节点之间存在边的概率,具体包括步骤A-步骤C。
步骤A、将下X跳节点输入初始神经网络模型,得到用户账户类型节点当前的向量。
步骤B、将下Y跳节点输入初始神经网络模型,得到多媒体资源类型节点当前的向量。
步骤C、基于用户账户类型当前的向量和多媒体资源类型节点当前的向量,确定用户账户类型节点与多媒体资源类型节点之间存在边的概率。
应理解,无论将该下X跳节点和该下Y跳节点分别输入到初始神经网络模型,还是已经训练完成的图神经网络模型,都可以先得到向量。对于初始神经网络模型而言,除得到该用户账户类型节点当前的向量和该多媒体资源类型节点当前的向量之外,还需要确定该用户账户类型节点与该多媒体资源类型节点之间存在边的概率,以指导该初始网络模型的训练过程。对于该图神经网络模型而言,得到的用户账户类型节点当前的向量和多媒体资源类型节点当前的向量即分别为用户账户类型节点的向量和多媒体资源类型节点的向量。
例如,若该初始神经网络模型为某一聚类异构图对应的图神经网络模型,并且X=M,Y=M,则上述S1022b中的过程与该步骤A-步骤C的过程是相同或类似的。即电子设备可以将聚类用户账户节点对应的下M跳节点输入该每一个聚类异构图对应的图神经网络模型,得到该聚类用户账户节点的向量,以及将该聚类多媒体资源节点对应的下N跳节点输入该每一个聚类异构图对应的图神经网络模型,得到该聚类多媒体资源节点的向量。
上述实施例提供的技术方案至少能够带来以下有益效果:由步骤A-步骤C可知,电子设备可以分别将上述下X跳节点和下Y跳节点输入到初始神经网络模型,并且基于得到的用户账户类型节点当前的向量和多媒体资源类型节点当前的向量,确定该用户账户类型节点与该多媒体资源类型节点之间存在边的概率。能够基于不同类型的两个节点当前的向量确定该两个节点之间存在边的概率,提升了模型训练的效率,进而能够确定出预测准确度较高的图神经网络模型。
结合图6,如图12所示,在本公开实施例的一种实现方式中,上述基于每一个聚类后得到的聚类异构图,确定每一次聚类后得到的聚类用户账户节点的向量和每一次聚类后得到的聚类多媒体资源节点的向量,具体还可以包括S1022c。
S1022c、对于每一次聚类后得到的聚类异构图中的每一个类簇而言,确定每一个类簇中每一个节点的子向量,并根据确定出的子向量,确定每一个节点中的子向量的平均值,并将平均值确定为每一个类簇的向量。
可以理解的是,对于上述每一个类簇,该类簇可以包括多个子向量,即多个节点各自对应的子向量。本公开实施例中,电子设备可以将该多个子向量的平均值确定为该类簇的向量。
结合上述实施例的描述,应理解,一个类簇可以为一个聚类用户账户节点或一个聚类多媒体资源节点。如此,电子设备可以将多个子向量的平均值确定为聚类用户账户节点的向量,或聚类多媒体资源节点的向量。
可选地,电子设备还可以将上述多个子向量的加权平均值确定为该类簇的向量。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1022c可知,对于每一次聚类后得到的聚类异构图中的每一个类簇而言,电子设备可以将该类簇包括(或对应的)多个子向量的平均值确定该类簇的向量。由于一个类簇为一个聚类用户账户节点或一个聚类多媒体资源节点,如此,在确定类簇(或聚类节点)的向量的过程中,无需对模型进行训练,可以直接基于初始异构图或上一次聚类后得到的聚类有构图中包括的每个节点的向量,确定出本次聚类后得到的聚类用户账户节点的向量和聚类多媒体资源节点的向量,可以快速地确定出聚类节点的向量,提升多媒体资源的推荐效率。
结合图3,如图13所示,在本公开实施例的一种实现方式中,上述基于用户账户节点的目标特征和多媒体资源节点的目标特征,确定用户账户节点表征的账户的待推荐多媒体资源,具体包括S1041-S1042。
S1041、确定用户账户节点的目标特征与多媒体资源节点的目标特征之间的相似度。
在本公开实施例的一种实现方式中,该用户账户节点的目标特征包括该用户账户节点的目标向量,该多媒体资源节点的目标特征包括该目标多媒体资源节点的目标向量,电子设备可以将该用户账户节点的目标向量与该目标多媒体资源节点的目标向量之间的点乘得分(或乘积)确定为该相似度。
S1042、将得到的相似度排序,并按照排序结果确定待推荐多媒体资源。
应理解,基于上述S1041电子设备可以确定出一个用户账户节点与多个多媒体资源节点各自对应的多个相似度,该电子设备可以将该多个相似度排序。
在本公开实施例的一种实现方式中,电子设备可以将从得到的相似度(即该多个相似度)中确定最大的K个相似度,K≥1;并且将该最大的K个相似度对应的多媒体资源节点表征的多媒体资源,确定为该待推荐多媒体资源。
上述实施例提供的技术方案至少能够带来以下有益效果:由S1041-S1042可知,电子设备可以确定用户账户节点的目标特征与多媒体资源节点的目标特征之间的相似度,然后对得到的相似度进行排序,并按照排序结果确定账户的待推荐多媒体资源。本公开实施例中,电子设备可以基于用户账户节点的目标特征与多媒体资源节点的目标特征之间的相似度,为用户账户节点表征的账户确定待推荐多媒体资源,能够为该账户确定出相似度较高的多媒体资源,提高多媒体资源推荐的有效性,提升用户体验。
可以理解的,在实际实施时,本公开实施例所述的电子设备可以包含有用于实现前述对应多媒体资源推荐方法的一个或多个硬件结构和/或软件模块,这些执行硬件结构和/或软件模块可以构成一个电子设备。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
基于这样的理解,本公开实施例还对应提供一种多媒体资源推荐装置,图14示出了本公开实施例提供的多媒体资源推荐装置的结构示意图。如图14所示,该多媒体资源推荐装置30可以包括:获取模块301、确定模块302以及处理模块303。
获取模块301,被配置为获取用户账户节点的初始特征和多媒体资源节点的初始特征。
确定模块302,被配置为对该用户账户节点的初始特征和该多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和该每一次聚类后得到的聚类多媒体资源节点的特征,I∈[1,L],L为大于1的第一阈值。
处理模块303,还被配置为基于该用户账户节点的初始特征和该每一次聚类后得到的聚类用户账户节点的特征,得到该用户账户节点的目标特征,以及基于该多媒体资源节点的初始特征和该每一次聚类后得到的聚类多媒体资源节点的特征,得到该多媒体资源节点的目标特征。
确定模块302,还被配置为基于该用户账户节点的目标特征和该多媒体资源节点的目标特征,确定该用户账户节点表征的账户的待推荐多媒体资源,并向该账户推荐该待推荐多媒体资源。
可选地,该用户账户节点的初始特征和该多媒体资源节点的初始特征均采用向量表征。
获取模块301,具体被配置为获取至少两个时间窗口中每一个时间窗口的交互记录,该交互记录至少用于记录每一用户账户执行过交互操作的多媒体资源及该交互操作的数量,该至少两个时间窗口为历史时间段内时长不同的时间窗口。
确定模块302,具体被配置为基于获取到的交互记录,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量。
处理模块303,具体被配置为拼接该每一个时间窗口中该用户账户节点的初始子向量,得到该用户账户节点的初始特征,以及拼接该每一个时间窗口中该多媒体资源节点的初始子向量,得到该多媒体资源节点的初始特征。
可选地,处理模块303,具体还被配置为基于该获取到的交互记录,生成该每一个时间窗口对应的初始异构图,该初始异构图包括用户账户节点、多媒体资源节点以及边,该边用于连接具有交互操作关系的用户账户节点和多媒体资源节点。
确定模块302,具体还被配置为基于该每一个时间窗口对应的初始异构图,确定该每一个时间窗口中该用户账户节点的初始子向量和该每一个时间窗口中该多媒体资源节点的初始子向量。
可选地,上述每一次聚类后得到的聚类用户账户节点的特征包括该聚类用户账户节点的向量,上述每一次聚类后得到的聚类多媒体资源节点的特征包括该聚类多媒体资源节点的向量。
获取模块301,具体被配置为对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图。
确定模块302,具体被配置为基于该每一次聚类后得到的聚类异构图,确定该每一次聚类后得到的聚类用户账户节点的向量和该每一次聚类后得到的聚类多媒体资源节点的向量。
可选地,处理模块303,具体被配置为执行聚类操作,该聚类操作包括:获取当前异构图对应的图神经网络模型,该当前异构图为初始异构图或上一次执行该聚类操作后得到的聚类异构图;基于该当前异构图对应的图神经网络模型提取该当前异构图中每一个节点的子向量;将每一类型的节点对应的子向量划分为多个类簇,该类型包括用户账户类型和多媒体资源类型;基于得到的类簇,生成聚类异构图。
可选地,确定模块302,具体还被配置为将得到的每一个类簇,确定为该生成的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点。
处理模块303,具体还被配置为对该每一个类簇执行下述操作:当该每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定该每一个类簇与该其他类簇之间存在聚类边,该其他类簇为得到的所有类簇中除该每一个类簇以外的任一类簇。
可选地,确定模块302,具体还被配置为根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定该聚类用户账户节点对应的下M跳节点以及该聚类多媒体资源节点对应的下N跳节点,M≥1,N≥1。
确定模块302,具体还被配置为基于该聚类用户账户节点对应的下M跳节点确定该聚类用户账户节点的向量,以及基于该聚类多媒体资源节点对应的下N跳节点确定该聚类多媒体资源节点的向量。
可选地,目标异构图为该初始异构图或该聚类异构图。
获取模块301,具体还被配置为获取每一个时间窗口中与该目标异构图对应的训练集和测试集。
处理模块303,具体还被配置为对该训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,以得到每一用户账户类型节点对应的下X跳节点,以及每一多媒体资源类型节点对应的下Y跳节点;当该目标异构图为该初始异构图时,该用户账户类型节点为该用户账户节点,该多媒体资源类型节点为该多媒体资源节点;当该目标异构图为该聚类异构图时,该用户账户类型节点为该聚类用户账户节点,该多媒体资源类型节点为该聚类多媒体资源节点,X≥1,Y≥1。
处理模块303,具体还被配置为将获取到的该下X跳节点和该下Y跳节点输入到初始神经网络模型中,得到该用户账户类型节点和该多媒体资源类型节点之间存在边的概率。
确定模块302,具体还被配置为根据该概率迭代训练该初始神经网络模型,直到该概率与该测试集对应的真实结果之间的误差小于第二阈值,将得到的神经网络模型确定为该目标异构图对应的图神经网络模型。
可选地,处理模块303,具体还被配置为将该下X跳节点输入该初始神经网络模型,得到该用户账户类型节点当前的向量。
处理模块303,具体还被配置为将该下Y跳节点输入该初始神经网络模型,得到该多媒体资源类型节点当前的向量。
确定模块302,具体还被配置为基于该用户账户类型节点当前的向量和该多媒体资源类型节点当前的向量,确定该用户账户类型节点与该多媒体资源类型节点之间存在边的概率。
可选地,确定模块302,具体还被配置为对于每一次聚类后得到的聚类异构图中的每一个类簇而言,确定该每一个类簇中每一个节点的子向量,并根据确定出的子向量,确定该每一个节点的子向量的平均值,并将该平均值确定为该每一个类簇的向量。
可选地,确定模块302,具体被配置为确定该用户账户节点的目标特征与该多媒体资源节点的目标特征之间的相似度。
确定模块302,具体还被配置为对得到的相似度进行排序,并按照排序结果确定该待推荐多媒体资源。
如上所述,本公开实施例可以根据上述方法示例对多媒体资源推荐装置进行功能模块的划分。其中,上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。另外,还需要说明的是,本公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。
关于上述实施例中的多媒体资源推荐装置,其中各个模块执行操作的具体方式、以及具备的有益效果,均已经在前述方法实施例中进行了详细描述,此处不再赘述。
图15是本公开提供的另一种多媒体资源推荐装置的结构示意图。如图15,该多媒体资源推荐装置40可以包括至少一个处理器401以及用于存储处理器可执行指令的存储器403。其中,处理器401被配置为执行存储器403中的指令,以实现上述实施例中的多媒体资源推荐方法。
另外,多媒体资源推荐装置40还可以包括通信总线402以及至少一个通信接口404。
处理器401可以是一个处理器(central processing units,CPU),微处理单元,ASIC,或一个或多个用于控制本公开方案程序执行的集成电路。
通信总线402可包括一通路,在上述组件之间传送信息。
通信接口404,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN)等。
存储器403可以是只读存储器(read-only memory,ROM) 或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM) 或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理单元相连接。存储器也可以和处理单元集成在一起。
其中,存储器403用于存储执行本公开方案的指令,并由处理器401来控制执行。处理器401用于执行存储器403中存储的指令,从而实现本公开方法中的功能。
在具体实现中,作为一种实施例,处理器401可以包括一个或多个CPU,例如图15中的CPU0和CPU1。
在具体实现中,作为一种实施例,多媒体资源推荐装置40可以包括多个处理器,例如图15中的处理器401和处理器407。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,多媒体资源推荐装置40还可以包括输出设备405和输入设备406。输出设备405和处理器401通信,可以以多种方式来显示信息。例如,输出设备405可以是液晶显示器(liquid crystal display,LCD), 发光二级管(light emittingdiode,LED)显示设备,阴极射线管(cathode ray tube,CRT) 显示设备,或投影仪(projector)等。输入设备406和处理器401通信,可以以多种方式接受用户的输入。例如,输入设备406可以是鼠标、键盘、触摸屏设备或传感设备等。
本领域技术人员可以理解,图15中示出的结构并不构成对多媒体资源推荐装置40的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
另外,本公开还提供一种计算机可读存储介质,包括指令,当指令由处理器执行时,使得处理器执行如上述实施例所提供的多媒体资源推荐方法。
另外,本公开还提供一种计算机程序产品,包括指令,当指令由处理器执行时,使得处理器执行如上述实施例所提供的多媒体资源推荐方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (24)

1.一种多媒体资源推荐方法,其特征在于,包括:
获取用户账户节点的初始特征和多媒体资源节点的初始特征;
对所述用户账户节点的初始特征和所述多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和所述每一次聚类后得到的聚类多媒体资源节点的特征,I∈[1,L],L为大于1的第一阈值;
基于所述用户账户节点的初始特征和所述每一次聚类后得到的聚类用户账户节点的特征,得到所述用户账户节点的目标特征,以及基于所述多媒体资源节点的初始特征和所述每一次聚类后得到的聚类多媒体资源节点的特征,得到所述多媒体资源节点的目标特征;
基于所述用户账户节点的目标特征和所述多媒体资源节点的目标特征,确定所述用户账户节点表征的账户的待推荐多媒体资源,并向所述账户推荐所述待推荐多媒体资源。
2.根据权利要求1所述的多媒体资源推荐方法,其特征在于,所述用户账户节点的初始特征和所述多媒体资源节点的初始特征均采用向量表征,所述获取用户账户节点的初始特征和多媒体资源节点的初始特征,包括:
获取至少两个时间窗口中每一个时间窗口的交互记录,所述交互记录至少用于记录每一用户账户执行过交互操作的多媒体资源及所述交互操作的数量,所述至少两个时间窗口为历史时间段内时长不同的时间窗口;
基于获取到的交互记录,确定所述每一个时间窗口中所述用户账户节点的初始子向量和所述每一个时间窗口中所述多媒体资源节点的初始子向量;
拼接所述每一个时间窗口中所述用户账户节点的初始子向量,得到所述用户账户节点的初始特征,以及拼接所述每一个时间窗口中所述多媒体资源节点的初始子向量,得到所述多媒体资源节点的初始特征。
3.根据权利要求2所述的多媒体资源推荐方法,其特征在于,所述基于获取到的交互记录,确定所述每一个时间窗口中所述用户账户节点的初始子向量和所述每一个时间窗口中所述多媒体资源节点的初始子向量,包括:
基于所述获取到的交互记录,生成所述每一个时间窗口对应的初始异构图,所述初始异构图包括用户账户节点、多媒体资源节点以及边,所述边用于连接具有交互操作关系的用户账户节点和多媒体资源节点;
基于所述每一个时间窗口对应的初始异构图,确定所述每一个时间窗口中所述用户账户节点的初始子向量和所述每一个时间窗口中所述多媒体资源节点的初始子向量。
4.根据权利要求1所述的多媒体资源推荐方法,其特征在于,所述每一次聚类后得到的聚类用户账户节点的特征包括所述聚类用户账户节点的向量,所述每一次聚类后得到的聚类多媒体资源节点的特征包括所述聚类多媒体资源节点的向量,所述对所述用户账户节点的初始特征和所述多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和所述每一次聚类后得到的聚类多媒体资源节点的特征,包括:
对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图;
基于所述每一次聚类后得到的聚类异构图,确定所述每一次聚类后得到的聚类用户账户节点的向量和所述每一次聚类后得到的聚类多媒体资源节点的向量。
5.根据权利要求4所述的多媒体资源推荐方法,其特征在于,所述对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图,包括:
执行聚类操作,所述聚类操作包括:获取当前异构图对应的图神经网络模型,所述当前异构图为初始异构图或上一次执行所述聚类操作后得到的聚类异构图;基于所述当前异构图对应的图神经网络模型提取所述当前异构图中每一个节点的子向量;将每一类型的节点对应的子向量划分为多个类簇,所述类型包括用户账户类型和多媒体资源类型;基于得到的类簇,生成聚类异构图。
6.根据权利要求5所述的多媒体资源推荐方法,其特征在于,所述基于得到的类簇,生成聚类异构图,包括:
将得到的每一个类簇,确定为所述生成的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点;
对所述每一个类簇执行下述操作:当所述每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定所述每一个类簇与所述其他类簇之间存在聚类边,所述其他类簇为得到的所有类簇中除所述每一个类簇以外的任一类簇。
7.根据权利要求4所述的多媒体资源推荐方法,其特征在于,所述基于所述每一次聚类后得到的聚类异构图,确定所述每一次聚类后得到的聚类用户账户节点的向量和所述每一次聚类后得到的聚类多媒体资源节点的向量,包括:
根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定所述聚类用户账户节点对应的下M跳节点以及所述聚类多媒体资源节点对应的下N跳节点,M≥1,N≥1;
基于所述聚类用户账户节点对应的下M跳节点确定所述聚类用户账户节点的向量,以及基于所述聚类多媒体资源节点对应的下N跳节点确定所述聚类多媒体资源节点的向量。
8.根据权利要求5所述的多媒体资源推荐方法,其特征在于,目标异构图为所述初始异构图或所述聚类异构图,获取每一个时间窗口中与所述目标异构图对应的图神经网络模型的方法包括:
获取所述每一个时间窗口中与所述目标异构图对应的训练集和测试集;
对所述训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,以得到每一用户账户类型节点对应的下X跳节点,以及每一多媒体资源类型节点对应的下Y跳节点;当所述目标异构图为所述初始异构图时,所述用户账户类型节点为所述用户账户节点,所述多媒体资源类型节点为所述多媒体资源节点;当所述目标异构图为所述聚类异构图时,所述用户账户类型节点为所述聚类用户账户节点,所述多媒体资源类型节点为所述聚类多媒体资源节点,X≥1,Y≥1;
将获取到的所述下X跳节点和所述下Y跳节点输入到初始神经网络模型中,得到所述用户账户类型节点和所述多媒体资源类型节点之间存在边的概率;
根据所述概率迭代训练所述初始神经网络模型,直到所述概率与所述测试集对应的真实结果之间的误差小于第二阈值,将得到的神经网络模型确定为所述目标异构图对应的图神经网络模型。
9.根据权利要求8所述的多媒体资源推荐方法,其特征在于,所述将获取到的所述下X跳节点和所述下Y跳节点输入到初始神经网络模型中,得到所述用户账户类型节点和所述多媒体资源类型节点之间存在边的概率,包括:
将所述下X跳节点输入所述初始神经网络模型,得到所述用户账户类型节点当前的向量;
将所述下Y跳节点输入所述初始神经网络模型,得到所述多媒体资源类型节点当前的向量;
基于所述用户账户类型节点当前的向量和所述多媒体资源类型节点当前的向量,确定所述用户账户类型节点与所述多媒体资源类型节点之间存在边的概率。
10.根据权利要求5所述的多媒体资源推荐方法,其特征在于,所述确定所述每一次聚类后得到的聚类用户账户节点的向量和所述每一次聚类后得到的聚类多媒体资源节点的向量,包括:
对于每一次聚类后得到的聚类异构图中的每一个类簇而言,确定所述每一个类簇中每一个节点的子向量,并根据确定出的子向量,确定所述每一个节点的子向量的平均值,并将所述平均值确定为所述每一个类簇的向量。
11.根据权利要求1-10中任一项所述的多媒体资源推荐方法,其特征在于,所述基于所述用户账户节点的目标特征和所述多媒体资源节点的目标特征,确定所述用户账户节点表征的账户的待推荐多媒体资源,包括:
确定所述用户账户节点的目标特征与所述多媒体资源节点的目标特征之间的相似度;
对得到的相似度进行排序,并按照排序结果确定所述待推荐多媒体资源。
12.一种多媒体资源推荐装置,其特征在于,包括获取模块、确定模块以及处理模块;
所述获取模块,被配置为获取用户账户节点的初始特征和多媒体资源节点的初始特征;
所述确定模块,被配置为对所述用户账户节点的初始特征和所述多媒体资源节点的初始特征分别进行I次聚类,并确定每一次聚类后得到的聚类用户账户节点的特征和所述每一次聚类后得到的聚类多媒体资源节点的特征,I∈[1,L],L为大于1的第一阈值;
所述处理模块,还被配置为基于所述用户账户节点的初始特征和所述每一次聚类后得到的聚类用户账户节点的特征,得到所述用户账户节点的目标特征,以及基于所述多媒体资源节点的初始特征和所述每一次聚类后得到的聚类多媒体资源节点的特征,得到所述多媒体资源节点的目标特征;
所述确定模块,还被配置为基于所述用户账户节点的目标特征和所述多媒体资源节点的目标特征,确定所述用户账户节点表征的账户的待推荐多媒体资源,并向所述账户推荐所述待推荐多媒体资源。
13.根据权利要求12所述的多媒体资源推荐装置,其特征在于,所述用户账户节点的初始特征和所述多媒体资源节点的初始特征均采用向量表征;
所述获取模块,具体被配置为获取至少两个时间窗口中每一个时间窗口的交互记录,所述交互记录至少用于记录每一用户账户执行过交互操作的多媒体资源及所述交互操作的数量,所述至少两个时间窗口为历史时间段内时长不同的时间窗口;
所述确定模块,具体被配置为基于获取到的交互记录,确定所述每一个时间窗口中所述用户账户节点的初始子向量和所述每一个时间窗口中所述多媒体资源节点的初始子向量;
所述处理模块,具体被配置为拼接所述每一个时间窗口中所述用户账户节点的初始子向量,得到所述用户账户节点的初始特征,以及拼接所述每一个时间窗口中所述多媒体资源节点的初始子向量,得到所述多媒体资源节点的初始特征。
14.根据权利要求13所述的多媒体资源推荐装置,其特征在于,
所述处理模块,具体还被配置为基于所述获取到的交互记录,生成所述每一个时间窗口对应的初始异构图,所述初始异构图包括用户账户节点、多媒体资源节点以及边,所述边用于连接具有交互操作关系的用户账户节点和多媒体资源节点;
所述确定模块,具体还被配置为基于所述每一个时间窗口对应的初始异构图,确定所述每一个时间窗口中所述用户账户节点的初始子向量和所述每一个时间窗口中所述多媒体资源节点的初始子向量。
15.根据权利要求12所述的多媒体资源推荐装置,其特征在于,所述每一次聚类后得到的聚类用户账户节点的特征包括所述聚类用户账户节点的向量,所述每一次聚类后得到的聚类多媒体资源节点的特征包括所述聚类多媒体资源节点的向量;
所述获取模块,具体被配置为对每一初始异构图中的用户账户节点和多媒体资源节点分别进行I次聚类,获取每一次聚类后得到的聚类异构图;
所述确定模块,具体被配置为基于所述每一次聚类后得到的聚类异构图,确定所述每一次聚类后得到的聚类用户账户节点的向量和所述每一次聚类后得到的聚类多媒体资源节点的向量。
16.根据权利要求15所述的多媒体资源推荐装置,其特征在于,
所述处理模块,具体被配置为执行聚类操作,所述聚类操作包括:获取当前异构图对应的图神经网络模型,所述当前异构图为初始异构图或上一次执行所述聚类操作后得到的聚类异构图;基于所述当前异构图对应的图神经网络模型提取所述当前异构图中每一个节点的子向量;将每一类型的节点对应的子向量划分为多个类簇,所述类型包括用户账户类型和多媒体资源类型;基于得到的类簇,生成聚类异构图。
17.根据权利要求16所述的多媒体资源推荐装置,其特征在于,
所述确定模块,具体还被配置为将得到的每一个类簇,确定为所述生成的聚类异构图中包括的聚类用户账户节点或聚类多媒体资源节点;
所述处理模块,具体还被配置为对所述每一个类簇执行下述操作:当所述每一个类簇包括的子向量对应的节点与其他类簇包括的子向量对应的节点之间存在交互操作关系时,确定所述每一个类簇与所述其他类簇之间存在聚类边,所述其他类簇为得到的所有类簇中除所述每一个类簇以外的任一类簇。
18.根据权利要求15所述的多媒体资源推荐装置,其特征在于,
所述确定模块,具体还被配置为根据每一个聚类异构图中每一个边连接的聚类用户账户节点和聚类多媒体资源节点的交互操作的数量,确定所述聚类用户账户节点对应的下M跳节点以及所述聚类多媒体资源节点对应的下N跳节点,M≥1,N≥1;
所述确定模块,具体还被配置为基于所述聚类用户账户节点对应的下M跳节点确定所述聚类用户账户节点的向量,以及基于所述聚类多媒体资源节点对应的下N跳节点确定所述聚类多媒体资源节点的向量。
19.根据权利要求16所述的多媒体资源推荐装置,其特征在于,目标异构图为所述初始异构图或所述聚类异构图;
所述获取模块,具体还被配置为获取每一个时间窗口中与所述目标异构图对应的训练集和测试集;
所述处理模块,具体还被配置为对所述训练集中的用户账户类型节点和多媒体资源类型节点执行加权采样,以得到每一用户账户类型节点对应的下X跳节点,以及每一多媒体资源类型节点对应的下Y跳节点;当所述目标异构图为所述初始异构图时,所述用户账户类型节点为所述用户账户节点,所述多媒体资源类型节点为所述多媒体资源节点;当所述目标异构图为所述聚类异构图时,所述用户账户类型节点为所述聚类用户账户节点,所述多媒体资源类型节点为所述聚类多媒体资源节点,X≥1,Y≥1;
所述处理模块,具体还被配置为将获取到的所述下X跳节点和所述下Y跳节点输入到初始神经网络模型中,得到所述用户账户类型节点和所述多媒体资源类型节点之间存在边的概率;
所述确定模块,具体还被配置为根据所述概率迭代训练所述初始神经网络模型,直到所述概率与所述测试集对应的真实结果之间的误差小于第二阈值,将得到的神经网络模型确定为所述目标异构图对应的图神经网络模型。
20.根据权利要求19所述的多媒体资源推荐装置,其特征在于,
所述处理模块,具体还被配置为将所述下X跳节点输入所述初始神经网络模型,得到所述用户账户类型节点当前的向量;
所述处理模块,具体还被配置为将所述下Y跳节点输入所述初始神经网络模型,得到所述多媒体资源类型节点当前的向量;
所述确定模块,具体还被配置为基于所述用户账户类型节点当前的向量和所述多媒体资源类型节点当前的向量,确定所述用户账户类型节点与所述多媒体资源类型节点之间存在边的概率。
21.根据权利要求16所述的多媒体资源推荐装置,其特征在于,
所述确定模块,具体还被配置为对于每一次聚类后得到的聚类异构图中的每一个类簇而言,确定所述每一个类簇中每一个节点的子向量,并根据确定出的子向量,确定所述每一个节点的子向量的平均值,并将所述平均值确定为所述每一个类簇的向量。
22.根据权利要求12-21中任一项所述的多媒体资源推荐装置,其特征在于,
所述确定模块,具体被配置为确定所述用户账户节点的目标特征与所述多媒体资源节点的目标特征之间的相似度;
所述确定模块,具体还被配置为对得到的相似度进行排序,并按照排序结果确定所述待推荐多媒体资源。
23.一种电子设备,其特征在于,所述电子设备包括:
处理器;
被配置为存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-11中任一项所述的多媒体资源推荐方法。
24.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,当所述计算机可读存储介质中的指令由电子设备执行时,使得所述电子设备能够执行如权利要求1-11中任一项所述的多媒体资源推荐方法。
CN202110896434.4A 2021-08-05 2021-08-05 一种多媒体资源推荐方法、装置、电子设备及存储介质 Active CN113342998B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110896434.4A CN113342998B (zh) 2021-08-05 2021-08-05 一种多媒体资源推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110896434.4A CN113342998B (zh) 2021-08-05 2021-08-05 一种多媒体资源推荐方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113342998A true CN113342998A (zh) 2021-09-03
CN113342998B CN113342998B (zh) 2022-06-10

Family

ID=77480789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110896434.4A Active CN113342998B (zh) 2021-08-05 2021-08-05 一种多媒体资源推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113342998B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200065334A1 (en) * 2018-08-21 2020-02-27 Kylie.ai, Inc. Artificial intelligence communications agent
CN111241311A (zh) * 2020-01-09 2020-06-05 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、电子设备及存储介质
CN111506823A (zh) * 2020-03-11 2020-08-07 平安科技(深圳)有限公司 信息推荐方法、装置及计算机设备
CN111708964A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 多媒体资源的推荐方法、装置、电子设备和存储介质
CN112052387A (zh) * 2020-08-17 2020-12-08 腾讯科技(深圳)有限公司 一种内容推荐方法、装置和计算机可读存储介质
CN112417298A (zh) * 2020-12-07 2021-02-26 中山大学 一种基于少量重叠用户的跨域推荐方法及系统
CN112561644A (zh) * 2020-12-16 2021-03-26 深圳市网联安瑞网络科技有限公司 基于链接预测的商品推荐方法、装置及相关设备
CN113157951A (zh) * 2021-03-26 2021-07-23 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法、装置、服务器及存储介质
CN113190757A (zh) * 2021-05-17 2021-07-30 清华大学 多媒体资源推荐方法、装置、电子设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200065334A1 (en) * 2018-08-21 2020-02-27 Kylie.ai, Inc. Artificial intelligence communications agent
CN111241311A (zh) * 2020-01-09 2020-06-05 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、电子设备及存储介质
CN111506823A (zh) * 2020-03-11 2020-08-07 平安科技(深圳)有限公司 信息推荐方法、装置及计算机设备
CN111708964A (zh) * 2020-05-27 2020-09-25 北京百度网讯科技有限公司 多媒体资源的推荐方法、装置、电子设备和存储介质
CN112052387A (zh) * 2020-08-17 2020-12-08 腾讯科技(深圳)有限公司 一种内容推荐方法、装置和计算机可读存储介质
CN112417298A (zh) * 2020-12-07 2021-02-26 中山大学 一种基于少量重叠用户的跨域推荐方法及系统
CN112561644A (zh) * 2020-12-16 2021-03-26 深圳市网联安瑞网络科技有限公司 基于链接预测的商品推荐方法、装置及相关设备
CN113157951A (zh) * 2021-03-26 2021-07-23 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法、装置、服务器及存储介质
CN113190757A (zh) * 2021-05-17 2021-07-30 清华大学 多媒体资源推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113342998B (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
US9923860B2 (en) Annotating content with contextually relevant comments
US9817893B2 (en) Tracking changes in user-generated textual content on social media computing platforms
CN108108743B (zh) 异常用户识别方法和用于识别异常用户的装置
US20200410392A1 (en) Task-aware command recommendation and proactive help
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
US20180012237A1 (en) Inferring user demographics through categorization of social media data
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
US11501655B2 (en) Automated skill tagging, knowledge graph, and customized assessment and exercise generation
CN112017062B (zh) 基于客群细分的资源额度分配方法、装置及电子设备
US11803374B2 (en) Monolithic computer application refactoring
CN111340220A (zh) 用于训练预测模型的方法和装置
US20230078134A1 (en) Classification of erroneous cell data
CN111191677B (zh) 用户特征数据生成方法、装置及电子设备
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
US11416757B2 (en) Classifier training using noisy samples
WO2023185125A1 (zh) 产品资源的数据处理方法及装置、电子设备、存储介质
CN113342998B (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
JP2023002475A (ja) コンピュータシステム、コンピュータプログラムおよびコンピュータで実装される方法(因果関係知識の識別および抽出)
US20220171985A1 (en) Item recommendation with application to automated artificial intelligence
CN114139059A (zh) 资源推荐模型的训练方法、资源推荐方法及装置
CN114676272A (zh) 多媒体资源的信息处理方法、装置、设备及存储介质
CN111767290A (zh) 用于更新用户画像的方法和装置
CN116911304B (zh) 一种文本推荐方法及装置
US11494054B2 (en) Item recommendation based on computed similarity between automatically generated item and request profiles
US20230376537A1 (en) Multi-chunk relationship extraction and maximization of query answer coherence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant