CN114969547B - 一种基于多视角增强图注意神经网络的音乐推荐方法 - Google Patents

一种基于多视角增强图注意神经网络的音乐推荐方法 Download PDF

Info

Publication number
CN114969547B
CN114969547B CN202210721249.6A CN202210721249A CN114969547B CN 114969547 B CN114969547 B CN 114969547B CN 202210721249 A CN202210721249 A CN 202210721249A CN 114969547 B CN114969547 B CN 114969547B
Authority
CN
China
Prior art keywords
music
user
view
representation
hmg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210721249.6A
Other languages
English (en)
Other versions
CN114969547A (zh
Inventor
张新
王东京
向正哲
殷昱煜
邓水光
俞东进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202210721249.6A priority Critical patent/CN114969547B/zh
Publication of CN114969547A publication Critical patent/CN114969547A/zh
Application granted granted Critical
Publication of CN114969547B publication Critical patent/CN114969547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多视角增强图注意神经网络的音乐推荐方法,包括如下步骤:S1、数据采集,获取一定时间内多个用户得音乐收听记录;S2、数据建模,构建异构音乐图HMG,对各种数据和信息进行整合;S3、表征学习,S4、用户短期兴趣建模,从用户的最近的音乐收听行为中推断她/他的短期兴趣偏好;S5、音乐推荐,基于用户的长期、短期和动态三种兴趣偏好进行推荐。该方法从用户的音乐收听记录以及音乐和用户的向量表征中学习用户的动态、长期和短期偏好,并利用上述偏好信息进而从海量的音乐数据中推荐满足用户实时要求的音乐。

Description

一种基于多视角增强图注意神经网络的音乐推荐方法
技术领域
本发明涉及数字经济的个性化服务技术领域,具体指一种基于多视角增强图注意神经网络的音乐推荐方法。
背景技术
近年来,由于信息技术的创新,数字服务市场发展迅速。根据国际唱片业联合会(IFPI)在2021年发布的报告,全球音乐市场增长18.5%,其中流媒体音乐市场增长24.3%。同时,用户可以方便地访问海量的数字音乐内容。具体来说,亚马逊音乐和苹果音乐都为用户提供了超过9000万首歌曲(2022年5月的统计数据)。
因此,人们越来越难以从海量的音乐内容中找到自己喜欢的音乐,这就是所谓的信息过载问题。为了解决该问题,推荐系统通过不同的策略(例如基于协同过滤的推荐、基于内容的推荐、上下文感知推荐、顺序推荐等)帮助用户从可用的海量数据中找到他们需要的服务或内容。
然而,传统的音乐推荐系统的推荐精度有限,尤其是在具有海量音乐数据的应用场景下的效果不佳。混合推荐方法通过将传统的协同过滤或基于内容的方法与用户档案、项目属性等辅助内容数据相结合,进而提高推荐系统的准确性。然而,现有的混合推荐方法可能无法以灵活和自适应的方式充分利用这些不同类型的数据。
此外,近年来用户的听音乐行为模式也在逐渐发生变化。例如,根据腾讯音乐娱乐(TME)在2020年第一季度发布的报告,COVID-19全球大流行带来了数字时代的新兴机遇,移动MAU(月活跃用户)和付费用户增长迅速,腾讯音乐的收入保持强劲。智能手机的普及以及移动互联网技术的快速发展,使得人们几乎可以随时随地享受音乐,这给用户的偏好建模和音乐推荐带来了更多的挑战。如何充分利用用户的音乐播放记录和音乐的内容特征等异构数据是进一步提高音乐推荐性能的关键因素。
发明内容
本发明针对上述问题,提出了一种基于多视角增强图注意神经网络(MEGAN)的音乐推荐方法,可以基于图神经网络和注意力机制,从异构数据中学习用户偏好和音乐特征表示,并实现音乐推荐。
为了解决上述技术问题,本发明的技术方案为:
一种基于多视角增强图注意神经网络的音乐推荐方法,包括如下步骤:
S1、数据采集
获取一定时间内多个用户得音乐收听记录H={H1,…,Hu,…,HU},
Figure GDA0004124047680000021
是用户u∈U得音乐收听记录,ti是mi∈M的时间戳,U和M表示用户集合和音乐集合;
S2、数据建模
构建异构音乐图HMG,对各种数据和信息进行整合,包括用户收听记录和音乐的内容,HMG定义为G=(V,E,W),V=(U,S,M,F)表示HMG中不同类型节点的集合,其中U、S、M和F分别是用户集合、会话集合、音乐集合和内容特征集合,E是HMG中不同类型边的集合,W是E的权重集;
S3、表征学习
S31、预训练:利用预训练技术得到用HMG中的节点的初始特征向量,节点vi∈V的初始特征向量定义为
Figure GDA0004124047680000022
其中V′∈R|V|×d是预训练的嵌入矩阵,
Figure GDA0004124047680000023
是vi的独热向量表示;
S32、用户兴趣建模:首先从HMG中以用户的档案视角、行为视角和会话视角学习用户的兴趣表示,然后将三个视角的兴趣表示进行融合,得到用户的综合兴趣表征vu
S33、音乐特征建模:首先从HMG中以音乐的属性视角、交互视角、转移视角和上下文视角学习音乐的特征表示,然后将四个视角的特征表示进行融合,得到音乐的综合特征表示vm
S4、用户短期兴趣建模
从用户的最近的音乐收听行为中推断她/他的短期兴趣偏好;
S5、音乐推荐
基于用户的长期、短期和动态三种兴趣偏好进行推荐。
作为优选,所述步骤S1中还包括数据处理,每个用户的音乐收听记录根据时间戳划分为不同的会话,其中间隔时间超过一定阈值的音乐播放记录会被划分到两个会话中,将用户u的播放记录可以被划分为n个会话,
Figure GDA0004124047680000031
此外,音乐和用户的内容特征词的集合表示为F。
作为优选,所述集合V包括用户节点u∈U、会话节点s∈S、音乐节点m∈M和内容特征词f∈F,所述集合E包括用户-音乐(u-m)边、用户-特征(u-f)边、用户会话(u-s)边、音乐特征(m-f)边、音乐-音乐(m-m)边和音乐-会话(m-s)边。
作为优选,所述步骤S32中,
从HMG中以用户的档案视角上的兴趣表征方法如下:
将用户u档案内容中的l′个特征词{f1,f2,…,fl′,}转换为相应的词嵌入矩阵
Figure GDA0004124047680000033
其中
Figure GDA0004124047680000034
是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,f∈Rd×(l′-l″+1),l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每个用户u的在档案视角上的兴趣表示
Figure GDA0004124047680000032
从HMG中以用户的行为视角上的兴趣表征方法如下:
将用户u在HMG上的音乐邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k个音乐邻居{m0,m1,…,mk-1},行为视角的用户兴趣表示定义为:
Figure GDA0004124047680000041
其中
Figure GDA00041240476800000420
是音乐mi的初始特征向量,上标b表示行为视角,
Figure GDA0004124047680000042
是用户u对第i个音乐邻居节点mi在行为视角的注意力权重,其定义如下:
Figure GDA0004124047680000043
其中
Figure GDA0004124047680000044
是用户u和音乐mi在HMG上的边的权重,
Figure GDA0004124047680000045
是u和mi之间的行为得分,表示用户偏好与音乐特征之间的相关性,正式定义为:
Figure GDA0004124047680000046
其中σ是带泄漏的ReLU激活函数,而
Figure GDA0004124047680000047
是可学习的向量参数,d″是隐藏层大小,||是向量之间的拼接,
Figure GDA0004124047680000048
此外,
Figure GDA0004124047680000049
Figure GDA00041240476800000410
是用户u和音乐mi在行为视角中的隐藏表示,定义为
Figure GDA00041240476800000411
Figure GDA00041240476800000412
其中
Figure GDA00041240476800000413
Figure GDA00041240476800000414
是可学习的参数,tanh()是双曲正切激活函数。
从HMG中以用户的会话视角上的兴趣表征方法如下:
将用户u在HMG上的会话邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k′个会话邻居{s0,s1,…,sk′-1},会话视角的用户兴趣表示定义为:
Figure GDA00041240476800000415
其中,其中上标s表示会话视图,
Figure GDA00041240476800000419
是u的会话si的嵌入,
Figure GDA00041240476800000416
是会话si和用户u之间的注意力权重,正式定义为:
Figure GDA00041240476800000417
Figure GDA00041240476800000418
Figure GDA0004124047680000051
Figure GDA0004124047680000052
其中
Figure GDA0004124047680000053
是u和她/他的会话邻居si之间的边的权重,
Figure GDA0004124047680000054
是u和si之间的会话得分,表示用户全局偏好和会话偏好之间的相关性,
Figure GDA0004124047680000055
Figure GDA0004124047680000056
是可学习的参数,
Figure GDA0004124047680000057
Figure GDA0004124047680000058
是用户u和会话si的隐藏表示。
作为优选,所述步骤S32中,用户的综合兴趣表征vu方法如下:
用户的综合兴趣表征建模为三个视角中学到的用户兴趣,定义为:
Figure GDA0004124047680000059
其中
Figure GDA00041240476800000510
Figure GDA00041240476800000511
分别是u在档案视角、行为视角和会话视角的兴趣表示,
Figure GDA00041240476800000512
Figure GDA00041240476800000513
是三个视角的权重,通过注意力机制计算的,视角x(p、b或者s)的权重定义为:
Figure GDA00041240476800000514
Figure GDA00041240476800000515
其中,qu∈Rd″
Figure GDA00041240476800000516
Figure GDA00041240476800000517
是可学习参数,d″是隐藏层的大小,
Figure GDA00041240476800000518
是用户u在视角x下的兴趣表示。
作为优选,所述步骤S33中,
从HMG中以音乐的属性视角学习音乐的特征表示:
将音乐m内容特征中的l′个特征词{f1,f2,…,fl′}转换为相应的词嵌入矩阵
Figure GDA00041240476800000519
其中
Figure GDA00041240476800000520
是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,f∈Rd×(l′-l″+1),l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每首音乐m的在属性视角上的兴趣表示
Figure GDA00041240476800000521
其中上标a表示属性视角;
从HMG中以音乐的交互视角学习音乐的特征表示:
将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n个用户邻居{u0,u1,…,un-1},交互视角的音乐特征表示定义为:
Figure GDA0004124047680000061
其中
Figure GDA0004124047680000062
是用户uj的初始兴趣向量,上标i表示交互视角,
Figure GDA0004124047680000063
是音乐m对第j个用户邻居节点uj在交互视角的注意力权重,其定义如下:
Figure GDA0004124047680000064
Figure GDA0004124047680000065
Figure GDA0004124047680000066
Figure GDA0004124047680000067
其中
Figure GDA0004124047680000068
是音乐m和第j个用户邻居节点uj在HMG上的边的权重,
Figure GDA0004124047680000069
是m和uj之间的交互得分,表示音乐特征与用户偏好之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接,
Figure GDA00041240476800000610
此外,
Figure GDA00041240476800000611
Figure GDA00041240476800000612
是m和uj在交互视角中的隐藏表示,
Figure GDA00041240476800000613
Figure GDA00041240476800000614
是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的转移视角学习音乐的特征表示:
将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n′个音乐邻居{m0,m1,…,mn′-1},转移视角的音乐特征表示定义为:
Figure GDA00041240476800000615
其中
Figure GDA00041240476800000616
是音乐mj的初始特征向量,上标t表示转移视角,
Figure GDA00041240476800000617
是音乐m对第j个音乐邻居节点mj在转移视角的注意力权重,其定义如下:
Figure GDA00041240476800000618
Figure GDA00041240476800000619
Figure GDA00041240476800000620
Figure GDA00041240476800000621
其中
Figure GDA0004124047680000071
是音乐m和第j个音乐邻居节点mj在HMG上的边的权重,
Figure GDA0004124047680000072
是m和mj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数。d″是隐藏层大小,||是向量之间的拼接,
Figure GDA0004124047680000073
此外,
Figure GDA0004124047680000074
Figure GDA0004124047680000075
是m和mj在转移视角中的隐藏表示,
Figure GDA0004124047680000076
Figure GDA0004124047680000077
是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的上下文视角学习音乐的特征表示:
将音乐m在HMG上的会话邻居进行聚合得到音乐特征表示,即对于音乐m和它的n″个会话邻居{s0,s1,…,sn″-1},上下文视角的音乐特征表示定义为:
Figure GDA0004124047680000078
其中
Figure GDA0004124047680000079
是会话sj的初始特征向量,上标c表示上下文视角,
Figure GDA00041240476800000710
是音乐m对第j个会话邻居节点sj在上下文视角的注意力权重,其定义如下:
Figure GDA00041240476800000711
Figure GDA00041240476800000712
Figure GDA00041240476800000713
Figure GDA00041240476800000714
其中
Figure GDA00041240476800000715
是音乐m和第j个会话邻居节点sj在HMG上的边的权重,
Figure GDA00041240476800000716
是m和sj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数。d″是隐藏层大小,||是向量之间的拼接,
Figure GDA00041240476800000717
此外,
Figure GDA00041240476800000718
Figure GDA00041240476800000719
是m和sj在上下文视角中的隐藏表示,
Figure GDA00041240476800000720
Figure GDA00041240476800000721
是可学习的参数,tanh()是双曲正切激活函数。
作为优选,所述步骤S33中,将属性视角、交互视角、转移视角和上下文视角四个视角的特征表示进行融合,得到音乐的综合特征表示vm方法如下:
定义:
Figure GDA00041240476800000722
其中
Figure GDA0004124047680000081
Figure GDA00041240476800000822
分别是m在属性视角、交互视角、转移视角和上下文视角的特征表示,
Figure GDA0004124047680000082
Figure GDA0004124047680000083
是四个视角的权重,通过注意力机制计算的,视角y(a、i、t或者c)的权重定义为:
Figure GDA0004124047680000084
Figure GDA0004124047680000085
其中,y是a、i、t和c中任意一种,qm∈Rd″
Figure GDA0004124047680000086
Figure GDA0004124047680000087
是可学习参数,d″是隐藏层的大小,
Figure GDA0004124047680000088
是音乐m在视角x下的特征向量。
作为优选,所述步骤S4中,给定用户u和她/他的历史收听序列{m0,…,mo-i,…,mo-1},u的短期偏好表示用基于注意力的加权和策略定义为:
Figure GDA0004124047680000089
其中
Figure GDA00041240476800000810
是音乐mj的综合特征表示,o是历史序列的长度,h是近期序列的长度,
Figure GDA00041240476800000811
是历史记录mj在短期偏好推断过程中的权重,
Figure GDA00041240476800000812
用软注意机制定义为:
Figure GDA00041240476800000813
其中
Figure GDA00041240476800000814
是mj对于u的短期偏好推断的得分,
Figure GDA00041240476800000815
它定义为:
Figure GDA00041240476800000816
其中vu∈Rd是用户u的综合兴趣表征,
Figure GDA00041240476800000817
是最后一首音乐记录mo-1的综合特征表示。
Figure GDA00041240476800000818
Figure GDA00041240476800000819
和cε∈Rd是可学习的参数。
作为优选,所述步骤S5中,用户u对候选音乐m的兴趣分数定义为:
Figure GDA00041240476800000820
其中vm是音乐m的综合特征表示,ρlt,ρst和ρd分别是长期、短期和动态兴趣偏好的权重,定义为
Figure GDA00041240476800000821
其中Wρ∈R3×3d和cρ∈R3是可学习的参数,从而可以根据上述公式中的兴趣对候选音乐进行排序,并将得分高的音乐推荐给目标用户。
本发明具有以下的特点和有益效果:
采用上述技术方案,首先使用异构音乐图HMG以统一的方式对各种数据进行建模,包括用户的音乐收听行为以及用户和音乐的文本内容数据。然后,结合图神经网络和注意力机制,利用HMG中的各种信息学习用户和音乐的低维实数向量表征,该学习过程通过用户的三个视图(档案/行为/会话)和音乐的四个视图(上下文/交互/转移/属性)进行增强。最后,MEGAN从用户的音乐收听记录以及音乐和用户的向量表征中学习用户的动态、长期和短期偏好,并利用上述偏好信息进而从海量的音乐数据中推荐满足用户实时要求的音乐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本实施例的方法流程图。
图2为本实施例中异构音乐图(HMG)建模方法示意图。
图3为本实施例中基于多视角增强图注意神经网络方法架构图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
本发明提供了一种基于多视角增强图注意神经网络的音乐推荐方法,如图1所示,包括如下步骤:
S1、数据采集
获取一定时间内多个用户得音乐收听记录
Figure GDA0004124047680000101
Figure GDA0004124047680000102
是用户u∈U得音乐收听记录,ti是mi∈M的时间戳,U和M表示用户集合和音乐集合;
进一步的,每个用户的音乐收听记录根据时间戳划分为不同的会话,其中间隔时间超过一定阈值的音乐播放记录会被划分到两个会话中,将用户u的播放记录可以被划分为n个会话,
Figure GDA0004124047680000103
此外,音乐和用户的内容特征词的集合表示为F。
具体的,如图2所示,本实施例中用户u1和u2的对m1-m5五首音乐的收听序列,两个用户的收听序列根据时间戳划分为4个会话{s1,1,s1,2,s2,1,s2,2},五首音乐的内容信息如图2左下角的表格所示。
S2、数据建模
构建异构音乐图HMG,如图2所示,对各种数据和信息进行整合,包括用户收听记录和音乐的内容,HMG定义为G=(V,E,W),V=(U,S,M,F)表示HMG中不同类型节点的集合,其中U、S、M和F分别是用户集合、会话集合、音乐集合和内容特征集合,所述集合V包括用户节点u∈U、会话节点s∈S、音乐节点m∈M和内容特征词f∈F,E是HMG中不同类型边的集合,所述集合E包括用户-音乐(u-m)边、用户-特征(u-f)边、用户会话(u-s)边、音乐特征(m-f)边、音乐-音乐(m-m)边和音乐-会话(m-s)边,W是E的权重集。
S3、表征学习,用图神经网络和注意力机制从HMG中的用户音乐收听行为数据以及音乐的内容特征中学习节点(用户、音乐等)的特征表示。
具体的,包括如下子步骤:
S31、预训练:利用预训练技术得到用HMG中的节点的初始特征向量,节点vi∈V的初始特征向量定义为
Figure GDA0004124047680000111
其中V′∈R|V|×d是预训练的嵌入矩阵,d是向量的维度,
Figure GDA0004124047680000112
是vi的独热向量表示。
S32、用户兴趣建模:首先从HMG中以用户的档案视角、行为视角和会话视角学习用户的兴趣表示,然后将三个视角的兴趣表示进行融合,得到用户的综合兴趣表征vu
进一步的,
从HMG中以用户的档案视角上的兴趣表征方法如下:
将用户u档案内容中的l′个特征词{f1,f2,…,fl′}转换为相应的词嵌入矩阵
Figure GDA0004124047680000113
其中
Figure GDA0004124047680000114
是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,f∈Rd×(l′-l″+1),l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每个用户u的在档案视角上的兴趣表示
Figure GDA0004124047680000121
从HMG中以用户的行为视角上的兴趣表征方法如下:
将用户u在HMG上的音乐邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k个音乐邻居{m0,m1,…,mk-1},行为视角的用户兴趣表示定义为:
Figure GDA0004124047680000122
其中
Figure GDA0004124047680000123
是音乐mi的初始特征向量,上标b表示行为视角,
Figure GDA0004124047680000124
是用户u对第i个音乐邻居节点mi在行为视角的注意力权重,其定义如下:
Figure GDA0004124047680000125
其中
Figure GDA0004124047680000126
是用户u和音乐mi在HMG上的边的权重,
Figure GDA0004124047680000127
是u和mi之间的行为得分,表示用户偏好与音乐特征之间的相关性,正式定义为:
Figure GDA0004124047680000128
其中σ是带泄漏的ReLU激活函数,而
Figure GDA0004124047680000129
是可学习的向量参数,d″是隐藏层大小,||是向量之间的拼接,
Figure GDA00041240476800001210
此外,
Figure GDA00041240476800001211
Figure GDA00041240476800001212
是用户u和音乐mi在行为视角中的隐藏表示,定义为
Figure GDA00041240476800001213
Figure GDA00041240476800001214
其中
Figure GDA00041240476800001215
Figure GDA00041240476800001216
是可学习的参数,tanh()是双曲正切激活函数。
从HMG中以用户的会话视角上的兴趣表征方法如下:
将用户u在HMG上的会话邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k′个会话邻居{s0,s1,…,sk′-1},会话视角的用户兴趣表示定义为:
Figure GDA00041240476800001217
其中,其中上标s表示会话视图,
Figure GDA00041240476800001218
是u的会话si的嵌入,
Figure GDA00041240476800001219
是会话si和用户u之间的注意力权重,正式定义为:
Figure GDA0004124047680000131
Figure GDA0004124047680000132
Figure GDA0004124047680000133
Figure GDA00041240476800001319
其中
Figure GDA0004124047680000134
是u和她/他的会话邻居si之间的边的权重,
Figure GDA0004124047680000135
是u和si之间的会话得分,表示用户全局偏好和会话偏好之间的相关性,
Figure GDA0004124047680000136
Figure GDA0004124047680000137
是可学习的参数,
Figure GDA0004124047680000138
Figure GDA0004124047680000139
是用户u和会话si的隐藏表示。
最后综合上述三个视角,用户的综合兴趣表征vu方法如下:
用户的综合兴趣表征建模为三个视角中学到的用户兴趣,定义为:
Figure GDA00041240476800001310
其中
Figure GDA00041240476800001311
Figure GDA00041240476800001312
分别是u在档案视角、行为视角和会话视角的兴趣表示,
Figure GDA00041240476800001313
Figure GDA00041240476800001314
是三个视角的权重,通过注意力机制计算的,视角x(p、b或者s)的权重定义为:
Figure GDA00041240476800001315
Figure GDA00041240476800001316
其中,qu∈Rd″
Figure GDA00041240476800001317
是可学习参数,d″是隐藏层的大小,
Figure GDA00041240476800001318
是用户u在视角x下的兴趣表示。
S33、音乐特征建模:首先从HMG中以音乐的属性视角、交互视角、转移视角和上下文视角学习音乐的特征表示,然后将四个视角的特征表示进行融合,得到音乐的综合特征表示vm
进一步的,
从HMG中以音乐的属性视角学习音乐的特征表示:
将音乐m内容特征中的l′个特征词{f1,f2,…,fl′}转换为相应的词嵌入矩阵
Figure GDA0004124047680000141
其中
Figure GDA00041240476800001418
是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,f∈Rd×(l′-l″+1),l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在Vu,f上使用双曲正切激活函数和均值池化策略,得到每首音乐m的在属性视角上的兴趣表示
Figure GDA0004124047680000142
其中上标a表示属性视角;
从HMG中以音乐的交互视角学习音乐的特征表示:
将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n个用户邻居{u0,u1,…,un-1},交互视角的音乐特征表示定义为:
Figure GDA0004124047680000143
其中
Figure GDA0004124047680000144
是用户uj的初始兴趣向量,上标i表示交互视角,
Figure GDA0004124047680000145
是音乐m对第j个用户邻居节点uj在交互视角的注意力权重,其定义如下:
Figure GDA0004124047680000146
Figure GDA0004124047680000147
Figure GDA0004124047680000148
Figure GDA0004124047680000149
其中
Figure GDA00041240476800001410
是音乐m和第j个用户邻居节点uj在HMG上的边的权重,
Figure GDA00041240476800001411
是m和uj之间的交互得分,表示音乐特征与用户偏好之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接,
Figure GDA00041240476800001412
此外,
Figure GDA00041240476800001413
Figure GDA00041240476800001414
是m和uj在交互视角中的隐藏表示,
Figure GDA00041240476800001415
Figure GDA00041240476800001416
是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的转移视角学习音乐的特征表示:
将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n′个音乐邻居{m0,m1,…,mn′-1},转移视角的音乐特征表示定义为:
Figure GDA00041240476800001417
其中
Figure GDA0004124047680000151
是音乐mj的初始特征向量,上标t表示转移视角,
Figure GDA0004124047680000152
是音乐m对第j个音乐邻居节点mj在转移视角的注意力权重,其定义如下:
Figure GDA0004124047680000153
Figure GDA0004124047680000154
Figure GDA0004124047680000155
Figure GDA0004124047680000156
其中
Figure GDA0004124047680000157
是音乐m和第j个音乐邻居节点mj在HMG上的边的权重,
Figure GDA0004124047680000158
是m和mj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数。d″是隐藏层大小,||是向量之间的拼接,
Figure GDA0004124047680000159
此外,
Figure GDA00041240476800001510
Figure GDA00041240476800001511
是m和mj在转移视角中的隐藏表示,
Figure GDA00041240476800001512
Figure GDA00041240476800001513
是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的上下文视角学习音乐的特征表示:
将音乐m在HMG上的会话邻居进行聚合得到音乐特征表示,即对于音乐m和它的n″个会话邻居{s0,s1,…,sn″-1},上下文视角的音乐特征表示定义为:
Figure GDA00041240476800001514
其中
Figure GDA00041240476800001515
是会话sj的初始特征向量,上标c表示上下文视角,
Figure GDA00041240476800001516
是音乐m对第j个会话邻居节点sj在上下文视角的注意力权重,其定义如下:
Figure GDA00041240476800001517
Figure GDA00041240476800001518
Figure GDA00041240476800001519
Figure GDA00041240476800001520
其中
Figure GDA00041240476800001521
是音乐m和第j个会话邻居节点sj在HMG上的边的权重,
Figure GDA00041240476800001522
是m和sj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数。d″是隐藏层大小,||是向量之间的拼接,
Figure GDA0004124047680000161
此外,
Figure GDA0004124047680000162
Figure GDA0004124047680000163
是m和sj在上下文视角中的隐藏表示,
Figure GDA0004124047680000164
Figure GDA0004124047680000165
是可学习的参数,tanh()是双曲正切激活函数。
进一步的,将属性视角、交互视角、转移视角和上下文视角四个视角的特征表示进行融合,得到音乐的综合特征表示vm方法如下:
定义:
Figure GDA0004124047680000166
其中
Figure GDA0004124047680000167
Figure GDA0004124047680000168
分别是m在属性视角、交互视角、转移视角和上下文视角的特征表示,
Figure GDA0004124047680000169
Figure GDA00041240476800001610
是四个视角的权重,通过注意力机制计算的,视角y(a、i、t或者c)的权重定义为:
Figure GDA00041240476800001611
Figure GDA00041240476800001612
其中,y是a、i、t和c中任意一种,qm∈Rd″
Figure GDA00041240476800001613
Figure GDA00041240476800001614
是可学习参数,d″是隐藏层的大小,
Figure GDA00041240476800001615
是音乐m在视角x下的特征向量。
S4、用户短期兴趣建模
具体的,如图3所示,可以理解的,用户的短期兴趣偏好是从她/他最近的收听行为中推断出来的给定,因此,用户u和她/他的历史收听序列{m0,…,mo-i,…,mo-1},u的短期偏好表示用基于注意力的加权和策略定义为:
Figure GDA00041240476800001616
其中
Figure GDA00041240476800001617
是音乐mj的综合特征表示,o是历史序列的长度,h是近期序列的长度,
Figure GDA00041240476800001618
是是历史记录mj在短期偏好推断过程中的权重,
Figure GDA00041240476800001619
用软注意机制定义为:
Figure GDA00041240476800001620
其中
Figure GDA00041240476800001621
是mj对于u的短期偏好推断的得分,
Figure GDA00041240476800001622
它定义为:
Figure GDA0004124047680000171
其中vu∈Rd是用户u的综合兴趣表征,
Figure GDA0004124047680000172
是最后一首音乐记录mo-1的综合特征表示。
Figure GDA0004124047680000173
和cε∈Rd是可学习的参数。
S5、音乐推荐
具体的,如图3所示,实施音乐推荐,本实施例基于用户的三种兴趣偏好进行推荐,即长期、短期和动态兴趣。用户u的长期偏好用综合兴趣表征vu表示,她/他的短期兴趣偏好为
Figure GDA0004124047680000174
此外,我们使用u的最后收听记录(音乐mo)的综合特征表示,即
Figure GDA0004124047680000175
来表示她/他的动态偏好。然后,我们可以根据用户u的偏好和候选音乐m∈M的特征计算u对m的兴趣分数,然后将分数高的音乐推荐给u。u对m的兴趣分数定义为:
Figure GDA0004124047680000176
其中vm是音乐m的综合特征表示,ρlt,ρst和ρd分别是长期、短期和动态兴趣偏好的权重,定义为
Figure GDA0004124047680000177
其中Wρ∈R3×3d和cρ∈R3是可学习的参数,从而可以根据上述公式中的兴趣对候选音乐进行排序,并将得分高的音乐推荐给目标用户。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式包括部件进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。

Claims (7)

1.一种基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,包括如下步骤:
S1、数据采集
获取一定时间内多个用户得音乐收听记录H={H1,…,Hu,…,HU},
Figure FDA0004092036010000011
是用户u∈U得音乐收听记录,ti是mi∈M的时间戳,U和M表示用户集合和音乐集合;
S2、数据建模
构建异构音乐图HMG,对各种数据和信息进行整合,包括用户收听记录和音乐的内容,HMG定义为G=(V,E,W),V=(U,S,M,F)表示HMG中不同类型节点的集合,其中U、S、M和F分别是用户集合、会话集合、音乐集合和内容特征集合,E是HMG中不同类型边的集合,W是E的权重集,
所述集合V包括用户节点u∈U、会话节点s∈S、音乐节点m∈M和内容特征词f∈F,所述集合E包括用户-音乐(u-m)边、用户-特征(u-f)边、用户会话(u-s)边、音乐特征(m-f)边、音乐-音乐(m-m)边和音乐-会话(m-s)边;
S3、表征学习
S31、预训练:利用预训练技术得到用HMG中的节点的初始特征向量,节点vi∈V的初始特征向量定义为
Figure FDA0004092036010000012
其中V′∈R|V|×d是预训练的嵌入矩阵,
Figure FDA0004092036010000013
是vi的独热向量表示;
S32、用户兴趣建模:首先从HMG中以用户的档案视角、行为视角和会话视角学习用户的兴趣表示,然后将三个视角的兴趣表示进行融合,得到用户的综合兴趣表征vu
所述步骤S32中,
从HMG中以用户的档案视角上的兴趣表征方法如下:
将用户u档案内容中的l′个特征词{f1,f2,…,fl′}转换为相应的词嵌入矩阵
Figure FDA0004092036010000021
其中
Figure FDA0004092036010000022
是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,f∈Rd×(l′-l″+1),l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每个用户u的在档案视角上的兴趣表示
Figure FDA0004092036010000023
从HMG中以用户的行为视角上的兴趣表征方法如下:
将用户u在HMG上的音乐邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k个音乐邻居{m0,m1,…,mk-1},行为视角的用户兴趣表示定义为:
Figure FDA0004092036010000024
其中
Figure FDA0004092036010000025
是音乐mi的初始特征向量,上标b表示行为视角,
Figure FDA0004092036010000026
是用户u对第i个音乐邻居节点mi在行为视角的注意力权重,其定义如下:
Figure FDA0004092036010000027
其中
Figure FDA0004092036010000028
是用户u和音乐mi在HMG上的边的权重,
Figure FDA0004092036010000029
是u和mi之间的行为得分,表示用户偏好与音乐特征之间的相关性,正式定义为:
Figure FDA00040920360100000210
其中σ是带泄漏的ReLU激活函数,而
Figure FDA00040920360100000211
是可学习的向量参数,d″是隐藏层大小,||是向量之间的拼接,
Figure FDA00040920360100000212
此外,
Figure FDA00040920360100000213
Figure FDA00040920360100000214
是用户u和音乐mi在行为视角中的隐藏表示,定义为
Figure FDA00040920360100000215
Figure FDA00040920360100000216
其中
Figure FDA00040920360100000217
Figure FDA00040920360100000218
是可学习的参数,tanh()是双曲正切激活函数,
从HMG中以用户的会话视角上的兴趣表征方法如下:
将用户u在HMG上的会话邻居进行聚合得到用户兴趣表示,即对于用户节点vu和她/他的k′个会话邻居{s0,s1,…,sk′-1},会话视角的用户兴趣表示定义为:
Figure FDA0004092036010000031
其中,其中上标s表示会话视图,
Figure FDA0004092036010000032
是u的会话si的嵌入,
Figure FDA0004092036010000033
是会话si和用户u之间的注意力权重,正式定义为:
Figure FDA0004092036010000034
Figure FDA0004092036010000035
Figure FDA0004092036010000036
Figure FDA0004092036010000037
其中
Figure FDA0004092036010000038
是u和她/他的会话邻居si之间的边的权重,
Figure FDA0004092036010000039
是u和si之间的会话得分,表示用户全局偏好和会话偏好之间的相关性,
Figure FDA00040920360100000310
Figure FDA00040920360100000311
是可学习的参数,
Figure FDA00040920360100000312
Figure FDA00040920360100000313
是用户u和会话si的隐藏表示;
S33、音乐特征建模:首先从HMG中以音乐的属性视角、交互视角、转移视角和上下文视角学习音乐的特征表示,然后将四个视角的特征表示进行融合,得到音乐的综合特征表示vm
S4、用户短期兴趣建模
从用户的最近的音乐收听行为中推断她/他的短期兴趣偏好;
S5、音乐推荐
基于用户的长期、短期和动态三种兴趣偏好进行推荐。
2.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S1中还包括数据处理,每个用户的音乐收听记录根据时间戳划分为不同的会话,其中间隔时间超过一定阈值的音乐播放记录会被划分到两个会话中,将用户u的播放记录被划分为n个会话,
Figure FDA00040920360100000314
此外,音乐和用户的内容特征词的集合表示为F。
3.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S32中,用户的综合兴趣表征vu方法如下:
用户的综合兴趣表征建模为三个视角中学到的用户兴趣,定义为:
Figure FDA0004092036010000041
其中
Figure FDA0004092036010000042
Figure FDA0004092036010000043
分别是u在档案视角、行为视角和会话视角的兴趣表示,
Figure FDA0004092036010000044
Figure FDA0004092036010000045
是三个视角的权重,通过注意力机制计算的,视角x(p、b或者s)的权重定义为:
Figure FDA0004092036010000046
Figure FDA0004092036010000047
其中,qu∈Rd″
Figure FDA0004092036010000048
Figure FDA0004092036010000049
是可学习参数,d″是隐藏层的大小,
Figure FDA00040920360100000410
是用户u在视角x下的兴趣表示。
4.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S33中,
从HMG中以音乐的属性视角学习音乐的特征表示:
将音乐m内容特征中的l′个特征词{f1,f2,…,fl′}转换为相应的词嵌入矩阵
Figure FDA00040920360100000411
其中
Figure FDA00040920360100000412
是fi的词向量,然后利用卷积操作将V′u,f转换为V″u,f∈Rd×(l′-l″+1),l″是卷积核的大小,卷积层中的输入通道数和输出通道数分别为d和d′,最后,在V″u,f上使用双曲正切激活函数和均值池化策略,得到每首音乐m的在属性视角上的兴趣表示
Figure FDA00040920360100000413
其中上标a表示属性视角;
从HMG中以音乐的交互视角学习音乐的特征表示:
将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n个用户邻居{u0,u1,…,un-1},交互视角的音乐特征表示定义为:
Figure FDA00040920360100000414
其中
Figure FDA00040920360100000415
是用户uj的初始兴趣向量,上标i表示交互视角,
Figure FDA00040920360100000416
是音乐m对第j个用户邻居节点uj在交互视角的注意力权重,其定义如下:
Figure FDA00040920360100000417
Figure FDA0004092036010000051
Figure FDA0004092036010000052
Figure FDA0004092036010000053
其中
Figure FDA0004092036010000054
是音乐m和第j个用户邻居节点uj在HMG上的边的权重,
Figure FDA0004092036010000055
是m和uj之间的交互得分,表示音乐特征与用户偏好之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接,
Figure FDA0004092036010000056
此外,
Figure FDA0004092036010000057
Figure FDA0004092036010000058
是m和uj在交互视角中的隐藏表示,
Figure FDA0004092036010000059
Figure FDA00040920360100000510
是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的转移视角学习音乐的特征表示:
将音乐m在HMG上的用户邻居进行聚合得到音乐特征表示,即对于音乐m和它的n′个音乐邻居{m0,m1,…,mn′-1},转移视角的音乐特征表示定义为:
Figure FDA00040920360100000511
其中
Figure FDA00040920360100000512
是音乐mj的初始特征向量,上标t表示转移视角,
Figure FDA00040920360100000513
是音乐m对第j个音乐邻居节点mj在转移视角的注意力权重,其定义如下:
Figure FDA00040920360100000514
Figure FDA00040920360100000515
Figure FDA00040920360100000516
Figure FDA00040920360100000517
其中
Figure FDA00040920360100000518
是音乐m和第j个音乐邻居节点mj在HMG上的边的权重,
Figure FDA00040920360100000519
是m和mj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接,
Figure FDA00040920360100000520
此外,
Figure FDA00040920360100000521
Figure FDA00040920360100000522
是m和mj在转移视角中的隐藏表示,
Figure FDA00040920360100000523
Figure FDA00040920360100000524
是可学习的参数,tanh()是双曲正切激活函数;
从HMG中以音乐的上下文视角学习音乐的特征表示:
将音乐m在HMG上的会话邻居进行聚合得到音乐特征表示,即对于音乐m和它的n″个会话邻居{s0,s1,…,sn″-1},上下文视角的音乐特征表示定义为:
Figure FDA0004092036010000061
其中
Figure FDA0004092036010000062
是会话sj的初始特征向量,上标c表示上下文视角,
Figure FDA0004092036010000063
是音乐m对第j个会话邻居节点sj在上下文视角的注意力权重,其定义如下:
Figure FDA0004092036010000064
Figure FDA0004092036010000065
Figure FDA0004092036010000066
Figure FDA0004092036010000067
其中
Figure FDA0004092036010000068
是音乐m和第j个会话邻居节点sj在HMG上的边的权重,
Figure FDA0004092036010000069
是m和sj之间的交互得分,表示音乐特征之间的相关性,σ是带泄漏的ReLU激活函数,d″是隐藏层大小,||是向量之间的拼接,
Figure FDA00040920360100000610
此外,
Figure FDA00040920360100000611
Figure FDA00040920360100000612
是m和sj在上下文视角中的隐藏表示,
Figure FDA00040920360100000613
Figure FDA00040920360100000614
是可学习的参数,tanh()是双曲正切激活函数。
5.根据权利要求4所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S33中,将属性视角、交互视角、转移视角和上下文视角四个视角的特征表示进行融合,得到音乐的综合特征表示vm方法如下:
定义:
Figure FDA00040920360100000615
其中
Figure FDA00040920360100000616
Figure FDA00040920360100000617
分别是m在属性视角、交互视角、转移视角和上下文视角的特征表示,
Figure FDA00040920360100000618
Figure FDA00040920360100000619
是四个视角的权重,通过注意力机制计算的,视角y(a、i、t或者c)的权重定义为:
Figure FDA00040920360100000620
Figure FDA00040920360100000621
其中,y是a、i、t和c中任意一种,qm∈Rd″
Figure FDA0004092036010000071
Figure FDA0004092036010000072
是可学习参数,d″是隐藏层的大小,
Figure FDA0004092036010000073
是音乐m在视角x下的特征向量。
6.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S4中,给定用户u和她/他的历史收听序列{m0,…,mo-i,…,mo-1},u的短期偏好表示用基于注意力的加权和策略定义为:
Figure FDA0004092036010000074
其中
Figure FDA0004092036010000075
是音乐mj的综合特征表示,o是历史序列的长度,h是近期序列的长度,
Figure FDA0004092036010000076
是历史记录mj在短期偏好推断过程中的权重,
Figure FDA0004092036010000077
用软注意机制定义为:
Figure FDA0004092036010000078
其中
Figure FDA0004092036010000079
是mj对于u的短期偏好推断的得分,
Figure FDA00040920360100000710
定义为:
Figure FDA00040920360100000711
其中vu∈Rd是用户u的综合兴趣表征,
Figure FDA00040920360100000712
是最后一首音乐记录mo-1的综合特征表示,
Figure FDA00040920360100000713
和cε∈R d是可学习的参数。
7.根据权利要求1所述的基于多视角增强图注意神经网络的音乐推荐方法,其特征在于,所述步骤S5中,用户u对候选音乐m的兴趣分数定义为:
Figure FDA00040920360100000714
其中vm是音乐m的综合特征表示,ρlt,ρst和ρd分别是长期、短期和动态兴趣偏好的权重,定义为
Figure FDA00040920360100000715
其中Wρ∈R3×3d和cρ∈R3是可学习的参数,从而根据上述公式中的兴趣对候选音乐进行排序,并将得分高的音乐推荐给目标用户。
CN202210721249.6A 2022-06-24 2022-06-24 一种基于多视角增强图注意神经网络的音乐推荐方法 Active CN114969547B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210721249.6A CN114969547B (zh) 2022-06-24 2022-06-24 一种基于多视角增强图注意神经网络的音乐推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210721249.6A CN114969547B (zh) 2022-06-24 2022-06-24 一种基于多视角增强图注意神经网络的音乐推荐方法

Publications (2)

Publication Number Publication Date
CN114969547A CN114969547A (zh) 2022-08-30
CN114969547B true CN114969547B (zh) 2023-04-18

Family

ID=82965988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210721249.6A Active CN114969547B (zh) 2022-06-24 2022-06-24 一种基于多视角增强图注意神经网络的音乐推荐方法

Country Status (1)

Country Link
CN (1) CN114969547B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595157B (zh) * 2023-07-17 2023-09-19 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11381651B2 (en) * 2019-05-29 2022-07-05 Adobe Inc. Interpretable user modeling from unstructured user data
CN110659382B (zh) * 2019-09-04 2021-10-15 杭州电子科技大学 基于异构信息网络表示学习技术的混合音乐推荐方法
CN111581520B (zh) * 2020-05-25 2022-04-19 中国人民解放军国防科技大学 基于会话中物品重要性的物品推荐方法和系统
US11769018B2 (en) * 2020-11-24 2023-09-26 Openstream Inc. System and method for temporal attention behavioral analysis of multi-modal conversations in a question and answer system
CN112989617A (zh) * 2021-03-22 2021-06-18 杭州电子科技大学 一种基于注意力感知时间点过程的音乐推荐方法
CN113378047B (zh) * 2021-06-10 2022-10-21 武汉大学 一种基于多方面增强的图神经网络推荐方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法

Also Published As

Publication number Publication date
CN114969547A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
Gao et al. Advances and challenges in conversational recommender systems: A survey
US20220343119A1 (en) Contextual-based method and system for identifying and revealing selected objects from video
US11783352B2 (en) Audio-based identification interfaces for selecting objects from video
KR102405115B1 (ko) 머신 학습을 이용한 라이브-스트림 콘텐츠의 추천
TWI475412B (zh) 數位內容次序調整方法和數位內容匯流器
CN111160954B (zh) 基于图卷积网络模型的面向群组对象的推荐方法
CN111258995B (zh) 数据处理方法、装置、存储介质及设备
CN112765480B (zh) 一种信息推送方法、装置及计算机可读存储介质
CN111339404A (zh) 基于人工智能的内容热度预测方法、装置和计算机设备
CN110162701A (zh) 内容推送方法、装置、计算机设备和存储介质
CN112287170B (zh) 一种基于多模态联合学习的短视频分类方法及装置
CN112328849A (zh) 用户画像的构建方法、基于用户画像的对话方法及装置
CN102165441A (zh) 用于分级媒体共享频道的方法、系统以及设备
CN112765373A (zh) 资源推荐方法、装置、电子设备和存储介质
CN114969547B (zh) 一种基于多视角增强图注意神经网络的音乐推荐方法
CN114020999A (zh) 一种电影社交网络的社区结构检测方法及系统
CN114357201A (zh) 基于信息感知的视听推荐方法、系统
CN105357583B (zh) 一种发现智能电视用户兴趣偏好的方法和装置
CN113590965B (zh) 一种融合知识图谱与情感分析的视频推荐方法
CN116051192A (zh) 处理数据的方法和装置
CN112651487B (zh) 基于图坍缩卷积神经网络的数据推荐方法、系统及介质
CN116186309B (zh) 基于融合用户意图的交互兴趣图的图卷积网络推荐方法
WO2021036344A1 (zh) 摘要生成方法和装置
CN117556149B (zh) 资源推送方法、装置、电子设备和存储介质
Li Modeling Consumer Preference for Unexpected and Cross-Domain Recommendations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant