CN117056601A - 一种基于超图的音乐推荐方法与系统 - Google Patents
一种基于超图的音乐推荐方法与系统 Download PDFInfo
- Publication number
- CN117056601A CN117056601A CN202311022162.0A CN202311022162A CN117056601A CN 117056601 A CN117056601 A CN 117056601A CN 202311022162 A CN202311022162 A CN 202311022162A CN 117056601 A CN117056601 A CN 117056601A
- Authority
- CN
- China
- Prior art keywords
- hypergraph
- music
- model
- user
- vertex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000011156 evaluation Methods 0.000 claims abstract description 18
- 238000005295 random walk Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims abstract description 6
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000013499 data model Methods 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000035945 sensitivity Effects 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 230000001550 time effect Effects 0.000 claims description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 230000009191 jumping Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000002759 z-score normalization Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/635—Filtering based on additional data, e.g. user or group profiles
- G06F16/637—Administration of user profiles, e.g. generation, initialization, adaptation or distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于超图的音乐推荐方法与系统,其构建步骤包括:数据采集,获取一定时间内多个用户的历史音乐收听记录进行数据预处理,得到训练集与测试集;超图模型的构建,使用超图数据结构对数据信息进行建模;嵌入生成,从超图数据模型中生成随机游走,并利用跳字模型学习超图顶点的嵌入,最后融合用户听歌当下的情景信息;模型的训练与生成推荐,利用所构建的超图音乐推荐方法,计算超图中每个顶点作为输入结点的上下文顶点的概率,预测用户任意时间感兴趣的音乐;模型评估,利用评价指标评估模型;通过构建基于超图的音乐推荐方法与系统,可以更好地捕捉音乐之间的复杂关联,提高推荐的精度和效率,提供更加个性化和多样化的音乐推荐。
Description
技术领域
本发明涉及技术推荐领域,具体设计一种基于超图的音乐推荐方法与系统。
背景技术
当前在音乐推荐中常用的算法是协同过滤推荐算法,它通过挖掘用户的行为数据,找到用户之间的相似性和关联性,并据此推荐相应的音乐给用户。但随着数据量的增加,协同过滤算法在海量数据环境下面临越来越多的挑战。随着科技的进步,不同平台所生成的数据以指数级的速度不断增长,这种趋势也出现在音乐网站上。尽管每天都有更多的音乐上传到网站,但用户却不会对自己所有听过的音乐进行评分,导致音乐评分数据稀疏,影响音乐推荐系统的推荐效果。
超图是一种数据结构,它扩展了图的概念,允许边连接多于两个节点,从而更好地表示复杂关系。在推荐系统中,超图可以用于建模更复杂的用户和物品之间的关联,从而提供更准确和个性化的推荐。然而,目前尚缺乏将超图、情景感知与音乐推荐相结合的研究,以提高音乐推挤的准确性和合理性。此外,情境感知可以考虑用户当前的环境、活动、心情等因素,从而更好地满足用户的需求。将情境感知与音乐推荐融合,可以使推荐系统更好地理解用户的偏好,进一步个性化推荐。
因此,现有的音乐推荐方法存在数据稀疏性较大,未能捕捉用户的长期兴趣变化,并且在考虑推荐上下文方面存在不足,无法充分满足用户当前的需求。为了解决这些问题,本发明提出了一种基于超图的音乐推荐方法与系统,并且融合了用户当前的情境感知,以提高音乐推荐系统的准确性和用户满意度。
发明内容
本发明提供的一种能够基于超图和融合用户情境感知的音乐推荐方法。通过综合应用超图构建和推理、情境感知的偏好学习,基于音乐数据集中所有用户的历史行为,实现对用户的个性化音乐推荐,提升用体验。
本发明公开了一种基于超图的音乐推荐方法与系统,包含以下步骤:
步骤1:数据采集。将获取的音乐数据,获取一定时间内多个用户的历史音乐收听记录进行数据预处理,得到训练样本集与测试样本集。
步骤2:超图模型构建。基于步骤1获取的训练集,使用超图数据结构对数据信息进行建模。
步骤3:嵌入生成。从超图数据模型中生成随机游走,并利用跳字模型学习超图顶点的嵌入,最后融合用户听歌当下的情景信息。
步骤4:模型的训练与生成推荐。基于给定的音乐数据库,利用所构建的超图音乐推荐方法,计算超图中每个顶点作为输入结点的上下文顶点的概率,预测用户任意时间感兴趣的音乐。
步骤5:模型评估。通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性。
进一步的,所述步骤1中数据采集的具体方法包括:
获取一定时间内多个用户的历史音乐收听记录H={H1,…,Hu,…,HU},是用户u∈U的音乐收听记录,ti是mi∈M的时间戳,U和M分别表示用户集合和音乐集合,并且将对应音乐相关系的专辑和歌手集合记为A和S,将对应音乐相关的标签属性记为T。
进一步的,所述步骤2中超图模型构建的具体方法包括:
超图的定义:,其中:V是一组顶点集,E是一组超图的带有索引的超边集。
V由以下不同的实体构成:
M:歌曲集;U:用户集;S:歌手;A:专辑;T:标签
顶点的集合定义为V=M∪U∪S∪A∪T,其中M为歌曲集,U为用户集,S为歌手集,A为专辑集,T为类别集,
根据不同实体之间的不同关系,可以定义以下的超边E:
EUM:歌手音乐视角,即一位用户和其听过的所有歌曲之间的关系
EAM:专辑音乐视角,即一张专辑和其拥有所有的歌曲之间的关系
ESA:歌手专辑视角,即一位歌手和其发布过的专辑之间的关系
ETM:标签音乐视角,即一种歌曲类别和其所属的歌曲之间的关系
超边ei∈E是由有序对定义的,其中/>为其“头部”,/>为其“尾部”;/>是/>顶点的集合,/>是/>顶点的集合,/>是构成整个超边的顶点的子集。
进一步的,所述步骤3嵌入生成的具体方法包括:
步骤3.1、首先使用随机游走生成器,为每个顶点创建一个游走,然后随机选择以顶点v∈V为尾部的超边e∈E,评估从该顶点v跳跃到另一条超边的概率p,具体公式为:
其中,α,β≥0为超参数。
步骤3.2、使用跳字模型从生成的游走中学习顶点嵌入。在本发明中,将超边的顶点被视为单词、随机游走视为句子。将超图所有的结点组成跳字模型的词汇表,然后将每一个结点表示为一个大小为|V|的one-hot编码,第i个位置对应与第i个结点,则设置第i个值为1,否则为0。
步骤3.2、融合情景信息,首先融合时间情景,提出时间效应函数,公式如下:
其中,ti表示用户当前时间听歌与其最后听歌时间的相差天数。
然后融合天气情景,对于情景信息的选择了天气,引入了天气敏感函数,公式如下:
其中,w∈[1,6],表示六种不同的天气环境,ksw表示音乐s对天气w的敏感程度,若敏感ksw为1,不敏感则为0。
将两种融合要素相结合,得到最终的用户-音乐偏好权重Ws,公式如下:
Ws=λ*Time+(1-λ)×Weather(s,w)
其中,λ为权重因子。
进一步的,所述步骤4模型的训练与生成推荐的具体方法包括:
步骤4.1、寻找结点匹配,即在随机行走中出现彼此接近的节点对,意味着它们之间存在上下文关系。使用softmax函数计算超图中每个顶点vj作为输入结点vi∈Vp的上下文顶点的概率,其中j∈{1,2,...,|V|}
其中,uj为输入顶点的one-hot编码向量与嵌入矩阵Wi、上下文矩阵W′o和用户-音乐偏好权重的乘积
步骤4.2、生成推荐,首先对嵌入进行z-score归一化,然后为每个用户计算其嵌入与每一个我们想要推荐项目的嵌入之间的余弦相似度:
最后,可以通过得分最高的top-K个项目,为用户选择K个推荐的歌曲。然后采用可视化的方法显示所预测用户任意时间感兴趣的音乐。
进一步的,所述步骤5模型评估的具体方法包括:
步骤5.1、设定平均绝对误差(MAE)、平均相对误差(MAPE)、均方根误差(RMSE)、Thei1不等系数U,四个评价指标。评价指标的具数学公式如下:
平均绝对误差:
平均相对误差:
均方根误差RMSE:
Thei1不等系数:
步骤5.2、基于构建的基于超图的音乐推荐模型,结合步骤1中得到的测试集,通过第一步所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
从以上技术方案可以看出,本发明具有以下优点:
传统推荐系统通常只考虑用户和物品之间的关系,而超图能够同时考虑多个实体之间的关系,从而更好地捕捉推荐中的多样性,通过超图能够更全面地了解用户的兴趣和偏好,从而提供更多样化的推荐结果。在传统图中,通常只有一个类型的边表示节点之间的连接。而在超图中,边可以是多类型的,允许更丰富的关系建模。这对于推荐系统来说特别重要,因为用户与物品之间的关系可能是多维度的,超图能够更好地捕捉这种复杂性,提高推荐准确度。并且超图允许节点之间的高阶关系,不仅可以考虑直接相连的节点,还可以考虑更远距离的节点之间的关系。这样推荐系统可以更好地利用上下文信息。同时超图可以更好地应对数据中的噪声和缺失,因为它可以通过多个实体之间的关系来填充缺失的信息,从而提高推荐系统的鲁棒性。
超图结构不仅包含与传统矩阵分解方法相关的附加信息,而且捕获与图方法相关的更高关系信息,能够无缝地表示用户与歌曲之间具有相关特征的所有可能和复杂的交互。除此之外,通过嵌入技术来训练超图学习,提供了一种通过向量映射推断用户与歌曲相似度的有效方法,并且不需要任何时态数据,而不需要利用其他方法解决冷启动问题。总体来说,引入超图可以增强音乐推荐系统的功能,提供更加个性化、多样化、上下文感知的音乐推荐体验,同时解决传统推荐系统在音乐领域所面临的一些问题。
在推荐过程中,为了更准确地反映用户的偏好和兴趣,考虑了用户对不同类型音乐的喜好、时间偏好情景、天气影响情景等。考虑了用户最近一段时间的喜好相比于考虑其过去一段时间的喜好要更有价值。并且用户当前的音乐偏好还受到天气环境因素的影响,在不同的天气环境下,人们会对不同类型的音乐产生不同的兴趣通过对时间情景的分析。这些都可以帮助我们准确的实现符合用户个人音乐喜好的推荐,从而提高用户的满意程度。
附图说明:
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是一种基于超图的音乐推荐方法与系统构建步骤示意图;
图2是一种基于超图的音乐推荐方法与系统超图的示意图;
图3是一种基于超图的音乐推荐方法与系统构建详细模型图;
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1、图2和图3,本发明实施例一提供的一种基于超图的音乐推荐方法,具体的构建包含以下步骤:
步骤1:数据采集,获取一定时间内多个用户的历史音乐收听记录H={H1,…,Hu,…,HU},是用户u∈U的音乐收听记录,ti是mi∈M的时间戳,U和M分别表示用户集合和音乐集合,并且将对应音乐相关系的专辑和歌手集合记为A和S,将对应音乐相关的标签属性记为T。
步骤2:超图模型构建,为了连接数据集中的所有信息,通过超图数据结构对信息进行建模,该结构结合了各种实体(例如,用户、歌曲和歌手)之间的关系。可以通过图形数据结构来定义用户和歌曲之间的关系。然而,我们可以利用超图的泛化能力,将用户和歌曲之间的关系明确为更高程度的超边:超图H可定义为:顶点集V和超边集E。
V由以下不同的实体构成:
M:歌曲集;U:用户集;S:歌手;A:专辑;T:标签
根据不同实体之间的不同关系,可以定义以下的超边E:
EUM:歌手音乐视角,即一位用户和其听过的所有歌曲之间的关系
EAM:专辑音乐视角,即一张专辑和其拥有所有的歌曲之间的关系
ESA:歌手专辑视角,即一位歌手和其发布过的专辑之间的关系
ETM:标签音乐视角,即一种歌曲类别和其所属的歌曲之间的关系超图的定义:,其中:V是一组顶点集,E是一组超图的带有索引的超边集。
顶点的集合定义为V=M∪U∪S∪A∪T,其中M为歌曲集,U为用户集,S为歌手集,A为专辑集,T为类别集,
超边ei∈E是由有序对定义的,其中/>为其“头部”,/>为其“尾部”;/>是/>顶点的集合,/>是/>顶点的集合,/>是构成整个超边的顶点的子集。
1.定义用户音乐视角EUM:
假设ui∈U为在超图H中的一位用户,用以下公式定义每条超边ei的EUM关系:
1)
2)
2.定义专辑音乐视角EAM
假设ri∈R为在超图H中的一张专辑,用以下公式定义每条超边ei的EAM关系:
1)
2)
3.定义歌手专辑视角ESA
假设si∈S为在超图H中的一位歌手,用以下公式定义每条超边ei的ESM关系:
1)
2)
4.定义标签音乐视角ETM
假设ti∈T为在超图H中的一种歌曲类型,用以下公式定义每条超边ei的ETM关系:
1)
2)
步骤3:嵌入生成,超图数据模型之后,对其进行处理来执行超图的节点嵌入,以捕获编码在其结构中的重要和有意义的信息。
对嵌入进行生成时,包括以下步骤:
第一步,首先使用随机游走生成器,为每个顶点创建一个游走,然后随机选择以顶点v∈V为尾部的超边e∈E,评估从该顶点v跳跃到另一条超边的概率p,它与当前超边的度成反比degree(e),也就意味着如果当前的超边顶点较少,就更容易跳跃到别的超边。
其中,α,β≥0为超参数。
这使得算法可以更深入地探索具有更多顶点的超边,同时避免在较小的超边内部陷入循环。然后根据概率p,当前超边要么保持不变,要么切换到当前顶点所在的另一条超边。最后从当前超边中随机选择要添加到游走中的顶点。
第二步:使用跳字模型从生成的游走中学习顶点嵌入。这是一种无监督学习模型,它为文本中的单词创建基于上下文的嵌入。在本发明中,将超边的顶点被视为单词、随机游走视为句子。
跳字模型是只有一个隐藏层的简单神经网络,其工作过程是:输入一个目标词,该网络旨在预测其上下文词,这些词是在它附近更频繁出现的词(即超图中最近的顶点)。
将超图所有的结点组成跳字模型的词汇表,然后将每一个结点表示为一个大小为|V|的one-hot编码,第i个位置对应与第i个结点,则设置第i个值为1,否则为0。
第三步:融合情景信息,首先融合时间情景,提出时间效应函数,可以更准确地反映用户当前的音乐偏好,并且能够及时地应对用户音乐偏好的变化。将指数函数对艾宾浩斯遗忘曲线进行拟合,拟合后的结果作为时间效应函数,用来计算用户在不同时间点对不同歌曲的喜爱程度,公式如下:
其中,ti表示用户当前时间听歌与其最后听歌时间的相差天数。
然后融合天气情景,对于情景信息的选择了天气,将天气划分为晴、阴、多云、雨、雪、雾六种情况,并引入了天气敏感函数,该函数可以根据当前天气状况,计算出音乐与天气的相关性,为个性化推荐系统提供更加准确的信息,构建的天气敏感函数如下:
其中,w∈[1,6],表示六种不同的天气环境,ksw表示音乐s对天气w的敏感程度,若敏感ksw为1,不敏感则为0。
将两种融合要素相结合,得到最终的用户-音乐偏好权重Ws,公式如下:
Ws=λ*Time+(1-λ)×Weather(s,w)
其中,λ为权重因子。
步骤4,模型的训练与生成推荐,包括以下步骤:
第一步:寻找结点匹配,即在随机行走中出现彼此接近的节点对,意味着它们之间存在上下文关系。
首先定义一个“上下文窗口”,在随机游走中定一个目标结点,在该游走中的结点,如果在这个窗口内,则与该目标结点形成也给单词配对,将被视为目标结点的上下文单词。
使用softmax函数计算超图中每个顶点vj作为输入结点vi∈Vp的上下文顶点的概率,其中j∈{1,2,...,|V|}
其中,uj为输入顶点的one-hot编码向量与嵌入矩阵Wi、上下文矩阵Wo′和用户-音乐偏好权重的乘积
第二步,生成推荐,基于给定的音乐数据库,利用所构建的超图音乐推荐方法,预测用户任意时间感兴趣的音乐,为用户定制个性化的私人歌曲列表。
对模型生产推荐时,包括以下步骤:
首先对嵌入进行z-score归一化,以便将每个嵌入特征归一化到相同的范围和尺度,然后为每个用户计算其嵌入与每一个我们想要推荐项目的嵌入之间的余弦相似度:
余弦相似度的得分在[-1,1]之间,值越接近1,两个向量越相似,意味着歌曲和用户更匹配。最后,可以通过得分最高的top-K个项目,为用户选择K个推荐的歌曲。然后采用可视化的方法显示所预测用户任意时间感兴趣的音乐。具体来说,通过例如柱状图、曲线图等形式,使用户更加方便、准确地获取预测结果,提升用户体验,帮助用户更好地做出相关决策。
步骤5,模型评估,通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性。
对模型进行评估时,包括以下步骤:
第一步,设定平均绝对误差(MAE)、平均相对误差(MAPE)、均方根误差(RMSE)、Thei1不等系数U,四个评价指标。评价指标的具数学公式如下:
平均绝对误差:
平均相对误差:
均方根误差RMSE:
Thei1不等系数:
第二步,基于步骤3构建的基于超图的音乐推荐模型,结合步骤2中得到的测试集,通过第一步所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
本发明实施例二还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明实施例一中的基于超图的音乐推荐方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例一中的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中实施例一的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-R0M、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中实施例一的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中实施例一的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (5)
1.一种基于超图的音乐推荐方法与系统,其特征在于包括以下步骤:
步骤1:数据采集;将获取的音乐数据,获取一定时间内多个用户的历史音乐收听记录进行数据预处理,得到训练样本集与测试样本集;
步骤2:超图模型构建;基于步骤1获取的训练集,使用超图数据结构对数据信息进行建模;
步骤3:嵌入生成;从超图数据模型中生成随机游走,并利用跳字模型学习超图顶点的嵌入,最后融合用户听歌当下的情景信息;
步骤4:模型的训练与生成推荐;基于给定的音乐数据库,利用所构建的超图音乐推荐方法,计算超图中每个顶点作为输入结点的上下文顶点的概率,预测用户任意时间感兴趣的音乐;
步骤5:模型评估;通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性。
2.根据权利要求1所述的一种基于超图的音乐推荐方法与系统,其特征在于步骤1中,所述数据采集具体步骤为:
获取一定时间内多个用户的历史音乐收听记录H={H1,···,Hu,···,HU},是用户u∈U的音乐收听记录,ti是mi∈M的时间戳,U和M分别表示用户集合和音乐集合,并且将对应音乐相关系的专辑和歌手集合记为A和S,将对应音乐相关的标签属性记为T。
3.根据权利要求1所述的一种基于超图的音乐推荐方法与系统,其特征在于步骤2中,所述超图模型构建具体步骤为:
超图的定义:H=(V,E{ei:i∈I}),其中:V是一组顶点集,E是一组超图的带有索引的超边集;
V由以下不同的实体构成:
M:歌曲集;U:用户集;S:歌手;A:专辑;T:标签
顶点的集合定义为V=M∪U∪S∪A∪T,其中M为歌曲集,U为用户集,S为歌手集,A为专辑集,T为类别集,
根据不同实体之间的不同关系,可以定义以下的超边E:
EUM:歌手音乐视角,即一位用户和其听过的所有歌曲之间的关系
EAM:专辑音乐视角,即一张专辑和其拥有所有的歌曲之间的关系
ESA:歌手专辑视角,即一位歌手和其发布过的专辑之间的关系
ETM:标签音乐视角,即一种歌曲类别和其所属的歌曲之间的关系
超边ei∈E是由有序对定义的,其中/>为其“头部”,/>为其“尾部”;/>是/>顶点的集合,/>是/>顶点的集合,/>是构成整个超边的顶点的子集。
4.根据权利要求1所述的一种基于超图的音乐推荐方法与系统,其特征在于步骤2中,所述嵌入生成构建具体步骤为:
步骤3.1、首先使用随机游走生成器,为每个顶点创建一个游走,然后随机选择以顶点v∈V为尾部的超边e∈E,评估从该顶点v跳跃到另一条超边的概率p,具体公式为:
其中,α,β≥0为超参数;
步骤3.2、使用跳字模型从生成的游走中学习顶点嵌入;在本发明中,将超边的顶点被视为单词、随机游走视为句子;将超图所有的结点组成跳字模型的词汇表,然后将每一个结点表示为一个大小为|V|的one-hot编码,第i个位置对应与第i个结点,则设置第i个值为1,否则为0;
步骤3.2、融合情景信息,首先融合时间情景,提出时间效应函数,公式如下:
其中,ti表示用户当前时间听歌与其最后听歌时间的相差天数;
然后融合天气情景,对于情景信息的选择了天气,引入了天气敏感函数,公式如下:
其中,w∈[1,6],表示六种不同的天气环境,ksw表示音乐s对天气w的敏感程度,若敏感ksw为1,不敏感则为0;
将两种融合要素相结合,得到最终的用户-音乐偏好权重Ws,公式如下:
Ws=λ*Time+(1-λ)×Weather(s,w)
其中,λ为权重因子;
进一步的,所述步骤4模型的训练与生成推荐的具体方法包括:
步骤4.1、寻找结点匹配,即在随机行走中出现彼此接近的节点对,意味着它们之间存在上下文关系;使用softmax函数计算超图中每个顶点vj作为输入结点vi∈Vp的上下文顶点的概率,其中j∈{1,2,...,|V|}
其中,uj为输入顶点的one-hot编码向量与嵌入矩阵Wi、上下文矩阵W′o和用户-音乐偏好权重的乘积
步骤4.2、生成推荐,首先对嵌入进行z-score归一化,然后为每个用户计算其嵌入与每一个我们想要推荐项目的嵌入之间的余弦相似度:
最后,可以通过得分最高的top-K个项目,为用户选择K个推荐的歌曲;然后采用可视化的方法显示所预测用户任意时间感兴趣的音乐。
5.根据权利要求1所述的一种基于超图的音乐推荐方法与系统,其特征在于步骤4中,所述模型评估具体步骤为:
通过相应评价指标评价模型的预测精度,检验所拟合模型的充分性;具体来说,对模型进行评估时,设定平均绝对误差(MAE)、平均相对误差(MAPE)、均方根误差(RMSE)、Thei1不等系数,四个评价指标:根据构建的基于超图的音乐推荐模型,结合测试样本集,通过所述的四个评价指标进行模型评估,检验所拟合模型的充分性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311022162.0A CN117056601A (zh) | 2023-08-15 | 2023-08-15 | 一种基于超图的音乐推荐方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311022162.0A CN117056601A (zh) | 2023-08-15 | 2023-08-15 | 一种基于超图的音乐推荐方法与系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117056601A true CN117056601A (zh) | 2023-11-14 |
Family
ID=88652859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311022162.0A Pending CN117056601A (zh) | 2023-08-15 | 2023-08-15 | 一种基于超图的音乐推荐方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117056601A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118113943A (zh) * | 2024-04-10 | 2024-05-31 | 天翼爱音乐文化科技有限公司 | 融合情境感知的协同过滤推荐方法、系统、设备及介质 |
-
2023
- 2023-08-15 CN CN202311022162.0A patent/CN117056601A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118113943A (zh) * | 2024-04-10 | 2024-05-31 | 天翼爱音乐文化科技有限公司 | 融合情境感知的协同过滤推荐方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Celma et al. | A new approach to evaluating novel recommendations | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN111061962B (zh) | 一种基于用户评分分析的推荐方法 | |
May Petry et al. | MARC: a robust method for multiple-aspect trajectory classification via space, time, and semantic embeddings | |
CN111324752B (zh) | 基于图神经网络结构建模的图像与文本检索方法 | |
WO2023108980A1 (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN110516160A (zh) | 基于知识图谱的用户建模方法、序列推荐方法 | |
Lin et al. | Heterogeneous knowledge-based attentive neural networks for short-term music recommendations | |
Cheng et al. | Collaborative filtering recommendation on users’ interest sequences | |
Roy et al. | iMusic: a session-sensitive clustered classical music recommender system using contextual representation learning | |
Wang et al. | Scholar2vec: vector representation of scholars for lifetime collaborator prediction | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
CN117056601A (zh) | 一种基于超图的音乐推荐方法与系统 | |
CN118152444B (zh) | 一种融合社交关系和时间语义的个性化推荐方法 | |
Tan et al. | Attentional autoencoder for course recommendation in mooc with course relevance | |
Noorian et al. | A novel Sequence-Aware personalized recommendation system based on multidimensional information | |
CN115408618A (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
CN115456707A (zh) | 提供商品推荐信息的方法、装置及电子设备 | |
CN114118310A (zh) | 基于综合相似度的聚类方法和装置 | |
CN113220994B (zh) | 基于目标物品增强表示的用户个性化信息推荐方法 | |
CN112632275B (zh) | 基于个人文本信息的人群聚类数据处理方法、装置及设备 | |
Utama et al. | Scientific Articles Recommendation System Based On User’s Relatedness Using Item-Based Collaborative Filtering Method | |
CN117251626A (zh) | 一种课程推荐方法、系统及电子设备 | |
CN114827728B (zh) | 节目数据推荐方法及系统 | |
CN116975359A (zh) | 资源处理方法、资源推荐方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |