CN105608105A - 一种基于收听上下文的音乐推荐方法 - Google Patents

一种基于收听上下文的音乐推荐方法 Download PDF

Info

Publication number
CN105608105A
CN105608105A CN201510726112.XA CN201510726112A CN105608105A CN 105608105 A CN105608105 A CN 105608105A CN 201510726112 A CN201510726112 A CN 201510726112A CN 105608105 A CN105608105 A CN 105608105A
Authority
CN
China
Prior art keywords
music
user
listens
listening
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510726112.XA
Other languages
English (en)
Other versions
CN105608105B (zh
Inventor
邓水光
王东京
周劲松
李莹
吴健
尹建伟
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201510726112.XA priority Critical patent/CN105608105B/zh
Publication of CN105608105A publication Critical patent/CN105608105A/zh
Application granted granted Critical
Publication of CN105608105B publication Critical patent/CN105608105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Abstract

本发明提供了一种在音乐推荐中结合用户收听上下文提高音乐推荐效果的方法,主要是利用神经语言模型从用户的音乐收听序列中提取音乐的特征向量,再从用户的完整收听序列和最近收听子序列中提取用户的全局兴趣和收听上下文兴趣,最后在推荐的时候综合考虑用户的全局兴趣和当前收听上下文兴趣,从而能够让推荐的音乐符合用户的实时需求和偏好。

Description

一种基于收听上下文的音乐推荐方法
技术领域
本发明涉及数据挖掘与推荐系统领域,主要涉及一种基于收听上下文的音乐推荐方法。
背景技术
随着互联网应用的发展,推荐系统也越来越受到大家的关注,并且在工业界以及学术界都取得了巨大的成功。传统单一维度的推荐系统已经不能满足用户个性化的需求,而上下文相关的推荐系统不仅能够较好的帮助用户解决信息过载的问题,而且能够更加充分的挖掘用户的随时间、环境等上下文而变化的特定需求。然而在基于上下文推荐系统的设计中,对用户上下文(尤其是情感上下文)的提取、建模以及与推荐系统的结合的策略较少且不够成熟,因此已有推荐系统算法没有结合收听上下文信息。但是在很多场景下,用户的收听上下文往往会主导用户的需求,例如用户的全局偏好包括摇滚乐和纯音乐,但是用户在晚上休息的时候,会更喜欢后者。
发明内容
针对传统音乐推荐系统的缺点,本发明提出了一种在音乐推荐算法中加入用户收听上下文的方法,具体包括如下的内容:
一种基于收听上下文的音乐推荐方法,包括以下步骤:
S1基于神经语言模型的音乐特征的提取;
S2用户收听上下文的提取和建模;
S3基于用户收听上下文的音乐推荐。
进一步的,步骤S1包括:
S10获取用户的完整音乐收听序列,包括音乐ID、播放时间、播放设备;
S11根据播放时间和播放设备,对用户的完整音乐收听序列进行分组,得到子序列;
S12利用神经语言模型处理所有用户的完整音乐收听序列,得到每首音乐的粗粒度的特征向量,利用神经语言模型处理所有用户的子序列,得到每首音乐的细粒度的特征向量,其中,具有相似收听上下文的音乐具有相似的特征向量。
优选的,步骤S12中,根据对效率和准确度的要求指定特征向量的维度,以得到推荐结果更准确的高维度特征向量,或者计算效率更高的低维度特征向量。
进一步的,步骤S2包括:
S20把用户的完整音乐收听序列中的所有音乐的粗粒度特征向量进行平均,得到用户的全局兴趣向量;
S21把用户的最近的音乐收听子序列中的所有音乐的细粒度特征向量进行平均,得到用户的收听上下文兴趣向量。
进一步的,步骤S3包括:
S30根据用户的全局兴趣向量和完整音乐收听序列计算用户之间的相似度,其计算公式为:
s i m ( u , v ) = λ · Σ m ∈ M u ∩ M v 1 | M u | × | M v | + θ · c o s ( p → g u , p → g v )
其中,u表示目标用户,v表示数据库中的另外一个用户;
Mu表示用户u所收听的音乐集合,Mv表示用户v所收听的音乐集合;
表示用户u的全局兴趣向量,表示用户v的全局兴趣向量;
的余弦相似度;λ和θ是权重系数;
S31计算目标用户u对音乐m的兴趣,计算公式如下:
其中,u表示目标用户;
Uu,k表示与u最相似的k个用户的集合,Um表示收听过音乐m的用户集合;
表示用户u的收听上下文兴趣向量,表示音乐m的细粒度特征向量;
的余弦相似度;ω和是权重系数;
S32利用步骤S31中的计算结果对所有音乐进行排序,把前N个推荐给目标用户u。
本发明有益的效果是:首次利用神经语言模型(skip-gram)从用户的完整收听序列和子序列中获取音乐的不同粒度的特征,分别表示为粗粒度特征向量和细粒度特征向量,为音乐特征提取困难的问题提供了一种可靠的解决方法;根据用户的完整收听序列和最近收听子序列中的音乐的特征向量获取用户的全局兴趣和收听上下文兴趣,为用户的收听上下文的提取和建模困难的问题提供了一种可行的思路;提出了一种能够综合考虑用户全局兴趣和收听上下文兴趣的推荐方法,能够使得推荐的音乐更符合目标用户当前的偏好,从而减少用户的搜索成本并提高用户的满意度。
附图说明
图1为本发明的基于收听上下文的音乐推荐方法的推荐系统架构示意图;
图2为本发明的基于收听上下文的音乐推荐方法的用户音乐偏好预测流程示意图。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
在本发明的一个实施例中,基于收听上下文的音乐推荐方法,包括以下步骤:
S1基于神经语言模型的音乐特征的提取;
S2用户收听上下文的提取和建模;
S3基于用户收听上下文的音乐推荐。
具体的,本实施例的推荐方法包括以下步骤:
获取用户的完整的音乐收听序列,收听序列中的每条记录包括音乐ID、播放时间、播放设备。
根据播放时间和播放设备,对用户的完整收听序列进行分组,得到子序列,播放时间靠近且播放设备相同的记录会分到同一个子序列里面,而播放时间间隔过长或者播放设备不同的记录会分到不同的子序列里面。
利用神经语言模型(skip-gram)分别处理所有用户的完整收听序列和子序列,将每首音乐表示为粗粒度特征向量和细粒度特征向量,其中,具有相似收听上下文(在序列中的前面和后面的音乐)的音乐具有相似的特征向量。优选的,此处可根据对效率和准确度的要求指定向量的维度,从而获得合适的特征向量(利用高维度特征向量的推荐结果更准确,而低维度特征向量的计算效率更高)。
把用户的完整的音乐收听序列中的所有音乐的粗粒度特征向量进行平均,得到用户的全局兴趣向量;把用户的最近的音乐收听序列中的所有音乐的细粒度特征向量进行平均,得到用户的收听上下文兴趣向量。
根据用户的全局兴趣和完整收听序列计算用户之间的相似度,其计算公式为:
s i m ( u , v ) = λ · Σ m ∈ M u ∩ M v 1 | M u | × | M v | + θ · c o s ( p → g u , p → g v ) 其中,
●u是目标用户,而v是数据库中的另外一个用户;
●Mu是用户u所收听的音乐集合,而Mv是用户v所收听的音乐条目集合;
是用户u的全局兴趣向量,而是用户v的全局兴趣向量;
的余弦相似度;
●λ和θ是权重系数,一般均取值为1。
计算目标用户u对音乐m的兴趣,计算公式如下:
其中,
●u是目标用户;
●Uu,k是与u最相似的k个用户的集合;
●Um是收听过音乐m的用户集合;
是用户u的收听上下文兴趣向量,而是音乐m的细粒度特征向量;
的余弦相似度;
●ω和是权重系数,一般均取值为1。
利用上步中得到的结果对所有音乐进行排序,把前N个推荐给当前用户。
下面结合附图作进一步详细说明:
图1展示了推荐系统的架构。该推荐系统分为两个主要模块:预处理模块和预测模块。预处理模块中,首先获取用户的所有收听记录(收听序列),并根据每条记录的收听时间和播放设备进行分组,得到子序列,其中收听时间比较接近并且播放设备一样的记录会被分到同一个子序列,而收听时间间隔较大或者播放设备不一致的记录会被分到不同子序列;再利用神经语言模型(skip-gram)从用户的完整收听序列和子序列中分别提取音乐的粗粒度和细粒度特征向量,最后每首音乐都有两个特征向量。在预测模块中,首先从目标用户的完整收听记录(收听序列)和子序列中获取用户的全局兴趣和收听上下文兴趣;然后根据用户的全局兴趣和收听上下文兴趣给用户推荐推荐适合其当前收听上下文的音乐。
图2展示了用户偏好预测的详细步骤。首先获取用户的完整收听记录(收听序列)以及近期收听序列,并分别从中提取用户的全局兴趣和收听上下文兴趣,然后利用用户的全局兴趣和完整收听序列,计算目标用户和其他用户的相似度,用户相似度计算公式为:
s i m ( u , v ) = λ · Σ m ∈ M u ∩ M v 1 | M u | × | M v | + θ · c o s ( p → g u , p → g v ) ,
其中u是目标用户,v是数据库中的另外一个用户,Mu是用户u所收听的音乐集合,Mv是用户v所收听的音乐条目集合,是用户u的全局兴趣向量,是用户v的全局兴趣向量,的余弦相似度,λ和θ是权重系数,一般均取值为1;最后计算目标用户在当前收听上下文的情况下对相似用户的音乐的偏好程度并排序,并把前N首推荐给目标用户:
其中u是目标用户,Uu,k是与u最相似的k个用户的集合,Um是收听过音乐m的用户集合,是用户u的收听上下文兴趣向量,而是音乐m的细粒度特征向量,的余弦相似度,ω和是权重系数,一般均取值为1。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (5)

1.一种基于收听上下文的音乐推荐方法,其特征在于,包括以下步骤:
S1基于神经语言模型的音乐特征的提取;
S2用户收听上下文的提取和建模;
S3基于用户收听上下文的音乐推荐。
2.根据权利要求1所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S1包括:
S10获取用户的完整音乐收听序列,序列中每条收听记录包括音乐ID、播放时间、播放设备;
S11根据播放时间和播放设备,对每个用户的完整音乐收听序列进行分组,得到一系列子序列,其中,在完整音乐收听序列中的播放时间接近并且播放设备相同的收听记录会被分到同一个子序列中;
S12利用神经语言模型处理所有用户的完整音乐收听序列,得到每首音乐的粗粒度的特征向量,利用神经语言模型处理所有用户的子序列,得到每首音乐的细粒度的特征向量,其中,具有相似收听上下文的音乐具有相似的特征向量。
3.根据权利要求2所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S12中,根据对效率和准确度的要求指定特征向量的维度,以得到推荐结果更准确的高维度特征向量,或者计算效率更高的低维度特征向量。
4.根据权利要求2或3所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S2包括:
S20把用户的完整音乐收听序列中的所有音乐的粗粒度特征向量进行平均,得到用户的全局兴趣向量;
S21把用户的最近的音乐收听子序列中的所有音乐的细粒度特征向量进行平均,得到用户的收听上下文兴趣向量。
5.根据权利要求4所述的基于收听上下文的音乐推荐方法,其特征在于,步骤S3包括:
S30根据用户的全局兴趣向量和完整音乐收听序列计算用户之间的相似度,其计算公式为:
s i m ( u , v ) = λ · Σ m ∈ M u ∩ M v 1 | M u | × | M v | + θ · c o s ( p → g u , p → g v )
其中,u表示目标用户,v表示数据库中的另外一个用户;
Mu表示用户u所收听的音乐集合,Mv表示用户v所收听的音乐集合;
表示用户u的全局兴趣向量,表示用户v的全局兴趣向量;
的余弦相似度;λ和θ是权重系数;
S31计算目标用户u对音乐m的兴趣,计算公式如下:
其中,u表示目标用户;
Uu,k表示与u最相似的k个用户的集合,Um表示收听过音乐m的用户集合;
表示用户u的收听上下文兴趣向量,表示音乐m的细粒度特征向量;
的余弦相似度;ω和是权重系数;
S32利用步骤S31中的计算结果对所有音乐进行排序,把前N个推荐给目标用户u。
CN201510726112.XA 2015-10-30 2015-10-30 一种基于收听上下文的音乐推荐方法 Active CN105608105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510726112.XA CN105608105B (zh) 2015-10-30 2015-10-30 一种基于收听上下文的音乐推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510726112.XA CN105608105B (zh) 2015-10-30 2015-10-30 一种基于收听上下文的音乐推荐方法

Publications (2)

Publication Number Publication Date
CN105608105A true CN105608105A (zh) 2016-05-25
CN105608105B CN105608105B (zh) 2018-11-13

Family

ID=55988046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510726112.XA Active CN105608105B (zh) 2015-10-30 2015-10-30 一种基于收听上下文的音乐推荐方法

Country Status (1)

Country Link
CN (1) CN105608105B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106080417A (zh) * 2016-08-10 2016-11-09 重庆长安汽车股份有限公司 基于汽车遥控钥匙定制车载音乐集的方法
CN108304526A (zh) * 2018-01-25 2018-07-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN108491537A (zh) * 2018-03-31 2018-09-04 北京偏北音乐文化有限公司 用户偏好信息处理方法、装置、设备及介质
CN109376265A (zh) * 2018-12-12 2019-02-22 杭州网易云音乐科技有限公司 歌曲推荐列表生成方法、介质、装置和计算设备
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006030712A1 (ja) * 2004-09-17 2006-03-23 Pioneer Corporation 楽曲推薦装置及び方法
CN101984437A (zh) * 2010-11-23 2011-03-09 亿览在线网络技术(北京)有限公司 音乐资源个性化推荐方法及系统
CN102495837A (zh) * 2011-11-01 2012-06-13 中国科学院计算技术研究所 一种数字信息推荐预测模型的训练方法和系统
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
CN103559197A (zh) * 2013-09-23 2014-02-05 浙江大学 基于上下文预过滤的实时音乐推荐方法
CN103970873A (zh) * 2014-05-14 2014-08-06 中国联合网络通信集团有限公司 一种音乐推荐方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006030712A1 (ja) * 2004-09-17 2006-03-23 Pioneer Corporation 楽曲推薦装置及び方法
CN101984437A (zh) * 2010-11-23 2011-03-09 亿览在线网络技术(北京)有限公司 音乐资源个性化推荐方法及系统
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
CN102495837A (zh) * 2011-11-01 2012-06-13 中国科学院计算技术研究所 一种数字信息推荐预测模型的训练方法和系统
CN103559197A (zh) * 2013-09-23 2014-02-05 浙江大学 基于上下文预过滤的实时音乐推荐方法
CN103970873A (zh) * 2014-05-14 2014-08-06 中国联合网络通信集团有限公司 一种音乐推荐方法和系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106080417A (zh) * 2016-08-10 2016-11-09 重庆长安汽车股份有限公司 基于汽车遥控钥匙定制车载音乐集的方法
CN108304526A (zh) * 2018-01-25 2018-07-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN108304526B (zh) * 2018-01-25 2022-02-11 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN108491537A (zh) * 2018-03-31 2018-09-04 北京偏北音乐文化有限公司 用户偏好信息处理方法、装置、设备及介质
CN108491537B (zh) * 2018-03-31 2022-01-28 北京偏北音乐文化有限公司 用户偏好信息处理方法、装置、设备及介质
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN109522474B (zh) * 2018-10-19 2021-05-18 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN109376265A (zh) * 2018-12-12 2019-02-22 杭州网易云音乐科技有限公司 歌曲推荐列表生成方法、介质、装置和计算设备

Also Published As

Publication number Publication date
CN105608105B (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN105608105A (zh) 一种基于收听上下文的音乐推荐方法
CN102654860B (zh) 一种个性化音乐推荐方法及系统
CN103177722B (zh) 一种基于音色相似度的歌曲检索方法
CN104731861B (zh) 多媒体数据推送方法及装置
CN105975472A (zh) 一种推荐方法和装置
CN103970873A (zh) 一种音乐推荐方法和系统
CN107293308B (zh) 一种音频处理方法及装置
CN103268348A (zh) 一种用户查询意图识别方法
CN109308912A (zh) 音乐风格识别方法、装置、计算机设备及存储介质
CN105741835A (zh) 一种音频信息处理方法及终端
CN103970802A (zh) 一种歌曲推荐的方法及装置
CN106649513B (zh) 基于谱聚类的音频数据聚类方法
CN103488782A (zh) 一种利用歌词识别音乐情感的方法
CN106528678A (zh) 一种歌曲处理方法及装置
CN103927177A (zh) 基于LDA模型和PageRank算法建立特征接口有向图的方法
CN104731887B (zh) 一种协同过滤中的用户相似度度量方法
CN102214219B (zh) 音视频内容检索系统及其方法
CN105447026A (zh) 基于多视角图中最小权重连通决定集的Web信息提取方法
CN106528653B (zh) 一种基于图嵌入模型的上下文感知音乐推荐方法
CN101763848B (zh) 一种用于音频内容识别的同步方法
CN105677850B (zh) 一种基于神经网络模型的上下文感知音乐推荐方法
CN112559877A (zh) 基于跨平台异构数据及行为上下文的ctr预估方法及系统
CN106599074A (zh) 协同过滤推荐系统中的用户时间相关相似度的计算方法
CN107133344B (zh) 一种数据处理方法及装置
Sattigeri et al. A scalable feature learning and tag prediction framework for natural environment sounds

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant