CN105426381B

CN105426381B - 一种基于微博情绪上下文的音乐推荐方法

Info

Publication number: CN105426381B
Application number: CN201510534221.1A
Authority: CN
Inventors: 邓水光; 王东京; 周新宇; 李莹; 吴健; 尹建伟; 吴朝晖
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2015-08-27
Filing date: 2015-08-27
Publication date: 2018-10-26
Anticipated expiration: 2035-08-27
Also published as: CN105426381A

Abstract

本发明是一种在音乐推荐中结合用户情感状态来提高音乐推荐效果的方法，包括以下步骤：基于情感词典的情绪上下文的提取和建模；包含情绪上下文的音乐记录的构建；基于用户情绪上下文的音乐推荐。本发明的方法主要是利用用户在微博上发布的微博数据，包括普通微博和音乐分享微博，并以此来获取用户在不同情感状态下的音乐需求和偏好，在推荐的时候考虑用户当前的情感状态以及在该状态下的音乐偏好，从而能够让推荐的音乐更贴近用户在当前情感状态的偏好。

Description

一种基于微博情绪上下文的音乐推荐方法

技术领域

本发明涉及情感挖掘与推荐系统领域，主要是设计一种基于微博情绪上下文的音乐推荐方法。

背景技术

情感挖掘是通过一些方法获取特定用户的情感状态，最为直观的方法是通过一些心跳、脉搏、体温等传感器获取用户的各项生理数据指标，从而判断用户当前所处的情感状态，不过这种方法的实现复杂，不具有普适性。另外一种比较常见的方式是通过文本分析的方法来处理用户产生的数据(包括微博、博客等)来获取用户当前的情感状态，由于用户所发布的这些信息往往都显示或隐式的蕴含着用户的情感状态，而且现在移动互联网的流行更加方便了这种方式获取用户数据的渠道。类似的方法在舆论分析等领域应用较为广泛。

随着互联网应用的发展，推荐系统也越来越受到大家的关注，并且在工业界以及学术界都取得了巨大的成功。传统单一维度的推荐系统已经不能满足用户个性化的需求，而上下文相关的推荐系统不仅能够较好的帮助用户解决信息过载的问题，而且能够更加充分的挖掘用户的随时间、环境等上下文而变化的特定需求。然而在基于上下文推荐系统的设计中，对用户上下文(尤其是情感上下文)的提取、建模以及与推荐系统的结合的策略较少且不够成熟，因此已有推荐系统算法均没有结合情感上下文信息。但是在很多场景下，用户的情感状态往往会主导用户的需求，例如听音乐、看书、看电影等等。

发明内容

针对传统音乐推荐系统的缺点，本发明提出了一种在音乐推荐算法中加入用户情感上下文的方法，具体包括如下的内容：

一种基于微博情绪上下文的音乐推荐方法，包括以下步骤：

10.基于情感词典的情绪上下文的提取和建模；

20.包含情绪上下文的音乐记录的构建；

30.基于用户情绪上下文的音乐推荐。

进一步的，步骤10包括：

101.利用已有情感词典、同义词词典、微博词汇构建一个多粒度情感词典，所述多粒度情感词典包含有三种情绪粒度，分别为2分类，包括积极、消极；7分类，包括乐、好、哀、惊、惧、怒、恶；19分类，包括快乐、安心、喜爱、相信、赞扬、祝愿、悲伤、失望、内疚、思念、惊奇、慌、恐惧、羞、愤怒、贬责、烦闷、怀疑、憎恶；

102.采用分词系统将用户微博数据转化为中文单词序列，并利用词袋模型来表示微博；

103.根据101中所构建的情感词典和微博中的情感词汇的出现频率，将微博表示为情感向量，此处可根据对效率和准确度的要求选择不同粒度的情感词典，从而获得合适的情感向量；具体的，根据细粒度情感词典获得的情绪向量更准确，而利用粗粒度情感词典的效率更高。

104.把用户在时间点t之前一段时间内的所有微博的情感向量相加，并归一化，作为用户在时间t的情绪上下文向量。

进一步的，步骤20包括：

201.从用户的音乐分享微博中获取用户的音乐收听记录，所述音乐收听记录包括时间；

202.利用用户的微博获取音乐收听记录对应的情绪上下文向量，最终得到所有用户的“用户-音乐-情绪上下文向量”的记录。

进一步的，步骤30包括：

301.根据用户的“用户-音乐-情绪上下文向量”的记录计算用户之间的相似度，其计算公式为：

其中，

·u是目标用户，而v数据库中的另外一个用户；

·I_u是用户u所收听的音乐集合，而I_v是用户v所收听的音乐条目集合；

·e_ui是用户u收听音乐i的情绪上下文向量；

·e_vi是用户v收听音乐i的情绪上下文向量；

·cos(e_ui,e_vi)是情绪上下文向量e_ui和e_vi的余弦相似度；

302.目标用户u对音乐i的兴趣计算公式如下：

其中，

·u是目标用户；

·U_u,k是和u最相似的k个用户的集合；

·U_i是收听过音乐i的用户集合；

·e_u是目标用户u的当前情绪上下文向量，e_vi是用户v收听音乐i的情绪上下文向量；

303.利用步骤302中的公式对所有音乐进行排序，把前N个推荐给当前用户。

本发明的基于微博情绪上下文的音乐推荐方法，其有益效果是：

1)通过构建多粒度的情感词典，并根据用户的微博获取用户的情绪上下文向量，为用户的情绪上下文的提取和建模的困难的问题提供了一种可行的思路；

2)利用新浪微博用户数据，提取用户的收听记录以及对应的情绪上下文，解决了上下文与音乐数据结合困难的问题；

3)设计了基于用户情感上下文的音乐推算法，能够使得推荐的音乐更符合目标用户当前的偏好。

附图说明

图1为本发明的基于微博情绪上下文的音乐推荐方法一个实施例的推荐系统架构；

图2为本发明的基于微博情绪上下文的音乐推荐方法一个实施例中用户音乐偏好预测流程。

具体实施方式

为了进一步理解本发明，下面结合实施例对本发明优选实施方案进行描述，但是应当理解，这些描述只是为进一步说明本发明的特征和优点，而不是对本发明权利要求的限制。

本发明提供了一种基于微博情绪上下文的音乐推荐方法，包括以下步骤：基于情感词典的情绪上下文的提取和建模；包含情绪上下文的音乐记录的构建；基于用户情绪上下文的音乐推荐。

具体的，图1展示了本发明的基于微博情绪上下文的音乐推荐方法一个具体实施例的推荐系统的架构。该推荐系统分为两个主要模块：预处理模块和预测模块。预处理模块中，首先获取用户的所有微博，并进行分类，其中包含用户音乐分享信息的为音乐微博，其他的为普通微博，再对用户的普通微博进行分词，并根据多粒度情感词典从中获取用户对应的情感状态，将其表示为情感向量；与此同时，从用户的音乐微博中提取用户历史音乐分享信息；最后再将二者根据时间关系进行关联，得到“用户-音乐-情绪上下文向量”的关联数据，为接下来的推荐算法提供数据基础。在预测模块中，首先从目标用户的最近微博中获取对当前情绪上下文；然后从目标用户普通微博和音乐微博中提取音乐分享信息及对应的情绪向量，并将二者根据时间关系进行关联，得到目标用户的“用户-音乐-情绪上下文向量”的关联数据；最后利用关联数据寻找与目标用户相似的用户，并根据相似用户的关联数据给目标用户推荐适合其当前情绪上下文的音乐。

图2展示了用户偏好预测的详细步骤。首先从目标用户的最近微博中挖掘情绪向量，作为目标用户当前的情绪上下文，并从目标用户的所有微博中提取目标用户的“用户-音乐-情绪上下文向量”的关联数据；然后利用关联数据，计算目标用户和其他用户的相似度，用户相似度计算公式为：

其中，u是目标用户，v数据库中的其他用户，I_u和I_v分别是目标用户u和用户v所收听的音乐条目集合，e_ui和e_vi分别是用户u和v收听音乐i的情绪上下文向量，cos(e_ui,e_vi)是情绪上下文向量e_ui和e_vi的余弦相似度；最后计算目标用户在当前情绪上下文的情况下对相似用户的音乐的偏好程度并排序，并把前N首音乐推荐给用户，目标用户u对音乐i的兴趣计算公式为：

其中，u是目标用户，U_u,k是和u最相似的k个用户的集合，U_i是收听过音乐i的用户集合，e_u是目标用户u的当前情绪上下文向量，e_vi是用户v收听音乐i的情绪上下文向量。

以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

Claims

1.一种基于微博情绪上下文的音乐推荐方法，其特征在于，包括以下步骤：

10.基于情感词典的情绪上下文的提取和建模，具体包括：

103.根据101中所构建的多粒度情感词典和微博中的情感词汇的出现频率，将微博表示为情感向量；根据对效率和准确度的要求选择不同粒度的情感词典，从而获得合适的情感向量；

104.把用户在时间点t之前一段时间内的所有微博的情感向量相加，并归一化，作为用户在时间t的情绪上下文向量；

20.包含情绪上下文的音乐记录的构建，具体包括：

202.利用用户的微博获取音乐收听记录对应的情绪上下文向量，最终得到所有用户的“用户-音乐-情绪上下文向量”的记录；

30.基于用户情绪上下文的音乐推荐，具体包括：

其中，

u是目标用户，而v数据库中的另外一个用户；

I_u是用户u所收听的音乐集合，而I_v是用户v所收听的音乐条目集合；

e_ui是用户u收听音乐i的情绪上下文向量；

e_vi是用户v收听音乐i的情绪上下文向量；

cos(e_ui,e_vi)是情绪上下文向量e_ui和e_vi的余弦相似度；

302.目标用户u对音乐i的兴趣计算公式如下：

其中，

u是目标用户；

U_u,k是和u最相似的k个用户的集合；

U_i是收听过音乐i的用户集合；

e_u是目标用户u的当前情绪上下文向量，e_vi是用户v收听音乐i的情绪上下文向量；