CN105426381B - 一种基于微博情绪上下文的音乐推荐方法 - Google Patents
一种基于微博情绪上下文的音乐推荐方法 Download PDFInfo
- Publication number
- CN105426381B CN105426381B CN201510534221.1A CN201510534221A CN105426381B CN 105426381 B CN105426381 B CN 105426381B CN 201510534221 A CN201510534221 A CN 201510534221A CN 105426381 B CN105426381 B CN 105426381B
- Authority
- CN
- China
- Prior art keywords
- user
- music
- microblogging
- mood
- context
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明是一种在音乐推荐中结合用户情感状态来提高音乐推荐效果的方法,包括以下步骤:基于情感词典的情绪上下文的提取和建模;包含情绪上下文的音乐记录的构建;基于用户情绪上下文的音乐推荐。本发明的方法主要是利用用户在微博上发布的微博数据,包括普通微博和音乐分享微博,并以此来获取用户在不同情感状态下的音乐需求和偏好,在推荐的时候考虑用户当前的情感状态以及在该状态下的音乐偏好,从而能够让推荐的音乐更贴近用户在当前情感状态的偏好。
Description
技术领域
本发明涉及情感挖掘与推荐系统领域,主要是设计一种基于微博情绪上下文的音乐推荐方法。
背景技术
情感挖掘是通过一些方法获取特定用户的情感状态,最为直观的方法是通过一些心跳、脉搏、体温等传感器获取用户的各项生理数据指标,从而判断用户当前所处的情感状态,不过这种方法的实现复杂,不具有普适性。另外一种比较常见的方式是通过文本分析的方法来处理用户产生的数据(包括微博、博客等)来获取用户当前的情感状态,由于用户所发布的这些信息往往都显示或隐式的蕴含着用户的情感状态,而且现在移动互联网的流行更加方便了这种方式获取用户数据的渠道。类似的方法在舆论分析等领域应用较为广泛。
随着互联网应用的发展,推荐系统也越来越受到大家的关注,并且在工业界以及学术界都取得了巨大的成功。传统单一维度的推荐系统已经不能满足用户个性化的需求,而上下文相关的推荐系统不仅能够较好的帮助用户解决信息过载的问题,而且能够更加充分的挖掘用户的随时间、环境等上下文而变化的特定需求。然而在基于上下文推荐系统的设计中,对用户上下文(尤其是情感上下文)的提取、建模以及与推荐系统的结合的策略较少且不够成熟,因此已有推荐系统算法均没有结合情感上下文信息。但是在很多场景下,用户的情感状态往往会主导用户的需求,例如听音乐、看书、看电影等等。
发明内容
针对传统音乐推荐系统的缺点,本发明提出了一种在音乐推荐算法中加入用户情感上下文的方法,具体包括如下的内容:
一种基于微博情绪上下文的音乐推荐方法,包括以下步骤:
10.基于情感词典的情绪上下文的提取和建模;
20.包含情绪上下文的音乐记录的构建;
30.基于用户情绪上下文的音乐推荐。
进一步的,步骤10包括:
101.利用已有情感词典、同义词词典、微博词汇构建一个多粒度情感词典,所述多粒度情感词典包含有三种情绪粒度,分别为2分类,包括积极、消极;7分类,包括乐、好、哀、惊、惧、怒、恶;19分类,包括快乐、安心、喜爱、相信、赞扬、祝愿、悲伤、失望、内疚、思念、惊奇、慌、恐惧、羞、愤怒、贬责、烦闷、怀疑、憎恶;
102.采用分词系统将用户微博数据转化为中文单词序列,并利用词袋模型来表示微博;
103.根据101中所构建的情感词典和微博中的情感词汇的出现频率,将微博表示为情感向量,此处可根据对效率和准确度的要求选择不同粒度的情感词典,从而获得合适的情感向量;具体的,根据细粒度情感词典获得的情绪向量更准确,而利用粗粒度情感词典的效率更高。
104.把用户在时间点t之前一段时间内的所有微博的情感向量相加,并归一化,作为用户在时间t的情绪上下文向量。
进一步的,步骤20包括:
201.从用户的音乐分享微博中获取用户的音乐收听记录,所述音乐收听记录包括时间;
202.利用用户的微博获取音乐收听记录对应的情绪上下文向量,最终得到所有用户的“用户-音乐-情绪上下文向量”的记录。
进一步的,步骤30包括:
301.根据用户的“用户-音乐-情绪上下文向量”的记录计算用户之间的相似度,其计算公式为:
其中,
·u是目标用户,而v数据库中的另外一个用户;
·Iu是用户u所收听的音乐集合,而Iv是用户v所收听的音乐条目集合;
·eui是用户u收听音乐i的情绪上下文向量;
·evi是用户v收听音乐i的情绪上下文向量;
·cos(eui,evi)是情绪上下文向量eui和evi的余弦相似度;
302.目标用户u对音乐i的兴趣计算公式如下:
其中,
·u是目标用户;
·Uu,k是和u最相似的k个用户的集合;
·Ui是收听过音乐i的用户集合;
·eu是目标用户u的当前情绪上下文向量,evi是用户v收听音乐i的情绪上下文向量;
303.利用步骤302中的公式对所有音乐进行排序,把前N个推荐给当前用户。
本发明的基于微博情绪上下文的音乐推荐方法,其有益效果是:
1)通过构建多粒度的情感词典,并根据用户的微博获取用户的情绪上下文向量,为用户的情绪上下文的提取和建模的困难的问题提供了一种可行的思路;
2)利用新浪微博用户数据,提取用户的收听记录以及对应的情绪上下文,解决了上下文与音乐数据结合困难的问题;
3)设计了基于用户情感上下文的音乐推算法,能够使得推荐的音乐更符合目标用户当前的偏好。
附图说明
图1为本发明的基于微博情绪上下文的音乐推荐方法一个实施例的推荐系统架构;
图2为本发明的基于微博情绪上下文的音乐推荐方法一个实施例中用户音乐偏好预测流程。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
本发明提供了一种基于微博情绪上下文的音乐推荐方法,包括以下步骤:基于情感词典的情绪上下文的提取和建模;包含情绪上下文的音乐记录的构建;基于用户情绪上下文的音乐推荐。
具体的,图1展示了本发明的基于微博情绪上下文的音乐推荐方法一个具体实施例的推荐系统的架构。该推荐系统分为两个主要模块:预处理模块和预测模块。预处理模块中,首先获取用户的所有微博,并进行分类,其中包含用户音乐分享信息的为音乐微博,其他的为普通微博,再对用户的普通微博进行分词,并根据多粒度情感词典从中获取用户对应的情感状态,将其表示为情感向量;与此同时,从用户的音乐微博中提取用户历史音乐分享信息;最后再将二者根据时间关系进行关联,得到“用户-音乐-情绪上下文向量”的关联数据,为接下来的推荐算法提供数据基础。在预测模块中,首先从目标用户的最近微博中获取对当前情绪上下文;然后从目标用户普通微博和音乐微博中提取音乐分享信息及对应的情绪向量,并将二者根据时间关系进行关联,得到目标用户的“用户-音乐-情绪上下文向量”的关联数据;最后利用关联数据寻找与目标用户相似的用户,并根据相似用户的关联数据给目标用户推荐适合其当前情绪上下文的音乐。
图2展示了用户偏好预测的详细步骤。首先从目标用户的最近微博中挖掘情绪向量,作为目标用户当前的情绪上下文,并从目标用户的所有微博中提取目标用户的“用户-音乐-情绪上下文向量”的关联数据;然后利用关联数据,计算目标用户和其他用户的相似度,用户相似度计算公式为:
其中,u是目标用户,v数据库中的其他用户,Iu和Iv分别是目标用户u和用户v所收听的音乐条目集合,eui和evi分别是用户u和v收听音乐i的情绪上下文向量,cos(eui,evi)是情绪上下文向量eui和evi的余弦相似度;最后计算目标用户在当前情绪上下文的情况下对相似用户的音乐的偏好程度并排序,并把前N首音乐推荐给用户,目标用户u对音乐i的兴趣计算公式为:
其中,u是目标用户,Uu,k是和u最相似的k个用户的集合,Ui是收听过音乐i的用户集合,eu是目标用户u的当前情绪上下文向量,evi是用户v收听音乐i的情绪上下文向量。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (1)
1.一种基于微博情绪上下文的音乐推荐方法,其特征在于,包括以下步骤:
10.基于情感词典的情绪上下文的提取和建模,具体包括:
101.利用已有情感词典、同义词词典、微博词汇构建一个多粒度情感词典,所述多粒度情感词典包含有三种情绪粒度,分别为2分类,包括积极、消极;7分类,包括乐、好、哀、惊、惧、怒、恶;19分类,包括快乐、安心、喜爱、相信、赞扬、祝愿、悲伤、失望、内疚、思念、惊奇、慌、恐惧、羞、愤怒、贬责、烦闷、怀疑、憎恶;
102.采用分词系统将用户微博数据转化为中文单词序列,并利用词袋模型来表示微博;
103.根据101中所构建的多粒度情感词典和微博中的情感词汇的出现频率,将微博表示为情感向量;根据对效率和准确度的要求选择不同粒度的情感词典,从而获得合适的情感向量;
104.把用户在时间点t之前一段时间内的所有微博的情感向量相加,并归一化,作为用户在时间t的情绪上下文向量;
20.包含情绪上下文的音乐记录的构建,具体包括:
201.从用户的音乐分享微博中获取用户的音乐收听记录,所述音乐收听记录包括时间;
202.利用用户的微博获取音乐收听记录对应的情绪上下文向量,最终得到所有用户的“用户-音乐-情绪上下文向量”的记录;
30.基于用户情绪上下文的音乐推荐,具体包括:
301.根据用户的“用户-音乐-情绪上下文向量”的记录计算用户之间的相似度,其计算公式为:
其中,
u是目标用户,而v数据库中的另外一个用户;
Iu是用户u所收听的音乐集合,而Iv是用户v所收听的音乐条目集合;
eui是用户u收听音乐i的情绪上下文向量;
evi是用户v收听音乐i的情绪上下文向量;
cos(eui,evi)是情绪上下文向量eui和evi的余弦相似度;
302.目标用户u对音乐i的兴趣计算公式如下:
其中,
u是目标用户;
Uu,k是和u最相似的k个用户的集合;
Ui是收听过音乐i的用户集合;
eu是目标用户u的当前情绪上下文向量,evi是用户v收听音乐i的情绪上下文向量;
303.利用步骤302中的公式对所有音乐进行排序,把前N个推荐给当前用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510534221.1A CN105426381B (zh) | 2015-08-27 | 2015-08-27 | 一种基于微博情绪上下文的音乐推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510534221.1A CN105426381B (zh) | 2015-08-27 | 2015-08-27 | 一种基于微博情绪上下文的音乐推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105426381A CN105426381A (zh) | 2016-03-23 |
CN105426381B true CN105426381B (zh) | 2018-10-26 |
Family
ID=55504594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510534221.1A Active CN105426381B (zh) | 2015-08-27 | 2015-08-27 | 一种基于微博情绪上下文的音乐推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105426381B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202252A (zh) * | 2016-06-29 | 2016-12-07 | 厦门趣处网络科技有限公司 | 一种基于用户情绪分析的出行推荐方法、系统 |
CN106886579B (zh) * | 2017-01-23 | 2020-01-14 | 北京航空航天大学 | 实时流式文本分级监控方法和装置 |
CN110020118B (zh) * | 2017-09-29 | 2021-11-16 | 北京国双科技有限公司 | 一种计算用户之间相似度的方法及装置 |
CN108038243A (zh) * | 2017-12-28 | 2018-05-15 | 广东欧珀移动通信有限公司 | 音乐推荐方法、装置、存储介质及电子设备 |
CN108804609A (zh) * | 2018-05-30 | 2018-11-13 | 平安科技(深圳)有限公司 | 歌曲推荐方法和装置 |
CN109213892A (zh) * | 2018-08-20 | 2019-01-15 | 广东小天才科技有限公司 | 一种音频播放方法、装置、设备及存储介质 |
CN109271634B (zh) * | 2018-09-17 | 2022-07-01 | 重庆理工大学 | 一种基于用户情感倾向感知的微博文本情感极性分析方法 |
CN109446378A (zh) * | 2018-11-08 | 2019-03-08 | 北京奇艺世纪科技有限公司 | 信息推荐方法、情感倾向确定方法及装置和电子设备 |
JP2021026261A (ja) * | 2019-07-31 | 2021-02-22 | キヤノン株式会社 | 情報処理システム、方法およびプログラム |
CN111414755A (zh) * | 2020-03-20 | 2020-07-14 | 中国计量大学 | 一种基于细粒度情感字典的网络情绪分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090281906A1 (en) * | 2008-05-07 | 2009-11-12 | Microsoft Corporation | Music Recommendation using Emotional Allocation Modeling |
CN103970873A (zh) * | 2014-05-14 | 2014-08-06 | 中国联合网络通信集团有限公司 | 一种音乐推荐方法和系统 |
CN104794208A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本上下文信息的情绪分类方法及系统 |
-
2015
- 2015-08-27 CN CN201510534221.1A patent/CN105426381B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090281906A1 (en) * | 2008-05-07 | 2009-11-12 | Microsoft Corporation | Music Recommendation using Emotional Allocation Modeling |
CN103970873A (zh) * | 2014-05-14 | 2014-08-06 | 中国联合网络通信集团有限公司 | 一种音乐推荐方法和系统 |
CN104794208A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本上下文信息的情绪分类方法及系统 |
Non-Patent Citations (3)
Title |
---|
MusicSense: Contextual Music Recommendation using Emotional Allocation Modeling;Rui Cai 等;《Acm International Conference on Multimedia》;20070928;第553-556页 * |
情感词汇本体的构造;徐琳宏 等;《情报学报》;20080505;第27卷(第2期);第180-185页 * |
面向微博短文本的情感分析研究;刘楠;《中国博士学位论文全文数据库信息科技辑》;20140515;正文第24-29,67-75页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105426381A (zh) | 2016-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105426381B (zh) | 一种基于微博情绪上下文的音乐推荐方法 | |
CN107609101B (zh) | 智能交互方法、设备及存储介质 | |
Poria et al. | Towards an intelligent framework for multimodal affective data analysis | |
CN107391575B (zh) | 一种基于词向量模型的隐式特征识别方法 | |
CN104462363B (zh) | 评论点的展现方法和装置 | |
US9047868B1 (en) | Language model data collection | |
Gedikli et al. | Improving recommendation accuracy based on item-specific tag preferences | |
CN106570106A (zh) | 一种输入过程中将语音信息转化为表情的方法和装置 | |
US9213746B2 (en) | Method for searching for information using the web and method for voice conversation using same | |
US20140325408A1 (en) | Apparatus and method for providing musical content based on graphical user inputs | |
CN106202073B (zh) | 音乐推荐方法及系统 | |
CN103778207A (zh) | 基于lda的新闻评论的话题挖掘方法 | |
CN104281252B (zh) | 一种信息处理方法及电子设备 | |
KR20110115543A (ko) | 개체의 유사성을 계산하는 방법 | |
CN103678304A (zh) | 为预定网页推送特定内容的方法、装置 | |
CN106126605B (zh) | 一种基于用户画像的短文本分类方法 | |
CN104142936A (zh) | 匹配音视频的方法和装置 | |
CN102236717A (zh) | 一种基于草图特征提取的图像检索方法 | |
CN106202200B (zh) | 一种基于固定主题的文本情感倾向性分类方法 | |
CN109308315A (zh) | 一种基于专家领域相似度与关联关系的协同推荐方法 | |
CN114003682A (zh) | 一种文本分类方法、装置、设备及存储介质 | |
CN105426382A (zh) | 一种基于Personal Rank的情绪上下文感知的音乐推荐方法 | |
Nath et al. | Textual lyrics based emotion analysis of bengali songs | |
CN111353070A (zh) | 视频标题的处理方法、装置、电子设备及可读存储介质 | |
Ngo et al. | A vietnamese dialog act corpus based on iso 24617-2 standard |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |