CN103885987B - 一种音乐推荐方法和系统 - Google Patents

一种音乐推荐方法和系统 Download PDF

Info

Publication number
CN103885987B
CN103885987B CN201210564614.3A CN201210564614A CN103885987B CN 103885987 B CN103885987 B CN 103885987B CN 201210564614 A CN201210564614 A CN 201210564614A CN 103885987 B CN103885987 B CN 103885987B
Authority
CN
China
Prior art keywords
music
user
data
recommendation
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210564614.3A
Other languages
English (en)
Other versions
CN103885987A (zh
Inventor
郭叶
陶振武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201210564614.3A priority Critical patent/CN103885987B/zh
Publication of CN103885987A publication Critical patent/CN103885987A/zh
Application granted granted Critical
Publication of CN103885987B publication Critical patent/CN103885987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明涉及网络技术领域,特别是一种音乐推荐方法和系统,所述方法应用于音乐推荐系统,包括:接收音乐推荐请求;判断与所述音乐推荐请求对应的用户是否为新用户;如果所述用户是新用户,从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据,并对从至少一种外部途径获取的所述用户的行为数据和/或所述用户相关的第一音乐资源数据进行处理,并根据处理结果对所述用户进行分级以获取用户的级别,进入根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤;如果所述用户不是新用户,获取所述用户对应的级别;根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。

Description

一种音乐推荐方法和系统
技术领域
本发明涉及网络技术领域,特别是涉及一种音乐推荐方法和系统。
背景技术
随着移动互联技术的发展,移动终端提供了越来越多样化的应用,例如视频观看、音乐播放、电子商务、定位信息服务等。其中,音乐播放成为了目前移动终端的一个重要应用。然而,互联网上存在大量的音乐资源,各大音乐网站、平台为用户提供了数以万计的音乐资源,如何使得移动终端用户方便的找到自己所需要的音乐,便需要通过个性化音乐推荐方法为用户智能地推荐可能感兴趣的音乐。
现有技术中的音乐推荐方法通常是这样实现的:收集用户收听音乐的行为轨迹,分析用户的兴趣偏好,计算音乐与音乐之间、音乐与用户之间、用户与用户之间的相似度或相关度,以此为依据推荐用户可能感兴趣的音乐。
然而,发明人在实现本发明的过程中发现,现有技术提供的方法至少存在如下缺陷:现有技术中的音乐推荐系统是基于收集的用户的行为记录来进行推荐的,当有新用户时,由于系统中没有新用户的行为记录,无法判断新用户的兴趣,因此不能为新用户有效地推荐其可能喜好的音乐。
另一方面,现有技术中,对所有用户均采用同样的推荐方法,无法取得良好的推荐效果,降低了推荐的效率。
发明内容
为解决上述技术问题,本发明实施例提供了一种音乐推荐方法和系统,可以为新用户进行音乐推荐,并提高了推荐的效率。
根据本发明实施例的第一方面,公开了一种音乐推荐方法,包括:
接收音乐推荐请求;
判断与所述音乐推荐请求对应的用户是否为新用户;
如果所述用户是新用户,从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据,并对所述从至少一种外部途径获取的所述用户的行为数据和/或所述用户相关的第一音乐资源数据进行处理,并根据处理结果对所述用户进行分级以获取所述用户的级别,进入根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤;
如果所述用户不是新用户,获取所述用户对应的级别;
根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。
优选地,所述对所述从至少一种外部途径获取的所述用户的行为数据和/或所述用户相关的第一音乐资源数据进行处理包括:
将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据;
将获取的结构化数据进行归一化处理,得到归一化处理的数据;
将所述归一化处理的数据与音乐推荐系统内的第二音乐资源数据进行关联与映射;
统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别;
获取用户音乐兴趣向量。
优选地,所述从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据为:
从网关获取用户上网记录,获取用户行为数据;和\或
从第三方音乐平台获取用户音乐日志,获取用户行为数据;和\或
从终端获取本地音乐资源数据,作为与用户相关的第一音乐资源数据。
优选地,当获取用户行为数据的途径为从网关获取用户上网记录以获取用户行为数据时,则所述将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据包括:
对用户上网记录中的网页地址进行参数分析处理;
对所述网页地址对应的网页内容进行提取;
对提取的网页内容进行过滤处理;
将经过过滤处理得到的结果保存成预设结构的数据。
优选地,当获取用户行为数据的途径为从第三方音乐平台获取用户音乐日志以获取用户行为数据时,则所述将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据包括:
根据第三方音乐平台资源对音乐日志中的音乐资源I D进行映射,以获取完整的音乐资源数据;
对获取的音乐资源数据进行过滤处理;
将经过过滤处理得到的结果保存成预设结构的数据。
优选地,当获取用户行为数据的途径为从终端获取本地音乐资源数据时,则所述将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据包括:
判断从终端获取的数据是否为音乐数据;
如果是,获取音乐属性信息;
根据音乐属性信息对获取的音乐数据进行过滤处理;
将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐具体包括:
当用户为高级用户时,使用协同过滤方法对用户进行个性化音乐推荐;
当用户为中级用户时,使用基于关联规则的方法对用户进行个性化音乐推荐;
当用户为低级用户时,使用基于音乐相似度过滤的方法进行个性化音乐推荐。
根据本发明实施例的第二方面,公开了一种音乐推荐系统,包括:
接收单元,用于接收音乐推荐请求;
第一判断单元,用于判断与所述音乐推荐请求对应的用户是否为新用户;
数据处理单元,用于如果所述用户是新用户,从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据,并对所述从至少一种外部途径获取的所述用户的行为数据和/或所述用户相关的第一音乐资源数据进行处理,并根据处理结果对所述用户进行分级以获取所述用户的级别,进入根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤;
获取单元,用于如果所述用户不是新用户,获取所述用户对应的级别;
推荐单元,用于根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。
优选地,所述数据处理单元包括:
结构化处理单元,用于将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据;
归一化处理单元,用于将获取的结构化数据进行归一化处理,得到归一化处理的数据;
关联与映射单元,用于将所述归一化处理的数据与所述音乐推荐系统内的第二音乐资源数据进行关联与映射;
统计单元,用于统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别;
音乐兴趣向量获取单元,用于获取用户音乐兴趣向量。
优选地,所述数据处理单元用于从网关获取用户上网记录,获取用户行为数据;和\或,从第三方音乐平台获取用户音乐日志,获取用户行为数据;和\或,从终端获取本地音乐资源数据,作为与用户相关的第一音乐资源数据。
优选地,所述数据处理单元包括第一处理单元,用于从网关获取用户上网记录以获取用户行为数据并进行处理,所述第一处理单元包括:
参数处理单元,用于对用户上网记录中的网页地址进行参数分析处理;
网页内容提取单元,用于对所述网页地址对应的网页内容进行提取;
第一过滤单元,用于对提取的网页内容进行过滤处理;
第一存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述数据处理单元包括第二处理单元,用于从第三方音乐平台获取用户音乐日志以获取用户行为数据并进行处理,所述第二处理单元包括:
映射单元,用于根据第三方音乐平台资源对音乐日志中的音乐资源I D进行映射,以获取完整的音乐资源数据;
第二过滤单元,用于对获取的音乐资源数据进行过滤处理;
第二存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述数据处理单元包括第三处理单元,用于从终端获取本地音乐资源数据并进行处理,所述第三处理单元包括:
第二判断单元,用于判断从终端获取的数据是否为音乐数据;
音乐属性获取单元,用于如果是,获取音乐属性信息;
第三过滤单元,用于根据音乐属性信息对获取的音乐数据进行过滤处理;
第三存储单元。用于将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述推荐单元具体包括:
第一推荐单元,用于当用户为高级用户时,使用协同过滤方法对用户进行个性化音乐推荐;
第二推荐单元,用于当用户为中级用户时,使用基于关联规则的方法对用户进行个性化音乐推荐;
第三推荐单元,用于当用户为低级用户时,使用基于音乐相似度过滤的方法进行个性化音乐推荐
本发明实施例能够达到的有益效果为:本发明提供了一种音乐推荐方法,当判断用户为新用户时,从外部途径获取用户的行为数据和/或与用户相关的第一音乐资源数据,并对获取的数据进行处理,根据处理结果对所述用户进行分级以获取所述用户的级别,并根据用户的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。本发明提供的方法解决了现有技术无法对新用户进行音乐推荐的问题。另一方面,对不同的用户采用不同的推荐方法,降低了方法复杂度,提高了推荐效率,改进了推荐效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的音乐推荐方法第一实施例示意图;
图2为本发明实施例提供的新用户数据预处理流程示意图;
图3为本发明实施例提供的音乐推荐方法第二实施例示意图;
图4为对网关用户行为数据进行结构化处理的示意图;
图5为对第三方音乐平台数据进行结构化处理的示意图;
图6为对终端音乐数据进行结构化处理的示意图;
图7为本发明实施例提供的音乐推荐系统示意图。
具体实施方式
本发明实施例提供了一种音乐推荐方法和系统,可以为新用户进行音乐推荐,并提高了推荐的效率。
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
参见图1,为本发明实施例提供的音乐推荐方法第一实施例示意图。
本发明第一实施例提供了一种音乐推荐方法,包括:
S101,接收音乐推荐请求。
音乐推荐请求可以是用户发送的,也可以是当前系统检测到用户访问音乐数据时由系统生成的。
S102,判断与所述音乐推荐请求对应的用户是否为新用户。
新用户为首次访问音乐平台的用户。音乐平台存储有用户的信息,所述用户的信息可以包括用户的账号信息、用户行为数据等信息。当判断用户是新用户时,进入步骤S103,如果用户不是新用户,进入步骤S104。
S103,如果所述用户是新用户,从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据,并对所述从至少一种外部途径获取的所述用户的行为数据和/或所述用户相关的第一音乐资源数据进行处理,并根据处理结果对所述用户进行分级以获取所述用户的级别,进入根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤。
在本发明第一实施例中,当判断用户是新用户时,则从外部渠道采集用户数据。所述用户数据包括用户行为数据和/或与所述用户相关的第一音乐资源数据。其中,第一音乐资源数据为非从本地音乐平台收集的音乐资源数据。
较佳地,从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据包括:
从网关获取用户上网记录,获取用户行为数据;和\或
从第三方音乐平台获取用户音乐日志,获取用户行为数据;和\或
从终端获取本地音乐资源数据,作为与用户相关的第一音乐资源数据。
以上仅为本发明第一实施例列举的几种从外部途径收集用户数据的方式,本发明不限定其他方式,本领域技术人员在不付出创造性劳动下获取的其他方式均属于本发明的保护范围。
当从多种渠道收集到用户行为数据或者与用户相关的第一音乐资源数据后,本发明对收集、获取的数据进行预处理,并根据处理结果对所述用户进行分级以获取所述用户的级别。
请参见图2,为本发明实施例提供的新用户数据预处理流程示意图。
其中,对获取的新用户数据进行预处理的步骤又可以包括:
S201,将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据。
S202,将获取的结构化数据进行归一化处理,得到归一化处理的数据。
其中,归一化处理主要是将从多种途径获取的数据进行合并,以获取归一化数据。
S203,将所述归一化处理的数据与所述音乐推荐系统内的第二音乐资源数据进行关联与映射。
将归一化处理的数据与本音乐平台的音乐推荐系统内的第二音乐资源数据进行关联与映射处理。具体实现时,是根据本音乐平台的音乐推荐系统内的第二音乐资源数据对归一化处理的数据进行完整性补充,以完善音乐数据中的各音乐属性信息。
S204,统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别。
在本发明第一实施例中,是根据音乐频次对用户进行分级的,音乐访问频次高于第一阈值的为高级用户,音乐访问频次高于第二阈值小于第一阈值的为中级用户,音乐访问频次低于第二阈值的为低级用户。其中,第一阈值和第二阈值为预设的阈值,可以由系统预先设定。
S25,获取用户音乐兴趣向量。
在本发明实施例中,可以根据获取的新用户数据以获取用户音乐兴趣向量,所述音乐兴趣向量用于描述用户的喜好以及各种音乐标签的权重。
S104,如果所述用户不是新用户,获取所述用户对应的级别。
S105,根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。
在本发明第一实施例中,对不同级别的用户采用不同的推荐方法,这样提高了音乐推荐的效率,并提升了推荐效果。另外,本发明第一实施例中解决了现有技术无法为新用户进行音乐推荐的问题,提升了用户体验,并增强了用户粘性。
参见图3,为本发明实施例提供的音乐推荐方法第二施例示意图。
本发明第二实施例提供的方法应用于音乐推荐系统,所述音乐推荐系统可以是网络推荐系统,也可以是保存在终端的音乐推荐系统。其中,终端可以是手机、计算机、PAD等。用户可以通过终端访问网络推荐系统。在本发明第二实施例中,以用户通过手机访问音乐平台或者音乐推荐系统为例进行说明。
S301,接收音乐推荐请求。
S302,判断用户是否为新用户。如果是,进入步骤S303,如果否,进入步骤S309。
S303,从外部途径获取用户行为数据和/或与所述用户相关的第一音乐资源数据。
其中,步骤S303通过以下步骤实现:
S303A,从网关获取用户上网记录,获取用户行为数据。
具体实现时,从网关获取用户的手机上网记录,判断其是否在网页上访问过音乐相关的新闻,是否下载、试听过歌曲,以实现文本数据的交叉关联。
S303B,从第三方音乐平台获取用户音乐日志,获取用户行为数据。
从第三方音乐平台获取用户音乐日志以获取用户行为数据,第三方音乐平台可以是除本音乐平台外的音乐平台,例如无线音乐平台、MM音乐等。
S303C,从终端获取本地音乐资源数据,作为与用户相关的第一音乐资源数据。
当终端是手机时,抓取手机本地音乐数据,包括扫描手机中存储的歌曲文件、采集用户最近播放过的音乐等。
S304,对从不同途径获取的新用户数据进行处理,以获取结构化的用户数据。
参见图4,为对网关用户行为数据进行结构化处理的示意图。
S304A,对用户上网记录中的网页地址进行参数分析处理。
对用户上网记录进行处理,分析URL结构,去除非必需参数,分析代表页面内容类别的参数、页面I D参数,进一步判断页面内容类别是否与音乐相关,将具有与音乐相关内容的URL保存。
S304B,对所述网页地址对应的网页内容进行提取。
判断当前URL内容是否已提取,如果是,则从URL内容库中读取相应的网页内容;如果否,进行URL内容提取。其中,网页内容提取的实现可以采用现有技术的方法,在此不再赘述。
S304C,对提取的网页内容进行过滤处理。
具体实现时,结合本音乐平台的音乐资源库,即结合第二音乐资源对网页内容进行过滤处理。判断每条网页内容中是否包含与本平台音乐资源匹配的歌曲或歌手或专辑信息,如果是,则保存网页内容;如果网页内容不包含与本平台音乐资源匹配的信息,则对这条网页内容数据进行遗弃处理。
S304D,将经过过滤处理得到的结果保存成预设结构的数据。
将经过过滤处理得到的结果按照预设的结构进行保存。具体实现时,保存的数据字段可以包括:手机号、歌曲、歌手、专辑、行为、时间等信息。
参见图5,为对第三方音乐平台数据进行结构化处理的示意图。
S304A',根据第三方音乐平台资源对用户音乐日志中的音乐资源ID进行映射,以获取完整的音乐资源数据。
具体实现时,结合第三音乐平台的资源对用户音乐日志中的音乐资源ID进行映射,以获取与所述音乐资源ID对应的完整的音乐资源数据。
S304B',对获取的音乐资源数据进行过滤处理。
具体实现时,结合本音乐平台的音乐资源库,即结合第二音乐资源对获取的第三方音乐平台的用户音乐资源数据进行过滤处理。判断每条用户音乐资源数据中是否包含与本平台音乐资源匹配的歌曲或歌手或专辑信息,如果是,则保存用户音乐资源数据;如果用户音乐资源数据不包含与本平台音乐资源匹配的信息,则对这条用户音乐资源数据进行遗弃处理。
S304C',将经过过滤处理得到的结果保存成预设结构的数据。
将经过过滤处理得到的结果按照预设的结构进行保存。具体实现时,保存的数据字段可以包括:手机号、歌曲、歌手、专辑、行为、时间等信息。
参见图6,为对终端音乐数据进行结构化处理的示意图。
S304A″,判断从终端获取的数据是否为音乐数据。如果是,进入步骤S304A″,如果否,丢弃此数据。
具体实现时,可以根据从终端获取的文件数据的格式判断是否为音乐文件,例如后缀名为MP3、WMA、RMVB、MP4等的文件为音乐文件。
S304B″,如果是,获取音乐属性数据。
其中,歌曲属性信息包括歌手、歌曲名、专辑名称等信息。
S304C″,根据音乐属性信息对获取的音乐数据进行过滤处理。
具体实现时,结合本音乐平台的音乐资源库,即结合第二音乐资源对终端的音乐数据对应的文件名和音乐属性信息进行过滤处理。判断每条终端音乐数据中是否包含与本平台音乐资源匹配的歌曲或歌手或专辑信息,如果是,则保存终端音乐数据;如果终端音乐数据不包含与本平台音乐资源匹配的信息,则对这条终端音乐数据进行遗弃处理。
S304D″,将经过过滤处理得到的结果保存成预设结构的数据。
将经过过滤处理得到的结果按照预设的结构进行保存。具体实现时,保存的数据字段可以包括:手机号、歌曲、歌手、专辑、行为、时间等信息。
S305,将获取的结构化数据进行归一化处理,得到归一化处理的数据。
将从各种途径获取的数据进行合并处理。
S306,将所述归一化处理的数据与所述音乐推荐系统内的第二音乐资源数据进行关联与映射。
本平台的第二音乐资源数据具体可以包括以下信息:
(1)音乐属性信息:名称、歌手、专辑、长度、上线时间。
(2)音乐统计信息:下载量、点击量等。
(3)音乐标签:地域、风格、场景、年代、主题、心情等信息。广义的标签数据应包含歌手、专辑等信息。
利用本平台音乐标签库对以上进行结构化处理后的数据进行关联与映射,补充以上数据的完整性,完善每条数据中的音乐信息。
S307,统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别。
对关联映射后的数据按用户、标签进行频次统计,获得如下格式的数据:手机号、访问总频次、每个标签的出现频次。
以下为本发明具体实现时的一个示例:
手机号 总频次 标签1 标签2 ... 标签n
138***1297 78 0 4 ... 1
135***4782 145 18 15 ... 7
137***3740 247 9 0 ... 16
S308,获取用户音乐兴趣向量,进入步骤S309。
在本发明第二实施例中,采用的TF-IDF算法进行权值归一化,获得每个用户的音乐兴趣向量。具体实现时,可以将上述表中所示数据转化为一个矩阵进行处理。
Wij=TFij*IDFj (3)
其中TFij为标签i在用户j中出现的频次;IDFj为倒文档频率,Wij为标签i在用户j中的权重,其为TFij与IDFj的乘积。其中,公式(1)中的fij为当前处理行中的任意一个标签对应的频次,Z为矩阵的列数,取值为1到N,maxfiz用于表示所述标签对应的当前处理行中所有标签对应的频次的最大值。例如,对于手机号为138***1297的用户数据对应的行,其中,假设fij为标签2对应的频次取值为4,则maxfiz为标签2所在处理行(即手机号为138***1297的用户数据对应的行)中标签1、标签2、标签3……标签n中的最大值。其中,公式(2)中的nj为当前处理的任意一个标签对应的频次值,N为当前处理的标签所在的列中各频次值的总和。如上表所示,假设标签2对应的频次4为当前处理的标签对应的频次值,则N为标签2所在的列中频次4、15、0的和值。
S309,获取用户对应的级别,根据用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。
在本发明第二实施例中,将用户按访问频次进行分级,可将用户分为高频用户、中频用户和低频用户。在进行音乐推荐时,对不同级别的用户采用不同的推荐算法。
其中,当用户是高频用户(高级用户)时,对高频用户采用SlopeOne推荐方法。SlopeOne推荐方法是利用已有的用户评分预测用户对未访问过的音乐的评分来进行推荐的,在本发明中,将用户兴趣向量的权值对候选音乐的标签进行加权,以得到用户对某个音乐的最终评分。该方法在评分很密接的情况下,算法的应用效果更好,所以该方法适用于高频用户。
当用户是中频用户(中级用户)时,对中频用户采用基于关联规则的音乐推荐方法。具体实现时,基于关联规则的音乐推荐过程如下:首先提取中频用户的音乐访问记录,用访问记录中出现的音乐构建音乐总集合。当为用户进行推荐时,计算与该用户访问过的音乐共现的音乐,作为备选集,再用用户兴趣向量中每个标签的权值对备选集中的音乐标签进行加权排序,将排序最靠前的N首音乐作为推荐结果。该方法需首先过滤只被一个用户访问过的音乐,而且一般情况下,音乐访问分布具有很明显的长尾现象,所以在对音乐进行过滤后,会大大降低算法的复杂度,提升方法的性能,取得的效果相对较好,所以是一种性价比较高的方法。
当用户是中频用户(低频用户)时,对低频用户和新用户采用基于音乐相似度过滤的推荐方法。基于音乐相似度过滤推荐的过程如下:首先提取用户已访问过的音乐作为种子音乐,然后通过音乐标签(如歌手、地域、风格等)计算音乐库中的音乐与种子音乐的相似度,并用用户兴趣向量中的音乐标签对相似度进行加权,选出用户未访问过的相似度最高的N首音乐推荐给用户。对于低频用户,可利用其在平台上访问过的音乐作为种子音乐;对于新用户,则利用从网关上网日志、第三方音乐平台日志、手机本地音乐数据中获取的音乐作为种子音乐。
在本发明第二实施例中,当用户是新用户时,针对从不同途径收集、获取的用户音乐数据进行了预处理,以获取了归一化的用户数据,以此作为用户分级、推荐的依据,解决了现有技术无法对新用户进行音乐推荐的问题。另一方面针对不同访问频次的用户使用了不同的推荐方法,提升了推荐效率,改善了推荐效果。
参见图7,为本发明实施例提供的音乐推荐系统示意图。
一种音乐推荐系统,包括:
接收单元701,用于接收音乐推荐请求。
第一判断单元702,用于判断与所述音乐推荐请求对应的用户是否为新用户。
数据处理单元703,用于如果所述用户是新用户,从至少一种外部途径获取所述用户的行为数据和/或与所述用户相关的第一音乐资源数据,并对所述从至少一种外部途径获取的所述用户的行为数据和/或所述用户相关的第一音乐资源数据进行处理,并根据处理结果对所述用户进行分级以获取所述用户的级别,进入根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤。
获取单元704,用于如果所述用户不是新用户,获取所述用户对应的级别。
推荐单元705,用于根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐。
优选地,所述数据处理单元包括:
结构化处理单元,用于将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据;
归一化处理单元,用于将获取的结构化数据进行归一化处理,得到归一化处理的数据;
关联与映射单元,用于将所述归一化处理的数据与所述音乐推荐系统内的第二音乐资源数据进行关联与映射;
统计单元,用于统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别;
音乐兴趣向量获取单元,用于获取用户音乐兴趣向量。
优选地,所述数据处理单元用于从网关获取用户上网记录,获取用户行为数据;和\或,从第三方音乐平台获取用户音乐日志,获取用户行为数据;和\或,从终端获取本地音乐资源数据,作为与用户相关的第一音乐资源数据。
优选地,所述数据处理单元包括第一处理单元,用于从网关获取用户上网记录以获取用户行为数据并进行处理,所述第一处理单元包括:
参数处理单元,用于对用户上网记录中的网页地址进行参数分析处理;
网页内容提取单元,用于对所述网页地址对应的网页内容进行提取;
第一过滤单元,用于对提取的网页内容进行过滤处理;
第一存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述数据处理单元包括第二处理单元,用于从第三方音乐平台获取用户音乐日志以获取用户行为数据并进行处理,所述第二处理单元包括:
映射单元,用于根据第三方音乐平台资源对音乐日志中的音乐资源I D进行映射,以获取完整的音乐资源数据;
第二过滤单元,用于对获取的音乐资源数据进行过滤处理;
第二存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述数据处理单元包括第三处理单元,用于从终端获取本地音乐资源数据并进行处理,所述第三处理单元包括:
第二判断单元,用于判断从终端获取的数据是否为音乐数据;
音乐属性获取单元,用于如果是,获取音乐属性信息;
第三过滤单元,用于根据音乐属性信息对获取的音乐数据进行过滤处理;
第三存储单元。用于将经过过滤处理得到的结果保存成预设结构的数据。
优选地,所述推荐单元具体包括:
第一推荐单元,用于当用户为高级用户时,使用协同过滤方法对用户进行个性化音乐推荐;
第二推荐单元,用于当用户为中级用户时,使用基于关联规则的方法对用户进行个性化音乐推荐;
第三推荐单元,用于当用户为低级用户时,使用基于音乐相似度过滤的方法进行个性化音乐推荐。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序单元。一般地,程序单元包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种音乐推荐方法,其特征在于,应用于音乐推荐系统,包括:
接收音乐推荐请求;
判断与所述音乐推荐请求对应的用户是否为新用户;所述新用户为首次访问所述音乐推荐系统的用户;
如果所述用户是新用户,从至少一种外部途径获取所述新用户的行为数据和/或与所述新用户相关的第一音乐资源数据,并对所述从至少一种外部途径获取的所述新用户的行为数据和/或所述新用户相关的第一音乐资源数据进行处理,并根据处理结果对所述新用户进行分级以获取所述新用户的级别,进入获取用户对应的级别以及根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤;
如果所述用户不是新用户,获取所述用户对应的级别;
根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐;
其中,所述对所述从至少一种外部途径获取的所述新用户的行为数据和/或所述新用户相关的第一音乐资源数据进行处理包括:
将从至少一种外部途径获取的所述新用户的行为数据和/或与所述新用户相关的第一音乐资源数据进行处理,获取结构化的用户数据;
将获取的结构化数据进行归一化处理,得到归一化处理的数据;
将所述归一化处理的数据与音乐推荐系统内的第二音乐资源数据进行关联与映射;
统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别;
获取所述新用户的音乐兴趣向量。
2.根据权利要求1所述的方法,其特征在于,所述从至少一种外部途径获取所述新用户的行为数据和/或与所述新用户相关的第一音乐资源数据为:
从网关获取用户上网记录,获取用户行为数据;和\或
从第三方音乐平台获取用户音乐日志,获取用户行为数据;和\或
从终端获取本地音乐资源数据,作为与用户相关的第一音乐资源数据。
3.根据权利要求1或2所述的方法,其特征在于,当获取用户行为数据的途径为从网关获取用户上网记录以获取用户行为数据时,则所述将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据包括:
对用户上网记录中的网页地址进行参数分析处理;
对所述网页地址对应的网页内容进行提取;
对提取的网页内容进行过滤处理;
将经过过滤处理得到的结果保存成预设结构的数据。
4.根据权利要求1或2所述的方法,其特征在于,当获取用户行为数据的途径为从第三方音乐平台获取用户音乐日志以获取用户行为数据时,则所述将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据包括:
根据第三方音乐平台资源对音乐日志中的音乐资源ID进行映射,以获取完整的音乐资源数据;
对获取的音乐资源数据进行过滤处理;
将经过过滤处理得到的结果保存成预设结构的数据。
5.根据权利要求1或2所述的方法,其特征在于,当获取用户行为数据的途径为从终端获取本地音乐资源数据时,则所述将从至少一种外部途径获取的用户行为数据和/或与用户相关的第一音乐资源数据进行处理,获取结构化的用户数据包括:
判断从终端获取的数据是否为音乐数据;
如果是,获取音乐属性信息;
根据音乐属性信息对获取的音乐数据进行过滤处理;
将经过过滤处理得到的结果保存成预设结构的数据。
6.根据权利要求1所述的方法,其特征在于,所述根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐具体包括:
当用户为高级用户时,使用协同过滤方法对用户进行个性化音乐推荐;
当用户为中级用户时,使用基于关联规则的方法对用户进行个性化音乐推荐;
当用户为低级用户时,使用基于音乐相似度过滤的方法进行个性化音乐推荐。
7.一种音乐推荐系统,其特征在于,包括:
接收单元,用于接收音乐推荐请求;
第一判断单元,用于判断与所述音乐推荐请求对应的用户是否为新用户;所述新用户为首次访问所述音乐推荐系统的用户;
数据处理单元,用于如果所述用户是新用户,从至少一种外部途径获取所述新用户的行为数据和/或与所述新用户相关的第一音乐资源数据,并对所述从至少一种外部途径获取的所述新用户的行为数据和/或所述新用户相关的第一音乐资源数据进行处理,并根据处理结果对所述新用户进行分级以获取所述新用户的级别,进入根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐的步骤;
获取单元,用于如果所述用户不是新用户,获取所述用户对应的级别;
推荐单元,用于根据所述用户对应的级别采用与所述级别对应的推荐方法进行个性化音乐推荐;
其中,所述数据处理单元包括:
结构化处理单元,用于将从至少一种外部途径获取的所述新用户的用户行为数据和/或与所述新用户相关的第一音乐资源数据进行处理,获取结构化的用户数据;
归一化处理单元,用于将获取的结构化数据进行归一化处理,得到归一化处理的数据;
关联与映射单元,用于将所述归一化处理的数据与所述音乐推荐系统内的第二音乐资源数据进行关联与映射;
统计单元,用于统计音乐频次,根据统计的音乐频次对所述新用户进行分级,得到所述新用户对应的级别;
音乐兴趣向量获取单元,用于获取所述新用户的音乐兴趣向量。
8.根据权利要求7所述的系统,其特征在于,所述数据处理单元用于从网关获取用户上网记录,获取用户行为数据;和\或,从第三方音乐平台获取用户音乐日志,获取用户行为数据;和\或,从终端获取本地音乐资源数据, 作为与用户相关的第一音乐资源数据。
9.根据权利要求7或8所述的系统,其特征在于,所述数据处理单元包括第一处理单元,用于从网关获取用户上网记录以获取用户行为数据并进行处理,所述第一处理单元包括:
参数处理单元,用于对用户上网记录中的网页地址进行参数分析处理;
网页内容提取单元,用于对所述网页地址对应的网页内容进行提取;
第一过滤单元,用于对提取的网页内容进行过滤处理;
第一存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
10.根据权利要求7或8所述的系统,其特征在于,所述数据处理单元包括第二处理单元,用于从第三方音乐平台获取用户音乐日志以获取用户行为数据并进行处理,所述第二处理单元包括:
映射单元,用于根据第三方音乐平台资源对音乐日志中的音乐资源ID进行映射,以获取完整的音乐资源数据;
第二过滤单元,用于对获取的音乐资源数据进行过滤处理;
第二存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
11.根据权利要求7或8所述的系统,其特征在于,所述数据处理单元包括第三处理单元,用于从终端获取本地音乐资源数据并进行处理,所述第三处理单元包括:
第二判断单元,用于判断从终端获取的数据是否为音乐数据;
音乐属性获取单元,用于如果是,获取音乐属性信息;
第三过滤单元,用于根据音乐属性信息对获取的音乐数据进行过滤处理;
第三存储单元,用于将经过过滤处理得到的结果保存成预设结构的数据。
12.根据权利要求7所述的系统,其特征在于,所述推荐单元具体包括:
第一推荐单元,用于当用户为高级用户时,使用协同过滤方法对用户进行个性化音乐推荐;
第二推荐单元,用于当用户为中级用户时,使用基于关联规则的方法对用户进行个性化音乐推荐;
第三推荐单元,用于当用户为低级用户时,使用基于音乐相似度过滤的方法进行个性化音乐推荐。
CN201210564614.3A 2012-12-21 2012-12-21 一种音乐推荐方法和系统 Active CN103885987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210564614.3A CN103885987B (zh) 2012-12-21 2012-12-21 一种音乐推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210564614.3A CN103885987B (zh) 2012-12-21 2012-12-21 一种音乐推荐方法和系统

Publications (2)

Publication Number Publication Date
CN103885987A CN103885987A (zh) 2014-06-25
CN103885987B true CN103885987B (zh) 2018-04-10

Family

ID=50954882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210564614.3A Active CN103885987B (zh) 2012-12-21 2012-12-21 一种音乐推荐方法和系统

Country Status (1)

Country Link
CN (1) CN103885987B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653535B (zh) * 2014-11-13 2019-07-02 中国科学院沈阳计算技术研究所有限公司 一种媒体资源推荐方法
CN104750868B (zh) * 2015-04-17 2019-03-01 魅族科技(中国)有限公司 一种多媒体文件播放列表建立方法及装置
CN106202103A (zh) * 2015-05-06 2016-12-07 阿里巴巴集团控股有限公司 音乐推荐方法和装置
CN106649316B (zh) * 2015-10-29 2020-11-27 北京国双科技有限公司 一种视频推送方法及装置
CN105868248A (zh) * 2015-12-15 2016-08-17 乐视网信息技术(北京)股份有限公司 媒体推荐方法及装置
CN106997347A (zh) * 2016-01-22 2017-08-01 华为技术有限公司 信息推荐方法及服务器
CN107092612B (zh) * 2016-08-15 2022-07-01 北京星选科技有限公司 一种推送资源的方法及装置
CN107977370B (zh) * 2016-10-21 2021-03-12 北京酷我科技有限公司 一种歌手推荐方法及系统
CN108429624B (zh) * 2016-12-21 2022-07-26 迈普通信技术股份有限公司 一种qos动态调整方法、设备及系统
CN106844768A (zh) * 2017-02-25 2017-06-13 张元康 基于第三方的数据对接系统及方法
CN108694171B (zh) * 2017-04-05 2021-10-19 腾讯科技(深圳)有限公司 信息推送的方法及装置
CN107609198B (zh) * 2017-10-20 2020-06-12 咪咕互动娱乐有限公司 一种推荐方法、装置及计算机可读存储介质
CN108062692B (zh) * 2017-12-28 2020-03-31 平安科技(深圳)有限公司 一种录音推荐方法、装置、设备及计算机可读存储介质
CN109150400B (zh) * 2018-08-14 2021-08-17 Oppo广东移动通信有限公司 数据传输方法、装置、电子设备及计算机可读介质
CN110287417A (zh) * 2019-06-26 2019-09-27 北京谦仁科技有限公司 数据处理方法、存储介质和电子设备
CN111145721B (zh) * 2019-12-12 2024-02-13 科大讯飞股份有限公司 个性化提示语生成方法、装置和设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441667A (zh) * 2008-12-29 2009-05-27 北京搜狗科技发展有限公司 一种音乐推荐方法及装置
CN102024058A (zh) * 2010-12-31 2011-04-20 万音达有限公司 音乐推荐方法及系统
CN102402625A (zh) * 2011-12-28 2012-04-04 深圳市五巨科技有限公司 一种音乐推荐的方法及系统
CN102567511A (zh) * 2011-12-27 2012-07-11 奇智软件(北京)有限公司 一种应用自动推荐的方法及装置
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
CN102685565A (zh) * 2012-05-18 2012-09-19 合一网络技术(北京)有限公司 一种点击反馈式个性化推荐系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097300A1 (en) * 2001-11-13 2003-05-22 Koninklijke Philips Electronics N.V. Method and apparatus for recommending items of interest based on stereotype preferences of third parties
CN102073717A (zh) * 2011-01-07 2011-05-25 南京大学 一种面向垂直电子商务网站的首页推荐方法
CN102289509A (zh) * 2011-08-31 2011-12-21 南京大学 一种网站数据的获取及迁移使用方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101441667A (zh) * 2008-12-29 2009-05-27 北京搜狗科技发展有限公司 一种音乐推荐方法及装置
CN102024058A (zh) * 2010-12-31 2011-04-20 万音达有限公司 音乐推荐方法及系统
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
CN102567511A (zh) * 2011-12-27 2012-07-11 奇智软件(北京)有限公司 一种应用自动推荐的方法及装置
CN102402625A (zh) * 2011-12-28 2012-04-04 深圳市五巨科技有限公司 一种音乐推荐的方法及系统
CN102685565A (zh) * 2012-05-18 2012-09-19 合一网络技术(北京)有限公司 一种点击反馈式个性化推荐系统

Also Published As

Publication number Publication date
CN103885987A (zh) 2014-06-25

Similar Documents

Publication Publication Date Title
CN103885987B (zh) 一种音乐推荐方法和系统
CN103020845B (zh) 一种移动应用的推送方法及系统
CN104281622B (zh) 一种社交媒体中的信息推荐方法和装置
Konstas et al. On social networks and collaborative recommendation
CN104142940B (zh) 信息推荐处理方法及装置
CN104991899B (zh) 用户属性的识别方法及装置
CN104077415B (zh) 搜索方法及装置
CN108241667A (zh) 用于推送信息的方法和装置
CN107784092A (zh) 一种推荐热词的方法、服务器及计算机可读介质
KR20150036117A (ko) 쿼리 확장
CN107818105A (zh) 应用程序的推荐方法及服务器
CN106326391A (zh) 多媒体资源推荐方法及装置
US10146775B2 (en) Apparatus, system and method for string disambiguation and entity ranking
CN101984437A (zh) 音乐资源个性化推荐方法及系统
CN106776860A (zh) 一种搜索摘要生成方法及装置
CN104503988B (zh) 搜索方法及装置
CN103530364B (zh) 提供下载链接的方法及系统
CN104462336A (zh) 信息推送方法和装置
CN101261629A (zh) 基于自动分类技术的特定信息搜索方法
CN106779946A (zh) 一种电影推荐方法及装置
US8838580B2 (en) Method and system for providing keyword ranking using common affix
CN109033441A (zh) 一种基于大数据分析的推送方法及装置
CN108416627A (zh) 一种基于互联网数据的品牌影响力监控方法及系统
CN103064880A (zh) 一种基于搜索信息向用户提供网站选择的方法、装置和系统
CN102682011B (zh) 建立域名描述名称信息表、搜索的方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant