CN106484745A

CN106484745A - 一种歌曲数据处理方法和装置

Info

Publication number: CN106484745A
Application number: CN201510557396.4A
Authority: CN
Inventors: 李晨曦
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2015-09-01
Filing date: 2015-09-01
Publication date: 2017-03-08
Anticipated expiration: 2035-09-01
Also published as: CN106484745B

Abstract

本发明实施例公开了一种歌曲数据处理方法和装置，用于计算用户之间听歌品位的相似性。本发明实施例方法包括：根据用户历史的听歌数据，计算听过的歌曲的N个待比较参数对应的N个比例值，该比例值能表示该用户与其他用户在该待比较参数上的相似性，再按照预置权重对该N个比例值进行综合加权得到相似值，该相似值即能表示该用户与其他用户听歌类型的相似度。

Description

一种歌曲数据处理方法和装置

技术领域

本发明涉及数据处理领域，尤其涉及一种歌曲数据处理方法和装置。

背景技术

歌曲是由歌词和曲谱相结合的艺术形式，也是人们用来陶冶情操的一种方式。歌曲优美的旋律使人能够产生高尚的想法，丰富人类的感情，促进人们理解人类情感的深邃内涵，达到心灵的和谐以及与自然的契合。

在线音乐服务中，可以根据用户的听歌习惯和听歌品位，给用户推荐可能喜欢的歌曲。

然而，随着社会的进步，用户不再仅仅满足于对歌曲的需求，更希望能通过听歌，从在线音乐服务平台上发现具有同样听歌品位的朋友。

发明内容

本发明实施例提供了一种歌曲数据处理方法和装置，用于计算用户之间听歌品位的相似性。

一种歌曲数据处理方法，包括：

获取第一歌曲列表和第二歌曲列表，所述第一歌曲列表中包括预置时间段内第一用户听过的歌曲，所述第二歌曲列表中包括所预置时间段内第二用户听过的歌曲，其中，每首歌曲的歌曲标签信息中包括N个待比较参数，所述N为大于1的正整数；

获取所述N个待比较参数对应的N个比例值，其中，每个待比较参数对应的比例值表示参数值相同歌曲数目平均值占歌曲总数目平均值的比例值，所述参数值相同歌曲数目平均值表示在所述第一歌曲列表和所述第二歌曲列表中该待比较参数的参数值相同的歌曲的数目的平均值，所述歌曲总数目平均值表示所述第一歌曲列表中歌曲数目和所述第二歌曲列表中歌曲数目的平均值；

按照分配给所述N个待比较参数的预置权重，对得到的所述N个比例值综合加权，得到第一相似值，所述第一相似值表示所述第一用户听歌的类型与所述第二用户听歌的类型的相似度。

一种数据处理装置，包括：

第一获取模块，用于获取第一歌曲列表和第二歌曲列表，所述第一歌曲列表中包括预置时间段内第一用户听过的歌曲，所述第二歌曲列表中包括所预置时间段内第二用户听过的歌曲，其中，每首歌曲的歌曲标签信息中包括N个待比较参数，所述N为大于1的正整数；

第二获取模块，用于获取所述N个待比较参数对应的N个比例值，其中，每个待比较参数对应的比例值表示参数值相同歌曲数目平均值占歌曲总数目平均值的比例值，所述参数值相同歌曲数目平均值表示在所述第一歌曲列表和所述第二歌曲列表中该待比较参数的参数值相同的歌曲的数目的平均值，所述歌曲总数目平均值表示所述第一歌曲列表中歌曲数目和所述第二歌曲列表中歌曲数目的平均值；

加权模块，用于按照分配给所述N个待比较参数的预置权重，对所述第二获取模块得到的所述N个比例值综合加权，得到第一相似值，所述第一相似值表示所述第一用户听歌的类型与所述第二用户听歌的类型的相似度。

从以上技术方案可以看出，本发明实施例具有以下优点：本发明实施例中，能根据用户历史的听歌数据，计算听过的歌曲的N个待比较参数对应的N个比例值，该比例值能表示该用户与其他用户在该待比较参数上的相似性，再按照预置权重对该N个比例值进行综合加权得到相似值，该相似值即能表示该用户与其他用户听歌类型的相似度，实现了对用户之间听歌类型相似性的计算，为用户发现具有同样听歌品位的朋友提供了基础。

附图说明

图1为本发明实施例中歌曲数据处理方法的执行环境一个结构示意图；

图2为本发明实施例中歌曲数据处理方法一个流程示意图；

图3为本发明实施例中歌曲数据处理方法另一个流程示意图；

图4为本发明实施例中数据处理装置一个结构示意图；

图5为本发明实施例中数据处理装置另一个结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，尽管在本发明实施例中可能采用术语第一、第二等来描述各个歌曲列表、用户或相似值，但歌曲列表、用户或相似值不应限于这些术语。这些术语仅用来将歌曲列表、用户或相似值彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一歌曲列表也可以被称为第二歌曲列表，类似地，第二歌曲列表也可以被称为第一歌曲列表；同样的，第二相似值也可以被称为第三相似值等等，本发明实施例对此不做限制。

本发明实施例中歌曲数据处理方法可以应用于在线音乐服务平台，也可以应用于社交网站服务器，还可以应用于其他的连接有多个用户端设备的网站服务器，此处不作限定。如图1所示，为本发明实施例中歌曲数据处理方法的执行环境一个结构示意图，其中，在线音乐服务平台连接有多个用户端设备，可以理解的是，用户端设备与在线音乐服务平台之间的连接并不需要是实际的物理连接，只要具有通信连接即可，各用户端设备可以在该在线音乐服务平台点播歌曲，而该在线音乐服务平台能得到使用各用户端设备的用户听歌的数据，并执行本发明实施例中的歌曲数据处理方法。在实际应用中，该在线音乐服务平台可以为一个服务器，也可以为多个服务器组成的服务器集群等，此处不作限定。

请参阅图2，本发明实施例中歌曲数据处理方法一个实施例包括：

201、获取第一歌曲列表和第二歌曲列表，所述第一歌曲列表中包括预置时间段内第一用户听过的歌曲，所述第二歌曲列表中包括所预置时间段内第二用户听过的歌曲，其中，每首歌曲的歌曲标签信息中包括N个待比较参数，所述N为大于1的正整数；

其中，每个待比较参数都可以有多个参数值，根据歌曲的不同而不同，例如，对于一首歌曲，其中一个待比较参数为歌曲名，该参数值可以是A，也可以是B，还可以是C，由该歌曲具体确定。

可以理解的是，该预置时间段可以根据实际情况进行设置，例如可以是一个星期，也可以是一个月，还可以是其他的时间段，此处不作限定。

需要说明的是，第一歌曲列表中包括的歌曲的数目与第二歌曲列表中包括的歌曲的数目可以相同，也可以不同，此处不作限定。

202、获取所述N个待比较参数对应的N个比例值，其中，每个待比较参数对应的比例值表示参数值相同歌曲数目平均值占歌曲总数目平均值的比例值；

其中，所述参数值相同歌曲数目平均值表示在所述第一歌曲列表和所述第二歌曲列表中该待比较参数的参数值相同的歌曲的数目的平均值，所述歌曲总数目平均值表示所述第一歌曲列表中歌曲数目和所述第二歌曲列表中歌曲数目的平均值；

例如，若第一歌曲列表中有J首歌曲，第二歌曲列表中有K首歌曲，对于歌曲名这个待比较参数，该J首歌曲和该K首歌曲中有G首歌曲的歌曲名相同，则歌曲名这个待比较参数的参数值相同的歌曲的数目为G，平均值也为G，歌曲总数目平均值为(J+K)/2，歌曲名这个待比较参数对应的比例值为2G/(J+K)。对于其他的待比较参数，也可以采用这种方式确定其对应的比例值。

203、按照分配给所述N个待比较参数的预置权重，对得到的所述N个比例值综合加权，得到第一相似值，所述第一相似值表示所述第一用户听歌的类型与所述第二用户听歌的类型的相似度。

可以理解的是，可以根据各待比较参数的重要性不同，分配不同的预置权重。

例如，假设有三个待比较参数：第一待比较参数，第二待比较参数，第三待比较参数，根据重要性不同，为第一待比较参数分配的权重为0.5，为第二待比较参数分配的权重为0.3，为第三待比较参数分配的权重为0.2，且第一待比较参数对应的比例值为A，第二待比较参数对应的比例值为B，第三待比较参数对应的比例值为C，则，对该3个比例值综合加权为：0.5A+0.3B+0.2C，即为得到的第一相似值。该第一相似值表示第一用户听歌的类型与第二用户听歌的类型的相似度，其中，该相似值越大，表示该第一用户与第二用户之间听歌类型的相似度越高。

本发明实施例中，能根据用户历史的听歌数据，计算听过的歌曲的N个待比较参数对应的N个比例值，该比例值能表示该用户与其他用户在该待比较参数上的相似性，再按照预置权重对该N个比例值进行综合加权得到相似值，该相似值即能表示该用户与其他用户听歌类型的相似度，实现了对用户之间听歌类型相似性的计算，为用户发现具有同样听歌品位的朋友提供了基础。

上面实施例中，获取所述N个待比较参数对应的N个比例值，在实际应用中，可以依次获取每个待比较参数对应的比例值，下面对本发明实施例中歌曲数据处理方法进行具体描述，请参阅图3，本发明实施例中歌曲数据处理方法另一个实施例包括：

301、获取第一歌曲列表和第二歌曲列表，所述第一歌曲列表中包括预置时间段内第一用户听过的歌曲，所述第二歌曲列表中包括所预置时间段内第二用户听过的歌曲，其中，每首歌曲的歌曲标签信息中包括N个待比较参数，所述N为大于1的正整数；

其中，所述参数值相同歌曲数目表示在所述第一歌曲列表和所述第二歌曲列表中该待比较参数的参数值相同的歌曲的数目，所述歌曲总数目平均值表示所述第一歌曲列表中歌曲数目和所述第二歌曲列表中歌曲数目的平均值；

例如，若第一歌曲列表中有J首歌曲，第二歌曲列表中有K首歌曲，对于歌曲名这个待比较参数，该J首歌曲和该K首歌曲中有G首歌曲的歌曲名相同，则歌曲名这个待比较参数的参数值相同的歌曲的数目为G，歌曲中数目平均值为(J+K)/2，歌曲名这个待比较参数对应的比例值为2G/(J+K)。对于其他的待比较参数，也可以采用这种方式确定其对应的比例值。

可选的，该N个待比较参数可以包括歌曲名、专辑名、歌手、歌曲流派、语种、乐器等待比较参数中至少一种，在实际应用中，还可以包括其他的与歌曲相关的待比较参数，此处不作限定。

在实际应用中，该N个待比较参数可以采用默认值，也可以有用户自定义，此处不作限定。

302、按照预置比较顺序，从所述N个待比较参数中依次选取一个待比较参数，作为当前比较参数，触发步骤303；

本步骤中，该预置比较顺序可以为默认顺序，也可以由用户自定义，此处不作限定。例如，若N个待比较参数为歌曲名、专辑名、歌手、歌曲流派、语种、乐器时，则预置比较顺序可以为按照歌曲名、专辑名、歌手、歌曲流派、语种、乐器从左至右的顺序，也可以按照歌曲名、歌手、专辑名、语种、歌曲流派、乐器从右至左的顺序，还可以自定义为其他顺序，此处不作限定。

可以理解的是，当对一个待比较参数比较完成，得到该待比较参数对应的相似值后，可以按照该预置比较顺序，选取下一个待比较参数，作为当前比较参数，继续执行后续步骤。

303、比较所述第一歌曲列表中歌曲的当前比较参数的参数值与所述第二歌曲列表中歌曲的当前比较参数的参数值，得到所述第一歌曲列表中当前比较参数的参数值与第二歌曲列表中当前比较参数的参数值相同的歌曲的数目的平均值；

选取一个当前比较参数后，会对第一歌曲列表中歌曲的当前比较参数的参数值与第二歌曲列表中歌曲的当前比较参数的参数值进行比较，得到该第一歌曲列表中当前比较参数的参数值与第二歌曲列表中当前比较参数的参数值相同的歌曲的数目的平均值。

例如，若当前比较参数为歌曲名，比较该第一歌曲列表中歌曲的歌曲名和第二歌曲列表中歌曲的歌曲名，能得到该第一歌曲列表与该第二歌曲列表中歌曲名相同的歌曲有5首，平均值也为5。若当前比较参数为歌手，比较比较该第一歌曲列表中歌曲的歌手和第二歌曲列表中歌曲的歌手，能得到该第一歌曲列表中10首歌曲与第二歌曲列表中6首歌曲的歌手相同，则歌手相同歌曲的平均值为8。

304、确定所述当前比较参数的参数值相同的歌曲的数目的平均值占所述第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值，作为所述当前比较参数对应的比例值；

在确定当前比较参数的参数值相同的歌曲的数目的平均值后，再确定该数目占第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值，作为该当前比较参数对应的比例值。

例如，若当前比较参数为歌曲名，该歌曲名相同的歌曲的数目为5首，第一歌曲列表共有15首歌，该第二歌曲列表共有25首歌，则该第一歌曲列表和第二歌曲列表中歌曲数目的平均值为20首，该歌曲名相同的歌曲占歌曲数目的平均值的比例值为25％，即为该当前比较参数歌曲名对应的比例值。

305、从所述第一歌曲列表和所述第二歌曲列表中去除所述当前比较参数的参数值相同的歌曲，更新所述第一歌曲列表和所述第二歌曲列表；

在得到当前比较参数对应的比例值后，为了较弱该参数的影响，可以从该第一歌曲列表和第二歌曲列表中去除该当前比较参数的参数值相同的歌曲，更新该第一歌曲列表和第二歌曲列表。

例如，若当前比较参数为歌曲名，得到第一歌曲列表中的15首歌曲和第二歌曲列表中的25首歌曲内有5首歌曲的歌曲名相同，则可以从第一歌曲列表和第二歌曲列表中将这5首歌曲去掉，更新后的第一歌曲列表中还剩10首歌曲，更新后的第二歌曲列表中还剩20首歌曲，且不再有歌曲名相同的歌曲。

可以理解的是，在实际应用中，步骤305可以存在也可以不存在，可以根据实际情况或用户的选择设定，此处不作限定。

306、触发步骤303，直到得到所述N个待比较参数分别对应的N个比例值；

循环步骤302至305，最后可以得到N个待比较参数分别对应的N个比例值。

307、按照分配给所述N个待比较参数的预置权重，对得到的所述N个比例值综合加权，得到第一相似值，所述第一相似值表示所述第一用户听歌的类型与所述第二用户听歌的类型的相似度；

根据每个待比较参数的重要程度或者用户的需求，可以为每个待比较参数分配的预置权重，分配的预置权重可以相同也可以不同，此处不作限定。在得到N个待比较参数分别对应的N个比例值后，按照分配给该N个待比较参数的阈值权重，对得到的该N个比例值进行综合加权，得到第一相似值。

308、将所述第一相似值呈现给所述第一用户和第二用户；

由于得到的该第一相似值表示的是第一用户与第二用户之间听歌类型的相似度，因此，可以将该第一相似值呈现给该第一用户和第二用户。

可以理解的是，呈现相似值的方式有很多种，可以以百分比的形式，可以图表的形式，还可以以进度条的形式等，此处不作限定。

309、获取第二相似值，所述第二相似度表示所述第一用户听歌的类型与第三用户听歌的类型的相似度；

可以理解的是，还可以获取该第一用户与第三用户之间的第二相似值，该第二相似值用来表示该第一用户与第三用户之间听歌类型的相似度。

在实际应用中，该第二用户和第三用户都可以是该第一用户在通讯工具或者音乐平台上的好友。还可以获取该第一用户与其他用户或其他好友之间的相似值。

310、对所述第一相似度和所述第二相似度排名，并将排名结果呈现给所述第一用户。

得到该第一用户与第二用户之间的第一相似度，以及该第一用户与第三用户的第二相似度之后，可以对该第一相似度和第二相似度进行排名，并将排名结果显示给该第一用户。

可以理解的是，若得到了该第一用户与更多其他用户或其他好友之间的相似度，也可以同时对得到的这些相似度进行排名，并呈现给该第一用户。

本发明实施例中，在确定一个待比较参数对应的相似值后，可以在歌曲列表中去除该待比较参数的参数值相同的歌曲，从而消除该参数值的影响，使得得到的相似值能更全面的体现听歌类型的相似度。且能获取多个用户与某个用户的相似值并排名后呈现给该用户，使得该用户能直观的确定好友中与自己听歌类型相似度最高的用户。

为便于理解，下面以一具体应用场景对本发明实施例中歌曲数据处理方法进行具体描述：

查找历史听歌数据，得到第一歌曲列表，其中包括第一用户在这一周内听过的45首歌曲，以及第二歌曲列表，其中包括第二用户在这一周内听过的55首歌曲；

按照歌曲名、歌手、语种这3个待比较参数从左至右的顺序：

先将歌曲名作为当前比较参数；

得到第一歌曲列表和第二歌曲列表中有10首相同歌曲名的歌曲，占歌曲数目的平均值50的比例值为20％；

从第一歌曲列表和第二歌曲列表中去掉这10首歌曲，更新第一歌曲列表为35首歌曲，第二歌曲列表为45首歌曲；

再选取歌手作为当前比较参数；

得到第一歌曲列表中15首歌曲和第二歌曲列表中5首歌曲的歌手相同，平均值为10，占歌曲数目的平均值40的比例值为25％；

从第一歌曲列表中去掉这15首歌曲，更新为20首，从第二歌曲列表中去掉这5首歌曲，更新为40首；

再选取语种作为当前比较参数；

得到第一歌曲列表中15首歌曲和第二歌曲列表中25首歌曲的语种相同，平均值为20，占歌曲数目的平均值30的比例值为66％；

按照歌曲名0.6，歌手0.3，语种0.1的权重，对这3个待比较参数对应的比例值进行综合加权：0.6*20％+0.3*25％+0.1*66％＝0.261，第一用户与第二用户之间的相似值即为0.261；

将该相似值以百分比的形式呈现给该第一用户和第二用户；

同理，可以获取该第一用户与第三用户的相似值为0.413，该第一用户与第四用户的相似值为0.106；

将第二用户、第三用户和第四用户与该第一用户之间的相似值排名，得到第三用户与第一用户之间相似值最高，第二用户与该第一用户之间相似值其次，第三用户与该第一用户之间相似值最低，将该排名结果呈现给该第一用户。

下面对本发明实施例中的数据处理处理装置进行描述，请参阅图4，本发明实施例中数据处理装置一个实施例包括：

第一获取模块401，用于获取第一歌曲列表和第二歌曲列表，所述第一歌曲列表中包括预置时间段内第一用户听过的歌曲，所述第二歌曲列表中包括所预置时间段内第二用户听过的歌曲，其中，每首歌曲的歌曲标签信息中包括N个待比较参数，所述N为大于1的正整数；

第二获取模块402，用于获取所述N个待比较参数对应的N个比例值，其中，每个待比较参数对应的比例值表示参数值相同歌曲数目平均值占歌曲总数目平均值的比例值，所述参数值相同歌曲数目平均值表示在所述第一歌曲列表和所述第二歌曲列表中该待比较参数的参数值相同的歌曲的数目的平均值，所述歌曲总数目平均值表示所述第一歌曲列表中歌曲数目和所述第二歌曲列表中歌曲数目的平均值；

加权模块403，用于按照分配给所述N个待比较参数的预置权重，对所述第二获取模块402得到的所述N个比例值综合加权，得到第一相似值，所述第一相似值表示所述第一用户听歌的类型与所述第二用户听歌的类型的相似度。

本发明实施例中，第二获取模块402能根据第一获取模块401得到的用户历史的听歌数据，计算听过的歌曲的N个待比较参数对应的N个比例值，该比例值能表示该用户与其他用户在该待比较参数上的相似性，加权模块403再按照预置权重对该N个比例值进行综合加权得到相似值，该相似值即能表示该用户与其他用户听歌类型的相似度，实现了对用户之间听歌品位相似性的计算，为用户发现具有同样听歌品位的朋友提供了基础。

上面实施例中，第二获取模块402获取所述N个待比较参数对应的N个比例值，在实际应用中，第二获取模块402可以依次获取每个待比较参数对应的比例值，下面对本发明实施例中数据处理处理装置进行具体描述，请参阅图5，本发明实施例中数据处理处理装置另一个实施例包括：

第一获取模块501，用于获取第一歌曲列表和第二歌曲列表，所述第一歌曲列表中包括预置时间段内第一用户听过的歌曲，所述第二歌曲列表中包括所预置时间段内第二用户听过的歌曲，其中，每首歌曲的歌曲标签信息中包括N个待比较参数，所述N为大于1的正整数；

第二获取模块502，用于获取所述N个待比较参数对应的N个比例值，其中，每个待比较参数对应的比例值表示参数值相同歌曲数目平均值占歌曲总数目平均值的比例值，所述参数值相同歌曲数目平均值表示在所述第一歌曲列表和所述第二歌曲列表中该待比较参数的参数值相同的歌曲的数目的平均值，所述歌曲总数目平均值表示所述第一歌曲列表中歌曲数目和所述第二歌曲列表中歌曲数目的平均值；

加权模块503，用于按照分配给所述N个待比较参数的预置权重，对所述第二获取模块502得到的所述N个比例值综合加权，得到第一相似值，所述第一相似值表示所述第一用户听歌的类型与所述第二用户听歌的类型的相似度；

本实施例中，所述第二获取模块502具体包括：

选取单元5021，用于按照预置比较顺序，从所述N个待比较参数中依次选取一个待比较参数，作为当前比较参数，触发比较单元；

比较单元5022，用于比较所述第一歌曲列表中歌曲的当前比较参数的参数值与所述第二歌曲列表中歌曲的当前比较参数的参数值，得到所述第一歌曲列表中当前比较参数的参数值与第二歌曲列表中当前比较参数的参数值相同的歌曲的数目的平均值；

确定单元5023，用于确定所述当前比较参数的参数值相同的歌曲的数目的平均值占所述第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值，作为所述当前比较参数对应的比例值，触发所述选取单元，直到得到所述N个待比较参数分别对应的N个比例值；

可选的，该装置还可以包括：

更新模块504，用于在所述确定单元5023确定所述当前比较参数的参数值相同的歌曲的数目的平均值占所述第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值之后，触发所述选取单元5021之前，从所述第一歌曲列表和所述第二歌曲列表中去除所述当前比较参数的参数值相同的歌曲，更新所述第一歌曲列表和所述第二歌曲列表；

可选的，该装置还可以包括：

呈现模块505，用于将所述第一相似值呈现给所述第一用户和第二用户；

可选的，该装置还可以包括：

第三获取模块506，用于获取第二相似值，所述第二相似度表示所述第一用户听歌的类型与第三用户听歌的类型的相似度；

排名模块507，用于对所述第一相似度和所述第二相似度排名，并将排名结果呈现给所述第一用户。

本发明实施例中，在确定单元5023确定一个待比较参数对应的相似值后，更新模块504可以在歌曲列表中去除该待比较参数的参数值相同的歌曲，从而消除该参数值的影响，使得得到的相似值能更全面的体现听歌类型的相似度。且第三获取模块506能获取多个用户与某个用户的相似值，排名模块507排名后呈现给该用户，使得该用户能直观的确定好友中与自己听歌类型相似度最高的用户。

为了便于理解上述实施例，下面以上述数据处理装置各个模块在一个具体应用场景中的交互过程进行说明：

第一获取模块501查找历史听歌数据，得到第一歌曲列表，其中包括第一用户在这一周内听过的45首歌曲，以及第二歌曲列表，其中包括第二用户在这一周内听过的55首歌曲；

按照歌曲名、歌手、语种这3个待比较参数从左至右的顺序：

选取单元5021先将歌曲名作为当前比较参数；

比较单元5022得到第一歌曲列表和第二歌曲列表中有10首相同歌曲名的歌曲，确定单元5023确定占歌曲数目的平均值50的比例值为20％；

更新模块504从第一歌曲列表和第二歌曲列表中去掉这10首歌曲，更新第一歌曲列表为35首歌曲，第二歌曲列表为45首歌曲；

选取单元5021再选取歌手作为当前比较参数；

比较单元5022得到第一歌曲列表中15首歌曲和第二歌曲列表中5首歌曲的歌手相同，平均值为10，确定单元5023确定占歌曲数目的平均值40的比例值为25％；

更新模块504从第一歌曲列表中去掉这15首歌曲，更新为20首，从第二歌曲列表中去掉这5首歌曲，更新为40首；

选取单元5021再选取语种作为当前比较参数；

比较单元5022得到第一歌曲列表中15首歌曲和第二歌曲列表中25首歌曲的语种相同，平均值为20，确定单元5023确定占歌曲数目的平均值30的比例值为66％；

加权模块503按照歌曲名0.6，歌手0.3，语种0.1的权重，对这3个待比较参数对应的比例值进行综合加权：0.6*20％+0.3*25％+0.1*66％＝0.261，第一用户与第二用户之间的相似值即为0.261；

呈现模块505将该相似值以百分比的形式呈现给该第一用户和第二用户；

同理，第三获取模块506可以获取该第一用户与第三用户的相似值为0.413，该第一用户与第四用户的相似值为0.106；

排名模块507将第二用户、第三用户和第四用户与该第一用户之间的相似值排名，得到第三用户与第一用户之间相似值最高，第二用户与该第一用户之间相似值其次，第三用户与该第一用户之间相似值最低，将该排名结果呈现给该第一用户。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种歌曲数据处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述N个待比较参数对应的N个比例值，具体包括：

按照预置比较顺序，从所述N个待比较参数中依次选取一个待比较参数，作为当前比较参数，对所述当前比较参数进行如下处理：

比较所述第一歌曲列表中歌曲的当前比较参数的参数值与所述第二歌曲列表中歌曲的当前比较参数的参数值，得到所述第一歌曲列表中当前比较参数的参数值与第二歌曲列表中当前比较参数的参数值相同的歌曲的数目的平均值；

确定所述当前比较参数的参数值相同的歌曲的数目的平均值占所述第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值，作为所述当前比较参数对应的比例值，触发所述按照预置比较顺序，从所述N个待比较参数中依次选取一个待比较参数，作为当前比较参数的步骤，直到得到所述N个待比较参数分别对应的N个比例值。

3.根据权利要求2所述的方法，其特征在于，所述作为所述当前比较参数对应的比例值的步骤之后，所述从所述N个待比较参数中依次选取下一个待比较参数的步骤之前，还包括：

从所述第一歌曲列表和所述第二歌曲列表中去除所述当前比较参数的参数值相同的歌曲，更新所述第一歌曲列表和所述第二歌曲列表。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

将所述第一相似值呈现给所述第一用户和第二用户。

5.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

获取第二相似值，所述第二相似度表示所述第一用户听歌的类型与第三用户听歌的类型的相似度；

对所述第一相似度和所述第二相似度排名，并将排名结果呈现给所述第一用户。

6.一种数据处理装置，其特征在于，包括：

7.根据权利要求6所述的数据处理装置，其特征在于，所述第二获取模块具体包括：

选取单元，用于按照预置比较顺序，从所述N个待比较参数中依次选取一个待比较参数，作为当前比较参数，触发比较单元；

比较单元，用于比较所述第一歌曲列表中歌曲的当前比较参数的参数值与所述第二歌曲列表中歌曲的当前比较参数的参数值，得到所述第一歌曲列表中当前比较参数的参数值与第二歌曲列表中当前比较参数的参数值相同的歌曲的数目的平均值；

确定单元，用于确定所述当前比较参数的参数值相同的歌曲的数目的平均值占所述第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值，作为所述当前比较参数对应的比例值，触发所述选取单元，直到得到所述N个待比较参数分别对应的N个比例值。

8.根据权利要求7所述的数据处理装置，其特征在于，所述装置还包括：

更新模块，用于在所述确定单元确定所述当前比较参数的参数值相同的歌曲的数目的平均值占所述第一歌曲列表和第二歌曲列表中歌曲数目的平均值的比例值之后，触发所述选取单元之前，从所述第一歌曲列表和所述第二歌曲列表中去除所述当前比较参数的参数值相同的歌曲，更新所述第一歌曲列表和所述第二歌曲列表。

9.根据权利要求6至8中任一项所述的数据处理装置，其特征在于，所述装置还包括：

第一呈现模块，用于将所述第一相似值呈现给所述第一用户和第二用户。

10.根据权利要求6至8中任一项所述的数据处理装置，其特征在于，所述装置还包括：

第三获取模块，用于获取第二相似值，所述第二相似度表示所述第一用户听歌的类型与第三用户听歌的类型的相似度；

排名模块，用于对所述第一相似度和所述第二相似度排名，并将排名结果呈现给所述第一用户。