CN108230059B

CN108230059B - 电影推荐方法及装置

Info

Publication number: CN108230059B
Application number: CN201611145312.7A
Authority: CN
Inventors: 刘颖慧; 韩晶; 刘静沙
Original assignee: China United Network Communications Group Co Ltd
Current assignee: China United Network Communications Group Co Ltd
Priority date: 2016-12-13
Filing date: 2016-12-13
Publication date: 2022-04-15
Anticipated expiration: 2036-12-13
Also published as: CN108230059A

Abstract

本发明实施例提供一种电影推荐方法及装置，该方法包括：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息向用户推荐电影，正是由于根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，才能全面、准确的向用户推荐电影。

Description

电影推荐方法及装置

技术领域

本发明实施例涉及大数据技术领域，尤其涉及一种电影推荐方法及装置。

背景技术

随着物质生活水平的不断提高，人们对精神生活水平的要求也越来越高，而观看电影是最为常见的精神娱乐项目。

通常，人们在观看电影前，可能会在电影网站或者影评网站上查看电影评论，或者查看一些电影评分，电影网站或者影评网站可能会向用户推荐评分较高，影评较好的影片，而电影评分和电影评论是根据已经观看了该电影的用户的电影评论和电影评分分析得到的，因此，这样的电影推荐方式具有一定的主观性，不够全面、准确。实际上，不同的用户可能有不同的观影倾向，例如：有些用户喜欢看科幻片，有些用户喜欢看喜剧片；有些用户喜欢看票价比较便宜的影片，有些用户喜欢在距离家里比较近的影院看电影等。

故，如何向用户全面、准确的推荐电影是亟需解决的技术问题。

发明内容

本发明实施例提供一种电影推荐方法及装置，以向用户全面、准确的推荐电影。

第一方面，本发明实施例提供一种电影推荐方法，包括：

获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；

根据所述当前上映电影的属性信息和所述预设时间段内历史上映电影的属性信息向用户推荐电影。

结合第一方面，在第一方面的第一种可能实施方式中，每部历史上映电影的属性信息包括：每部历史上映电影对应的至少一次历史购票信息，每次历史购票信息包括以下至少一项：所述每部历史上映电影的票价、所述每部历史上映电影的放映时段和放映所述每部历史上映电影的电影院的位置信息；

所述当前上映电影的属性信息包括以下至少一项：所述当前上映电影的票价、所述当前上映电影的放映时段和放映所述当前上映电影的电影院的位置信息；

相应的，所述根据所述当前上映电影的属性信息和所述预设时间段内历史上映电影的属性信息向用户推荐电影，包括：

采用CURE算法将所述至少一次历史购票信息划分为K类历史购票信息，K为大于或者等于1的正整数；

根据所述K类历史购票信息以及所述当前上映电影的属性信息向至少一类历史购票信息对应的用户推荐所述当前上映电影。

结合第一方面的第一种可能实施方式，在第一方面的第二种可能实施方式中，所述根据所述K类历史购票信息以及所述当前上映电影的信息向至少一类历史购票信息对应的用户推荐所述当前上映电影，包括：

针对所述K类历史购票信息中的每类历史购票信息，确定所述每类历史购票信息的平均票价、平均放映时段和电影院的平均位置信息；

计算所述当前上映电影的票价与所述每类历史购票信息的平均票价的第一差值的绝对值、所述当前上映电影的放映时段与所述平均放映时段的第二差值的绝对值、所述当前上映电影的电影院的位置信息与所述电影院的平均位置信息的第三差值的绝对值；

计算所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值的加权平均值；

向所述加权平均值小于第一预设阈值的至少一类历史购票信息对应的用户推荐所述当前上映电影。

结合第一方面的第二种可能实施方式，在第一方面的第三种可能实施方式中，所述计算所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值的加权平均值，包括：

确定所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值分别对应的第一权重、第二权重和第三权重；

根据所述第一权重、所述第二权重和所述第三权重计算所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值的加权平均值。

结合第一方面的第三种可能实施方式，在第一方面的第四种可能实施方式中，所述确定所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值分别对应的第一权重、第二权重和第三权重，包括：

将所述每类历史购票信息中的所有票价对应的购票总次数与所述每类历史购票信息中的票价种类数相除，得到所述每种票价对应的平均购票次数；

将所述每类历史购票信息中的所有放映时段对应的购票总次数与所述每类历史购票信息中的放映时段种类数相除，得到所述每种放映时段对应的平均购票次数；

将所述每类历史购票信息中的所有位置信息对应的购票总次数与所述每类历史购票信息中的位置信息种类数相除，得到所述每种位置信息对应的平均购票次数；

对所述每种票价对应的平均购票次数、所述每种放映时段对应的平均购票次数和所述每种位置信息对应的平均购票次数求和，得到平均购票总次数；

将所述每种票价对应的平均购票次数与所述平均购票总次数相除，得到所述第一权重；

将所述每种放映时段对应的平均购票次数与所述平均购票总次数相除，得到所述第二权重；

将所述每种位置信息对应的平均购票次数与所述平均购票总次数相除，得到所述第三权重。

结合第一方面，在第一方面的第五种可能实施方式中，所述根据所述当前上映电影的属性信息和所述预设时间段内历史上映电影的属性信息向用户推荐电影，包括：

根据所述历史上映电影的属性信息和所述当前上映电影的属性信息计算所述历史上映电影和所述当前上映电影的相似度；

根据所述历史上映电影和所述当前上映电影的相似度以及所述历史上映电影的评分值，计算所述当前上映电影的评分值；

向用户推荐评分值大于第二预设阈值的当前上映电影。

结合第一方面的第五种可能实施方式，在第一方面的第六种可能实施方式中，所述根据所述历史上映电影的属性信息和所述当前上映电影的属性信息计算所述历史上映电影和所述当前上映电影的相似度，包括：

若所述历史上映电影的属性信息与所述当前上映电影的属性信息相同，则确定所述历史上映电影的属性信息对应的属性值为第一数值，否则为第二数值；

根据所述历史上映电影的属性信息对应的属性值构建属性矩阵，所述属性矩阵的每行表示所述当前上映电影的一项属性信息，所述属性矩阵的每列为所述每部历史上映电影的第一属性向量；

对所述属性矩阵进行SVD分解，确定左奇异矩阵的第一列为所述当前上映电影的属性信息对应的权重系数；

将所述当前上映电影的属性信息对应的权重系数与所述每部历史上映电影的第一属性向量相乘，得到所述每部历史上映电影的第二属性向量；

根据所述每部历史上映电影的第二属性向量和所述当前上映电影的属性信息对应的属性向量计算所述每部历史上映电影和所述当前上映电影的相似度。

结合第一方面的第六种可能实施方式，在第一方面的第七种可能实施方式中，所述根据所述每部历史上映电影的第二属性向量和所述当前上映电影的属性信息对应的属性向量计算所述每部历史上映电影和所述当前上映电影的相似度，包括：

通过

计算所述每部历史上映电影和所述当前上映电影的相似度；

其中，

表示每部历史上映电影的第二属性向量，

表示所述当前上映电影的属性信息对应的属性向量，

表示

和

的相似度。

第二方面，本发明实施例提供一种电影推荐装置，包括：

获取模块，用于获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；

推荐模块，用于根据所述当前上映电影的属性信息和所述预设时间段内历史上映电影的属性信息向用户推荐电影。

结合第二方面，在第二方面的第一种可能实施方式中，每部历史上映电影的属性信息包括：所述每部历史上映电影对应的至少一次历史购票信息，每次历史购票信息包括以下至少一项：所述每部历史上映电影的票价、所述每部历史上映电影的放映时段和放映所述每部历史上映电影的电影院的位置信息；

相应的，所述推荐模块包括：

划分子模块，用于采用CURE算法将所述至少一次历史购票信息划分为K类历史购票信息，K为大于或者等于1的正整数；

第一推荐子模块，用于根据所述K类历史购票信息以及所述当前上映电影的属性信息向至少一类历史购票信息对应的用户推荐所述当前上映电影。

结合第二方面的第一种可能实施方式，在第二方面的第二种可能实施方式中，所述第一推荐子模块包括：

第一确定单元，用于针对所述K类历史购票信息中的每类历史购票信息，确定所述每类历史购票信息的平均票价、平均放映时段和电影院的平均位置信息；

第一计算单元，用于计算所述当前上映电影的票价与所述每类历史购票信息的平均票价的第一差值的绝对值、所述当前上映电影的放映时段与所述平均放映时段的第二差值的绝对值、所述当前上映电影的电影院的位置信息与所述电影院的平均位置信息的第三差值的绝对值；

第二计算单元，用于计算所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值的加权平均值；

推荐单元，用于向所述加权平均值小于第一预设阈值的至少一类历史购票信息对应的用户推荐所述当前上映电影。

结合第二方面的第二种可能实施方式，在第二方面的第三种可能实施方式中，所述第二计算单元用于：

结合第二方面的第三种可能实施方式，在第二方面的第四种可能实施方式中，所述第二计算单元具体用于：

结合第二方面，在第二方面的第五种可能实施方式中，所述推荐模块包括：

第一计算子模块，用于根据所述历史上映电影的属性信息和所述当前上映电影的属性信息计算所述历史上映电影和所述当前上映电影的相似度；

第二计算子模块，用于根据所述历史上映电影和所述当前上映电影的相似度以及所述历史上映电影的评分值，计算所述当前上映电影的评分值；

第二推荐子模块，用于向用户推荐评分值大于第二预设阈值的当前上映电影。

结合第二方面的第五种可能实施方式，在第二方面的第六种可能实施方式中，所述第一计算子模块，包括：

第二确定单元，用于若所述历史上映电影的属性信息与所述当前上映电影的属性信息相同，则确定所述历史上映电影的属性信息对应的属性值为第一数值，否则为第二数值；

构建单元，用于根据所述历史上映电影的属性信息对应的属性值构建属性矩阵，所述属性矩阵的每行表示所述当前上映电影的一项属性信息，所述属性矩阵的每列为所述每部历史上映电影的第一属性向量；

分解单元，用于对所述属性矩阵进行SVD分解，确定左奇异矩阵的第一列为所述当前上映电影的属性信息对应的权重系数；

相乘单元，用于将所述当前上映电影的属性信息对应的权重系数与所述每部历史上映电影的第一属性向量相乘，得到所述每部历史上映电影的第二属性向量；

第三计算单元，用于根据所述每部历史上映电影的第二属性向量和所述当前上映电影的属性信息对应的属性向量计算所述每部历史上映电影和所述当前上映电影的相似度。

结合第二方面的第六种可能实施方式，在第二方面的第七种可能实施方式中，所述第三计算单元具体用于：

通过

计算所述每部历史上映电影和所述当前上映电影的相似度；

其中，

表示每部历史上映电影的第二属性向量，

表示所述当前上映电影的属性信息对应的属性向量，

表示

和

的相似度。

本发明实施例提供一种电影推荐方法及装置，该方法包括：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息向用户推荐电影，正是由于根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，才能全面、准确的向用户推荐电影，比如：根据历史上映电影的属性信息确定用户喜欢喜剧片，最终服务器向用户推荐喜剧片，这种方式可以满足用户的个性化需求，以实现全面、准确的向用户推荐电影。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的一种电影推荐方法的流程图；

图2为本发明另一实施例提供的一种电影推荐方法的流程图；

图3为本发明一实施例提供的根据K类历史购票信息以及当前上映电影的信息向至少一类历史购票信息对应的用户推荐当前上映电影的流程图；

图4为本发明一实施例提供的确定第一差值的绝对值、第二差值的绝对值和第三差值的绝对值分别对应的第一权重、第二权重和第三权重的流程图；

图5为本发明再一实施例提供的一种电影推荐方法的流程图；

图6为本发明一实施例提供的根据历史上映电影的属性信息和当前上映电影的属性信息计算历史上映电影和当前上映电影的相似度的流程图；

图7为本发明一实施例提供的一种电影推荐装置的结构示意图；

图8为本发明另一实施例提供的一种电影推荐装置的结构示意图；

图9为本发明一实施例提供的一种第一推荐子模块的结构示意图；

图10为本发明再一实施例提供的一种电影推荐装置的结构示意图；

图11为本发明一实施例提供的第一计算子模块的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决现有技术中所采用的电影推荐方式具有一定的主观性，不够全面、准确的问题。本发明实施例提供一种电影推荐方法及装置。

图1为本发明一实施例提供的一种电影推荐方法的流程图，该方法的执行主体为：电影网站或者影评网站侧的服务器，如图1所示，该方法包括如下流程：

步骤S101：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；

其中，当前上映电影的属性信息可以包括以下至少一项：当前上映电影的票价、当前上映电影的放映时段和放映当前上映电影的电影院的位置信息，除此之外，当前上映电影的属性信息还可以包括：当前上映电影的演员信息、导演信息、制作公司信息等。相应的，历史上映电影的属性信息可以包括以下至少一项：历史上映电影的票价、历史上映电影的放映时段和放映历史上映电影的电影院的位置信息，除此之外，历史上映电影的属性信息还可以包括：历史上映电影的演员信息、导演信息、制作公司信息、电影语言信息、视觉类型等。本发明实施例对当前上映电影的属性信息和历史上映电影的属性信息不做限制。

该预设时间段可以根据实际情况设置，比如：可以设置为10年，1年，半年，甚至3个月等，本发明实施例对此不做限制。

其中，获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，具体方式可以是：当前上映电影的属性信息或者历史上映电影的属性信息都可以被划分为：公开信息和私人信息，公开信息可以是电影网站上所存储的当前上映电影的电影评分和电影评论，以及历史上映电影的电影评分和电影评论，这类公开信息可通过爬虫程序实现，但不仅限于此种实现方式。私人信息收集需要用户授权，当用户授权后，服务器可以获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，

由于当前上映电影的属性信息和预设时间段内历史上映电影的属性信息数量庞大，面对这种大数据分析，本发明实施例采用Hadoop+HBase的大数据平台进行存储。具体地，服务器对获取到的当前上映电影的属性信息和预设时间段内历史上映电影的属性信息进行压缩，并将压缩后的信息存储在Hadoop集群的数据节点上。定时运行MapReduce程序对文件进行解压和解析处理，将数据保存至HBase数据库中，为后续分析提供大数据支撑。

步骤S102：根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息向用户推荐电影。

例如：服务器通过对历史上映电影的属性信息进行分析，确定用户A喜欢看导演B拍的喜剧片，当服务器根据当前上映电影的属性信息确定当前上映电影是导演B拍的喜剧片，则服务器会向用户A推荐当前上映电影；再例如：服务器通过对历史上映电影的属性信息进行分析，确定用户C喜欢看科幻片，并且喜欢在家门口的影院D看电影，当服务器根据当前上映电影的属性信息确定当前上映电影在影院D上映的科幻片，则服务器会向用户C推荐当前上映电影。

其中，服务器可以采用向用户发送邮件、微信、短信或者向用户推送提醒消息等方式向用户推荐电影，本发明实施例对此不做限制。

本发明实施例提供一种电影推荐方法，包括：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息向用户推荐电影，正是由于根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，才能全面、准确的向用户推荐电影，比如：根据历史上映电影的属性信息确定用户喜欢喜剧片，最终服务器向用户推荐喜剧片，这种方式可以满足用户的个性化需求，以实现全面、准确的向用户推荐电影。

基于上一实施例的基础，下面将详细的描述如何根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息向用户推荐电影，本发明将提供两种具体实现方式，但不限于此。

第一种可选方式，每部历史上映电影的属性信息包括：所述每部历史上映电影对应的至少一次历史购票信息，每次历史购票信息包括以下至少一项：所述每部历史上映电影的票价、所述每部历史上映电影的放映时段和放映所述每部历史上映电影的电影院的位置信息；所述当前上映电影的属性信息包括以下至少一项：所述当前上映电影的票价、所述当前上映电影的放映时段和放映所述当前上映电影的电影院的位置信息。

例如：对于历史上映电影A，它对应的一次历史购票信息为：票价为40元，放映时段为14:00-16:00，放映该电影A的电影院的位置信息为X1纬度，Y1经度，当前上映电影的票价为30元、当前上映电影的放映时段为18:00-20:30和放映当前上映电影的电影院的位置信息为X2纬度，Y2经度。

基于上述当前上映电影的属性信息和历史上映电影的属性信息的提出，本发明实施例提供一种电影推荐方法，具体地，图2为本发明另一实施例提供的一种电影推荐方法的流程图，该方法的执行主体为：电影网站或者影评网站侧的服务器，如图2所示，该方法包括如下流程：

步骤S201：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；

其中，步骤S201与步骤S101相同，在此不再赘述。

步骤S202：采用CURE算法将至少一次历史购票信息划分为K类历史购票信息，K为大于或者等于1的正整数；

采用CURE算法将至少一次历史购票信息划分为K类历史购票信息包括第一，将历史购票信息映射至坐标系中的坐标点，坐标轴分别为票价、放映时段和电影院的位置信息，其中该位置信息是一维坐标，因此，如何将二维坐标转换为一维坐标尤为重要。

对位置信息的降维方式包括：首先，假设历史购票信息涉及n个电影院的位置信息，电影院i的位置信息为(x_i,y_i)，其中x_i表示电影院i的经度，y_i表示电影院i的纬度，通过公式：

分别计算经度平均值xave和纬度平均值yave；

其次，令x’_i＝x_i-xave，y’_i＝y_i-yave；

最后，确定电影院i的位置信息为(x_i,y_i)转换的一维坐标z_i通过如下公式计算：z_i＝signal(x’_i)(x’_i)²+signal(y’_i)(y’_i)²，signal(x’_i)表示取x’_i的符号，例如：signal(x’_i)可以是“-”或者“+”，同样的，signal(y’_i)表示取y’_i的符号，signal(y’_i)可以是“-”或者“+”。

第二，根据历史购票信息中的放映时段和电影院的位置信息使用层次聚类方法，对同值对象合并，例如：可以将相同放映时段的电影归为一类，或者将相同位置信息的电影归为一类，聚集得出最初的M个历史购票信息类，M为大于K的正整数，针对每个历史购票信息类中每个历史购票信息，计算该历史购票信息到其他历史购票信息的距离之和，最终在该历史购票信息类中选取所计算的距离最大的N个历史购票信息作为代表点，N个代表点分别为Pr1-PrN计算用户类的质心Pc，计算质心的方式可以采用现有技术。对于任一个代表点，可以通过乘以(1-α)*dist，求得新的合成代表点，其中dist是质心到原代表点的距离，α大于等于0，且小于等于1的数。

第三，扫描历史购票信息类的内的所有点，每个点即为一个历史购票信息，计算待分类点P到每个历史购票信息类中的所有代表点的距离，并对该距离求和，将该求和结果作为待分类点P到该每个历史购票信息类的距离，例如：计算待分类点P到历史购票信息类Q中的所有代表点的距离，并对该距离求和，该求和结果即为待分类点P到历史购票信息类Q的距离。然后，确定与待分类点P距离最近的历史购票信息类，将该待分类点P分入该历史购票信息类中。

经过第二步和第三步之后，已将所有的历史购票信息划分至对应的历史购票信息类中。

第四，计算每两个历史购票信息类的所有代表点间的距离和，取距离和最小的两个历史购票信息类合并，并针对合并后的历史购票信息类计算新的代表点和质心，直至历史购票信息类数目等于K，假设经过第三步之后，得到历史购票信息类分别是：历史购票信息类1，历史购票信息类2，历史购票信息类3，计算历史购票信息类1与历史购票信息类2的所有代表点间的距离和，计算历史购票信息类1与历史购票信息类2的所有代表点间的距离和，历史购票信息类1与历史购票信息类3的所有代表点间的距离和，计算历史购票信息类2与历史购票信息类3的所有代表点间的距离和，最红选择距离和最小的两个类进行合并，假设历史购票信息类1与历史购票信息类2的所有代表点间的距离和最小，则合并历史购票信息类1与历史购票信息类2。

需要说明的是，上述的分类方法不限于CURE算法。

步骤S203：根据K类历史购票信息以及当前上映电影的属性信息向至少一类历史购票信息对应的用户推荐当前上映电影。

具体地，图3为本发明一实施例提供的根据K类历史购票信息以及当前上映电影的信息向至少一类历史购票信息对应的用户推荐当前上映电影的流程图，如图3所示，包括：

步骤S301：针对K类历史购票信息中的每类历史购票信息，确定每类历史购票信息的平均票价、平均放映时段和电影院的平均位置信息；

具体地，采用加权平均法计算每类历史购票信息的平均票价、平均放映时段和电影院的平均位置信息，其中加权平均法涉及的权重可以是根据实际情况设置的，例如：可以设置票价、放映时段和电影院的位置信息对应的权重均为1/3，本发明实施例对此不做限制。

步骤S302：计算当前上映电影的票价与每类历史购票信息的平均票价的第一差值的绝对值、当前上映电影的放映时段与平均放映时段的第二差值的绝对值、当前上映电影的电影院的位置信息与电影院的平均位置信息的第三差值的绝对值；

步骤S303：计算第一差值的绝对值、第二差值的绝对值和第三差值的绝对值的加权平均值；

可选地，计算第一差值的绝对值、第二差值的绝对值和第三差值的绝对值的加权平均值，包括：确定所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值分别对应的第一权重、第二权重和第三权重；根据所述第一权重、所述第二权重和所述第三权重计算所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值的加权平均值。

结合步骤S302和步骤S303进行说明，具体地，可以采用如下公式：计算第一差值的绝对值、第二差值的绝对值和第三差值的绝对值的加权平均值，

其中，F_i表示历史购票信息类i对应的所述加权平均值，P_now表示当前上映电影的票价，

表示历史购票信息类i的平均票价，

表示历史购票信息类i的平均放映时段，

表示历史购票信息类i的平均位置信息，w₁，w₂和w₃分别为第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值分别对应的第一权重、第二权重和第三权重。其中，第一权重、第二权重和第三权重可以根据实际情况预先设定，也可以是通过如下方式计算得到：

可选地，图4为本发明一实施例提供的确定第一差值的绝对值、第二差值的绝对值和第三差值的绝对值分别对应的第一权重、第二权重和第三权重的流程图，如图4所示，包括：

步骤S401：将每类历史购票信息中的所有票价对应的购票总次数与每类历史购票信息中的票价种类数相除，得到每种票价对应的平均购票次数；

例如：每类历史购票信息包括的票价种类分别为：30元，35元，40元，50元，90元，每种票价对应的购票次数分别为：200次，300次，200次，100次，300次，因此，针对该类历史购票信息，所有票价对应的购票总次数为1100次，每种票价对应的平均购票次数分别为1100/5＝220次。

步骤S402：将每类历史购票信息中的所有放映时段对应的购票总次数与每类历史购票信息中的放映时段种类数相除，得到每种放映时段对应的平均购票次数；

例如：每类历史购票信息包括的放映时段分别为：10:00-12：00，11:00-13：00，13:00-15：00，14:00-16：00，每个放映时段对应的购票次数分别为：200次，300次，200次，100次，因此，针对该类历史购票信息，所有放映时段对应的购票总次数为800次，每个放映时段对应的平均购票次数分别为800/4＝200次。

步骤S403：将每类历史购票信息中的所有位置信息对应的购票总次数与每类历史购票信息中的位置信息种类数相除，得到每种位置信息对应的平均购票次数；

例如：每类历史购票信息包括的位置信息分别为：(x₁,y₁)，(x₂,y₂)，(x₃,y₃)，(x₄,y₄)，每个位置信息对应的购票次数分别为：200次，300次，200次，200次，因此，针对该类历史购票信息，所有位置信息对应的购票总次数为900次，每个位置信息对应的平均购票次数分别为900/4＝225次。

步骤S404：对每种票价对应的平均购票次数、每种放映时段对应的平均购票次数和每种位置信息对应的平均购票次数求和，得到平均购票总次数；

步骤S405：将每种票价对应的平均购票次数与平均购票总次数相除，得到第一权重；

步骤S406：将每种放映时段对应的平均购票次数与平均购票总次数相除，得到第二权重；

步骤S407：将每种位置信息对应的平均购票次数与平均购票总次数相除，得到第三权重。

具体地，结合步骤S404至步骤S407进行说明：接着上述的例子，对每种票价对应的平均购票次数、每种放映时段对应的平均购票次数和每种位置信息对应的平均购票次数求和，得到平均购票总次数为220次+200次+225次＝645次，因此，第一权重w₁＝220/645，第二权重w₂＝200/645，第三权重w₃＝225/645。

步骤S304：向加权平均值小于第一预设阈值的至少一类历史购票信息对应的用户推荐当前上映电影。

该第一预设阈值可以根据实际情况设置，假设历史购票信息类1的加权平均值小于第一预设值，则将该当前上映电影推荐给历史购票信息类1对应的用户。

可选地，在向用户推荐当前上映电影时，还可以考虑每个历史购票信息类对应的用户的偏好信息，用户的偏好可以是每次购买两个票或者一张票，偏好为喜欢看3D电影等。

本发明实施例提供一种电影推荐方法，包括：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息，采用CURE算法将至少一次历史购票信息划分为K类历史购票信息，根据K类历史购票信息以及当前上映电影的属性信息向至少一类历史购票信息对应的用户推荐当前上映电影，也就是说，服务器可以根据用户的历史数据为用户推荐当前上映电影，例如：根据用户对票价的倾向，放映时段的倾向以及电影院位置信息的倾向等，因此，这种方式可以满足用户的个性化需求，以实现全面、准确的向用户推荐电影。

基于图1对应实施例的基础，下面将详细介绍如何根据当前上映电影的属性信息和预设时间段内历史上映电影的属性信息向用户推荐电影的第二种可选方式。

图5为本发明再一实施例提供的一种电影推荐方法的流程图，该方法的执行主体为：电影网站或者影评网站侧的服务器，如图5所示，该方法包括如下流程：

步骤S501：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；

其中，步骤S501与步骤S101相同，在此不再赘述。

步骤S502：根据历史上映电影的属性信息和当前上映电影的属性信息计算历史上映电影和当前上映电影的相似度；

其中，历史上映电影的属性信息可以被量化为向量，该向量的每个分量表示历史上映电影的一个属性信息，同样当前上映电影的属性信息也可以被量化为向量，该向量的每个分量表示当前上映电影的一个属性信息。因此，所谓根据历史上映电影的属性信息和当前上映电影的属性信息计算历史上映电影和当前上映电影的相似度，也就是计算两个向量的相似度。

步骤S503：根据历史上映电影和当前上映电影的相似度以及历史上映电影的评分值，计算当前上映电影的评分值；

例如：假设历史上映电影A与当前上映电影的相似度最高，则将历史上映电影A的评分值作为当前上映电影的评分值；或者，历史上映电影A和历史上映电影A分别为与当前上映电影的相似度最高的两部电影，则将历史上映电影A的评分值和历史上映电影B的评分值的平均值作为当前上映电影的评分值。本发明实施例对此不做限制。

步骤S504：向用户推荐评分值大于第二预设阈值的当前上映电影。

其中，该第二预设阈值可以根据实际情况设置，本发明实施例对此不做限制。

本发明实施例提供一种电影推荐方法，包括：获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；根据历史上映电影的属性信息和当前上映电影的属性信息计算历史上映电影和当前上映电影的相似度；根据历史上映电影和当前上映电影的相似度以及历史上映电影的评分值，计算当前上映电影的评分值；向用户推荐评分值大于第二预设阈值的当前上映电影，以实现全面、准确的向用户推荐电影。

图6为本发明一实施例提供的根据历史上映电影的属性信息和当前上映电影的属性信息计算历史上映电影和当前上映电影的相似度的流程图，该方法的执行主体为：电影网站或者影评网站侧的服务器，如图6所示，该方法包括如下流程：

步骤S601：若历史上映电影的属性信息与当前上映电影的属性信息相同，则确定历史上映电影的属性信息对应的属性值为第一数值，否则为第二数值；

步骤S602：根据历史上映电影的属性信息对应的属性值构建属性矩阵，该属性矩阵的每行表示当前上映电影的一项属性信息，该属性矩阵的每列为每部历史上映电影的第一属性向量；

结合步骤S601和步骤S602进行说明：该第一数值可以是1，第二数值可以是0，假设当前上映电影的属性信息包括：导演A，制片人B，编剧C，男演员D，男演员E，男演员F，男演员G，女演员H，女演员I，女演员J，女演员K，历史上映电影总共为11部，分别为T1-T11，当历史上映电影的属性信息与当前上映电影的属性信息相同，则确定历史上映电影的属性信息对应的属性值为1，否则为0，根据历史上映电影的属性信息对应的属性值构建属性矩阵，例如该属性矩阵为：

步骤S603：对属性矩阵进行SVD分解，确定左奇异矩阵的第一列为当前上映电影的属性信息对应的权重系数；

“＝”左侧第一个矩阵即为左奇异矩阵，左奇异矩阵的第一列为当前上映电影的属性信息对应的权重系数。

步骤S604：将当前上映电影的属性信息对应的权重系数与每部历史上映电影的第一属性向量相乘，得到每部历史上映电影的第二属性向量；

也就是说，属性矩阵的每一列乘以权重系数，可以得到每部历史上映电影的第二属性向量。

步骤S605：根据每部历史上映电影的第二属性向量和当前上映电影的属性信息对应的属性向量计算每部历史上映电影和当前上映电影的相似度。

可选地，所述根据所述每部历史上映电影的第二属性向量和所述当前上映电影的属性信息对应的属性向量计算所述每部历史上映电影和所述当前上映电影的相似度，包括：

通过

计算所述每部历史上映电影和所述当前上映电影的相似度；

其中，

表示每部历史上映电影的第二属性向量，

表示所述当前上映电影的属性信息对应的属性向量，

表示

和

的相似度，

表示求向量

的长度，

表示求向量

的长度。

当然，确定相似度的方法还可以是比较两个向量的每个分量，当历史上映电影的M(M为大于或者等于1的正整数)个分量与当前上映电影对应的M个分量的差值的绝对值都小于预设阈值Y1，则确定相似度为P1，同样的，当历史上映电影的M个分量与当前上映电影对应的M个分量的差值的绝对值都小于预设阈值Y2，大于预设阈值Y1，则确定相似度为P2。

需要说明的是，本发明实施例对求解两个向量的相似度方法不做限制。

本发明实施例中，提供了根据历史上映电影的属性信息和当前上映电影的属性信息计算历史上映电影和当前上映电影的相似度的方法，通过相似度的确定，根据历史上映电影和当前上映电影的相似度以及历史上映电影的评分值，计算当前上映电影的评分值，向用户推荐评分值大于第二预设阈值的当前上映电影，以实现全面、准确的向用户推荐电影。

图7为本发明一实施例提供的一种电影推荐装置的结构示意图，如图7所示，该装置包括：获取模块71，用于获取当前上映电影的属性信息和预设时间段内历史上映电影的属性信息；

推荐模块72，用于根据所述当前上映电影的属性信息和所述预设时间段内历史上映电影的属性信息向用户推荐电影。

本发明实施例提供的电影推荐装置，可用于执行图1对应实施例的方法步骤，在此不再赘述。

可选地，图8为本发明另一实施例提供的一种电影推荐装置的结构示意图，如图8所示，每部历史上映电影的属性信息包括：所述每部历史上映电影对应的至少一次历史购票信息，每次历史购票信息包括以下至少一项：所述每部历史上映电影的票价、所述每部历史上映电影的放映时段和放映所述每部历史上映电影的电影院的位置信息。

所述当前上映电影的属性信息包括以下至少一项：所述当前上映电影的票价、所述当前上映电影的放映时段和放映所述当前上映电影的电影院的位置信息。

相应的，所述推荐模块72包括：划分子模块721，用于采用CURE算法将所述至少一次历史购票信息划分为K类历史购票信息，K为大于或者等于1的正整数；

第一推荐子模块722，用于根据所述K类历史购票信息以及所述当前上映电影的属性信息向至少一类历史购票信息对应的用户推荐所述当前上映电影。

图9为本发明一实施例提供的一种第一推荐子模块的结构示意图，如图9所示，所述第一推荐子模块722包括：第一确定单元7221，用于针对所述K类历史购票信息中的每类历史购票信息，确定所述每类历史购票信息的平均票价、平均放映时段和电影院的平均位置信息；

第一计算单元7222，用于计算所述当前上映电影的票价与所述每类历史购票信息的平均票价的第一差值的绝对值、所述当前上映电影的放映时段与所述平均放映时段的第二差值的绝对值、所述当前上映电影的电影院的位置信息与所述电影院的平均位置信息的第三差值的绝对值；

第二计算单元7223，用于计算所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值的加权平均值；

推荐单元7224，用于向所述加权平均值小于第一预设阈值的至少一类历史购票信息对应的用户推荐所述当前上映电影。

可选地，所述第二计算单元7223用于：确定所述第一差值的绝对值、所述第二差值的绝对值和所述第三差值的绝对值分别对应的第一权重、第二权重和第三权重；

可选地，所述第二计算单元7223具体用于：将所述每类历史购票信息中的所有票价对应的购票总次数与所述每类历史购票信息中的票价种类数相除，得到所述每种票价对应的平均购票次数；

本发明实施例提供的电影推荐装置，可用于执行图1、图2、图3和图4对应实施例的方法步骤，在此不再赘述。

可选地，图10为本发明再一实施例提供的一种电影推荐装置的结构示意图，如图10所示，推荐模块72包括：第一计算子模块723，用于根据所述历史上映电影的属性信息和所述当前上映电影的属性信息计算所述历史上映电影和所述当前上映电影的相似度；

第二计算子模块724，用于根据所述历史上映电影和所述当前上映电影的相似度以及所述历史上映电影的评分值，计算所述当前上映电影的评分值；

第二推荐子模块725，用于向用户推荐评分值大于第二预设阈值的当前上映电影。

本发明实施例提供的电影推荐装置，可用于执行图5对应实施例的方法步骤，在此不再赘述。

可选地，图11为本发明一实施例提供的第一计算子模块的结构示意图，如图11所示，所述第一计算子模块723，包括：第二确定单元7231，用于若所述历史上映电影的属性信息与所述当前上映电影的属性信息相同，则确定所述历史上映电影的属性信息对应的属性值为第一数值，否则为第二数值；

构建单元7232，用于根据所述历史上映电影的属性信息对应的属性值构建属性矩阵，所述属性矩阵的每行表示所述当前上映电影的一项属性信息，所述属性矩阵的每列为所述每部历史上映电影的第一属性向量；

分解单元7233，用于对所述属性矩阵进行SVD分解，确定左奇异矩阵的第一列为所述当前上映电影的属性信息对应的权重系数；

相乘单元7234，用于将所述当前上映电影的属性信息对应的权重系数与所述每部历史上映电影的第一属性向量相乘，得到所述每部历史上映电影的第二属性向量；

第三计算单元7235，用于根据所述每部历史上映电影的第二属性向量和所述当前上映电影的属性信息对应的属性向量计算所述每部历史上映电影和所述当前上映电影的相似度。

可选地，所述第三计算单元7235具体用于：

通过

计算所述每部历史上映电影和所述当前上映电影的相似度；

其中，

表示每部历史上映电影的第二属性向量，

表示所述当前上映电影的属性信息对应的属性向量，

表示

和

的相似度。

本发明实施例提供的电影推荐装置，可用于执行图6对应实施例的方法步骤，在此不再赘述。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。