CN116644240B

CN116644240B - 一种基于数据处理的图书专业书籍智能推荐方法

Info

Publication number: CN116644240B
Application number: CN202310926362.2A
Authority: CN
Inventors: 齐书稳; 付鹏; 罗庚; 韩阳; 王殿武; 周彦彬; 张文超; 潘恒; 张珂
Original assignee: Citic United Cloud Technology Co ltd
Current assignee: Citic United Cloud Technology Co ltd
Priority date: 2023-07-27
Filing date: 2023-07-27
Publication date: 2024-01-26
Anticipated expiration: 2043-07-27
Also published as: CN116644240A

Abstract

本发明涉及数据处理领域，公开了一种基于数据处理的图书专业书籍智能推荐方法，包括：获取多个样本用户的相关信息及感兴趣书籍信息；对多个样本用户进行聚类，确定多个用户聚类簇及每个用户聚类簇对应的用户聚类画像；对多本候选书籍进行聚类，确定多个书籍总聚类簇及书籍总聚类簇画像；对每个书籍总聚类簇包括的多本候选书籍进行二次聚类，确定每个书籍总聚类簇包括的多个书籍子聚类簇及书籍子聚类簇画像；基于多个样本用户的感兴趣书籍信息，建立关系图谱；基于用户问卷调查的反馈及关系图谱，从多本候选书籍中的至少一本目标推荐书籍，将至少一本目标推荐书籍的相关信息发送至待推荐用户端，具有更加准确地为用户推荐书籍的优点。

Description

一种基于数据处理的图书专业书籍智能推荐方法

技术领域

本发明涉及数据处理领域，特别涉及一种基于数据处理的图书专业书籍智能推荐方法。

背景技术

书籍阅读平台通常会为用户进行书籍推荐。现有技术中，根据书籍推荐场景不同的业务需求会采用不同的书籍推荐模型来确定待推荐书籍。每个书籍推荐方法通常是以单一维度的信息进行推荐的。例如，某个书籍推荐方法以点击率进行推荐，按照书籍的点击率的高低推荐给用户。所推荐的目标书籍与用户匹配度较低。

因此，需要提供一种基于数据处理的图书专业书籍智能推荐方法，用于更加准确地为用户推荐书籍。

发明内容

本说明书实施例之一提供一种基于数据处理的图书专业书籍智能推荐方法，所述方法包括：获取多个样本用户的相关信息及感兴趣书籍信息；基于所述多个样本用户的相关信息对所述多个样本用户进行聚类，确定多个用户聚类簇及每个所述用户聚类簇对应的用户聚类画像；对多本候选书籍进行聚类，确定多个书籍总聚类簇，并建立每个所述书籍总聚类簇的书籍总聚类簇画像；对每个所述书籍总聚类簇包括的多本候选书籍进行二次聚类，确定每个所述书籍总聚类簇包括的多个书籍子聚类簇，并建立每个所述书籍子聚类簇的书籍子聚类簇画像；基于多个所述样本用户的感兴趣书籍信息，建立关系图谱，其中，所述关系图谱包括每个所述书籍总聚类簇对应的节点及每个所述用户聚类簇对应的节点；获取待推荐用户端对用户问卷调查的反馈；基于待推荐用户端对用户问卷调查的反馈及所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍，将所述至少一本目标推荐书籍的相关信息发送至所述待推荐用户端。

在一些实施例中，所述样本用户的相关信息至少包括年龄信息、学历信息、专业技能信息及兴趣爱好信息；所述基于所述多个样本用户的相关信息对所述多个样本用户进行聚类，确定多个用户聚类簇及每个所述用户聚类簇对应的用户聚类画像，包括：对于任意两个所述样本用户，计算两个所述样本用户的相关信息之间的信息相似度；通过k-means聚类算法基于两个所述样本用户的相关信息之间的信息相似度，对所述多个样本用户进行聚类，确定所述多个用户聚类簇；对于每个所述用户聚类簇，基于所述用户聚类簇的聚类中心对应的样本用户的相关信息建立所述用户聚类簇对应的用户聚类画像。

在一些实施例中，所述对多本候选书籍进行聚类，确定多个书籍总聚类簇，并建立每个所述书籍总聚类簇的书籍总聚类簇画像，包括：获取每本所述候选书籍所属的专业应用场景；对于任意两本所述候选书籍，基于两本所述候选书籍所属的专业应用场景，确定两本所述候选书籍的关联度；通过k-means聚类算法基于两本所述候选书籍的关联度，对所述多本候选书籍进行聚类，确定所述多个书籍总聚类簇；对于每个所述书籍总聚类簇，基于所述书籍总聚类簇的聚类中心对应的专业应用场景建立所述书籍总聚类簇对应的书籍总聚类簇画像。

在一些实施例中，所述对于任意两本所述候选书籍，基于两本所述候选书籍所属的专业应用场景，确定两本所述候选书籍的关联度，包括：对于两本所述候选书籍中的一本，获取所述候选书籍所属的专业应用场景对应的多个历史购买用户；对于每个所述历史购买用户，获取所述历史购买用户的历史购买记录；基于所述历史购买用户的历史购买记录，确定两本所述候选书籍中的另一本所属的专业应用场景与所述候选书籍所属的专业应用场景之间的关联度。

在一些实施例中，所述对每个所述书籍总聚类簇包括的多本候选书籍进行二次聚类，确定每个所述书籍总聚类簇包括的多个书籍子聚类簇，并建立每个所述书籍子聚类簇的书籍子聚类簇画像，包括：对于每个所述书籍总聚类簇，获取所述书籍总聚类簇包括的每本所述候选书籍的关键词；对于任意两本所述候选书籍，计算两本所述候选书籍的关键词相似度；通过k-means聚类算法基于两本所述候选书籍的关键词相似度，对所述书籍总聚类簇包括的多本所述候选书籍进行聚类，确定所述多个书籍子聚类簇；对于每个所述书籍子聚类簇，基于所述书籍子聚类簇的聚类中心对应的候选书籍的关键词建立所述书籍子聚类簇对应的书籍子聚类簇画像。

在一些实施例中，所述基于待推荐用户端对用户问卷调查的反馈及所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍，包括：基于所述待推荐用户端对用户问卷调查的反馈，确定书籍关键词并建立所述待推荐用户端对应的用户画像；计算所述待推荐用户端对应的用户画像与每个所述用户聚类画像之间的用户画像相似度，基于所述用户画像相似度判断所述多个用户聚类簇中是否存在至少一个目标用户聚类簇；当判断所述多个用户聚类簇中存在所述至少一个目标用户聚类簇时，基于所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍；当判断所述多个用户聚类簇中不存在所述目标用户聚类簇时，基于所述书籍关键词建立待推荐书籍画像，并基于所述待推荐书籍画像与每个所述书籍子聚类簇画像之间的第一书籍画像相似度，确定所述多本候选书籍中的至少一本目标推荐书籍。

在一些实施例中，所述基于所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍，包括：对于每个所述目标用户聚类簇，基于所述关系图谱，确定与所述目标用户聚类簇关联的书籍总聚类簇；对于每个与所述目标用户聚类簇关联的书籍总聚类簇，基于所述书籍关键词建立待推荐书籍画像，并计算所述待推荐书籍画像及与所述书籍总聚类簇包括的每个书籍子聚类簇之间的第二书籍画像相似度；基于所述第二书籍画像相似度，确定所述多本候选书籍中的至少一本目标推荐书籍。

在一些实施例中，所述方法还包括：获取所述待推荐用户端对所述至少一本目标推荐书籍的相关信息的操作信息，更新所述至少一本目标推荐书籍，并将更新后的所述至少一本目标推荐书籍的相关信息发送至所述待推荐用户端。

在一些实施例中，所述待推荐用户端对所述至少一本目标推荐书籍的相关信息的操作信息至少包括点击信息、浏览停留时间及感兴趣度反馈信息。

在一些实施例中，所述方法还包括：基于所述待推荐用户端对用户问卷调查的反馈及所述待推荐用户端对应的至少一本目标推荐书籍，更新所述关系图谱。

相比于现有技术，本说明书提供的一种基于数据处理的图书专业书籍智能推荐方法，至少具备以下有益效果：

1、通过多个样本用户的相关信息及感兴趣书籍信息，预先建立多个用户聚类簇及每个所述用户聚类簇对应的用户聚类画像，并预先建立多个书籍总聚类簇的书籍总聚类簇画像和多个书籍子聚类簇及书籍子聚类簇画像，便于在后续自动生成推荐列表时，可以快速基于样本用户的感兴趣书籍信息确定至少一本目标推荐书籍，从多维角度对用户的书籍需求进行分析，从而匹配更适配的推荐书籍，提供了用户体验；

2、获取待推荐用户端对所述至少一本目标推荐书籍的相关信息的操作信息，更新至少一本目标推荐书籍，可以实时根据用户的操作信息，及时对推荐给用户的书籍进行调整，灵活度更高。

附图说明

本说明书将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书一些实施例所示的基于数据处理的图书专业书籍智能推荐方法的流程示意图；

图2是根据本说明书一些实施例所示的关系图谱的示意图；

图3是根据本说明书一些实施例所示的从多本候选书籍中的至少一本目标推荐书籍的流程示意图；

图4是根据本说明书一些实施例所示的建立多个书籍子聚类簇的流程示意图；

图5是根据本说明书一些实施例所示的电子设备的结构框图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。

图1是根据本说明书一些实施例所示的基于数据处理的图书专业书籍智能推荐方法的流程示意图。如图1所示，基于数据处理的图书专业书籍智能推荐方法可以包括以下流程。

S110，获取多个样本用户的相关信息及感兴趣书籍信息。

样本用户的相关信息至少包括年龄信息、学历信息、专业技能信息（例如，工作岗位、已获得的专业技能证书等）及兴趣爱好信息。

感兴趣书籍信息可以为样本用户已经阅读或期望阅读的书籍。

S120，基于多个样本用户的相关信息对多个样本用户进行聚类，确定多个用户聚类簇及每个用户聚类簇对应的用户聚类画像。

在一些实施例中，对于任意两个样本用户，计算两个样本用户的相关信息之间的信息相似度；通过k-means聚类算法基于两个样本用户的相关信息之间的信息相似度，对多个样本用户进行聚类，确定多个用户聚类簇；对于每个用户聚类簇，基于用户聚类簇的聚类中心对应的样本用户的相关信息建立用户聚类簇对应的用户聚类画像。

具体的，可以通过以下方式计算两个样本用户的相关信息之间的信息相似度：

基于两个样本用户的年龄信息，计算该两个样本用户之间的年龄差值绝对值；

基于两个样本用户的学历信息，计算该两个样本用户之间的学历差值绝对值；

基于两个样本用户的专业技能信息，计算该两个样本用户之间的专业技能余弦相似度；

基于两个样本用户的兴趣爱好信息，计算该两个样本用户之间的兴趣爱好余弦相似度；

基于该两个样本用户之间的年龄差值绝对值、学历差值绝对值、专业技能余弦相似度及兴趣爱好余弦相似度，计算两个样本用户的相关信息之间的信息相似度。

仅作为示例，可以基于以下公式计算两个样本用户的相关信息之间的信息相似度：

其中，、/>、/>及/>均为预设权重，/>及/>均为预设参数，/>为年龄差值绝对值，/>为学历差值绝对值，/>为专业技能余弦相似度，/>为兴趣爱好余弦相似度。

S130，对多本候选书籍进行聚类，确定多个书籍总聚类簇，并建立每个书籍总聚类簇的书籍总聚类簇画像。

图4是根据本说明书一些实施例所示的建立多个书籍子聚类簇的流程示意图，如图4所示，在一些实施例中，可以获取每本候选书籍所属的专业应用场景；对于任意两本候选书籍，基于两本候选书籍所属的专业应用场景，确定两本候选书籍的关联度；通过k-means聚类算法基于两本候选书籍的关联度，对多本候选书籍进行聚类，确定多个书籍总聚类簇；对于每个书籍总聚类簇，基于书籍总聚类簇的聚类中心对应的专业应用场景建立书籍总聚类簇对应的书籍总聚类簇画像。

在一些实施例中，对于任意两本候选书籍，基于两本候选书籍所属的专业应用场景，确定两本候选书籍的关联度，包括：对于两本候选书籍中的一本，获取候选书籍所属的专业应用场景对应的多个历史购买用户，其中，历史购买用户可以为曾经购买过与该候选书籍所属的专业应用场景一致的书籍的用户；对于每个历史购买用户，获取历史购买用户的历史购买记录；基于历史购买用户的历史购买记录，确定两本候选书籍中的另一本所属的专业应用场景与候选书籍所属的专业应用场景之间的关联度。

具体的，对于每个历史购买用户，基于历史购买用户的历史购买记录，确定该用户中每种专业应用场景包括的书籍的数量，基于每个历史购买用户购买过的每种专业应用场景包括的书籍的数量，确定两本候选书籍中的另一本所属的专业应用场景与候选书籍所属的专业应用场景之间的关联度。

仅作为示例，可以基于以下公式计算两本候选书籍中的另一本所属的专业应用场景与候选书籍所属的专业应用场景之间的关联度：

其中，为两本候选书籍中的另一本所属的专业应用场景与候选书籍所属的专业应用场景之间的关联度，n为取候选书籍所属的专业应用场景对应的多个历史购买用户的总数，/>为第k个历史购买用户对应的权重，/>的值可以基于第k个历史购买用户的购买过的书籍的数量确定，例如，第k个历史购买用户的购买过的书籍的数量越大，则/>的值越大，/>为第k个历史购买用户的购买过的书籍中两本候选书籍中的另一本所属的专业应用场景包括的书籍的总数，/>为第k个历史购买用户的购买过的书籍的总数。

S140，对每个书籍总聚类簇包括的多本候选书籍进行二次聚类，确定每个书籍总聚类簇包括的多个书籍子聚类簇，并建立每个书籍子聚类簇的书籍子聚类簇画像。

如图4所示，在一些实施例中，对于每个书籍总聚类簇，获取书籍总聚类簇包括的每本候选书籍的关键词；对于任意两本候选书籍，计算两本候选书籍的关键词相似度；通过k-means聚类算法基于两本候选书籍的关键词相似度，对书籍总聚类簇包括的多本候选书籍进行聚类，确定多个书籍子聚类簇；对于每个书籍子聚类簇，基于书籍子聚类簇的聚类中心对应的候选书籍的关键词建立书籍子聚类簇对应的书籍子聚类簇画像。

S150，基于多个样本用户的感兴趣书籍信息，建立关系图谱。

图2是根据本说明书一些实施例所示的关系图谱的示意图，如图2所示，关系图谱包括每个书籍总聚类簇对应的节点及每个用户聚类簇对应的节点。

具体的，可以基于多个样本用户的感兴趣书籍信息，确定用户聚类簇与书籍总聚类簇之间的关联关系。例如，对于每个用户聚类簇，基于该用户聚类簇包括的样本用户的感兴趣书籍信息，确定该用户聚类簇包括的样本用户中对某个书籍总聚类簇所属的专业应用场景感兴趣的用户（也可称为感兴趣用户），基于感兴趣用户占用户聚类簇包括的样本用户的比例，判断用户聚类簇与书籍总聚类簇之间是否存在关联关系。仅作为示例，当某个书籍总聚类簇所属的专业应用场景对应的感兴趣用户占用户聚类簇包括的样本用户的比例大于预设比例阈值（例如，50%）时，该用户聚类簇与书籍总聚类簇之间存在关联关系。用户聚类簇与书籍总聚类簇之间存在关联关系时，关系图谱上用户聚类簇对应的节点与书籍总聚类簇之间对应的节点之间可以通过边连接。

S160，获取待推荐用户端对用户问卷调查的反馈。

用户问卷调查用于获取与待推荐用户端的使用者的基本信息、专业背景及感兴趣书籍类型相关的信息。例如，用户问卷调查可以包括用于获取待推荐用户端的使用者的年龄信息的选择题、用于获取待推荐用户端的使用者的学历信息的选择题、用于获取待推荐用户端的使用者的专业技能信息的选择题以及供用户选择的多个书籍关键词。

S170，基于待推荐用户端对用户问卷调查的反馈及关系图谱，确定多本候选书籍中的至少一本目标推荐书籍，将至少一本目标推荐书籍的相关信息发送至待推荐用户端。

图3是根据本说明书一些实施例所示的从多本候选书籍中的至少一本目标推荐书籍的流程示意图，如图3所示，在一些实施例中，可以基于待推荐用户端对用户问卷调查的反馈，确定书籍关键词并建立待推荐用户端对应的用户画像；计算待推荐用户端对应的用户画像与每个用户聚类画像之间的用户画像相似度，基于用户画像相似度判断多个用户聚类簇中是否存在至少一个目标用户聚类簇；当判断多个用户聚类簇中存在至少一个目标用户聚类簇时，基于关系图谱，从多本候选书籍中的至少一本目标推荐书籍；当判断多个用户聚类簇中不存在目标用户聚类簇时，基于书籍关键词建立待推荐书籍画像，并基于待推荐书籍画像与每个书籍子聚类簇画像之间的第一书籍画像相似度，从多本候选书籍中的至少一本目标推荐书籍，例如，可以将第一书籍画像相似度大于预设书籍画像相似度阈值的书籍子聚类簇（也可称为第一关联书籍子聚类簇）包括的候选书籍中选择至少一部分作为目标推荐书籍。

可以理解的，当存在与待推荐用户端对应的用户画像相似的用户聚类簇时，可以基于关系图谱，确定该用户聚类簇关联的书籍总聚类簇中确定至少一本目标推荐书籍，能够较为准确地在更小的范围内确定目标推荐书籍，在保证推荐书籍的匹配度的同时，提高了效率。

在一些实施例中，可以按照第一书籍画像相似度从大到小对至少一本目标推荐书籍进行优先级排序。

在一些实施例中，基于关系图谱，从多本候选书籍中的至少一本目标推荐书籍，包括：对于每个目标用户聚类簇，基于关系图谱，确定与目标用户聚类簇关联的书籍总聚类簇；对于每个与目标用户聚类簇关联的书籍总聚类簇，基于书籍关键词建立待推荐书籍画像，并计算待推荐书籍画像及与书籍总聚类簇包括的每个书籍子聚类簇之间的第二书籍画像相似度；基于第二书籍画像相似度，从多本候选书籍中的至少一本目标推荐书籍。例如，可以将第二书籍画像相似度大于预设书籍画像相似度阈值的书籍子聚类簇（也可称为第二关联书籍子聚类簇）包括的候选书籍中选择至少一部分作为目标推荐书籍。

在一些实施例中，可以按照第二书籍画像相似度从大到小对至少一本目标推荐书籍进行优先级排序。

在一些实施例中，基于数据处理的图书专业书籍智能推荐方法还可以包括S180，获取待推荐用户端对至少一本目标推荐书籍的相关信息的操作信息，更新至少一本目标推荐书籍，并将更新后的至少一本目标推荐书籍的相关信息发送至待推荐用户端。

在一些实施例中，待推荐用户端对至少一本目标推荐书籍的相关信息的操作信息可以至少包括点击信息、浏览停留时间及感兴趣度反馈信息。

具体的，确定多本候选书籍中的至少一本目标推荐书籍后，可以基于至少一本目标推荐书籍生成推荐页面，并将该推荐页面发送至待推荐用户端，其中，推荐页面可以包括每本目标推荐书籍的名称、专业应用场景及关键词，使用该待推荐用户端的用户可以点击目标推荐书籍的名称，以获取该目标推荐书籍的内容简介。

其中，点击信息可以包括目标推荐书籍是否被该待推荐用户端的用户点击及被点击次数，浏览停留时间可以为该待推荐用户端的用户点击目标推荐书籍的名称后获取该目标推荐书籍的内容简介，在显示该目标推荐书籍的内容简介的页面的停留时间，对于每个目标推荐书籍，推荐页面还设置有感兴趣度反馈选项（例如“感兴趣选项”及“不感兴趣选项”），该待推荐用户端的用户可以点击感兴趣度反馈选项，反馈对该目标推荐书籍是否感兴趣。

在一些实施例中，可以根据待推荐用户端对至少一本目标推荐书籍的相关信息的操作信息，更新第一关联书籍子聚类簇或第二关联书籍子聚类簇的推荐优先级，至少一本目标推荐书籍。

例如，可以基于以下公式更新关联书籍子聚类簇的推荐优先级：

其中，为更新后的第i个关联书籍子聚类簇的优先级，/>为基于第一书籍画像相似度或第二书籍画像相似度确定的第i个关联书籍子聚类簇的优先级，m为目标推荐书籍中归属第i个关联书籍子聚类簇的书籍的总数，/>、/>、/>及/>为预设权重参数，/>为第i个关联书籍子聚类簇中第j本书籍对应的归一化后的点击信息，/>为第i个关联书籍子聚类簇中第j本书籍对应的归一化后的浏览停留时间，/>为第i个关联书籍子聚类簇中第j本书籍对应的归一化后的感兴趣度反馈信息。

在一些实施例中，基于数据处理的图书专业书籍智能推荐方法还可以包括S190，基于待推荐用户端对用户问卷调查的反馈及待推荐用户端对应的至少一本目标推荐书籍，更新关系图谱。

具体的，可以将使用该待推荐用户端的用户作为待添加样本用户，基于待推荐用户端对用户问卷调查的反馈及待推荐用户端对应的至少一本目标推荐书籍生成该待添加样本用户的相关信息及感兴趣书籍信息。当待添加样本用户的总数大于预设待添加样本用户总数阈值时，可以对已聚类的样本用户和待添加样本用户重新进行聚类，以更新多个用户聚类簇，并建立更新后的多个用户聚类簇与多个书籍总聚类簇之间的关联关系，以更新关系图谱。

图5是根据本说明书一些实施例所示的电子设备的结构框图，如图5所示，其是可以应用于本发明的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图5所示，电子设备包括计算单元，其可以根据存储在只读存储器（ROM）中的计算机程序或者从存储单元加载到随机访问存储器（RAM）中的计算机程序，来执行各种适当的动作和处理。在RAM中，还可存储设备操作所需的各种程序和数据。计算单元、ROM以及RAM通过总线彼此相连。输入/输出（I/O）接口也连接至总线。

电子设备中的多个部件连接至I/O接口，包括：输入单元、输出单元、存储单元以及通信单元。输入单元可以是能向电子设备输入信息的任何类型的设备，输入单元可以接收输入的数字或字符信息，以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元可以包括但不限于磁盘、光盘。通信单元允许电子设备通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算单元可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元的一些示例包括但不限于中央处理单元（CPU）、图形处理单元（GPU）、各种专用的人工智能（AI）计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器（DSP）、以及任何适当的处理器、控制器、微控制器等。计算单元执行上文所描述的各个方法和处理。例如，在一些实施例中，基于数据处理的图书专业书籍智能推荐方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元。在一些实施例中，计算机程序的部分或者全部可以经由ROM和/或通信单元而被载入和/或安装到电子设备上。在一些实施例中，计算单元可以通过其他任何适当的方式（例如，借助于固件）而被配置为执行基于数据处理的图书专业书籍智能推荐方法。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种基于数据处理的图书专业书籍智能推荐方法，其特征在于，包括：

获取多个样本用户的相关信息及感兴趣书籍信息；

基于所述多个样本用户的相关信息对所述多个样本用户进行聚类，确定多个用户聚类簇及每个所述用户聚类簇对应的用户聚类画像；

对多本候选书籍进行聚类，确定多个书籍总聚类簇，并建立每个所述书籍总聚类簇的书籍总聚类簇画像；

对每个所述书籍总聚类簇包括的多本候选书籍进行二次聚类，确定每个所述书籍总聚类簇包括的多个书籍子聚类簇，并建立每个所述书籍子聚类簇的书籍子聚类簇画像；

基于多个所述样本用户的感兴趣书籍信息，建立关系图谱，其中，基于多个样本用户的感兴趣书籍信息，确定用户聚类簇与书籍总聚类簇之间的关联关系; 对于每个用户聚类簇，基于该用户聚类簇包括的样本用户的感兴趣书籍信息，确定该用户聚类簇包括的样本用户中对某个书籍总聚类簇所属的专业应用场景感兴趣的用户，基于感兴趣用户占用户聚类簇包括的样本用户的比例，判断用户聚类簇与书籍总聚类簇之间是否存在关联关系, 用户聚类簇与书籍总聚类簇之间存在关联关系时，关系图谱上用户聚类簇对应的节点与书籍总聚类簇之间对应的节点之间可以通过边连接；

所述关系图谱包括每个所述书籍总聚类簇对应的节点及每个所述用户聚类簇对应的节点；

获取待推荐用户端对用户问卷调查的反馈；

基于待推荐用户端对用户问卷调查的反馈及所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍，将所述至少一本目标推荐书籍的相关信息发送至所述待推荐用户端;

对多本候选书籍进行聚类，确定多个书籍总聚类簇，并建立每个所述书籍总聚类簇的书籍总聚类簇画像，包括：

获取每本所述候选书籍所属的专业应用场景；

对于任意两本所述候选书籍，基于两本所述候选书籍所属的专业应用场景，确定两本所述候选书籍的关联度；所述对于任意两本所述候选书籍，基于两本所述候选书籍所属的专业应用场景，确定两本所述候选书籍的关联度，包括：

对于两本所述候选书籍中的一本，获取所述候选书籍所属的专业应用场景对应的多个历史购买用户；

对于每个所述历史购买用户，获取所述历史购买用户的历史购买记录；

基于所述历史购买用户的历史购买记录，确定两本所述候选书籍中的另一本所属的专业应用场景与所述候选书籍所属的专业应用场景之间的关联度；

通过k-means聚类算法基于两本所述候选书籍的关联度，对所述多本候选书籍进行聚类，确定所述多个书籍总聚类簇；

对于每个所述书籍总聚类簇，基于所述书籍总聚类簇的聚类中心对应的专业应用场景建立所述书籍总聚类簇对应的书籍总聚类簇画像；

所述对每个所述书籍总聚类簇包括的多本候选书籍进行二次聚类，确定每个所述书籍总聚类簇包括的多个书籍子聚类簇，并建立每个所述书籍子聚类簇的书籍子聚类簇画像，包括：

对于每个所述书籍总聚类簇，

获取所述书籍总聚类簇包括的每本所述候选书籍的关键词；

对于任意两本所述候选书籍，计算两本所述候选书籍的关键词相似度；

通过k-means聚类算法基于两本所述候选书籍的关键词相似度，对所述书籍总聚类簇包括的多本所述候选书籍进行聚类，确定所述多个书籍子聚类簇；

对于每个所述书籍子聚类簇，基于所述书籍子聚类簇的聚类中心对应的候选书籍的关键词建立所述书籍子聚类簇对应的书籍子聚类簇画像;

所述基于待推荐用户端对用户问卷调查的反馈及所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍，包括：

基于所述待推荐用户端对用户问卷调查的反馈，确定书籍关键词并建立所述待推荐用户端对应的用户画像；

计算所述待推荐用户端对应的用户画像与每个所述用户聚类画像之间的用户画像相似度，基于所述用户画像相似度判断所述多个用户聚类簇中是否存在至少一个目标用户聚类簇；

当判断所述多个用户聚类簇中存在所述至少一个目标用户聚类簇时，基于所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍；

当判断所述多个用户聚类簇中不存在所述目标用户聚类簇时，基于所述书籍关键词建立待推荐书籍画像，并基于所述待推荐书籍画像与每个所述书籍子聚类簇画像之间的第一书籍画像相似度，确定所述多本候选书籍中的至少一本目标推荐书籍;

所述基于所述关系图谱，确定所述多本候选书籍中的至少一本目标推荐书籍，包括：

对于每个所述目标用户聚类簇，

基于所述关系图谱，确定与所述目标用户聚类簇关联的书籍总聚类簇；

对于每个与所述目标用户聚类簇关联的书籍总聚类簇，基于所述书籍关键词建立待推荐书籍画像，并计算所述待推荐书籍画像及与所述书籍总聚类簇包括的每个书籍子聚类簇之间的第二书籍画像相似度；

基于所述第二书籍画像相似度，确定所述多本候选书籍中的至少一本目标推荐书籍。

2.根据权利要求1所述的一种基于数据处理的图书专业书籍智能推荐方法，其特征在于，所述样本用户的相关信息至少包括年龄信息、学历信息、专业技能信息及兴趣爱好信息；

所述基于所述多个样本用户的相关信息对所述多个样本用户进行聚类，确定多个用户聚类簇及每个所述用户聚类簇对应的用户聚类画像，包括：

对于任意两个所述样本用户，计算两个所述样本用户的相关信息之间的信息相似度；

通过k-means聚类算法基于两个所述样本用户的相关信息之间的信息相似度，对所述多个样本用户进行聚类，确定所述多个用户聚类簇；

对于每个所述用户聚类簇，基于所述用户聚类簇的聚类中心对应的样本用户的相关信息建立所述用户聚类簇对应的用户聚类画像。

3.根据权利要求1-2中任意一项所述的一种基于数据处理的图书专业书籍智能推荐方法，其特征在于，还包括：

获取所述待推荐用户端对所述至少一本目标推荐书籍的相关信息的操作信息，更新所述至少一本目标推荐书籍，并将更新后的所述至少一本目标推荐书籍的相关信息发送至所述待推荐用户端。

4.根据权利要求3所述的一种基于数据处理的图书专业书籍智能推荐方法，其特征在于，所述待推荐用户端对所述至少一本目标推荐书籍的相关信息的操作信息至少包括点击信息、浏览停留时间及感兴趣度反馈信息。

5.根据权利要求1-4中任意一项所述的一种基于数据处理的图书专业书籍智能推荐方法，其特征在于，还包括：

基于所述待推荐用户端对用户问卷调查的反馈及所述待推荐用户端对应的至少一本目标推荐书籍，更新所述关系图谱。