CN113850649A

CN113850649A - 一种基于多平台用户数据的定制化推荐方法及推荐系统

Info

Publication number: CN113850649A
Application number: CN202111147286.2A
Authority: CN
Inventors: 韩众和; 张源奔; 李军; 李峰; 王洋; 郭岩; 谢辉平
Original assignee: Aerospace Information Research Institute of CAS
Current assignee: Aerospace Information Research Institute of CAS
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2021-12-28

Abstract

本发明公开了一种基于多平台用户数据的定制化推荐方法，包括：采集多个平台中的用户数据；根据用户数据，构建多平台用户画像，其中，多平台用户画像包括用户行为信息和用户属性信息；根据多平台用户画像，构建包含时间度量的用户行为评价模型，其中，用户行为评价模型用于计算用户对实体的喜好值；根据用户行为评价模型的计算结果，构建多平台召回策略，其中，多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法；根据多平台召回策略的输出结果，利用排序模型获得推荐结果；将推荐结果反馈给用户；根据用户的反馈结果，输出定制化推荐结果。本发明同时还公开了一种基于多平台用户数据的定制化推荐系统。

Description

一种基于多平台用户数据的定制化推荐方法及推荐系统

技术领域

本发明涉及推荐系统中多平台推荐策略定制领域，特别涉及一种基于多平台用户数据的定制化推荐方法及推荐系统。

背景技术

推荐系统是一种信息过滤系统，用于预测用户对物品的评分或偏好。随着信息技术和互联网技术的发展，人们逐渐从信息匮乏的时代走入了信息过载的时代。在这种情况下，消费者想从大量信息(诸如网络商城中的物品)中找到自己感兴趣的信息，而信息生产者想让自己生产的信息脱颖而出。解决上述问题的一种方法是使用推荐系统连接用户和信息，建立二者之间的桥梁。与此同时，推荐系统需要解决的另一个问题是发掘用户的行为，找到用户的个性化需求并帮助用户发现那些他们感兴趣的信息。

现有的推荐系统生成推荐结果的流程主要包括两个阶段：第一个阶段是召回阶段，该阶段的工作是利用多种运行速度较快的召回策略对数据库中的物品进行初次筛选，生成用户喜爱物品的候选集；第二个阶段是排序阶段，该阶段使用排序算法对第一阶段生成的候选集进行打分排序，以此产生有序的推荐结果。

在召回阶段中，现有的推荐系统通常采用基于用户协同过滤、基于物品协同过滤、基于内容推荐等算法；在排序阶段中，常用的排序算法大致分为两类：第一类是基于策略的排序方法，即系统根据加权混合等方式对候选数据集进行混合排序推荐；第二类是基于模型的排序方法，常用的模型包括逻辑回归、梯度提升树、线性和深度模型Wide And Deep模型等。

目前，已有不少针对推荐系统及推荐策略的研究。在现有的技术中，研究的重点集中在增加召回源的个数和采用深度学习模型进行打分，从而增加推荐效果的丰富性与准确性。但这类方法在实际应用过程中，仍存在两个亟待解决的关键问题：其一，在构建用户行为打分体系时，用户行为的打分并不受时间所影响。比方说某用户在一周前发生的浏览行为与近期发生的浏览行为所获得的打分相同，使得系统认为两种行为的重要度相似。这种情况下，推荐结果的实时性就无法体现。其二，很少有针对多个门户系统生成统一推荐结果的推荐系统或策略，这是因为不同平台中的信息可能无法互相关联，从而造成推荐信息的丢失与重复，并降低推荐结果的准确性和多样性。

发明内容

有鉴于此，本发明的主要目的在于提供一种基于多平台用户数据的定制化推荐方法及推荐系统，以期至少部分地解决上述提及的技术问题中的至少之一。

根据本发明的一个方面，提供了一种基于多平台用户数据的定制化推荐方法，包括：

一种基于多平台用户数据的定制化推荐方法，包括：

采集多个平台中的用户数据；

根据用户数据，构建多平台用户画像，其中，多平台用户画像包括用户行为信息和用户属性信息；

根据多平台用户画像，构建包含时间度量的用户行为评价模型，其中，用户行为评价模型用于计算用户对实体的喜好值；

根据用户行为评价模型的计算结果，构建多平台召回策略，其中，多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法；

根据多平台召回策略的输出结果，利用排序模型获得推荐结果；

将推荐结果反馈给用户；

根据用户的反馈结果，输出定制化推荐结果。

根据本发明的实施例，其中根据用户数据，构建多平台用户画像包括：

对用户数据进行处理，获得处理后的用户数据；

对处理后的用户数据进行统计分析，生成多平台用户画像；

实时接收多平台中的用户数据，动态更新多平台用户画像；

其中，构建包含时间度量的用户行为评价模型包括：

为用户对实体的不同行为预设不同的权重；

根据权重计算用户对实体的第一行为得分；

根据用户对实体的行为的时间顺序，利用衰减模型对第一行为得分进行衰减，得到第二行为得分；

按照平台和实体的类型，将衰减后的行为得分进行存储。

根据本发明的实施例，上述衰减模型由式(1)和式(2)表示：

score_desc＝w*score_act (2)，

其中，式(1)用于计算衰减系数，式(2)用于计算第二行为得分；其中，n为用户发生行为的次数，w为衰减系数，t为实体在行为序列中的位置，行为序列用于表示发生行为的时间顺序，score_act表示第一行为得分，score_dxsc表示第二行为得分。

根据本发明的实施例，上述构建多平台召回策略包括：

获取第一平台的实体的属性信息，其中，属性信息包括文字信息和图片信息；

利用特征抽取模型对文字信息进行处理，获取语义特征向量，其中，语义特征向量的维度与第一预设值相等；

利用图片特征提取模型对图片信息进行处理，获取图片特征向量，其中，图片特征向量与语义特征向量具有相同的向量维度；

当第一平台的实体的属性信息缺失时，将缺失的属性信息所对应的特征向量的值初始化成零，其中，缺失的属性信息所对应的特征向量的维度与第一预设值相同；

将语义特征向量和图片特征向量进行拼接，获得拼接结果，并对拼接结果进行全连接网络压缩，得到第一平台的实体的多模态语义特征；

获取多个第二平台中的每一个第二平台下的多个实体的多模态语义特征；

计算第一平台的实体的多模态语义特征和第二平台的每一个实体的多模态语义特征的余弦相似度得分，并将余弦相似度得分进行降序排序，获得排序结果；

根据排序结果中，将排序第一的第二平台的实体设置为第一平台的实体的完全相似关联实体；将排名第二到第二预设值范围内的第二平台的多个实体设置为第一平台的实体的近似关联实体；

获取第一平台的实体在其他第二平台上的完全相似关联实体和近似关联实体。

根据本发明的实施例，多模态实体映射召回方法包括基于热度的召回策略和基于语义相似度的召回策略；多平台行为融合召回方法包括基于用户的跨平台协同过滤召回策略、基于物品的跨平台协同过滤召回策略、基于矩阵分解的跨平台召回策略、基于标签的跨平台召回策略以及基于空间的跨平台召回策略；

当进行基于热度的召回策略时，计算第一平台的实体在第一平台上的热度值；计算每一个第一平台的实体的完全相似关联实体在其第二平台上的热度值；将第一平台的实体和其完全相似关联实体的热度值相加，获得第一平台的实体的总热度值；利用总热度值，对第一平台和多个第二平台上的实体进行热度降序排序，将排名位于第三预设值范围内的第一平台和多个第二平台上的实体作为基于热度的召回策略的召回结果；

当进行基于语义相似度召回策略时，利用第一平台的实体的完全相似关联实体，将第一平台的实体的近似关联物品进行映射，获取第一平台的实体在多个第二平台上的多个完全关联实体；对多个完全关联实体进行相似度降序排序并去重；获取排名位于第四预设值范围内的多个第一平台的实体的完全关联实体作为基于语义相似度召回策略的召回结果；

当进行基于用户的跨平台协同过滤召回策略时，利用用户评价模型，获取目标用户和多个其他用户对同一个实体的评分；利用评分，计算目标用户与每一个其他用户的改进的皮尔森相似度；根据改进的皮尔森相似度，获取目标用户的多个相似用户；根据相似用户的属性信息，获取相似用户浏览过的实体；过滤掉目标用户浏览过的实体，利用热度算法对过滤后的实体进行降序排序，获取排名位于第五预设值范围内的实体作为基于用户的跨平台协同过滤召回策略的召回结果；

当进行基于物品的跨平台协同过滤召回策略时，利用用户评价模型，获取目标用户对实体的评分；利用评分，获取目标用户浏览过的其他实体；利用改进的共现相似度，计算多个平台下的实体和其他实体的共现相似度的值；将其他实体按照共现相似度的值进行降序排序，过滤掉目标用户浏览过的其他实体，将排名在第六预设值范围内的多个实体作为基于物品的跨平台协同过滤召回策略的召回结果；

当进行基于矩阵分解的跨平台召回策略时，对用户在多个平台的行为矩阵进行拼接，利用改进的损失函数，对拼接后的矩阵进行分解，利用分解后的矩阵对用户未浏览过的实体进行打分并对打分进行降序排序，根据排序结果，选取排名位于第七预设值范围内的实体作为基于矩阵分解的跨平台召回策略的召回结果；

当进行基于标签的跨平台召回策略时，利用用户评价模型，获取用户对实体的评分，获取分值最高的实体；利用分值最高的实体的标签获取与分值最高的实体的标签相同的其他实体；将其他实体进行总热度降序排序，过滤掉用户浏览过的实体，将排名位于第八预设值范围内的实体作为基于标签的跨平台召回策略的召回结果；

当基于空间的跨平台召回策略时，利用用户评价模型，获取用户对实体的评分，获取分值最高的实体；根据分值最高的实体的地理位置，筛选出分值最高的实体的地理位置周边的多个实体；过滤掉用户浏览过的实体，对多个实体进行总热度降序排序，将排名位于第九预设值范围内的实体作为基于空间的跨平台召回策略的召回结果。

根据本发明的实施例，上述多平台召回策略的输出结果是基于热度的召回策略、基于语义相似度的召回策略、基于用户的跨平台协同过滤召回策略、基于物品的跨平台协同过滤召回策略、基于矩阵分解的跨平台召回策略、基于标签的跨平台召回策略以及基于空间的跨平台召回策略的并集。

根据本发明的实施例，上述改进的皮尔逊相似度由式(3)表示：

其中，其中r为相似度；T为平台个数；t代表各个平台；X_t为A对A和B用户共同看过的物品的打分；Y_t为B对A和B用户共同看过的物品的打分；N为A和B用户共同看过的物品数量；∑X_tY_t为A和B用户共同看过的物品评分乘积后求和；

改进的共现相似度由式(4)表示：

改进的损失函数由式(5)表示：

其中R_ij为单平台用户i对物品j的评分，

为矩阵分解后，用户矩阵中用户i的向量,S_j为矩阵分解后，物品矩阵中物品j对应向量；n为用户数量；m为物品数量。

根据本发明的实施例，上述根据多平台召回策略的输出结果，利用排序模型获得推荐结果包括：

获取用户行为特征和用户属性特征从而构成用户画像特征；

构建训练样本，其中样本包括正例样本和负例样本；

利用训练样本对排序模型进行训练；

利用训练好的排序模型对多平台召回策略的输出结果进行排序，得到推荐结果。

根据本发明的实施例，上述根据用户的反馈结果，输出定制化推荐结果包括：

当用户对推荐结果不满意时，则将多模态实体映射召回方法和多平台行为融合召回方法所产生的结果展示给用户；

根据用户选择的数据来源、召回源和排序算法，生成定制化的推荐结果。

根据本发明的另一个方面，提供了一种基于多平台用户数据的定制化推荐系统，包括：

采集模块，用于采集多个平台中的用户数据；

第一构建模块，用于根据用户数据，构建多平台用户画像，其中，多平台用户画像包括用户行为信息和用户属性信息；

第二构建模块，用于根据多平台用户画像，构建包含时间度量的用户行为评价模型，其中，用户行为评价模型用于计算用户对物品的喜好值；

第三构建模块，用于根据用户行为评价模型的计算结果，构建多平台召回策略，其中，多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法；

推荐模块，用于根据多平台召回策略的输出结果，利用排序模型获得推荐结果；

反馈模块，用于将推荐结果反馈给用户；

定制模块，用于根据用户的反馈结果，输出定制化推荐结果。

本发明提供的基于多平台用户数据的定制化推荐方法，可以对多个门户平台中有关联的信息建立关联关系，解决横跨多个门户平台进行推荐时推荐信息的丢失与重复的问题；同时上述推荐方法可以结合多平台的数据优势，提高推荐结果的多样性和准确性。本发明提供的基于多平台用户数据的定制化推荐系统能够提高推荐结果的时效性。

附图说明

图1是根据本发明实施例的一种基于多平台用户数据的定制化推荐方法的流程图；

图2是根据本发明实施例的构建多平台用户画像的流程图；

图3是根据本发明实施例的构建包含时间度量的用户行为评价模型的流程图；

图4是根据本发明实施例的构建多平台召回策略的流程图；

图5是根据本发明实施例的输出定制化推荐结果的流程图；

图6是根据本发明实施例的一种基于多平台用户数据的定制化推荐系统的结构图；

图7是根据本发明实施例的推荐系统的工作流程图；

图8是根据本发明实施例的推荐系统的架构图；

图9是根据本发明实施例的推荐系统的结果展示图；

图10是根据本发明实施例的推荐系统配置图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明作进一步的详细说明。

根据本发明的一个方面提供了一种基于多平台用户数据的定制化推荐方法，如图1所示包括步骤S110～步骤S170。

在步骤S110，采集多个平台中的用户数据。

在步骤S120，根据用户数据，构建多平台用户画像，其中，多平台用户画像包括用户行为信息和用户属性信息。

其中，以三个门户平台(比如知识图谱平台，地图平台，商城平台)为例，在知识图谱平台和地图平台中，用户行为有点击、浏览、收藏和下载四种；在商城平台中，用户行为有点击、浏览、收藏、下单、加入购物车和评价六种。

在步骤S130，根据多平台用户画像，构建包含时间度量的用户行为评价模型，其中，用户行为评价模型用于计算用户对实体的喜好值。

上述实体包括多类别的物品，如知识图谱平台上概念、地图平台上的地理区域以及商城平台上的商品等。

上述用户画像，可以通过统计各平台用户对实体或商品的行为次数总量来构建用户的行为画像，比如点击、浏览等数据总次数。

在步骤S140，根据用户行为评价模型的计算结果，构建多平台召回策略，其中，多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法。

在步骤S150，根据多平台召回策略的输出结果，利用排序模型获得推荐结果。

在步骤S160，将推荐结果反馈给用户。

在步骤S170，根据用户的反馈结果，输出定制化推荐结果。

本发明上述实施例所公开的推荐方法，创新地构建包含时间度量的用户行为打分体系，解决了推荐系统的打分体系中无法度量时间影响的问题；创新地构建多平台召回策略，解决横跨多个门户平台进行推荐时推荐信息的丢失与重复的问题，同时多平台行为融合召回方法可以结合多平台的数据优势，提高推荐结果的多样性和准确性。

图2是根据本发明实施例的构建多平台用户画像的流程图，包括步骤S210～步骤S230。

根据本发明的实施例，根据用户数据，构建多平台用户画像包括：

在步骤S210，对用户数据进行处理，获得处理后的用户数据。

在步骤S220，对处理后的用户数据进行统计分析，生成多平台用户画像。

在步骤S230，实时接收多平台中的用户数据，动态更新多平台用户画像。比如可以每天定时更新用户画像。

图3是根据本发明实施例的构建包含时间度量的用户行为评价模型的流程图，包括步骤S310～步骤S340。

如图3所示，构建包含时间度量的用户行为评价模型包括：

在步骤S310，为用户对实体的不同行为预设不同的权重。

在步骤S320，根据权重计算用户对实体的第一行为得分。

在步骤S330，根据用户对实体的行为的时间顺序，利用衰减模型对第一行为得分进行衰减，得到第二行为得分。

在步骤S340，按照平台和实体的类型，将衰减后的行为得分进行存储。

构建包含时间度量的用户行为评价模型可以有效提高推荐结果的实时性，例如在某购物商城中，某用户一周前浏览过T恤，一小时之前浏览过卫衣，则上述两种行为所获得的行为得分相同，从而使得系统认为用户对两种商品的喜好程度相同。但是，用户一小时之前观看过的商品喜好程度应该高于一周前的商品。因此，引入包含时间度量的打分体系，让打分更偏重于用户最近的行为记录，从而使得推荐结果具有实时性。

根据本发明的实施例，上述衰减模型由式(1)和式(2)表示：

score_desc＝w*sCore_act (2)，

其中，式(1)用于计算衰减系数，式(2)用于计算第二行为得分；其中，n为用户发生行为的次数，w为衰减系数，t为实体在行为序列中的位置，行为序列用于表示发生行为的时间顺序，score_act表示第一行为得分，score_desc表示第二行为得分。

上述衰减模型，充分考虑到用户行为的时间因素，对不同时间点上的用户行为的权重进行重新计算，能够更好地反映用户对实体的喜好程度。例如对于某实体，假设平台中与其相关的行为有浏览、收藏、下载，通过人为经验确定各个行为的重要程度后，本平台可以获得该行为的行为得分，如式(6)所示：

score_act＝0.2*n_brow+0.4*n_fav+0.4*n_down (6)，

其中，n_brow为用户浏览该实体或商品的次数，n_fav为用户是否收藏该实体或商品，n_down为用户下载该实体或商品的次数；为了区别各个行为对平台的影响，对上述行为次数乘以重要性权重系数。比如在本平台中，0.2为浏览行为的权重系数，0.4为收藏和下载的权重系数，这表明在本平台中收藏和下载行为的重要性应该高于浏览行为。为了能够对单一平台的行为数据生成推荐结果，又能够对多平台行为数据生成推荐结果，按照平台和物品的类型将score_desc进行保存，保存格式为“id-type-platform-score”，其中id为数据存储编号；type为数据类型；platform为数据来源平台；score为评分score_desc，这种存储格式有利于后续计算召回结果时的快速查询。

图4是根据本发明实施例的构建多平台召回策略的流程图，包括步骤S410～步骤S490。

在步骤S410，获取第一平台的实体的属性信息，其中，属性信息包括文字信息和图片信息。

在步骤S420，利用特征抽取模型对文字信息进行处理，获取语义特征向量，其中，语义特征向量的维度与第一预设值相等。

对于文字信息可以利用BERT特征抽取模型进行处理，其中，上述语义特征向量维度为1*768维。

在步骤S430，利用图片特征提取模型对图片信息进行处理，获取图片特征向量，其中，图片特征向量与语义特征向量具有相同的向量维度。

利用经过预训练的VGG-19图片特征提取模型对图片信息进行处理，获取初始的图片特征向量，其中初始的图片特征向量的维度是196*512维，对初始的图片特征向量的第一维进行列平均计算并使用已有的全连接网络对第二维进行映射，得到与语义特征向量相同维度的图片特征向量，即处理后的图片特征向量的维度是1*768维。

在步骤S440，当第一平台的实体的属性信息缺失时，将缺失的属性信息所对应的特征向量的值初始化成零，其中，缺失的属性信息所对应的特征向量的维度与第一预设值相同。

比如某实体没有文字信息或者图片信息，默认将上述实体对应的语义特征向量或图片特征向量设置为1*768维的0值向量，其中上述第一预设值即为1*768维。

在步骤S450，将语义特征向量和图片特征向量进行拼接，获得拼接结果，并对拼接结果进行全连接网络压缩，得到第一平台的实体的多模态语义特征。

上述多模态语义特征的维度是1*768维，与语义特征向量和图片特征向量维度一致。

在步骤S460，获取多个第二平台中的每一个第二平台下的多个实体的多模态语义特征。

其中，上述第二平台有多个，在每一个第二平台上都有多个实体，分别计算上述每一个第二平台上的多个实体的多模态语义特征，从而获得了多个平台的多个实体的多模态语义特征。

在步骤S470，计算第一平台的实体的多模态语义特征和第二平台的每一个实体的多模态语义特征的余弦相似度得分，并将余弦相似度得分进行降序排序，获得排序结果。

在步骤S480，根据排序结果中，将排序第一的第二平台的实体设置为第一平台的实体的完全相似关联实体；将排名第二到第二预设值范围内的第二平台的多个实体设置为第一平台的实体的近似关联实体。

计算上述第一平台的实体与其中一个第二平台的多个实体的余弦相似度得分，其中，例如将相似度得分最高的1个实体或物品设置为上述第一平台的实体或物品的完全相似关联X_most，将相似度最高的前10个物品设置为近似关联X_related，上述第二预设值即为10。

在步骤S490，获取第一平台的实体在其他第二平台上的完全相似关联实体和近似关联实体。

重复上述步骤，就可以得到上述第一平台的实体在每一个第二平台上的完全相似关联的实体和多个近似关联的实体。

当进行基于热度的召回策略时，计算第一平台的实体在第一平台上的热度值；计算每一个第一平台的实体的完全相似关联实体在其第二平台上的热度值；将第一平台的实体和其完全相似关联实体的热度值相加，获得第一平台的实体的总热度值；利用总热度值，对第一平台和多个第二平台上的实体进行热度降序排序，将排名位于第三预设值范围内的第一平台和多个第二平台上的实体作为基于热度的召回策略的召回结果。

例如，在进行基于热度的召回策略时，已有的基于热度的召回方法通常针对某个平台计算与实体在该平台下的热度值并获得其召回结果。而本发明实施例提供基于热度的召回策略，利用上述实施例中得到的完全相似关联X_most计算实体或物品在多个门户平台中的总热度，从而对多个平台的实体或物品进行关联推荐。总热度由式(7)表示：

heat_all(X)＝heat₁+heat₂+heat₃ (7)，

其中，heat₁，heat₂，heat₃分别为某物品在三个不同门户平台中的热度；heat_all(X)为三个门户平台中实体的总热度。使用heat_all对各平台中的实体进行热度排序，将heat_all数值最高的20个(即上述第三预设值范围内)实体作为此召回源的最终结果D_heat。

当进行基于语义相似度召回策略时，利用第一平台的实体的完全相似关联实体，将第一平台的实体的近似关联物品进行映射，获取第一平台的实体在多个第二平台上的多个完全关联实体；对多个完全关联实体进行相似度降序排序并去重；获取排名位于第四预设值范围内的多个第一平台的实体的完全关联实体作为基于语义相似度召回策略的召回结果。

现有的基于语义相似度召回策略直接使用深度学习模型获得在同一平台下文本相似度最高的实体或物品作为召回结果。而本发明实施例所公开的基于语义相似度召回策略使用上述实施例所得到的近似关联X_related计算此召回源的结果D_semantic，从而针对各个系统中的实体或物品之间的多模态语义相似度进行推荐。例如，当用户在某平台浏览实体或商品时，可以得到当前浏览的实体在其他多个平台上的近似关联X_related。假设平台总数为N，则针对当前浏览的实体或商品获取到的近似关联总数X_{related_all}为10*(N-1)个；将10*(N-1)个近似关联使用完全相似关联X_most进行映射，可以得到用户使用平台中的10*(N-1)个完全关联实体。这些实体可能有重复，进行去重之后即可作为本召回源的结果D_semantic。若D_semantic个数过多，可以使用相似度排序对其进行删减，选择相似度最高的n个实体(即上述第四预设值范围内的实体)作为本召回源的推荐结果。

当进行基于用户的跨平台协同过滤召回策略时，利用用户评价模型，获取目标用户和多个其他用户对同一个实体的评分；利用评分，计算目标用户与每一个其他用户的改进的皮尔森相似度；根据改进的皮尔森相似度，获取目标用户的多个相似用户；根据相似用户的属性信息，获取相似用户浏览过的实体；过滤掉目标用户浏览过的实体，利用热度算法对过滤后的实体进行降序排序，获取排名位于第五预设值范围内的实体作为基于用户的跨平台协同过滤召回策略的召回结果。

在已有的推荐方法中，协同过滤算法仅利用用户在一个平台中的数据寻找相似用户，然后召回此相似用户感兴趣且本用户未浏览过的实体或商品，这种方式无法结合多平台数据优势，造成推荐的多样性和准确性降低。本发明实施例所提供的基于用户的跨平台协同过滤召回策略能够利用多平台数据更能有效捕捉用户行为，从而找到真正的最近邻用户并给出精确推荐。通过上述基于用户的跨平台协同过滤召回策略，计算基于多平台用户行为的改进皮尔森相似度，然后取相似度最高的40个的实体和商品，再过滤本用户浏览过的物品，选取热度最高的20个实体或商品(即第五预设值范围内的实体)，作为此召回源的结果D_{user_rec}

当进行基于物品的跨平台协同过滤召回策略时，利用用户评价模型，获取目标用户对实体的评分；利用评分，获取目标用户浏览过的其他实体；利用改进的共现相似度，计算多个平台下的实体和其他实体的共现相似度的值；将其他实体按照共现相似度的值进行降序排序，过滤掉目标用户浏览过的其他实体，将排名在第六预设值范围内的多个实体作为基于物品的跨平台协同过滤召回策略的召回结果。

已有的基于物品的跨平台协同过滤召回策略仅用单平台数据来计算物品相似度，降低了推荐结果的多样性和准确性。而本发明实施例所提供的基于物品协同过滤的多平台行为融合召回策略通过改进的共现相似度，能够更好地寻找与某实体相似的其他实体，同时过滤本用户浏览过的物品然后截取热度最高的20个实体或商品(即第六预设值范围内的多个实体)，作为此召回源的结果D_{item_rec}。

当进行基于矩阵分解的跨平台召回策略时，对用户在多个平台的行为矩阵进行拼接，利用改进的损失函数，对拼接后的矩阵进行分解，利用分解后的矩阵对用户未浏览过的实体进行打分并对打分进行降序排序，根据排序结果，选取排名位于第七预设值范围内的实体作为基于矩阵分解的跨平台召回策略的召回结果。

假设R₁为用户在知识图谱平台的行为矩阵；R₂为用户在商城平台的行为矩阵，R₃为用户在地图平台的行为矩阵；为了获得用户在多平台行为特点，将对应用户在多平台行为记录拼接，其中没有行为的数据补0，R′为多平台行为拼接后的矩阵由(8)表示：

现有技术中的损失函数由式(9)表示：

其中R_ij为单平台用户i对物品j的评分，

为矩阵分解后，用户矩阵中用户i的向量，S_j为矩阵分解后，物品矩阵中物品j对应向量；n为用户数量；m为物品数量；与已有的矩阵分解策略不同，本发明实施例所提供的基于矩阵分解的跨平台召回策略能够对多个平台同时计算矩阵分解，经过矩阵分解，系统将对用户未看过的物品进行预测打分，截取前20个实体或商品(即第七预设值范围内的实体)作为此召回源的结果D_matrix。

当进行基于标签的跨平台召回策略时，利用用户评价模型，获取用户对实体的评分，获取分值最高的实体；利用分值最高的实体的标签获取与分值最高的实体的标签相同的其他实体；将其他实体进行总热度降序排序，过滤掉用户浏览过的实体，将排名位于第八预设值范围内的实体作为基于标签的跨平台召回策略的召回结果。

在排序结果中，过滤本用户浏览过的物品之后，获得热度最高的前20个物品(即第八预设值范围内的实体)，作为此召回源的结果D_tag。

首先，获取在所有门户平台中最受用户喜爱的一个实体或物品；若该物品或实体在系统中存储有地理位置，则根据该位置筛选出50个在其位置周边的候选实体或商品；其次从中过滤本用户浏览过的物品，利用热度打分截取热度最高的20个实体(即第九预设值范围内)，作为基于空间的跨平台召回策略的结果D_space。

通过上述实施例，利用上述多个召回策略，结合多平台的用户数据，可以获得更加准确和全面的推荐结果。

利用公式(10)可以得到生成召回阶段的总候选集D_cand：

D_cand＝D_heat∪D_semantic∪D_{user_rec}∪D_{item_rec}∪D_matrix∪D_tag∪D_space (10)。

上述总候选集D_cand即上述多平台召回策略的输出结果。

改进的共现相似度由式(4)表示：

改进的损失函数由式(5)表示：

其中R′_ij为单平台用户i对物品j的评分，

为矩阵分解后，用户矩阵中用户i的向量，S_j为矩阵分解后，物品矩阵中物品j对应向量；n为用户数量；m为物品数量。

图4是根据本发明实施例的推荐结果的流程图，包括步骤S410～步骤S440。

如图4所示，上述根据多平台召回策略的输出结果，利用排序模型获得推荐结果包括：

在步骤S410，获取用户行为特征和用户属性特征从而构成用户画像特征。

首先，基于特征构造方法，使用one-hot特征构建用户行为特征与用户属性特征并对其进行拼接；其次，使用特征构造方法构建稀疏型特征和数值型特征获取用户属性特征feature_act，其中稀疏型特征用于训练逻辑回归排序模型，数值型特征用于训练XGBoost排序模型；再次，选择用户的年龄、部门、出生地、生活区域和喜好商品类型特征来获取用户属性特征feature_prop；将feature_act和feature_prop进行拼接，得到用户画像特征feature。

在步骤S420，构建训练样本，其中样本包括正例样本和负例样本。

上述步骤中，采用统计用户浏览时长的方式来区分样本的正负例，如某用户浏览某物品时间超过3s则视为正例,浏览时长少于3s则将其视为负例。

在步骤S430，利用训练样本对排序模型进行训练；

在步骤S440，利用训练好的排序模型对多平台召回策略的输出结果进行排序，得到推荐结果。

上述步骤S440中，利用训练好的排序模型对召回源总候选集D_cand，进行打分排序，获得推荐结果。

上述推荐方法利用排序模型，充分利用本发明实施例所提供的用户画像，并通过样本训练，使得生成的推荐结果能够更符合用户的需求。

图5是根据本发明实施例的输出定制化推荐结果的流程图，包括步骤S510～步骤S520。

如图5所示，根据用户的反馈结果，输出定制化推荐结果包括：

在步骤S510，当用户对推荐结果不满意时，则将多模态实体映射召回方法和多平台行为融合召回方法所产生的结果展示给用户；

在步骤S520，根据用户选择的数据来源、召回源和排序算法，生成定制化的推荐结果。

通过对上述推荐方法所产生的推荐结果进行定制，生成的推荐结果能够更接近用户的需求，充分发挥了用户在上述推荐方法中的作用，使得推荐结果更加准确。

根据本发明的另一个方面，提供了一种基于多平台用户数据的定制化推荐系统，如图6所示，上述推荐系统600包括采集模块610、第一构建模块620、第二构建模块630、第三构建模块640、推荐模块650、反馈模块660以及定制模块670；其中：

采集模块610，用于采集多个平台中的用户数据；

第一构建模块620，用于根据用户数据，构建多平台用户画像，其中，多平台用户画像包括用户行为信息和用户属性信息；

第二构建模块630，用于根据多平台用户画像，构建包含时间度量的用户行为评价模型，其中，用户行为评价模型用于计算用户对物品的喜好值；

第三构建模块640，用于根据用户行为评价模型的计算结果，构建多平台召回策略，其中，多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法；

推荐模块650，用于根据多平台召回策略的输出结果，利用排序模型获得推荐结果；

反馈模块660，用于将推荐结果反馈给用户；

定制模块670，用于根据用户的反馈结果，输出定制化推荐结果。

上述推荐系统，结合了多平台的用户数据，通过构建画像和用户评价模型，采用了多个推荐策略对用户数据进行处理并充分考虑到用户个性化操作，为用户生成了丰富可靠的推荐结果，大大地提升了用户的使用体验。

图7是根据本发明实施例的推荐系统的工作流程图，图8是根据本发明实施例的推荐系统的架构图；下面结合图7和图8对上述推荐系统作进一步地详细说明。

如图7所示，上述系统首先采集多个平台的用户信息，并构建多平台用户画像和包括时间度量的用户评价模型，进而构建多平台召回策略，其中多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法，利用排序模型将多平台召回策略生成的推荐结果进行排序并筛选，将相关推荐结果反馈给用户，当用户对当前结果满意时候，则输出相关推荐结果，如果用户对当前结果不满意时，则进入用户定制流程，进而生成用户满意的结果。图8进一步展示了上述推荐系统详细的架构图；如图8所示，其中，用户数据包括用户行为信息和用户属性信息，用于提取用户特征；实体或商品包括实体或商品的文字信息和图片信息，用于提取多模态实体特征；多平台行为融合召回方法包括基于用户的跨平台协同过滤召回策略、基于物品的跨平台协同过滤召回策略、基于矩阵分解的跨平台召回策略、基于标签的跨平台召回策略以及基于空间的跨平台召回策略，多模态实体映射召回方法包括基于语义相似度的召回策略和基于热度的召回策略；上述多模态实体映射召回方法和多平台行为融合召回方法用于生成多召回源的召回结果；利用排序模型对召回结果进行选择生成最终的推荐结果，其中排序模型包括梯度提升树模型和逻辑回归模型。

下面结合图9和图10对上述推荐系统输出定制化推荐结果的流程作详细的说明。

图9是根据本发明实施例的推荐系统的结果展示图。如图9所示，上述推荐系统支持用户通过点选方式选择召回策略和排序算法；当用户对推荐结果不满意时，上述推荐系统会展示召回结果产生的原因，让用户能够了解召回结果产生原因删除或增加推荐方法支持的推荐策略。

图10是根据本发明实施例的推荐系统配置图。如图10所示，用户可以通过上述推荐系统的相关配置来定制推荐结果，其中可定制部分包含用户数据的来源、召回源的选择和排序算法的选择。当用户进行数据来源定制时，系统默认采用所有平台的用户数据P_all生成推荐结果，以三个用户平台为例，其中知识图谱平台数据为P₁，商城平台数据为P₂，地图平台数据为P₃，则系统的总数据来源为：P_all＝P₁∪P₂∪P₃假设用户不想收到来自商城平台的推荐结果，则可以取消商城平台的数据，此时数据来源为：P_all＝P₁∪P₃。当用户进行召回源定制时，系统通过分析图6所示的召回结果产生的原因，用户可以删除或增加系统支持的召回源，以此改变总候选集数据，从而改变最终的推荐结果，例如用户取消基于热度召回源和基于矩阵分解召回源后，则总候选集D_cand变为D_cand＝D_heat∪Ds_emantc∪D_{user_rec}∪D_{item_rec}∪D_tag∪D_space。当用户进行排序算法定制时，系统支持选择两种不同的排序算法，包含逻辑回归模型和梯度提升树算法，其中逻辑回归算法训练及参数更新速度较快，梯度提升树算法排序结果较为精确。经过上述定制化操作后，系统输出经过用户定制后的推荐结果。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于多平台用户数据的定制化推荐方法，包括：

采集多个平台中的用户数据；

根据所述用户数据，构建多平台用户画像，其中，所述多平台用户画像包括用户行为信息和用户属性信息；

根据所述多平台用户画像，构建包含时间度量的用户行为评价模型，其中，所述用户行为评价模型用于计算用户对实体的喜好值；

根据所述用户行为评价模型的计算结果，构建多平台召回策略，其中，所述多平台召回策略包括多模态实体映射召回方法和多平台行为融合召回方法；

根据所述多平台召回策略的输出结果，利用排序模型获得推荐结果；

将所述推荐结果反馈给所述用户；

根据所述用户的反馈结果，输出定制化推荐结果。

2.根据权利要求1所述的方法，其中，所述根据所述用户数据，构建多平台用户画像包括：

对所述用户数据进行处理，获得处理后的用户数据；

对所述处理后的用户数据进行统计分析，生成所述多平台用户画像；

实时接收多平台中的所述用户数据，动态更新所述多平台用户画像；

其中，所述构建包含时间度量的用户行为评价模型包括：

为所述用户对所述实体的不同行为预设不同的权重；

根据所述权重计算所述用户对所述实体的第一行为得分；

根据所述用户对所述实体的行为的时间顺序，利用衰减模型对所述第一行为得分进行衰减，得到第二行为得分；

按照所述平台和所述实体的类型，将所述衰减后的行为得分进行存储。

3.根据权利要2所述的方法，其中，所述衰减模型由式(1)和式(2)表示：

score_desc＝w*score_act (2),

其中，式(1)用于计算衰减系数，式(2)用于计算所述第二行为得分；其中，n为所述用户发生行为的次数，w为衰减系数，t为所述实体在行为序列中的位置，所述行为序列用于表示发生行为的时间顺序，score_act表示所述第一行为得分，score_desc表示所述第二行为得分。

4.根据权利要求1所述的方法，其中，构建多平台召回策略包括：

获取第一平台的实体的属性信息，其中，所述属性信息包括文字信息和图片信息；

利用特征抽取模型对所述文字信息进行处理，获取语义特征向量，其中，所述语义特征向量的维度与第一预设值相等；

利用图片特征提取模型对所述图片信息进行处理，获取图片特征向量，其中，所述图片特征向量与所述语义特征向量具有相同的向量维度；

当所述第一平台的实体的属性信息缺失时，将缺失的属性信息所对应的特征向量的值初始化成零，其中，所述缺失的属性信息所对应的特征向量的维度与所述第一预设值相同；

将所述语义特征向量和所述图片特征向量进行拼接，获得拼接结果，并对所述拼接结果进行全连接网络压缩，得到所述第一平台的实体的多模态语义特征；

计算所述第一平台的实体的多模态语义特征和所述第二平台的每一个实体的多模态语义特征的余弦相似度得分，并将所述余弦相似度得分进行降序排序，获得排序结果；

根据所述排序结果中，将排序第一的所述第二平台的实体设置为所述第一平台的实体的完全相似关联实体；将排名第二到第二预设值范围内的所述第二平台的多个实体设置为所述第一平台的实体的近似关联实体；

获取所述第一平台的实体在其他所述第二平台上的所述完全相似关联实体和所述近似关联实体。

5.根据权利要求4所述的方法，其中，所述多模态实体映射召回方法包括基于热度的召回策略和基于语义相似度的召回策略；所述多平台行为融合召回方法包括基于用户的跨平台协同过滤召回策略、基于物品的跨平台协同过滤召回策略、基于矩阵分解的跨平台召回策略、基于标签的跨平台召回策略以及基于空间的跨平台召回策略；

当进行所述基于热度的召回策略时，计算所述第一平台的实体在第一平台上的热度值；计算每一个所述第一平台的实体的完全相似关联实体在其第二平台上的热度值；将所述第一平台的实体和其完全相似关联实体的热度值相加，获得所述第一平台的实体的总热度值；利用所述总热度值，对所述第一平台和多个所述第二平台上的实体进行热度降序排序，将排名位于第三预设值范围内的所述第一平台和多个所述第二平台上的实体作为所述基于热度的召回策略的召回结果；

当进行所述基于语义相似度召回策略时，利用所述第一平台的实体的完全相似关联实体，将所述第一平台的实体的近似关联物品进行映射，获取所述第一平台的实体在多个所述第二平台上的多个完全关联实体；对所述多个完全关联实体进行相似度降序排序并去重；获取排名位于第四预设值范围内的多个所述第一平台的实体的完全关联实体作为所述基于语义相似度召回策略的召回结果；

当进行基于用户的跨平台协同过滤召回策略时，利用所述用户评价模型，获取目标用户和多个其他用户对同一个实体的评分；利用所述评分，计算所述目标用户与每一个所述其他用户的改进的皮尔森相似度；根据所述改进的皮尔森相似度，获取所述目标用户的多个相似用户；根据所述相似用户的属性信息，获取所述相似用户浏览过的实体；过滤掉所述目标用户浏览过的所述实体，利用热度算法对过滤后的所述实体进行降序排序，获取排名位于第五预设值范围内的实体作为基于用户的跨平台协同过滤召回策略的召回结果；

当进行基于物品的跨平台协同过滤召回策略时，利用所述用户评价模型，获取目标用户对所述实体的评分；利用所述评分，获取所述目标用户浏览过的其他实体；利用改进的共现相似度，计算多个平台下的所述实体和所述其他实体的共现相似度的值；将所述其他实体按照共现相似度的值进行降序排序，过滤掉所述目标用户浏览过的所述其他实体，将排名在第六预设值范围内的多个实体作为基于物品的跨平台协同过滤召回策略的召回结果；

当进行基于矩阵分解的跨平台召回策略时，对所述用户在多个平台的行为矩阵进行拼接，利用改进的损失函数，对拼接后的矩阵进行分解，利用分解后的矩阵对所述用户未浏览过的实体进行打分并对所述打分进行降序排序，根据所述排序结果，选取排名位于第七预设值范围内的实体作为基于矩阵分解的跨平台召回策略的召回结果；

当进行基于标签的跨平台召回策略时，利用所述用户评价模型，获取所述用户对所述实体的评分，获取分值最高的实体；利用所述分值最高的实体的标签获取与所述分值最高的实体的标签相同的其他实体；将所述其他实体进行总热度降序排序，过滤掉所述用户浏览过的实体，将排名位于第八预设值范围内的实体作为基于标签的跨平台召回策略的召回结果；

当基于空间的跨平台召回策略时，利用所述用户评价模型，获取所述用户对所述实体的评分，获取分值最高的实体；根据所述分值最高的实体的地理位置，筛选出所述分值最高的实体的地理位置周边的多个实体；过滤掉所述用户浏览过的实体，对所述多个实体进行总热度降序排序，将排名位于第九预设值范围内的实体作为基于空间的跨平台召回策略的召回结果。

6.根据权利要求5所述的方法，其中，所述多平台召回策略的输出结果是基于热度的召回策略、基于语义相似度的召回策略、基于用户的跨平台协同过滤召回策略、基于物品的跨平台协同过滤召回策略、基于矩阵分解的跨平台召回策略、基于标签的跨平台召回策略以及基于空间的跨平台召回策略的并集。

7.根据权利要求5所述的方法，其中，所述改进的皮尔逊相似度由式(3)表示：