CN111292151A

CN111292151A - 对象推荐方法及装置、存储介质及对象推荐设备

Info

Publication number: CN111292151A
Application number: CN201811497121.6A
Authority: CN
Inventors: 颜建辉; 王劲鹏; 余东辉; 彭涛; 蔡润昌; 闫宇; 邓志勇
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Internet Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Internet Co Ltd
Priority date: 2018-12-07
Filing date: 2018-12-07
Publication date: 2020-06-16
Anticipated expiration: 2038-12-07
Also published as: CN111292151B

Abstract

本发明公开了一种对象推荐方法，包括：获取用户对第一对象评价的对象评分矩阵；根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵；基于所述兴趣转移矩阵，向用户推荐第二对象。本发明还同时公开了一种对象推荐装置及一种计算机存储介质。

Description

对象推荐方法及装置、存储介质及对象推荐设备

技术领域

本发明涉及数据业务领域，尤其涉及一种对象推荐方法及装置、存储介质。

背景技术

对象推荐是互联网和电子商务发展的产物，需要建立在海量数据挖掘基础上，向用户提供个性化的信息服务和决策支持。现有的对象推荐方法多从用户对对象的行为数据进行建模，但是现有的模型向用户推荐相关对象的精准度依然达不到预期。

发明内容

本发明实施例提供一种对象推荐方法及装置、存储介质。

本发明的技术方案是这样实现的：

一方面，提供一种对象推荐方法，包括：

获取用户对第一对象评价的对象评分矩阵；

根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵；

基于所述兴趣转移矩阵，向用户推荐第二对象。

进一步地，所述根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵，包括：

按照预定约束条件，以所述对象评分矩阵为已知量求解所述兴趣转移矩阵。

进一步地，所述按照预定约束条件，以所述对象评分矩阵为已知量求解所述兴趣转移矩阵包括：

按照如下函数关系，根据所述对象评分矩阵为已知量求解所述兴趣转移矩阵：

其中，α₁为预先设定的第一系数，β₁为预先设定的第二系数，λ₁为预先设定的第三系数，p为预先设定的第四系数，g为预先设定的第五系数，

为第i个用户所对应的属性特征向量，

为第j个所述第一对象所对应的属性特征向量，

为第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量，

为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值，

为第j个所述第一对象及第i个所述第一对象间的相似度度量值，C为所述兴趣转移矩阵，

为所述C中第j个所述第一对象对应的向量。

进一步地，所述方法，还包括：

按照如下函数关系，确定所述

其中，

为第k个周期内第i个用户对第j个所述第一对象的使用时长，

为预先设定的阀值。

进一步地，所述方法，还包括：

基于第i个所述第一对象和第j个所述第一对象的标签属性信息，确定第i个所述第一对象的标签特征向量

和第j个所述第一对象的标签特征向量

基于第i个所述第一对象和第j个所述第一对象的详细数据信息，确定第i个所述第一对象的详细数据向量

和第j个所述第一对象的详细数据向量

基于第i个所述第一对象和第j个所述第一对象的统计数据信息，确定第i个所述第一对象的统计数据向量

和第j个所述第一对象的统计数据向量

基于所述

所述

所述

所述

所述

及所述

确定所述

进一步地，所述基于所述

所述

所述

所述

所述

及所述

确定所述

包括：

按照如下函数关系，根据所述

所述

所述

所述

所述

及所述

确定所述

其中，α₂为预先设定的第六系数，β₂为预先设定的第七系数，λ₂为预先设定的第八系数，

进一步地，所述基于所述兴趣转移矩阵，向用户推荐第二对象，包括：

结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵，从所述待推荐对象中选择出向所述用户推荐的第二对象。

进一步地，所述结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵，从所述待推荐对象中选择出向所述用户推荐的第二对象，包括：

按照如下函数关系，结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵，确定用户的喜好程度推算矩阵：

其中，

为所述用户的喜好程度推算矩阵中的第i个用户对第j个所述待推荐对象的喜好程度推算值，p为预先设定的第四系数，g为预先设定的第五系数，

为所述用户属性矩阵中的第i个用户所对应的属性特征向量，

为所述待推荐对象的对象属性矩阵中的第j个所述待推荐对象所对应的属性特征向量，

为第t个周期对应的对象评分矩阵中第i个用户对应的评分向量，C为所述兴趣转移矩阵；

依据所述用户的喜好程度推算矩阵，从所述待推荐对象中选择出向所述用户推荐的第二对象。

本发明还提供了一种对象推荐装置，包括：

获取单元：用于获取用户对第一对象评价的对象评分矩阵；

生成单元：用于根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵；

推荐单元，用于基于所述兴趣转移矩阵，向用户推荐第二对象。

本发明还提供了一种计算机存储介质，所述计算机存储介质存储有计算机可执行指令；所述计算机可执行指令被执行后，能够实现上述对象推荐方法。

收发器、存储器及处理器；

所述存储器，用于存储计算机可执行指令；

所述处理器，分别与收发器及存储器连接，用于控制所述收发器及所述存储器，通过执行所述计算机可执行指令能够实现权利要求1至8任一项提供的方法。

本发明提供的对象推荐方法及装置、存储介质，获取用户对第一对象评价的对象评分矩阵；根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵；基于所述兴趣转移矩阵，向用户推荐第二对象。本发明中的兴趣转移矩阵表征了第一对象对用户兴趣转移的影响程度，通过兴趣转移矩阵，可以在用户使用过第一对象后，确定用户改变了的兴趣，从而依据用户改变后的兴趣，较精准地向用户推荐相关对象。

附图说明

图1为本发明实施例提供的一种对象推荐方法的流程示意图；

图2为本发明实施例提供的一种确定对象间的相似度度量值方法的流程示意图；

图3为本发明实施例提供的一种对象推荐装置组成结构示意图；

图4为本发明实施例提供一种对象推荐设备组成结构示意图。

具体实施方式

在本发明的各种实施例中，兴趣转移矩阵表征了第一对象对用户兴趣转移影响程度，利用对象间的关联性，确定用户在使用过第一对象后，用户兴趣发生的改变，从而依据用户兴趣的改变，较精准地向用户推荐相关对象。为使本发明实施例的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明实施例进行详细说明。

图1为本发明实施例提供的一种对象推荐方法的流程示意图，如图1所示，所述对象推荐方法包括以下步骤：

步骤101：获取用户对第一对象评价的对象评分矩阵；

步骤102：根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵；

步骤103：基于所述兴趣转移矩阵，向用户推荐第二对象。

本发明中的所述对象可为各种商品和/或服务，在一些实施例中，所述对象还可包括：交换或共享的各种物品或服务。

商品可包括：食品、生活用品等，服务可包括：摄影体验、培训、医学诊疗等。本发明中的对象推荐方法尤其适用于图书、音乐、动漫、游戏等包含一定文字内容的对象。

本发明中的第一对象为用户已使用过的对象，第二对象可与第一对象具有相同或相似的用途，比如：第一对象和第二对象都为推理侦探小说，第一对象和第二对象为不同品牌但相同产地的大米等；第二对象也可与第一对象在功能上或属性上具有关联性，比如：第一、二对象都为同一作者编写的书籍，第一对象为羽毛球拍，第二对象为羽毛球等。本发明利用对象间的关联性，确定用户在使用过第一对象后，用户兴趣发生的改变，从而依据用户兴趣的改变，个性化地向用户推荐用户可能具有较大兴趣使用的第二对象。

对象评分矩阵记录了用户对已使用对象的评分数值，体现了用户对不同对象的使用行为及喜爱程度。可以利用用户对已使用对象的主观评分确定对象评分矩阵，也可以利用用户对对象的使用时长确定对象评分矩阵。由于不同时期用户对对象的喜爱程度会发生变化，可选定一定时间周期，比如：一周、一个月等，确定该时间周期对应的对象评分矩阵。

兴趣转移矩阵为对象对用户自身兴趣爱好的影响，可以表述为用户使用完特定对象后其兴趣转移的强度及方向。兴趣转移矩阵中每个元素，可以表示为用户使用过某对象之后，用户转移的兴趣偏好的概率。

按照约束条件，通过对象评分矩阵可唯一确定兴趣转移矩阵。上述约束条件可以为函数关系约束条件等。

为第i个用户所对应的属性特征向量，

为第j个所述第一对象所对应的属性特征向量，

为所述C中第j个所述第一对象对应的向量。

为第i个用户所对应的属性特征向量，

为第j个所述第一对象所对应的属性特征向量，

为兴趣转移矩阵中第j个所述第一对象对应的属性向量，上述

中的属性特征信息相匹配。

上述的最小化函数可分为三部分，第一部分为：

其中，

代表基于用户自身属性信息，获取到的用户长期兴趣信息，

为基于第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量及兴趣转移矩阵，获取用户短期兴趣信息，

为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值，其代表了第k个周期中用户对对象兴趣的计算值；第二部分为：

其中，

为基于对象的属性信息，获取到的对象间相关信息，

为第j个所述第一对象及第i个所述第一对象间的相似度度量值，其代表了对象间相关信息的计算值，在上述的最小化函数构建过程中，引入上述第二部分的作用为：在以第一部分的用户行为数据生成过程中，加入了丰富可靠的数据，并有利于改善第一部分的用户行为数据稀疏性带来的问题；第三部分为：

的作用为防止模型过拟合，造成模型性能下降。约束条件中，

作用为避免

的不合理赋值。

进一步地，所述方法，还包括：

按照如下函数关系，确定所述

其中，

为第k个周期内第i个用户对第j个所述第一对象的使用时长，

为预先设定的阀值。

通过上述函数，可以利用用户对对象的使用时长，确定对象评分矩阵。

可选地，按照如下函数关系，确定所述

其中，

为第k个周期内第i个用户对第j个所述第一对象的使用时长，t_mean为用户使用特定对象的时间均值。

图2为本发明实施例提供的一种确定对象间的相似度度量值方法的流程示意图，所述方法，包括：

步骤201：基于第i个所述第一对象和第j个所述第一对象的标签属性信息，确定第i个所述第一对象的标签特征向量

和第j个所述第一对象的标签特征向量

步骤202：基于第i个所述第一对象和第j个所述第一对象的详细数据信息，确定第i个所述第一对象的详细数据向量

和第j个所述第一对象的详细数据向量

步骤203：基于第i个所述第一对象和第j个所述第一对象的统计数据信息，确定第i个所述第一对象的统计数据向量

和第j个所述第一对象的统计数据向量

步骤204：基于所述

所述

所述

所述

所述

及所述

确定所述

在本发明中的对象为书籍时，上述标签属性信息为书籍名称、作者、体裁、检索关键词等。首先，基于书籍的标签属性信息建立的书籍特征词典，然后根据特定书籍的标签数据生成该书籍对应的标签特征向量。具体地，可根据特征词典中的标签数据在特定书籍的标签性信息中出现的次数，确定该书籍对应的标签特征向量。比如：建立的书籍特征词典共有100个标签信息组成，其中，该特征词典中下标为50、51、52的标签信息分别为“当年明月”、“明朝”、“万历”，《明朝那些事儿》是一本书，该书作者为“当年明月”，该书的名称中包含有“明朝”，该书的检索关键词为“明朝”、“万历”，则该书对应的标签特征向量包含有100个元素，其中，下标为50、51、52的元素分别为“1”、“2”、“1”，其余元素全为0，该书对应的标签特征向量包含的元素，代表了对应的特征词典中的标签信息，在该书的标签性信息中出现的次数。

上述详细数据信息为基于书籍的目录、摘要、内容等详细数据。可依据文档主题生成模型(Latent Dirichlet Allocation，LDA)获取主题词及书籍主题词归属概率，并生成特定书籍对应的详细数据特征向量。具体地，首先，依据LDA方法，生成每本书籍的主题词及书籍主题词归属概率，然后将每本书籍的主题词组合成主题词典，最后，再依据每本书籍的主题词在主题词典中的位置和书籍主题词归属概率，生成书籍对应的详细数据特征向量。

上述统计数据信息为基于特定书籍所对应的阅读行为，可包含不同时段内的阅读人数比例、单次阅读平均时长、全文阅读所耗费的平均时长等统计数据。其中阅读时段可根据需求，设定阅读周期，比如，以6小时为周期，将一天划分为4个不同时段，而后分布统计不同时段内特定数据对应的阅读人数比例。

上述确定对象间相似度的方法适用于包含一定文字内容的对象，比如：图书、歌曲、动漫、游戏等。当本发明中的对象为歌曲时，上述标签属性信息为表演者、作词者、作曲者、音乐类型、检索关键词等；上述详细数据信息为基于音乐的名称、歌词内容等详细数据；上述统计数据信息为基于特定歌曲所对应的收听行为，可包含不同时段内的收听人数比例、单次收听平均时长等统计数据。

进一步地，所述基于所述

所述

所述

所述

所述

及所述

确定所述

包括：

按照如下函数关系，根据所述

所述

所述

所述

所述

及所述

确定所述

可选地，

即上述对象相似度矩阵的对角线上的元素全为1。

其中，

为所述用户属性矩阵中的第i个用户所对应的属性特征向量，

上述

为根据本发明方法推算出的用户对对象的喜好程度推算指，该值越大，用户对对应对象的喜好的可能性越大，该值的确定过程中，考虑了对象间的关联性，利用了用户在使用过第一对象后，用户的兴趣发送的改变。因此，依据该值可较精准地向用户推荐其感兴趣的对象，满足用户的个性化需求。

图3为本发明实施例提供的一种对象推荐装置组成结构示意图，包括：

获取单元301：用于获取用户对第一对象评价的对象评分矩阵；

生成单元302：用于根据所述对象评分矩阵，生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵；

推荐单元303，用于基于所述兴趣转移矩阵，向用户推荐第二对象。

进一步地，所述生成单元302，具体用于：

进一步地，所述生成单元302，还用于：

为第i个用户所对应的属性特征向量，

为第j个所述第一对象所对应的属性特征向量，

为所述C中第j个所述第一对象对应的向量。

进一步地，所述装置，还包括：

第一确定单元，用于按照如下函数关系，确定所述

其中，

为第k个周期内第i个用户对第j个所述第一对象的使用时长，

为预先设定的阀值。

进一步地，所述装置，还包括：

第二确定单元，用于基于第i个所述第一对象和第j个所述第一对象的标签属性信息，确定第i个所述第一对象的标签特征向量

和第j个所述第一对象的标签特征向量

和第j个所述第一对象的详细数据向量

和第j个所述第一对象的统计数据向量

基于所述

所述

所述

所述

所述

及所述

确定所述

进一步地，所述第二确定单元，还用于：

按照如下函数关系，根据所述

所述

所述

所述

所述

及所述

确定所述

进一步地，所述推荐单元303，用于：

进一步地，所述推荐单元303，还用于：

其中，

为所述用户属性矩阵中的第i个用户所对应的属性特征向量，

本发明还提供了一种计算机存储介质，所述计算机存储介质存储有计算机可执行指令；所述计算机可执行指令被执行后，能够上述对象推荐的方法。

图4为本发明实施例提供一种对象推荐设备组成结构示意图，包括：

收发器401、存储器402及处理器403；

所述存储器402，用于存储计算机可执行指令；

所述处理器403，分别与收发器及存储器连接，用于控制所述收发器及所述存储器，通过执行所述计算机可执行指令能够实现权利要求1至8任一项提供的方法。

本发明实施例提供的另一种对象方法，以图书为例(其他内容类型，如音乐、视频等，同样适用)：

其所依赖的基础数据包括以下两个部分：

(1)用户阅读行为数据

用户阅读行为数据，主要用以描述用户与特定书籍间的交互行为，其具体内容包含了用户ID、书籍ID、书籍章节、时间、阅读持续时间等。该数据一方面提供了用户是否阅读了某特定数据及阅读时长等数据，一方面提供了用户自身的阅读特性，如阅读发生的时段、阅读频次等数据，一方面提供了特定书籍对应的阅读行为特征，如平均单次阅读时长、平均阅读总时长等。

(2)书籍内容描述性数据

内容描述性数据，主要用以描述书籍自身属性，如名称、作者、体裁等标签数据；摘要、目录、字数、具体内容等详细数据。

基于以上数据，本发明的具体步骤如下：

(1)按照一定时间周期计算获取用户商品评分矩阵

用户商品评分矩阵用以记录特定用户对特定商品的评分数值，体现了用户对不同商品的阅读行为及喜爱程度。用户商品评分矩阵的计算过程如下：

选定一定时间周期(如一周、一个月等)，选取T个时间周期内的用户行为数据，其用户行为数据包括：用户ID、书籍ID、时间、阅读持续时间。每条数据对应的向量形式如下：

其中，uⁱ,b^j分别表示第i个用户及第j书籍，

则表示用户i在时刻c对应的时段内对数据j的阅读时长。

根据以上数据，可进一步整理得特定用户对特定书籍的总阅读时长向量如下：

其中，

表示用户i对书籍j的总阅读时长。

以阅读时长为依据，可推导得特定周期对应的用户书籍的评分矩阵形式如下：

其中，S^k表示第k个周期统计得到的用户评分矩阵，n、m分别为用户个数及书籍数目，

表示用户i对书籍j的评分值，取值范围为0-1，该值通过用户i对书籍j的阅读时长确定，可采用设定阈值或统计比值的方式进行计算，如下所示：

或

其中，

表示预先设定的阈值，t_mean表示所有用户针对特定书籍的阅读时间均值。

(2)按照一定的时间周期计算内容相似度矩阵

内容相似度矩阵记录了在特定的计算规则下，不同书籍间体现出来的相似性数值(取值范围为0-1)，内容相似度计算过程如下：

步骤一：原始数据获得

选定一定的时间周期(由于书籍自身属性变化较小，可选用较长时间，如3个月等)，获取书籍对应的基础内容数据，包含：书籍名称、书籍作者、体裁等标签数据；目录、摘要、具体内容等详细数据；字数等统计数据。

步骤二：原始数据整理

本发明将书籍特性划分为a)标签数据特性；b)详细数据特性；c)统计数据特性三个方面，各方面的整理过程如下：

a)标签数据特性

基于所有书籍的书籍名称、作者、体裁、检索关键词等标签数据建立特征词词典，而后根据特定书籍的标签数据生成标签特征向量，形式如下：

其中，

表示书籍j的标签数据特征向量，

表示书籍j标签数据中特征词c出现的次数。

b)详细数据特性

基于书籍的目录、摘要、内容等详细数据，依据LDA方法(基于隐含狄利克雷分布的主题模型)抽取主题词及书籍主题词归属概率，并生成特定书籍对应的详细数据特征向量，形式如下：

其中，

表示书籍j的标签数据特征向量，

表示书籍j归属于主题d的概率值大小。

c)统计数据特性

基于特定书籍所对应的阅读行为，可得阅读时段分布(即不同时段内的阅读人数比例)、单次阅读平均时长、全文阅读所耗费的平均时长等统计数据。

其中，阅读时段分布，以4小时(或其他周期)为间隔，将一天划分为不同时段，而后分布统计不同时段内的阅读人数比例，将书籍j在时段i对应的阅读比例记为v_i ^j；单次阅读平均时长，即所有用户对特定书籍一次完整阅读过程所持续时间均值，对于中间间隔时间较短(如小于5分钟)的多次阅读可视为一次阅读行为，书籍j对应的一次阅读平均时长记为

全文阅读所耗费的平均时长，即所有阅读完全文所耗费总阅读时长的均值，书籍j对应总时长记为

则可得统计数据特征向量为：

其中，I表示划分时段个数。

步骤三：计算书籍间的相似度

在获得各个书籍对应的特征向量

基础上，可根据当前相似度评估方法进一步计算得到不同商品间的相似度大小，如：

其中，

为书籍j及书籍i间的相似度度量值，αβλ为设定的权重系数，其值大于0；f(·)为向量间的相似度计算函数，可采用余弦相似度计算函数如下：

进一步可以整理得书籍相似度矩阵为

(3)求解计算优化模型，得到用户属性矩阵、数据属性矩阵、商品用户影响矩阵，获得书籍相似度矩阵M及用户商品评分矩阵S^k后，可定义用户属性矩阵如下：

其中，

表示第i个用户所对应的属性特征向量，其中每个特征向量共包含q个元素，q取值可设定。该向量用以描述用户自身属性，可一定程度上代表用户自身的兴趣爱好等特征。

定义书籍属性矩阵如下：

其中，

表示第i个书籍所对应的属性特征向量，其中每个特征向量共包含q个元素。该向量用以描述书籍的自身属性，可以一定程度上代表书籍自身的兴趣偏向等特征。

定义商品用户影响矩阵如下：

其中，

表示第i个书籍所对应的特征向量，其中每个特征向量共包含q个元素。该向量用以描述书籍对用户自身兴趣爱好的影响，可以一定程度上表述用户阅读完特定书籍后其兴趣转移的强度及方向。

表示用户阅读第i本书的之后，阅读行为的兴趣偏好又转移为第j种兴趣偏好的概率。

设定S⁰为零矩阵，则矩阵U、B、C可通过求解以下优化问题得到

其中，α,β,λ,p,g为相关系数，可预先设定，由上述优化问题表达可知该优化问题为凸优化问题，因此可用较为成熟的梯度下降等算法进行求解。

(4)基于用户属性矩阵、书籍属性矩阵、商品用户影响矩阵计算推荐项目经由优化问题的求解，可得各个用户对应的特征属性向量，及各个书籍对应的属性向量、影响向量，因此可以根据每个用户的近期时段内的阅读评分记录(记为

表示用户i对书籍j的阅读评分项，取值为0-1)，计算得特定用户对特定备选推荐书籍的喜好程度值如下：

表示用户i对书籍j喜好程度推算值，后续可根据用户对不同书籍喜好程度值的大小，对备选书籍进行排序，向用户优先推荐喜好程度值较大的书籍。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。