CN111292151A - 对象推荐方法及装置、存储介质及对象推荐设备 - Google Patents

对象推荐方法及装置、存储介质及对象推荐设备 Download PDF

Info

Publication number
CN111292151A
CN111292151A CN201811497121.6A CN201811497121A CN111292151A CN 111292151 A CN111292151 A CN 111292151A CN 201811497121 A CN201811497121 A CN 201811497121A CN 111292151 A CN111292151 A CN 111292151A
Authority
CN
China
Prior art keywords
user
matrix
ith
jth
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811497121.6A
Other languages
English (en)
Other versions
CN111292151B (zh
Inventor
颜建辉
王劲鹏
余东辉
彭涛
蔡润昌
闫宇
邓志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Internet Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Internet Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Internet Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811497121.6A priority Critical patent/CN111292151B/zh
Publication of CN111292151A publication Critical patent/CN111292151A/zh
Application granted granted Critical
Publication of CN111292151B publication Critical patent/CN111292151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种对象推荐方法,包括:获取用户对第一对象评价的对象评分矩阵;根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;基于所述兴趣转移矩阵,向用户推荐第二对象。本发明还同时公开了一种对象推荐装置及一种计算机存储介质。

Description

对象推荐方法及装置、存储介质及对象推荐设备
技术领域
本发明涉及数据业务领域,尤其涉及一种对象推荐方法及装置、存储介质。
背景技术
对象推荐是互联网和电子商务发展的产物,需要建立在海量数据挖掘基础上,向用户提供个性化的信息服务和决策支持。现有的对象推荐方法多从用户对对象的行为数据进行建模,但是现有的模型向用户推荐相关对象的精准度依然达不到预期。
发明内容
本发明实施例提供一种对象推荐方法及装置、存储介质。
本发明的技术方案是这样实现的:
一方面,提供一种对象推荐方法,包括:
获取用户对第一对象评价的对象评分矩阵;
根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;
基于所述兴趣转移矩阵,向用户推荐第二对象。
进一步地,所述根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵,包括:
按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵。
进一步地,所述按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵包括:
按照如下函数关系,根据所述对象评分矩阵为已知量求解所述兴趣转移矩阵:
Figure BDA0001897162500000021
Figure BDA0001897162500000022
其中,α1为预先设定的第一系数,β1为预先设定的第二系数,λ1为预先设定的第三系数,p为预先设定的第四系数,g为预先设定的第五系数,
Figure BDA0001897162500000023
为第i个用户所对应的属性特征向量,
Figure BDA0001897162500000024
为第j个所述第一对象所对应的属性特征向量,
Figure BDA0001897162500000025
为第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量,
Figure BDA0001897162500000026
为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值,
Figure BDA00018971625000000225
为第j个所述第一对象及第i个所述第一对象间的相似度度量值,C为所述兴趣转移矩阵,
Figure BDA0001897162500000027
为所述C中第j个所述第一对象对应的向量。
进一步地,所述方法,还包括:
按照如下函数关系,确定所述
Figure BDA0001897162500000028
Figure BDA0001897162500000029
其中,
Figure BDA00018971625000000210
为第k个周期内第i个用户对第j个所述第一对象的使用时长,
Figure BDA00018971625000000211
为预先设定的阀值。
进一步地,所述方法,还包括:
基于第i个所述第一对象和第j个所述第一对象的标签属性信息,确定第i个所述第一对象的标签特征向量
Figure BDA00018971625000000212
和第j个所述第一对象的标签特征向量
Figure BDA00018971625000000213
基于第i个所述第一对象和第j个所述第一对象的详细数据信息,确定第i个所述第一对象的详细数据向量
Figure BDA00018971625000000214
和第j个所述第一对象的详细数据向量
Figure BDA00018971625000000215
基于第i个所述第一对象和第j个所述第一对象的统计数据信息,确定第i个所述第一对象的统计数据向量
Figure BDA00018971625000000216
和第j个所述第一对象的统计数据向量
Figure BDA00018971625000000217
基于所述
Figure BDA00018971625000000218
所述
Figure BDA00018971625000000219
所述
Figure BDA00018971625000000220
所述
Figure BDA00018971625000000221
所述
Figure BDA00018971625000000222
及所述
Figure BDA00018971625000000223
确定所述
Figure BDA00018971625000000224
进一步地,所述基于所述
Figure BDA0001897162500000031
所述
Figure BDA0001897162500000032
所述
Figure BDA0001897162500000033
所述
Figure BDA0001897162500000034
所述
Figure BDA0001897162500000035
及所述
Figure BDA0001897162500000036
确定所述
Figure BDA0001897162500000037
包括:
按照如下函数关系,根据所述
Figure BDA0001897162500000038
所述
Figure BDA0001897162500000039
所述
Figure BDA00018971625000000310
所述
Figure BDA00018971625000000311
所述
Figure BDA00018971625000000312
及所述
Figure BDA00018971625000000313
确定所述
Figure BDA00018971625000000314
Figure BDA00018971625000000315
其中,α2为预先设定的第六系数,β2为预先设定的第七系数,λ2为预先设定的第八系数,
Figure BDA00018971625000000316
进一步地,所述基于所述兴趣转移矩阵,向用户推荐第二对象,包括:
结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
进一步地,所述结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象,包括:
按照如下函数关系,结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,确定用户的喜好程度推算矩阵:
Figure BDA00018971625000000317
其中,
Figure BDA00018971625000000318
为所述用户的喜好程度推算矩阵中的第i个用户对第j个所述待推荐对象的喜好程度推算值,p为预先设定的第四系数,g为预先设定的第五系数,
Figure BDA00018971625000000319
为所述用户属性矩阵中的第i个用户所对应的属性特征向量,
Figure BDA00018971625000000320
为所述待推荐对象的对象属性矩阵中的第j个所述待推荐对象所对应的属性特征向量,
Figure BDA00018971625000000321
为第t个周期对应的对象评分矩阵中第i个用户对应的评分向量,C为所述兴趣转移矩阵;
依据所述用户的喜好程度推算矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
本发明还提供了一种对象推荐装置,包括:
获取单元:用于获取用户对第一对象评价的对象评分矩阵;
生成单元:用于根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;
推荐单元,用于基于所述兴趣转移矩阵,向用户推荐第二对象。
本发明还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够实现上述对象推荐方法。
收发器、存储器及处理器;
所述存储器,用于存储计算机可执行指令;
所述处理器,分别与收发器及存储器连接,用于控制所述收发器及所述存储器,通过执行所述计算机可执行指令能够实现权利要求1至8任一项提供的方法。
本发明提供的对象推荐方法及装置、存储介质,获取用户对第一对象评价的对象评分矩阵;根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;基于所述兴趣转移矩阵,向用户推荐第二对象。本发明中的兴趣转移矩阵表征了第一对象对用户兴趣转移的影响程度,通过兴趣转移矩阵,可以在用户使用过第一对象后,确定用户改变了的兴趣,从而依据用户改变后的兴趣,较精准地向用户推荐相关对象。
附图说明
图1为本发明实施例提供的一种对象推荐方法的流程示意图;
图2为本发明实施例提供的一种确定对象间的相似度度量值方法的流程示意图;
图3为本发明实施例提供的一种对象推荐装置组成结构示意图;
图4为本发明实施例提供一种对象推荐设备组成结构示意图。
具体实施方式
在本发明的各种实施例中,兴趣转移矩阵表征了第一对象对用户兴趣转移影响程度,利用对象间的关联性,确定用户在使用过第一对象后,用户兴趣发生的改变,从而依据用户兴趣的改变,较精准地向用户推荐相关对象。为使本发明实施例的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明实施例进行详细说明。
图1为本发明实施例提供的一种对象推荐方法的流程示意图,如图1所示,所述对象推荐方法包括以下步骤:
步骤101:获取用户对第一对象评价的对象评分矩阵;
步骤102:根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;
步骤103:基于所述兴趣转移矩阵,向用户推荐第二对象。
本发明中的所述对象可为各种商品和/或服务,在一些实施例中,所述对象还可包括:交换或共享的各种物品或服务。
商品可包括:食品、生活用品等,服务可包括:摄影体验、培训、医学诊疗等。本发明中的对象推荐方法尤其适用于图书、音乐、动漫、游戏等包含一定文字内容的对象。
本发明中的第一对象为用户已使用过的对象,第二对象可与第一对象具有相同或相似的用途,比如:第一对象和第二对象都为推理侦探小说,第一对象和第二对象为不同品牌但相同产地的大米等;第二对象也可与第一对象在功能上或属性上具有关联性,比如:第一、二对象都为同一作者编写的书籍,第一对象为羽毛球拍,第二对象为羽毛球等。本发明利用对象间的关联性,确定用户在使用过第一对象后,用户兴趣发生的改变,从而依据用户兴趣的改变,个性化地向用户推荐用户可能具有较大兴趣使用的第二对象。
对象评分矩阵记录了用户对已使用对象的评分数值,体现了用户对不同对象的使用行为及喜爱程度。可以利用用户对已使用对象的主观评分确定对象评分矩阵,也可以利用用户对对象的使用时长确定对象评分矩阵。由于不同时期用户对对象的喜爱程度会发生变化,可选定一定时间周期,比如:一周、一个月等,确定该时间周期对应的对象评分矩阵。
兴趣转移矩阵为对象对用户自身兴趣爱好的影响,可以表述为用户使用完特定对象后其兴趣转移的强度及方向。兴趣转移矩阵中每个元素,可以表示为用户使用过某对象之后,用户转移的兴趣偏好的概率。
进一步地,所述根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵,包括:
按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵。
按照约束条件,通过对象评分矩阵可唯一确定兴趣转移矩阵。上述约束条件可以为函数关系约束条件等。
进一步地,所述按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵包括:
按照如下函数关系,根据所述对象评分矩阵为已知量求解所述兴趣转移矩阵:
Figure BDA0001897162500000061
Figure BDA0001897162500000062
其中,α1为预先设定的第一系数,β1为预先设定的第二系数,λ1为预先设定的第三系数,p为预先设定的第四系数,g为预先设定的第五系数,
Figure BDA0001897162500000063
为第i个用户所对应的属性特征向量,
Figure BDA00018971625000000612
为第j个所述第一对象所对应的属性特征向量,
Figure BDA0001897162500000064
为第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量,
Figure BDA0001897162500000065
为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值,
Figure BDA0001897162500000066
为第j个所述第一对象及第i个所述第一对象间的相似度度量值,C为所述兴趣转移矩阵,
Figure BDA0001897162500000067
为所述C中第j个所述第一对象对应的向量。
Figure BDA0001897162500000068
为第i个用户所对应的属性特征向量,
Figure BDA0001897162500000069
为第j个所述第一对象所对应的属性特征向量,
Figure BDA00018971625000000610
为兴趣转移矩阵中第j个所述第一对象对应的属性向量,上述
Figure BDA00018971625000000611
中的属性特征信息相匹配。
上述的最小化函数可分为三部分,第一部分为:
Figure BDA0001897162500000071
其中,
Figure BDA0001897162500000072
代表基于用户自身属性信息,获取到的用户长期兴趣信息,
Figure BDA0001897162500000073
为基于第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量及兴趣转移矩阵,获取用户短期兴趣信息,
Figure BDA0001897162500000074
为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值,其代表了第k个周期中用户对对象兴趣的计算值;第二部分为:
Figure BDA0001897162500000075
其中,
Figure BDA0001897162500000076
为基于对象的属性信息,获取到的对象间相关信息,
Figure BDA0001897162500000077
为第j个所述第一对象及第i个所述第一对象间的相似度度量值,其代表了对象间相关信息的计算值,在上述的最小化函数构建过程中,引入上述第二部分的作用为:在以第一部分的用户行为数据生成过程中,加入了丰富可靠的数据,并有利于改善第一部分的用户行为数据稀疏性带来的问题;第三部分为:
Figure BDA0001897162500000078
的作用为防止模型过拟合,造成模型性能下降。约束条件中,
Figure BDA0001897162500000079
作用为避免
Figure BDA00018971625000000710
的不合理赋值。
进一步地,所述方法,还包括:
按照如下函数关系,确定所述
Figure BDA00018971625000000711
Figure BDA00018971625000000712
其中,
Figure BDA00018971625000000713
为第k个周期内第i个用户对第j个所述第一对象的使用时长,
Figure BDA00018971625000000714
为预先设定的阀值。
通过上述函数,可以利用用户对对象的使用时长,确定对象评分矩阵。
可选地,按照如下函数关系,确定所述
Figure BDA00018971625000000715
Figure BDA00018971625000000716
其中,
Figure BDA0001897162500000081
为第k个周期内第i个用户对第j个所述第一对象的使用时长,tmean为用户使用特定对象的时间均值。
图2为本发明实施例提供的一种确定对象间的相似度度量值方法的流程示意图,所述方法,包括:
步骤201:基于第i个所述第一对象和第j个所述第一对象的标签属性信息,确定第i个所述第一对象的标签特征向量
Figure BDA00018971625000000814
和第j个所述第一对象的标签特征向量
Figure BDA0001897162500000082
步骤202:基于第i个所述第一对象和第j个所述第一对象的详细数据信息,确定第i个所述第一对象的详细数据向量
Figure BDA0001897162500000083
和第j个所述第一对象的详细数据向量
Figure BDA0001897162500000084
步骤203:基于第i个所述第一对象和第j个所述第一对象的统计数据信息,确定第i个所述第一对象的统计数据向量
Figure BDA0001897162500000085
和第j个所述第一对象的统计数据向量
Figure BDA0001897162500000086
步骤204:基于所述
Figure BDA0001897162500000087
所述
Figure BDA0001897162500000088
所述
Figure BDA0001897162500000089
所述
Figure BDA00018971625000000810
所述
Figure BDA00018971625000000811
及所述
Figure BDA00018971625000000812
确定所述
Figure BDA00018971625000000813
在本发明中的对象为书籍时,上述标签属性信息为书籍名称、作者、体裁、检索关键词等。首先,基于书籍的标签属性信息建立的书籍特征词典,然后根据特定书籍的标签数据生成该书籍对应的标签特征向量。具体地,可根据特征词典中的标签数据在特定书籍的标签性信息中出现的次数,确定该书籍对应的标签特征向量。比如:建立的书籍特征词典共有100个标签信息组成,其中,该特征词典中下标为50、51、52的标签信息分别为“当年明月”、“明朝”、“万历”,《明朝那些事儿》是一本书,该书作者为“当年明月”,该书的名称中包含有“明朝”,该书的检索关键词为“明朝”、“万历”,则该书对应的标签特征向量包含有100个元素,其中,下标为50、51、52的元素分别为“1”、“2”、“1”,其余元素全为0,该书对应的标签特征向量包含的元素,代表了对应的特征词典中的标签信息,在该书的标签性信息中出现的次数。
上述详细数据信息为基于书籍的目录、摘要、内容等详细数据。可依据文档主题生成模型(Latent Dirichlet Allocation,LDA)获取主题词及书籍主题词归属概率,并生成特定书籍对应的详细数据特征向量。具体地,首先,依据LDA方法,生成每本书籍的主题词及书籍主题词归属概率,然后将每本书籍的主题词组合成主题词典,最后,再依据每本书籍的主题词在主题词典中的位置和书籍主题词归属概率,生成书籍对应的详细数据特征向量。
上述统计数据信息为基于特定书籍所对应的阅读行为,可包含不同时段内的阅读人数比例、单次阅读平均时长、全文阅读所耗费的平均时长等统计数据。其中阅读时段可根据需求,设定阅读周期,比如,以6小时为周期,将一天划分为4个不同时段,而后分布统计不同时段内特定数据对应的阅读人数比例。
上述确定对象间相似度的方法适用于包含一定文字内容的对象,比如:图书、歌曲、动漫、游戏等。当本发明中的对象为歌曲时,上述标签属性信息为表演者、作词者、作曲者、音乐类型、检索关键词等;上述详细数据信息为基于音乐的名称、歌词内容等详细数据;上述统计数据信息为基于特定歌曲所对应的收听行为,可包含不同时段内的收听人数比例、单次收听平均时长等统计数据。
进一步地,所述基于所述
Figure BDA0001897162500000091
所述
Figure BDA0001897162500000092
所述
Figure BDA0001897162500000093
所述
Figure BDA0001897162500000094
所述
Figure BDA0001897162500000095
及所述
Figure BDA0001897162500000096
确定所述
Figure BDA0001897162500000097
包括:
按照如下函数关系,根据所述
Figure BDA0001897162500000098
所述
Figure BDA0001897162500000099
所述
Figure BDA00018971625000000910
所述
Figure BDA00018971625000000911
所述
Figure BDA00018971625000000912
及所述
Figure BDA00018971625000000913
确定所述
Figure BDA00018971625000000914
Figure BDA00018971625000000915
其中,α2为预先设定的第六系数,β2为预先设定的第七系数,λ2为预先设定的第八系数,
Figure BDA00018971625000000916
可选地,
Figure BDA00018971625000000917
即上述对象相似度矩阵的对角线上的元素全为1。
进一步地,所述基于所述兴趣转移矩阵,向用户推荐第二对象,包括:
结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
进一步地,所述结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象,包括:
按照如下函数关系,结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,确定用户的喜好程度推算矩阵:
Figure BDA0001897162500000101
其中,
Figure BDA0001897162500000102
为所述用户的喜好程度推算矩阵中的第i个用户对第j个所述待推荐对象的喜好程度推算值,p为预先设定的第四系数,g为预先设定的第五系数,
Figure BDA0001897162500000103
为所述用户属性矩阵中的第i个用户所对应的属性特征向量,
Figure BDA0001897162500000104
为所述待推荐对象的对象属性矩阵中的第j个所述待推荐对象所对应的属性特征向量,
Figure BDA0001897162500000105
为第t个周期对应的对象评分矩阵中第i个用户对应的评分向量,C为所述兴趣转移矩阵;
依据所述用户的喜好程度推算矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
上述
Figure BDA0001897162500000106
为根据本发明方法推算出的用户对对象的喜好程度推算指,该值越大,用户对对应对象的喜好的可能性越大,该值的确定过程中,考虑了对象间的关联性,利用了用户在使用过第一对象后,用户的兴趣发送的改变。因此,依据该值可较精准地向用户推荐其感兴趣的对象,满足用户的个性化需求。
图3为本发明实施例提供的一种对象推荐装置组成结构示意图,包括:
获取单元301:用于获取用户对第一对象评价的对象评分矩阵;
生成单元302:用于根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;
推荐单元303,用于基于所述兴趣转移矩阵,向用户推荐第二对象。
进一步地,所述生成单元302,具体用于:
按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵。
进一步地,所述生成单元302,还用于:
按照如下函数关系,根据所述对象评分矩阵为已知量求解所述兴趣转移矩阵:
Figure BDA0001897162500000111
Figure BDA0001897162500000112
其中,α1为预先设定的第一系数,β1为预先设定的第二系数,λ1为预先设定的第三系数,p为预先设定的第四系数,g为预先设定的第五系数,
Figure BDA0001897162500000113
为第i个用户所对应的属性特征向量,
Figure BDA0001897162500000114
为第j个所述第一对象所对应的属性特征向量,
Figure BDA0001897162500000115
为第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量,
Figure BDA0001897162500000116
为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值,
Figure BDA0001897162500000117
为第j个所述第一对象及第i个所述第一对象间的相似度度量值,C为所述兴趣转移矩阵,
Figure BDA0001897162500000118
为所述C中第j个所述第一对象对应的向量。
进一步地,所述装置,还包括:
第一确定单元,用于按照如下函数关系,确定所述
Figure BDA0001897162500000119
Figure BDA00018971625000001110
其中,
Figure BDA00018971625000001111
为第k个周期内第i个用户对第j个所述第一对象的使用时长,
Figure BDA00018971625000001112
为预先设定的阀值。
进一步地,所述装置,还包括:
第二确定单元,用于基于第i个所述第一对象和第j个所述第一对象的标签属性信息,确定第i个所述第一对象的标签特征向量
Figure BDA00018971625000001113
和第j个所述第一对象的标签特征向量
Figure BDA00018971625000001114
基于第i个所述第一对象和第j个所述第一对象的详细数据信息,确定第i个所述第一对象的详细数据向量
Figure BDA0001897162500000121
和第j个所述第一对象的详细数据向量
Figure BDA0001897162500000122
基于第i个所述第一对象和第j个所述第一对象的统计数据信息,确定第i个所述第一对象的统计数据向量
Figure BDA0001897162500000123
和第j个所述第一对象的统计数据向量
Figure BDA0001897162500000124
基于所述
Figure BDA0001897162500000125
所述
Figure BDA0001897162500000126
所述
Figure BDA0001897162500000127
所述
Figure BDA0001897162500000128
所述
Figure BDA0001897162500000129
及所述
Figure BDA00018971625000001210
确定所述
Figure BDA00018971625000001211
进一步地,所述第二确定单元,还用于:
按照如下函数关系,根据所述
Figure BDA00018971625000001212
所述
Figure BDA00018971625000001213
所述
Figure BDA00018971625000001214
所述
Figure BDA00018971625000001215
所述
Figure BDA00018971625000001216
及所述
Figure BDA00018971625000001217
确定所述
Figure BDA00018971625000001218
Figure BDA00018971625000001219
其中,α2为预先设定的第六系数,β2为预先设定的第七系数,λ2为预先设定的第八系数,
Figure BDA00018971625000001220
进一步地,所述推荐单元303,用于:
结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
进一步地,所述推荐单元303,还用于:
按照如下函数关系,结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,确定用户的喜好程度推算矩阵:
Figure BDA00018971625000001221
其中,
Figure BDA00018971625000001222
为所述用户的喜好程度推算矩阵中的第i个用户对第j个所述待推荐对象的喜好程度推算值,p为预先设定的第四系数,g为预先设定的第五系数,
Figure BDA00018971625000001223
为所述用户属性矩阵中的第i个用户所对应的属性特征向量,
Figure BDA00018971625000001224
为所述待推荐对象的对象属性矩阵中的第j个所述待推荐对象所对应的属性特征向量,
Figure BDA00018971625000001225
为第t个周期对应的对象评分矩阵中第i个用户对应的评分向量,C为所述兴趣转移矩阵;
依据所述用户的喜好程度推算矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
本发明还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够上述对象推荐的方法。
图4为本发明实施例提供一种对象推荐设备组成结构示意图,包括:
收发器401、存储器402及处理器403;
所述存储器402,用于存储计算机可执行指令;
所述处理器403,分别与收发器及存储器连接,用于控制所述收发器及所述存储器,通过执行所述计算机可执行指令能够实现权利要求1至8任一项提供的方法。
本发明实施例提供的另一种对象方法,以图书为例(其他内容类型,如音乐、视频等,同样适用):
其所依赖的基础数据包括以下两个部分:
(1)用户阅读行为数据
用户阅读行为数据,主要用以描述用户与特定书籍间的交互行为,其具体内容包含了用户ID、书籍ID、书籍章节、时间、阅读持续时间等。该数据一方面提供了用户是否阅读了某特定数据及阅读时长等数据,一方面提供了用户自身的阅读特性,如阅读发生的时段、阅读频次等数据,一方面提供了特定书籍对应的阅读行为特征,如平均单次阅读时长、平均阅读总时长等。
(2)书籍内容描述性数据
内容描述性数据,主要用以描述书籍自身属性,如名称、作者、体裁等标签数据;摘要、目录、字数、具体内容等详细数据。
基于以上数据,本发明的具体步骤如下:
(1)按照一定时间周期计算获取用户商品评分矩阵
用户商品评分矩阵用以记录特定用户对特定商品的评分数值,体现了用户对不同商品的阅读行为及喜爱程度。用户商品评分矩阵的计算过程如下:
选定一定时间周期(如一周、一个月等),选取T个时间周期内的用户行为数据,其用户行为数据包括:用户ID、书籍ID、时间、阅读持续时间。每条数据对应的向量形式如下:
Figure BDA0001897162500000141
其中,ui,bj分别表示第i个用户及第j书籍,
Figure BDA0001897162500000142
则表示用户i在时刻c对应的时段内对数据j的阅读时长。
根据以上数据,可进一步整理得特定用户对特定书籍的总阅读时长向量如下:
Figure BDA0001897162500000143
其中,
Figure BDA0001897162500000144
表示用户i对书籍j的总阅读时长。
以阅读时长为依据,可推导得特定周期对应的用户书籍的评分矩阵形式如下:
Figure BDA0001897162500000145
其中,Sk表示第k个周期统计得到的用户评分矩阵,n、m分别为用户个数及书籍数目,
Figure BDA0001897162500000146
表示用户i对书籍j的评分值,取值范围为0-1,该值通过用户i对书籍j的阅读时长确定,可采用设定阈值或统计比值的方式进行计算,如下所示:
Figure BDA0001897162500000147
Figure BDA0001897162500000148
其中,
Figure BDA0001897162500000149
表示预先设定的阈值,tmean表示所有用户针对特定书籍的阅读时间均值。
(2)按照一定的时间周期计算内容相似度矩阵
内容相似度矩阵记录了在特定的计算规则下,不同书籍间体现出来的相似性数值(取值范围为0-1),内容相似度计算过程如下:
步骤一:原始数据获得
选定一定的时间周期(由于书籍自身属性变化较小,可选用较长时间,如3个月等),获取书籍对应的基础内容数据,包含:书籍名称、书籍作者、体裁等标签数据;目录、摘要、具体内容等详细数据;字数等统计数据。
步骤二:原始数据整理
本发明将书籍特性划分为a)标签数据特性;b)详细数据特性;c)统计数据特性三个方面,各方面的整理过程如下:
a)标签数据特性
基于所有书籍的书籍名称、作者、体裁、检索关键词等标签数据建立特征词词典,而后根据特定书籍的标签数据生成标签特征向量,形式如下:
Figure BDA0001897162500000151
其中,
Figure BDA0001897162500000152
表示书籍j的标签数据特征向量,
Figure BDA0001897162500000153
表示书籍j标签数据中特征词c出现的次数。
b)详细数据特性
基于书籍的目录、摘要、内容等详细数据,依据LDA方法(基于隐含狄利克雷分布的主题模型)抽取主题词及书籍主题词归属概率,并生成特定书籍对应的详细数据特征向量,形式如下:
Figure BDA0001897162500000154
其中,
Figure BDA0001897162500000155
表示书籍j的标签数据特征向量,
Figure BDA0001897162500000156
表示书籍j归属于主题d的概率值大小。
c)统计数据特性
基于特定书籍所对应的阅读行为,可得阅读时段分布(即不同时段内的阅读人数比例)、单次阅读平均时长、全文阅读所耗费的平均时长等统计数据。
其中,阅读时段分布,以4小时(或其他周期)为间隔,将一天划分为不同时段,而后分布统计不同时段内的阅读人数比例,将书籍j在时段i对应的阅读比例记为vi j;单次阅读平均时长,即所有用户对特定书籍一次完整阅读过程所持续时间均值,对于中间间隔时间较短(如小于5分钟)的多次阅读可视为一次阅读行为,书籍j对应的一次阅读平均时长记为
Figure BDA0001897162500000157
全文阅读所耗费的平均时长,即所有阅读完全文所耗费总阅读时长的均值,书籍j对应总时长记为
Figure BDA0001897162500000161
则可得统计数据特征向量为:
Figure BDA0001897162500000162
其中,I表示划分时段个数。
步骤三:计算书籍间的相似度
在获得各个书籍对应的特征向量
Figure BDA0001897162500000163
基础上,可根据当前相似度评估方法进一步计算得到不同商品间的相似度大小,如:
Figure BDA0001897162500000164
其中,
Figure BDA0001897162500000165
为书籍j及书籍i间的相似度度量值,αβλ为设定的权重系数,其值大于0;f(·)为向量间的相似度计算函数,可采用余弦相似度计算函数如下:
Figure BDA0001897162500000166
进一步可以整理得书籍相似度矩阵为
Figure BDA0001897162500000167
(3)求解计算优化模型,得到用户属性矩阵、数据属性矩阵、商品用户影响矩阵,获得书籍相似度矩阵M及用户商品评分矩阵Sk后,可定义用户属性矩阵如下:
Figure BDA0001897162500000168
其中,
Figure BDA0001897162500000169
表示第i个用户所对应的属性特征向量,其中每个特征向量共包含q个元素,q取值可设定。该向量用以描述用户自身属性,可一定程度上代表用户自身的兴趣爱好等特征。
定义书籍属性矩阵如下:
Figure BDA0001897162500000171
其中,
Figure BDA0001897162500000172
表示第i个书籍所对应的属性特征向量,其中每个特征向量共包含q个元素。该向量用以描述书籍的自身属性,可以一定程度上代表书籍自身的兴趣偏向等特征。
定义商品用户影响矩阵如下:
Figure BDA0001897162500000173
其中,
Figure BDA0001897162500000174
表示第i个书籍所对应的特征向量,其中每个特征向量共包含q个元素。该向量用以描述书籍对用户自身兴趣爱好的影响,可以一定程度上表述用户阅读完特定书籍后其兴趣转移的强度及方向。
Figure BDA0001897162500000175
表示用户阅读第i本书的之后,阅读行为的兴趣偏好又转移为第j种兴趣偏好的概率。
设定S0为零矩阵,则矩阵U、B、C可通过求解以下优化问题得到
Figure BDA0001897162500000176
Figure BDA0001897162500000177
其中,α,β,λ,p,g为相关系数,可预先设定,由上述优化问题表达可知该优化问题为凸优化问题,因此可用较为成熟的梯度下降等算法进行求解。
(4)基于用户属性矩阵、书籍属性矩阵、商品用户影响矩阵计算推荐项目经由优化问题的求解,可得各个用户对应的特征属性向量,及各个书籍对应的属性向量、影响向量,因此可以根据每个用户的近期时段内的阅读评分记录(记为
Figure BDA0001897162500000178
Figure BDA0001897162500000179
表示用户i对书籍j的阅读评分项,取值为0-1),计算得特定用户对特定备选推荐书籍的喜好程度值如下:
Figure BDA0001897162500000181
Figure BDA0001897162500000182
表示用户i对书籍j喜好程度推算值,后续可根据用户对不同书籍喜好程度值的大小,对备选书籍进行排序,向用户优先推荐喜好程度值较大的书籍。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种对象推荐方法,其特征在于,所述方法,包括:
获取用户对第一对象评价的对象评分矩阵;
根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;
基于所述兴趣转移矩阵,向用户推荐第二对象。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵,包括:
按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵。
3.根据权利要求2所述的方法,其特征在于,
所述按照预定约束条件,以所述对象评分矩阵为已知量求解所述兴趣转移矩阵包括:
按照如下函数关系,根据所述对象评分矩阵为已知量求解所述兴趣转移矩阵:
Figure FDA0001897162490000011
其中,α1为预先设定的第一系数,β1为预先设定的第二系数,λ1为预先设定的第三系数,p为预先设定的第四系数,g为预先设定的第五系数,
Figure FDA0001897162490000012
为第i个用户所对应的属性特征向量,
Figure FDA0001897162490000013
为第j个所述第一对象所对应的属性特征向量,
Figure FDA0001897162490000014
为第k-1个周期对应的对象评分矩阵中第i个用户对应的评分向量,
Figure FDA0001897162490000015
为第k个周期对应的对象评分矩阵中第i个用户对第j个所述第一对象的评分值,
Figure FDA0001897162490000016
为第j个所述第一对象及第i个所述第一对象间的相似度度量值,C为所述兴趣转移矩阵,
Figure FDA0001897162490000017
为所述C中第j个所述第一对象对应的向量。
4.根据权利要求3所述的方法,其特征在于,所述方法,还包括:
按照如下函数关系,确定所述
Figure FDA0001897162490000021
Figure FDA0001897162490000022
其中,
Figure FDA0001897162490000023
为第k个周期内第i个用户对第j个所述第一对象的使用时长,
Figure FDA0001897162490000024
为预先设定的阀值。
5.根据权利要求3所述的方法,其特征在于,所述方法,还包括:
基于第i个所述第一对象和第j个所述第一对象的标签属性信息,确定第i个所述第一对象的标签特征向量
Figure FDA0001897162490000025
和第j个所述第一对象的标签特征向量
Figure FDA0001897162490000026
基于第i个所述第一对象和第j个所述第一对象的详细数据信息,确定第i个所述第一对象的详细数据向量
Figure FDA0001897162490000027
和第j个所述第一对象的详细数据向量
Figure FDA0001897162490000028
基于第i个所述第一对象和第j个所述第一对象的统计数据信息,确定第i个所述第一对象的统计数据向量
Figure FDA0001897162490000029
和第j个所述第一对象的统计数据向量
Figure FDA00018971624900000210
基于所述
Figure FDA00018971624900000211
所述
Figure FDA00018971624900000212
所述
Figure FDA00018971624900000213
所述
Figure FDA00018971624900000214
所述
Figure FDA00018971624900000215
及所述
Figure FDA00018971624900000216
确定所述
Figure FDA00018971624900000217
6.根据权利要求5所述的方法,其特征在于,所述基于所述
Figure FDA00018971624900000218
所述
Figure FDA00018971624900000219
所述
Figure FDA00018971624900000220
所述
Figure FDA00018971624900000221
所述
Figure FDA00018971624900000222
及所述
Figure FDA00018971624900000223
确定所述
Figure FDA00018971624900000224
包括:
按照如下函数关系,根据所述
Figure FDA00018971624900000225
所述
Figure FDA00018971624900000226
所述
Figure FDA00018971624900000227
所述
Figure FDA00018971624900000228
所述
Figure FDA00018971624900000229
及所述
Figure FDA00018971624900000230
确定所述
Figure FDA00018971624900000231
Figure FDA00018971624900000232
其中,α2为预先设定的第六系数,β2为预先设定的第七系数,λ2为预先设定的第八系数,
Figure FDA00018971624900000233
7.根据权利要求1所述的方法,其特征在于,
所述基于所述兴趣转移矩阵,向用户推荐第二对象,包括:
结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
8.根据权利要求7所述的方法,其特征在于,
所述结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象,包括:
按照如下函数关系,结合用户属性矩阵、待推荐对象的对象属性矩阵及兴趣转移矩阵,确定用户的喜好程度推算矩阵:
Figure FDA0001897162490000031
其中,
Figure FDA0001897162490000032
为所述用户的喜好程度推算矩阵中的第i个用户对第j个所述待推荐对象的喜好程度推算值,p为预先设定的第四系数,g为预先设定的第五系数,
Figure FDA0001897162490000033
为所述用户属性矩阵中的第i个用户所对应的属性特征向量,
Figure FDA0001897162490000034
为所述待推荐对象的对象属性矩阵中的第j个所述待推荐对象所对应的属性特征向量,
Figure FDA0001897162490000035
为第t个周期对应的对象评分矩阵中第i个用户对应的评分向量,C为所述兴趣转移矩阵;
依据所述用户的喜好程度推算矩阵,从所述待推荐对象中选择出向所述用户推荐的第二对象。
9.一种对象推荐装置,其特征在于,所述装置,包括:
获取单元:用于获取用户对第一对象评价的对象评分矩阵;
生成单元:用于根据所述对象评分矩阵,生成表征第一对象对用户兴趣转移影响程度的兴趣转移矩阵;
推荐单元,用于基于所述兴趣转移矩阵,向用户推荐第二对象。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被执行后,能够实现权利要求1至8任一项提供的方法。
11.一种对象推荐设备,其特征在于,所述设备包括:
收发器、存储器及处理器;
所述存储器,用于存储计算机可执行指令;
所述处理器,分别与收发器及存储器连接,用于控制所述收发器及所述存储器,通过执行所述计算机可执行指令能够实现权利要求1至8任一项提供的方法。
CN201811497121.6A 2018-12-07 2018-12-07 对象推荐方法及装置、存储介质及对象推荐设备 Active CN111292151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811497121.6A CN111292151B (zh) 2018-12-07 2018-12-07 对象推荐方法及装置、存储介质及对象推荐设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811497121.6A CN111292151B (zh) 2018-12-07 2018-12-07 对象推荐方法及装置、存储介质及对象推荐设备

Publications (2)

Publication Number Publication Date
CN111292151A true CN111292151A (zh) 2020-06-16
CN111292151B CN111292151B (zh) 2023-07-25

Family

ID=71029331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811497121.6A Active CN111292151B (zh) 2018-12-07 2018-12-07 对象推荐方法及装置、存储介质及对象推荐设备

Country Status (1)

Country Link
CN (1) CN111292151B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859155A (zh) * 2020-08-04 2020-10-30 深圳前海微众银行股份有限公司 物品推荐方法、设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104935963A (zh) * 2015-05-29 2015-09-23 中国科学院信息工程研究所 一种基于时序数据挖掘的视频推荐方法
CN105022760A (zh) * 2014-04-30 2015-11-04 深圳市腾讯计算机系统有限公司 一种新闻推荐方法及装置
CN105488213A (zh) * 2015-12-11 2016-04-13 哈尔滨工业大学深圳研究生院 面向lbs的基于马尔可夫预测算法的个性化推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022760A (zh) * 2014-04-30 2015-11-04 深圳市腾讯计算机系统有限公司 一种新闻推荐方法及装置
CN104935963A (zh) * 2015-05-29 2015-09-23 中国科学院信息工程研究所 一种基于时序数据挖掘的视频推荐方法
CN105488213A (zh) * 2015-12-11 2016-04-13 哈尔滨工业大学深圳研究生院 面向lbs的基于马尔可夫预测算法的个性化推荐方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859155A (zh) * 2020-08-04 2020-10-30 深圳前海微众银行股份有限公司 物品推荐方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN111292151B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
US10366119B2 (en) Customized content stream utilizing dwelltime-based machine learning
Zhao et al. Topical keyphrase extraction from twitter
US8301623B2 (en) Probabilistic recommendation system
US10515130B2 (en) Prioritizing items from different categories in a news stream
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN104615775B (zh) 一种用户推荐方法及装置
US20010013009A1 (en) System and method for computer-based marketing
CN104794207B (zh) 一种基于协作的推荐系统及其工作方法
US8713028B2 (en) Related news articles
JP5395729B2 (ja) 情報提示装置
KR20160019445A (ko) 소비 가능한 콘텐트의 사용법을 추천에 병합하는 방법
TW201520790A (zh) 個性化資料搜尋方法和裝置
CN110348920A (zh) 一种推荐产品的方法及装置
Yu et al. Latent dirichlet allocation based diversified retrieval for e-commerce search
CN109684548B (zh) 一种基于用户图谱的数据推荐方法
CN113065062A (zh) 一种基于用户阅读时间行为的新闻推荐方法及系统
CN111310038A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN115878903B (zh) 基于大数据的信息智能推荐方法
Xie et al. A probabilistic recommendation method inspired by latent Dirichlet allocation model
CN111292151A (zh) 对象推荐方法及装置、存储介质及对象推荐设备
KR101542417B1 (ko) 사용자 선호도 학습 방법 및 장치
KR20110043369A (ko) 음악 추천을 위한 연관성 분석 방법
CN109919699B (zh) 项目推荐方法、项目推荐系统以及计算机可读介质
Ge A user-based collaborative filtering recommendation algorithm based on folksonomy smoothing
CN116610858A (zh) 一种信息分发方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant