CN112528161B - 一种基于物品点击序列优化的会话推荐方法 - Google Patents

一种基于物品点击序列优化的会话推荐方法 Download PDF

Info

Publication number
CN112528161B
CN112528161B CN202110178084.8A CN202110178084A CN112528161B CN 112528161 B CN112528161 B CN 112528161B CN 202110178084 A CN202110178084 A CN 202110178084A CN 112528161 B CN112528161 B CN 112528161B
Authority
CN
China
Prior art keywords
user
item
interest
sequence
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110178084.8A
Other languages
English (en)
Other versions
CN112528161A (zh
Inventor
刘峤
蓝天
吴祖峰
代婷婷
宋明慧
周乐
曾义夫
孙建强
曾维智
张志鹏
李银强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110178084.8A priority Critical patent/CN112528161B/zh
Publication of CN112528161A publication Critical patent/CN112528161A/zh
Application granted granted Critical
Publication of CN112528161B publication Critical patent/CN112528161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于物品点击序列优化的会话推荐方法,属于会话推荐技术领域。本发明所述方法利用最短路径方法提炼用户最感兴趣的物品序列,能够剔除长序列中多条兴趣路径对用户兴趣表征的干扰;本发明所述方法从最短路径物品序列的长度分布与用户点击的兴趣强弱出发,定义了三种用户兴趣类型,能够捕获不同类型下物品点击行为随时间变化的用户兴趣,可有效建模长序列的用户兴趣。

Description

一种基于物品点击序列优化的会话推荐方法
技术领域
本发明属于会话推荐技术领域,具体涉及一种基于物品点击序列优化的会话推荐方法。
背景技术
随着互联网的快速发展和各种电子产品的普及,京东、拼多多等电商平台走进大众视野,实现了消费模式由传统的实体店购买到线上的转变,为市民生活提供了便捷服务。对电商企业而言,电商平台物品数量庞大,不同用户间的消费兴趣迥异,如何提升用户购买率以提升收益是当前面临的一个挑战。学术界将其归纳为一个基于序列学习的会话推荐问题,即如何利用用户会话日志中记录的历史行为(如浏览、购买)预测用户下一时刻的点击行为,达到如用户购买电脑后,平台会自动推荐鼠标、键盘等物品的目的。
目前会话推荐主要存在两个技术问题,一是用户通常是匿名的,仅通过当前会话很难获得足够的上下文信息对用户兴趣进行建模;二是数据中不包含用户对物品的主观意见(如评分),因此只能通过历史行为数据对用户兴趣进行间接推测。文献 “NeuralAttentive Session-based Recommendation[C]//Proceedings of the 17th ACM CIKMon Conference on Information and Knowledge Management, Singapore, ACM Press,2017,1419-1428”和“Session-Based Recommendation with Graph Neural Networks[C]//Proceedings of the 33th AAAI Conference on Artificial Intelligence,Hawaii, USA, AAAI Press,2019, 346-353”先后把循环神经网络、注意力机制以及图神经网络应用于推荐系统用于提取用户兴趣特征。然而上述现有技术在对物品点击序列提取用户兴趣特征时,侧重于强调序列最后一个物品对预测结果的重要性,而忽视了对具有动态变化特点的用户兴趣建模,直接影响预测准确率。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种基于物品点击序列优化的会话推荐方法。
本发明所提出的技术问题是这样解决的:
一种基于物品点击序列优化的会话推荐方法,包括以下步骤:
步骤1. 根据用户物品点击序列,构建物品字典、物品集合、物品邻接矩阵与有向物品关联图;
步骤2. 对物品字典进行初始化,形成物品字典和物品集合的高维空间表示,利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空间表示,形成用户物品点击序列的高维空间表示;
步骤3. 利用最短路径算法优化用户物品点击序列,提取最短路径序列;
步骤4. 定义初始兴趣、直接兴趣和动态兴趣三种用户兴趣类型,利用用户物品点击序列的最短路径序列长度判定用户兴趣类型,并计算对应用户兴趣类型的高维空间表示;
步骤5. 基于三种用户兴趣类型的条件概率,采用全概率公式对用户物品点击序列进行建模,并用负对数似然损失函数进行模型优化,取概率最大值对应的物品作为会话推荐的下一时刻点击推荐的物品。
进一步的,步骤1的具体过程为:、
用户物品点击序列为
Figure 334304DEST_PATH_IMAGE001
Figure 913053DEST_PATH_IMAGE002
为用户第p次点击的物品,
Figure 691653DEST_PATH_IMAGE003
Figure 90274DEST_PATH_IMAGE004
为用户点击的物品数量,用户物品点击序列的物品集合为V,物品集合 为物品字典的子集,物品集合中物品个数为
Figure 612522DEST_PATH_IMAGE005
Figure 717881DEST_PATH_IMAGE006
,物品邻接矩阵为
Figure 27902DEST_PATH_IMAGE007
,有向物 品关联图为
Figure 851502DEST_PATH_IMAGE008
,其中
Figure 646282DEST_PATH_IMAGE009
代表用户点击物品
Figure 199623DEST_PATH_IMAGE010
后再点击
Figure 116764DEST_PATH_IMAGE011
Figure 99763DEST_PATH_IMAGE012
Figure 88448DEST_PATH_IMAGE013
Figure 371662DEST_PATH_IMAGE014
Figure 459703DEST_PATH_IMAGE015
Figure 54633DEST_PATH_IMAGE016
进一步的,步骤2的具体过程为:
步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化,得到物品字典 的高维空间表示
Figure 519112DEST_PATH_IMAGE017
,提取物品集合的高维空间表示
Figure 391253DEST_PATH_IMAGE018
Figure 650196DEST_PATH_IMAGE019
为物品集合中第k个物品的高维空间表示,
Figure 233887DEST_PATH_IMAGE020
Figure 502057DEST_PATH_IMAGE021
Figure 228704DEST_PATH_IMAGE022
维矩阵,d为 物品高维空间表示的维度;
步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空 间表示,更新后的物品集合的高维空间表示为
Figure 986445DEST_PATH_IMAGE023
Figure 493650DEST_PATH_IMAGE024
为更新 后的第k个物品的高维空间表示;
Figure 503194DEST_PATH_IMAGE025
其中,gatedGNN为门控图卷积神经网络函数,GRU为门控循环单元函数;
步骤2-3.将用户物品点击序列
Figure 208982DEST_PATH_IMAGE026
中的所有物品用
Figure 278569DEST_PATH_IMAGE027
代替,形成用户物品点击序 列的高维空间表示
Figure 7490DEST_PATH_IMAGE028
Figure 679780DEST_PATH_IMAGE029
为用户第p次点击的物品的 高维空间表示,
Figure 177758DEST_PATH_IMAGE030
Figure 152667DEST_PATH_IMAGE031
维矩阵。
进一步的,步骤3的具体过程为:
利用最短路径算法获取用户物品点击序列中第一个物品
Figure 368885DEST_PATH_IMAGE032
到最后一个物品
Figure 346330DEST_PATH_IMAGE033
的最短路径序列
Figure 902076DEST_PATH_IMAGE034
,实现用户物品点击序列优化;
Figure 110204DEST_PATH_IMAGE035
其中,
Figure 876035DEST_PATH_IMAGE036
为迪杰斯特拉函数。
进一步的,步骤4的具体过程为:
当用户物品点击序列的最短路径序列长度为1时,用户兴趣类型为初始兴趣,建立初始兴趣ini,初始兴趣的高维空间表示为:
Figure 827810DEST_PATH_IMAGE037
当用户物品点击序列的最短路径序列长度为2时,用户兴趣类型为直接兴趣,建立直接兴趣dir,直接兴趣的高维空间表示为:
Figure 238063DEST_PATH_IMAGE038
其中,
Figure 617092DEST_PATH_IMAGE039
为平均池化函数;
当用户物品点击序列的最短路径序列长度大于2时,用户兴趣类型为动态兴趣,统 计用户物品点击序列中物品的点击频次,选择出现频次最多的前两个物品
Figure 870218DEST_PATH_IMAGE040
Figure 360106DEST_PATH_IMAGE041
作 为用户最感兴趣的物品,然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中 最后一个物品之间的最短距离
Figure 890444DEST_PATH_IMAGE042
Figure 502691DEST_PATH_IMAGE043
Figure 180797DEST_PATH_IMAGE044
Figure 412058DEST_PATH_IMAGE045
建立动态兴趣dyn,动态兴趣的高维空间表示为:
Figure 859220DEST_PATH_IMAGE046
其中,
Figure 143833DEST_PATH_IMAGE047
Figure 43656DEST_PATH_IMAGE048
分别为
Figure 813029DEST_PATH_IMAGE049
Figure 380276DEST_PATH_IMAGE050
的高维空 间表示。
进一步的,步骤5的具体过程为:
由用户物品点击序列
Figure 334326DEST_PATH_IMAGE051
预测下一个点击物品的概率
Figure 721445DEST_PATH_IMAGE052
的具体计算方 法如下:
Figure 294509DEST_PATH_IMAGE053
Figure 44159DEST_PATH_IMAGE054
Figure 106793DEST_PATH_IMAGE055
Figure 918891DEST_PATH_IMAGE056
分别为用户物品点击序列
Figure 92383DEST_PATH_IMAGE057
中用户兴 趣类型分别为初始兴趣、直接兴趣和动态兴趣的概率,具体计算方法如下:
Figure 430961DEST_PATH_IMAGE058
Figure 664496DEST_PATH_IMAGE059
Figure 963890DEST_PATH_IMAGE060
Figure 941074DEST_PATH_IMAGE061
其中,softmax和tanh为激活函数,
Figure 635622DEST_PATH_IMAGE062
为激活函数softmax的学习参数,
Figure 40059DEST_PATH_IMAGE063
Figure 92329DEST_PATH_IMAGE064
Figure 935520DEST_PATH_IMAGE065
Figure 920793DEST_PATH_IMAGE066
Figure 433814DEST_PATH_IMAGE067
为激活函数tanh的学习参数,上标T表示转置;
Figure 770118DEST_PATH_IMAGE068
Figure 151420DEST_PATH_IMAGE069
Figure 256780DEST_PATH_IMAGE070
分别为用户物品点 击序列
Figure 940702DEST_PATH_IMAGE071
中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率, 具体计算方法如下:
若用户物品点击序列的最短路径序列长度为1,
Figure 764301DEST_PATH_IMAGE072
Figure 949295DEST_PATH_IMAGE073
,否则,
Figure 846844DEST_PATH_IMAGE074
若用户物品点击序列的最短路径序列长度为2,
Figure 29564DEST_PATH_IMAGE075
Figure 638662DEST_PATH_IMAGE076
,否则,
Figure 299450DEST_PATH_IMAGE077
若用户物品点击序列的最短路径序列长度大于2,
Figure 317085DEST_PATH_IMAGE078
Figure 405126DEST_PATH_IMAGE079
,否则,
Figure 56DEST_PATH_IMAGE080
其中,
Figure 649823DEST_PATH_IMAGE081
Figure 584281DEST_PATH_IMAGE082
Figure 780907DEST_PATH_IMAGE083
Figure 800815DEST_PATH_IMAGE084
Figure 131303DEST_PATH_IMAGE085
Figure 857950DEST_PATH_IMAGE086
Figure 881270DEST_PATH_IMAGE087
Figure 388475DEST_PATH_IMAGE088
Figure 866860DEST_PATH_IMAGE089
Figure 775911DEST_PATH_IMAGE090
为激活函数tanh的学习参数;
取概率
Figure 438973DEST_PATH_IMAGE091
中最大值对应的物品作为会话推荐的下一时刻点击推荐的 物品。
本发明的有益效果是:
本发明所述方法利用最短路径方法提炼用户最感兴趣的物品序列,能够剔除长序列中多条兴趣路径对用户兴趣表征的干扰;本发明所述方法从最短路径物品序列的长度分布与用户点击的兴趣强弱出发,定义了三种用户兴趣类型,能够捕获不同类型下物品点击行为随时间变化的用户兴趣,可有效建模长序列的用户兴趣。
具体实施方式
下面结合实施例对本发明进行进一步的说明。
本实施例提供一种基于物品点击序列优化的会话推荐方法,包括以下步骤:
步骤1. 用户物品点击序列(即一条会话)为
Figure 433474DEST_PATH_IMAGE001
Figure 715551DEST_PATH_IMAGE092
为 用户第p次点击的物品,
Figure 308468DEST_PATH_IMAGE093
Figure 345694DEST_PATH_IMAGE094
为用户点击的物品数量,用户物品点击序列的 物品集合为V,物品集合为物品字典的子集,物品集合中物品个数为
Figure 499595DEST_PATH_IMAGE095
,且一般地
Figure 647680DEST_PATH_IMAGE096
,物品邻接矩阵为
Figure 328060DEST_PATH_IMAGE097
,有向物品关联图为
Figure 536187DEST_PATH_IMAGE098
,其中
Figure 177384DEST_PATH_IMAGE009
代表用户点击物品
Figure 863580DEST_PATH_IMAGE010
后再点击
Figure 929625DEST_PATH_IMAGE011
Figure 246337DEST_PATH_IMAGE012
Figure 437147DEST_PATH_IMAGE013
Figure 989351DEST_PATH_IMAGE014
Figure 316427DEST_PATH_IMAGE015
Figure 804041DEST_PATH_IMAGE016
步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化,得到物品字典 的高维空间表示
Figure 482147DEST_PATH_IMAGE099
,提取物品集合的高维空间表示
Figure 339506DEST_PATH_IMAGE100
Figure 786668DEST_PATH_IMAGE101
为物品集合中第k个物品的高维空间表示,
Figure 445183DEST_PATH_IMAGE102
Figure 672902DEST_PATH_IMAGE103
Figure 504591DEST_PATH_IMAGE104
维矩阵,
Figure 9522DEST_PATH_IMAGE105
为 物品高维空间表示的维度;
步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空 间表示,更新后的物品集合的高维空间表示为
Figure 635676DEST_PATH_IMAGE106
Figure 350691DEST_PATH_IMAGE107
为更 新后的第k个物品的高维空间表示;
Figure 986071DEST_PATH_IMAGE108
其中,gatedGNN(gated graph neural network,gatedGNN)为门控图卷积神经网络函数,GRU(Gated Recurrent Unit,GRU)为门控循环单元函数;
步骤2-3.将用户物品点击序列
Figure 345509DEST_PATH_IMAGE109
中的所有物品用
Figure 470459DEST_PATH_IMAGE110
代替,形成用户物品点击序 列的高维表示
Figure 344874DEST_PATH_IMAGE111
Figure 721629DEST_PATH_IMAGE112
为用户第p次点击的物品的高 维空间表示,
Figure 997890DEST_PATH_IMAGE113
Figure 795207DEST_PATH_IMAGE114
维矩阵;
步骤3. 利用最短路径算法获取用户物品点击序列中第一个物品
Figure 156918DEST_PATH_IMAGE115
到最后一个物 品
Figure 71784DEST_PATH_IMAGE116
的最短路径序列
Figure 530447DEST_PATH_IMAGE117
,实现用户物品点击序列优化;
Figure 934884DEST_PATH_IMAGE118
其中,
Figure 721574DEST_PATH_IMAGE119
为迪杰斯特拉函数;
步骤4. 当用户物品点击序列的最短路径序列长度为1时,用户兴趣类型为初始兴趣,建立初始兴趣ini,初始兴趣的高维空间表示为:
Figure 236869DEST_PATH_IMAGE120
当用户物品点击序列的最短路径序列长度为2时,用户兴趣类型为直接兴趣,建立直接兴趣dir,直接兴趣的高维空间表示为:
Figure 550039DEST_PATH_IMAGE121
其中,
Figure 125377DEST_PATH_IMAGE122
为平均池化函数;
当用户物品点击序列的最短路径序列长度大于2时,用户兴趣类型为动态兴趣,统 计用户物品点击序列中物品的点击频次,选择出现频次最多的前两个物品
Figure 399363DEST_PATH_IMAGE123
Figure 718349DEST_PATH_IMAGE124
作 为用户最感兴趣的物品,然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中 最后一个物品之间的最短距离
Figure 886025DEST_PATH_IMAGE125
Figure 835527DEST_PATH_IMAGE126
Figure 393547DEST_PATH_IMAGE127
Figure 80006DEST_PATH_IMAGE128
建立动态兴趣dyn,动态兴趣的高维空间表示为:
Figure 39871DEST_PATH_IMAGE129
其中,
Figure 894695DEST_PATH_IMAGE130
Figure 205591DEST_PATH_IMAGE131
分别为
Figure 928696DEST_PATH_IMAGE132
Figure 743068DEST_PATH_IMAGE133
的高维空 间表示;
步骤5. 基于三种用户兴趣类型的条件概率,采用全概率公式对用户物品点击序列进行建模,并用负对数似然损失函数进行模型优化,取概率最大值对应的物品作为会话推荐的下一时刻点击推荐的物品;
由用户物品点击序列
Figure 299951DEST_PATH_IMAGE134
预测下一个点击物品的概率
Figure 894881DEST_PATH_IMAGE135
的具体计算方 法如下:
Figure 359360DEST_PATH_IMAGE136
Figure 965922DEST_PATH_IMAGE137
Figure 490444DEST_PATH_IMAGE138
Figure 572670DEST_PATH_IMAGE139
分别为用户物品点击序列
Figure 778523DEST_PATH_IMAGE140
中用户兴趣 类型分别为初始兴趣、直接兴趣和动态兴趣的概率,具体计算方法如下:
Figure 567488DEST_PATH_IMAGE141
Figure 826693DEST_PATH_IMAGE142
Figure 68318DEST_PATH_IMAGE143
Figure 812284DEST_PATH_IMAGE144
其中,softmax和tanh为激活函数,
Figure 49230DEST_PATH_IMAGE145
为激活函数softmax的学习参数,
Figure 649975DEST_PATH_IMAGE146
Figure 582159DEST_PATH_IMAGE147
Figure 926553DEST_PATH_IMAGE148
Figure 752427DEST_PATH_IMAGE149
Figure 524073DEST_PATH_IMAGE150
为激活函数tanh的学习参数,上标T表示转置;
Figure 943554DEST_PATH_IMAGE151
Figure 419534DEST_PATH_IMAGE152
Figure 37597DEST_PATH_IMAGE153
分别为用户物品点 击序列
Figure 448987DEST_PATH_IMAGE154
中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率, 具体计算方法如下:
若用户物品点击序列的最短路径序列长度为1,
Figure 716283DEST_PATH_IMAGE155
Figure 402479DEST_PATH_IMAGE156
,否则,
Figure 78311DEST_PATH_IMAGE157
若用户物品点击序列的最短路径序列长度为2,
Figure 519657DEST_PATH_IMAGE158
Figure 710466DEST_PATH_IMAGE159
,否则,
Figure 138037DEST_PATH_IMAGE160
若用户物品点击序列的最短路径序列长度大于2,
Figure 730692DEST_PATH_IMAGE161
Figure 342939DEST_PATH_IMAGE162
,否则,
Figure 21045DEST_PATH_IMAGE163
其中,
Figure 986727DEST_PATH_IMAGE164
Figure 433889DEST_PATH_IMAGE165
Figure 217037DEST_PATH_IMAGE083
Figure 585702DEST_PATH_IMAGE084
Figure 417391DEST_PATH_IMAGE085
Figure 271123DEST_PATH_IMAGE086
Figure 162855DEST_PATH_IMAGE087
Figure 18816DEST_PATH_IMAGE088
Figure 450934DEST_PATH_IMAGE089
Figure 872688DEST_PATH_IMAGE090
为激活函数tanh的学习参数;
取概率
Figure 873005DEST_PATH_IMAGE091
中最大值对应的物品作为会话推荐的下一时刻点击推荐的 物品。

Claims (2)

1.一种基于物品点击序列优化的会话推荐方法,其特征在于,包括以下步骤:
步骤1. 根据用户物品点击序列,构建物品字典、物品集合、物品邻接矩阵与有向物品关联图;
步骤1的具体过程为:
用户物品点击序列为
Figure DEST_PATH_IMAGE001
Figure DEST_PATH_IMAGE002
为用户第p次点击的物品,
Figure DEST_PATH_IMAGE003
Figure DEST_PATH_IMAGE004
为用户点击的物品数量,用户物品点击序列的物品集合为V,物品集合为 物品字典的子集,物品集合中物品个数为
Figure DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
,物品邻接矩阵为
Figure DEST_PATH_IMAGE007
,有向物品 关联图为
Figure DEST_PATH_IMAGE008
,其中
Figure DEST_PATH_IMAGE009
代表用户点击物品
Figure DEST_PATH_IMAGE010
后再点击
Figure DEST_PATH_IMAGE011
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
Figure DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
Figure DEST_PATH_IMAGE016
步骤2. 对物品字典进行初始化,形成物品字典和物品集合的高维空间表示,利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空间表示,形成用户物品点击序列的高维空间表示;
步骤2的具体过程为:
步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化,得到物品字典的高 维空间表示
Figure DEST_PATH_IMAGE017
,提取物品集合的高维空间表示
Figure DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
为 物品集合中第k个物品的高维空间表示,
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
维矩阵,d为物品 高维空间表示的维度;
步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空间表 示,更新后的物品集合的高维空间表示为
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE025
为更新后 的第k个物品的高维空间表示;
Figure DEST_PATH_IMAGE026
其中,gatedGNN为门控图卷积神经网络函数,GRU为门控循环单元函数;
步骤2-3.将用户物品点击序列
Figure DEST_PATH_IMAGE027
中的所有物品用
Figure DEST_PATH_IMAGE028
代替,形成用户物品点击序列的 高维空间表示
Figure DEST_PATH_IMAGE029
Figure DEST_PATH_IMAGE030
为用户第p次点击的物品的高 维空间表示,
Figure DEST_PATH_IMAGE031
Figure DEST_PATH_IMAGE032
维矩阵;
步骤3. 利用最短路径算法优化用户物品点击序列,提取最短路径序列;
步骤3的具体过程为:
利用最短路径算法获取用户物品点击序列中第一个物品
Figure DEST_PATH_IMAGE033
到最后一个物品
Figure DEST_PATH_IMAGE034
的最 短路径序列
Figure DEST_PATH_IMAGE035
,实现用户物品点击序列优化;
Figure DEST_PATH_IMAGE036
其中,
Figure DEST_PATH_IMAGE037
为迪杰斯特拉函数;
步骤4. 定义初始兴趣、直接兴趣和动态兴趣三种用户兴趣类型,利用用户物品点击序列的最短路径序列长度判定用户兴趣类型,并计算对应用户兴趣类型的高维空间表示;
步骤4的具体过程为:
当用户物品点击序列的最短路径序列长度为1时,用户兴趣类型为初始兴趣,建立初始兴趣ini,初始兴趣的高维空间表示为:
Figure DEST_PATH_IMAGE038
当用户物品点击序列的最短路径序列长度为2时,用户兴趣类型为直接兴趣,建立直接兴趣dir,直接兴趣的高维空间表示为:
Figure DEST_PATH_IMAGE039
其中,
Figure DEST_PATH_IMAGE040
为平均池化函数;
当用户物品点击序列的最短路径序列长度大于2时,用户兴趣类型为动态兴趣,统计用 户物品点击序列中物品的点击频次,选择出现频次最多的前两个物品
Figure DEST_PATH_IMAGE041
Figure DEST_PATH_IMAGE042
作为用 户最感兴趣的物品,然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中最后 一个物品之间的最短距离
Figure DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE045
Figure DEST_PATH_IMAGE046
建立动态兴趣dyn,动态兴趣的高维空间表示为:
Figure DEST_PATH_IMAGE047
其中,
Figure DEST_PATH_IMAGE048
Figure DEST_PATH_IMAGE049
分别为
Figure DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
的高维空间表 示;
步骤5. 基于三种用户兴趣类型的条件概率,采用全概率公式对用户物品点击序列进行建模,并用负对数似然损失函数进行模型优化,取概率最大值对应的物品作会话推荐的为下一时刻点击推荐的物品。
2.根据权利要求1所述的基于物品点击序列优化的会话推荐方法,其特征在于,步骤5的具体过程为:
由用户物品点击序列
Figure DEST_PATH_IMAGE052
预测下一个点击物品的概率
Figure DEST_PATH_IMAGE053
的具体计算方法如 下:
Figure DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE055
Figure DEST_PATH_IMAGE056
Figure DEST_PATH_IMAGE057
分别为用户物品点击序列
Figure DEST_PATH_IMAGE058
中用户兴趣类 型分别为初始兴趣、直接兴趣和动态兴趣的概率,具体计算方法如下:
Figure DEST_PATH_IMAGE059
Figure DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
Figure DEST_PATH_IMAGE062
其中,softmax和tanh为激活函数,
Figure DEST_PATH_IMAGE063
为激活函数softmax的学习参数,
Figure DEST_PATH_IMAGE064
Figure DEST_PATH_IMAGE065
Figure DEST_PATH_IMAGE066
Figure DEST_PATH_IMAGE067
Figure DEST_PATH_IMAGE068
为激活函数tanh的学习参数,上标T表示转置;
Figure DEST_PATH_IMAGE069
Figure DEST_PATH_IMAGE070
Figure DEST_PATH_IMAGE071
分别为用户物品点击序 列
Figure DEST_PATH_IMAGE072
中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率,具体 计算方法如下:
若用户物品点击序列的最短路径序列长度为1,
Figure DEST_PATH_IMAGE073
Figure DEST_PATH_IMAGE074
,否则,
Figure DEST_PATH_IMAGE075
若用户物品点击序列的最短路径序列长度为2,
Figure DEST_PATH_IMAGE076
Figure DEST_PATH_IMAGE077
,否则,
Figure DEST_PATH_IMAGE078
若用户物品点击序列的最短路径序列长度大于2,
Figure DEST_PATH_IMAGE079
Figure DEST_PATH_IMAGE080
,否则,
Figure DEST_PATH_IMAGE081
其中,
Figure DEST_PATH_IMAGE082
Figure DEST_PATH_IMAGE083
Figure DEST_PATH_IMAGE084
Figure DEST_PATH_IMAGE085
Figure DEST_PATH_IMAGE086
Figure DEST_PATH_IMAGE087
Figure DEST_PATH_IMAGE088
Figure DEST_PATH_IMAGE089
Figure DEST_PATH_IMAGE090
Figure DEST_PATH_IMAGE091
为激活函数tanh的学习参数;
取概率
Figure DEST_PATH_IMAGE092
中最大值对应的物品作为会话推荐的下一时刻点击推荐的物品。
CN202110178084.8A 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法 Active CN112528161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110178084.8A CN112528161B (zh) 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110178084.8A CN112528161B (zh) 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法

Publications (2)

Publication Number Publication Date
CN112528161A CN112528161A (zh) 2021-03-19
CN112528161B true CN112528161B (zh) 2021-04-30

Family

ID=74975539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110178084.8A Active CN112528161B (zh) 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法

Country Status (1)

Country Link
CN (1) CN112528161B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326425B (zh) * 2021-04-20 2022-09-20 中国电子科技集团公司第五十四研究所 一种基于结构和语义注意力堆叠的会话推荐方法及系统
CN113688315B (zh) * 2021-08-19 2023-04-18 电子科技大学 一种基于无信息损失图编码的序列推荐方法
CN117436550B (zh) * 2023-12-15 2024-04-16 深圳须弥云图空间科技有限公司 推荐模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334646A (zh) * 2018-04-11 2018-07-27 焦点科技股份有限公司 一种基于频繁浏览序列的网站结构优化方法
CN109635204A (zh) * 2018-12-21 2019-04-16 上海交通大学 基于协同过滤和长短记忆网络的在线推荐系统
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐系统点击率预测方法
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
US7676400B1 (en) * 2005-06-03 2010-03-09 Versata Development Group, Inc. Scoring recommendations and explanations with a probabilistic user model
US20190079957A1 (en) * 2017-09-12 2019-03-14 Linkedin Corporation Centralized feature management, monitoring and onboarding
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334646A (zh) * 2018-04-11 2018-07-27 焦点科技股份有限公司 一种基于频繁浏览序列的网站结构优化方法
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质
CN109635204A (zh) * 2018-12-21 2019-04-16 上海交通大学 基于协同过滤和长短记忆网络的在线推荐系统
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐系统点击率预测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A Session-Based Customer Preference Learning Method by Using the Gated Recurrent Units With Attention Function;Jenhui Chen 等;《IEEE Access》;20190129;第7卷;132582-132591 *
Feature-Level Attentive Neural Model for Session-Based Recommendation;Qing Yang 等;《IEEE Access》;20200720;第8卷;132582-132591 *
Graph-based domain model for adaptive learning path recommendation;Muhammad Fiqri 等;《2017 IEEE Global Engineering Education Conference (EDUCON)》;20170428;375-380 *
基于图表示学习的会话感知推荐模型;曾义夫 等;《计算机研究与发展》;20200315;590-603 *
基于多场景会话数据的推荐技术研究与实现;李赵宁;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200715(第7期);I138-1454 *
基于时序门控图神经网络的可解释序列推荐;刘阳;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200815(第8期);I138-904 *

Also Published As

Publication number Publication date
CN112528161A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN112528161B (zh) 一种基于物品点击序列优化的会话推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN107808278B (zh) 一种基于稀疏自编码器的Github开源项目推荐方法
CN112364976B (zh) 基于会话推荐系统的用户偏好预测方法
CN107633444B (zh) 基于信息熵与模糊c均值聚类的推荐系统噪声过滤方法
CN112115377B (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN106897404B (zh) 一种基于多gru层神经网络的推荐方法与系统
CN108230058A (zh) 产品推荐方法及系统
CN108470052B (zh) 一种基于矩阵补全的抗托攻击推荐算法
CN111737578A (zh) 一种推荐方法及系统
CN111681084B (zh) 一种基于社交关系影响因素的电商平台推荐方法
CN110197404A (zh) 可降低流行度偏差的个性化长尾商品推荐方法和系统
CN112396492A (zh) 基于图注意力网络和双向长短期记忆网络的会话推荐方法
CN116431931A (zh) 实时增量数据统计分析方法
Luo et al. BGNN: Behavior-aware graph neural network for heterogeneous session-based recommendation
CN111339435A (zh) 一种基于潜在因子的矩阵分解补全混合推荐方法
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
CN113763095B (zh) 信息推荐方法、装置和模型训练方法、装置
CN112016000B (zh) 一种基于卷积协同过滤的电影组推荐方法及系统
CN112232388A (zh) 基于elm-rfe的购物意图关键因素识别方法
CN116757747A (zh) 基于行为序列和特征重要性的点击率预测方法
Sang et al. Position-aware graph neural network for session-based recommendation
CN115392975A (zh) 一种基于Canopy模糊聚类和奇异值分解的个性化推荐方法
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant