CN115329211A - 一种基于自监督学习和图神经网络的个性化兴趣推荐方法 - Google Patents
一种基于自监督学习和图神经网络的个性化兴趣推荐方法 Download PDFInfo
- Publication number
- CN115329211A CN115329211A CN202210918860.8A CN202210918860A CN115329211A CN 115329211 A CN115329211 A CN 115329211A CN 202210918860 A CN202210918860 A CN 202210918860A CN 115329211 A CN115329211 A CN 115329211A
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- graph
- user
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 100
- 230000007774 longterm Effects 0.000 claims abstract description 19
- 230000003993 interaction Effects 0.000 claims abstract description 8
- 230000002452 interceptive effect Effects 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 67
- 230000006870 function Effects 0.000 claims description 31
- 235000009508 confectionery Nutrition 0.000 claims description 15
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 22
- 239000013604 expression vector Substances 0.000 abstract description 5
- 230000009471 action Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种基于自监督学习和图神经网络的个性化兴趣推荐方法,使用自监督的图对比学习的方法预训练兴趣点特征表示向量,深度学习兴趣点之间的流行度访问行为模式,训练图编码器模型,使兴趣点特征向量融合空间关联性和交互行为关联性。同时在下游推荐任务中将目标用户个人的兴趣点交互图通过预训练中训练好的图编码器模型学习用户个人的长期行为模式作为长期兴趣,以达到个性化的目的。大大提高了模型的泛化能力和推荐召回率,实现根据兴趣个性化解决用户出行需求的目的。
Description
技术领域
本发明涉及兴趣预测的个性化推荐技术领域,具体涉及一种基于自监督学习和图神经网络的个性化兴趣推荐方法。
背景技术
基于位置的社交网络能够使用户随时随地通过打卡、照片、分享和评论等方式反映个人兴趣爱好,通过智能算法根据用户行为模式挖掘出用户潜在的兴趣并根据用户个性化兴趣推荐下一个用户想要打卡的地点已经成为了解决当前互联网时代用户出行需求的最有效技术手段之一。目前研究人员针对于个性化兴趣推荐算法已经提出了较为有效的兴趣学习模型,但是大部分模型都是基于单独用户的行为轨迹进行兴趣建模,从而实现下一个兴趣地点的推荐,并没有考虑用户访问地点之间天然不变的位置关系的潜在特征。另一方面,同时忽视了对访问地点之间的访问流量进行全局性多用户行为分析,因此无法有效的推荐出用户真正想要访问打卡的下一个感兴趣的地点。
发明内容
本发明为了克服以上技术的不足,提供了一种基于自监督学习和图神经网络的个性化兴趣推荐方法,实现用户在一定区域内的行动轨迹和行为模式是有迹可循的,并且在现实生活中,在一定区域内的不同用户的行为模式和行动轨迹也具有高度重合性。因此对兴趣访问点(下文简称兴趣点)根据空间坐标和访问流行度进行图结构的建模可以学习出兴趣点之间的一种普遍的行为模式,且用于单个用户时可以将这种行为模式视为用户的长期兴趣。
本发明克服其技术问题所采用的技术方案是:
一种基于自监督学习和图神经网络的个性化兴趣推荐方法,包括如下步骤:
a)从Gowalla这个数据集读取兴趣点集合和用户集合其中pi为第i个兴趣点,1≤i≤nP,nP为兴趣点集合P的长度,uo为第o个用户,1≤o≤nU,nU为用户集合U的长度;b)根据第o个用户的签到时间生成用户o在第b天的日签到序列用户o的全部签到序列全部用户的全部签到序列其中 为第o个用户待推荐的那一天,为第o个用户第b天的第z个签到点, 为用户o在第b天的日签到序列的长度;
f)创建一个基于图同构网络的图编码器模型GraphEncoder,将兴趣点的原始特征向量E及邻接矩阵W*输入到图编码器模型GraphEncoder中,输出得到邻接矩阵W*的兴趣点局部图特征向量G、增强视图邻接矩阵的兴趣点局部图特征向量Gq、增强视图邻接矩阵的兴趣点局部图特征向量Gk;
g)计算InfoNCE损失函数losspre,利用损失函数losspre迭代训练图编码器模型GraphEncoder,通过反向传播更新兴趣点的原始特征向量E,得到带有空间特征和流行度特征的兴趣点特征向量E*;
k)获取第o个用户要预测当天t的签到序列按顺序从带有空间特征和流行度特征的兴趣点特征向量E*中取出该签到序列里访问的兴趣点的特征向量,按顺序依次标记为其中hm为预测当天t的第m个访问的兴趣点的特征向量, 为用户o在预测当天t的日签到序列的长度,将一天时间分成24个时间片,计算当天第m个访问的兴趣点与最后第个访问的兴趣点之间的时间片差值,并将差值编码为64维向量定义一个时间片偏移嵌入矩阵矩阵长度为当前序列长度其中为qm为第m个兴趣点对应的时间片偏移嵌入向量,通过半正矢公式计算当天第m个访问的兴趣点与最后第个访问的兴趣点之间的距离,将距离值编码为64维向量定义一个空间偏移嵌入矩阵矩阵长度为当前序列长度其中为posm为第m个访问的兴趣点对应的空间偏移嵌入向量,
o)将概率pcandi中最大的前10个兴趣点推荐给用户。
进一步的,步骤c)中将兴趣点集合P中的每一个兴趣点初始化为64维的原始特征向量e。
进一步的,步骤d)包括如下步骤:
d-1)通过公式si,j=ln(freqi,j)计算得到第i个兴趣点pi到第j个兴趣点pj的权重影响度si,j,式中freqi,j为第i个兴趣点pi到第j个兴趣点pj访问的次数;
d-3)通过公式di,j=haversine(loni,lati,lonj,latj)计算得到第i个兴趣点pi与第j个兴趣点pj之间的距离di,j,式中haversine(·)为半正矢函数,loni为第i个兴趣点pi的经度,lati为第i个兴趣点pi的纬度,lonj为第j个兴趣点pj的经度,latj为第j个兴趣点pj的纬度;
优选的,步骤d-5)中δ取值为0.5。
优选的,步骤e)中以0.9的概率随机删除邻接矩阵W*中的元素。
进一步的,步骤f)包括如下步骤:
f-1)在编码器GraphEncoder中通过公式E(k)=MLP(k)(W*E(k-1))计算得到邻接矩阵W*经过k次节点更新后的兴趣点特征表示E(k),式中k={1,2},MLP(k)(·)为多层感知机,E(k -1)为经过k-1次节点更新后的兴趣点特征表示,当k取值为1时,E(0)为所有兴趣点的原始特征向量E,通过公式计算得到增强视图邻接矩阵经过k次节点更新后的兴趣点特征表示通过公式计算得到增强视图邻接矩阵经过k次节点更新后的兴趣点特征表示
f-2)在编码器GraphEncoder中通过公式G=concat(sum(E(l))l=0,1,2)计算得到邻接矩阵W*的兴趣点局部图特征向量G,式中concat(·)为拼接操作,sum(·)为求和操作,E(l)为邻接矩阵W*经过第l次节点更新后的兴趣点特征表示,通过公式计算得到增强视图邻接矩阵的兴趣点局部图特征向量Gq,为增强视图邻接矩阵经过第l次节点更新后的兴趣点特征表示,通过公式计算得到增强视图邻接矩阵的兴趣点局部图特征向量Gk,为增强视图邻接矩阵经过第l次节点更新后的兴趣点特征表示。
进一步的,步骤g)中通过公式计算得到InfoNCE损失函数losspre,式中T为转置,Gk,+为一个训练批次兴趣点局部图特征向量Gq对应生成的兴趣点局部图特征向量Gk,Gk,i为全部训练批次兴趣点局部图特征向量Gq对应生成的兴趣点局部图特征向量Gk,0≤i≤K,K为一个迭代周期内的训练批次大小,τ为温度系数,τ取值为0.7,利用InfoNCE损失函数losspre迭代100次训练图编码器模型GraphEncoder。
进一步的,步骤l)包括如下步骤:
l-1)通过公式
进一步的,还包括通过公式计算得到损失函数loss,式中NUM为所有候选兴趣点的总数,ycandi取值为0或1,ycandi取值为0表示为负采样,ycandi取值为1表示为正采样,利用损失函数loss通过二元交叉熵损失迭代500次训练步骤n)中的模型。
本发明的有益效果是:使用自监督的图对比学习的方法预训练兴趣点特征表示向量,深度学习兴趣点之间的流行度访问行为模式,训练图编码器模型,使兴趣点特征向量融合空间关联性和交互行为关联性。同时在下游推荐任务中将目标用户个人的兴趣点交互图通过预训练中训练好的图编码器模型学习用户个人的长期行为模式作为长期兴趣,以达到个性化的目的。创新注意力公式,将短期的时间和空间特性考量到注意力机制中,学习用户的短期兴趣,大大的提高推荐任务的准确率。相交其他方法,本方法首次使用图对比学习来捕获兴趣点之间的客观行为趋势,并学习用户长期的行为模式图并把图特征表示向量作为长期兴趣,充分考量了兴趣点推荐中的短期访问兴趣点对推荐任务的影响,大大提高了模型的泛化能力和推荐召回率,实现根据兴趣个性化解决用户出行需求的目的。
附图说明
图1为本发明的下游推荐任务的框架图。
具体实施方式
下面结合附图1对本发明做进一步说明。
用户在一定区域内的行动轨迹和行为模式是有迹可循的,并且在现实生活中,在一定区域内的不同用户的行为模式和行动轨迹也具有高度重合性。因此对兴趣访问点(下文简称兴趣点)根据空间坐标和访问流行度进行图结构的建模可以学习出兴趣点之间的一种普遍的行为模式,且用于单个用户时可以将这种行为模式视为用户的长期兴趣。
本发明共分为预训练和下游推荐任务两大阶段。在预训练阶段,初始化全体兴趣点的特征表示向量,将所有兴趣点根据全体用户的签到行为构建兴趣点-兴趣点访问全局流图(下文简称兴趣点全局图),并对其进行基于访问量和空间特征的图同构网络编码器建模,使用自监督的图对比学习方法学习兴趣点之间的全局访问模式以获取兴趣点的初级特征表示。在下游推荐任务阶段,首先将待推荐目标用户的历史访问兴趣点构建成兴趣点-兴趣点用户访问子图,以预训练阶段训练完成的图同构网络编码器对目标用户的长期兴趣行为模式进行学习,生成目标用户的长期兴趣。其次将待推荐当天目标用户访问的兴趣点通过时空片注意力机制学习短期兴趣。最后,将目标用户的长期兴趣与短期兴趣输入到预测层,输出最终的推荐结果。
具体的,一种基于自监督学习和图神经网络的个性化兴趣推荐方法,包括如下步骤:
(1)获取数据
a)Gowalla这个数据集包括用户与兴趣点的交互记录、交互时间和兴趣点的坐标(经纬度),因此从Gowalla这个数据集读取兴趣点集合和用户集合其中pi为第i个兴趣点,1≤i≤nP,nP为兴趣点集合P的长度,uo为第o个用户,1≤o≤nU,nU为用户集合U的长度。
b)根据第o个用户的签到时间生成用户o在第b天的日签到序列用户o的全部签到序列全部用户的全部签到序列其中 为第o个用户待推荐的那一天,为第o个用户第b天的第z个签到点, 为用户o在第b天的日签到序列的长度。每一个签到点c都由(u,p,t)三元组组成,u是某一个用户,p是某一个兴趣点,t(t=1,2,...,24)是一天24小时中某一个签到小时。
(2)对比学习预训练
d)将全部用户的全部签到序列根据签入签出记录构建兴趣点全局图,兴趣点全局图为有向图,根据签到序列中两个兴趣点之间的访问先后关系构成边,边缘权重由边连接的两个兴趣点先后访问次数和兴趣点之间的距离影响,该兴趣点全局图由用户的历史签到序列创建兴趣点之间的邻接矩阵构成,为实数空间,该兴趣点全局图的节点为兴趣点集合P中全部兴趣点。
f)创建一个基于图同构网络的图编码器模型GraphEncoder,将兴趣点的原始特征向量E及邻接矩阵W*输入到图编码器模型GraphEncoder中,输出得到邻接矩阵W*的兴趣点局部图特征向量G,为了为了获取兴趣点之间全局访问模式,我们需要采用自监督对比学习的方式通过两个增强视图和学习兴趣点全局图各个节点的局部图结构。将两个增强视图邻接矩阵输入到GraphEncoder中,分别获得图特征表示向量,获得增强视图邻接矩阵的兴趣点局部图特征向量Gq、增强视图邻接矩阵的兴趣点局部图特征向量Gk。
g)计算InfoNCE损失函数losspre,利用损失函数losspre迭代训练图编码器模型GraphEncoder,通过反向传播更新兴趣点的原始特征向量E,得到带有空间特征和流行度特征的兴趣点特征向量E*。
(3)下游推荐任务
k)获取第o个用户要预测当天t的签到序列按顺序从带有空间特征和流行度特征的兴趣点特征向量E*中取出该签到序列里访问的兴趣点的特征向量,按顺序依次标记为其中hm为预测当天t的第m个访问的兴趣点的特征向量, 为用户o在预测当天t的日签到序列的长度,签到时间对短期兴趣有直观的影响,如果一个签到发生在上午6点,那对于晚上8点的签到影响就微乎其微了,这里我们将一天时间分成24个时间片,计算当天第m个访问的兴趣点与最后第个访问的兴趣点之间的时间片差值,并将差值编码为64维向量定义一个时间片偏移嵌入矩阵矩阵长度为当前序列长度其中为qm为第m个兴趣点对应的时间片偏移嵌入向量,另一方面,预测当天访问的兴趣点之间的空间距离也会影响到用户的短期兴趣,距离近的影响度会变高,这里通过半正矢公式计算当天第m个访问的兴趣点与最后第个访问的兴趣点之间的距离,将距离值编码为64维向量定义一个空间偏移嵌入矩阵矩阵长度为当前序列长度其中为posm为第m个访问的兴趣点对应的空间偏移嵌入向量,
(4)预测层
(5)推荐
o)将概率pcandi中最大的前10个兴趣点推荐给用户。
使用自监督的图对比学习的方法预训练兴趣点特征表示向量,深度学习兴趣点之间的流行度访问行为模式,训练图编码器模型,使兴趣点特征向量融合空间关联性和交互行为关联性。同时在下游推荐任务中将目标用户个人的兴趣点交互图通过预训练中训练好的图编码器模型学习用户个人的长期行为模式作为长期兴趣,以达到个性化的目的。创新注意力公式,将短期的时间和空间特性考量到注意力机制中,学习用户的短期兴趣,大大的提高推荐任务的准确率。相交其他方法,本方法首次使用图对比学习来捕获兴趣点之间的客观行为趋势,并学习用户长期的行为模式图并把图特征表示向量作为长期兴趣,充分考量了兴趣点推荐中的短期访问兴趣点对推荐任务的影响,大大提高了模型的泛化能力和推荐召回率,实现根据兴趣个性化解决用户出行需求的目的。
实施例1:
步骤c)中将兴趣点集合P中的每一个兴趣点初始化为64维的原始特征向量e。
实施例2:
步骤d)包括如下步骤:
d-1)通常情况下,节点的影响度为长尾分布,部分节点的具有稠密的连通性(即很受欢迎),因此需要使用对数函数对其频率进行处理。因此,通过公式si,j=ln(freqi,j)计算得到第i个兴趣点pi到第j个兴趣点pj的权重影响度si,j,式中freqi,j为第i个兴趣点pi到第j个兴趣点pj访问的次数。
d-3)通过haversine(半正矢公式)di,j=haversine(loni,lati,lonj,latj)计算得到第i个兴趣点pi与第j个兴趣点pj之间的距离di,j,式中haversine(·)为半正矢函数,loni为第i个兴趣点pi的经度,lati为第i个兴趣点pi的纬度,lonj为第j个兴趣点pj的经度,latj为第j个兴趣点pj的纬度。
实施例3:
步骤d-5)中δ取值为0.5。
实施例4:
实施例5:
步骤e)中以0.9的概率随机删除邻接矩阵W*中的元素。
实施例6:
步骤f)包括如下步骤:
f-1)在编码器GraphEncoder中通过公式E(k)=MLP(k)(W*E(k-1))计算得到邻接矩阵W*经过k次节点更新后的兴趣点特征表示E(k),式中k={1,2},MLP(k)(·)为多层感知机,E(k -1)为经过k-1次节点更新后的兴趣点特征表示,当k取值为1时,E(0)为所有兴趣点的原始特征向量E,通过公式计算得到增强视图邻接矩阵经过k次节点更新后的兴趣点特征表示通过公式计算得到增强视图邻接矩阵经过k次节点更新后的兴趣点特征表示
f-2)在编码器GraphEncoder中通过公式G=concat(sum(E(l))|l=0,1,2)计算得到邻接矩阵W*的兴趣点局部图特征向量G,式中concat(·)为拼接操作,sum(·)为求和操作,E(l)为邻接矩阵W*经过第l次节点更新后的兴趣点特征表示,通过公式计算得到增强视图邻接矩阵的兴趣点局部图特征向量Gq,为增强视图邻接矩阵经过第l次节点更新后的兴趣点特征表示,通过公式计算得到增强视图邻接矩阵的兴趣点局部图特征向量Gk,为增强视图邻接矩阵经过第l次节点更新后的兴趣点特征表示。
实施例7:
步骤g)中通过公式计算得到InfoNCE损失函数losspre,式中T为转置,Gk,+为一个训练批次兴趣点局部图特征向量Gq对应生成的兴趣点局部图特征向量Gk,Gk,i为全部训练批次兴趣点局部图特征向量Gq对应生成的兴趣点局部图特征向量Gk,0≤i≤K,K为一个迭代周期内的训练批次大小,τ为温度系数,τ取值为0.7,利用InfoNCE损失函数losspre迭代100次训练图编码器模型GraphEncoder。
实施例8:
步骤l)包括如下步骤:
l-1)通过公式
实施例9:
还包括通过公式计算得到损失函数loss,式中NUM为所有候选兴趣点的总数,ycandi取值为0或1,ycandi取值为0表示为负采样,ycandi取值为1表示为正采样,利用损失函数loss通过二元交叉熵损失迭代500次训练步骤n)中的模型。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于自监督学习和图神经网络的个性化兴趣推荐方法,其特征在于,包括如下步骤:
b)根据第o个用户的签到时间生成用户o在第b天的日签到序列用户o的全部签到序列全部用户的全部签到序列其中 为第o个用户待推荐的那一天,为第o个用户第b天的第z个签到点, 为用户o在第b天的日签到序列的长度;
f)创建一个基于图同构网络的图编码器模型GraphEncoder,将兴趣点的原始特征向量E及邻接矩阵W*输入到图编码器模型GraphEncoder中,输出得到邻接矩阵W*的兴趣点局部图特征向量G、增强视图邻接矩阵的兴趣点局部图特征向量Gq、增强视图邻接矩阵的兴趣点局部图特征向量Gk;
g)计算InfoNCE损失函数losspre,利用损失函数losspre迭代训练图编码器模型GraphEncoder,通过反向传播更新兴趣点的原始特征向量E,得到带有空间特征和流行度特征的兴趣点特征向量E*;
h)在兴趣点集合P中创建用户历史交互兴趣点的掩码数组,已交互的为1,未交互的为0,根据掩码数组从邻接矩阵W*中提取出第o个用户的邻接矩阵i)将带有空间特征和流行度特征的兴趣点特征向量E*及第o个用户的邻接矩阵输入到步骤g)中训练完成的图编码器模型GraphEncoder中,输出得到第o个用户的交互子图特征表示
k)获取第o个用户要预测当天t的签到序列按顺序从带有空间特征和流行度特征的兴趣点特征向量E*中取出该签到序列里访问的兴趣点的特征向量,按顺序依次标记为其中hm为预测当天t的第m个访问的兴趣点的特征向量, 为用户o在预测当天t的日签到序列的长度,将一天时间分成24个时间片,计算当天第m个访问的兴趣点与最后第个访问的兴趣点之间的时间片差值,并将差值编码为64维向量定义一个时间片偏移嵌入矩阵矩阵长度为当前序列长度其中为qm为第m个兴趣点对应的时间片偏移嵌入向量,通过半正矢公式计算当天第m个访问的兴趣点与最后第个访问的兴趣点之间的距离,将距离值编码为64维向量定义一个空间偏移嵌入矩阵矩阵长度为当前序列长度其中为posm为第m个访问的兴趣点对应的空间偏移嵌入向量,
o)将概率pcandi中最大的前10个兴趣点推荐给用户。
2.根据权利要求1所述的基于自监督学习和图神经网络的个性化兴趣推荐方法,其特征在于:步骤c)中将兴趣点集合P中的每一个兴趣点初始化为64维的原始特征向量e。
3.根据权利要求1所述的基于自监督学习和图神经网络的个性化兴趣推荐方法,其特征在于,步骤d)包括如下步骤:
d-1)通过公式si,j=ln(freqi,j)计算得到第i个兴趣点pi到第j个兴趣点pj的权重影响度si,j,式中freqi,j为第i个兴趣点pi到第j个兴趣点pj访问的次数;
d-3)通过公式di,j=haversine(loni,lati,lonj,latj)计算得到第i个兴趣点pi与第j个兴趣点pj之间的距离di,j,式中haversine(·)为半正矢函数,loni为第i个兴趣点pi的经度,lati为第i个兴趣点pi的纬度,lonj为第j个兴趣点pj的经度,latj为第j个兴趣点pj的纬度;
4.根据权利要求1所述的基于自监督学习和图神经网络的个性化兴趣推荐方法,其特征在于:步骤d-5)中δ取值为0.5。
6.根据权利要求1所述的基于自监督学习和图神经网络的个性化兴趣推荐方法,其特征在于:步骤e)中以0.9的概率随机删除邻接矩阵W*中的元素。
7.根据权利要求1所述的基于自监督学习和图神经网络的个性化兴趣推荐方法,其特征在于,步骤f)包括如下步骤:
f-1)在编码器GraphEncoder中通过公式E(k)=MLP(k)(W*E(k-1))计算得到邻接矩阵W*经过k次节点更新后的兴趣点特征表示E(k),式中k={1,2},MLP(k)(·)为多层感知机,E(k-1)为经过k-1次节点更新后的兴趣点特征表示,当k取值为1时,E(0)为所有兴趣点的原始特征向量E,通过公式计算得到增强视图邻接矩阵经过k次节点更新后的兴趣点特征表示通过公式计算得到增强视图邻接矩阵经过k次节点更新后的兴趣点特征表示
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210918860.8A CN115329211B (zh) | 2022-08-01 | 2022-08-01 | 一种基于自监督学习和图神经网络的个性化兴趣推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210918860.8A CN115329211B (zh) | 2022-08-01 | 2022-08-01 | 一种基于自监督学习和图神经网络的个性化兴趣推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115329211A true CN115329211A (zh) | 2022-11-11 |
CN115329211B CN115329211B (zh) | 2023-06-06 |
Family
ID=83919960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210918860.8A Active CN115329211B (zh) | 2022-08-01 | 2022-08-01 | 一种基于自监督学习和图神经网络的个性化兴趣推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115329211B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052061A (zh) * | 2023-02-21 | 2023-05-02 | 嘉洋智慧安全科技(北京)股份有限公司 | 事件监测方法、装置、电子设备及存储介质 |
CN118193853A (zh) * | 2024-05-16 | 2024-06-14 | 烟台大学 | 一种随机群组的兴趣点推荐方法、系统、设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949865A (zh) * | 2020-08-10 | 2020-11-17 | 杭州电子科技大学 | 基于图神经网络与用户长短期偏好的兴趣点推荐方法 |
CN112559879A (zh) * | 2020-12-24 | 2021-03-26 | 北京百度网讯科技有限公司 | 兴趣模型训练方法、兴趣点推荐方法、装置和设备 |
CN112925977A (zh) * | 2021-02-26 | 2021-06-08 | 中国科学技术大学 | 一种基于自监督图表征学习的推荐方法 |
CN113868537A (zh) * | 2021-10-19 | 2021-12-31 | 山东省人工智能研究院 | 一种基于多行为会话图融合的推荐方法 |
WO2022037256A1 (zh) * | 2020-08-21 | 2022-02-24 | 腾讯科技(深圳)有限公司 | 文本语句处理方法、装置、计算机设备和存储介质 |
CN114154070A (zh) * | 2021-12-07 | 2022-03-08 | 西安邮电大学 | 一种基于图卷积神经网络的mooc推荐方法 |
WO2022135121A1 (zh) * | 2020-12-25 | 2022-06-30 | 浙江大学 | 一种基于对比学习的分子图表示学习方法 |
CN114780866A (zh) * | 2022-04-11 | 2022-07-22 | 山东省人工智能研究院 | 一种基于时空上下文兴趣学习模型的个性化智能推荐方法 |
-
2022
- 2022-08-01 CN CN202210918860.8A patent/CN115329211B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949865A (zh) * | 2020-08-10 | 2020-11-17 | 杭州电子科技大学 | 基于图神经网络与用户长短期偏好的兴趣点推荐方法 |
WO2022037256A1 (zh) * | 2020-08-21 | 2022-02-24 | 腾讯科技(深圳)有限公司 | 文本语句处理方法、装置、计算机设备和存储介质 |
CN112559879A (zh) * | 2020-12-24 | 2021-03-26 | 北京百度网讯科技有限公司 | 兴趣模型训练方法、兴趣点推荐方法、装置和设备 |
WO2022135121A1 (zh) * | 2020-12-25 | 2022-06-30 | 浙江大学 | 一种基于对比学习的分子图表示学习方法 |
CN112925977A (zh) * | 2021-02-26 | 2021-06-08 | 中国科学技术大学 | 一种基于自监督图表征学习的推荐方法 |
CN113868537A (zh) * | 2021-10-19 | 2021-12-31 | 山东省人工智能研究院 | 一种基于多行为会话图融合的推荐方法 |
CN113868537B (zh) * | 2021-10-19 | 2022-07-05 | 山东省人工智能研究院 | 一种基于多行为会话图融合的推荐方法 |
CN114154070A (zh) * | 2021-12-07 | 2022-03-08 | 西安邮电大学 | 一种基于图卷积神经网络的mooc推荐方法 |
CN114780866A (zh) * | 2022-04-11 | 2022-07-22 | 山东省人工智能研究院 | 一种基于时空上下文兴趣学习模型的个性化智能推荐方法 |
Non-Patent Citations (2)
Title |
---|
LI LIU,DA CHEN,MINGLEI SHU: "A new tubular structure tracking algorithm based on curvature-penalized perceptual grouping", 《ICASSP2021》 * |
刘广洲,李金宝,任东东,舒明雷: "密集连接扩张卷积神经网络的单幅图像去雾", 《计算机科学与探索》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052061A (zh) * | 2023-02-21 | 2023-05-02 | 嘉洋智慧安全科技(北京)股份有限公司 | 事件监测方法、装置、电子设备及存储介质 |
CN116052061B (zh) * | 2023-02-21 | 2024-02-27 | 嘉洋智慧安全科技(北京)股份有限公司 | 事件监测方法、装置、电子设备及存储介质 |
CN118193853A (zh) * | 2024-05-16 | 2024-06-14 | 烟台大学 | 一种随机群组的兴趣点推荐方法、系统、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115329211B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | An attention-based spatiotemporal lstm network for next poi recommendation | |
Islam et al. | A survey on deep learning based Point-of-Interest (POI) recommendations | |
Feng et al. | Poi2vec: Geographical latent representation for predicting future visitors | |
Misra et al. | Statistical downscaling of precipitation using long short-term memory recurrent neural networks | |
CN115329211B (zh) | 一种基于自监督学习和图神经网络的个性化兴趣推荐方法 | |
CN109062962B (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN111949865A (zh) | 基于图神经网络与用户长短期偏好的兴趣点推荐方法 | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
CN113705772A (zh) | 一种模型训练方法、装置、设备及可读存储介质 | |
CN111241419B (zh) | 一种基于用户关系嵌入模型的下一个兴趣点推荐方法 | |
Gad et al. | A robust deep learning model for missing value imputation in big NCDC dataset | |
CN108804646B (zh) | 一种融合深度学习和因子分解机的兴趣点签到预测方法 | |
CN107392164A (zh) | 一种基于面部动作单元强度估计的表情分析方法 | |
CN111695046B (zh) | 基于时空移动数据表征学习的用户画像推断方法及装置 | |
CN114780866B (zh) | 一种基于时空上下文兴趣学习模型的个性化智能推荐方法 | |
Liu et al. | Pair-wise ranking based preference learning for points-of-interest recommendation | |
Ma et al. | Exploring multiple spatio-temporal information for point-of-interest recommendation | |
Xu et al. | Ssser: Spatiotemporal sequential and social embedding rank for successive point-of-interest recommendation | |
CN114579892B (zh) | 一种基于跨城市兴趣点匹配的用户异地访问位置预测方法 | |
CN116090504A (zh) | 图神经网络模型训练方法及装置、分类方法、计算设备 | |
CN117633371B (zh) | 基于多注意力机制的推荐方法、设备和可读存储介质 | |
CN113590971A (zh) | 一种基于类脑时空感知表征的兴趣点推荐方法及系统 | |
CN113409157A (zh) | 一种跨社交网络用户对齐方法以及装置 | |
Briffoteaux | Parallel surrogate-based algorithms for solving expensive optimization problems | |
Mishra et al. | Unsupervised functional link artificial neural networks for cluster Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |