CN116070034B - 结合自适应周期与兴趣量因子的图卷积网络推荐方法 - Google Patents
结合自适应周期与兴趣量因子的图卷积网络推荐方法 Download PDFInfo
- Publication number
- CN116070034B CN116070034B CN202310196986.3A CN202310196986A CN116070034B CN 116070034 B CN116070034 B CN 116070034B CN 202310196986 A CN202310196986 A CN 202310196986A CN 116070034 B CN116070034 B CN 116070034B
- Authority
- CN
- China
- Prior art keywords
- interest
- user
- item
- representing
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000008859 change Effects 0.000 claims abstract description 19
- 238000012417 linear regression Methods 0.000 claims abstract description 6
- 230000006399 behavior Effects 0.000 claims description 35
- 238000007667 floating Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 28
- 238000010586 diagram Methods 0.000 claims description 15
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 230000014509 gene expression Effects 0.000 claims description 13
- 230000003993 interaction Effects 0.000 claims description 12
- 238000005096 rolling process Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000001914 filtration Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种结合自适应周期与兴趣量因子的图卷积网络推荐方法,结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,能够更形象合理地模拟用户的兴趣变化规律,可比较显式地表示用户的动态行为变化,采用遗忘曲线拟合出的函数对用户的兴趣权重占比进行计算,能够更准确地判别出用户当前的兴趣情况,本发明引入了自适应周期和兴趣量因子,更为准确地解析用户的整体偏好,采用聚类和线性回归技术对其求解,根据用户针对同种类型项目具有相似行为的规律对用户行为进行聚类并拟合,获取用户的自适应周期,再结合用户‑项目的行为规律,归结出用户对项目的兴趣量,这些深度信息的特征表示,蕴含着更高阶的协作,有助于捕获用户的整体偏好。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种结合自适应周期与兴趣量因子的图卷积网络推荐方法。
背景技术
项目推荐系统被广泛应用于商品、音乐、电影、旅游推荐等生活场景中,给人们的生活带来了智能化和便利性。协同过滤(Collaborative Filtering, CF)作为推荐领域中经典的算法之一,能比较充分地利用用户的全局信息,获取较好的推荐精度,但单一的协同过滤推荐模型对于数据的完整性要求极高,故在实际使用中,数据稀疏性、训练效率低等问题是这一类模型的通病。而不可否认的是,评分、浏览等基础信息,确实最能表现用户兴趣也极易获取兴趣的。因此,纵向深挖用户基础信息并不亚于横向融入近期热门的辅助信息。
基于深度学习的推荐模型对挖掘用户-项目间的非线性关系有着独特的优势,且其抽象的编码能力可表示更高层次的交互信息,解决了很多传统推荐模型面临的问题,其中采用多种神经网络组合成的混合神经网络表现出的优势更为明显。但这些模型始终面临着数据稀疏性问题,且在复杂信息抽象编码的过程中会丢失大量的潜在信息。近些年比较热门的基于图卷积网络(Graph Convolutional Network, GCN)的推荐模型,采用GCN方法将用户-项目图结构信息输入模型中,最大程度上保留了潜在信息,能很好地实现协同过滤的思想。然而,这些工作尽管对用户的潜在信息更为关注,但对用户和项目的高阶交互信息挖掘程度仍较浅,也未兼顾到用户-项目间更深层次的关系,影响了推荐的实际效果。
发明内容
为此,本发明的实施例提出一种结合自适应周期与兴趣量因子的图卷积网络推荐方法,以解决现有技术对用户和项目的高阶交互信息挖掘程度仍较浅,未兼顾到用户-项目间更深层次的关系的问题。
根据本发明一实施例的结合自适应周期与兴趣量因子的图卷积网络推荐方法,包括以下步骤:
步骤1,将多个用户针对不同项目的历史行为记录转化成以时间间隔为单位的行为记忆序列;
步骤2,从行为记忆序列中提取出每个用户的浏览次数和浏览周期,根据浏览次数和浏览周期对同种类型项目下不同用户间的兴趣周期进行K均值聚类,得到同种类型项目下不同兴趣形态下的用户群,再使用多元线性回归方式拟合出同种类型项目下不同兴趣形态的函数表示,最后根据目标用户所属的兴趣形态匹配拟合出相应函数,并得到自适应周期;
步骤3,根据目标用户的行为记忆序列,按照预设的周期间隔数对目标用户的浏览周期进行切割,结合目标用户在单位周期内的浏览情况和设定的兴趣浮点变化规则,构建出用户-项目兴趣浮点模型,进一步使用Sigmoid函数对用户-项目兴趣浮点模型进行平滑优化,将用户-项目兴趣浮点模型中最后一个兴趣浮点的数值作为目标用户对目标类型的项目的当前兴趣量因子;
步骤4,结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,将步骤2得到的自适应周期和步骤2得到的当前兴趣量因子代入兴趣模型,得出目标用户对目标类型的项目的兴趣程度,再根据该兴趣程度计算兴趣权重占比,根据该兴趣权重占比对不同类型的项目进行排序,再根据排序情况构建用户-类型-项目三元图结构,最后将用户-类型-项目三元图结构输入到图卷积网络模型中,得出目标用户对各个项目的得分,按照得分大小对各个项目进行排序以及组建推荐列表。
根据本发明实施例的结合自适应周期与兴趣量因子的图卷积网络推荐方法,具有以下有益效果:
(1)本发明结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,能够更形象合理地模拟用户的兴趣变化规律,可比较显式地表示用户的动态行为变化,进一步采用遗忘曲线拟合出的函数对用户的兴趣权重占比进行计算,能够更准确地判别出用户当前的兴趣情况;
(2)本发明引入了自适应周期和兴趣量因子,更为准确地解析用户的整体偏好,采用聚类和线性回归技术对其求解,根据用户针对同种类型项目具有相似行为的规律对用户行为进行聚类并拟合,获取用户的自适应周期,再结合用户-项目的行为规律,归结出用户对项目的兴趣量,这些深度信息的特征表示,蕴含着更高阶的协作,有助于捕获用户的整体偏好;
(3)本发明利用GCN方法实现协同过滤,能提高模型推荐的准确性和适用性,相较于传统的基于用户、项目等协同过滤方法,本发明结合GCN方法可更为全面地利用到整体数据,避免数据运用过程中的丢失。
(4)该方法提升了用户和项目的高阶交互信息挖掘程度,兼顾到用户-项目间更深层次的关系,从而提升了推荐的实际效果。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
附图说明
本发明实施例的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一实施例的结合自适应周期与兴趣量因子的图卷积网络推荐方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例提出一种结合自适应周期与兴趣量因子的图卷积网络推荐方法,所述方法包括步骤1至步骤4:
步骤1,将多个用户针对不同项目的历史行为记录转化成以时间间隔为单位的行为记忆序列。
其中,行为记忆序列的表达式如下:
;
其中,表示行为记忆序列,/>表示交互总次数,/>表示用户对项目进行第1次浏览和第2次浏览的时间间隔,/>表示用户对项目进行第2次浏览和第3次浏览的时间间隔,/>表示用户对项目进行第3次浏览和第4次浏览的时间间隔,/>表示用户对项目进行第/>次浏览和第/>次浏览的时间间隔,/>表示用户最近一次对项目进行浏览的时间戳,/>为自适应周期。
步骤2,从行为记忆序列中提取出每个用户的浏览次数和浏览周期,根据浏览次数和浏览周期对同种类型项目下不同用户间的兴趣周期进行K均值聚类,得到同种类型项目下不同兴趣形态下的用户群,再使用多元线性回归方式拟合出同种类型项目下不同兴趣形态的函数表示,最后根据目标用户所属的兴趣形态匹配拟合出相应函数,并得到自适应周期。
其中,自适应周期的计算公式如下:
;
且;
其中,表示目标用户对项目的兴趣形态标识,/>分别表示第1个、第2个与第n个兴趣形态,/>均表示偏置参数,/>为条件表达式函数,/>均表示权重参数,/>表示浏览次数,/>表示浏览周长。
自适应周期是一个预测值,且易受用户行为记忆序列中时间点变化的影响,即行为记忆的每次更新,自适应周期都会随之变化。通过研究发现,用户的浏览频数和浏览周期可很好地分别描述行为记忆的深度和广度,因而成为决定用户兴趣的关键因素。但简单地将用户历史记录中总的浏览频数和浏览周期解析出的兴趣表现,只是用户对项目的整体兴趣程度。事实上,用户历史记录中,哪怕是对同一个项目,在不同时间段都可能会表现多种不同兴趣。因此,将整体兴趣表现来标识近期的兴趣程度,将会丢失大量重要信息。
为更形象地描述用户对项目在不同周期内的兴趣表现,这里定义兴趣形态,以区别于兴趣程度。其中,兴趣程度仅发生在某一时间跨度,某一时刻兴趣的唯一独立的兴趣表现;兴趣形态则不局限于某一时间跨度,可在同一时刻表示多种兴趣表现的共现情况,即兴趣形态可指任一时间跨度,任一维度下的一种兴趣表现。
在本发明中,任一时刻点用表示,其中/>与/>表示同一用户对目标项目的不同历史浏览周期或不同用户对目标项目的同一浏览周期,则/>与表示对应浏览周期内的某一个浏览时刻。其中,兴趣程度只能是周期跨度中的某一时间轴/>直线上任一时刻中用户对目标项目的兴趣表现,而本发明将同一用户对目标项目的不同历史浏览周期或不同用户对目标项目的同一浏览周期置于同一时间平面内进行研究,因而,兴趣形态不受单一跨度或维度的约束,可为/>中的任一时刻中用户对目标项目的兴趣表现。
兴趣形态更适用于分析项目主体下的深度信息。进一步考虑到用户对项目在历史记录中可能存在多种兴趣形态,而当前的兴趣形态主要由最近一段时间的数据起主导作用。
本发明在不舍弃历史数据的情况下,指定一个距离当前时刻跨度合适的时间周期,综合该周期内的行为记忆来计算浏览次数和浏览周长/>。
其中,浏览次数是一个标量,必须为整数。
浏览周长是倒数第/>次行为的时间戳开始,每两个相邻时间戳差值的总和。
可见,所设计的浏览次数和浏览周长/>对项目的近期兴趣形态有着关键作用,根据这些因素可准确地对兴趣进行K均值聚类,进而利用线性回归生成自适应周期。
与传统模型根据用户基本信息与项目评价等信息计算相似度的方式不同,本发明主要利用和/>提取用户属性特征,转换成向量表示用以聚类。其优势是,这种考虑用深度信息将用户数据融合的方式,不易受缺失值或噪声的干扰,且/>和/>都是数值标量,反映更多用户潜在的行为信息,不易受用户及环境的影响。
K均值算法是典型的基于距离的聚类形式,在结合数值特征的聚类中表现优秀,同样也十分适用于本模型。算法采用距离作为评判相似度的标准,距离越大,两者之间的相似度越小。
兴趣形态相似度高的用户归到一类,可得到用户对每种项目在不同周期的兴趣形态,这在很大程度上反映出用户的兴趣规律,特别是最近一个周期内的兴趣形态,对于生成自适应周期起到关键作用。
步骤3,根据目标用户的行为记忆序列,按照预设的周期间隔数对目标用户的浏览周期进行切割,结合目标用户在单位周期内的浏览情况和设定的兴趣浮点变化规则,构建出用户-项目兴趣浮点模型,进一步使用Sigmoid函数对用户-项目兴趣浮点模型进行平滑优化,将用户-项目兴趣浮点模型中最后一个兴趣浮点的数值作为目标用户对目标类型的项目的当前兴趣量因子。
其中,步骤3具体包括:
步骤3.1,定义一个周期间隔数,将其作为单位周期间隔长度,将目标用户的浏览周期切分为h块;
不同的项目推荐,需要参考的用户历史行为跨度是不一致的。比如,商品推荐中,用户一个月前的数据依然具有很好的参考价值,但在音乐推荐中,用户的爱好随心情变化明显,一周前数据的价值就已大打折扣了。为使近期的行为能在兴趣量中起主导作用,却不丢失长久行为的作用,定义一个周期间隔数(Time_Period_Num, TPN),将其作为单位周期间隔长度,进而用户的历史行为总周期被切分为h块。同时,用兴趣指数描述用户的兴趣量变化情况,该指数会随着切分周期的改变呈起伏变化,表现为一个浮动的小点。
步骤3.2,设定如下兴趣浮点变化规则:
(1)有效切分指数从第一次出现用户对项目产生行为开始计数,逐个切分周期递进,有行为则加一个单位,否则减一个单位;
(2)预先设置兴趣量的有效饱和值;
(3)若用户对新项目产生行为,则兴趣指数从0开始计数;若用户对旧项目再一次产生行为,则兴趣指数在原来的数值上继续计数;
步骤3.3,根据目标用户在单位周期内的浏览情况以及上述的兴趣浮点变化规则,构建出用户-项目兴趣浮点模型,对于用户-项目兴趣浮点模型得到的每个兴趣浮点的数值,使用Sigmoid函数进行平滑优化,Sigmoid函数的表达式如下:
;
其中,表示兴趣浮点的数值,/>表示预先设置的兴趣量的有效饱和值,/>为控制参数,/>为自然数底;
本发明引入双曲正切Sigmoid函数对兴趣量进行优化计算。该函数在数据工程里面,通常被用来做归一化处理,以及减小某些离散值对整体数据分布的影响。为更好模拟出用户的行为变化规律,并充分利用Sigmoid函数的分布特点,将上述提出的兴趣指数变化转变为Sigmoid函数中的横坐标值的变化,而兴趣量变化则转变成Sigmoid函数中纵坐标值的变化。先要设置合理且有效的TPN,对兴趣指数进行累计演算,然后代入Sigmoid函数,求解出的值作为当前周期中的目标项目兴趣量因子,这样就有效地规避了局部数值过大的风险。
步骤3.4,将用户-项目兴趣浮点模型中最后一个兴趣浮点的数值作为目标用户对目标类型的项目的当前兴趣量因子。
步骤4,结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,将步骤2得到的自适应周期和步骤2得到的当前兴趣量因子代入兴趣模型,得出目标用户对目标类型的项目的兴趣程度,再根据该兴趣程度计算兴趣权重占比,根据该兴趣权重占比对不同类型的项目进行排序,再根据排序情况构建用户-类型-项目三元图结构,最后将用户-类型-项目三元图结构输入到图卷积网络模型中,得出目标用户对各个项目的得分,按照得分大小对各个项目进行排序以及组建推荐列表。
在求得自适应周期和兴趣量因子之后,采用悲观推荐的策略,关注于推荐可能被遗忘的兴趣,因为用户短期内兴趣量大的兴趣很容易被模型学习,相反地,将会被遗忘的兴趣却不容易被模型学习,但往往更可能是潜在兴趣。这就要求推荐时不仅要考虑当前的热门兴趣,还需兼顾到下一次推荐或用户下一次行为发生前将会被遗忘的兴趣(注意,这种兴趣可能来自于前几次推荐)。
现实中,用户一般不会主动再去浏览将会被遗忘的兴趣个体,也就是说用户的此次兴趣再次作用到上一个周期兴趣项目的概率并不大。但却常体现在同一类项目中,即再次浏览与上一次兴趣项目同类的项目个体。一般认为,用户潜在兴趣是先表现在某类项目上,再指向该类的某个具体项目上的想法是合理的。
假设喜剧类电影《喜剧之王》是用户上个历史周期的兴趣项目,但这个周期对动作类电影浏览量更高。因此,在推荐中考虑动作类电影的同时,也不能放弃电影《喜剧之王》带来的历史兴趣信息。然而,再推荐一次电影《喜剧之王》意义不大,但可推荐同为喜剧类的其它电影,比如《功夫》。本申请遵从用户浏览项目的行为规律,先推荐出用户的兴趣项目类型,再从兴趣项目类型推荐列表中预测用户的兴趣项目个体。
协同过滤、协同深度学习等模型的嵌入函数缺乏对关键关联信息的精确编码,往往这种编码揭示了隐藏在用户-项目交互中的用户(或物品)之间的相似性。更具体地说,大多数现有的方法只使用描述性特征(例如ID和相关属性)来构建嵌入函数,而不考虑用户-项目的一般交互或更高阶的交互关系。因此,当嵌入不足以捕获协作信息时,需采用具有交互关系的函数来弥补,则先要将用户-项目的一般交互关系转变成具有高阶连接性的形式。
本申请在传统的用户项目图结构上,加入项目类型信息,从而构建用户-类型-项目三元图结构信息,并采用其中的GCN方法来传播用户-项目嵌入信息,对用户与项目的高阶交互信息进行挖掘。将每一种潜在项目类型内的所有项目作为一个嵌入层,该嵌入层聚合了用户-项目的交互信息来进一步细化用户(或项目)的嵌入。每增加一个嵌入传播层,就能包含更多用户(或项目)的交互信息,且用户(或项目)的嵌入表示均由上一个传播层细化得到。因此,在传播过程中,可挖掘到更高阶用户-项目交互信息,或者增强用户-项目间的协作信号。
其中,步骤4具体包括:
步骤4.1,结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,兴趣模型的函数S的表达式为:
;
其中,为固定值0.00255,/>为自然数底,/>均为常数,/>表示时间轴的放大倍数;
步骤4.2,采用下式计算目标用户对目标类型的项目的兴趣程度:
;
其中,表示目标用户对目标类型的项目的兴趣程度,/>表示目标用户对目标类型的项目的当前兴趣量因子。
以项目A为例,用表示对A的兴趣量。结合用户的记忆行为,取第1次浏览结束的时间点作为时间原点,计算第1次与第2次浏览间的时间差t。将t带入兴趣保持率函数,得到第2次开始浏览的兴趣保持率/>。然后将/>与之前得到的/>(浏览信息A最近1次表现出的兴趣量)相乘,得到第2次浏览时推荐项目A的兴趣程度/>。之后的第2次推荐,可取第2次浏览结束后的时刻作为新的时间点。若用户在下一次浏览中继续浏览同一类信息,则说明他的兴趣未改变。为体现用户未改变兴趣,将新浏览得到的兴趣量/>以新一次浏览结束时刻作为新时间点来计算兴趣保持率,记为/>,以进一步确定对项目A的兴趣程度。这样,通过上述兴趣程度的计算公式就可预测出用户下一次浏览该类信息的兴趣程度。
由上述兴趣程度的计算公式可知,用户对信息相邻两次浏览间的时间差及兴趣量,是影响兴趣程度的两个关键因素。在进行推荐时,时间差是最后一次浏览时刻与下一次浏览时刻的间隔,它与兴趣量均是用户-项目基础信息和特征中无法轻易得到的,而需经过一系列对基础信息的归纳和转化,因此,本发明称之为深度信息。其中,该时间差即为行为记忆序列中的自适应周期,而用户对目标信息的兴趣量称为兴趣量因子。
步骤4.3,采用下式计算兴趣权重占比:
;
;
;
;
其中,表示兴趣权重占比,/>表示兴趣权重占比中间值,/>表示目标用户对所有类型的项目的兴趣程度,/>表示项目的类型总数,/>表示目标用户对第/>种类型的项目的兴趣程度,/>表示目标用户意图系数,/>表示最近一个周期内目标用户浏览项目的类型数,表示最近一个周期内目标用户浏览第I种类型的项目,/>表示最近一个周期内目标用户对第I种类型的项目的浏览次数,/>表示最近一个周期内目标用户对目标类型的项目的浏览次数,/>表示选择距离当前时刻最近/>个周期内的第/>个周期浏览的项目的类型总数,/>表示项目类型为第I种的项目数量,/>表示第一周期数,/>表示第二周期数,/>;
步骤4.4,根据兴趣权重占比对不同类型的项目进行排序,再根据排序情况构建用户-类型-项目三元图结构,将用户-类型-项目三元图结构输入到图卷积网络模型中,得出目标用户对各个项目的得分,按照得分大小对各个项目进行排序以及组建推荐列表。
其中,为降低模型的复杂度,本发明采用轻量级GCN,图卷积网络模型的输入为用户-类型-项目三元图结构组成的嵌入表示,输出为预测值,图卷积网络模型包括由嵌入层(生成并初始化用户与项目的嵌入)、图传播层(在多层传播中优化嵌入)及预测层(精化嵌入并输出预测值),图卷积网络模型满足以下条件式:
;
;
;
其中,表示预测值,即用户/>对项目/>的得分,/>表示用户/>的嵌入矩阵,/>表示项目/>的嵌入矩阵,/>表示图卷积网络模型的总层数,/>表示图卷积网络模型中的第k层,表示用户/>在第k层的潜在嵌入矩阵,/>表示项目/>在第k层的潜在嵌入矩阵,/>表示第k层的权重,T表示转置操作。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (4)
1.一种结合自适应周期与兴趣量因子的图卷积网络推荐方法,其特征在于,所述方法包括:
步骤1,将多个用户针对不同项目的历史行为记录转化成以时间间隔为单位的行为记忆序列;
步骤2,从行为记忆序列中提取出每个用户的浏览次数和浏览周期,根据浏览次数和浏览周期对同种类型项目下不同用户间的兴趣周期进行K均值聚类,得到同种类型项目下不同兴趣形态下的用户群,再使用多元线性回归方式拟合出同种类型项目下不同兴趣形态的函数表示,最后根据目标用户所属的兴趣形态匹配拟合出相应函数,并得到自适应周期;
步骤3,根据目标用户的行为记忆序列,按照预设的周期间隔数对目标用户的浏览周期进行切割,结合目标用户在单位周期内的浏览情况和设定的兴趣浮点变化规则,构建出用户-项目兴趣浮点模型,进一步使用Sigmoid函数对用户-项目兴趣浮点模型进行平滑优化,将用户-项目兴趣浮点模型中最后一个兴趣浮点的数值作为目标用户对目标类型的项目的当前兴趣量因子;
步骤4,结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,将步骤2得到的自适应周期和步骤3得到的当前兴趣量因子代入兴趣模型,得出目标用户对目标类型的项目的兴趣程度,再根据该兴趣程度计算兴趣权重占比,根据该兴趣权重占比对不同类型的项目进行排序,再根据排序情况构建用户-类型-项目三元图结构,最后将用户-类型-项目三元图结构输入到图卷积网络模型中,得出目标用户对各个项目的得分,按照得分大小对各个项目进行排序以及组建推荐列表;
在所述步骤2中,自适应周期的计算公式如下:
;
且;
其中,表示目标用户对项目的兴趣形态标识,/>与/>分别表示第1个、第2个与第/>个兴趣形态,/>与/>均表示偏置参数,/>为条件表达式函数,/>与/>均表示权重参数,表示浏览次数,/>表示浏览周长;
所述步骤3具体包括:
步骤3.1,定义一个周期间隔数,将其作为单位周期间隔长度,将目标用户的浏览周期切分为块;
步骤3.2,设定如下兴趣浮点变化规则:
(1)有效切分指数从第一次出现用户对项目产生行为开始计数,逐个切分周期递进,有行为则加一个单位,否则减一个单位;
(2)预先设置兴趣量的有效饱和值;
(3)若用户对新项目产生行为,则兴趣指数从0开始计数;若用户对旧项目再一次产生行为,则兴趣指数在原来的数值上继续计数;
步骤3.3,根据目标用户在单位周期内的浏览情况以及上述的兴趣浮点变化规则,构建出用户-项目兴趣浮点模型,对于用户-项目兴趣浮点模型得到的每个兴趣浮点的数值,使用Sigmoid函数进行平滑优化,Sigmoid函数的表达式如下:
;
其中,表示兴趣浮点的数值,/>表示预先设置的兴趣量的有效饱和值,/>为控制参数,/>为自然数底;
步骤3.4,将用户-项目兴趣浮点模型中最后一个兴趣浮点的数值作为目标用户对目标类型的项目的当前兴趣量因子。
2.根据权利要求1所述的结合自适应周期与兴趣量因子的图卷积网络推荐方法,其特征在于,在所述步骤1中,行为记忆序列的表达式如下:
;
其中,表示行为记忆序列,/>表示交互总次数,/>表示用户对项目进行第1次浏览和第2次浏览的时间间隔,/>表示用户对项目进行第2次浏览和第3次浏览的时间间隔,/>表示用户对项目进行第3次浏览和第4次浏览的时间间隔,/>表示用户对项目进行第/>次浏览和第/>次浏览的时间间隔,/>表示用户最近一次对项目进行浏览的时间戳,/>为自适应周期。
3.根据权利要求1所述的结合自适应周期与兴趣量因子的图卷积网络推荐方法,其特征在于,所述步骤4具体包括:
步骤4.1,结合艾宾浩斯遗忘曲线构建可计算用户兴趣程度的兴趣模型,兴趣模型的函数的表达式为:
;
其中,为固定值0.00255,/>为自然数底,/>和/>均为常数,/>表示时间轴的放大倍数;
步骤4.2,采用下式计算目标用户对目标类型的项目的兴趣程度:
;
其中,表示目标用户对目标类型的项目的兴趣程度,/>表示目标用户对目标类型的项目的当前兴趣量因子;
步骤4.3,采用下式计算兴趣权重占比:
;
;
;
;
其中,表示兴趣权重占比,/>表示兴趣权重占比中间值,/>表示目标用户对所有类型的项目的兴趣程度,/>表示项目的类型总数,/>表示目标用户对第/>种类型的项目的兴趣程度,/>表示目标用户意图系数,/>表示最近一个周期内目标用户浏览项目的类型数,/>表示最近一个周期内目标用户浏览第I种类型的项目,/>表示最近一个周期内目标用户对第I种类型的项目的浏览次数,/>表示最近一个周期内目标用户对目标类型的项目的浏览次数,表示选择距离当前时刻最近/>个周期内的第/>个周期浏览的项目的类型总数,/>表示项目类型为第I种的项目数量,/>表示第一周期数,/>表示第二周期数,/>;
步骤4.4,根据兴趣权重占比对不同类型的项目进行排序,再根据排序情况构建用户-类型-项目三元图结构,将用户-类型-项目三元图结构输入到图卷积网络模型中,得出目标用户对各个项目的得分,按照得分大小对各个项目进行排序以及组建推荐列表。
4.根据权利要求3所述的结合自适应周期与兴趣量因子的图卷积网络推荐方法,其特征在于,所述步骤4.4中,图卷积网络模型的输入为用户-类型-项目三元图结构组成的嵌入表示,输出为预测值,图卷积网络模型包括由嵌入层、图传播层及预测层,图卷积网络模型满足以下条件式:
;
;
;
其中,表示预测值,即用户/>对项目/>的得分,/>表示用户/>的嵌入矩阵,/>表示项目/>的嵌入矩阵,/>表示图卷积网络模型的总层数,/>表示图卷积网络模型中的第/>层,/>表示用户/>在第/>层的潜在嵌入矩阵,/>表示项目/>在第/>层的潜在嵌入矩阵,/>表示第/>层的权重,/>表示转置操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310196986.3A CN116070034B (zh) | 2023-03-03 | 2023-03-03 | 结合自适应周期与兴趣量因子的图卷积网络推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310196986.3A CN116070034B (zh) | 2023-03-03 | 2023-03-03 | 结合自适应周期与兴趣量因子的图卷积网络推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116070034A CN116070034A (zh) | 2023-05-05 |
CN116070034B true CN116070034B (zh) | 2023-11-03 |
Family
ID=86171550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310196986.3A Active CN116070034B (zh) | 2023-03-03 | 2023-03-03 | 结合自适应周期与兴趣量因子的图卷积网络推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116070034B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804336A (zh) * | 2018-06-15 | 2018-11-13 | 深圳壹账通智能科技有限公司 | 交互系统测试方法、装置、计算机设备和存储介质 |
CN109471676A (zh) * | 2018-10-30 | 2019-03-15 | 中国建设银行股份有限公司 | 参数配置处理方法和装置 |
CN110619081A (zh) * | 2019-09-20 | 2019-12-27 | 苏州市职业大学 | 一种基于交互图神经网络的新闻推送方法 |
CN111061961A (zh) * | 2019-11-19 | 2020-04-24 | 江西财经大学 | 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 |
CN111291261A (zh) * | 2020-01-21 | 2020-06-16 | 江西财经大学 | 融合标签和注意力机制的跨领域推荐方法及其实现系统 |
CN113468227A (zh) * | 2021-06-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 基于图神经网络的信息推荐方法、系统、设备和存储介质 |
CN114564652A (zh) * | 2022-04-29 | 2022-05-31 | 江西财经大学 | 基于用户意图与双向偏好的个性化礼物推荐方法与系统 |
CN115129995A (zh) * | 2022-07-12 | 2022-09-30 | 南昌大学 | 面向用户长短期兴趣衰减变化的电影推荐方法 |
CN115272015A (zh) * | 2022-06-15 | 2022-11-01 | 华南师范大学 | 基于异构图和协同衰减注意力机制的课程推荐方法及系统 |
CN115439187A (zh) * | 2022-09-02 | 2022-12-06 | 哈尔滨工业大学(威海) | 一种基于用户短期偏好的服务推荐方法 |
CN115659060A (zh) * | 2022-05-31 | 2023-01-31 | 杭州康晟健康管理咨询有限公司 | 一种基于动态图神经网络的信息推荐方法及系统 |
-
2023
- 2023-03-03 CN CN202310196986.3A patent/CN116070034B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804336A (zh) * | 2018-06-15 | 2018-11-13 | 深圳壹账通智能科技有限公司 | 交互系统测试方法、装置、计算机设备和存储介质 |
CN109471676A (zh) * | 2018-10-30 | 2019-03-15 | 中国建设银行股份有限公司 | 参数配置处理方法和装置 |
CN110619081A (zh) * | 2019-09-20 | 2019-12-27 | 苏州市职业大学 | 一种基于交互图神经网络的新闻推送方法 |
CN111061961A (zh) * | 2019-11-19 | 2020-04-24 | 江西财经大学 | 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 |
CN111291261A (zh) * | 2020-01-21 | 2020-06-16 | 江西财经大学 | 融合标签和注意力机制的跨领域推荐方法及其实现系统 |
CN113468227A (zh) * | 2021-06-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 基于图神经网络的信息推荐方法、系统、设备和存储介质 |
CN114564652A (zh) * | 2022-04-29 | 2022-05-31 | 江西财经大学 | 基于用户意图与双向偏好的个性化礼物推荐方法与系统 |
CN115659060A (zh) * | 2022-05-31 | 2023-01-31 | 杭州康晟健康管理咨询有限公司 | 一种基于动态图神经网络的信息推荐方法及系统 |
CN115272015A (zh) * | 2022-06-15 | 2022-11-01 | 华南师范大学 | 基于异构图和协同衰减注意力机制的课程推荐方法及系统 |
CN115129995A (zh) * | 2022-07-12 | 2022-09-30 | 南昌大学 | 面向用户长短期兴趣衰减变化的电影推荐方法 |
CN115439187A (zh) * | 2022-09-02 | 2022-12-06 | 哈尔滨工业大学(威海) | 一种基于用户短期偏好的服务推荐方法 |
Non-Patent Citations (2)
Title |
---|
GNN-based retrieval and recommadation system: A semantic enhenced graph model;Long Wang,等;《2022 IEEE 5th Advanced Information Management, Communicates, Electronic and Automation Control Conference (IMCEC)》;第1823-1830页 * |
结合用户长短期兴趣与事件影响力的事件推荐策略;钱忠胜,等;《计算机研究与发展》;第第59卷卷(第第12期期);第2803-2815页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116070034A (zh) | 2023-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Steck | Calibrated recommendations | |
Luo et al. | Personalized recommendation by matrix co-factorization with tags and time information | |
Lin et al. | Heterogeneous knowledge-based attentive neural networks for short-term music recommendations | |
CN107992531A (zh) | 基于深度学习的新闻个性化智能推荐方法与系统 | |
CN112765480B (zh) | 一种信息推送方法、装置及计算机可读存储介质 | |
CN104063481A (zh) | 一种基于用户实时兴趣向量的电影个性化推荐方法 | |
CN107220365A (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
Jiao et al. | A novel learning rate function and its application on the SVD++ recommendation algorithm | |
CN104935963A (zh) | 一种基于时序数据挖掘的视频推荐方法 | |
CN104462383A (zh) | 一种基于用户多种行为反馈的电影推荐方法 | |
CN112418525B (zh) | 社交话题群体行为的预测方法、装置及计算机存储介质 | |
Zhu et al. | A dynamic personalized news recommendation system based on BAP user profiling method | |
CN110851718A (zh) | 一种基于长短时记忆网络以及用户评论的电影推荐方法 | |
CN112214661B (zh) | 一种面向视频常规评论的情感不稳定用户检测方法 | |
Duan et al. | A hybrid intelligent service recommendation by latent semantics and explicit ratings | |
Sridhar et al. | Content-Based Movie Recommendation System Using MBO with DBN. | |
Chen et al. | DPM-IEDA: dual probabilistic model assisted interactive estimation of distribution algorithm for personalized search | |
Kant et al. | Fuzzy logic based similarity measure for multimedia contents recommendation | |
Bunga et al. | From implicit preferences to ratings: Video games recommendation based on collaborative filtering | |
Nasir et al. | Improving e-commerce product recommendation using semantic context and sequential historical purchases | |
CN116070034B (zh) | 结合自适应周期与兴趣量因子的图卷积网络推荐方法 | |
CN116975346A (zh) | 标签图数据的生成方法、装置、设备、介质和程序产品 | |
Darvishy et al. | New attributes for neighborhood-based collaborative filtering in news recommendation | |
Yu et al. | News recommendation model based on encoder graph neural network and bat optimization in online social multimedia art education | |
CN114022233A (zh) | 一种新型的商品推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |