CN112184341B - 一种基于档案网络的美食推荐方法 - Google Patents

一种基于档案网络的美食推荐方法 Download PDF

Info

Publication number
CN112184341B
CN112184341B CN202011244627.3A CN202011244627A CN112184341B CN 112184341 B CN112184341 B CN 112184341B CN 202011244627 A CN202011244627 A CN 202011244627A CN 112184341 B CN112184341 B CN 112184341B
Authority
CN
China
Prior art keywords
user
representation
term
long
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011244627.3A
Other languages
English (en)
Other versions
CN112184341A (zh
Inventor
王庆先
张仁建
李昊杰
黄庆
常奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202011244627.3A priority Critical patent/CN112184341B/zh
Publication of CN112184341A publication Critical patent/CN112184341A/zh
Application granted granted Critical
Publication of CN112184341B publication Critical patent/CN112184341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于档案网络的美食推荐方法,本方法结合了实体之间的关系本身包含的信息,引入了档案网络分别处理用户长期兴趣和用户评论数据,并通过改进后的LSTM序列模型将用户短期兴趣融合,最终通过上下文来确定他们的重要程度,因此本方法容纳了大量的关联信息和隐藏语义,使得学习得到的用户表示质量更佳,美食推荐结果更准确,具备部署可行性和卓越的推荐效果。

Description

一种基于档案网络的美食推荐方法
技术领域
本发明涉及大数据处理领域,具体涉及一种基于档案网络的美食推荐方法。
背景技术
用户建模是在线推荐系统的一项基本任务。在过去的几十年中,对协同过滤(CF)技术进行了很好的研究,以模拟用户的长期偏好。传统上,用户表示纯粹在离线阶段生成。如果不参考特定的候选美食项目进行推荐,就很难从兴趣的角度完全捕捉用户偏好。
发明内容
针对现有技术中的上述不足,本发明提供的基于档案网络的美食推荐方法可以针对用户的喜好进行精准推荐。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于档案网络的美食推荐方法,其包括以下步骤:
S1、建立美食项目知识图谱,将美食项目知识图谱中待推荐美食项目实体与对应关系所连接的其他实体邻居做单跳的聚合,得到待推荐美食项目表示;
S2、采用档案网络分别获取用户的长期兴趣表示和用户属性表示,采用LSTM序列模型获取用户的短期兴趣表示;根据当前用户浏览行为的上下文获取上下文表示;
S3、将长期兴趣表示、短期兴趣表示、用户属性表示和上下文表示进行拼接,得到拼接向量,将拼接向量进行激活,得到权重值;
S4、将权重值与长期兴趣表示和短期兴趣表示进行融合,并将融合后的结果与用户属性表示进行聚合,得到最终用户表示;
S5、将最终用户表示与待推荐美食项目表示进行拼接后激活,得到待推荐美食项目的点击率预测值;
S6、将点击率预测值最大的若干个待推荐美食项目作为推荐结果,完成美食推荐。
进一步地,步骤S1的具体方法包括以下子步骤:
S1-1、建立美食项目知识图谱,包括美食项目的所述商标、代言人、属性和分类;
S1-2、根据美食项目知识图谱中不同的关系进行相应实体邻居表示聚合,得到邻居聚合后的表示;
S1-3、根据公式:
Figure BDA0002769575380000021
获取第q个待推荐美食项目表示xq;其中σ为知识图谱中的激活函数;
Figure BDA0002769575380000022
表示第q个美食项目自身参与聚合的可训练参数;gq表示第q个美食项目的原始表示;
Figure BDA0002769575380000023
表示第q个美食项目在第r种关系中聚合的可训练参数;R表示关系的总数;
Figure BDA0002769575380000024
表示第q个美食项目在第r种关系的邻居聚合后的表示。
进一步地,步骤S2中采用档案网络获取用户的长期兴趣表示的具体方法包括以下子步骤:
S2-1-1、将用户行为按照行为发生的时间信息划分为用户短期行为和用户长期行为;
S2-1-2、将用户长期行为进行矢量化,得到长期行为矢量化向量;长期行为矢量化向量包括与用户相关的每个项目所对应的长期行为向量;
S2-1-3、将长期行为矢量化向量通过正交多头注意力机制池进行汇总,并根据公式:
Figure BDA0002769575380000031
得到每个用户对每个项目的长期行为档案列向量xi u;其中Θu代表用户u关于所有项目的长期行为矢量化向量集;θv代表用户u对于项目v的长期行为矢量化向量;
Figure BDA0002769575380000032
表示通过正交多头注意力机制池得到的关于θv的权重,i表示长期行为档案向量编号,即第i个长期行为档案列向量对应于项目v,也对应于θv
S2-1-4、根据公式:
Figure BDA0002769575380000033
将用户对项目的长期行为档案列向量与待推荐美食项目进行注意力计算和加权聚合,得到用户的长期兴趣表示
Figure BDA0002769575380000034
其中
Figure BDA0002769575380000035
表示通过注意力机制得到的第i个长期行为档案列向量的权重;B(u)表示长期行为档案列向量集。
进一步地,步骤S2中采用档案网络获取用户属性表示的具体方法包括以下子步骤:
S2-2-1、将用户评论数据进行矢量化,得到评论数据矢量化向量;其中用户评论数据包括用户ID、评论标题、评论主体、评论等级和评论时间;
S2-2-2、将长期行为矢量化向量通过正交多头注意力机制池进行汇总,并根据公式:
Figure BDA0002769575380000036
得到每个用户对每个项目的评论数据档案列向量
Figure BDA0002769575380000037
其中Θp代表用户u关于所有项目的评论数据矢量化向量集;θp代表用户u对于项目v的评论数据矢量化向量;
Figure BDA0002769575380000038
表示通过正交多头注意力机制池得到的关于θp的权重,i表示评论数据档案向量编号,即第i个评论数据档案列向量对应于项目v的评论数据,也对应于θp
S2-2-3、根据公式:
Figure BDA0002769575380000041
将用户对项目的评论数据档案列向量与待推荐美食项目进行注意力计算和加权聚合,得到用户属性表示
Figure BDA0002769575380000042
其中
Figure BDA0002769575380000043
表示通过注意力机制得到的第i个评论数据档案列向量的权重;C(u)表示评论数据档案列向量集。
进一步地,步骤S2中采用LSTM序列模型获取用户的短期兴趣表示的具体方法包括以下子步骤:
S2-3-1、将用户行为按照行为发生的时间信息划分为用户短期行为和用户长期行为,根据公式:
ck=fk⊙Tδ⊙ck-1+ik⊙Ts⊙φ(xkWc+hk-1Uc+bc)
获取LSTM序列模型的细胞状态输出;其中ck表示第k个细胞的状态输出;fk表示第k个细胞的遗忘门输出;ck-1表示第k-1个细胞的状态输出;ik表示第k个细胞的输入门输出;φ表示LSTM序列模型的细胞激活函数;xk表示第k个细胞的原始输入,即用户短期行为;Wc、Uc和bc均为常数;hk-1表示第k-1个细胞的隐藏状态输出;⊙表示LSTM序列模型的中的element-wise相乘,即Hadamard乘积;Tδ为表示用户历史美食交互行为序列中连续的两个美食项目交互间隔时间的时间间隔门;Ts为表示LSTM细胞中的美食项目与待预测的美食项目的时间跨度的时间跨度门;
S2-3-2、根据公式:
Figure BDA0002769575380000044
获取LSTM序列模型的细胞输出门的输出;其中ok表示第k个细胞的输出门的输出;
Figure BDA0002769575380000045
和b0均为常数;
Figure BDA0002769575380000046
表示时间间隔;
Figure BDA0002769575380000047
表示时间跨度;
S2-3-3、将LSTM序列模型的细胞状态输出和输出门的输出通过注意力机制得到细胞的隐藏状态输出,并根据公式:
Figure BDA0002769575380000051
获取用户u的短期兴趣表示
Figure BDA0002769575380000052
其中Bu表示用户u交互过的美食项目总数;ai表示第i个细胞的注意力系数;hi表示第i个细胞的隐藏状态输出。
进一步地,步骤S2中根据当前用户浏览行为的上下文获取上下文表示的具体方法为:
对于数值型的当前用户浏览行为则直接输入;对于类别型的当前用户浏览行为则进行one-hot编码;对于字符串型的当前用户浏览行为则进行embedding操作;将对当前用户浏览行为的所有操作进行拼接得到上下文表示。
进一步地,步骤S3的具体方法为:
将长期兴趣表示、短期兴趣表示、用户属性表示和上下文表示进行拼接,得到拼接向量,根据公式:
Figure BDA0002769575380000053
将拼接向量进行激活,得到权重值α;其中σ为sigmoid激活函数;Wm和bm均为常数;
Figure BDA0002769575380000054
为用户u的短期兴趣表示;
Figure BDA0002769575380000055
为用户u的长期兴趣表示;
Figure BDA0002769575380000056
为用户u的用户属性表示;xcontext为上下文表示。
进一步地,步骤S4的具体方法为:
根据公式:
Figure BDA0002769575380000057
将权重值α与长期兴趣表示
Figure BDA0002769575380000058
和短期兴趣表示
Figure BDA0002769575380000059
进行融合,并将融合后的结果与用户属性表示
Figure BDA00027695753800000510
进行聚合,得到最终用户表示
Figure BDA00027695753800000511
进一步地,步骤S5的具体方法为:
将最终用户表示与待推荐美食项目表示进行拼接,将拼接得到的向量通过两层的感知机后通过sigmoid函数激活,得到待推荐美食项目的点击率预测值。
本发明的有益效果为:本方法根据知识图谱中的不同关系,将美食项目实体与对应关系所连接的其他实体邻居做单跳的聚合,得到更丰富的美食项目表示。然后对于用户的长短期兴趣表示学习方法方面进行具体细化;一方面,对于用户短期兴趣的推荐所需的数据信息应该详细丰富;引入了一种改进后的LSTM技术来处理用户短时间段的历史行为,即改进后的LSTM使得对时间间隔和跨度敏感,得到一系列的隐藏状态;另一方面对于用户长期兴趣的推荐所需的数据信息应该全面、精简,引入了档案网络来处理用户长时间段的历史行为,即用户历史在离线阶段被总结成高度紧凑和互补的向量,称为档案。同时,用户对特定候选美食项目的偏好可以通过这种档案的集中而被精确地捕获。本方法结合了实体之间的关系本身包含的信息,引入了档案网络分别处理用户长期兴趣和用户评论数据,并通过改进后的LSTM序列模型将用户短期兴趣融合,最终通过上下文来确定他们的重要程度,因此本方法容纳了大量的关联信息和隐藏语义,使得学习得到的用户表示质量更佳,美食推荐结果更准确,具备部署可行性和卓越的推荐效果。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,该基于档案网络的美食推荐方法包括以下步骤:
S1、建立美食项目知识图谱,将美食项目知识图谱中待推荐美食项目实体与对应关系所连接的其他实体邻居做单跳的聚合,得到待推荐美食项目表示;
S2、采用档案网络分别获取用户的长期兴趣表示和用户属性表示,采用LSTM序列模型获取用户的短期兴趣表示;根据当前用户浏览行为的上下文获取上下文表示;
S3、将长期兴趣表示、短期兴趣表示、用户属性表示和上下文表示进行拼接,得到拼接向量,将拼接向量进行激活,得到权重值;
S4、将权重值与长期兴趣表示和短期兴趣表示进行融合,并将融合后的结果与用户属性表示进行聚合,得到最终用户表示;
S5、将最终用户表示与待推荐美食项目表示进行拼接后激活,得到待推荐美食项目的点击率预测值;
S6、将点击率预测值最大的若干个待推荐美食项目作为推荐结果,完成美食推荐。
步骤S1的具体方法包括以下子步骤:
S1-1、建立美食项目知识图谱,包括美食项目的所述商标、代言人、属性和分类;
S1-2、根据美食项目知识图谱中不同的关系进行相应实体邻居表示聚合,得到邻居聚合后的表示;
S1-3、根据公式:
Figure BDA0002769575380000071
获取第q个待推荐美食项目表示xq;其中σ为知识图谱中的激活函数;
Figure BDA0002769575380000072
表示第q个美食项目自身参与聚合的可训练参数;gq表示第q个美食项目的原始表示;
Figure BDA0002769575380000081
表示第q个美食项目在第r种关系中聚合的可训练参数;R表示关系的总数;
Figure BDA0002769575380000082
表示第q个美食项目在第r种关系的邻居聚合后的表示。
步骤S2中采用档案网络获取用户的长期兴趣表示的具体方法包括以下子步骤:
S2-1-1、将用户行为按照行为发生的时间信息划分为用户短期行为和用户长期行为;
S2-1-2、将用户长期行为进行矢量化,得到长期行为矢量化向量;长期行为矢量化向量包括与用户相关的每个项目所对应的长期行为向量;
S2-1-3、将长期行为矢量化向量通过正交多头注意力机制池进行汇总,并根据公式:
Figure BDA0002769575380000083
得到每个用户对每个项目的长期行为档案列向量
Figure BDA0002769575380000084
其中Θu代表用户u关于所有项目的长期行为矢量化向量集;θv代表用户u对于项目v的长期行为矢量化向量;
Figure BDA0002769575380000085
表示通过正交多头注意力机制池得到的关于θv的权重,i表示长期行为档案向量编号,即第i个长期行为档案列向量对应于项目v,也对应于θv
S2-1-4、根据公式:
Figure BDA0002769575380000086
将用户对项目的长期行为档案列向量与待推荐美食项目进行注意力计算和加权聚合,得到用户的长期兴趣表示
Figure BDA0002769575380000087
其中
Figure BDA0002769575380000088
表示通过注意力机制得到的第i个长期行为档案列向量的权重;B(u)表示长期行为档案列向量集。
步骤S2中采用档案网络获取用户属性表示的具体方法包括以下子步骤:
S2-2-1、将用户评论数据进行矢量化,得到评论数据矢量化向量;其中用户评论数据包括用户ID、评论标题、评论主体、评论等级和评论时间;
S2-2-2、将长期行为矢量化向量通过正交多头注意力机制池进行汇总,并根据公式:
Figure BDA0002769575380000091
得到每个用户对每个项目的评论数据档案列向量
Figure BDA0002769575380000092
其中Θp代表用户u关于所有项目的评论数据矢量化向量集;θp代表用户u对于项目v的评论数据矢量化向量;
Figure BDA0002769575380000093
表示通过正交多头注意力机制池得到的关于θp的权重,i表示评论数据档案向量编号,即第i个评论数据档案列向量对应于项目v的评论数据,也对应于θp
S2-2-3、根据公式:
Figure BDA0002769575380000094
将用户对项目的评论数据档案列向量与待推荐美食项目进行注意力计算和加权聚合,得到用户属性表示
Figure BDA0002769575380000095
其中
Figure BDA0002769575380000096
表示通过注意力机制得到的第i个评论数据档案列向量的权重;C(u)表示评论数据档案列向量集。
步骤S2中采用LSTM序列模型获取用户的短期兴趣表示的具体方法包括以下子步骤:
S2-3-1、将用户行为按照行为发生的时间信息划分为用户短期行为和用户长期行为,根据公式:
ck=fk⊙Tδ⊙ck-1+ik⊙Ts⊙φ(xkWc+hk-1Uc+bc)
获取LSTM序列模型的细胞状态输出;其中ck表示第k个细胞的状态输出;fk表示第k个细胞的遗忘门输出;ck-1表示第k-1个细胞的状态输出;ik表示第k个细胞的输入门输出;φ表示LSTM序列模型的细胞激活函数;xk表示第k个细胞的原始输入,即用户短期行为;Wc、Uc和bc均为常数;hk-1表示第k-1个细胞的隐藏状态输出;⊙表示LSTM序列模型的中的element-wise相乘,即Hadamard乘积;Tδ为表示用户历史美食交互行为序列中连续的两个美食项目交互间隔时间的时间间隔门;Ts为表示LSTM细胞中的美食项目与待预测的美食项目的时间跨度的时间跨度门;
S2-3-2、根据公式:
Figure BDA0002769575380000101
获取LSTM序列模型的细胞输出门的输出;其中ok表示第k个细胞的输出门的输出;
Figure BDA0002769575380000102
和b0均为常数;
Figure BDA0002769575380000103
表示时间间隔;
Figure BDA0002769575380000104
表示时间跨度;
S2-3-3、将LSTM序列模型的细胞状态输出和输出门的输出通过注意力机制得到细胞的隐藏状态输出,并根据公式:
Figure BDA0002769575380000105
获取用户u的短期兴趣表示
Figure BDA0002769575380000106
其中Bu表示用户u交互过的美食项目总数;ai表示第i个细胞的注意力系数;hi表示第i个细胞的隐藏状态输出。
步骤S2中根据当前用户浏览行为的上下文获取上下文表示的具体方法为:对于数值型的当前用户浏览行为则直接输入;对于类别型的当前用户浏览行为则进行one-hot编码;对于字符串型的当前用户浏览行为则进行embedding操作;将对当前用户浏览行为的所有操作进行拼接得到上下文表示。
步骤S3的具体方法为:将长期兴趣表示、短期兴趣表示、用户属性表示和上下文表示进行拼接,得到拼接向量,根据公式:
Figure BDA0002769575380000107
将拼接向量进行激活,得到权重值α;其中σ为sigmoid激活函数;Wm和bm均为常数;
Figure BDA0002769575380000111
为用户u的短期兴趣表示;
Figure BDA0002769575380000112
为用户u的长期兴趣表示;
Figure BDA0002769575380000113
为用户u的用户属性表示;xcontext为上下文表示。
步骤S4的具体方法为:根据公式:
Figure BDA0002769575380000114
将权重值α与长期兴趣表示
Figure BDA0002769575380000115
和短期兴趣表示
Figure BDA0002769575380000116
进行融合,并将融合后的结果与用户属性表示
Figure BDA0002769575380000117
进行聚合,得到最终用户表示
Figure BDA0002769575380000118
步骤S5的具体方法为:将最终用户表示与待推荐美食项目表示进行拼接,将拼接得到的向量通过两层的感知机后通过sigmoid函数激活,得到待推荐美食项目的点击率预测值。
在具体实施过程中,由于用户长期历史行为集可能会冗余,故在正交多头注意力机制池中还可以加入向量相似性去冗余操作,减少冗余数据。
综上所述,本发明根据知识图谱中的不同关系,将美食项目实体与对应关系所连接的其他实体邻居做单跳的聚合,得到更丰富的美食项目表示。然后对于用户的长短期兴趣表示学习方法方面进行具体细化;一方面,对于用户短期兴趣的推荐所需的数据信息应该详细丰富;引入了一种改进后的LSTM技术来处理用户短时间段的历史行为,即改进后的LSTM使得对时间间隔和跨度敏感,得到一系列的隐藏状态;另一方面对于用户长期兴趣的推荐所需的数据信息应该全面、精简,引入了档案网络来处理用户长时间段的历史行为,即用户历史在离线阶段被总结成高度紧凑和互补的向量,称为档案。同时,用户对特定候选美食项目的偏好可以通过这种档案的集中而被精确地捕获。本方法结合了实体之间的关系本身包含的信息,引入了档案网络分别处理用户长期兴趣和用户评论数据,并通过改进后的LSTM序列模型将用户短期兴趣融合,最终通过上下文来确定他们的重要程度,因此本方法容纳了大量的关联信息和隐藏语义,使得学习得到的用户表示质量更佳,美食推荐结果更准确,具备部署可行性和卓越的推荐效果。

Claims (8)

1.一种基于档案网络的美食推荐方法,其特征在于,包括以下步骤:
S1、建立美食项目知识图谱,将美食项目知识图谱中待推荐美食项目实体与对应关系所连接的其他实体邻居做单跳的聚合,得到待推荐美食项目表示;
S2、采用档案网络分别获取用户的长期兴趣表示和用户属性表示,采用LSTM序列模型获取用户的短期兴趣表示;根据当前用户浏览行为的上下文获取上下文表示;
S3、将长期兴趣表示、短期兴趣表示、用户属性表示和上下文表示进行拼接,得到拼接向量,将拼接向量进行激活,得到权重值;
S4、将权重值与长期兴趣表示和短期兴趣表示进行融合,并将融合后的结果与用户属性表示进行聚合,得到最终用户表示;
S5、将最终用户表示与待推荐美食项目表示进行拼接后激活,得到待推荐美食项目的点击率预测值;
S6、将点击率预测值最大的若干个待推荐美食项目作为推荐结果,完成美食推荐;
步骤S1的具体方法包括以下子步骤:
S1-1、建立美食项目知识图谱,包括美食项目的商标、代言人、属性和分类;
S1-2、根据美食项目知识图谱中不同的关系进行相应实体邻居表示聚合,得到邻居聚合后的表示;
S1-3、根据公式:
Figure FDA0003607476820000011
获取第q个待推荐美食项目表示xq;其中σ为知识图谱中的激活函数;
Figure FDA0003607476820000012
表示第q个美食项目自身参与聚合的可训练参数;gq表示第q个美食项目的原始表示;
Figure FDA0003607476820000021
表示第q个美食项目在第r种关系中聚合的可训练参数;R表示关系的总数;
Figure FDA0003607476820000022
表示第q个美食项目在第r种关系的邻居聚合后的表示。
2.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S2中采用档案网络获取用户的长期兴趣表示的具体方法包括以下子步骤:
S2-1-1、将用户行为按照行为发生的时间信息划分为用户短期行为和用户长期行为;
S2-1-2、将用户长期行为进行矢量化,得到长期行为矢量化向量;长期行为矢量化向量包括与用户相关的每个项目所对应的长期行为向量;
S2-1-3、将长期行为矢量化向量通过正交多头注意力机制池进行汇总,并根据公式:
Figure FDA0003607476820000023
得到每个用户对每个项目的长期行为档案列向量
Figure FDA0003607476820000024
其中Θu代表用户u关于所有项目的长期行为矢量化向量集;θv代表用户u对于项目v的长期行为矢量化向量;
Figure FDA0003607476820000025
表示通过正交多头注意力机制池得到的关于θv的权重,i表示长期行为档案向量编号,即第i个长期行为档案列向量对应于项目v,也对应于θv
S2-1-4、根据公式:
Figure FDA0003607476820000026
将用户对项目的长期行为档案列向量与待推荐美食项目进行注意力计算和加权聚合,得到用户的长期兴趣表示
Figure FDA0003607476820000027
其中
Figure FDA0003607476820000028
表示通过注意力机制得到的第i个长期行为档案列向量的权重;B(u)表示长期行为档案列向量集。
3.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S2中采用档案网络获取用户属性表示的具体方法包括以下子步骤:
S2-2-1、将用户评论数据进行矢量化,得到评论数据矢量化向量;其中用户评论数据包括用户ID、评论标题、评论主体、评论等级和评论时间;
S2-2-2、将长期行为矢量化向量通过正交多头注意力机制池进行汇总,并根据公式:
Figure FDA0003607476820000031
得到每个用户对每个项目的评论数据档案列向量
Figure FDA0003607476820000032
其中Θp代表用户u关于所有项目的评论数据矢量化向量集;θp代表用户u对于项目v的评论数据矢量化向量;
Figure FDA0003607476820000033
表示通过正交多头注意力机制池得到的关于θp的权重,i表示评论数据档案向量编号,即第i个评论数据档案列向量对应于项目v的评论数据,也对应于θp
S2-2-3、根据公式:
Figure FDA0003607476820000034
将用户对项目的评论数据档案列向量与待推荐美食项目进行注意力计算和加权聚合,得到用户属性表示
Figure FDA0003607476820000035
其中
Figure FDA0003607476820000036
表示通过注意力机制得到的第i个评论数据档案列向量的权重;C(u)表示评论数据档案列向量集。
4.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S2中采用LSTM序列模型获取用户的短期兴趣表示的具体方法包括以下子步骤:
S2-3-1、将用户行为按照行为发生的时间信息划分为用户短期行为和用户长期行为,根据公式:
ck=fk⊙Tδ⊙ck-1+ik⊙Ts⊙φ(xkWc+hk-1Uc+bc)
获取LSTM序列模型的细胞状态输出;其中ck表示第k个细胞的状态输出;fk表示第k个细胞的遗忘门输出;ck-1表示第k-1个细胞的状态输出;ik表示第k个细胞的输入门输出;φ表示LSTM序列模型的细胞激活函数;xk表示第k个细胞的原始输入,即用户短期行为;Wc、Uc和bc均为常数;hk-1表示第k-1个细胞的隐藏状态输出;⊙表示LSTM序列模型的中的element-wise相乘,即Hadamard乘积;Tδ为表示用户历史美食交互行为序列中连续的两个美食项目交互间隔时间的时间间隔门;Ts为表示LSTM细胞中的美食项目与待预测的美食项目的时间跨度的时间跨度门;
S2-3-2、根据公式:
Figure FDA0003607476820000041
获取LSTM序列模型的细胞输出门的输出;其中ok表示第k个细胞的输出门的输出;
Figure FDA0003607476820000042
和b0均为常数;
Figure FDA0003607476820000043
表示时间间隔;
Figure FDA0003607476820000044
表示时间跨度;
S2-3-3、将LSTM序列模型的细胞状态输出和输出门的输出通过注意力机制得到细胞的隐藏状态输出,并根据公式:
Figure FDA0003607476820000045
获取用户u的短期兴趣表示
Figure FDA0003607476820000046
其中|Bu|表示用户u交互过的美食项目总数;ai表示第i个细胞的注意力系数;hi表示第i个细胞的隐藏状态输出。
5.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S2中根据当前用户浏览行为的上下文获取上下文表示的具体方法为:
对于数值型的当前用户浏览行为则直接输入;对于类别型的当前用户浏览行为则进行one-hot编码;对于字符串型的当前用户浏览行为则进行embedding操作;将对当前用户浏览行为的所有操作进行拼接得到上下文表示。
6.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S3的具体方法为:
将长期兴趣表示、短期兴趣表示、用户属性表示和上下文表示进行拼接,得到拼接向量,根据公式:
Figure FDA0003607476820000051
将拼接向量进行激活,得到权重值α;其中σ为sigmoid激活函数;Wm和bm均为常数;
Figure FDA0003607476820000052
为用户u的短期兴趣表示;
Figure FDA0003607476820000053
为用户u的长期兴趣表示;
Figure FDA0003607476820000054
为用户u的用户属性表示;xcontext为上下文表示。
7.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S4的具体方法为:
根据公式:
Figure FDA0003607476820000055
将权重值α与长期兴趣表示
Figure FDA0003607476820000056
和短期兴趣表示
Figure FDA0003607476820000057
进行融合,并将融合后的结果与用户属性表示
Figure FDA0003607476820000058
进行聚合,得到最终用户表示
Figure FDA0003607476820000059
8.根据权利要求1所述的基于档案网络的美食推荐方法,其特征在于,所述步骤S5的具体方法为:
将最终用户表示与待推荐美食项目表示进行拼接,将拼接得到的向量通过两层的感知机后通过sigmoid函数激活,得到待推荐美食项目的点击率预测值。
CN202011244627.3A 2020-11-10 2020-11-10 一种基于档案网络的美食推荐方法 Active CN112184341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011244627.3A CN112184341B (zh) 2020-11-10 2020-11-10 一种基于档案网络的美食推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011244627.3A CN112184341B (zh) 2020-11-10 2020-11-10 一种基于档案网络的美食推荐方法

Publications (2)

Publication Number Publication Date
CN112184341A CN112184341A (zh) 2021-01-05
CN112184341B true CN112184341B (zh) 2022-07-08

Family

ID=73916580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011244627.3A Active CN112184341B (zh) 2020-11-10 2020-11-10 一种基于档案网络的美食推荐方法

Country Status (1)

Country Link
CN (1) CN112184341B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408589B (zh) * 2022-08-31 2023-06-20 智城动力(深圳)科技有限公司 一种客户类型匹配方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180052884A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Knowledge graph construction for intelligent online personal assistant
CN108874957B (zh) * 2018-06-06 2022-02-01 华东师范大学 基于Meta-graph知识图谱表示的对话式音乐推荐方法
CN108920527A (zh) * 2018-06-07 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化推荐方法
CN110633373B (zh) * 2018-06-20 2023-06-09 上海财经大学 一种基于知识图谱和深度学习的汽车舆情分析方法
CN111695022B (zh) * 2019-01-18 2023-07-04 创新奇智(重庆)科技有限公司 一种基于知识图谱可视化的兴趣搜索方法
CN110287335B (zh) * 2019-06-17 2021-08-27 桂林电子科技大学 基于知识图谱和用户长短期偏好的个性化景点推荐方法及装置
CN110288436A (zh) * 2019-06-19 2019-09-27 桂林电子科技大学 一种基于游客偏好建模的个性化景点推荐方法
CN111274373B (zh) * 2020-01-16 2021-06-11 山东大学 一种基于知识图谱的电子病历问答方法及系统
CN111538827B (zh) * 2020-04-28 2023-09-05 清华大学 基于内容和图神经网络的判例推荐方法、装置及存储介质

Also Published As

Publication number Publication date
CN112184341A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN111241311B (zh) 媒体信息推荐方法、装置、电子设备及存储介质
Mongia et al. Deep latent factor model for collaborative filtering
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
CN110348968B (zh) 一种基于用户及项目耦合关系分析的推荐系统及方法
Liu et al. Dynamic attention-based explainable recommendation with textual and visual fusion
CN112632403B (zh) 推荐模型的训练方法、推荐方法、装置、设备和介质
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
Wu et al. Contextual operation for recommender systems
Li et al. Sparse online collaborative filtering with dynamic regularization
CN112650929A (zh) 一种融入评论信息的图神经网络推荐方法
CN113918833A (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及系统
CN112184341B (zh) 一种基于档案网络的美食推荐方法
CN115982467A (zh) 一种去偏化用户多兴趣推荐方法、装置及存储介质
Panagiotakis et al. A dual hybrid recommender system based on SCoR and the random forest
CN115481325A (zh) 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统
Liu et al. Adaptive hierarchical attention-enhanced gated network integrating reviews for item recommendation
Selma et al. Deep learning for recommender systems: Literature review and perspectives
Feng et al. Personalized recommendation with hybrid feedback by refining implicit data
Hou et al. Deep Reinforcement Learning Recommendation System based on GRU and Attention Mechanism.
Chen et al. A Hybrid Neural Network and Hidden Markov Model for Time-aware Recommender Systems.
Elias et al. Movie Recommendation Based on Mood Detection using Deep Learning Approach
CN113010796B (zh) 用于项目推荐的方法
CN116628179B (zh) 一种用户操作数据的可视化与人机交互推荐方法
CN114238755A (zh) 基于多关系发现的个性化推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant