CN117009646A

CN117009646A - 一种基于知识图谱与深度学习的食谱信息推送方法

Info

Publication number: CN117009646A
Application number: CN202310555565.5A
Authority: CN
Inventors: 王肖阳; 陈奇; 张子健; 陈明健; 陈扬伟; 干红华
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2023-05-17
Filing date: 2023-05-17
Publication date: 2023-11-07

Abstract

本发明公开了一种基于知识图谱与深度学习的食谱信息推送方法，该方法通过采集食谱相关信息构建食谱知识图谱，获取食谱具体描述文本信息，并分别进行进行向量化抽取；将用户食谱交互矩阵进行矩阵分解，得到用户场景向量以及食谱场景向量并进行拼接得到场景向量；将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征获得食谱特征；将用户类别信息和食谱类别信息通过Embedding转化为向量特征；将用户数值型特征以及食谱数值型特征进行归一化；将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理；构建并训练推荐系统以进行食谱推荐。该方法有效的提升了推荐系统的可解释性、精度和泛化能力。

Description

一种基于知识图谱与深度学习的食谱信息推送方法

技术领域

本申请涉及信息提取推送技术领域，具体涉及一种基于知识图谱与深度学习的食谱信息推送方法。

背景技术

现代社会生活水平不断提高，在家庭生活和社交活动中，饮食扮演着越来越重要的角色。随着互联网的飞速发展，从网络中获取食谱信息也成了人们的日常习惯。然而互联网中的数据量相当庞大，并且依旧在飞速增长，如何从海量的食谱中获取有价值的适合用户的食谱成为了有待解决的问题。

目前市场上许多软件根据搜集到的用户以及食谱等相关数据，推荐给用户可能喜欢的食谱，他们更多采用的是基于协同过滤或者简单的机器学习模型，虽然实现简单但是损失了很多有效信息，推荐效果有待进一步提高。

发明内容

本发明目的在于针对现有技术的不足，提出一种基于知识图谱与深度学习的食谱信息推送方法，捕获用户的相关喜好以及食谱相关信息，为用户推荐食谱以及食谱相关信息。

为了实现上述目的，本发明采用的技术方案包括以下步骤：

S1：采集食谱相关信息构建食谱知识图谱并获取食谱具体描述文本信息；

S2：将食谱具体描述文本信息进行向量化抽取，得到食谱具体描述文本信息向量特征；

S3：将食谱知识图谱进行向量化抽取，得到食谱知识图谱向量特征；

S4：将用户食谱交互矩阵进行矩阵分解，得到用户场景向量以及食谱场景向量，将用户场景向量以及食谱场景向量进行拼接得到场景向量，此时场景向量代表用户和食谱的场景偏向，将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征通过动态权重层进行动态权重分配以及特征融合；

动态权重层注意力函数为：

f(x_kg，s)＝x_kgWS，f(x_wd，s)＝x_wdWS

其中x_kg为食谱知识图谱的向量，W为权重矩阵，S为场景向量，x_wd为食谱具体描述文本信息特征向量；

权重权重/>

其中α为食谱知识图谱的向量x_kg的权重，β为食谱具体描述文本信息特征向量x_wd的权重；

融合后的食谱特征向量为：

y＝x_kg^Tα+x_wd^Tβ；

S5：构建并训练食谱推荐系统以进行食谱推荐，具体步骤如下：

S5.1：将用户类别信息以及食谱类别信息通过Embedding转化为向量特征；

S5.2：将用户数值型特征以及食谱数值型特征进行归一化处理；

S5.3：将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉；

S5.4：将交叉后的特征输入Attention net来获取不同特征的权重并将赋予不同权重后的特征传入下一层神经网络；

S5.5：将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理；并与Attention net输出的向量输入输出层，进行模型训练；得到训练好的食谱推荐系统用于食谱推荐。

进一步地，所述S1中所述具体步骤如下：研究人员选择食谱领域作为知识范围，对食谱领域中的本体进行定义，根据本体的数据描述，定义其相关属性信息以及值域，对本体之间关系进行定义并添加了约束条件，之后生成知识图谱记录并存储，同时获取食谱的具体步骤的文本信息。

进一步地，所述S2中所述食谱具体描述文本信息向量化抽取为使用Word2vec模型进行向量化抽取。

进一步地，所述S3中所述食谱知识图谱向量化抽取具体为使用TransR模型进行向量化抽取。

进一步地，所述S5中用户类别信息包括职业和城市，所述食谱类别信息包括食谱类别。

进一步地，所述S5中用户数值型特征包括用户年龄；所述食谱数值型特征包括食谱的点赞数和收藏数。

进一步地，所述S5中食谱推荐系统分为两部分，左侧交叉积变换层和右侧部分；左侧交叉积变换层部分用于提升模型的记忆能力，右侧部分用于提升模型的泛化能力。

进一步地，所述用户收藏食谱id特征以及待曝光食谱id特征通过交叉积变换层进行特征处理。

进一步地，所述模型右侧部分用于：

将用户类别信息以及食谱类别信息通过Embedding转化为向量特征；

将用户年龄等各数值型特征以及食谱点赞数、收藏数等数值型特征进行归一化处理；

将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉。

进一步地，所述S5中食谱推荐步骤具体为：遍历所有待推荐食谱，将待预测用户的相关身份信息、用户食谱交互信息以及食谱对应信息输入推荐系统模型中，根据得分高低进行排序，根据推荐食谱限制数量，将前n个得分较高的食谱进行推荐。

有益效果：

(1)本发明提供的基于知识图谱和深度学习的食谱信息推荐方法，相比于现有的基于用户或物品的协同过滤进行食谱信息推荐的相关技术，本发明利用食谱知识图谱以及食谱相关描述信息为推荐系统引入额外信息，有效的提升了推荐系统的可解释性；

(2)本发明提供了一种将食谱具体描述文本信息特征和食谱知识图谱向量特征结合场景向量特征进行动态分配权重的方法，增强了食谱领域中食谱具体描述文本信息特征和食谱知识图谱向量特征的特征融合效果；

(2)本发明提出了一种推荐系统模型，将食谱具体描述文本信息和食谱知识图谱有效结合后的特征引入提出的推荐系统模型中，有效提升了推荐系统的准确率。

附图说明

图1为本发明提供的一种基于知识图谱与深度学习的食谱信息推送方法的流程示意图；

图2为本发明提供的一种基于知识图谱与深度学习的食谱信息推送方法的模型架构；

具体实施方式

以下结合附图对本发明具体实施方式作进一步详细说明。

如图1所示为本申请实例提供的一种基于知识图谱与深度学习的食谱信息推送方法的流程示意图。在本实施例中，食谱信息推送方法可以包括如下步骤。

动态权重层注意力函数为：

f(x_kg，s)＝x_kgWS，f(x_wd，s)＝x_wdWS

权重权重/>

融合后的食谱特征向量为：

y＝x_kg^Tα+x_wd^Tβ；

所述S1中所述具体步骤如下：研究人员选择食谱领域作为知识范围，对食谱领域中的本体进行定义，根据本体的数据描述，定义其相关属性信息以及值域，对本体之间关系进行定义并添加了约束条件，之后生成知识图谱记录并存储，同时获取食谱的具体步骤的文本信息。

所述S2中所述食谱具体描述文本信息向量化抽取为使用Word2vec模型进行向量化抽取。

所述S3中所述食谱知识图谱向量化抽取具体为使用TransR模型进行向量化抽取。

所述S5中用户类别信息包括职业和城市，所述食谱类别信息包括食谱类别。

所述S5中用户数值型特征包括用户年龄；所述食谱数值型特征包括食谱的点赞数和收藏数。

所述S5中食谱推荐系统分为两部分，左侧交叉积变换层和右侧部分；左侧交叉积变换层部分用于提升模型的记忆能力，右侧部分用于提升模型的泛化能力。

所述用户收藏食谱id特征以及待曝光食谱id特征通过交叉积变换层进行特征处理。

所述模型右侧部分用于：

所述S5中食谱推荐步骤具体为：遍历所有待推荐食谱，将待预测用户的相关身份信息、用户食谱交互信息以及食谱对应信息输入推荐系统模型中，根据得分高低进行排序，根据推荐食谱限制数量，将前n个得分较高的食谱进行推荐。

实施例：

如图2所示，本发明提供一种基于知识图谱与深度学习的食谱信息推送方法的模型，该模型由动态权重层、Embedding层、交叉积变换层、Attention Net以及输出层构成，用于实现个性化食谱推荐。

动态权重层将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征进行动态权重分配以及特征融合，更好的针对某用户和某食谱的场景偏向进行推荐，增强推荐效果。

Embedding层的主要作用是将输入的离散特征转换为连续的稠密向量表示。它通过学习一个嵌入矩阵，将每个离散特征映射到一个低维的向量空间中。这些低维向量可以被视为对原始特征的一种压缩和提取，能够更好地捕捉特征之间的相似性和差异性。

交叉积变换层的主要作用是实现输入特征的交叉组合，从而提高模型在稀疏数据上的性能，提升模型的记忆能力。

Attention Net(注意力网络)是基于注意力机制构建的神经网络模型。AttentionMechanism(注意力机制)是一种用于自然语言处理和机器学习中的算法，能够帮助模型更好地理解和处理数据。Attention Net的作用是通过给予不同特征不同的权重，使得模型能够更加关注某些特定的部分，从而提高模型对输入数据的理解和表达能力。具体来说，Attention Net可以在对输入进行编码的同时，自动学习一个权重向量，将不同部分的信息进行不同程度的融合，从而产生更好的输出结果。

输出层是神经网络中的最后一层，它的主要作用是将模型输入的各类数据特征转化为最终的输出结果。

为了后续进行知识图谱的特征提取，需要先构建食谱知识图谱。

构建知识图谱时，以三元组的形式将搜集到的食谱相关数据进行存储，具体的食谱属性信息涉及菜式(家常菜、快手菜、下饭菜等)、功效(减肥、美容、润肺抗燥等)、适宜人群(儿童、老人、孕产妇等)、菜系(鲁菜、川菜、韩国料理等)、器具(烤箱、烤箱菜、电饭煲等)、烹调方法(煎、蒸、炖、红烧等)、口味特色(辣、咖喱、糖醋、蒜香、原味等)、形态(寿司、糖果、汤圆、果汁等)、用餐场合(生日、野餐、正餐、工作餐等)、用餐时间(早餐、中餐、晚餐、夜宵等)、主料(肉类、蔬菜水果、水产等)、辅料(盐、醋、味精、料酒等)；将菜式、功效、适宜人群、菜系、器具、烹调方法、口味特色、形态、用餐场合、用餐时间、主料、辅料等属性信息组成食谱属性集合。食谱节点的属性信息构建具体方式为：根据食谱属性集合，按集合元素即属性名称逐一抽取信息并预处理，上述预处理包括缺失值补充等。

将菜谱发布者的其他相关文字描述使用Word2Vec模型进行向量化表示；

将获取到的知识图谱使用TransR模型进行向量化表示，对于每个三元组(h，r，t)，将实体空间中的实体通过矩阵M_r投影到r关系空间中，分别为h_r和t_r，

h_r＝hM_r，t_r＝tM_r.

得分函数为：

约束条件为：||h||₂≤1，||r||₂≤1，||t||₂≤1，||hM_r||₂≤1，||tM_r||₂≤1

损失函数为：

式中γ是一个超参数；

将用户食谱交互图进行矩阵分解，例如交互矩阵为M(m*n)分解成两个矩阵P(m*k)和Q(k*n)，之后将矩阵进行转置拼接为N((m+n)*k)，此时获得场景向量，场景向量代表用户和食谱的场景偏向。

将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征通过动态权重层进行动态权重分配以及特征融合。进行动态分配权重是为了更好的针对某用户和某食谱的场景偏向进行推荐，增强推荐效果。例如对于一个喜欢尝试新菜品的用户，知识图谱特征可能更加重要，因为它可以提供更多的食材、口味等信息，帮助用户发现新颖的食谱；对于一个喜欢按步骤做菜的用户，食谱具体描述文本信息特征可能更加重要，因为它可以提供更多的技巧、注意事项等信息，帮助用户完成食谱；对于一个在节日或特殊场合做菜的用户，知识图谱特征和食谱具体描述文本信息特征可能都比较重要，因为它们可以提供更多的食材搭配、菜品风格、烹饪难度等信息，帮助用户选择合适的食谱。

动态权重层注意力函数为

f(x_kg，s)＝x_kgWS，f(x_wd，s)＝x_wdWS.

其中x_kg为食谱知识图谱的向量，W为权重矩阵，S为场景向量，x_wd为食谱具体描述文本信息特征向量。

权重权重/>

α为食谱知识图谱的向量x_kg的权重，β为食谱具体描述文本信息特征向量x_wd的权重。

融合后的食谱特征向量为

y＝x_kg^Tα+x_wd^Tβ.

例如此时食谱知识图谱向量x_kg＝[0.2，0.4，0.6，0.8]，食谱具体描述文本信息特征向量x_wd＝[0.1，0.3，0.5，0.7]，场景向量S＝[[0.9，0.8]，[0.8，0.9]]，初始化一个随机的权重矩阵W＝[[0.1，0.2]，[0.3，0.4]，[0.5，0.6]，[0.7，0.8]]，注意力函数f(x_kg，s)＝x_kgWS以及f(x_wd，s)＝x_wdWS，前者的输出为[1.8600，1.8800]，后者的输出为[1.5560，1.5720]，x_kg的权重值为[0.5445，0.5446]，x_wd的权重值为[0.4555，0.4554]，融合后的特征向量y＝x_kg^Tα+x_wd^Tβ，y为[[0.1544，0.1545]，[0.3544，0.3545]，[0.5544，0.5545]，[0.7544，0.7545]]。

将用户的年龄等数值型特征进行归一化处理。将用户的所在城市等类别型特征通过Embedding层进行编码。具体来说，我们将每个离散特征都映射到一个固定长度的低维向量空间，以便更好地表示特征之间的关系。

将动态权重层输出的特征、Embedding层输出的特征以及归一化处理之后的数值型特征进行特征交叉，所得向量输入Attention网络分配不同的权重；在Attention层中，不同特征x_i，x_j的交叉特征的权重a_ij公式如下：

a′_ij＝h^TReLU(W(V_i⊙V_j)x_ix_j+b)

其中h为全连接层到softmax输出层的权重向量，ReLU是激活函数，V_i和V_j代表第i个和第j个特征的隐向量，⊙代表Hadamard乘积，表示对应位置元素相乘，W为特征交叉层到注意力网络全连接层的权重矩阵，b为偏置向量；

将用户收藏食谱id特征以及待曝光食谱id特征进行交叉积变换，交叉积变换层定义如下：

其中，C_ki是一个bool型变量，如果第i个特征是第k个变换的一部分则为1，否则为0；

模型右侧部分每一个隐层都执行以下计算：

a^(l+1)＝f(ω^(l)a^(l)+b^(l))

其中f是激活函数ReLU，ω^(l)，a^(l)，b^(l)，分别是第l层的权重矩阵，激活值，偏置；

将交叉积变换层和attention网络层输出的向量进行组合输入输出层进行训练，模型的预测值定义如下：

其中，Y是二值分类标签，σ是sigmoid函数，是原始特征X的跨产品变换，b是偏置项，/>是左侧模型的权重向量，/>是右侧模型的权重向量，用于最终激活函数a^(lf)的权重，a^(lf)是指attention网络层的输出向量。

将用户以及食谱相关信息输入到训练好的推荐系统模型中，根据模型的输出得分进行排序，将排名靠前的n个食谱推荐至用户；

上述实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。

Claims

1.一种基于知识图谱与深度学习的食谱信息推送方法，其特征在于，包括以下步骤：

动态权重层注意力函数为：

f(x_kg,s)＝x_kgWS，f(x_wd,s)＝x_wdWS

权重权重/>

融合后的食谱特征向量为：

y＝x_kg^Tα+x_wd^Tβ；

S5.5：将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理；并与Attentionnet输出的向量输入输出层，进行模型训练；得到训练好的食谱推荐系统用于食谱推荐。

2.根据权利要求1所述的方法，其特征在于，所述S1中所述具体步骤如下：研究人员选择食谱领域作为知识范围，对食谱领域中的本体进行定义，根据本体的数据描述，定义其相关属性信息以及值域，对本体之间关系进行定义并添加了约束条件，之后生成知识图谱记录并存储，同时获取食谱的具体步骤的文本信息。

3.根据权利要求1所述的方法，其特征在于，所述S2中所述食谱具体描述文本信息向量化抽取为使用Word2vec模型进行向量化抽取。

4.根据权利要求1所述的方法，其特征在于，所述S3中所述食谱知识图谱向量化抽取具体为使用TransR模型进行向量化抽取。

5.根据权利要求1所述的方法，其特征在于，所述S5中用户类别信息包括性别和职业，所述食谱类别信息包括食谱类别。

6.根据权利要求1所述的方法，其特征在于，所述S5中用户数值型特征包括用户年龄；所述食谱数值型特征包括食谱的点赞数和收藏量。

7.根据权利要求1所述的方法，其特征在于，所述S5中食谱推荐系统分为两部分，左侧交叉积变换层和右侧部分；左侧交叉积变换层部分用于提升模型的记忆能力，右侧部分用于提升模型的泛化能力。

8.根据权利要求7所述的方法，其特征在于，所述用户收藏食谱id特征以及待曝光食谱id特征通过交叉积变换层进行特征处理。

9.根据权利要求7所述的方法，其特征在于，所述模型右侧部分用于：

10.根据权利要求1所述的方法，其特征在于，所述S5中食谱推荐步骤具体为：遍历所有待推荐食谱，将待预测用户的相关身份信息、用户食谱交互信息以及食谱对应信息输入推荐系统模型中，根据得分高低进行排序，根据推荐食谱限制数量，将前n个得分较高的食谱进行推荐。