CN117009646A - 一种基于知识图谱与深度学习的食谱信息推送方法 - Google Patents
一种基于知识图谱与深度学习的食谱信息推送方法 Download PDFInfo
- Publication number
- CN117009646A CN117009646A CN202310555565.5A CN202310555565A CN117009646A CN 117009646 A CN117009646 A CN 117009646A CN 202310555565 A CN202310555565 A CN 202310555565A CN 117009646 A CN117009646 A CN 117009646A
- Authority
- CN
- China
- Prior art keywords
- recipe
- vector
- user
- information
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 118
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 230000003993 interaction Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 5
- 230000009466 transformation Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000010411 cooking Methods 0.000 description 6
- 235000021186 dishes Nutrition 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 235000012054 meals Nutrition 0.000 description 4
- 235000009508 confectionery Nutrition 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 240000002234 Allium sativum Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 235000013410 fast food Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 235000015203 fruit juice Nutrition 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- LPUQAYUQRXPFSQ-DFWYDOINSA-M monosodium L-glutamate Chemical compound [Na+].[O-]C(=O)[C@@H](N)CCC(O)=O LPUQAYUQRXPFSQ-DFWYDOINSA-M 0.000 description 1
- 235000013923 monosodium glutamate Nutrition 0.000 description 1
- 239000004223 monosodium glutamate Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000021178 picnic Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 235000002639 sodium chloride Nutrition 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 235000021419 vinegar Nutrition 0.000 description 1
- 239000000052 vinegar Substances 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱与深度学习的食谱信息推送方法,该方法通过采集食谱相关信息构建食谱知识图谱,获取食谱具体描述文本信息,并分别进行进行向量化抽取;将用户食谱交互矩阵进行矩阵分解,得到用户场景向量以及食谱场景向量并进行拼接得到场景向量;将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征获得食谱特征;将用户类别信息和食谱类别信息通过Embedding转化为向量特征;将用户数值型特征以及食谱数值型特征进行归一化;将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理;构建并训练推荐系统以进行食谱推荐。该方法有效的提升了推荐系统的可解释性、精度和泛化能力。
Description
技术领域
本申请涉及信息提取推送技术领域,具体涉及一种基于知识图谱与深度学习的食谱信息推送方法。
背景技术
现代社会生活水平不断提高,在家庭生活和社交活动中,饮食扮演着越来越重要的角色。随着互联网的飞速发展,从网络中获取食谱信息也成了人们的日常习惯。然而互联网中的数据量相当庞大,并且依旧在飞速增长,如何从海量的食谱中获取有价值的适合用户的食谱成为了有待解决的问题。
目前市场上许多软件根据搜集到的用户以及食谱等相关数据,推荐给用户可能喜欢的食谱,他们更多采用的是基于协同过滤或者简单的机器学习模型,虽然实现简单但是损失了很多有效信息,推荐效果有待进一步提高。
发明内容
本发明目的在于针对现有技术的不足,提出一种基于知识图谱与深度学习的食谱信息推送方法,捕获用户的相关喜好以及食谱相关信息,为用户推荐食谱以及食谱相关信息。
为了实现上述目的,本发明采用的技术方案包括以下步骤:
S1:采集食谱相关信息构建食谱知识图谱并获取食谱具体描述文本信息;
S2:将食谱具体描述文本信息进行向量化抽取,得到食谱具体描述文本信息向量特征;
S3:将食谱知识图谱进行向量化抽取,得到食谱知识图谱向量特征;
S4:将用户食谱交互矩阵进行矩阵分解,得到用户场景向量以及食谱场景向量,将用户场景向量以及食谱场景向量进行拼接得到场景向量,此时场景向量代表用户和食谱的场景偏向,将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征通过动态权重层进行动态权重分配以及特征融合;
动态权重层注意力函数为:
f(x_kg,s)=x_kgWS,f(x_wd,s)=x_wdWS
其中x_kg为食谱知识图谱的向量,W为权重矩阵,S为场景向量,x_wd为食谱具体描述文本信息特征向量;
权重权重/>
其中α为食谱知识图谱的向量x_kg的权重,β为食谱具体描述文本信息特征向量x_wd的权重;
融合后的食谱特征向量为:
y=x_kgTα+x_wdTβ;
S5:构建并训练食谱推荐系统以进行食谱推荐,具体步骤如下:
S5.1:将用户类别信息以及食谱类别信息通过Embedding转化为向量特征;
S5.2:将用户数值型特征以及食谱数值型特征进行归一化处理;
S5.3:将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉;
S5.4:将交叉后的特征输入Attention net来获取不同特征的权重并将赋予不同权重后的特征传入下一层神经网络;
S5.5:将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理;并与Attention net输出的向量输入输出层,进行模型训练;得到训练好的食谱推荐系统用于食谱推荐。
进一步地,所述S1中所述具体步骤如下:研究人员选择食谱领域作为知识范围,对食谱领域中的本体进行定义,根据本体的数据描述,定义其相关属性信息以及值域,对本体之间关系进行定义并添加了约束条件,之后生成知识图谱记录并存储,同时获取食谱的具体步骤的文本信息。
进一步地,所述S2中所述食谱具体描述文本信息向量化抽取为使用Word2vec模型进行向量化抽取。
进一步地,所述S3中所述食谱知识图谱向量化抽取具体为使用TransR模型进行向量化抽取。
进一步地,所述S5中用户类别信息包括职业和城市,所述食谱类别信息包括食谱类别。
进一步地,所述S5中用户数值型特征包括用户年龄;所述食谱数值型特征包括食谱的点赞数和收藏数。
进一步地,所述S5中食谱推荐系统分为两部分,左侧交叉积变换层和右侧部分;左侧交叉积变换层部分用于提升模型的记忆能力,右侧部分用于提升模型的泛化能力。
进一步地,所述用户收藏食谱id特征以及待曝光食谱id特征通过交叉积变换层进行特征处理。
进一步地,所述模型右侧部分用于:
将用户类别信息以及食谱类别信息通过Embedding转化为向量特征;
将用户年龄等各数值型特征以及食谱点赞数、收藏数等数值型特征进行归一化处理;
将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉。
进一步地,所述S5中食谱推荐步骤具体为:遍历所有待推荐食谱,将待预测用户的相关身份信息、用户食谱交互信息以及食谱对应信息输入推荐系统模型中,根据得分高低进行排序,根据推荐食谱限制数量,将前n个得分较高的食谱进行推荐。
有益效果:
(1)本发明提供的基于知识图谱和深度学习的食谱信息推荐方法,相比于现有的基于用户或物品的协同过滤进行食谱信息推荐的相关技术,本发明利用食谱知识图谱以及食谱相关描述信息为推荐系统引入额外信息,有效的提升了推荐系统的可解释性;
(2)本发明提供了一种将食谱具体描述文本信息特征和食谱知识图谱向量特征结合场景向量特征进行动态分配权重的方法,增强了食谱领域中食谱具体描述文本信息特征和食谱知识图谱向量特征的特征融合效果;
(2)本发明提出了一种推荐系统模型,将食谱具体描述文本信息和食谱知识图谱有效结合后的特征引入提出的推荐系统模型中,有效提升了推荐系统的准确率。
附图说明
图1为本发明提供的一种基于知识图谱与深度学习的食谱信息推送方法的流程示意图;
图2为本发明提供的一种基于知识图谱与深度学习的食谱信息推送方法的模型架构;
具体实施方式
以下结合附图对本发明具体实施方式作进一步详细说明。
如图1所示为本申请实例提供的一种基于知识图谱与深度学习的食谱信息推送方法的流程示意图。在本实施例中,食谱信息推送方法可以包括如下步骤。
S1:采集食谱相关信息构建食谱知识图谱并获取食谱具体描述文本信息;
S2:将食谱具体描述文本信息进行向量化抽取,得到食谱具体描述文本信息向量特征;
S3:将食谱知识图谱进行向量化抽取,得到食谱知识图谱向量特征;
S4:将用户食谱交互矩阵进行矩阵分解,得到用户场景向量以及食谱场景向量,将用户场景向量以及食谱场景向量进行拼接得到场景向量,此时场景向量代表用户和食谱的场景偏向,将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征通过动态权重层进行动态权重分配以及特征融合;
动态权重层注意力函数为:
f(x_kg,s)=x_kgWS,f(x_wd,s)=x_wdWS
其中x_kg为食谱知识图谱的向量,W为权重矩阵,S为场景向量,x_wd为食谱具体描述文本信息特征向量;
权重权重/>
其中α为食谱知识图谱的向量x_kg的权重,β为食谱具体描述文本信息特征向量x_wd的权重;
融合后的食谱特征向量为:
y=x_kgTα+x_wdTβ;
S5:构建并训练食谱推荐系统以进行食谱推荐,具体步骤如下:
S5.1:将用户类别信息以及食谱类别信息通过Embedding转化为向量特征;
S5.2:将用户数值型特征以及食谱数值型特征进行归一化处理;
S5.3:将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉;
S5.4:将交叉后的特征输入Attention net来获取不同特征的权重并将赋予不同权重后的特征传入下一层神经网络;
S5.5:将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理;并与Attention net输出的向量输入输出层,进行模型训练;得到训练好的食谱推荐系统用于食谱推荐。
所述S1中所述具体步骤如下:研究人员选择食谱领域作为知识范围,对食谱领域中的本体进行定义,根据本体的数据描述,定义其相关属性信息以及值域,对本体之间关系进行定义并添加了约束条件,之后生成知识图谱记录并存储,同时获取食谱的具体步骤的文本信息。
所述S2中所述食谱具体描述文本信息向量化抽取为使用Word2vec模型进行向量化抽取。
所述S3中所述食谱知识图谱向量化抽取具体为使用TransR模型进行向量化抽取。
所述S5中用户类别信息包括职业和城市,所述食谱类别信息包括食谱类别。
所述S5中用户数值型特征包括用户年龄;所述食谱数值型特征包括食谱的点赞数和收藏数。
所述S5中食谱推荐系统分为两部分,左侧交叉积变换层和右侧部分;左侧交叉积变换层部分用于提升模型的记忆能力,右侧部分用于提升模型的泛化能力。
所述用户收藏食谱id特征以及待曝光食谱id特征通过交叉积变换层进行特征处理。
所述模型右侧部分用于:
将用户类别信息以及食谱类别信息通过Embedding转化为向量特征;
将用户年龄等各数值型特征以及食谱点赞数、收藏数等数值型特征进行归一化处理;
将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉。
所述S5中食谱推荐步骤具体为:遍历所有待推荐食谱,将待预测用户的相关身份信息、用户食谱交互信息以及食谱对应信息输入推荐系统模型中,根据得分高低进行排序,根据推荐食谱限制数量,将前n个得分较高的食谱进行推荐。
实施例:
如图2所示,本发明提供一种基于知识图谱与深度学习的食谱信息推送方法的模型,该模型由动态权重层、Embedding层、交叉积变换层、Attention Net以及输出层构成,用于实现个性化食谱推荐。
动态权重层将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征进行动态权重分配以及特征融合,更好的针对某用户和某食谱的场景偏向进行推荐,增强推荐效果。
Embedding层的主要作用是将输入的离散特征转换为连续的稠密向量表示。它通过学习一个嵌入矩阵,将每个离散特征映射到一个低维的向量空间中。这些低维向量可以被视为对原始特征的一种压缩和提取,能够更好地捕捉特征之间的相似性和差异性。
交叉积变换层的主要作用是实现输入特征的交叉组合,从而提高模型在稀疏数据上的性能,提升模型的记忆能力。
Attention Net(注意力网络)是基于注意力机制构建的神经网络模型。AttentionMechanism(注意力机制)是一种用于自然语言处理和机器学习中的算法,能够帮助模型更好地理解和处理数据。Attention Net的作用是通过给予不同特征不同的权重,使得模型能够更加关注某些特定的部分,从而提高模型对输入数据的理解和表达能力。具体来说,Attention Net可以在对输入进行编码的同时,自动学习一个权重向量,将不同部分的信息进行不同程度的融合,从而产生更好的输出结果。
输出层是神经网络中的最后一层,它的主要作用是将模型输入的各类数据特征转化为最终的输出结果。
为了后续进行知识图谱的特征提取,需要先构建食谱知识图谱。
构建知识图谱时,以三元组的形式将搜集到的食谱相关数据进行存储,具体的食谱属性信息涉及菜式(家常菜、快手菜、下饭菜等)、功效(减肥、美容、润肺抗燥等)、适宜人群(儿童、老人、孕产妇等)、菜系(鲁菜、川菜、韩国料理等)、器具(烤箱、烤箱菜、电饭煲等)、烹调方法(煎、蒸、炖、红烧等)、口味特色(辣、咖喱、糖醋、蒜香、原味等)、形态(寿司、糖果、汤圆、果汁等)、用餐场合(生日、野餐、正餐、工作餐等)、用餐时间(早餐、中餐、晚餐、夜宵等)、主料(肉类、蔬菜水果、水产等)、辅料(盐、醋、味精、料酒等);将菜式、功效、适宜人群、菜系、器具、烹调方法、口味特色、形态、用餐场合、用餐时间、主料、辅料等属性信息组成食谱属性集合。食谱节点的属性信息构建具体方式为:根据食谱属性集合,按集合元素即属性名称逐一抽取信息并预处理,上述预处理包括缺失值补充等。
将菜谱发布者的其他相关文字描述使用Word2Vec模型进行向量化表示;
将获取到的知识图谱使用TransR模型进行向量化表示,对于每个三元组(h,r,t),将实体空间中的实体通过矩阵Mr投影到r关系空间中,分别为hr和tr,
hr=hMr,tr=tMr.
得分函数为:
约束条件为:||h||2≤1,||r||2≤1,||t||2≤1,||hMr||2≤1,||tMr||2≤1
损失函数为:
式中γ是一个超参数;
将用户食谱交互图进行矩阵分解,例如交互矩阵为M(m*n)分解成两个矩阵P(m*k)和Q(k*n),之后将矩阵进行转置拼接为N((m+n)*k),此时获得场景向量,场景向量代表用户和食谱的场景偏向。
将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征通过动态权重层进行动态权重分配以及特征融合。进行动态分配权重是为了更好的针对某用户和某食谱的场景偏向进行推荐,增强推荐效果。例如对于一个喜欢尝试新菜品的用户,知识图谱特征可能更加重要,因为它可以提供更多的食材、口味等信息,帮助用户发现新颖的食谱;对于一个喜欢按步骤做菜的用户,食谱具体描述文本信息特征可能更加重要,因为它可以提供更多的技巧、注意事项等信息,帮助用户完成食谱;对于一个在节日或特殊场合做菜的用户,知识图谱特征和食谱具体描述文本信息特征可能都比较重要,因为它们可以提供更多的食材搭配、菜品风格、烹饪难度等信息,帮助用户选择合适的食谱。
动态权重层注意力函数为
f(x_kg,s)=x_kgWS,f(x_wd,s)=x_wdWS.
其中x_kg为食谱知识图谱的向量,W为权重矩阵,S为场景向量,x_wd为食谱具体描述文本信息特征向量。
权重权重/>
α为食谱知识图谱的向量x_kg的权重,β为食谱具体描述文本信息特征向量x_wd的权重。
融合后的食谱特征向量为
y=x_kgTα+x_wdTβ.
例如此时食谱知识图谱向量x_kg=[0.2,0.4,0.6,0.8],食谱具体描述文本信息特征向量x_wd=[0.1,0.3,0.5,0.7],场景向量S=[[0.9,0.8],[0.8,0.9]],初始化一个随机的权重矩阵W=[[0.1,0.2],[0.3,0.4],[0.5,0.6],[0.7,0.8]],注意力函数f(x_kg,s)=x_kgWS以及f(x_wd,s)=x_wdWS,前者的输出为[1.8600,1.8800],后者的输出为[1.5560,1.5720],x_kg的权重值为[0.5445,0.5446],x_wd的权重值为[0.4555,0.4554],融合后的特征向量y=x_kgTα+x_wdTβ,y为[[0.1544,0.1545],[0.3544,0.3545],[0.5544,0.5545],[0.7544,0.7545]]。
将用户的年龄等数值型特征进行归一化处理。将用户的所在城市等类别型特征通过Embedding层进行编码。具体来说,我们将每个离散特征都映射到一个固定长度的低维向量空间,以便更好地表示特征之间的关系。
将动态权重层输出的特征、Embedding层输出的特征以及归一化处理之后的数值型特征进行特征交叉,所得向量输入Attention网络分配不同的权重;在Attention层中,不同特征xi,xj的交叉特征的权重aij公式如下:
a′ij=hTReLU(W(Vi⊙Vj)xixj+b)
其中h为全连接层到softmax输出层的权重向量,ReLU是激活函数,Vi和Vj代表第i个和第j个特征的隐向量,⊙代表Hadamard乘积,表示对应位置元素相乘,W为特征交叉层到注意力网络全连接层的权重矩阵,b为偏置向量;
将用户收藏食谱id特征以及待曝光食谱id特征进行交叉积变换,交叉积变换层定义如下:
其中,Cki是一个bool型变量,如果第i个特征是第k个变换的一部分则为1,否则为0;
模型右侧部分每一个隐层都执行以下计算:
a(l+1)=f(ω(l)a(l)+b(l))
其中f是激活函数ReLU,ω(l),a(l),b(l),分别是第l层的权重矩阵,激活值,偏置;
将交叉积变换层和attention网络层输出的向量进行组合输入输出层进行训练,模型的预测值定义如下:
其中,Y是二值分类标签,σ是sigmoid函数,是原始特征X的跨产品变换,b是偏置项,/>是左侧模型的权重向量,/>是右侧模型的权重向量,用于最终激活函数a(lf)的权重,a(lf)是指attention网络层的输出向量。
将用户以及食谱相关信息输入到训练好的推荐系统模型中,根据模型的输出得分进行排序,将排名靠前的n个食谱推荐至用户;
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (10)
1.一种基于知识图谱与深度学习的食谱信息推送方法,其特征在于,包括以下步骤:
S1:采集食谱相关信息构建食谱知识图谱并获取食谱具体描述文本信息;
S2:将食谱具体描述文本信息进行向量化抽取,得到食谱具体描述文本信息向量特征;
S3:将食谱知识图谱进行向量化抽取,得到食谱知识图谱向量特征;
S4:将用户食谱交互矩阵进行矩阵分解,得到用户场景向量以及食谱场景向量,将用户场景向量以及食谱场景向量进行拼接得到场景向量,此时场景向量代表用户和食谱的场景偏向,将食谱具体描述文本信息向量特征和食谱知识图谱向量特征结合场景向量特征通过动态权重层进行动态权重分配以及特征融合;
动态权重层注意力函数为:
f(x_kg,s)=x_kgWS,f(x_wd,s)=x_wdWS
其中x_kg为食谱知识图谱的向量,W为权重矩阵,S为场景向量,x_wd为食谱具体描述文本信息特征向量;
权重权重/>
其中α为食谱知识图谱的向量x_kg的权重,β为食谱具体描述文本信息特征向量x_wd的权重;
融合后的食谱特征向量为:
y=x_kgTα+x_wdTβ;
S5:构建并训练食谱推荐系统以进行食谱推荐,具体步骤如下:
S5.1:将用户类别信息以及食谱类别信息通过Embedding转化为向量特征;
S5.2:将用户数值型特征以及食谱数值型特征进行归一化处理;
S5.3:将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉;
S5.4:将交叉后的特征输入Attention net来获取不同特征的权重并将赋予不同权重后的特征传入下一层神经网络;
S5.5:将用户收藏食谱id特征以及待曝光食谱id特征进行特征处理;并与Attentionnet输出的向量输入输出层,进行模型训练;得到训练好的食谱推荐系统用于食谱推荐。
2.根据权利要求1所述的方法,其特征在于,所述S1中所述具体步骤如下:研究人员选择食谱领域作为知识范围,对食谱领域中的本体进行定义,根据本体的数据描述,定义其相关属性信息以及值域,对本体之间关系进行定义并添加了约束条件,之后生成知识图谱记录并存储,同时获取食谱的具体步骤的文本信息。
3.根据权利要求1所述的方法,其特征在于,所述S2中所述食谱具体描述文本信息向量化抽取为使用Word2vec模型进行向量化抽取。
4.根据权利要求1所述的方法,其特征在于,所述S3中所述食谱知识图谱向量化抽取具体为使用TransR模型进行向量化抽取。
5.根据权利要求1所述的方法,其特征在于,所述S5中用户类别信息包括性别和职业,所述食谱类别信息包括食谱类别。
6.根据权利要求1所述的方法,其特征在于,所述S5中用户数值型特征包括用户年龄;所述食谱数值型特征包括食谱的点赞数和收藏量。
7.根据权利要求1所述的方法,其特征在于,所述S5中食谱推荐系统分为两部分,左侧交叉积变换层和右侧部分;左侧交叉积变换层部分用于提升模型的记忆能力,右侧部分用于提升模型的泛化能力。
8.根据权利要求7所述的方法,其特征在于,所述用户收藏食谱id特征以及待曝光食谱id特征通过交叉积变换层进行特征处理。
9.根据权利要求7所述的方法,其特征在于,所述模型右侧部分用于:
将用户类别信息以及食谱类别信息通过Embedding转化为向量特征;
将用户年龄等各数值型特征以及食谱点赞数、收藏数等数值型特征进行归一化处理;
将融合后的食谱特征向量、用户类别信息向量特征、食谱类别信息向量特征、归一化后的用户数值型特征以及食谱数值型特征进行特征交叉。
10.根据权利要求1所述的方法,其特征在于,所述S5中食谱推荐步骤具体为:遍历所有待推荐食谱,将待预测用户的相关身份信息、用户食谱交互信息以及食谱对应信息输入推荐系统模型中,根据得分高低进行排序,根据推荐食谱限制数量,将前n个得分较高的食谱进行推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310555565.5A CN117009646A (zh) | 2023-05-17 | 2023-05-17 | 一种基于知识图谱与深度学习的食谱信息推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310555565.5A CN117009646A (zh) | 2023-05-17 | 2023-05-17 | 一种基于知识图谱与深度学习的食谱信息推送方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117009646A true CN117009646A (zh) | 2023-11-07 |
Family
ID=88571718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310555565.5A Pending CN117009646A (zh) | 2023-05-17 | 2023-05-17 | 一种基于知识图谱与深度学习的食谱信息推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117009646A (zh) |
-
2023
- 2023-05-17 CN CN202310555565.5A patent/CN117009646A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105468596B (zh) | 图片检索方法和装置 | |
CN110659420B (zh) | 一种基于深度神经网络蒙特卡洛搜索树的个性化配餐方法 | |
CN110223757A (zh) | 食谱方案的推荐方法、装置、介质、电子设备 | |
CN107665254A (zh) | 一种基于深度学习的菜谱推荐方法 | |
CN103198089A (zh) | 信息处理装置、信息处理方法和程序 | |
Shen et al. | Affective product form design using fuzzy Kansei engineering and creativity | |
CN110134868A (zh) | 一种基于用户偏好异构性分析的推荐方法 | |
Charte et al. | QUINTA: A question tagging assistant to improve the answering ratio in electronic forums | |
CN107038413A (zh) | 食谱推荐方法、装置及冰箱 | |
CN106157156A (zh) | 一种基于用户社区的协作推荐系统 | |
Thangamani et al. | Identification of malnutrition with use of supervised datamining techniques–decision trees and artificial neural networks | |
Super | Food and history | |
Nilesh et al. | Recommendation of Indian cuisine recipes based on ingredients | |
CN115280422A (zh) | 食物推荐方法、装置、存储介质及电子设备 | |
Giraud et al. | A cross‐cultural segmentation of western Balkan consumers: focus on preferences toward traditional fresh cow cheese | |
CN110119479A (zh) | 一种餐馆推荐方法、装置、设备及可读存储介质 | |
Eftimov et al. | FoodEx2vec: New foods’ representation for advanced food data analysis | |
CN112951374A (zh) | 数据分析方法、系统、计算机设备及存储介质 | |
Jabeen et al. | AutoChef: Automated generation of cooking recipes | |
CN117009646A (zh) | 一种基于知识图谱与深度学习的食谱信息推送方法 | |
Razzaq et al. | EvoRecipes: a generative approach for evolving context-aware recipes | |
Bai et al. | Recommendation algorithm based on probabilistic matrix factorization with adaboost | |
Cui et al. | Construction of recipe knowledge graph based on user knowledge demands | |
Li et al. | Picture-to-amount (pita): Predicting relative ingredient amounts from food images | |
Ventura | The computational creativity complex |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |