CN117635268A - 知识图谱补全辅助产品推荐方法、设备和存储介质 - Google Patents
知识图谱补全辅助产品推荐方法、设备和存储介质 Download PDFInfo
- Publication number
- CN117635268A CN117635268A CN202311658776.8A CN202311658776A CN117635268A CN 117635268 A CN117635268 A CN 117635268A CN 202311658776 A CN202311658776 A CN 202311658776A CN 117635268 A CN117635268 A CN 117635268A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- knowledge graph
- recommended
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 46
- 230000000295 complement effect Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 9
- 238000003064 k means clustering Methods 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008485 antagonism Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种知识图谱补全辅助产品推荐方法、设备和存储介质,一种知识图谱补全辅助产品推荐方法包括:获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息;将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到;将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息。本发明实施例公开的知识图谱补全辅助产品推荐方法、设备和存储介质,能够提高产品推荐准确度。
Description
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种知识图谱补全辅助产品推荐方法、设备和存储介质。
背景技术
对于银行等面向用户的机构,会面向用户推出多种不同的产品或服务,但如何向用户推荐最适合的产品或服务,是提高各机构服务质量的重要手段。
目前业界提出采用知识图谱辅助推荐的方式进行产品或服务的推荐,知识图谱辅助推荐主要是通过知识图谱补全模型实现,通过提高预测准确性的补全模型实现对用户偏好更精准的预测,其中补全模型准确性提高,其训练需要依赖于正负样本的质量。而现有知识图谱嵌入和补全模型在进行训练时,选择负样本往往是从实体集合中随机选择一个实体来替换头实体或尾实体形成负三元组,但这样的方法无法控制负样本质量,往往会生成低质量的负样本,负样本质量低会导致模型的容错率低、进而导致模型预测准确率变低。
发明内容
本发明提供一种知识图谱补全辅助产品推荐方法、设备和存储介质,能够提高产品推荐准确度。
第一方面,本发明实施例提供一种知识图谱补全辅助产品推荐方法,其特征在于,包括:
获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息;
将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到;
将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息。
在第一方面一种可能的实现方式中,获取待推荐用户信息之前,还包括:
获取历史用户信息,并基于历史用户信息构建用户与产品的知识图谱,历史用户信息包括历史记录中的用户的基本信息以及用户与产品的相关信息;
对用户与产品的知识图谱中的实体进行聚类划分,并随机替换同一聚类中的实体,得到高质量负样本;
基于高质量负样本对用户与产品的知识图谱中进行训练,得到知识图谱补全模型。
在第一方面一种可能的实现方式中,基于高质量负样本对用户与产品的知识图谱中进行训练,得到知识图谱补全模型,包括:
使用对抗自编码器对高质量负样本和用户与产品的知识图谱中的正样本进行训练优化,得到知识图谱补全模型。
在第一方面一种可能的实现方式中,对抗自编码器包括编码器和解码器;使用对抗自编码器对高质量负样本和用户与产品的知识图谱中的正样本进行训练优化,得到知识图谱补全模型,包括:
将高质量负样本输入编码器,将正样本输入解码器,编码器编码后的信息输入解码器,解码器向编码器反馈优化信息;
采用随机梯度下降法作为知识图谱补全模型的损失函数,作为编码器和解码器的优化目标,得到知识图谱补全模型。
在第一方面一种可能的实现方式中,对用户与产品的知识图谱中的实体进行聚类划分,并随机替换同一聚类中的实体,得到高质量负样本,包括:
采用k-means聚类对用户与产品的知识图谱中的实体进行社区划分;
在同社区实体中进行随机替换实体,获得高质量负样本。
在第一方面一种可能的实现方式中,采用k-means聚类对用户与产品的知识图谱中的实体进行社区划分,包括:
依次计算用户与产品的知识图谱中的实体间的余弦相似度,将余弦相似度差距小于预设阈值的实体划分为同一社区并迭代更新。
在第一方面一种可能的实现方式中,获取历史用户信息,包括:
从数据库内获取历史用户信息,或者通过用户填写的问卷信息获取历史用户信息。
第二方面,本发明实施例提供一种知识图谱补全辅助产品推荐装置,包括:
信息获取模块,用于获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息;
模型预测模块,用于将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到;
产品推荐模块,用于将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息。
第三方面,本发明实施例提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现如第一方面任一中可能的实现方式的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一中可能的实现方式的方法。
本发明实施例提供的知识图谱补全辅助产品推荐方法、设备和存储介质,首先获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息,然后将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到,最后将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息,能使针对不同客户进行精准化推荐,提高客户体验。
附图说明
图1为本发明实施例提供的一种知识图谱补全辅助产品推荐方法的流程图;
图2为本发明实施例提供的另一种知识图谱补全辅助产品推荐方法的流程图;
图3为本申请实施例提供的知识图谱补全辅助产品推荐方法中实体聚类示意图;
图4为本申请实施例提供的知识图谱补全辅助产品推荐装置的结构示意图;
图5为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1为本发明实施例提供的一种知识图谱补全辅助产品推荐方法的流程图,如图1所示,本实施例提供的知识图谱补全辅助产品推荐方法包括:
步骤S110,获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息。
本实施例提供的知识图谱补全辅助产品推荐方法,应用于任一台具有处理能力的计算机或服务器。为了解决传统知识图谱辅助推荐准确性不足的情况,本实施例提出基于聚类的知识图谱补全辅助产品推荐方法。其中产品推荐是指实体产品推荐或服务产品推荐。
知识图谱补全通常定义为“三元组分类”或“链接预测”任务。首先,一条知识在知识图谱中通常由三元组表示:“头实体,关系,尾实体”。三元组分类即对于给定的三元组,预测其正确的概率。而链接预测则是对三元组中缺失的某个元素加以补全。其实质是利用知识图谱中已有的知识(包括结构和属性等)经过推断得到新的知识。
本实施例提供的知识图谱补全辅助产品推荐方法,首先获取待推荐用户信息,待推荐用户信息指对提供的产品存在使用或购买意愿,但还未确定使用或购买产品类型的用户。待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息,其中待推荐用户的基本信息例如为用户的名称、分类、浏览记录、资产情况等信息,待推荐用户与产品的相关信息例如为用户已购买或正在使用的产品信息等。
步骤S120,将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到。
本实施例采用知识图谱补全模型进行辅助产品推荐,目前已经有将知识图谱补全应用于产品推荐领域,但现有知识图谱嵌入和补全模型在进行训练时,选择负样本往往是从实体集合中随机选择一个实体来替换头或尾实体形成负三元组,这样的方法无法控制负样本质量,往往会生成低质量的负样本,低质量负样本对模型训练的作用有限。因此本实施例提供的方法中,通过聚类随机替换实体得到高质量负样本训练得到知识图谱补全模型,并使用该知识图谱补全模型进行产品推荐,从而提高知识图谱补全模型的预测准确性。
首先需要建立知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到。知识图谱补全模型是利用数据库中已有的历史用户信息训练得到的,且通过聚类算法随机替换实体得到高质量负样本。聚类是根据样本数据之间的相似性度量将整个样本集合聚集成若干个类的过程,使得同一类的样本数据尽量相似,不同类别的样本数据差异明显。通过聚类处理后,可以得到各实体的聚类结果,通过对实体进行随机替换,得到的负样本质量比未聚类替换的实体质量更高。对知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练的具体方法将在后续实施例中进行详细说明。
步骤S130,将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息。
将待推荐用户信息输入知识图谱补全模型后,可以得出知识图谱补全模型对待推荐用户的预测信息,该预测信息即为待推荐用户的产品推荐信息。原有的方法进行模型训练时,往往采取随机替换实体的方法生成负样本导致负样本质量低,但是本申请的方法采用聚类思想,通过聚类替换实体的方式生成高质量负样本,能大大提高模型识错能力,使得模型预测准确率提高,实现更精准个性化推荐。
本实施例提供的知识图谱补全辅助产品推荐方法,首先获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息,然后将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到,最后将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息,能使针对不同客户进行精准化推荐,提高客户体验。
图2为本发明实施例提供的另一种知识图谱补全辅助产品推荐方法的流程图,如图2所示,本实施例提供的知识图谱补全辅助产品推荐方法包括:
步骤S210,获取历史用户信息,并基于历史用户信息构建用户与产品的知识图谱,历史用户信息包括历史记录中的用户的基本信息以及用户与产品的相关信息。
本实施例提供的方法为对知识图谱补全模型进行训练的具体方法。在获取待推荐用户信息之前,需要对知识图谱补全模型进行训练。首先,获取历史用户信息,并基于历史用户信息构建用户与产品的知识图谱,历史用户信息包括历史记录中的用户的基本信息以及用户与产品的相关信息。获取到的历史用户信息为多个,对历史用户信息进行知识抽取,得到历史用户信息的相关实体和关系,然后基于历史用户信息的相关实体和关系构建用户与产品的知识图谱。有多个历史用户信息对知识图谱补全模型进行训练,需要对多个历史用户信息均进行知识抽取共同建立知识图谱,并利用多个历史用户信息分别对知识图谱补全模型进行训练。历史用户信息可以是从数据库内获取的,也可以通过用户填写的问卷信息获取。
步骤S220,对用户与产品的知识图谱中的实体进行聚类划分,并随机替换同一聚类中的实体,得到高质量负样本。
接着,对用户与产品的知识图谱中的实体进行聚类划分,也就是将类似实体划分为同一聚类,然后随机替换同一聚类中的实体,得到高质量负样本。对用户与产品的知识图谱中的实体进行聚类划分,是依次对知识图谱中的实体依次进行聚类划分,并迭代聚类划分情况。将聚类划分后的实体进行随机替换,替换得到的实体显然质量更高,也就得到高质量负样本。
具体地,可以采用k-means聚类对用户与产品的知识图谱中的实体进行社区划分;在同社区实体中进行随机替换实体,获得高质量负样本。
图3为本申请实施例提供的知识图谱补全辅助产品推荐方法中实体聚类示意图,如图3所示,具体方法如下:通过设置k个对象,采用随机的方式,将k个节点作为聚类中心初始值,然后计算其余节点和初始聚类中心的欧氏距离,并依次将节点分配给欧式空间中最近的聚类中心所在的类别。聚类中心以及距离较近的节点会根据迭代划分形成一个聚类。迭代过程中,类中每分配一个数据点,都会根据当前聚类中存在的样本点重新计算类中心,迭代计算直至达到某个终止条件。终止条件一般分为三种:1)所有对象都停止重新分配;2)聚类中心点固定;3)误差平方和达到局部最小值。
具体地,依次计算用户与产品的知识图谱中的实体间的余弦相似度,将余弦相似度差距小于预设阈值的实体划分为同一社区并迭代更新。
知识图谱中每个实体之间都存在联系,有的是直接相连,有的通过中间路径产生关联。在嵌入模型中,节点间都是通过嵌入向量产生关联,而余弦相似度是计算向量之间相似性的最常用方法,即通过计算两个向量之间的夹角余弦值衡量向量之间的差异。一般认为余弦值越大,向量之间夹角越小,两者也越相似。定义任意两个实体向量ei和ej,则它们之间的相似度计算公式为:
在本步骤中,首先是选择k个初始质心,根据余弦相似度进行聚类,将余弦相似性高的节点分配到特定的类中。之后计算每个社区的中心值,将新值所代表的节点作为新的质心,直到迭代结束社区划分完成,我们认为同社区的节点拥有全局较高相似度。在实体替换过程中,替换实体与被替换实体属于同一个社区,经过替换即可形成高质量负样本。
步骤S230,基于高质量负样本对用户与产品的知识图谱中进行训练,得到知识图谱补全模型。
最后,基于高质量负样本对用户与产品的知识图谱中进行训练,由于对知识图谱进行训练所使用的负样本为高质量负样本,因此训练得到的知识图谱补全模型的质量也更高,使用知识图谱补全模型进行产品预测的准确率也更高。
具体地,可以使用对抗自编码器对高质量负样本和用户与产品的知识图谱中的正样本进行训练优化,得到知识图谱补全模型。
自编码器,通常由编码器和解码器两部分对称结构组成,编码器的主要作用是提取原始数据的关键信息特征,从而获得更精炼的数据表征,解码器的主要作用是为了实现精炼数据表征到原始数据重建的过程,这样原始信号中的主要信息可以被重建出来,次要干扰信息就可以被去除。对抗自编码器是一种可以将自动编码器转换为生成模型的通用方法。其中编码器也可以称为生成器,解码器也可以称为判别器。
具体地,首先将高质量负样本输入编码器,将正样本输入解码器,编码器编码后的信息输入解码器,解码器向编码器反馈优化信息;然后采用随机梯度下降法作为知识图谱补全模型的损失函数,作为编码器和解码器的优化目标,得到知识图谱补全模型。
使用对抗自编码器对正负样本进行训练优化,其中编码器是编码输入数据,解码器还原编码器中的数据。通过给定方法对比输入和输出,计算差异进行反馈优化,使它们无限接近。本步骤中,对抗网络的生成器G和判别器D皆采用对抗自编码器,负样本使用经k-means聚类后,替换头实体生成的高质量负样本。对抗自编码器由于其对数据高效的降维学习,可以加速模型的收敛。具体原理如下:
将p(z)表示成数据先验分布,q(z|x)表示成编码分布,p(x|z)表示成解码分布。对抗模型自编码器q(z|x)的功能可以用聚合后验概率q(z)表示,如下公式所示:
则对抗自编码器可以被正则化为将后验概率q(z)与随机分布p(z)对抗匹配的过程。这里假设q(z|x)是一个高斯分布,并用到高斯后验的方法,其均值和方差是由编码器网络预测的:zi~N(μi(x),σi(x))。在这种情况下,q(z)中的随机性同时来自于数据分布和编码器输出处的高斯分布的随机性。我们选择将生成器的随机样本分布替换为高质量负样本。判别器D不断学习并判别输入数据来自正三元组还是负三元组,生成器则根据判别器判别结果进行优化。
对于训练三元组,采用随机梯度下降算法(Stochastic Gradient Descent,SGD)算法用来作为损失函数最小化,即目标函数为:
其中,G*代表生成器,D*代表判别器;φ和δ分别代表生成器和判别器的参数,(h,r,t)为正样本三元组,(h′,r′,t′)为负样本三元组。首先固定生成器,对判别器进行更新,使判别器达到当前最优状态,最大化其判别能力。假定ds为判别器正确识别正样本的概率,ds′为判别器正确识别负样本的概率,则有
当D*=0.5时,即ds=ds′时,判别器训练达到最优化状态。此时固定判别器,对生成器进行训练。主要是根据判别器的反馈进行参数优化。
模型训练结束后,生成器可以拟合正样本数据的真实分布,我们可以基于生成器学习到的数据分布完成补全模型的训练。
本实施例的方法基于对抗思想,将选取的正、负样本分别作为模型的输入,并将编码后的向量输入判别器进行对抗训练。将判别器的判别结果作为生成器和判别器优化的依据。大大提高模型对正负样本的识别能力,实现准确率提升,从而提升推荐能力。
图4为本申请实施例提供的知识图谱补全辅助产品推荐装置的结构示意图。如图4所示,该知识图谱补全辅助产品推荐装置,包括:信息获取模块410、模型预测模块420、产品推荐模块430。
信息获取模块410,用于获取待推荐用户信息,待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息;
模型预测模块420,用于将待推荐用户信息输入知识图谱补全模型,知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到;
产品推荐模块430,用于将对待推荐用户信息对应的预测信息作为待推荐用户的产品推荐信息。
在一实施例中,基于度惩罚的知识图谱补全模型缺陷检测装置还包括:模型训练模块440,获取历史用户信息,并基于历史用户信息构建用户与产品的知识图谱,历史用户信息包括历史记录中的用户的基本信息以及用户与产品的相关信息;对用户与产品的知识图谱中的实体进行聚类划分,并随机替换同一聚类中的实体,得到高质量负样本;基于高质量负样本对用户与产品的知识图谱中进行训练,得到知识图谱补全模型。
在一实施例中,模型训练模块440,具体用于使用对抗自编码器对高质量负样本和用户与产品的知识图谱中的正样本进行训练优化,得到知识图谱补全模型。
在一实施例中,对抗自编码器包括编码器和解码器;模型训练模块440,具体用于将高质量负样本输入编码器,将正样本输入解码器,编码器编码后的信息输入解码器,解码器向编码器反馈优化信息;采用随机梯度下降法作为知识图谱补全模型的损失函数,作为编码器和解码器的优化目标,得到知识图谱补全模型。
模型训练模块440,具体用于采用k-means聚类对用户与产品的知识图谱中的实体进行社区划分;在同社区实体中进行随机替换实体,获得高质量负样本。
模型训练模块440,具体用于依次计算用户与产品的知识图谱中的实体间的余弦相似度,将余弦相似度差距小于预设阈值的实体划分为同一社区并迭代更新。
模型训练模块440,具体用于从数据库内获取历史用户信息,或者通过用户填写的问卷信息获取历史用户信息。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,信息获取模块410、模型预测模块420、产品推荐模块430、模型训练模块440均可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上信息获取模块410、模型预测模块420、产品推荐模块430、模型训练模块440的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
图5为本申请实施例提供的电子设备的结构示意图。如图5所示,该电子设备可以包括:收发器51、处理器52、存储器53。
处理器52执行存储器存储的计算机执行指令,使得处理器52执行上述实施例中的方案。处理器52可以是通用处理器,包括中央处理器(CPU)、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器53通过系统总线与处理器52连接并完成相互间的通信,存储器53用于存储计算机程序指令。
收发器51可以用于获取待运行任务和待运行任务的配置信息。
系统总线可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。收发器用于实现数据库访问装置与其他计算机(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(randomaccess memory,RAM),也可能还包括非易失性存储器(non-volatile memory)。
本申请实施例还提供一种运行指令的芯片,该芯片用于执行上述实施例中知识图谱补全辅助产品推荐方法的技术方案。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行上述实施例知识图谱补全辅助产品推荐方法的技术方案。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,其存储在计算机可读存储介质中,至少一个处理器可以从计算机可读存储介质读取计算机程序,至少一个处理器执行计算机程序时可实现上述实施例中知识图谱补全辅助产品推荐方法的技术方案。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种知识图谱补全辅助产品推荐方法,其特征在于,包括:
获取待推荐用户信息,所述待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息;
将所述待推荐用户信息输入知识图谱补全模型,所述知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到;
将对所述待推荐用户信息对应的预测信息作为所述待推荐用户的产品推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述获取待推荐用户信息之前,还包括:
获取历史用户信息,并基于所述历史用户信息构建用户与产品的知识图谱,所述历史用户信息包括历史记录中的用户的基本信息以及用户与产品的相关信息;
对所述用户与产品的知识图谱中的实体进行聚类划分,并随机替换同一聚类中的实体,得到高质量负样本;
基于所述高质量负样本对所述用户与产品的知识图谱中进行训练,得到所述知识图谱补全模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述高质量负样本对所述用户与产品的知识图谱中进行训练,得到所述知识图谱补全模型,包括:
使用对抗自编码器对所述高质量负样本和所述用户与产品的知识图谱中的正样本进行训练优化,得到所述知识图谱补全模型。
4.根据权利要求3所述的方法,其特征在于,所述对抗自编码器包括编码器和解码器;所述使用对抗自编码器对所述高质量负样本和所述用户与产品的知识图谱中的正样本进行训练优化,得到所述知识图谱补全模型,包括:
将所述高质量负样本输入所述编码器,将所述正样本输入所述解码器,所述编码器编码后的信息输入所述解码器,所述解码器向所述编码器反馈优化信息;
采用随机梯度下降法作为知识图谱补全模型的损失函数,作为所述编码器和所述解码器的优化目标,得到所述知识图谱补全模型。
5.根据权利要求2所述的方法,其特征在于,所述对所述用户与产品的知识图谱中的实体进行聚类划分,并随机替换同一聚类中的实体,得到高质量负样本,包括:
采用k-means聚类对所述用户与产品的知识图谱中的实体进行社区划分;
在同社区实体中进行随机替换实体,获得高质量负样本。
6.根据权利要求5所述的方法,其特征在于,所述采用k-means聚类对所述用户与产品的知识图谱中的实体进行社区划分,包括:
依次计算所述用户与产品的知识图谱中的实体间的余弦相似度,将余弦相似度差距小于预设阈值的实体划分为同一社区并迭代更新。
7.根据权利要求2~6中任一项所述的方法,其特征在于,所述获取历史用户信息,包括:
从数据库内获取所述历史用户信息,或者通过用户填写的问卷信息获取所述历史用户信息。
8.一种知识图谱补全辅助产品推荐装置,其特征在于,包括:
信息获取模块,用于获取待推荐用户信息,所述待推荐用户信息包括待推荐用户的基本信息以及待推荐用户与产品的相关信息;
模型预测模块,用于将所述待推荐用户信息输入知识图谱补全模型,所述知识图谱补全模型通过聚类随机替换实体得到高质量负样本后训练得到;
产品推荐模块,用于将对所述待推荐用户信息对应的预测信息作为所述待推荐用户的产品推荐信息。
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311658776.8A CN117635268A (zh) | 2023-12-05 | 2023-12-05 | 知识图谱补全辅助产品推荐方法、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311658776.8A CN117635268A (zh) | 2023-12-05 | 2023-12-05 | 知识图谱补全辅助产品推荐方法、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117635268A true CN117635268A (zh) | 2024-03-01 |
Family
ID=90031853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311658776.8A Pending CN117635268A (zh) | 2023-12-05 | 2023-12-05 | 知识图谱补全辅助产品推荐方法、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117635268A (zh) |
-
2023
- 2023-12-05 CN CN202311658776.8A patent/CN117635268A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11741361B2 (en) | Machine learning-based network model building method and apparatus | |
CN109873812B (zh) | 异常检测方法、装置及计算机设备 | |
US20190378044A1 (en) | Processing dynamic data within an adaptive oracle-trained learning system using curated training data for incremental re-training of a predictive model | |
US20200302337A1 (en) | Automatic selection of high quality training data using an adaptive oracle-trained learning framework | |
CN111553759A (zh) | 一种产品信息推送方法、装置、设备及存储介质 | |
US11315196B1 (en) | Synthesized invalid insurance claims for training an artificial intelligence / machine learning model | |
US11429863B2 (en) | Computer-readable recording medium having stored therein learning program, learning method, and learning apparatus | |
CN108205570B (zh) | 一种数据检测方法和装置 | |
US11615272B2 (en) | Anomaly analysis using a blockchain, and applications thereof | |
US20200334557A1 (en) | Chained influence scores for improving synthetic data generation | |
Nguyen et al. | Asymmetric mixture model with simultaneous feature selection and model detection | |
CN111639690A (zh) | 基于关系图谱学习的欺诈分析方法、系统、介质及设备 | |
Diao et al. | Clustering by Detecting Density Peaks and Assigning Points by Similarity‐First Search Based on Weighted K‐Nearest Neighbors Graph | |
US11836122B2 (en) | Schema validation with data synthesis | |
CN117635268A (zh) | 知识图谱补全辅助产品推荐方法、设备和存储介质 | |
CN112686423A (zh) | 基于机器学习的信托产品收益率预测方法及装置 | |
CN112541446A (zh) | 一种生物特征库更新方法、装置及电子设备 | |
CN116680323B (zh) | 基于大数据安全平台的用户需求挖掘方法及系统 | |
US20220215272A1 (en) | Deterioration detection method, computer-readable recording medium storing deterioration detection program, and information processing apparatus | |
US20220237459A1 (en) | Generation method, computer-readable recording medium storing generation program, and information processing apparatus | |
CN117273765B (zh) | 基于自动核检的多级经销商流转数据处理方法及系统 | |
US20220237463A1 (en) | Generation method, computer-readable recording medium storing generation program, and information processing apparatus | |
US20220222582A1 (en) | Generation method, computer-readable recording medium storing generation program, and information processing apparatus | |
US20230289531A1 (en) | Deep Learning Systems and Methods to Disambiguate False Positives in Natural Language Processing Analytics | |
CN113537290B (zh) | 一种基于超高维数据元聚类的图像匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |