CN109063188A - 一种实体推荐方法和装置 - Google Patents
一种实体推荐方法和装置 Download PDFInfo
- Publication number
- CN109063188A CN109063188A CN201810986947.2A CN201810986947A CN109063188A CN 109063188 A CN109063188 A CN 109063188A CN 201810986947 A CN201810986947 A CN 201810986947A CN 109063188 A CN109063188 A CN 109063188A
- Authority
- CN
- China
- Prior art keywords
- entity
- user
- vector
- network model
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种实体推荐方法,该方法包括:对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量;基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量;计算所述预测表示向量与所述实体向量之间的相似度;基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
Description
技术领域
本申请涉及数据分析技术领域,具体而言,涉及一种实体推荐方法和装置。
背景技术
在海量数据的今天,用户会面对各种各样的内容,每个用户也都对一定数量的内容进行购买、评分、评论等操作,用户评论过的或者评分过或者购买过的内容,认为是用户感兴趣的内容,否则,认为是用户不感兴趣的内容。对于一个用户而言,该用户感兴趣的内容最多以千为数量级别,而系统中的内容的数量级至少是千万级别的,该用户感兴趣的内容与系统中的内容相比,数量是极其稀少的,而现有技术对用户感兴趣的内容进行分析预测时,预测的结果可能不是该用户当前感兴趣的内容,降低了用户体验。
发明内容
有鉴于此,本申请的目的在于提供一种实体推荐方法和装置,用于解决现有技术中推荐实体准确度低的问题。
第一方面,本申请实施例提供了一种实体推荐方法,该方法包括:
对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量;
基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量;
计算所述预测表示向量与所述实体向量之间的相似度;
基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
可选地,所述基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,包括:
基于所述用户对所述已选实体的评分或喜好程度,确定所述已选实体所对应的权重;
基于所述已选实体的实体向量及对应的权重,生成所述神经网络模型的输入。
可选地,所述神经网络模型为长短期记忆网络模型LSTM,所述基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,包括:
依照所述用户选择所述已选实体的先后顺序,使用所述已选实体的实体向量,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
可选地,所述依照所述用户选择所述已选实体的先后顺序,使用所述已选实体的实体向量,生成所述长短期记忆网络模型LSTM在不同时刻的输入,包括:
将所述用户对所述已选实体的评分或喜好程度进行归一化处理,确定所述已选实体对应的权重;
依照所述用户选择所述已选实体的先后顺序,分别使用所述已选实体的实体向量及对应的权重,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
可选地,还包括:
基于如下至少之一对所述神经网络模型进行训练优化:
(1)所述已选实体;
(2)所述用户选择所述已选实体的先后顺序;
(3)向所述用户进行推荐之后,用户实际选择的实体。
可选地,所述确定向所述用户进行推荐的推荐实体,包括:
将相似度大于设定阈值所对应的实体确定为所述推荐实体。
可选地,还包括:
基于所述知识图谱中,所述已选实体与所述推荐实体之间的路径,为所述推荐实体形成推荐理由,并通知或显示给所述用户。
第二方面,本申请实施例提供了一种实体推荐装置,该装置包括:
处理模块,用于对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量;
生成模块,用于基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量;
计算模块,用于计算所述预测表示向量与所述实体向量之间的相似度;
确定模块,用于基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
第三方面,本申请实施例提供了一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。
本申请实施例提供的实体推荐方法,对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量,基于用户已经选择过的已选实体的实体向量,确定表示所述用户感兴趣内容的预测表示向量,基于计算的预测表示向量与实体向量之间的相似度,确定向所述用户进行推荐的推荐实体。本申请通过知识图谱增加实体与实体之间的关联,一定程度上可以避免输入模型进行预测的数据的稀疏性对预测结果的影响,从而提升推荐的准确性和覆盖率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种实体推荐方法的流程示意图;
图2为本申请实施例提供的一种知识图谱的简易示意图;
图3为本申请实施例提供的一种实体推荐装置的结构示意图;
图4为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种实体推荐方法,如图1所示,应用于实体推荐系统中,该实体推荐系统包括终端设备,如:计算机、笔记本电脑、平板电脑、移动电话、便携设备、车载设备等,也包括网络系统,如:视听服务系统、大屏幕系统、客户端/服务器系统(C/S)、浏览器/服务器系统、云计算系统,等等。此处并不限制实体推荐系统的类型和架构。该方法包括以下步骤:
S101,对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量。
通常,知识图谱旨在描述现实世界中存在的实体以及实体之间的关系。这里,实体为知识图谱中的实体,包括但不限于内容项目、内容项目信息,物品、物品信息、社交信息等,内容项目包括但不限于电影、音乐、话剧等等,内容项目信息包括但不限于导演、编剧、演员、类型、题材等等,物品包括但不限于各种各类的产品、商品等,如:汽车、手机、日用品等,物品信息包括但不限于厂商、工厂地址、零售商、用户类型等,社交信息包括但不限于评论、博文、动态、好友、联系人、爱好、住址、发帖人、博主等等。可以知道的是,内容及内容之间的关系可以用来构成知识图谱。
这里,可以利用翻译模型对知识图谱中的实体进行嵌入处理,最终得到实体的实体向量,不同的实体对应不同的实体向量,即,每个实体的实体向量在知识图谱中都是唯一的。更进一步,利用翻译模型在进行知识图谱嵌入时,还可以分别对实体和关系进行嵌入,将实体投影到对应的关系空间中,建立从头实体到尾实体的翻译关系。
在这里,翻译模型可以为TransR模型、TransE模型、TransH模型等,优选地,翻译模型为TransR模型。不过应当理解,与TransR模型具备同样实现原理的模型都可以实现对本申请知识图谱中的实体进行嵌入处理,本申请对此不予限制。
例如:在利用TransR模型进行知识图谱嵌入时,在实体空间和关系空间构建实体和关系嵌入,将实体投影到对应的关系空间中,建立从头实体到尾实体的翻译关系,最终得到包含语义信息的每个实体的实体向量。
S102,基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量。
通过神经网络模型基于用户已经选择过的实体进行计算,对用户感兴趣内容进行预测。这里,已选实体可以为用户在预设平台进行过评分、评论、设置过喜好程度等等的实体,例如:对于电影项目,预设平台可以是但不限于豆瓣网、电影网等等,本申请对此不予限制。
这里,神经网络模型可以是但不限于长短期记忆网络(Long Short-Term Memory,LSTM)模型、卷积神经网络(Convolutional Neural Network,CNN)模型、循环神经网络(Recurrent Neural Network,RNN)模型、隐马尔科夫模型(Hidden Markov Model,HMM))、门控循环单元(Gated Recurrent Unit,GRU)神经网络等,本申请对此不予限制。经过神经网络模型的计算,输入神经网络模型的实体向量的维度与神经网络模型输出的用户感兴趣内容的预测表示向量的维度相同。
在具体实施中,用户已经选择过的已选实体可以是按照选择时间排序的,以体现用户在不同时刻的选择,已选实体对应的实体向量也可以按照时间排序的,每两个已选实体之间的时长间隔(两个已选实体的选择时间的差值)可以为是相等的,也可以是各不相同的。
在实现时,可以参考用户对已选择过的实体的评价,例如:参考已选实体的评分或喜好程度,并体现在神经网络模型的输入中。具体可以是,基于所述用户对所述已选实体的评分或喜好程度,确定所述已选实体所对应的权重;基于所述已选实体的实体向量及对应的权重,生成所述神经网络模型的输入。
这里,评分可以为用户在预设平台为已选实体的打分,例如,仍以电影为例,用户在豆瓣网为已观看的电影1的打分为9分、电影2的打分为7分,等等;喜好程度为用户在预设平台给已选实体评的星级,例如,用户在视频应用程序中给已选电影1的星级为4星,给电影2的星级为4.5星,等等。
权重表征当前已选实体在用户选择的所有已选实体中的评分占比;将已选实体的实体向量及对应的权重的乘积作为神经网络模型的输入。在具体实施中,每个用户可能已经选择过多个实体,计算用户对多个已选实体的评分的和值,分别计算各已选实体的评分与计算的和值的比值,将比值作为各已选实体对应的权重。
在确定完各已选实体的权重后,从构建的知识图谱中,确定各已选实体的实体向量,针对每个已选实体,计算该已选实体的权重与该已选实体的实体向量的乘积,将该乘积作为神经网络模型的输入,对神经网络模型进行训练。
例如,对于已选实体包括C、D、E,用户对实体C的评分为8分,对实体D的评分为9分,对实体E的评分为8分,三个实体的评分的和值为25,分别计算已选实体C、D、E的评分与和值(25)的比值,已选实体C的权重为8/25为0.32,已选实体D的权重为9/25为0.36,实体E的权重为8/25为0.32,从知识图谱中确定的实体C的实体向量为λ1、实体D的实体向量为λ2、实体E的实体向量为λ3,实体C的权重与实体向量的乘积为0.32λ1,实体D的权重与实体向量的乘积为0.36λ2,实体E的权重与实体向量的乘积为0.32λ3,将0.32λ1、0.36λ2、0.32λ3输入到神经网络模型对神经网络模型进行训练,例如通过CNN网络模型和/或LSTM网络模型,等等,得到用户感兴趣内容的预测表示向量。
还通过使用LSTM网络模型,实现对已选实体的顺序输入。具体可以为,依照所述用户选择所述已选实体的先后顺序,使用所述已选实体的实体向量,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
在实现时,还可以参考用户对已选择过的实体的评价:
将所述用户对所述已选实体的评分或喜好程度进行归一化处理,确定所述已选实体对应的权重;
依照所述用户选择所述已选实体的先后顺序,分别使用所述已选实体的实体向量及对应的权重,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
这里,已选实体的先后顺序可以是依照已选实体的选择时间进行排序,如,按照选择时间由远及近对已选实体进行排序;当已选实体的评分或喜好程度没在同一量纲时,可以通过归一化处理将已选实体的评分或喜好程度处理到同一标准,如,通过将当前实体的评分与各已选实体的评分的和值的比值作为已选实体的权重,归一化处理的方法在现有技术已有详细的介绍,此处不再进行一一列举;将不同时刻的已选实体的实体向量与对应的权重的乘积作为长短期记忆网络模型的输入。
在具体实施中,每个用户可能已经选择过多个实体,用户选择的实体处于不同的时间,按照时间由远及近对各个已选实体进行排序,计算用户对多个已选实体的评分的和值,分别计算各已选实体的评分与计算的和值的比值,将比值作为各已选实体对应的权重。在确定完各已选实体的权重后,从构建的知识图谱中,确定各已选实体的实体向量,针对每个已选实体,计算该已选实体的权重与该已选实体的实体向量的乘积,将排序后已选实体的各乘积输入到长短期记忆网络模型进行训练,对长短期记忆网络模型进行训练。
延续上一个示例,已选实体包括C、D、E,C的选择或评分时间为9月1号,D的选择或评分时间为9月8号,E的选择或评分时间为9月15号,用户对实体C的评分为8分,对实体D的评分为9分,对实体E的评分为8分,根据选择或评分时间可以知道先后顺序为C、D、E。
这样,三个实体的评分的和值为25,分别计算已选实体C、D、E的评分与和值的比值,已选实体C的权重为8/25为0.32,已选实体D的权重为9/25为0.36,实体E的权重为8/25为0.32,实体C的实体向量为λ1,实体D的实体向量为λ2,实体E的实体向量为λ3,实体C的权重与实体向量的乘积为0.32λ1,实体D的权重与实体向量的乘积为0.36λ2,实体E的权重与实体向量的乘积为0.32λ3,按照已选实体C、D、E的先后顺序分别将0.32λ1、0.36λ2、0.32λ3输入到长短期记忆网络模型,对长短期记忆网络模型进行训练,得到用户感兴趣内容的预测表示向量。
此外,还可以对神经网络模型进行训练,训练可以基于如下一种或一种以上对神经网络模型进行:(1)已选实体;(2)用户选择所述已选实体的先后顺序;(3)向用户进行推荐之后,用户实际选择的实体。
无论神经网络模型是否为长短期记忆网络模型,均可以将已选实体的权重和对应的实体向量的乘积输入到神经网络模型中对该模型进行训练,也可以将已选实体的权重和对应的实体向量的乘积按照先后顺序输入到神经网络模型中对该模型进行训练,也可以在向用户推荐实体之后,根据用户实际选择的实体的权重和对应的实体向量的乘积输入到神经网络模型对该模型进行训练,在利用推荐后实际选择的实体进行训练时,也可以将实际选择的实体的权重和对应的实体向量的乘积按照先后顺序输入到神经网络模型对该模型进行训练。不过应当注意,具体进行训练的方法在现有技术中已有详细的介绍,此处不再进行过多说明。
在实际应用中,以实体为电影项目为例,用户的感兴趣的内容随着时间或环境是不断变化的,在不同的环境或者时间段内,感兴趣内容也是不同的,如,过去的某一段时间内,用户喜欢看爱情电影,而在最近一段时间内,用户特别喜欢看科幻电影。那么,现有技术在推荐电影时,会推荐给用户爱情电影,虽然推荐的爱情电影并不会对用户产生多少影响,但是,考虑用户现阶段的喜好,显示推荐科幻电影是较佳的推荐选择。因此,考虑到用户兴趣会随时间发生偏移,神经网络模型优选地为长短期记忆网络模型,在一定程度上遵循了“离当前时间点越近的用户行为更能体现用户当前的兴趣,用户的长久兴趣不易发生变化”这一常识,提升了推荐的准确性和覆盖率。
在神经网络模型为长短期记忆网络模型时,由于长短期记忆网络模型不会将所有的东西都全部丢弃,会考虑用户之前的已经选择过的实体,因此,模型中每个节点的状态会类似于传送带在整个链上运行,进而将不同时刻的向量输入到长短期记忆网络模型对模型进行训练,增加训练后模型的预测准确度。
S103,计算所述预测表示向量与所述实体向量之间的相似度;
这里,可以根据相似度计算公式计算预测标识向量和实体向量之间的相似度,相似度计算公式在现有技术中已有详细的介绍,例如余弦相似度,此处不再进行过多说明。
在具体实施中,在通过训练后的神经网络模型得到感兴趣内容的预测表示向量后,针对知识图谱中的全部或部分实体,分别计算该实体的实体向量与预测表示向量之间的相似度。计算所选择的知识图谱的实体的数量,可以根据需要设定或调整。
S104,基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
在确定向所述用户进行推荐的推荐实体时,包括:
将相似度大于设定阈值所对应的实体确定为所述推荐实体。
这里,设定阈值一般为预先设置的,可以为对大数据进行分析得到的,也可以为根据历史经验得到的,本申请对此不予限制;在为用户推荐实体时,可以将相似度大于设定阈值对应的实体确定为推荐实体,也可以按照相似度由大到小的顺序对实体进行排序,将排序靠前的前预设数目个实体作为推荐实体,本申请对此不予限制。
在具体实施中,在计算预测表示向量和实体向量之间的相似度时,会得到多个相似度,相似度越大表明实体与感兴趣内容越相近,因此,将相似度大于设定阈值对应的实体确定为推荐实体,并推荐给用户。
构建的知识图谱中包括每两个实体之间的路径,在为用户推荐实体后,还可以基于所述知识图谱中,所述已选实体与所述推荐实体之间的路径,为所述推荐实体形成推荐理由,并通知或显示给所述用户。
这里,实体与实体之间的路径可以为实体与实体之间的关联关系,仍以电影为例,针对用户已经选择的电影A和/或其他电影,向用户推荐电影B,在知识图谱中,电影A与电影B之间的路径可以为导演、题材等等,这样,可以得出推荐理由或表达推荐理由的解释语句,等等。
在具体实施中,在确定推荐实体后,针对每个推荐实体,从知识图谱中,确定该推荐实体与用户的已选实体之间是否存在路径,若该推荐实体与用户的已选实体之间存在路径,则基于该推荐实体与已选实体之间的路径,生成推荐理由,若该推荐实体与用户的已选实体之间不存在路径,此时,可以不生成推荐理由,也可以将预设理由作为推荐理由推荐给用户。这样,当推荐实体不是用户感兴趣内容时,用户通过推荐理由可以了解推荐原因,增加了用户的体验。
例如,参考图2,用户的已选实体为A:《喜剧之王》,推荐实体为B:《逃学威龙》和C:《让子弹飞》,在知识图谱中,将已经评分过的电影和推荐列表中的电影抽取出来,已选实体A与推荐实体B之间的路径为导演和主演,已选实体A和推荐实体B之间的路径为题材,推荐实体B的推荐理由为:你可能喜欢《逃学威龙》,因为《逃学威龙》和《喜剧之王》(你已经看过的)具有相同的导演和主演;推荐实体C的推荐理由为:你可能喜欢《让子弹飞》,因为《让子弹飞》和《喜剧之王》(你已经看过的)都是喜剧类的电影。
本申请实施例提供了一种实体推荐装置,如图3所示,该装置包括:
处理模块31,用于对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量;
生成模块32,用于基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量;
计算模块33,用于计算所述预测表示向量与所述实体向量之间的相似度;
确定模块34,用于基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
可选地,所述生成模块32具体用于:
基于所述用户对所述已选实体的评分或喜好程度,确定所述已选实体所对应的权重;
基于所述已选实体的实体向量及对应的权重,生成所述神经网络模型的输入。
可选地,所述生成模块32具体用于:
所述神经网络模型为长短期记忆网络模型LSTM,所述基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,包括:
依照所述用户选择所述已选实体的先后顺序,使用所述已选实体的实体向量,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
可选地,所述生成模块32还用于:
将所述用户对所述已选实体的评分或喜好程度进行归一化处理,确定所述已选实体对应的权重;
依照所述用户选择所述已选实体的先后顺序,分别使用所述已选实体的实体向量及对应的权重,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
可选地,还包括:训练模块35,所述训练模块用于基于如下至少之一对所述神经网络模型进行训练优化:
(1)所述已选实体;
(2)所述用户选择所述已选实体的先后顺序;
(3)向所述用户进行推荐之后,用户实际选择的实体。
可选地,所述确定模块34具体用于:
将相似度大于设定阈值所对应的实体确定为所述推荐实体。
可选地,该装置还包括:推荐模块36,所述推荐模块36用于:
基于所述知识图谱中,所述已选实体与所述推荐实体之间的路径,为所述推荐实体形成推荐理由,并通知或显示给所述用户。
对应于图1中的实体推荐方法,本申请实施例还提供了一种计算机设备,如图4所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述实体推荐方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述实体推荐方法,用于解决现有技术中推荐实体准确度低的问题,本申请对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量,基于用户已经选择过的已选实体的实体向量,确定表示所述用户感兴趣内容的预测表示向量,基于计算的预测表示向量与实体向量之间的相似度,确定向所述用户进行推荐的推荐实体。本申请通过知识图谱增加实体与实体之间的关联,一定程度上可以避免输入模型进行预测的数据的稀疏性对预测结果的影响,从而提升推荐的准确性和覆盖率。
对应于图1中的实体推荐方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述实体推荐方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述实体推荐方法,用于解决现有技术中推荐实体准确度低的问题,本申请对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量,基于用户已经选择过的已选实体的实体向量,确定表示所述用户感兴趣内容的预测表示向量,基于计算的预测表示向量与实体向量之间的相似度,确定向所述用户进行推荐的推荐实体。本申请通过知识图谱增加实体与实体之间的关联,一定程度上可以避免输入模型进行预测的数据的稀疏性对预测结果的影响,从而提升推荐的准确性和覆盖率。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种实体推荐方法,其特征在于,该方法包括:
对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量;
基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量;
计算所述预测表示向量与所述实体向量之间的相似度;
基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
2.如权利要求1所述的方法,其特征在于,所述基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,包括:
基于所述用户对所述已选实体的评分或喜好程度,确定所述已选实体所对应的权重;
基于所述已选实体的实体向量及对应的权重,生成所述神经网络模型的输入。
3.如权利要求1所述的方法,其特征在于,所述神经网络模型为长短期记忆网络模型LSTM,所述基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,包括:
依照所述用户选择所述已选实体的先后顺序,使用所述已选实体的实体向量,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
4.如权利要求3所述的方法,其特征在于,所述依照所述用户选择所述已选实体的先后顺序,使用所述已选实体的实体向量,生成所述长短期记忆网络模型LSTM在不同时刻的输入,包括:
将所述用户对所述已选实体的评分或喜好程度进行归一化处理,确定所述已选实体所对应的权重;
依照所述用户选择所述已选实体的先后顺序,分别使用所述已选实体的实体向量及对应的权重,生成所述长短期记忆网络模型LSTM在不同时刻的输入。
5.如权利要求1-4任一所述的方法,其特征在于,还包括:基于如下至少之一对所述神经网络模型进行训练优化:
(1)所述已选实体;
(2)所述用户选择所述已选实体的先后顺序;
(3)向所述用户进行推荐之后,用户实际选择的实体。
6.如权利要求1-4任一所述的方法,其特征在于,所述确定向所述用户进行推荐的推荐实体,包括:
将相似度大于设定阈值所对应的实体确定为所述推荐实体。
7.如权利要求1-4任一所述的方法,其特征在于,还包括:
基于所述知识图谱中,所述已选实体与所述推荐实体之间的路径,为所述推荐实体形成推荐理由,并通知或显示给所述用户。
8.一种实体推荐装置,其特征在于,该装置包括:
处理模块,用于对知识图谱中的实体进行嵌入处理,得到表示实体的实体向量;
生成模块,用于基于用户已经选择过的已选实体的实体向量,生成神经网络模型的输入,由所述神经网络模型输出表示所述用户感兴趣内容的预测表示向量;
计算模块,用于计算所述预测表示向量与所述实体向量之间的相似度;
确定模块,用于基于计算得到的相似度,确定向所述用户进行推荐的推荐实体。
9.一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810986947.2A CN109063188A (zh) | 2018-08-28 | 2018-08-28 | 一种实体推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810986947.2A CN109063188A (zh) | 2018-08-28 | 2018-08-28 | 一种实体推荐方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109063188A true CN109063188A (zh) | 2018-12-21 |
Family
ID=64756247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810986947.2A Pending CN109063188A (zh) | 2018-08-28 | 2018-08-28 | 一种实体推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109063188A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921213A (zh) * | 2018-06-28 | 2018-11-30 | 国信优易数据有限公司 | 一种实体分类模型训练方法及装置 |
CN109857873A (zh) * | 2019-02-21 | 2019-06-07 | 北京百度网讯科技有限公司 | 推荐实体的方法和装置、电子设备、计算机可读介质 |
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
CN110457596A (zh) * | 2019-08-01 | 2019-11-15 | 北京明略软件系统有限公司 | 一种资源推荐处理方法及装置 |
CN110555753A (zh) * | 2019-08-14 | 2019-12-10 | 中国平安人寿保险股份有限公司 | 基于推荐的排序控制方法、装置、计算机设备及存储介质 |
CN111128345A (zh) * | 2019-11-19 | 2020-05-08 | 上海联影智能医疗科技有限公司 | 医学图像的获取方法、医学扫描设备和计算机存储介质 |
CN111369318A (zh) * | 2020-02-28 | 2020-07-03 | 安徽农业大学 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
CN111949306A (zh) * | 2020-07-06 | 2020-11-17 | 北京大学 | 一种支持开源项目碎片化学习的推送方法和系统 |
CN112035682A (zh) * | 2020-09-28 | 2020-12-04 | 上海松鼠课堂人工智能科技有限公司 | 基于知识图谱的性格模型分析处理方法及系统 |
CN112559764A (zh) * | 2020-12-10 | 2021-03-26 | 北京中视广信科技有限公司 | 一种基于领域知识图谱的内容推荐方法 |
CN112765486A (zh) * | 2021-01-22 | 2021-05-07 | 重庆邮电大学 | 一种融合知识图谱的注意力机制的电影推荐方法 |
CN112966091A (zh) * | 2019-12-12 | 2021-06-15 | 复旦大学 | 一种融合实体信息与热度的知识图谱推荐系统 |
CN113423019A (zh) * | 2021-06-23 | 2021-09-21 | 北京字跳网络技术有限公司 | 一种控件显示方法、装置、设备及存储介质 |
CN114064930A (zh) * | 2021-11-29 | 2022-02-18 | 北京字节跳动网络技术有限公司 | 一种数据展示方法、装置、计算机设备以及存储介质 |
CN114861059A (zh) * | 2022-05-18 | 2022-08-05 | 北京百度网讯科技有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019777B2 (en) * | 2006-03-16 | 2011-09-13 | Nexify, Inc. | Digital content personalization method and system |
US9183279B2 (en) * | 2011-09-22 | 2015-11-10 | International Business Machines Corporation | Semantic questioning mechanism to enable analysis of information architectures |
CN105653706A (zh) * | 2015-12-31 | 2016-06-08 | 北京理工大学 | 一种基于文献内容知识图谱的多层引文推荐方法 |
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 |
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN107861972A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种用户录入商品信息后显示商品全结果的方法及设备 |
CN107909427A (zh) * | 2017-10-25 | 2018-04-13 | 浙江大学 | 一种提升推荐模型时序数据挖掘能力的循环神经网络方法 |
CN108334638A (zh) * | 2018-03-20 | 2018-07-27 | 桂林电子科技大学 | 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法 |
-
2018
- 2018-08-28 CN CN201810986947.2A patent/CN109063188A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019777B2 (en) * | 2006-03-16 | 2011-09-13 | Nexify, Inc. | Digital content personalization method and system |
US9183279B2 (en) * | 2011-09-22 | 2015-11-10 | International Business Machines Corporation | Semantic questioning mechanism to enable analysis of information architectures |
CN105653706A (zh) * | 2015-12-31 | 2016-06-08 | 北京理工大学 | 一种基于文献内容知识图谱的多层引文推荐方法 |
CN107423442A (zh) * | 2017-08-07 | 2017-12-01 | 火烈鸟网络(广州)股份有限公司 | 基于用户画像行为分析的应用推荐方法及系统,储存介质及计算机设备 |
CN107861972A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种用户录入商品信息后显示商品全结果的方法及设备 |
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN107909427A (zh) * | 2017-10-25 | 2018-04-13 | 浙江大学 | 一种提升推荐模型时序数据挖掘能力的循环神经网络方法 |
CN108334638A (zh) * | 2018-03-20 | 2018-07-27 | 桂林电子科技大学 | 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法 |
Non-Patent Citations (1)
Title |
---|
盛文瑾等: ""基于领域关联兴趣模型的个性化文献推荐方法"", 《北京生物医学工程》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921213A (zh) * | 2018-06-28 | 2018-11-30 | 国信优易数据有限公司 | 一种实体分类模型训练方法及装置 |
CN109857873A (zh) * | 2019-02-21 | 2019-06-07 | 北京百度网讯科技有限公司 | 推荐实体的方法和装置、电子设备、计算机可读介质 |
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
CN110457596A (zh) * | 2019-08-01 | 2019-11-15 | 北京明略软件系统有限公司 | 一种资源推荐处理方法及装置 |
CN110555753A (zh) * | 2019-08-14 | 2019-12-10 | 中国平安人寿保险股份有限公司 | 基于推荐的排序控制方法、装置、计算机设备及存储介质 |
CN111128345A (zh) * | 2019-11-19 | 2020-05-08 | 上海联影智能医疗科技有限公司 | 医学图像的获取方法、医学扫描设备和计算机存储介质 |
CN111128345B (zh) * | 2019-11-19 | 2024-03-22 | 上海联影智能医疗科技有限公司 | 医学图像的获取方法、医学扫描设备和计算机存储介质 |
CN112966091A (zh) * | 2019-12-12 | 2021-06-15 | 复旦大学 | 一种融合实体信息与热度的知识图谱推荐系统 |
CN112966091B (zh) * | 2019-12-12 | 2022-10-14 | 复旦大学 | 一种融合实体信息与热度的知识图谱推荐系统 |
CN111369318A (zh) * | 2020-02-28 | 2020-07-03 | 安徽农业大学 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
CN111369318B (zh) * | 2020-02-28 | 2024-02-02 | 安徽农业大学 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
CN111949306A (zh) * | 2020-07-06 | 2020-11-17 | 北京大学 | 一种支持开源项目碎片化学习的推送方法和系统 |
CN111949306B (zh) * | 2020-07-06 | 2021-05-28 | 北京大学 | 一种支持开源项目碎片化学习的推送方法和系统 |
CN112035682B (zh) * | 2020-09-28 | 2021-04-20 | 上海松鼠课堂人工智能科技有限公司 | 基于知识图谱的性格模型分析处理方法及系统 |
CN112035682A (zh) * | 2020-09-28 | 2020-12-04 | 上海松鼠课堂人工智能科技有限公司 | 基于知识图谱的性格模型分析处理方法及系统 |
CN112559764B (zh) * | 2020-12-10 | 2023-12-01 | 北京中视广信科技有限公司 | 一种基于领域知识图谱的内容推荐方法 |
CN112559764A (zh) * | 2020-12-10 | 2021-03-26 | 北京中视广信科技有限公司 | 一种基于领域知识图谱的内容推荐方法 |
CN112765486B (zh) * | 2021-01-22 | 2022-04-05 | 重庆邮电大学 | 一种融合知识图谱的注意力机制的电影推荐方法 |
CN112765486A (zh) * | 2021-01-22 | 2021-05-07 | 重庆邮电大学 | 一种融合知识图谱的注意力机制的电影推荐方法 |
CN113423019A (zh) * | 2021-06-23 | 2021-09-21 | 北京字跳网络技术有限公司 | 一种控件显示方法、装置、设备及存储介质 |
CN113423019B (zh) * | 2021-06-23 | 2023-04-07 | 北京字跳网络技术有限公司 | 一种控件显示方法、装置、设备及存储介质 |
CN114064930A (zh) * | 2021-11-29 | 2022-02-18 | 北京字节跳动网络技术有限公司 | 一种数据展示方法、装置、计算机设备以及存储介质 |
CN114861059A (zh) * | 2022-05-18 | 2022-08-05 | 北京百度网讯科技有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063188A (zh) | 一种实体推荐方法和装置 | |
CN111209476B (zh) | 推荐方法、模型生成方法、装置、介质及设备 | |
WO2017181612A1 (zh) | 个性化视频推荐方法及装置 | |
CN109903103B (zh) | 一种推荐物品的方法和装置 | |
CN111984689A (zh) | 信息检索的方法、装置、设备以及存储介质 | |
CN109388742A (zh) | 一种搜索方法、搜索服务器和搜索系统 | |
CN110737783A (zh) | 一种推荐多媒体内容的方法、装置及计算设备 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
CN111209477B (zh) | 一种信息推荐的方法及装置、电子设备、存储介质 | |
CN111818370B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN110163703B (zh) | 一种分类模型建立方法、文案推送方法和服务器 | |
CN103365936A (zh) | 视频推荐系统及其方法 | |
CN111708948A (zh) | 内容项推荐方法、装置、服务器及计算机可读存储介质 | |
CN112632403A (zh) | 推荐模型的训练方法、推荐方法、装置、设备和介质 | |
CN106407401A (zh) | 一种视频推荐方法及装置 | |
CN112559901B (zh) | 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品 | |
CN111246257A (zh) | 视频推荐方法、装置、设备及存储介质 | |
CN112100221A (zh) | 一种资讯推荐方法、装置、推荐服务器及存储介质 | |
CN111597446A (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN116894711A (zh) | 商品推荐理由生成方法及其装置、电子设备 | |
CN110490683A (zh) | 一种线下线上协同多模型混合推荐的方法及系统 | |
CN109800356A (zh) | 一种信息资源推荐方法、装置、设备及存储介质 | |
CN108959655A (zh) | 一种面向动态环境的自适应在线推荐方法 | |
CN112269943B (zh) | 一种信息推荐系统及方法 | |
CN103457944A (zh) | 信息推送方法、装置和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing Applicant after: Guoxin Youyi Data Co., Ltd Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181221 |
|
RJ01 | Rejection of invention patent application after publication |