CN114398490A - 一种基于分层注意力机制的知识图谱补全方法及装置 - Google Patents

一种基于分层注意力机制的知识图谱补全方法及装置 Download PDF

Info

Publication number
CN114398490A
CN114398490A CN202111518114.1A CN202111518114A CN114398490A CN 114398490 A CN114398490 A CN 114398490A CN 202111518114 A CN202111518114 A CN 202111518114A CN 114398490 A CN114398490 A CN 114398490A
Authority
CN
China
Prior art keywords
behavior
user
entity
interaction
interactive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111518114.1A
Other languages
English (en)
Other versions
CN114398490B (zh
Inventor
王璐
李青山
高标
罗文龙
王子奇
计亚江
刘腾威
樊磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202111518114.1A priority Critical patent/CN114398490B/zh
Publication of CN114398490A publication Critical patent/CN114398490A/zh
Application granted granted Critical
Publication of CN114398490B publication Critical patent/CN114398490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于分层注意力机制的知识图谱补全方法及装置,包括:构建初始知识图谱;从交互日志中确定实体集合,并确定每个交互实体的初始向量;确定用户对每个交互实体的行为,并根据各行为的量化结果优化初始向量,得到优化向量;从交互日志中获取用户行为序列,并对行为序列进行分层,得到第一集合和第二集合;对第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;根据第一集合获取用户的第一类兴趣、根据第二集合获取用户的第二类兴趣,并在将第一类兴趣与第二类兴趣确定为实体后,更新初始知识图谱。本发明通过分层注意力机制获取用户长期兴趣和短期兴趣,使知识图谱更加完善。

Description

一种基于分层注意力机制的知识图谱补全方法及装置
技术领域
本发明属于人工智能技术领域,具体涉及一种基于分层注意力机制的知识图谱补全方法及装置。
背景技术
随着互联网技术的不断发展,短视频应用利用推荐系统将网络上的信息由被动展示给用户转变为主动地为用户提供信息服务。但在实际应用中,当用户历史信息较少时,就会面临冷启动和数据稀疏两大问题,因此需要尽可能挖掘用户和物品深层次信息以提高推荐性能,而知识图谱通过结构化的组织、管理海量互联网数据信息,将互联网信息表示为更易被人类理解的知识形式,包含了不同领域中的实体信息和实体间的关系信息,从而可以有效缓解协同过滤中数据稀疏的问题。
现有技术中,基于知识图谱的研究多基于已存在的知识图谱,将知识图谱视作静态的,忽视了知识图谱的不完善性,并且关于基于注意力机制的知识图谱补全方法只是利用注意力机制获得更好的嵌入表示,也没有产生新的实体进行知识图谱补全。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于分层注意力机制的知识图谱补全方法及装置。本发明要解决的技术问题通过以下技术方案实现:
第一方面,本发明提供一种基于分层注意力机制的知识图谱补全方法,包括:
构建初始知识图谱,所述初始知识图谱包括多个“实体-关系-实体”三元组;
从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量;
针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量;
从所述交互日志中获取用户行为序列,并对所述行为序列进行分层,得到第一集合和第二集合;所述用户行为序列包括用户在当前时刻之前的交互行为分布,所述第一集合包括用户在当前时刻之前的所有交互行为,所述第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
对所述第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
分别根据所述第一集合获取用户的第一类兴趣、根据所述第二集合获取用户的第二类兴趣,并在将所述第一类兴趣与所述第二类兴趣确定为实体后,更新所述初始知识图谱。
在本发明的一个实施例中,所述实体集合包括用户交互的所有交互实体、以及每个交互实体对应的实体标签;
所述从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量的步骤,包括:
从用户的交互日志中确定交互实体集合;
根据所述交互实体集合,统计每个交互实体对应的实体标签的数量;
根据所述实体标签的数量,确定每个交互实体的初始向量。
在本申请的一个实施例中,所述针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量的步骤,包括:
确定用户对于每个所述交互实体的行为;
根据预设的第一类反馈行为、预设的第二类反馈行为以及预设量化规则,对每个所述行为进行量化;
根据量化结果对所述初始向量进行优化,得到优化向量。
在本发明的一个实施例中,所述第一类反馈行为是间接表明用户兴趣的行为,所述第二类反馈行为是直接表明用户兴趣的行为;
所述预设的第一类反馈行为包括浏览行为、点击行为和交易行为,所述预设的第二类反馈行为包括评分行为。
在本申请的一个实施例中,所述根据预设的第一类反馈行为、预设的第二类反馈行为以及预设量化规则,对每个所述行为进行量化的步骤,包括:
分别判断用户针对交互实体是否发生浏览行为、点击行为和/或交易行为;
若是,则将对应的浏览行为、点击行为和/或交易行为量化为1;若否,则将对应的浏览行为、点击行为和/或交易行为量化为0;
分别判断用户针对交互实体行为是否发生评分行为;
若是,则按照如下公式量化所述评分行为:
Figure BDA0003407603090000031
其中,Vu,i表示用户对交互实体的评分,Vmin表示该交互实体预设的最低评分,Vmax表示该交互实体预设的最高评分,
Figure BDA0003407603090000041
表示评分行为的量化结果。
在本申请的一个实施例中,当用户针对交互实体发生浏览行为、点击行为和/或交易行为时,所述根据量化结果对所述初始向量进行优化,得到优化向量的步骤,包括:
获取所述浏览行为、所述点击行为和/或所述交易行为的预设权重;
根据所述预设权重以及所述浏览行为、所述点击行为和/或所述交易行为的量化结果,按照如下公式对初始向量进行优化:
Figure BDA0003407603090000042
其中,ea表示所述浏览行为、所述点击行为和/或所述交易行为的量化结果,WT表示所述浏览行为、所述点击行为和/或所述交易行为的预设权重,ei表示初始向量,
Figure BDA0003407603090000043
表示优化向量。
在本申请的一个实施例中,当用户针对交互实体发生评分行为时,按照如下公式对初始向量进行优化:
Figure BDA0003407603090000044
式中,ei表示所述评分行为的量化结果,
Figure BDA0003407603090000045
表示优化向量。
在本申请的一个实施例中,按照如下公式对所述第一集合中所有交互行为的时间信息进行编码:
Figure BDA0003407603090000046
其中,
Figure BDA0003407603090000047
S表示行为序列中距离当前时刻最远的时刻,Mf表示时间编码矩阵,|di,j|表示和交互行为i对应第一的时刻与交互行为j对应的第二时刻的时间位置距离。
第二方面,本发明还提供一种基于分层注意力机制的知识图谱补全装置,包括:
构建单元,用于构建初始知识图谱,所述初始知识图谱包括多个“实体-关系-实体”三元组;
确定单元,用于从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量;
优化单元,用于针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量;
分层单元,用于从所述交互日志中获取用户行为序列,并对所述行为序列进行分层,得到第一集合和第二集合;所述用户行为序列包括用户在当前时刻之前的交互行为分布,所述第一集合包括用户在当前时刻之前的所有交互行为,所述第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
编码单元,用于对所述第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
更新单元,用于分别根据所述第一集合获取用户的第一类兴趣、根据所述第二集合获取用户的第二类兴趣,并在将所述第一类兴趣与所述第二类兴趣确定为实体后,更新所述初始知识图谱。
与现有技术相比,本发明的有益效果在于:
本发明提供一种基于分层注意力机制的知识图谱补全方法及装置,由于第一集合包括用户在当前时刻之前的所有交互行为、第二集合包括用户在当前时刻之前的预设时间段内的交互行为,因此可通过分层注意力机制从用户行为序列中获取用户的第一类兴趣及第二类兴趣,其中,第一类兴趣为用户的长期兴趣,第二类兴趣为用户的短期兴趣,进而将用户兴趣视作知识图谱的实体,并定义相应关系以完善知识图谱,使知识图谱不断演化完善。
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
图1是本发明实施例提供的基于分层注意力机制的知识图谱补全方法的一种流程图;
图2是本发明实施例提供的基于分层注意力机制的知识图谱补全装置的一种结构示意图;
图3是本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
图1是本发明实施例提供的基于分层注意力机制的知识图谱补全方法的一种流程图。本发明实施例提供一种基于分层注意力机制的知识图谱补全方法,包括:
S1、构建初始知识图谱,初始知识图谱包括多个“实体-关系-实体”三元组;
S2、从交互日志中确定用户交互的实体集合,根据实体集合确定其中每个交互实体的初始向量;
S3、针对每个交互实体,确定用户的行为,并根据各个行为的量化结果对初始向量进行优化,得到优化向量;
S4、从交互日志中获取用户行为序列,并对行为序列进行分层,得到第一集合和第二集合;用户行为序列包括用户在当前时刻之前的交互行为分布,第一集合包括用户在当前时刻之前的所有交互行为,第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
S5、对第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
S6、分别根据第一集合获取用户的第一类兴趣、根据第二集合获取用户的第二类兴趣,并在将第一类兴趣与第二类兴趣确定为实体后,更新初始知识图谱。
本实施例中,初始知识图谱的基本组成单位是“实体--关系--实体”三元组,具体地,根据用户交互日志获取用户实体u、关系r和尾实体i,其中,(uj,rj,ij)表示第j个三元组,j=1,2,…。在上述步骤S2中,获取用户的交互日志,并从交互日志中获取用户交互的实体,得到交互实体集合I。可选地,交互实体集合I包括用户交互的所有交互实体、以及每个交互实体对应的实体标签,例如:从用户观看的电影数据集中,获取用户观看过的所有电影,每部电影即为一个交互实体,所有交互实体构成的集合即为交互实体集合I。
进一步地,获取用户在当前时刻之前的所有交互行为、以及用户在当前时刻之前的预设时间段内的交互行为,得到第一集合与第二集合,再通过分层注意力机制从用户行为序列、即第一集合和第二集合中获取用户的第一类兴趣及第二类兴趣,可以理解的是,第一类兴趣为用户的长期兴趣,第二类兴趣为用户的短期兴趣,进而将用户兴趣视作知识图谱的实体,并定义相应关系以完善知识图谱,使知识图谱不断演化完善。
可选地,从交互日志中确定用户交互的实体集合,根据实体集合确定其中每个交互实体的初始向量的步骤,包括:
S201、从用户的交互日志中确定交互实体集合;
S202、根据交互实体集合,统计每个交互实体对应的实体标签的数量;
S203、根据实体标签的数量,确定每个交互实体的初始向量。
具体地,获取交互实体集合后,确定每个交互实体对应的实体标签的数量;仍以交互日志为用户观看过的电影数据集为例,获取交互实体集合后,每部电影都有对应的实体标签即为该电影的标签集(k1,k2,K3,…),k1、k2、K3可以为科幻、灾难、喜剧、爱情、动作等标签,而后统计每部电影的所有标签数量d,d表示电影实体的维度。
本实施例中,结合one-hot编码机制和分布式表示,把初始向量表示为ei={0,0,0,…,1,…,0}d,其中,d表示第i个交互实体的维度,显然,每个维度都映射相应的实体标签。例如,一个电影实体的实体标签包括科幻和动作,则科幻和动作对应的向量特征值为1,其他均为0。
针对每个交互实体,用户的不同行为表示了用户对该交互实体不同的感兴趣程度,不同行为表示用户对交互实体的不同的感兴趣程度,为了消除不同行为的影响,对初始向量进行优化。可选地,在上述步骤S3中,针对每个交互实体,确定用户的行为,并根据各个行为的量化结果对初始向量进行优化,得到优化向量的步骤,包括:
确定用户对于每个交互实体的行为;
根据预设的第一类反馈行为、预设的第二类反馈行为以及预设量化规则,对每个行为进行量化;
根据量化结果对初始向量进行优化,得到优化向量。
具体而言,对于用户u,给定交互实体i,在t时刻用户u与交互实体i之间发生交互,称为行为au,i t。可以理解的是,针对每个交互实体,用户的行为通常是异构的,也就是说用户对于各交互实体的行为有多种。本实施例中,预设的第一类反馈行为是指能够间接表明用户兴趣的行为,如浏览行为、点击行为和交易行为,而预设的第二类反馈行为是指能够直接表明用户兴趣的行为,如评分行为。
可选地,根据预设的第一类反馈行为、预设的第二类反馈行为以及预设量化规则,对每个行为进行量化的步骤,包括:
分别判断用户针对交互实体是否发生浏览行为、点击行为和/或交易行为;
若是,则将对应的浏览行为、点击行为和/或交易行为量化为1;若否,则将对应的浏览行为、点击行为和/或交易行为量化为0;
判断用户针对交互实体行为是否发生评分行为;
若是,则按照如下公式量化评分行为:
Figure BDA0003407603090000091
其中,Vu,i表示用户对交互实体的评分,Vmin表示用户对交互实体的最低评分,Vmax表示用户对交互实体的最高评分,
Figure BDA0003407603090000092
表示评分行为的量化结果。
本实施例中,以判断大用户针对交互实体是否发生点击行为为例,按照下式进行量化:
Figure BDA0003407603090000101
也就是说,如果用户在t时刻发生点击行为,那么就将点击行为量化为1,反之,则将点击行为量化为0。
需要说明的是,浏览行为和交易行为的量化过程与点击行为的量化过程相同,此处不再赘述进;并且,除上述浏览行为、点击行为和交易行为之外,实际场景中还包括大量可以间接表明用户兴趣的隐式反馈行为,应该根据实际需求预设第一类反馈行为,本发明对此不作限定。
可以理解的是,对每个交互实体来说,用户的不同行为表示了用户对该交互实体不同的感兴趣程度,因此,本实施例给每种行为赋予预设权重。当用户针对交互实体发生浏览行为、点击行为和/或交易行为时,根据量化结果对初始向量进行优化,得到优化向量的步骤,包括:
获取浏览行为、点击行为和/或交易行为的预设权重;
根据预设权重以及浏览行为、点击行为和/或交易行为的量化结果,按照如下公式对初始向量进行优化:
Figure BDA0003407603090000102
其中,ea表示浏览行为、点击行为和/或交易行为的量化结果,WT表示浏览行为、点击行为和/或交易行为的预设权重,WT的维度与ea相同,ei表示初始向量,
Figure BDA0003407603090000103
表示优化向量。示例性地,用户针对交互实体发生了浏览行为、点击行为和交易行为,则ea={1,1,1}、WT={0.3,0.4,0.3}。
另一方面,判断用户针对交互实体行为是否发生评分行为;若是,则按照如下公式量化评分行为:
Figure BDA0003407603090000104
其中,Vu,i表示用户对交互实体的评分,Vmin表示该交互实体预设的最低评分,Vmax表示该交互实体预设的最高评分,
Figure BDA0003407603090000111
表示评分行为的量化结果。
当用户针对交互实体发生评分行为时,按照如下公式对初始向量进行优化:
Figure BDA0003407603090000112
式中,ei表示所述评分行为的量化结果,
Figure BDA0003407603090000113
表示优化向量。
需要说明的是,预设的第二类反馈行为为显式反馈行为,不同于隐式反馈行为,显式反馈能够直接表明用户的兴趣,除上述评分行为外,实际场景中还包括其他显式反馈行为,应该当根据实际需求灵活预设第二了反馈行为,本申请对此不作限定。
用户兴趣在实际生活中通常会受到多重因素的影响,例如季节、环境、年龄甚至经历等,随时间呈现动态变化特性。从时间演变以及因果关系上看,用户兴趣与可变的短期兴趣有着密切的联系,并且用户稳定的、静态的长期兴趣也会影响用户当前的选择。一般来说,用户的长期兴趣反映了用户过去较长时间内的总体兴趣偏好,对于用户来说较为稳定,而在某个具体时间段内,用户近期的短期兴趣会对用户当前选择产生很大的影响,比如一个电影爱好者,在春节期间可能会对喜剧类电影感兴趣,但是在平时该用户更加倾向于观看科幻电影。
为了从第一集合与第二集合包含的用户行为序列中获取用户兴趣以完善初始知识图谱,需要提取用户可变的短期兴趣与稳定的长期兴趣。因此,本实施例对用户行为序列Su={u1,u2,...,un}进行分层,定义第一集合SLu={u1,u2,...,un}表示用户当前交互行为之前的所有历史行为,并定义第二集合SSu={u1,u2,...,um}表示用户当前时刻之前的预设时间段内的交互行为,其中m∈n。
进一步地,基于用户行为序列的时间顺序信息和时间依赖关系,利用位置编码矩阵对时间信息进行编码,以构造动态依赖关系。
可选地,在上述步骤S5中,按照如下公式对所述第一集合中所有交互行为的时间信息进行编码:
Figure BDA0003407603090000121
其中,
Figure BDA0003407603090000122
S表示行为序列中距离当前时刻最远的时刻,Mf表示时间编码矩阵,|di,j|表示和交互行为i对应第一的时刻与交互行为j对应的第二时刻的时间位置距离。
根据注意力分布,本实施例可以采用一种“软性”的信息选择机制对输入信息进行汇总,获取用户长短期兴趣。
Figure BDA0003407603090000123
Figure BDA0003407603090000124
对第一集合和第二集合中的用户行为序列应用上述公式获取用户兴趣表示,选择预设数量个最大的
Figure BDA0003407603090000125
对应的实体标签作为用户兴趣,其中,从第一集合的用户行为序列中获得用户长期兴趣LIs,从第二集合的用户行为序列中获得用户短期兴趣SIs。
进一步地,把获得的用户长期兴趣和短期兴趣定义为实体,并根据用户兴趣在初始知识图谱上定义两种关系LI和SI,LI表示用户对某一实体语义有长期的兴趣,SI表示用户最近的兴趣关注点。最后根据用户兴趣实体和相应关系完善知识图谱。
图2是本发明实施例提供的基于分层注意力机制的知识图谱补全装置的一种结构示意图。如图2所示,本发明实施例还提供一种基于分层注意力机制的知识图谱补全装置,包括:
构建单元210,用于构建初始知识图谱,初始知识图谱包括多个“实体-关系-实体”三元组;
确定单元220,用于从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量;
优化单元230,用于针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量;
分层单元240,用于从所述交互日志中获取用户行为序列,并对所述行为序列进行分层,得到第一集合和第二集合;所述用户行为序列包括用户在当前时刻之前的交互行为分布,所述第一集合包括用户在当前时刻之前的所有交互行为,所述第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
编码单元250,用于对所述第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
更新单元260,用于分别根据所述第一集合获取用户的第一类兴趣、根据所述第二集合获取用户的第二类兴趣,并在将所述第一类兴趣与所述第二类兴趣确定为实体后,更新所述初始知识图谱。
本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
构建初始知识图谱,所述初始知识图谱包括多个“实体-关系-实体”三元组;
从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量;
针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量;
从所述交互日志中获取用户行为序列,并对所述行为序列进行分层,得到第一集合和第二集合;所述用户行为序列包括用户在当前时刻之前的交互行为分布,所述第一集合包括用户在当前时刻之前的所有交互行为,所述第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
对所述第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
分别根据所述第一集合获取用户的第一类兴趣、根据所述第二集合获取用户的第二类兴趣,并在将所述第一类兴趣与所述第二类兴趣确定为实体后,更新所述初始知识图谱。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的方法可以应用于电子设备。具体的,该电子设备可以为:台式计算机、便携式计算机、智能移动终端、服务器等。在此不作限定,任何可以实现本发明的电子设备,均属于本发明的保护范围。
对于装置/电子设备/存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,本发明实施例的装置、电子设备及存储介质分别是应用上述基于分层注意力机制的知识图谱补全方法的装置、电子设备及存储介质,则上述基于分层注意力机制的知识图谱补全方法的所有实施例均适用于该装置、电子设备及存储介质,且均能达到相同或相似的有益效果。
应用本发明实施例所提供的终端设备,可以展示专有名词和/或固定词组供用户选择,进而减少用户输入时间,提高用户体验。
该终端设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有数据交互功能的电子装置。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外,本领域的技术人员可以将本说明书中描述的不同实施例或示例进行接合和组合。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种基于分层注意力机制的知识图谱补全方法,其特征在于,包括:
构建初始知识图谱,所述初始知识图谱包括多个“实体-关系-实体”三元组;
从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量;
针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量;
从所述交互日志中获取用户行为序列,并对所述行为序列进行分层,得到第一集合和第二集合;所述用户行为序列包括用户在当前时刻之前的交互行为分布,所述第一集合包括用户在当前时刻之前的所有交互行为,所述第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
对所述第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
分别根据所述第一集合获取用户的第一类兴趣、根据所述第二集合获取用户的第二类兴趣,并在将所述第一类兴趣与所述第二类兴趣确定为实体后,更新所述初始知识图谱。
2.根据权利要求1所述的基于分层注意力机制的知识图谱补全方法,其特征在于,所述实体集合包括用户交互的所有交互实体、以及每个交互实体对应的实体标签;
所述从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量的步骤,包括:
从用户的交互日志中确定交互实体集合;
根据所述交互实体集合,统计每个交互实体对应的实体标签的数量;
根据所述实体标签的数量,确定每个交互实体的初始向量。
3.根据权利要求1所述的基于分层注意力机制的知识图谱补全方法,其特征在于,所述针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量的步骤,包括:
确定用户对于每个所述交互实体的行为;
根据预设的第一类反馈行为、预设的第二类反馈行为以及预设量化规则,对每个所述行为进行量化;
根据量化结果对所述初始向量进行优化,得到优化向量。
4.根据权利要求3所述的基于分层注意力机制的知识图谱补全方法,其特征在于,所述第一类反馈行为是间接表明用户兴趣的行为,所述第二类反馈行为是直接表明用户兴趣的行为;
所述预设的第一类反馈行为包括浏览行为、点击行为和交易行为,所述预设的第二类反馈行为包括评分行为。
5.根据权利要求4所述的基于分层注意力机制的知识图谱补全方法,其特征在于,所述根据预设的第一类反馈行为、预设的第二类反馈行为以及预设量化规则,对每个所述行为进行量化的步骤,包括:
分别判断用户针对交互实体是否发生浏览行为、点击行为和/或交易行为;
若是,则将对应的浏览行为、点击行为和/或交易行为量化为1;若否,则将对应的浏览行为、点击行为和/或交易行为量化为0;
分别判断用户针对交互实体行为是否发生评分行为;
若是,则按照如下公式量化所述评分行为:
Figure FDA0003407603080000031
其中,Vu,i表示用户对交互实体的评分,Vmin表示该交互实体预设的最低评分,Vmax表示该交互实体预设的最高评分,
Figure FDA0003407603080000035
表示评分行为的量化结果。
6.根据权利要求5所述的基于分层注意力机制的知识图谱补全方法,其特征在于,当用户针对交互实体发生浏览行为、点击行为和/或交易行为时,所述根据量化结果对所述初始向量进行优化,得到优化向量的步骤,包括:
获取所述浏览行为、所述点击行为和/或所述交易行为的预设权重;
根据所述预设权重以及所述浏览行为、所述点击行为和/或所述交易行为的量化结果,按照如下公式对初始向量进行优化:
Figure FDA0003407603080000033
其中,ea表示所述浏览行为、所述点击行为和/或所述交易行为的量化结果,WT表示所述浏览行为、所述点击行为和/或所述交易行为的预设权重,ei表示初始向量,
Figure FDA0003407603080000034
表示优化向量。
7.根据权利要求5所述的基于分层注意力机制的知识图谱补全方法,其特征在于,当用户针对交互实体发生评分行为时,按照如下公式对初始向量进行优化:
Figure FDA0003407603080000041
式中,ei表示所述评分行为的量化结果,
Figure FDA0003407603080000042
表示优化向量。
8.根据权利要求1所述的基于分层注意力机制的知识图谱补全方法,其特征在于,按照如下公式对所述第一集合中所有交互行为的时间信息进行编码:
Figure FDA0003407603080000043
其中,
Figure FDA0003407603080000044
S表示行为序列中距离当前时刻最远的时刻,Mf表示时间编码矩阵,|di,j|表示和交互行为i对应第一的时刻与交互行为j对应的第二时刻的时间位置距离。
9.一种基于分层注意力机制的知识图谱补全装置,其特征在于,包括:
构建单元,用于构建初始知识图谱,所述初始知识图谱包括多个“实体-关系-实体”三元组;
确定单元,用于从交互日志中确定用户交互的实体集合,根据所述实体集合确定其中每个交互实体的初始向量;
优化单元,用于针对每个所述交互实体,确定用户的行为,并根据各个行为的量化结果对所述初始向量进行优化,得到优化向量;
分层单元,用于从所述交互日志中获取用户行为序列,并对所述行为序列进行分层,得到第一集合和第二集合;所述用户行为序列包括用户在当前时刻之前的交互行为分布,所述第一集合包括用户在当前时刻之前的所有交互行为,所述第二集合包括用户在当前时刻之前的预设时间段内的交互行为;
编码单元,用于对所述第一集合中所有交互行为的时间信息进行编码,得到用户的注意力分布;
更新单元,用于分别根据所述第一集合获取用户的第一类兴趣、根据所述第二集合获取用户的第二类兴趣,并在将所述第一类兴趣与所述第二类兴趣确定为实体后,更新所述初始知识图谱。
CN202111518114.1A 2021-12-13 2021-12-13 一种基于分层注意力机制的知识图谱补全方法及装置 Active CN114398490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111518114.1A CN114398490B (zh) 2021-12-13 2021-12-13 一种基于分层注意力机制的知识图谱补全方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111518114.1A CN114398490B (zh) 2021-12-13 2021-12-13 一种基于分层注意力机制的知识图谱补全方法及装置

Publications (2)

Publication Number Publication Date
CN114398490A true CN114398490A (zh) 2022-04-26
CN114398490B CN114398490B (zh) 2024-04-02

Family

ID=81227167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111518114.1A Active CN114398490B (zh) 2021-12-13 2021-12-13 一种基于分层注意力机制的知识图谱补全方法及装置

Country Status (1)

Country Link
CN (1) CN114398490B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282219A1 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN113010778A (zh) * 2021-03-10 2021-06-22 北京明略软件系统有限公司 一种基于用户历史兴趣的知识图谱推荐方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140282219A1 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
CN113010778A (zh) * 2021-03-10 2021-06-22 北京明略软件系统有限公司 一种基于用户历史兴趣的知识图谱推荐方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张素琪;许馨匀;佘士耀;任珂可;: "基于双用户视角与知识图谱注意力网络的推荐模型", 现代计算机, no. 13 *

Also Published As

Publication number Publication date
CN114398490B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
JP7108720B2 (ja) 対話システム間の知識共有方法、対話方法、知識共有装置、対話装置、電子機器及び記憶媒体
CN110119474B (zh) 推荐模型训练方法、基于推荐模型的预测方法及装置
US10354184B1 (en) Joint modeling of user behavior
JP2022031624A (ja) コンテンツ推奨方法、装置、電子機器、記憶媒体およびコンピュータプログラム
GB2567712A (en) Global vector recommendations based on implicit interaction and profile data
US20160078520A1 (en) Modified matrix factorization of content-based model for recommendation system
CN113221019A (zh) 基于即时学习的个性化推荐方法和系统
US20190205757A1 (en) Model-free control for reinforcement learning agents
CN113836404A (zh) 对象推荐方法、装置、电子设备及计算机可读存储介质
CN113836390B (zh) 资源推荐方法、装置、计算机设备及存储介质
CN110827078B (zh) 一种信息推荐方法、装置、设备及存储介质
US10373046B2 (en) Client-server hybrid AI scores for customized actions
CN114398490B (zh) 一种基于分层注意力机制的知识图谱补全方法及装置
CN116308551A (zh) 基于数字金融ai平台的内容推荐方法及系统
CN114547116A (zh) 一种数据推送方法、装置、设备和介质
CN112532406B (zh) 对照实验的数据处理方法、装置、计算机设备及存储介质
CN114926234A (zh) 物品信息推送方法、装置、电子设备和计算机可读介质
CN113111273A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN113672801B (zh) 信息的处理方法、装置、存储介质和电子设备
CN114866845B (zh) 一种基于短视频发布的信息检测方法及系统
CN116680467A (zh) 对象推荐方法、装置、计算机设备和存储介质
Najantong et al. Understanding the model of user satisfaction in using cloud storage systems of employees in Thailand: A conceptual framework
CN116975427A (zh) 确定对象对资源信息的感兴趣程度的方法、装置和计算设备
CN116701747A (zh) 内容推荐方法、装置、计算机设备及计算机可读存储介质
CN115659041A (zh) 信息推荐方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant