CN116992008B - 知识图谱多跳问答推理方法、装置和计算机设备 - Google Patents
知识图谱多跳问答推理方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN116992008B CN116992008B CN202311272187.6A CN202311272187A CN116992008B CN 116992008 B CN116992008 B CN 116992008B CN 202311272187 A CN202311272187 A CN 202311272187A CN 116992008 B CN116992008 B CN 116992008B
- Authority
- CN
- China
- Prior art keywords
- entity
- determining
- score
- hop
- user query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000006870 function Effects 0.000 claims description 65
- 239000011159 matrix material Substances 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 abstract description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 235000008694 Humulus lupulus Nutrition 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- YTAHJIFKAKIKAV-XNMGPUDCSA-N [(1R)-3-morpholin-4-yl-1-phenylpropyl] N-[(3S)-2-oxo-5-phenyl-1,3-dihydro-1,4-benzodiazepin-3-yl]carbamate Chemical compound O=C1[C@H](N=C(C2=C(N1)C=CC=C2)C1=CC=CC=C1)NC(O[C@H](CCN1CCOCC1)C1=CC=CC=C1)=O YTAHJIFKAKIKAV-XNMGPUDCSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种知识图谱多跳问答推理方法、装置和计算机设备。首先,基于用户查询问题确定语句实体,之后,基于所述语句实体以及知识图谱展开路径,确定关系实体树,之后,基于所述用户查询问题确定问题关注度,之后,基于所述问题关注度确定关系得分,之后,基于所述关系得分和关系实体树确定每一跳实体得分,最后,基于所述每一跳实体得分确定所述用户查询问题的推理答案。也就是说,在知识图谱多跳问答推理的过程中,通过识别和链接问题中的实体和关系,从实体出发,结合问题关注度更新每一步关系得分和每一跳实体得分,确定最终的实体得分,从而确定推理答案,提高了知识图谱多跳问答推理的合理性和准确性。
Description
技术领域
本申请涉及知识图谱问答和自然语言处理技术领域,特别是涉及一种知识图谱多跳问答推理方法、装置和计算机设备。
背景技术
随着大数据时代的发展,如何帮助用户在海量信息中快速找到想要的信息成为主流的研究课题。知识图谱以三元组的形式结构化存储海量信息,用客观世界可认知的语义表示表达海量互联网信息,因其具有强大的语义表达、存储和表达能力得到了广泛关注和研究应用。传统技术中,基于知识图谱的问答技术通常以实体、属性等单一具体对象为主,而在实际应用场景中,用户不再满足于单跳的知识问答,更多地倾向表达复杂的多跳问答推理问题。知识图谱多跳问答推理是指针对一个文本问题,在包含大量知识的知识图谱中找到多个有关联的三元组,通过在给定关系图上通过多个关系边找到答案的过程。
现有技术中,通常是通过预测顺序关系路径或聚合隐藏图特征来推断答案,知识库中的数据以三元组的形式存在,通过预测顺序关系路径的方法以用户问题中的主题实体为起始实体,沿着知识库中的多个三元组的路径进行推理,从而获取到答案实体或关系。在预测推理答案的过程中,虽然这些方法都意识到了预测路径的重要性,但多采用弱监督的方式对预测模型进行训练,得到的预测路径结果的合理性较低,不能保证预测路径结果的准确性。
因此,相关技术中亟需一种能够提高知识图谱多跳问答推理的合理性和准确性的方式。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高知识图谱多跳问答推理的合理性和准确性的知识图谱多跳问答推理方法、装置和计算机设备。
第一方面,本申请提供了一种知识图谱多跳问答推理方法。所述方法包括:
基于用户查询问题确定语句实体;
基于所述语句实体以及知识图谱展开路径,确定关系实体树;
基于所述用户查询问题确定问题关注度;
基于所述问题关注度确定关系得分;
基于所述关系得分和关系实体树确定每一跳实体得分;
基于所述每一跳实体得分确定所述用户查询问题的推理答案。
可选的,在本申请的一个实施例中,所述基于用户查询问题确定语句实体包括:
获取知识图谱实体和用户查询问题实体;
将所述用户查询问题实体映射到知识图谱实体,确定语句实体。
可选的,在本申请的一个实施例中,所述基于所述用户查询问题确定问题关注度包括:
基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出;
基于所述向量编码以及各个时刻输出确定问题关注度。
可选的,在本申请的一个实施例中,所述基于所述问题关注度确定关系得分包括:
获取知识图谱关系编码;
基于所述问题关注度和知识图谱关系编码确定关系得分。
可选的,在本申请的一个实施例中,所述基于所述关系得分和关系实体树确定每一跳实体得分包括:
基于所述关系实体树确定实体关系矩阵和关系实体矩阵;
基于所述关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分。
可选的,在本申请的一个实施例中,所述方法还包括:
基于所述关系得分确定关系预测损失函数;
基于所述用户查询问题确定问题跳数概率分布,基于所述问题跳数概率分布确定跳数预测损失函数。
可选的,在本申请的一个实施例中,所述基于所述每一跳实体得分确定所述用户查询问题的推理答案包括:
基于所述问题跳数概率分布和每一跳实体得分确定最终实体得分;
基于所述最终实体得分确定答案预测损失函数;
基于所述关系预测损失函数、跳数预测损失函数和答案预测损失函数确定知识推理总体损失函数;
若所述总体损失函数最小,则基于所述最终实体得分确定所述用户查询问题的推理答案。
第二方面,本申请还提供了一种知识图谱多跳问答推理装置。所述装置包括:
语句实体模块,用于基于用户查询问题确定语句实体;
关系实体树模块,用于基于所述语句实体以及知识图谱展开路径,确定关系实体树;
问题关注度模块,用于基于所述用户查询问题确定问题关注度;
关系得分模块,用于基于所述问题关注度确定关系得分;
每一跳实体得分模块,用于基于所述关系得分和关系实体树确定每一跳实体得分;
推理答案确定模块,用于基于所述每一跳实体得分确定所述用户查询问题的推理答案。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行上述各个实施例所述方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个实施例所述方法的步骤。
上述知识图谱多跳问答推理方法、装置和计算机设备,首先,基于用户查询问题确定语句实体,之后,基于所述语句实体以及知识图谱展开路径,确定关系实体树,之后,基于所述用户查询问题确定问题关注度,之后,基于所述问题关注度确定关系得分,之后,基于所述关系得分和关系实体树确定每一跳实体得分,最后,基于所述每一跳实体得分确定所述用户查询问题的推理答案。也就是说,在知识图谱多跳问答推理的过程中,通过识别和链接问题中的实体和关系,从实体出发,结合问题关注度更新每一步关系得分和每一跳实体得分,确定最终的实体得分,从而确定推理答案,提高了知识图谱多跳问答推理的合理性和准确性。
附图说明
图1为一个实施例中知识图谱多跳问答推理方法的应用环境图;
图2为一个实施例中知识图谱多跳问答推理方法的流程示意图;
图3为一个实施例中获取用户查询问题实体步骤的流程示意图;
图4为一个实施例中知识图谱多跳问答推理方法具体步骤的流程示意图;
图5为一个实施例中知识推理部分具体步骤的流程示意图;
图6为一个实施例中知识图谱多跳问答推理装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的知识图谱多跳问答推理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种知识图谱多跳问答推理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S201:基于用户查询问题确定语句实体。
本申请实施例中,首先,通过接收到的用户输入的需要查询的问题,确定其中提及到的语句实体。具体的,可以将用户查询问题中提及的实体映射到标准的知识库中存储的实体,获得语句实体的标准向量表示。映射方法可以采用计算相似度、特征对比等方法。
S203:基于所述语句实体以及知识图谱展开路径,确定关系实体树。
本申请实施例中,确定语句实体之后,基于语句实体和知识库中的知识图谱展开路径,从知识图谱中抽取语句实体相关的三元组,确定关系实体树。具体的,基于头实体衍生出相关的关系和相应的尾实体。在此步骤中,首先初始化/>,然后从一个主题实体/>开始,作为一个头部实体,可以通过与其所有关联的关系衍生出多个尾部实体和相应的三元组/>,将衍生出的所有实体加入到/>后,将/>中新加入的实体作为头部实体,继续衍生出多个尾部实体和三元组,将以上过程重复T次,得到基于语句实体T跳内的所有三元组G,即得到相应的关系-实体树,合并形成统一的检索子图G。
S205:基于所述用户查询问题确定问题关注度。
本申请实施例中,基于用户查询问题,确定问题关注度。问题关注度指在对用户查询问题的推理过程中,不同时刻所关注的问题对应的不同部分信息。具体的,可以通过用户查询问题确定每个时刻的不同输出,之后根据各个时刻的不同输出和当下时刻问题编码确定每个时刻的问题关注度。
S207:基于所述问题关注度确定关系得分。
本申请实施例中,确定问题关注度之后,就获得了每个时刻关注的问题对应的不同部分信息,基于这些信息和语句实体之间的关系信息,确定当前时刻下的各个关系得分,即当前对用户查询问题的关注信息在关系上的匹配分数。
S209:基于所述关系得分和关系实体树确定每一跳实体得分。
本申请实施例中,基于关系得分和关系实体树确定每一跳实体得分,即确定关系得分之后,基于关系实体数,推算从用户查询问题的每个语句实体通过关系链接跳转到每一个实体上的得分,具体的,采用关系实体树中的实体关系链接信息和各关系的匹配分数,推算每一跳的实体分数。
S211:基于所述每一跳实体得分确定所述用户查询问题的推理答案。
本申请实施例中,最后,基于每一跳实体得分,选择跳数中实体得分最高的对应的实体作为用户查询问题的推理答案。
上述知识图谱多跳问答推理方法中,首先,基于用户查询问题确定语句实体,之后,基于所述语句实体以及知识图谱展开路径,确定关系实体树,之后,基于所述用户查询问题确定问题关注度,之后,基于所述问题关注度确定关系得分,之后,基于所述关系得分和关系实体树确定每一跳实体得分,最后,基于所述每一跳实体得分确定所述用户查询问题的推理答案。也就是说,在知识图谱多跳问答推理的过程中,通过识别和链接问题中的实体和关系,从实体出发,结合问题关注度更新每一步关系得分和每一跳实体得分,确定最终的实体得分,从而确定推理答案,提高了知识图谱多跳问答推理的合理性和准确性。
在本申请的一个实施例中,所述基于用户查询问题确定语句实体包括:
S301:获取知识图谱实体和用户查询问题实体。
S303:将所述用户查询问题实体映射到知识图谱实体,确定语句实体。
在本申请的一个实施例中,首先,获取知识图谱实体和用户查询问题实体。知识图谱实体是基于知识表征学习模型ComplEx学习知识图谱得到的每个实体的向量表示E。ComplEx是基于语义匹配的知识图谱嵌入模型,使用神经网络嵌入学习的方法来学习知识图谱中实体的表示。ComplEx模型将每个实体与一个向量相关联,捕获其潜在语义。用户查询问题实体是采用Bert和CRF模型得到的用户查询问题中所有的实体。如图3所示,首先采用BIO序列标注方法标注用户查询问题中的实体位置,BIO标注方法将序列中每个元素标记为B、I或O,分别代表实体的起始、中间和非实体。使用Bert模型获取到每个词的向量表示/>,然后使用CRF限制句法要求,从而获取到句子中提及实体的始末位置[i,j],然后将此位置Bert输出的每个词的向量进行平均,代表用户查询问题实体的向量表示:
;
之后,基于知识图谱实体和用户查询问题实体确定二者的相似度分数,依据相似度分数将用户查询问题实体映射到知识图谱实体,确定为语句实体,即将相似度最高的知识图谱实体作为用户查询问题的主题实体。具体的,通过下述公式确定二者的相似度分数得分。
;
其中,为归一化指数函数,/>为用户查询问题实体,E为知识图谱实体。
本实施例中,通过获取知识图谱实体和用户查询问题实体,计算相似度将用户查询问题实体和标准知识库的知识图谱链接,使后续推理更准确。
在本申请的一个实施例中,所述基于所述用户查询问题确定问题关注度包括:
S401:基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出。
S403:基于所述向量编码以及各个时刻输出确定问题关注度。
在本申请的一个实施例中,首先,基于用户查询问题采用双向GRU模型确定用户查询问题的向量编码和各个时刻输出。GRU是序列建模中被广泛使用的网络结构,它通过控制当前信息以及历史信息的贡献大小来实现序列信息的积累。RNN神经元将当前时刻的输入向量作为一个整体,通过门设计控制其信息载入到模型的信息量。具体的,在每一个时间步j,问题编码器通过当前时刻的每个字的编码和前一时刻的输出/>来更新当前时刻的输出/>,从而使其具有历史信息的记忆性,其中/>的值随机初始化,计算公式如下:
;
之后,可以得到每个时间步的输出,其中/>和/>分别代表前向和后向编码。最后一个时刻的输出即为用户查询问题的向量编码q,各个时刻输出为。
之后,基于对关系路径的推理需求,采用注意力机制,基于向量编码和各个时刻输出确定问题关注度,即在推理的不同时刻中,需要关注的问题的不同部分信息。具体的,基于用户查询问题的向量编码和上一时刻中对于用户查询问题的关注信息,更新此时刻用户查询问题的关注信息,首先将上一时刻对于用户查询问题的关注信息和用户查询问题的向量编码q进行拼接,其中,/>被初始化为语句实体/>的编码。然后将拼接后的向量经过一个全连接线性网络,得到当前时刻用户查询问题的编码/>。全连接线性网络如下式所示。
;
其中,和/>为待学习的参数。然后采用注意力的机制,计算在不同的推理步骤t中对用户查询问题不同部分的关注信息。基于当前时刻用户查询问题的编码计算对于问题不同部分信息的关注度/>,具体计算公式如下。
;
其中,为/>的转置,/>和/>均为待学习的参数。再基于关注度/>对用户查询问题各个部分的信息进行加权求和,得到问题关注度/>,具体计算公式如下:
;
本实施例中,通过基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出,并确定问题关注度,通过确定各个时刻输出从而确定在推理的不同时刻关注的问题的不同部分信息,使推理更全面。
在本申请的一个实施例中,所述基于所述问题关注度确定关系得分包括:
S501:获取知识图谱关系编码。
S503:基于所述问题关注度和知识图谱关系编码确定关系得分。
在本申请的一个实施例中,首先,基于知识表征学习模型ComplEx获取知识图谱关系中每个关系/>的编码/>,每个关系都表示为一个矩阵,模拟了潜在因素之间的成对相互作用。具体公式如下。
;
之后,基于问题关注度和知识图谱关系编码/>关系得分。具体的,即是使用问题关注度 />计算关系/>的分数/>,表示当前对用户查询问题的关注信息在关系向量上的匹配分数,具体计算方式如下式所示。
;
其中,和/>是待学习的参数。
本实施例中,通过获取知识图谱关系编码,基于问题关注度和知识图谱关系编码确定关系得分,获取每一步关系得分,能够推理出最合理的关系走向。
在本申请的一个实施例中,所述基于所述关系得分和关系实体树确定每一跳实体得分包括:
S601:基于所述关系实体树确定实体关系矩阵和关系实体矩阵。
S603:基于所述关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分。
在本申请的一个实施例中,首先,基于关系实体树确定实体关系矩阵和关系实体矩阵,即基于获取到的检索子图G确定实体-关系矩阵和关系-实体矩阵,其中,m和n分别表示知识图谱中所有关系和实体的数量。之后,基于关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分,具体的,基于关系得分/>,更新当前第t跳结束后的实体的得分,直至最大跳数。具体计算过程是基于实体-关系矩阵/>和关系-实体矩阵/>计算实体-实体关系得分矩阵/>,之后基于关系得分矩阵/>以及上一跳实体得分/>更新此跳结束后每个实体的分数/>,具体计算公式如下所示。
,/>;
其中,为待学习的参数,/>的初始值/>,重复上述步骤,直到最大跳数T。
本实施例中,通过基于关系实体树确定实体关系矩阵和关系实体矩阵,基于关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分,即结合每一步的关系得分和关系实体树,能够确定每一跳的实体得分,推理出最准确的问题答案。
在本申请的一个实施例中,所述方法还包括:
S701:基于所述关系得分确定关系预测损失函数。
S703:基于所述用户查询问题确定问题跳数概率分布,基于所述问题跳数概率分布确定跳数预测损失函数。
在本申请的一个实施例中,首先基于关系得分确定关系预测损失函数,具体的,采用交叉熵作为关系预测的损失函数,得到第一阶段优化的路径推理模型,具体公式如下所示。
;
其中,为问题t时刻时的关系标签,如果此时关系为/>,则/>为1,其他为0。
之后,基于用户查询问题确定问题跳数概率分布,即基于用户查询问题的向量编码q,计算问题跳数概率分布,具体计算公式如下所示。
;
其中,,/>表示找到当前问题的答案需要t跳的概率,/>和/>均为待学习的参数。
之后,基于问题跳数概率分布确定跳数预测损失函数,同样的,采用交叉熵作为跳数预测损失函数,得到第一阶段优化的跳数预测模型,具体公式如下所示。
;
其中,,当问题实际为t跳时,/>,其余为0,/>表示找到当前问题的答案需要t跳的概率。
本实施例中,通过基于关系得分确定关系预测损失函数,基于用户查询问题确定问题跳数概率分布,基于问题跳数概率分布确定跳数预测损失函数,分模块确定损失函数,给模型训练提供了参考评估,使知识图谱多跳问答推理得到的结果更准确。
在本申请的一个实施例中,所述基于所述每一跳实体得分确定所述用户查询问题的推理答案包括:
S801:基于所述问题跳数概率分布和每一跳实体得分确定最终实体得分;
S803:基于所述最终实体得分确定答案预测损失函数;
S805:基于所述关系预测损失函数、跳数预测损失函数和答案预测损失函数确定知识推理总体损失函数;
S807:若所述总体损失函数最小,则基于所述最终实体得分确定所述用户查询问题的推理答案。
在本申请的一个实施例中,首先,基于问题跳数概率分布和每一跳实体得分确定最终实体得分,具体的,基于跳数预测和实体分布概率预测更新得到最终的实体得分,即基于每一跳实体得分和问题跳数概率分布计算得到最终实体得分矩阵,具体计算公式如下:
;
之后,基于最终实体得分确定答案预测损失函数。具体的,采用L2损失函数作为答案预测损失函数,得到第一阶段优化的答案预测模型,具体计算公式如下。
,/>;
其中,,/>,Y为黄金答案集合。
之后,基于关系预测损失函数、跳数预测损失函数/>和答案预测损失函数确定知识推理总体损失函数/>,确定知识推理模型。具体计算公式如下所示。
;
其中,、/>均为超参数。
之后,在大量数据上,采用Adam梯度下降的方式训练知识推理模型。梯度下降是一种优化算法,该算法从任一点开始,沿该点梯度的反方向运动一段距离,再沿新位置的梯度反方向运行一段距离。如此迭代,解一直朝下坡最陡的方向运动,希望能运动到损失函数的全局最小点。Adam是一种替代传统随机梯度下降过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重。
当知识推理模型的总体损失函数最小时,各部分即路径推理模型、跳数预测模型和答案预测模型的各损失函数也最小时,知识推理模型训练完毕,将此时的最终实体得分里分数最高的实体作为用户查询问题的推理答案进行输出。
本实施例中,通过基于问题跳数概率分布和每一跳实体得分确定最终实体得分,并确定答案预测损失函数,基于关系预测损失函数、跳数预测损失函数和答案预测损失函数确定知识推理总体损失函数,若总体损失函数最小,则基于最终实体得分确定所述用户查询问题的推理答案,能够有效地利用知识推理过程中的各种信息,提升知识推理效果。
下面以一个具体实施例说明知识图谱多跳问答推理的具体实施步骤,如图4所示,首先,由用户输入问句,即用户查询问题,S901,基于用户查询问题确定语句实体,进行实体识别及链接,具体的,S903-S905,获取知识图谱实体和用户查询问题实体,将所述用户查询问题实体映射到知识图谱实体,确定语句实体。其中知识图谱实体是从知识库获得的。之后,S907,基于所述语句实体以及知识图谱展开路径,确定关系实体树,即进行子图检索。
之后进行知识推理,如图5所示,S909,基于所述用户查询问题确定问题关注度,S911,基于所述问题关注度确定关系得分,S913,基于所述关系得分和关系实体树确定每一跳实体得分。具体的,S915-S917,基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出,基于所述向量编码以及各个时刻输出确定问题关注度,S919-S921,获取知识图谱关系编码,基于所述问题关注度和知识图谱关系编码确定关系得分,S923-S925,基于所述关系实体树确定实体关系矩阵和关系实体矩阵,基于所述关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分。
之后,S927,基于所述关系得分确定关系预测损失函数,S929,基于所述用户查询问题确定问题跳数概率分布,基于所述问题跳数概率分布确定跳数预测损失函数,S931,基于所述问题跳数概率分布和每一跳实体得分确定最终实体得分,S933,基于所述最终实体得分确定答案预测损失函数,S935,基于所述关系预测损失函数、跳数预测损失函数和答案预测损失函数确定知识推理总体损失函数。
最后,S937,若所述总体损失函数最小,则基于所述最终实体得分确定所述用户查询问题的推理答案。具体应用中,是通过采用阶段-整体的方式训练知识推理模型,即先最小化关系预测损失函数,然后最小化跳数预测损失函数/>,然后最小化知识推理总体损失函数/>,最后最小化答案预测损失函数/>,此时整个模型训练完成,输出最终实体得分中分数最高的实体作为用户查询问题的推理答案。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的知识图谱多跳问答推理方法的知识图谱多跳问答推理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个知识图谱多跳问答推理装置实施例中的具体限定可以参见上文中对于知识图谱多跳问答推理方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种知识图谱多跳问答推理装置600,包括:语句实体模块601、关系实体树模块603、问题关注度模块605、关系得分模块607、每一跳实体得分模块609和推理答案确定模块611,其中:
语句实体模块601,用于基于用户查询问题确定语句实体。
关系实体树模块603,用于基于所述语句实体以及知识图谱展开路径,确定关系实体树。
问题关注度模块605,用于基于所述用户查询问题确定问题关注度。
关系得分模块607,用于基于所述问题关注度确定关系得分。
每一跳实体得分模块609,用于基于所述关系得分和关系实体树确定每一跳实体得分。
推理答案确定模块611,用于基于所述每一跳实体得分确定所述用户查询问题的推理答案。
在本申请的一个实施例中,所述语句实体模块还用于:
获取知识图谱实体和用户查询问题实体;
将所述用户查询问题实体映射到知识图谱实体,确定语句实体。
在本申请的一个实施例中,所述问题关注度模块还用于:
基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出;
基于所述向量编码以及各个时刻输出确定问题关注度。
在本申请的一个实施例中,所述关系得分模块还用于:
获取知识图谱关系编码;
基于所述问题关注度和知识图谱关系编码确定关系得分。
在本申请的一个实施例中,所述每一跳实体得分模块还用于:
基于所述关系实体树确定实体关系矩阵和关系实体矩阵;
基于所述关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分。
在本申请的一个实施例中,所述推理答案确定模块还用于:
基于所述关系得分确定关系预测损失函数;
基于所述用户查询问题确定问题跳数概率分布,基于所述问题跳数概率分布确定跳数预测损失函数。
可选的,在本申请的一个实施例中,所述推理答案确定模块还用于:
基于所述问题跳数概率分布和每一跳实体得分确定最终实体得分;
基于所述最终实体得分确定答案预测损失函数;
基于所述关系预测损失函数、跳数预测损失函数和答案预测损失函数确定知识推理总体损失函数;
若所述总体损失函数最小,则基于所述最终实体得分确定所述用户查询问题的推理答案。
上述知识图谱多跳问答推理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种知识图谱多跳问答推理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (7)
1.一种知识图谱多跳问答推理方法,其特征在于,所述方法包括:
基于用户查询问题确定语句实体;
基于所述语句实体以及知识图谱展开路径,确定关系实体树;
基于所述用户查询问题确定问题关注度;
基于所述问题关注度确定关系得分;
基于所述关系得分和关系实体树确定每一跳实体得分;
基于所述每一跳实体得分确定所述用户查询问题的推理答案;
所述基于用户查询问题确定语句实体包括:
获取知识图谱实体和用户查询问题实体;
将所述用户查询问题实体映射到知识图谱实体,确定语句实体;
所述基于所述用户查询问题确定问题关注度包括:
基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出;
基于所述向量编码以及各个时刻输出确定问题关注度;
所述基于所述关系得分和关系实体树确定每一跳实体得分包括:
基于所述关系实体树确定实体关系矩阵和关系实体矩阵;
基于所述关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分。
2.根据权利要求1所述的方法,其特征在于,所述基于所述问题关注度确定关系得分包括:
获取知识图谱关系编码;
基于所述问题关注度和知识图谱关系编码确定关系得分。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述关系得分确定关系预测损失函数;
基于所述用户查询问题确定问题跳数概率分布,基于所述问题跳数概率分布确定跳数预测损失函数。
4.根据权利要求3所述的方法,其特征在于,所述基于所述每一跳实体得分确定所述用户查询问题的推理答案包括:
基于所述问题跳数概率分布和每一跳实体得分确定最终实体得分;
基于所述最终实体得分确定答案预测损失函数;
基于所述关系预测损失函数、跳数预测损失函数和答案预测损失函数确定知识推理总体损失函数;
若所述总体损失函数最小,则基于所述最终实体得分确定所述用户查询问题的推理答案。
5.一种知识图谱多跳问答推理装置,其特征在于,所述装置包括:
语句实体模块,用于基于用户查询问题确定语句实体;
关系实体树模块,用于基于所述语句实体以及知识图谱展开路径,确定关系实体树;
问题关注度模块,用于基于所述用户查询问题确定问题关注度;
关系得分模块,用于基于所述问题关注度确定关系得分;
每一跳实体得分模块,用于基于所述关系得分和关系实体树确定每一跳实体得分;
推理答案确定模块,用于基于所述每一跳实体得分确定所述用户查询问题的推理答案;
所述基于用户查询问题确定语句实体包括:
获取知识图谱实体和用户查询问题实体;
将所述用户查询问题实体映射到知识图谱实体,确定语句实体;
所述基于所述用户查询问题确定问题关注度包括:
基于所述用户查询问题确定所述用户查询问题的向量编码以及各个时刻输出;
基于所述向量编码以及各个时刻输出确定问题关注度;
所述基于所述关系得分和关系实体树确定每一跳实体得分包括:
基于所述关系实体树确定实体关系矩阵和关系实体矩阵;
基于所述关系得分、实体关系矩阵和关系实体矩阵确定每一跳实体得分。
6.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至权利要求4中任一项所述的方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至权利要求4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311272187.6A CN116992008B (zh) | 2023-09-28 | 2023-09-28 | 知识图谱多跳问答推理方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311272187.6A CN116992008B (zh) | 2023-09-28 | 2023-09-28 | 知识图谱多跳问答推理方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116992008A CN116992008A (zh) | 2023-11-03 |
CN116992008B true CN116992008B (zh) | 2024-01-09 |
Family
ID=88530700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311272187.6A Active CN116992008B (zh) | 2023-09-28 | 2023-09-28 | 知识图谱多跳问答推理方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116992008B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573849B (zh) * | 2024-01-16 | 2024-04-19 | 之江实验室 | 一种知识图谱多跳问答方法、装置、设备及存储介质 |
CN118093839B (zh) * | 2024-04-24 | 2024-07-02 | 北京中关村科金技术有限公司 | 基于深度学习的知识运营问答对话处理方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021139283A1 (zh) * | 2020-06-16 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
CN114168719A (zh) * | 2021-06-22 | 2022-03-11 | 北京理工大学 | 一种基于知识图谱嵌入的可解释性多跳问答方法及系统 |
CN115688879A (zh) * | 2022-10-21 | 2023-02-03 | 中电智恒信息科技服务有限公司 | 一种基于知识图谱的智能客服语音处理系统及方法 |
CN115757715A (zh) * | 2022-10-28 | 2023-03-07 | 浙江工业大学 | 一种基于知识图谱表示学习的复杂问题多跳智能问答方法 |
CN115934914A (zh) * | 2022-12-27 | 2023-04-07 | 成都数之联科技股份有限公司 | 基于知识图谱的意图多分类问答方法、装置、设备及介质 |
CN116303961A (zh) * | 2023-03-16 | 2023-06-23 | 齐鲁工业大学(山东省科学院) | 基于多跳组合图指纹网络的知识图谱问答方法及系统 |
CN116401353A (zh) * | 2023-04-12 | 2023-07-07 | 西安交通大学 | 一种结合内部与外部知识图谱的安全多跳问答方法及系统 |
CN116662478A (zh) * | 2023-04-10 | 2023-08-29 | 长春理工大学 | 基于知识图谱嵌入与路径信息的多跳检索方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220237377A1 (en) * | 2021-01-25 | 2022-07-28 | Nec Laboratories America, Inc. | Graph-based cross-lingual zero-shot transfer |
-
2023
- 2023-09-28 CN CN202311272187.6A patent/CN116992008B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021139283A1 (zh) * | 2020-06-16 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
CN114168719A (zh) * | 2021-06-22 | 2022-03-11 | 北京理工大学 | 一种基于知识图谱嵌入的可解释性多跳问答方法及系统 |
CN115688879A (zh) * | 2022-10-21 | 2023-02-03 | 中电智恒信息科技服务有限公司 | 一种基于知识图谱的智能客服语音处理系统及方法 |
CN115757715A (zh) * | 2022-10-28 | 2023-03-07 | 浙江工业大学 | 一种基于知识图谱表示学习的复杂问题多跳智能问答方法 |
CN115934914A (zh) * | 2022-12-27 | 2023-04-07 | 成都数之联科技股份有限公司 | 基于知识图谱的意图多分类问答方法、装置、设备及介质 |
CN116303961A (zh) * | 2023-03-16 | 2023-06-23 | 齐鲁工业大学(山东省科学院) | 基于多跳组合图指纹网络的知识图谱问答方法及系统 |
CN116662478A (zh) * | 2023-04-10 | 2023-08-29 | 长春理工大学 | 基于知识图谱嵌入与路径信息的多跳检索方法和系统 |
CN116401353A (zh) * | 2023-04-12 | 2023-07-07 | 西安交通大学 | 一种结合内部与外部知识图谱的安全多跳问答方法及系统 |
Non-Patent Citations (3)
Title |
---|
基于BiLSTM-CRF的细粒度知识图谱问答;张楚婷;常亮;王文凯;陈红亮;宾辰忠;;计算机工程(第02期);全文 * |
基于知识图谱的抑郁症自动问答系统研究;田迎;单娅辉;王时绘;;湖北大学学报(自然科学版)(第05期);全文 * |
面向知识图谱的知识推理研究进展;官赛萍;靳小龙;贾岩涛;王元卓;程学旗;;软件学报(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116992008A (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110651280B (zh) | 投影神经网络 | |
CN116992008B (zh) | 知识图谱多跳问答推理方法、装置和计算机设备 | |
Zhuang et al. | Representation learning via dual-autoencoder for recommendation | |
CN113535984B (zh) | 一种基于注意力机制的知识图谱关系预测方法及装置 | |
CN110825884B (zh) | 基于人工智能的嵌入表示处理方法、装置及电子设备 | |
CN106649514A (zh) | 用于受人启发的简单问答(hisqa)的系统和方法 | |
CN107609185B (zh) | 用于poi的相似度计算的方法、装置、设备和计算机可读存储介质 | |
CN110737778A (zh) | 基于知识图谱和Transformer的专利推荐方法 | |
WO2023065211A1 (zh) | 一种信息获取方法以及装置 | |
US11874798B2 (en) | Smart dataset collection system | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN116126341A (zh) | 模型编译方法、装置、计算机设备及计算机可读存储介质 | |
KR20230094955A (ko) | 문서 데이터 검색 기법 | |
Zhao et al. | Multi-task learning with graph attention networks for multi-domain task-oriented dialogue systems | |
CN115935991A (zh) | 多任务模型生成方法、装置、计算机设备和存储介质 | |
CN115062134A (zh) | 知识问答模型训练及知识问答方法、装置和计算机设备 | |
CN115409111A (zh) | 命名实体识别模型的训练方法和命名实体识别方法 | |
KR101467707B1 (ko) | 지식 베이스의 개체 매칭 방법 및 이를 위한 장치 | |
CN112905809B (zh) | 知识图谱学习方法和系统 | |
CN108475346A (zh) | 神经随机访问机器 | |
Zhu | AutoNLU: architecture search for sentence and cross-sentence attention modeling with re-designed search space | |
CN112069404A (zh) | 一种商品信息的展示方法、装置、设备和存储介质 | |
CN116975434A (zh) | 内容推荐方法以及相关设备 | |
CN115952266A (zh) | 问题生成方法、装置、计算机设备和存储介质 | |
CN114168804B (zh) | 一种基于异质子图神经网络的相似信息检索方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |