CN115438164A - 问答方法、系统、设备及存储介质 - Google Patents

问答方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN115438164A
CN115438164A CN202211116993.XA CN202211116993A CN115438164A CN 115438164 A CN115438164 A CN 115438164A CN 202211116993 A CN202211116993 A CN 202211116993A CN 115438164 A CN115438164 A CN 115438164A
Authority
CN
China
Prior art keywords
relation
entity
relationship
entities
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211116993.XA
Other languages
English (en)
Inventor
杨燕
刘珮
钱兵
任思聪
武巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211116993.XA priority Critical patent/CN115438164A/zh
Publication of CN115438164A publication Critical patent/CN115438164A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了问答方法、系统、设备及存储介质,通过从问题的主题实体开始沿着关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分,基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。本实施例提出充分利用关系图的关系信息进行答案实体的多跳推理。其中,关系图不受知识图谱的结构化知识以及文本形式的非结构化知识的差异化限制,从而能够利用多信息来源作为知识增强,以提升对答案实体的预测精度。

Description

问答方法、系统、设备及存储介质
技术领域
本发明涉及计算机技术领域,具体地说,涉及问答方法、系统、设备及存储介质。
背景技术
随着科技的发展,人工智能(Artificial Intelligence,AI)正逐步改变着我们的生活方式,例如智能问答就是其中一种。当客户通过文字或语音在线咨询时,可以由线上的智能客服机器人或线上智能客服应答系统为客户进行智能答复。智能问答可以有效缓解客户服务的等待状况,提升服务质量,因而有着非常广阔的前景。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
针对现有技术中的问题,本发明的目的在于提供三维模型场景构建方法、系统、设备及存储介质,克服了现有技术的困难,能够获得高质量画质的三维模型场景。
本发明的实施例提供一种问答方法,其包括:
接收用户的输入;
响应于用户的输入,获得问题信息并从问题信息中提取主题实体;
获取关系图,关系图是由实体及实体之间的关系构造得到的,从主题实体开始沿着关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分;
基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。
在一些实施例中,从主题实体开始沿着关系图进行多步关系跳转,包括:
在至少一步关系跳转的上一层父节点对应多个实体的情况下,从多个实体中选择实体得分不小于预定义阈值的目标实体,并从目标实体开始进行关系跳转。
在一些实施例中,关系图为非结构化关系图,非结构化关系图是将文本中的实体作为节点且实体之间的关系作为边构造得到的,其中关系是使用自然语言描述表示的。
在一些实施例中,将问题信息与关系进行相似度匹配以得到关系分数,包括:
使用关系编码器对关系获取关系嵌入,并计算关系嵌入与问题信息的元素积以得到问题信息与关系之间的相似度特征;
将相似度特征输入神经网络模型,输出关系得分。
在一些实施例中,关系图为结构化关系图,结构化关系图是将知识图谱中的实体作为节点且实体之间的关系作为边构造得到的,其中关系是使用谓词进行表示。
在一些实施例中,关系具体使用谓词集表示;将问题信息与关系进行相似度匹配以得到关系分数,包括:
计算问题信息与谓词集中各个谓词之间的概率分布;
将概率分布进行加权,以得到关系得分。
在一些实施例中,基于关系分数获得关系所指向子节点的实体得分,包括:
利用注意力模型对关系分数及其父节点所对应实体得分进行相乘,以得到实体得分。
本公开实施例还提供一种问答系统,其包括:
接收模块,接收用户的输入;
提取模块,响应于用户的输入,获得问题信息并从问题信息中提取主题实体;
计算模块,获取关系图,关系图是由实体及实体之间的关系构造得到的,从主题实体开始沿着关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分;
答案响应模块,基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。
本发明的实施例还提供一种电子设备,包括:
处理器;
存储器,其中存储有处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行上述问答方法的步骤。
本发明的实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述问答方法的步骤。
本发明的目的在于提供问答方法、系统、设备及存储介质,通过从问题的主题实体开始沿着关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分,基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。本实施例提出充分利用关系图的关系信息进行答案实体的多跳推理。其中,关系图不受知识图谱的结构化知识以及文本形式的非结构化知识的差异化限制,可以将两者纳入关系图的框架内,从而能够利用多信息来源作为知识增强,以提升对答案实体的预测精度,提升问答效果。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本公开实施例提供的问答方法的流程图;
图2是本公开实施例提供的问答方法在一种场景下的原理示意图;
图3是本公开实施例提供的问答系统的模块结构示意图;
图4是本发明的电子设备运行的示意图;
图5示出了根据本公开实施方式的存储介质的示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使本发明全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件转发模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
此外,附图中所示的流程仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤可以分解,有的步骤可以合并或部分合并,且实际执行的顺序有可能根据实际情况改变。具体描述时使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。需要说明的是,在不冲突的情况下,本发明的实施例及不同实施例中的特征可以相互组合。
在相关技术中,问答模型以知识图谱作为知识来源,模型框架仅适用于结构化知识,现有模型框架不能统一地处理结构化的知识和非结构化的知识来源。而一些新的知识则更多的是非结构化形式的文本资源,这使得基于知识图谱的模型框架不能进行答案实体的精确预测。
本公开实施例提出,在统一框架内既能处理结构化知识,也能处理非结构化的知识,显著提高了答案准确率,更好地满足用户的问答需求。
图1为本公开实施例提供的问答方法的流程图,本方法的执行主体为问答系统,该问答系统可应用于服务器,如云端服务器或本地物理服务器。如图1所示,问答方法包括如下步骤:
步骤110:接收用户的输入;
步骤120:响应于用户的输入,获得问题消息并从问题消息中提取主题实体;
步骤130:获取关系图,关系图是由实体及实体之间的关系构造得到的,从主题实体开始沿着关系图中的关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分;
步骤140:基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。
本实施例提出充分利用关系图的关系信息进行答案实体的多跳推理。其中,关系图不受知识图谱的结构化知识以及文本形式的非结构化知识的差异化限制,可以将两者纳入关系图的框架内,从而能够利用多信息来源作为知识增强,以提升对答案实体的预测精度,提升问答效果。
在本公开实施例中,关系图可以是非结构化关系图,非结构化关系图是将文本中的实体作为节点且实体之间的关系作为边构造得到的,其中关系是使用自然语言描述表示的。
具体来说,可非结构化关系图采用如下方式进行构建:
将文本中的实体作为节点,实体之间的关系作为边。非结构化关系图中的关系用自然语言描述表示。自由文本中的关系可以根据实体对的共现关系从大型文献语料库中轻松提取。具体来说,本实施例通过提取一对实体的共现句并用特殊占位符替换实体,从而构建非结构化关系图。
其中,实体指文本中包含的特定信息,如人物、位置等。共现关系是指一对实体在上下文的至少两个段落或句子中同时出现。
在本公开其他实施例中,关系图也可以是结构化关系图,结构化关系图是将知识图谱中的实体作为节点且实体之间的关系作为边构造得到的,其中关系是使用谓词进行表示。
具体地,将知识图谱中的实体作为节点,实体之间的关系作为边。具体地说,知识图谱中的关系可以视为有约束的标签,它预先定义了一组谓词来表示实体间关系,所以被称为结构化知识图。
因此,在本实施例中,无论是结构化关系图和非结构化关系图,其均可使用上述图1所示的关系跳转的方式进行答案实体预测。
在本公开实施例中,从主题实体开始沿着关系图进行多步关系跳转,具体可以包括:
在至少一步关系跳转的上一层父节点对应多个实体的情况下,从多个实体中选择实体得分不小于预定义阈值的目标实体,并从目标实体开始进行关系跳转。
在这种情况下,从所选择的实体开始构建关系子集,这些关系子集为一条路径的一部分。因此,最后的路径数量可能少于关系图中的路径数量总和,这可以节省后续计算时间,提升答案预测效率。
在本公开实施例中,关系图为非结构化关系图的情况下,对每个关系,将问题信息与关系进行相似度匹配以得到关系分数,包括:
使用关系编码器对关系获取关系嵌入,并计算关系嵌入与问题信息的元素积以得到问题信息与关系之间的相似度特征;
将相似度特征输入神经网络模型,输出关系得分。
由于关系是使用自然语言描述表示,因此关系编码器对该自然语言表示进行编码,得到向量化的关系嵌入,并表征为矩阵形式。对问题信息,也是经编码得到的向量化的问题嵌入,也表征为矩阵形式。进一步地,将关系嵌入与问题嵌入计算元素积,该元素积表征相似度。本实施例基于神经网络模型提升方案可行性。
在本公开实施例中,神经网络可以使用多层感知机(Multilayer Perceptron,缩写MLP),通过MLP将相似度特征从d维映射到1维,最后通过Sigmoid激活函数层得到关系得分。
在本公开实施例中,神经网络还可以使用其他网络,在此不作限定。
在本公开实施例中,在关系图为结构化关系图的情况下,关系具体使用谓词集表示;将问题信息与关系进行相似度匹配以得到关系分数,包括:
计算问题信息与谓词集中各个谓词之间的概率分布;
将概率分布进行加权,以得到关系得分。
由于结构化关系图中的关系使用谓词集表征,因此基于概率分布得到该关系的最终得分。
在本公开实施例中,基于关系分数获得关系所指向子节点的实体得分,具体包括:
利用注意力模型对关系分数及其父节点所对应实体得分进行相乘,以得到实体得分。
在本公开实施例中,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应,包括:
在得到多条路径的情况下,在多条路径中选取排序在的至少一个目标路径,将目标路径的叶子节点作为答案实体并向用户响应。
在本公开实施例中,在只有一条路径的情况下,则以该路径的叶子节点作为答案实体并向用户响应。
本公开实施例提出在统一的框架中计算关系分数。具体地,从问题中的主题实体开始,跳转T步,进行多跳答案的预测。其中,为每个实体维护一个分数,以表示它们的激活概率,主题实体初始化为1,其他实体初始化为0。在每步关系跳转中,为每个关系计算一个分数,以表示它们在当前查询中的激活概率,然后在那些激活的关系之间传递实体分数。
正如上文,对于结构化关系图和非结构化关系图,对应的关系分数计算方法不同。下面详细介绍答案预测方案。
第一步,计算实体得分
将步骤T的实体得分表示为行向量aT∈[0,1]n,其中[0,1]表示0到1之间的实数。0是初始分数,即只有主题实体得到1。在第T步关系跳转,处理问题的一部分,得到查询向量qt∈Rd,其中d为隐藏层维数。
第二步,利用关系分数更新实体得分
通过沿着关系图中路径的关系得分转移实体得分,将实体得分的向量与关系得分矩阵相乘,利用注意力机制,以可微的方式沿着关系跳跃。重复T次后,即可得到每一步的实体得分:a1,a2,...,aT
第三步:计算实体最终得分
计算得到的实体分数a1,a2,...,aT的加权和作为路径得分,并最终输出。并通过自动确定跳数T来回答从1-hop到T-hop的所有问题。
第四步:top1分数实体作为最终答案
将第三步的路径得分按照从高到低的顺序排列,取最高分数的实体作为最终答案返回。
举例说明,如图2所示,输入问题是“what organization did the wife BillGates found?”,具体地,答案预测方法包括如下步骤:
在STEP 0,提取主题实体“Bill Gates”,对应于图中黑色填充块,其实体得分为a0
在STEP1,图中箭头1表征关系1,将关系1与上述问题进行相似度匹配,得到关系得分W1;图中黑色填充块为箭头1指向的子节点所对应实体,实体得分a1=a0*W1
在STEP2,图中箭头2表征关系2,将关系与上述问题进行相似度匹配,得到关系得分W2;图中黑色填充块为箭头2指向的子节点所对应实体,实体得分a2=a1*W2
最终,得到答案为Bill&Melinda Gates Fundation。
由上可知,基于关系图的多跳问题推理。利用知识图谱和文本中的知识,构建由实体及其关系组成的关系图,并基于关系图进行多跳推理,其中间的推理步骤更易于理解。
利用关系信息更新实体,通过沿着多个步骤的关系得分转移实体得分,将实体得分向量与关系得分矩阵相乘,以可微的方式沿着关系跳跃,提高预测答案的准确性,提升用户体验。
图3是本公开提供的问答系统的一种实施例的模块示意图,如图3所示,问答系统300包括但不限于如下模块:
接收模块310,接收用户的输入;
提取模块320,响应于用户的输入,获得问题信息并从问题信息中提取主题实体;
计算模块330,获取关系图,关系图是由实体及实体之间的关系构造得到的,从主题实体开始沿着关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分;
答案响应模块340,基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。
上述模块的实现原理参见图1所示问答方法中的相关介绍,此处不再赘述。
可选地,计算模块330具体用于:
在至少一步关系跳转的上一层父节点对应多个实体的情况下,从多个实体中选择实体得分不小于预定义阈值的目标实体,并从目标实体开始进行关系跳转。
可选地,关系图为非结构化关系图,非结构化关系图是将文本中的实体作为节点且实体之间的关系作为边构造得到的,其中关系是使用自然语言描述表示的。
可选地,计算模块330具体用于:
使用关系编码器对关系获取关系嵌入,并计算关系嵌入与问题信息的元素积以得到问题信息与关系之间的相似度特征;
将相似度特征输入神经网络模型,输出关系得分。
可选地,关系图为结构化关系图,结构化关系图是将知识图谱中的实体作为节点且实体之间的关系作为边构造得到的,其中关系是使用谓词进行表示。
可选地,关系具体使用谓词集表示;计算模块330具体用于:
计算问题信息与谓词集中各个谓词之间的概率分布;
将概率分布进行加权,以得到关系得分。
可选地,计算模块330具体用于:
利用注意力模型对关系分数及其父节点所对应实体得分进行相乘,以得到实体得分。
本实施例提出充分利用关系图的关系信息进行答案实体的多跳推理。其中,关系图不受知识图谱的结构化知识以及文本形式的非结构化知识的差异化限制,可以将两者纳入关系图的框架内,从而能够利用多信息来源作为知识增强,以提升对答案实体的预测精度,提升问答效果。
本发明实施例还提供一种电子设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的问答方法的步骤。
如上所示,本公开实施例的电子设备能够充分利用关系图的关系信息进行答案实体的多跳推理。其中,关系图不受知识图谱的结构化知识以及文本形式的非结构化知识的差异化限制,可以将两者纳入关系图的框架内,从而能够利用多信息来源作为知识增强,以提升对答案实体的预测精度,提升问答效果。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
图4本发明的电子设备的结构示意图。下面参照图4来描述根据本发明的这种实施方式的电子设备400。图4显示的电子设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:至少一个处理单元410、至少一个存储单元420、连接不同平台组件(包括存储单元420和处理单元410)的总线430、显示单元440等。
其中,存储单元存储有程序代码,程序代码可以被处理单元410执行,使得处理单元410执行本说明书问答方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元410可以执行图1所示的步骤。
存储单元420可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)421和/或高速缓存存储单元422,还可以进一步包括只读存储单元(ROM)423。
存储单元420还可以包括具有一组(至少一个)程序模块425的程序/实用工具424,这样的程序模块425包括但不限于:处理系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线430可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备400也可以与一个或多个外部设备40(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口450进行。
并且,电子设备400还可以通过网络适配器460与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器460可以通过总线430与电子设备400的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的问答方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述问答方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图5所示,描述了根据本公开实施方式的用于实现上述方法的程序产品500。根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明处理的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上,本发明的目的在于提供问答方法、系统、设备及存储介质,通过从问题的主题实体开始沿着关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将问题信息与关系进行相似度匹配以得到关系分数,基于关系分数获得关系所指向子节点的实体得分,基于多步关系跳转得到由实体构成的路径,并对路径中的实体得分进行加权计算,得到路径得分,在路径得分满足设定条件的情况下,将路径的叶子节点作为答案实体并向用户响应。
本实施例提出充分利用关系图的关系信息进行答案实体的多跳推理。其中,关系图不受知识图谱的结构化知识以及文本形式的非结构化知识的差异化限制,可以将两者纳入关系图的框架内,从而能够利用多信息来源作为知识增强,以提升对答案实体的预测精度,提升问答效果。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种问答方法,其特征在于,包括:
接收用户的输入;
响应于所述用户的输入,获得问题信息并从所述问题信息中提取主题实体;
获取关系图,所述关系图是由实体及实体之间的关系构造得到的,从所述主题实体开始沿着所述关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将所述问题信息与关系进行相似度匹配以得到关系分数,基于所述关系分数获得所述关系所指向子节点的实体得分;
基于所述多步关系跳转得到由实体构成的路径,并对所述路径中的实体得分进行加权计算,得到路径得分,在所述路径得分满足设定条件的情况下,将所述路径的叶子节点作为答案实体并向所述用户响应。
2.根据权利要求1所述的问答方法,其特征在于,所述从所述主题实体开始沿着所述关系图进行多步关系跳转,包括:
在至少一步关系跳转的上一层父节点对应多个实体的情况下,从多个实体中选择实体得分不小于预定义阈值的目标实体,并从所述目标实体开始进行关系跳转。
3.根据权利要求1所述的问答方法,其特征在于,所述关系图为非结构化关系图,所述非结构化关系图是将文本中的实体作为节点且实体之间的关系作为边构造得到的,其中所述关系是使用自然语言描述表示的。
4.根据权利要求3所述的问答方法,其特征在于,所述将所述问题信息与关系进行相似度匹配以得到关系分数,包括:
使用关系编码器对所述关系获取关系嵌入,并计算所述关系嵌入与问题信息的元素积以得到所述问题信息与关系之间的相似度特征;
将所述相似度特征输入神经网络模型,输出关系得分。
5.根据权利要求1所述的问答方法,其特征在于,所述关系图为结构化关系图,所述结构化关系图是将知识图谱中的实体作为节点且实体之间的关系作为边构造得到的,其中所述关系是使用谓词进行表示。
6.根据权利要求5所述的问答方法,其特征在于,所述关系具体使用谓词集表示;所述将所述问题信息与关系进行相似度匹配以得到关系分数,包括:
计算所述问题信息与谓词集中各个谓词之间的概率分布;
将所述概率分布进行加权,以得到所述关系得分。
7.根据权利要求1所述的问答方法,其特征在于,所述基于所述关系分数获得所述关系所指向子节点的实体得分,包括:
利用注意力模型对所述关系分数及其父节点所对应实体得分进行相乘,以得到实体得分。
8.一种问答系统,其特征在于,包括:
接收模块,接收用户的输入;
提取模块,响应于所述用户的输入,获得问题信息并从所述问题信息中提取主题实体;
计算模块,获取关系图,所述关系图是由实体及实体之间的关系构造得到的,从所述主题实体开始沿着所述关系图进行多步关系跳转,其中,在每一步关系跳转过程中,将所述问题信息与关系进行相似度匹配以得到关系分数,基于所述关系分数获得所述关系所指向子节点的实体得分;
答案响应模块,基于所述多步关系跳转得到由实体构成的路径,并对所述路径中的实体得分进行加权计算,得到路径得分,在所述路径得分满足设定条件的情况下,将所述路径的叶子节点作为答案实体并向所述用户响应。
9.一种电子设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的问答方法的步骤。
10.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至7任一项所述的问答方法的步骤。
CN202211116993.XA 2022-09-14 2022-09-14 问答方法、系统、设备及存储介质 Pending CN115438164A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211116993.XA CN115438164A (zh) 2022-09-14 2022-09-14 问答方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211116993.XA CN115438164A (zh) 2022-09-14 2022-09-14 问答方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115438164A true CN115438164A (zh) 2022-12-06

Family

ID=84247119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211116993.XA Pending CN115438164A (zh) 2022-09-14 2022-09-14 问答方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115438164A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595156A (zh) * 2023-07-17 2023-08-15 北京普华恒信技术服务有限公司 一种知识管理系统及管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595156A (zh) * 2023-07-17 2023-08-15 北京普华恒信技术服务有限公司 一种知识管理系统及管理方法
CN116595156B (zh) * 2023-07-17 2023-12-19 北京普华恒信技术服务有限公司 一种知识管理系统及管理方法

Similar Documents

Publication Publication Date Title
US11544573B2 (en) Projection neural networks
JP2023539532A (ja) テキスト分類モデルのトレーニング方法、テキスト分類方法、装置、機器、記憶媒体及びコンピュータプログラム
CN111737552A (zh) 训练信息抽取模型和获取知识图谱的方法、装置和设备
CN112988979B (zh) 实体识别方法、装置、计算机可读介质及电子设备
US11507828B2 (en) Unsupervised hypernym induction machine learning
CN110402445B (zh) 使用递归神经网络浏览序列数据的方法和系统
CN111915086A (zh) 异常用户预测方法和设备
CN113779225A (zh) 实体链接模型的训练方法、实体链接方法及装置
CN115114407A (zh) 意图识别方法、装置、计算机设备及存储介质
CN115438164A (zh) 问答方法、系统、设备及存储介质
CN110704668A (zh) 基于网格的协同注意力vqa方法和装置
US20240046128A1 (en) Dynamic causal discovery in imitation learning
CN116992151A (zh) 一种基于双塔图卷积神经网络的在线课程推荐方法
CN111507108B (zh) 别名生成方法、装置、电子设备及计算机可读存储介质
CN111090740B (zh) 一种用于对话系统的知识图谱生成方法
CN113569017A (zh) 一种模型处理方法、装置、电子设备及存储介质
CN111723186A (zh) 用于对话系统的基于人工智能的知识图谱生成方法、电子设备
CN116957006A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
US20220284326A1 (en) Using functions to annotate a syntax tree with real data used to generate an answer to a question
CN113704466B (zh) 基于迭代网络的文本多标签分类方法、装置及电子设备
CN112989024B (zh) 文本内容的关系提取方法、装置、设备及存储介质
CN115129930A (zh) 一种视频的信息处理方法、装置、计算机设备和存储介质
CN114493674A (zh) 一种广告点击率预测模型及方法
CN112446738A (zh) 广告数据处理方法、装置、介质以及电子设备
CN113626564B (zh) 一种概念标签生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination