CN113094467A - 一种知识图谱的查询方法、电子设备及存储介质 - Google Patents

一种知识图谱的查询方法、电子设备及存储介质 Download PDF

Info

Publication number
CN113094467A
CN113094467A CN201911336981.6A CN201911336981A CN113094467A CN 113094467 A CN113094467 A CN 113094467A CN 201911336981 A CN201911336981 A CN 201911336981A CN 113094467 A CN113094467 A CN 113094467A
Authority
CN
China
Prior art keywords
sentence
original question
sentences
words
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911336981.6A
Other languages
English (en)
Inventor
朱石争
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201911336981.6A priority Critical patent/CN113094467A/zh
Priority to PCT/CN2020/137306 priority patent/WO2021129515A1/zh
Priority to EP20906427.8A priority patent/EP4083811A4/en
Publication of CN113094467A publication Critical patent/CN113094467A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Abstract

本发明实施例涉及通信领域,公开了一种知识图谱的查询方法、电子设备及存储介质。本发明中,查询方法包括:若在知识图谱中无法直接查询到原始问句的答案,则确定原始问句的实体词;对原始问句进行实体词预处理,根据与经实体词预处理后的原始问句相似度大于预设阈值的预存等价句,确定原始问句的属性词;根据确定的实体词与属性词查询并反馈查询到的原始问句的答案。在无法直接查询到答案时,对原始问句进行实体词预处理,根据和处理后的原始问句相似度大于预设阈值的预存等价句,确定原始问句的属性词,从而将知识图谱中的预存等价句应用于相似语义问句的属性词确定过程中,提高确定出原始问句属性词的概率,进而提高查询到原始问句答案的机率。

Description

一种知识图谱的查询方法、电子设备及存储介质
技术领域
本发明实施例涉及通信领域,特别涉及一种知识图谱的查询方法、电子设备及存储介质。
背景技术
伴随着通信技术的发展,人工智能的发展已经逐渐成熟,智能问答属于较为基础的功能。在基于知识图谱的问答系统中,因知识图谱的构建均是根据相对标准且简短的词语(实体词及属性词)进行构建,且属性词之间也会存在比较相似的情况,如“开通方法”和“开通条件”,而用户的问法中使用的词语则会比较口语化(如针对“开通方法”,用户会问“怎么开通”),若问答系统中缺少大规模语料进行机器学习训练,就会存在基于知识图谱无法检索出答案的情况。现有技术中采用的解决办法是直接基于某一问答对的等价句的句式模板对选定的问答对进行扩展,在对应属性上添加相对口语化的等价句,通过增加问答对中的等价句,提高回答用户问题的成功率。
发明人发现相关技术中至少存在如下问题:由于进行等价句添加时,是根据设定的模板对选定的问答对进行口语化的等价句添加,因此问答过程中成功查询到用户提出的问题的答案的机率依旧较低,答案的准确性也较差。
发明内容
本发明实施方式的目的在于提供一种知识图谱的查询方法、电子设备及存储介质,提高智能问答过程中,查询到用户输入的原始问句的答案的成功率和查询到的答案的准确性。
为解决上述技术问题,本发明的实施方式提供了一种知识图谱的查询方法,包括:在预先建立的知识图谱中查询原始问句的答案;若无法查询到原始问句的答案,则确定原始问句的实体词;对原始问句进行实体词预处理,获取知识图谱中各预存等价句与经实体词预处理后的原始问句的相似度,根据与经实体词预处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词;根据原始问句的实体词及属性词,在知识图谱中查询原始问句的答案,并反馈查询到的答案。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的知识图谱的查询方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,计算机程序被处理器执行时实现上述的知识图谱的查询方法。
本发明实施方式相对于现有技术而言,在进行问答的过程中,在无法直接从知识图谱中查询到原始问句的答案时,确定出原始问句的实体词,对原始问句进行实体词预处理,然后根据与处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词,再根据原始问句的实体词与属性词进行答案的检索和反馈,通过利用知识图谱中的语义关系,将知识图谱中预存的等价句,应用于语义相近的原始问句的属性词确定过程中,从而提高了确定出原始问句的属性词的概率和确定出的属性词的准确性,再根据确定出的实体词及属性词进行原始问句答案的查询反馈,提升原始问句答案查询的成功率和查询到的答案的准确性。
另外,对原始问句进行实体词预处理,获取知识图谱中各预存等价句与经实体词预处理后的原始问句的相似度,根据与经实体词预处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词,包括:根据各预存等价句的实体词确定目标实体词;其中,目标实体词为各预存等价句的实体词中,与原始问句实体词的相似度大于第一预设阈值的实体词;将原始问句的实体词替换为目标实体词,生成原始问句的派生问句;根据派生问句与各预存等价句的相似度,确定目标预存等价句;其中,目标预存等价句为各预存等价句中,与派生问句的相似度大于第二预设阈值的预存等价句;根据目标预存等价句的属性词,确定原始问句的属性词。通过原始问句的实体词和预存等价句实体词的相似度,对原始问句中的实体词进行替换,再根据目标预存等价句的属性词确定原始问句的属性词,从而利用已有预存等价句的属性词确定出原始问句的属性词,提高了确定出原始问句的属性词的概率,进而提高了成功查询出原始问句答案的机率。
另外,根据派生问句与各预存等价句的相似度,确定目标预存等价句,包括:若未检测到与派生问句的相似度大于第二预设阈值的预存等价句,则输出包含目标实体词的所有预存等价句;根据接收到的用户反馈,确定目标预存等价句。通过根据包含目标实体词的预存等价句对用户进行二次问询,根据用户反馈确定目标预存等价句,保证了准确的获取到用户意图;通过二次问询确定用户意图,提高了查询出原始问句答案的机率和查询到答案的准确性。
另外,对原始问句进行实体词预处理,获取知识图谱中各预存等价句与经实体词预处理后的原始问句的相似度,根据与经实体词预处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词,包括:移除原始问句的实体词,生成原始问句的派生问句;移除各预存等价句的实体词,根据派生问句与移除实体词后的各预存等价句的相似度,确定目标预存等价句;其中,目标预存等价句为移除实体词后的各预存等价句中,与派生问句的相似度大于第二预设阈值的预存等价句;根据目标预存等价句的属性词,确定原始问句的属性词。通过移除原始问句和预存等价句的实体词,避免实体词对问句语义相似度的影响,保证了能够准确的确定出派生问句对应的目标等价句;再根据目标等价句的属性词确定原始问句的属性词,提升了确定出原始问句属性词的概率,进而提高了查询出原始问句答案的机率。
另外,在确定目标预存等价句后,还包括:根据目标预存等价句,生成原始问句的等价句,将原始问句的等价句添加进知识图谱。通过将根据目标预存等价句确定原始问句的等价句,实现了将已有预存等价句应用于原始问句等价句的确定过程中,提高了等价句泛化能力,避免了按照固定句式模板进行等价句添加的局限性;将确定的等价句添加进知识图谱中,提高了知识图谱扩充的效率。
另外,确定原始问句的实体词,包括:检测知识图谱的预存实体词中是否存在与原始问句匹配的实体词;其中,预存实体词为各预存等价句的实体词;若预存实体词中存在与原始问句匹配的实体词,则将与原始问句匹配的预存实体词作为原始问句的实体词;若预存实体词中不存在与原始问句匹配的实体词,则输出问询语句,根据接收到的问询反馈对原始问句进行更新,并重新检测预存实体词中是否存在于原始问句匹配的实体词。根据知识图谱中的预存实体词和原始问句的匹配度,确定原始问句的实体词,保证知识图谱中能够查询到原始问句的实体词;无法直接确定实体词时,根据问询反馈更新原始问句并重新检测实体词,尽可能地提高识别出原始问句实体词的概率。
另外,在输出问询语句前,还包括:检测当前输出问询语句的次数是否达到预设门限;若当前输出问询语句的次数尚未达到预设门限,则再执行输出问询语句;若当前输出问询语句的次数达到预设门限,则输出表示未查询到答案的查询结果。通过多次问询,提高确定出原始问句实体词的概率;在问询次数过多时,输出未查询到原始问句答案的结果,避免进行多次无意义的查询,提高反馈效率。
另外,确定目标预存等价句,包括:若检测到多个与派生问句的相似度大于第二预设阈值的预存等价句,则将与派生问句相似度最大的预存等价句作为目标预存等价句。通过选取相似度最高的预存等价句作为目标预存等价句,保证得到的属性词和原始问句的吻合程度。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本发明第一实施方式中的知识图谱的查询方法流程图;
图2是根据本发明第二实施方式中的知识图谱的查询方法流程图;
图3是根据本发明第三实施方式中的电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种知识图谱的查询方法,在本实施方式中,根据预先建立的知识图谱查询原始问句的答案;若无法查询到原始问句的答案,则根据知识图谱确定原始问句的实体词;对原始问句进行实体词预处理,获取知识图谱中的预存等价句与进行实体词预处理后的原始问句的相似度,根据与经实体词预处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词;根据原始问句的实体词及属性词,在知识图谱中查询原始问句的答案,并反馈查询到的答案,在无法直接确定原始问句的答案时,获取原始问句的实体词,对原始问句进行实体词预处理,并根据和处理后的原始问句的相似度大于预设阈值的预存等价句确定原始问句的属性词,从而通过语义关系将预存等价句应用于语义相近的原始问句的属性词的确定过程中,从而提高了确定出原始问句属性词的概率和准确性,进而提高了根据实体词和属性词进行原始问句答案查询和反馈时查询到答案的概率,保证了查询到的答案的准确性。
下面对本实施方式的知识图谱的查询方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非本实施方案的必须。
本实施方式中的一种知识图谱的查询方法的具体流程如图1所示,具体包括以下步骤:
步骤101,获取原始问句。
具体地说,在进行智能问答的时候,终端通过语音识别或者文字识别的方式,对用户输入的信息进行解析,确定出用户输入的原始问句。
步骤102,检测能否查询到原始问句的答案,若能查询到原始问句的答案,则进入步骤106,若不能查询到原始问句的答案,则进入步骤103。
具体地说,在获取到用户的原始问句后,终端在预先建立的知识图谱中查询原始问句的答案,尝试获取原始问句答案,若能同时获取到原始问句唯一的实体词和属性词,则判定能够查询到原始问句的答案,其中,原始问句的实体词为原始问句中包含的实体对象,原始问句的属性词为原始问句中针对自身包含的实体对象的具体意图,例如,用户输入的原始问句为“笔记本电脑如何清灰?”,则原始问句的实体词为原始问句中包含的实体对象“笔记本电脑”;原始问句的属性词为,原始问句针对自身包含的实体对象“笔记本电脑”的具体意图“清灰方法”。根据获取到的原始问句的实体词及属性词查询原始问句的答案,并进入步骤106,进行答案的反馈;若无法同时获取到原始问句唯一的实体词及属性词,则判定无法查询到原始问句的答案,进入步骤103。
步骤103,确定原始问句的实体词。
具体地说,在无法直接查询到原始问句的答案时,根据知识图谱中各预存等价句的实体词,对原始问句进行实体词的确定,检测原始问句中是否包含知识图谱中预存的实体词,将原始问句中包含的知识图谱预存实体词作为原始问句的实体词。
在一个例子中,根据知识图谱中预存的实体词确定原始问句的实体词时,检测知识图谱的预存实体词中是否存在与原始问句匹配的实体词;其中,预存实体词为各预存等价句的实体词;若预存实体词中存在与原始问句匹配的实体词,则将与原始问句匹配的预存实体词作为原始问句的实体词;若预存实体词中不存在与原始问句匹配的实体词,则输出问询语句,根据接收到的问询反馈对原始问句进行更新,并重新检测预存实体词中是否存在于原始问句匹配的实体词。
例如,终端获取到的原始问句为“怎么绑定支付宝”,根据知识图谱中预存实体词对原始问句进行匹配时,未查询到与原始问句相匹配的实体词,即,无法获取到原始问句中需要进行网银开通的对象具体是什么,则在交互界面向用户输出问询语句,提示用户重新输入问句或者对原始问句进行补充,获取用户重新输入的问句或者对原始问句的补充信息,在对终端中的原始问句进行更新后,重新进行实体词的匹配和确定,例如,用户对原始问句进行了补充,根据用户的补充信息,原始问句变更为“银行卡怎么绑定支付宝”,则重新检测知识图谱预存实体词中是否有与原始问句匹配的实体词,检测到原始问句中的“银行卡”在知识图谱的预存实体词中,则将“银行卡”作为原始问句“银行卡怎么绑定支付宝”的实体词。
步骤104,确定原始问句的属性词。
具体地说,在确定原始问句的实体词后,根据原始问句的实体词,对原始问句进行实体词预处理,获取知识图谱中的预存等价句与进行实体词预处理后的原始问句的相似度,根据与经实体词预处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词。
在一个例子中,确定出原始问句的实体词后,根据各预存等价句的实体词确定目标实体词;其中,目标实体词为各预存等价句的实体词中,与原始问句实体词的相似度大于第一预设阈值的实体词;将原始问句的实体词替换为目标实体词,生成原始问句的派生问句;根据派生问句与各预存等价句的相似度,确定目标预存等价句;其中,目标预存等价句为各预存等价句中,与派生问句的相似度大于第二预设阈值的预存等价句;根据目标预存等价句的属性词,确定原始问句的属性词。
例如,用户输入的原始问句为“新买的奔驰有故障,该怎么维权?”通过对知识图谱中预存实体词和原始问句的匹配程度,确定出原始问句的实体词为“奔驰”,然后根据语义相似度算法对原始问句的实体词和预存实体词之间进行相似度计算,得到和原始问句实体词的语义相似度大于85%的预存实体词为“奔驰汽车”,则将“奔驰汽车”作为目标实体词,原始问句中的实体词替换为目标实体词,生成原始问句的派生问句“新买的奔驰汽车有故障,该怎么维权?”再对派生问句和知识图谱中预存的问句进行语义相似度计算,得到在已有实体属性对“长安汽车——维权渠道”上的等价句“刚购买的长安汽车有问题,该如何维权”和派生问句相似度大于75%,则将目标预存等价句的属性词“维权渠道”作为原始问句的属性词。
在实际应用中,可以根据实际情况对第一预设阈值和第二预设阈值的具体值进行设置,本实施方式对预设阈值的设置不做限制。
在另一个例子中,在根据派生问句与各预存等价句的相似度,确定目标预存等价句时,若未检测到与派生问句的相似度大于第二预设阈值的预存等价句,则输出包含目标实体词的所有预存等价句;根据接收到的用户反馈,确定目标预存等价句。
例如,用户输入的原始问句为“新买的奔驰有故障,该怎么维权?”通过与知识图谱中预存实体词的匹配,确定出目标实体词为“奔驰汽车”,替换实体词后,未检测到有预存等价句和派生问句的语义相似度大于75%,此时,检测到包含目标实体词“奔驰汽车”预存等价句的有“刚买的奔驰汽车有问题,该如何维权”及“新买的奔驰汽车有问题,维权的渠道有哪些”,则根据这两个预存等价句的属性词,向用户输出问询语句,由用户选择具体想要了解的是哪个预存等价句对应的内容,若用户选择了解奔驰汽车的维权渠道,则将“新买的奔驰汽车有问题,维权的渠道有哪些”作为目标预存等价句,将目标预存等价句的属性词“维权渠道”作为原始问句的属性词。
步骤105,根据原始问句的实体词与属性词查询原始问句的答案。
具体地说,终端在获取到用户输入的原始问句的实体词和属性词后,根据原始问句的实体词与属性词在知识图谱中对原始问句的答案进行查询。
步骤106,反馈查询到的答案。
具体地说,终端根据检索到的原始问句的答案,通过交互界面,通过语音播报、视频播放、文字显示等方式向用户反馈查询到的原始问句的答案。
由此,本实施方式提供了一种知识图谱的查询方法,在无法直接查询到原始问句的答案时,根据知识图谱中预存等价句的实体词和原始问句的匹配程度确定原始问句的实体词,然后再对原始问句进行实体词预处理,根据和处理后原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词,再根据原始问句的实体词与属性词进行答案的查询和反馈,通过目标预存等价句确定出原始问句的属性词,使得能够根据已有等价句确定原始问句的实体词及属性词,提高了确定出原始问句的实体词与属性词的概率,进而提高了查询到原始问句的答案的机率。
本发明的第二实施方式涉及一种知识图谱的查询方法,本实施方式与第一实施方式大致相同,在本实施方式中,确定原始问句实体词的过程中,若多次问询都无法确定出原始问句的实体词,则直接反馈无法查询到答案,避免多次无意义的问询,提高查询效率;确定原始问句的属性词时,先移除预存等价句和原始问句的实体词,再根据移除实体词后的问句之间的相似度确定目标问句,从而避免实体词对确定问句之间相似度的影响,然后根据目标问句的属性词确定原始问句的属性词,再进行根据原始问句的属性词和实体词进行答案的查询和反馈,从而将所有预存等价句都应用到原始问句实体词和属性词的确定过程中;在确定目标预存等价句后,根据目标预存等价句生成原始问句的等价句,从而提高了知识图谱的等价句泛化能力,避免了根据固定句式进行等价句泛化时的局限性;将确定的原始问句的等价句添加进知识图谱中,从而自动、高效的对知识图谱进行扩充。
本实施方式中的一种知识图谱的查询方法的具体流程如图2所示,具体包括以下步骤:
步骤201,获取原始问句。
步骤202,检测能否查询到原始问句的答案,若能查询到原始问句的答案,则进入步骤207,若不能查询到原始问句的答案,则进入步骤203。
本实施方式的步骤201、步骤202和第一实施方式中的步骤101、步骤102相似,在此就不再赘述。
步骤203,检测能否确定原始问句的实体词,若能够确定原始问句的实体词,则进入步骤204,若不能确定原始问句的实体词,则进入步骤207。
具体地说,在无法直接查询到原始问句的答案时,终端根据知识图谱中预存等价句的实体词对原始问句进行匹配,尝试确定原始问句的实体词,在无法直接确定出原始问句实体词的时候,在交互界面向用户进行问询,并根据问询得到的反馈,对原始问句进行更新,并重新检测更新后的原始问句的实体词,在对用户进行问询前,检测当前输出问询语句的次数是否达到预设门限;若当前输出问询语句的次数尚未达到预设门限,则再执行输出问询语句,直到确定出原始问句的实体词,然后进入步骤204;若当前输出问询语句的次数达到预设门限,则进入步骤207,输出表示未查询到答案的查询结果。
在实际应用中,可以根据实际情况和需要对问询次数的预设门限的值进行设置,本实施方式对预设门限的设置不做限制。
步骤204,确定原始问句的属性词。
具体地说,在确定出原始问句的实体词后,根据原始问句的实体词,对原始问句进行实体词预处理,获取知识图谱中的预存等价句与进行实体词预处理后的原始问句的相似度,根据与经实体词预处理后的原始问句的相似度大于预设阈值的预存等价句,确定原始问句的属性词。
在一个例子中,确定原始问句的实体词后,移除原始问句的实体词,生成原始问句的派生问句;移除各预存等价句的实体词,根据派生问句与移除实体词后的各预存等价句的相似度,确定目标预存等价句;其中,目标预存等价句为移除实体词后的各预存等价句中,与派生问句的相似度大于第二预设阈值的预存等价句;根据目标预存等价句的属性词,确定原始问句的属性词。
例如,用户输入的原始问句为“iptv已完成申请,自己如何开通?”,终端基于知识图谱预存等价句的实体词对原始问句进行解析后,获取到原始问句的实体词为“iptv”,则终端将原始问句中的实体词移除,得到原始问句的派生问句“已完成申请,自己如何开通?”,然后移除知识图谱中所有预存等价句的实体词,通过语义相似度算法计算派生问句和移除实体词后的各预存等价句的语义相似度,检测是否有与派生问句相似度大于70%的目标预存等价句。在进行相似度计算后,得到实体属性对“固化——开通方法”上的预存等价句“固化申请已经完成,自己怎么开通?”在移除实体词后和派生问句的相似度大于70%,则将“固化申请已经完成,自己怎么开通”作为目标预存等价句,然后将目标预存等价句中的属性词“开通方法”作为原始问句的属性词。
在实际应用中,可以根据实际情况对第二预设阈值进行设置,本实施方式对第二预设阈值的具体取值不做限制。
在另一个例子中,根据原始问句实体词对原始问句进行实体词预处理后,检测是否存在与经实体词预处理后的原始问句相似度大于第二预设阈值的预存等价句,若检测到多个与派生问句相似度大于第二预设阈值的预存等价句,则将与派生问句相似度最大的预存等价句作为目标预存等价句。例如,原始问句为“iptv已完成申请,自己如何开通?”,检测到与原始问句的派生问句相似度大于70%的预存等价句有两个,预存等价句1“固化申请已经完成,自己怎么开通?”移除实体词后与派生问句的相似度为85%,预存等价句2“银行卡申请已经完成,信用卡开通条件是什么?”移除实体词后与派生问句的相似度为78%,则选择预存等价句1作为目标预存等价句,并将目标预存等价句的属性词“开通方法”作为原始问句的属性词。
步骤205,将原始问句的等价句添加进知识图谱。
具体地说,在确定目标预存问句后,根据目标预存等价句,生成原始问句的等价句,将原始问句的等价句添加进知识图谱。
在一个例子中,确定目标预存问句后,结合原始问句的实体词对目标预存等价句进行泛化,确定出原始问句的等价句,然后根据原始问句的等价句中的的实体词和属性词,确定等价句所对应的实体属性对,将获取到的等价句添加到该实体属性的等价句存储区间中,对知识图谱中的预存等价句进行自动扩充,并在知识图谱中保存等价句和等价句所属实体属性对的映射关系,便于后续对存储的等价句的调用。
例如,用户输入的原始问句为“新买的奔驰汽车有故障,该怎么维权?”通过与知识图谱中预存实体词的匹配,确定出实体词为“奔驰汽车”,根据移除实体词后问句的相似度,获取到的目标预存等价句为“刚购买的长安汽车有问题,该如何维权”,结合原始问句的实体词“奔驰汽车”对目标预存等价句进行泛化,得到原始问句的等价句“刚购买的奔驰汽车有问题,该如何维权”,然后根据等价句的包含的实体词“奔驰汽车”和属性词“维权流程”,确定原始问句等价句所属的实体属性对为“奔驰汽车——维权流程”,将原始问句的等价句存储到对应的存储区间中,并保存等价句和实体属性对的映射关系。
步骤206,根据原始问句的实体词与属性词查询原始问句的答案。
具体地说,终端在获取到用户输入的原始问句的实体词与属性词后,根据原始问句的实体词与属性词在知识图谱中对原始问句的答案进行检索,确定原始问句的答案。
步骤207,反馈查询结果。
具体地说,终端在对原始问句的答案进行检索后,若无法根据原始问句实体词与属性词检索到原始问句的答案或者无法获取到原始问句的实体词、属性词时,输出无法查询到原始问句的答案;若能够直接查询到原始问句的答案或者根据实体词与属性词查询到原始问句的答案,则输出查询到的原始问句的答案。
由此,本实施方式提供了一种知识图谱的查询方法,在进行原始问句答案的查询时,无法直接查询到答案,则确定原始问句的实体词,移除预存等价句和原始问句的实体词,根据处理后的问句之间的相似度确定出目标预存等价句,进而确定出原始问句的属性词,根据原始问句的实体词与属性词进行答案的查询;根据目标预存等价句与原始问句的实体词生成原始问句的等价句,并将原始问句的等价句添加进知识图谱。通过移除实体词后问句之间的相似度确定出目标预存等价句,并根据目标预存等价句的属性词确定原始问句的属性词,实现了将知识图谱中已有等价句应用在原始问句的属性词的确定过程中,提高了确定出原始问句属性词的概率;在确定出目标预存等价句后,根据目标预存问句生成原始问句的等价句,并自动将原始问句的等价句添加进知识图谱中,提高了知识图谱等价句的泛化能力和知识图谱扩充的效率;在多个满足相似度要求的等价句中选取相似度最高的等价句,保证了确定的属性词和原始问句的吻合程度,进而提高了查询到原始问句的答案的机率及查询到的答案的准确性。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种电子设备,如图3所示,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的知识图谱的查询方法。
其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
本发明第四实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种知识图谱的查询方法,其特征在于,包括:
在预先建立的知识图谱中查询原始问句的答案;
若无法查询到所述原始问句的答案,则确定所述原始问句的实体词;
对所述原始问句进行实体词预处理,获取所述知识图谱中各预存等价句与经所述实体词预处理后的所述原始问句的相似度,根据与经所述实体词预处理后的所述原始问句的相似度大于预设阈值的预存等价句,确定所述原始问句的属性词;
根据所述原始问句的实体词及属性词,在所述知识图谱中查询所述原始问句的答案,并反馈查询到的答案。
2.根据权利要求1所述的知识图谱的查询方法,其特征在于,所述对所述原始问句进行实体词预处理,获取所述知识图谱中各预存等价句与经所述实体词预处理后的所述原始问句的相似度,根据与经所述实体词预处理后的所述原始问句的相似度大于预设阈值的预存等价句,确定所述原始问句的属性词,包括:
根据各所述预存等价句的实体词确定目标实体词;其中,所述目标实体词为各所述预存等价句的实体词中,与所述原始问句的实体词的相似度大于第一预设阈值的实体词;
将所述原始问句的实体词替换为所述目标实体词,生成所述原始问句的派生问句;
根据所述派生问句与各所述预存等价句的相似度,确定目标预存等价句;其中,所述目标预存等价句为各所述预存等价句中,与所述派生问句的相似度大于第二预设阈值的预存等价句;
根据所述目标预存等价句的属性词,确定所述原始问句的属性词。
3.根据权利要求2所述的知识图谱的查询方法,其特征在于,所述根据所述派生问句与各所述预存等价句的相似度,确定目标预存等价句,包括:
若未检测到与所述派生问句的相似度大于所述第二预设阈值的所述预存等价句,则输出包含所述目标实体词的所有所述预存等价句;
根据接收到的用户反馈,确定所述目标预存等价句。
4.根据权利要求1所述的知识图谱的查询方法,其特征在于,所述对所述原始问句进行实体词预处理,获取所述知识图谱中各预存等价句与经所述实体词预处理后的所述原始问句的相似度,根据与经所述实体词预处理后的所述原始问句的相似度大于预设阈值的预存等价句,确定所述原始问句的属性词,包括:
移除所述原始问句的实体词,生成所述原始问句的派生问句;
移除各所述预存等价句的实体词,根据所述派生问句与移除实体词后的各所述预存等价句的相似度,确定目标预存等价句;其中,所述目标预存等价句为移除实体词后的各所述预存等价句中,与所述派生问句的相似度大于第二预设阈值的预存等价句;
根据所述目标预存等价句的属性词,确定所述原始问句的属性词。
5.根据权利要求2至4中任一项所述的知识图谱的查询方法,其特征在于,在所述确定目标预存等价句后,还包括:
根据所述目标预存等价句,生成所述原始问句的等价句;
将所述原始问句的等价句添加进所述知识图谱。
6.根据权利要求1所述的知识图谱的查询方法,其特征在于,所述确定所述原始问句的实体词,包括:
检测所述知识图谱的预存实体词中是否存在与所述原始问句匹配的实体词;其中,所述预存实体词为各所述预存等价句的实体词;
若所述预存实体词中存在与所述原始问句匹配的实体词,则将与所述原始问句匹配的所述预存实体词作为所述原始问句的实体词;
若所述预存实体词中不存在与所述原始问句匹配的实体词,则输出问询语句,根据接收到的问询反馈对所述原始问句进行更新,并重新检测所述预存实体词中是否存在于所述原始问句匹配的实体词。
7.根据权利要求6所述的知识图谱的查询方法,其特征在于,在所述输出问询语句前,还包括:
检测当前输出所述问询语句的次数是否达到预设门限;
若当前输出所述问询语句的次数尚未达到所述预设门限,则再执行所述输出问询语句;
若当前输出所述问询语句的次数达到所述预设门限,则输出表示未查询到答案的查询结果。
8.根据权利要求2至4中任一项所述的知识图谱的查询方法,其特征在于,所述确定目标预存等价句,包括:
若检测到多个与所述派生问句的相似度大于所述第二预设阈值的所述预存等价句,则将与所述派生问句相似度最大的预存等价句作为所述目标预存等价句。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一项所述的知识图谱的查询方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的知识图谱的查询方法。
CN201911336981.6A 2019-12-23 2019-12-23 一种知识图谱的查询方法、电子设备及存储介质 Pending CN113094467A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201911336981.6A CN113094467A (zh) 2019-12-23 2019-12-23 一种知识图谱的查询方法、电子设备及存储介质
PCT/CN2020/137306 WO2021129515A1 (zh) 2019-12-23 2020-12-17 一种知识图谱的查询方法、电子设备及存储介质
EP20906427.8A EP4083811A4 (en) 2019-12-23 2020-12-17 KNOWLEDGE GRAPH QUERY METHOD, ELECTRONIC DEVICE AND STORAGE MEDIUM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911336981.6A CN113094467A (zh) 2019-12-23 2019-12-23 一种知识图谱的查询方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113094467A true CN113094467A (zh) 2021-07-09

Family

ID=76573661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911336981.6A Pending CN113094467A (zh) 2019-12-23 2019-12-23 一种知识图谱的查询方法、电子设备及存储介质

Country Status (3)

Country Link
EP (1) EP4083811A4 (zh)
CN (1) CN113094467A (zh)
WO (1) WO2021129515A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905497A (zh) * 2022-12-23 2023-04-04 北京百度网讯科技有限公司 确定答复语句的方法、装置、电子设备和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100532B (zh) * 2022-08-02 2023-04-07 北京卫星信息工程研究所 小样本遥感图像目标检测方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156788A1 (en) * 2001-04-20 2002-10-24 Jia-Sheng Heh Method of constructing, editing, indexing, and matching up with information on the interner for a knowledge map
US10565508B2 (en) * 2014-12-12 2020-02-18 International Business Machines Corporation Inferred facts discovered through knowledge graph derived contextual overlays
CN104881446A (zh) * 2015-05-14 2015-09-02 百度在线网络技术(北京)有限公司 搜索方法及装置
CN105069086B (zh) * 2015-07-31 2017-07-11 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN107944025A (zh) * 2017-12-12 2018-04-20 北京百度网讯科技有限公司 信息推送方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905497A (zh) * 2022-12-23 2023-04-04 北京百度网讯科技有限公司 确定答复语句的方法、装置、电子设备和存储介质
CN115905497B (zh) * 2022-12-23 2024-03-19 北京百度网讯科技有限公司 确定答复语句的方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
EP4083811A1 (en) 2022-11-02
EP4083811A4 (en) 2024-01-10
WO2021129515A1 (zh) 2021-07-01

Similar Documents

Publication Publication Date Title
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN109086199B (zh) 一种自动化生成测试脚本的方法、终端和可存储介质
US10394956B2 (en) Methods, devices, and systems for constructing intelligent knowledge base
CN106649825B (zh) 语音交互系统及其创建方法和装置
CN105608218A (zh) 智能问答知识库的建立方法、建立装置及建立系统
CN105678324A (zh) 基于相似度计算的问答知识库的建立方法、装置及系统
CN113094467A (zh) 一种知识图谱的查询方法、电子设备及存储介质
CN111161726B (zh) 一种智能语音交互方法、设备、介质及系统
CN114970560A (zh) 对话意图识别方法、装置、存储介质和智能设备
CN111553138B (zh) 用于规范内容结构文档的辅助写作方法及装置
CN105808688A (zh) 基于人工智能的补全检索方法及装置
KR20210141123A (ko) 인공지능의 부분 학습 방법 및 이를 위한 장치
US11853297B2 (en) Methods and apparatus for retrieving information via an intermediate representation
CN107315739A (zh) 一种语义分析方法
CN111680514B (zh) 信息处理和模型训练方法、装置、设备及存储介质
CN112417846A (zh) 文本自动化生成方法、装置、电子设备及存储介质
CN110347807B (zh) 问题信息处理方法及装置
CN109447240B (zh) 图形图像复制模型的训练方法、存储介质及计算设备
CN112445902A (zh) 一种多轮对话中用户意图的识别方法及相关设备
CN116304078A (zh) 法律案件的适用法条推荐方法及装置
US20220262353A1 (en) Method and device for Processing Voice Information, Storage Medium and Electronic Apparatus
CN111930884A (zh) 一种确定回复语句的方法、设备和人机对话系统
CN112417115B (zh) 基于网络的对话状态优化方法、装置、服务器及存储介质
CN112201250B (zh) 一种语义分析方法、装置、电子设备及存储介质
CN113342956B (zh) 一种用于多轮对话中相同槽值填充的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination