WO2021121020A1 - 问答方法、装置及设备 - Google Patents

问答方法、装置及设备 Download PDF

Info

Publication number
WO2021121020A1
WO2021121020A1 PCT/CN2020/132899 CN2020132899W WO2021121020A1 WO 2021121020 A1 WO2021121020 A1 WO 2021121020A1 CN 2020132899 W CN2020132899 W CN 2020132899W WO 2021121020 A1 WO2021121020 A1 WO 2021121020A1
Authority
WO
WIPO (PCT)
Prior art keywords
question
entity
target
answer
knowledge graph
Prior art date
Application number
PCT/CN2020/132899
Other languages
English (en)
French (fr)
Inventor
王喆锋
陈珊珊
卢栋才
袁晶
怀宝兴
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2021121020A1 publication Critical patent/WO2021121020A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Definitions

  • the method further includes: if the number of the target entity is one, according to the target entity The associated question and answer pair obtains the answer to the target question.
  • multiple target entities may not have a common upper-level entity.
  • the candidate path corresponding to each target entity does not include the same superior entity.
  • rhetorical questions can be generated separately for multiple candidate paths.
  • the rhetorical questions may also be conducted according to a certain order, so that every time the rhetorical question provided to the user is a rhetorical question that the user answers yes with a high probability.
  • the processing priority of multiple candidate paths is obtained, the processing priority of one candidate path and the target entity and target in the candidate path
  • the similarity between the questions is positively correlated. That is, the higher the similarity between the target entity and the target problem in a candidate path, the higher the processing priority of the candidate path.
  • a rhetorical question for further clarifying the user's intention is generated according to the superior entity of the target entity in the candidate path, and the rhetorical question is provided to the user.
  • the processing unit 902 is specifically configured to: if the number of question and answer pairs associated with an entity is one, determine the similarity between the question and answer pairs associated with the entity and the target question, Determine the degree of similarity between the entity and the target question; if the number of question and answer pairs associated with an entity is multiple, the degree of similarity between the multiple question answer pairs associated with the entity and the target question The highest similarity is determined in, and the highest similarity is determined as the similarity between the entity and the target problem.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种问答方法、装置及设备,该方法包括:获取用户输入的目标问题(S301),根据知识库中的存储内容,获取目标问题对应的应答,其中,知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系(S302)。该方法能够提高向用户返回的应答的准确度。

Description

问答方法、装置及设备
本申请要求于2019年12月18日提交中国专利局、申请号为201911311066.1、申请名称为“问答方法、装置及设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种问答方法、装置及设备。
背景技术
问答系统已经得到了广泛的应用,很多智能客服系统都采用了问答机器人。示例性的,用户可以向问答机器人提出问题,问答机器人根据用户的问题,向用户返回合适的答案。
基于检索的问答方法中,需要将预先写好的问题-答案对(简称问答对,QA对)存储到知识库中。在接收到用户输入的问题时,计算用户的问题与知识库中的问题的相似度,并返回相似度最高的问题对应的答案。
然而,当用户输入的问题较为模糊时,上述检索过程可能无法确定出最合适的答案。
发明内容
本申请提供一种问答方法、装置及设备,能够提高向用户返回的应答的准确度。
第一方面,本申请提供一种问答方法,包括:获取用户输入的目标问题;根据知识库中的存储内容,获取所述目标问题对应的应答;其中,所述知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,每个所述问答对包括已知问题和所述已知问题对应的答案。
该方案中,由于在获取目标问题对应的应答时,利用了知识库中存储的内容:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,这样,当用户提出的目标问题较为模糊时,例如,用户的目标问题与多个问答对中的已知问题的相似度均较高,则可以根据该多个问答对所关联的实体之间的关联关系,确定出目标问题对应的应答,从而提高了向用户返回的应答的准确度。
结合第一方面,在一种可能的实现方式中,所述根据知识库中的存储内容,获取所述目标问题对应的应答,包括:根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答。
结合第一方面,在一种可能的实现方式中,所述根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答,包括:针对所述知识图谱中的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与所述目标问题之间的相似 度;在所述知识图谱中确定出目标实体,所述目标实体与所述目标问题之间的相似度大于或者等于预设阈值;若所述目标实体的数量为多个,则在所述知识图谱中确定出每个目标实体各自对应的候选路径,根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答;其中,一个目标实体对应的候选路径为从所述知识图谱中的上级实体出发到达该目标实体的路径。
该实现方式中,当确定出的目标实体的数量有多个时,说明用户的目标问题的语义较为模糊。该情况下,可以根据各目标实体对应的候选路径确定出目标问题的应答。该情况下确定出的目标问题的应答,其实是用于进一步明确用户意图的反问问题,而不是针对该目标问题的具体答案。通过反问问题使得用户与问答设备进行多轮的交互,引导用户准确表达自己的问题,从而保证为用户提供最合适的答案。
结合第一方面,在一种可能的实现方式中,所述在所述知识图谱中确定出目标实体之后,所述方法还包括:若所述目标实体的数量为一个,则根据所述目标实体关联的问答对,获取所述目标问题的应答。
该实现方式中,当确定出的目标实体的数量为一个时,说明用户的目标问题的语义较为清楚。该情况下,直接根据目标实体关联的问答对,即可确定出目标问题的应答。示例性的,若该目标实体仅关联了一个问答对,则直接将该问答对中的答案作为目标问题的应答。若该目标实体关联了多个问答对,则将该多个问答对中与目标问题的相似度最高的问答对中的答案作为目标问题的应答。
结合第一方面,在一种可能的实现方式中,所述根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答,包括:若确定出的多条候选路径中包括相同的上级实体,则根据各所述候选路径中的中间实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户;其中,所述中间实体位于所述候选路径中所述上级实体和所述目标实体之间。
结合第一方面,在一种可能的实现方式中,所述根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答,包括:若确定出的多条候选路径中不包括相同的上级实体,则根据所述多条候选路径中的至少一条候选路径中的所述目标实体的上级实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户。
上述两种实现方式中,在用户提出的目标问题较为模糊的情况下,利用知识图谱指示的不同问答对之间的关联关系,生成用于明确用户意图的反问问题,通过多轮问答交互过程,澄清用户意图,从而向用户返回最合适的答案。
结合第一方面,在一种可能的实现方式中,所述根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与所述目标问题之间的相似度,包括:若一个实体关联的问答对的数量为一个,则将该实体所关联的问答对与所述目标问题之间的相似度,确定为该实体与所述目标问题之间的相似度;若一个实体关联的问答对的数量为多个,则从该实体所关联的多个问答对分别与所述目标问题之间的相似度中确定出最高相似度,将该最高相似度确定为该实体与所述目标问题之间的相似度。
第二方面,本申请提供一种问答装置,包括:通信单元、处理单元和知识库;其中,所述通信单元,用于获取用户输入的目标问题;所述处理单元,用于根据知识库中的存储 内容,获取所述目标问题对应的应答;其中,所述知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,每个所述问答对包括已知问题和所述已知问题对应的答案。
结合第二方面,在一种可能的实现方式中,所述处理单元具体用于:根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答。
结合第二方面,在一种可能的实现方式中,所述处理单元具体用于:针对所述知识图谱中的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与所述目标问题之间的相似度;在所述知识图谱中确定出目标实体,所述目标实体与所述目标问题之间的相似度大于或者等于预设阈值;若所述目标实体的数量为多个,则在所述知识图谱中确定出每个目标实体各自对应的候选路径,根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答;其中,一个目标实体对应的候选路径为从所述知识图谱中的上级实体出发到达该目标实体的路径。
结合第二方面,在一种可能的实现方式中,所述处理单元还具体用于:若所述目标实体的数量为一个,则根据所述目标实体关联的问答对,获取所述目标问题的应答。
结合第二方面,在一种可能的实现方式中,所述处理单元具体用于:若确定出的多条候选路径中包括相同的上级实体,则根据各所述候选路径中的中间实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户;其中,所述中间实体位于所述候选路径中所述上级实体和所述目标实体之间。
结合第二方面,在一种可能的实现方式中,所述处理单元具体用于:若确定出的多条候选路径中不包括相同的上级实体,则根据所述多条候选路径中的至少一条候选路径中的所述目标实体的上级实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户。
结合第二方面,在一种可能的实现方式中,所述处理单元具体用于:若一个实体关联的问答对的数量为一个,则将该实体所关联的问答对与所述目标问题之间的相似度,确定为该实体与所述目标问题之间的相似度;若一个实体关联的问答对的数量为多个,则从该实体所关联的多个问答对分别与所述目标问题之间的相似度中确定出最高相似度,将该最高相似度确定为该实体与所述目标问题之间的相似度。
第三方面,本申请提供一种问答设备,包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得所述处理器运行所述计算机程序执行如第一方面任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现如第一方面任一项所述的方法。
第五方面,本申请提供一种芯片或者芯片系统,该芯片或者芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以进行第一方面任一项方法。
其中,芯片中的通信接口可以为输入/输出接口、管脚或电路等。
在一种可能的实现中,本申请中上述描述的芯片或者芯片系统还包括至少一个存储器,该至少一个存储器中存储有指令。该存储器可以为芯片内部的存储单元,例如,寄存器、 缓存等,也可以是该芯片的存储单元(例如,只读存储器、随机存取存储器等)。
第六方面,本申请提供一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述第一方面任一项所述的方法。
本申请提供的问答方法、装置及设备,该方法包括:获取用户输入的目标问题,根据知识库中的存储内容,获取目标问题对应的应答,其中,知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系;这样,当用户提出的目标问题较为模糊时,例如,用户的目标问题与多个问答对中的已知问题的相似度均较高,则可以根据该多个问答对所关联的实体之间的关联关系,确定出目标问题对应的应答,从而提高了向用户返回的应答的准确度。
附图说明
图1为本申请实施例的一种可能的应用场景示意图;
图2为本申请实施例的问答过程的原理示意图;
图3为本申请一个实施例提供的问答方法的流程示意图;
图4为本申请实施例中知识库中的存储内容的示意图;
图5为本申请实施例提供的一个知识图谱的示意图;
图6为本申请实施例提供的另一个知识图谱的示意图;
图7为本申请另一个实施例提供的问答方法的流程示意图;
图8为本申请又一个实施例提供的问答方法的示意图;
图9为本申请一个实施例提供的问答装置的结构示意图;
图10为本申请一个实施例提供的问答设备的结构示意图。
具体实施方式
下面结合附图,对本申请的技术方案进行描述。
问答系统(question answering system,QA)已经得到的广泛的应用。问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。问答系统也可以称为人机对话系统等。目前,很多领域的智能客服系统都采用了问答系统。图1为本申请实施例的一种可能的应用场景示意图。如图1所示,该应用场景包括:问答设备和用户。示例性的,用户可以向问答设备提出问题,问答设备根据用户的问题,向用户返回合适的答案。例如:用户向问答设备提出问题“中国的首都是哪里?”,问答设备向用户返回答案“北京”。
其中,问答设备可以是具有对用户提出的问题进行应答功能的任意的电子设备。问答设备也可以称为问答机器人,包括但不限于:电脑、计算机、智能手机、智能家居、智能音箱、智能穿戴设备、智能机器人等。根据应用领域的不同,问答设备可以有不同的名称,例如:聊天机器人、客服机器人、咨询机器人、接待机器人等。
图1所示的应用场景中,用户与问答设备的交互方式可以有多种,本实施例对此不作限定。示例性的,用户可以向问答设备以语音形式输入问题,还可以向问答设备以文本形 式输入问题。有些场景中,用户还可以采用肢体语言向问答设备输入问题。相应的,问答设备也可以采用多种交互方式向用户输出应答信息。
问答设备中包括问答装置,问答装置可以获取用户输入的问题,并对问题进行计算处理得到该问题对应的答案。应理解,问答设备中除了包括问答装置外,还可以包括其他装置,例如:输入装置(例如:键盘、触摸屏、语音输入装置等)、输出装置(例如:显示屏、扬声器等),对于有些会执行动作的问答设备,还可以包括驱动装置、控制装置等,本实施例对于问答设备的结构不作限定。
图2为本申请实施例的问答过程的原理示意图。如图2所示,问答装置可以包括:通信单元、处理单元和知识库。其中,知识库用于提供回答用户问题所需的知识。处理单元中可以设置有语义匹配模型,用于根据用户的问题去知识库中检索最合适的答案。能够理解,知识库中的知识越丰富,问答设备能够回答的问题越多。通信单元用于与问答设备的其他装置进行交互,例如,从输入装置获取用户输入的问题,将该问题对应的应答提供给输出装置等。
其中,对于不同类型的问答设备,其知识库中的知识可以采用不同的表达方式。一种可能的实施方式中,知识库中的知识以“问题-答案对”的形式存储。“问题-答案对”也可以简称为“问答(question and answering、QA)对”。其中,Q表示已知问题(或者称为标准问题),A表示Q对应的答案。问答设备接收到用户问题后,通过语义匹配模型去知识库中寻找答案,本质上就是将用户问题与知识库中的已知问题进行匹配,返回最匹配的已知问题对应的答案。
上述的问答方法可以称为基于检索的问答方法(information retrieval based question answering,IRQA),该类方法包括两个核心特征。第一个特征是将预先写好的问答对存储到知识库中。第二个特征是接收到用户问题后,计算用户问题与知识库中的已知问题(Q)的相似度,返回相似度最高的已知问题(Q)对应的答案(A)。能够理解,基于检索的问答方法中,若要使得问答效果较好,一方面需要保证知识库中的知识足够丰富,即尽量保证用户问题包含在知识库中。另一方面需要保证语义匹配模型足够准确,即,保证在知识库中有答案的前提下能够找到这个答案。
然而,上述的基于检索的问答方案中,根据用户问题与知识库中的已知问题的相似度进行检索,如果用户问题较为模糊,即用户问题与多个已知问题的相似度无法区分,则问答设备无法确定出最合适的答案,导致问答设备返回的答案的准确度降低。
为了解决上述问题,本申请实施例提供一种问答方法、装置及设备,能够提升问答系统的准确度。
下面结合几个具体的实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图3为本申请一个实施例提供的问答方法的流程示意图。本实施例的方法可以由图1中的问答设备执行,示例性的,可以由问答设备中的问答装置执行。如图3所示,本实施例的方法包括:
S301:获取用户输入的目标问题。
该目标问题可以是用户向问答设备输入的问题。示例性的,用户可以采用文本形式向问答设备输入目标问题,该情况下,问答设备获取到的目标问题为文本形式。用户还可以 采用语音形式向问答设备输入目标问题,该情况下,问答设备可以将接收到的语音信息转换为文本信息,从而得到文本形式的目标问题。用户还可以采用肢体语言向问答设备输入目标问题,该情况下,问答设备通过对用户的肢体动作进行采集和分析,识别得到文本形式的目标问题。
S302:根据知识库中的存储内容,获取所述目标问题对应的应答;其中,所述知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,每个所述问答对包括已知问题和所述已知问题对应的答案。
现有技术中的知识库中存储的内容仅包括多个问答对,并且问答对之间是彼此独立的。示例性的,知识库中存储了N个问答对,如表1所示。因此,现有技术中,问答设备在接收到用户输入的目标问题后,计算目标问题与N个问答对中的已知问题之间的相似度,将相似度最高的已知问题对应的答案作为该目标问题的答案。
表1
序号 Q(已知问题) A(答案)
1 已知问题1 答案1
2 已知问题2 答案2
N 已知问题N 答案N
本申请的发明人在研究过程中发现,上述现有技术的知识库中存储的N个问答对之间是彼此独立的。有些场景中,用户输入的目标问题的含义较为模糊,使得目标问题与知识库中的M个问答对的已知问题的相似度均较高,其中,M<N。由于该M个问答对之间相互独立,问答设备很难根据这M个问答对进一步准确确定出目标问题的答案。
本实施例与现有技术不同之处在于,本实施例的知识库中除了存储多个问答对之外,还利用知识图谱存储了多个问答对之间的关联关系。图4为本申请实施例中知识库中的存储内容的示意图,如图4所示,知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述问答对之间的关联关系。其中,多个问答对与表1中的存储内容类似,每个问答对中包括已知问题和该已知问题对应的答案。
其中,知识图谱(knowledge graph)是一种语义网络,旨在描述真实世界中存在的各种实体及其关系。实体是有可区别性且内于其自身而独立存在的某种事物,如某一个人、某一个城市、某一种植物、某一种商品等等。实体是知识图谱中最基本元素,不同的实体间存在不同的关系。知识图谱可以被看作是一张巨大的图,其中包括节点和边。节点表示实体,边表示实体之间的语义关系。
知识图谱可以通过人为构建与定义,示例性的,可以基于某个应用场景或者某个应用领域的知识构建得到。例如,以体育明星领域为例,“篮球明星包括姚明”、“姚明出生于上海”、“姚明的国籍是中国”、“姚明的配偶是叶莉”,上述就是一条条的知识,这些知识可以从网络百科中获取。网络百科中的这些知识是由非结构化的自然语言组建而成的,这样的组织方式适合人类阅读但并不适合计算机处理。为了便于计算机的处理和理解,可以通过对上述各条知识之间的实体关系进行梳理和分析,构建得到知识图谱。图5为本申请实施例提供的一个知识图谱的示意图。如图5所示,知识图谱中包括5个实体,分别为“篮球明星”、“姚明”、“上海”、“中国”、“叶莉”。知识图谱中还通过各个实体之间的边指示 了各实体之间的语义关系。
实际应用中,知识图谱的构建方式可以有多种,一种可能的方式中,可以基于三元组来构建知识图谱。其中,三元组的基本形式可以为(实体1-关系-实体2),还可以为(实体-属性-属性值)。图5所示的知识图谱中包括了上述两种形式的三元组。其中,“篮球明星-姚明”是基于(实体1-关系-实体2)形式的三元组得到的,表达的含义为“篮球明星”与“姚明”之间的关系为包含关系。“姚明-上海”、“姚明-中国”、“姚明-叶莉”则是基于(实体-属性-属性值)形式的三元组得到的,表达的含义分别为“姚明的生成地是上海”、“姚明的国籍是中国”、“姚明的配偶是叶莉”。需要说明的是,实际应用中还可以采用其他的构建知识图谱的方式,当构建方式不同时,构建得到的知识图谱也可能不同,图5所示的知识图谱仅为一种示例。
无论采用哪种构建方式,知识图谱的构建都是从最原始的数据(包括结构化、半结构化、非结构化数据)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取知识事实,经过信息抽取、知识表示、知识融合、知识推理等多个过程构建得到知识图谱。本实施例对于知识图谱的构建过程不作详述。
本实施例中,针对问答系统的应用场景或者应用领域中的知识进行构建,得到知识图谱,将知识图谱存储到知识库中。知识图谱中包括多个实体,根据知识图谱可以获知多个实体之间的关联关系。继续参见图4,知识库中除了存储多个问答对与知识图谱之外,还存储了知识图谱中的实体与问答对之间的关联关系。例如:实体1与QA0001和QA0002关联,实体2与QA0003和QA0004关联等。这样,根据知识图谱中的实体1与实体2之间的关联关系,可以获知上述多个问答对之间的关联关系。本实施例通过建立问答对与知识图谱中的实体之间的关联关系,实现了利用知识图谱中的多个实体之间的关联关系将多个问答对关联起来,使得多个问答对之间也具有了关联关系。换句话说,多个问答对之间的关联关系可以通过这些问答对所关联的实体之间的关联关系呈现。
下面结合图6进行举例说明。图6为本申请实施例提供的另一个知识图谱的示意图,以宠物狗知识图谱为例,如图6所示,该知识图谱中包括7个实体,分别为:宠物狗、金毛、藏獒、金毛的特性、金毛的驯养方法、藏獒的特性、藏獒的驯养方法。在建立知识图谱中的实体与问答对之间的关联关系时,可以根据每个问答对所描述的实体,将该问答对关联到知识图谱中的对应的实体上。示例性的,假设某个问答对为“Q:金毛有哪些特性?A:温顺忠实、热情友善、聪明机警”,该问答对描述的实体为“金毛的特性”,因此,可以将该问答对与图6所示知识图谱中的实体“金毛的特性”关联。假设某个问答对为“Q:如何驯养金毛?A:采用正确的奖励、惩戒、诱导等方式…”,该问答对描述的实体为“金毛的驯养方法”,因此,可以将该问答对与图6所示知识图谱中的实体“金毛的驯养方法”关联。以此类推,知识库中的每个问答对均可以与知识图谱中的某个实体建立关联关系。如图6所示,QA0001与实体“金毛特性”关联,QA0002与实体“金毛驯养方法”关联,QA0003与“藏獒特性”关联,QA0004与“藏獒驯养方法”关联。
能够理解,在建立知识图谱中的实体与问答对之间的关联关系时,知识图谱中的每个实体可以与一个或者多个问答对建立关联关系,每个问答对只与知识图谱中的一个实体建立关联关系。知识图谱中可以仅有部分实体关联有问答对,也可以是每个实体均关联有问答对。
本实施例中,当问答设备获取到用户的目标问题后,可以根据如图4所示的知识库中的存储内容,获取目标问题对应的应答。由于知识库中存储了知识图谱、多个问答对以及知识图谱中的实体与问答对之间的关联关系,利用知识图谱中的实体之间的关联关系以及实体与问答对之间的关联关系,可以获知问答对之间的关联关系。这样,在获取目标问答对应的应答时,可以利用这些问答对之间的关联关系,即使用户的目标问题较为模糊,也可能向用户返回合适的应答。
换句话说,在获取目标问题对应的应答时,可以根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答。当用户提出的目标问题的语义较为模糊时,例如,用户的目标问题与多个问答对中的已知问题的相似度均较高,则可以根据该多个问答对所关联的实体之间的关联关系,确定出目标问题对应的应答。能够理解,该应答可以是用于回答目标问题的具体答案,还可以是用于进一步明确用户意图的反问问题。
示例性的,若用户提出的目标问题为“宠物狗如何驯养”,由于该目标问题与图6中的QA0001和QA0002中的已知问题的相似度均较高,说明该目标问题的语义较为模糊,根据知识图谱中QA0001和QA0002关联的实体之间的关联关系,问答设备可以确定出需要进一步确认用户的目标问题是针对金毛还是藏獒,因此,问答设备可以将反问问题“请问你想问的是金毛还是藏獒?”作为该目标问题对应的应答。这样,通过反问问题可以引导用户准确表达自己的问题,从而保证为用户提供最合适的答案。
本实施例提供的问答方法,包括:获取用户输入的目标问题,根据知识库中的存储内容,获取目标问题对应的应答,其中,知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系;这样,当用户提出的目标问题较为模糊时,例如,用户的目标问题与多个问答对中的已知问题的相似度均较高,则可以根据该多个问答对所关联的实体之间的关联关系,确定出目标问题对应的应答,从而提高了向用户返回的应答的准确度。
下面结合图7所示的实施例对本申请提供的问答方法进行更详细的描述。本实施例以图6所示的知识图谱为例进行举例说明。
图7为本申请另一个实施例提供的问答方法的流程示意图。如图7所示,本实施例的方法包括:
S701:获取用户输入的目标问题。
本实施例中S701的具体实施方式与图3所示实施例中的S301类似,此处不再赘述。
例如:用户输入的目标问题可以为“我该如何驯养宠物狗?”、“宠物狗如何驯养?”、“金毛有哪些特性?”、“宠物狗有哪些特性?”等。
S702:针对知识图谱中的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与目标问题之间的相似度。
示例性的,首先针对知识库中的每个问答对,分别计算出每个问答对与目标问题之间的相似度。能够理解,该相似度是指每个问答对中的已知问题的语义与目标问题的语义之间的相似度。结合图6,可以分别计算出QA0001至QA0004与目标问题之间的相似度。其中,计算每个问答对与目标问题之间的相似度属于现有技术,可以采用现有的语义相似度的计算方法,本实施例对此不作详述。
然后,针对知识图谱中关联了问答对的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与目标问题之间的相似度。示例性的,若某个实体关联的问答对的数量为一个,则将该实体关联的问答对与目标问题之间的相似度确定为该实体与目标问题之间的相似度。若某个实体关联的问答对的数量为多个,则从该实体关联的多个问答对分别与目标问题之间的相似度中确定出最高相似度,将该最高相似度确定为该实体与目标问题之间的相似度。
S703:在知识图谱中确定出目标实体,所述目标实体与所述目标问题之间的相似度大于或者等于预设阈值。
示例性的,通过设置预设阈值对知识图谱中的实体进行筛选,过滤掉与目标问题之间的相似度较低的实体,将与目标问题之间的相似度大于预设阈值的实体确定为目标实体。其中,本实施例对于预设阈值的取值不做限定,可以根据实际应用场景进行设置。该预设阈值可以是固定值,也可以是动态值。
结合图6,当目标问题为“金毛有哪些特性?”时,确定出的目标实体可以为“金毛特性”。当目标问题为“我该如何驯养宠物狗?”或者“宠物狗如何驯养?”时,确定出的目标实体可以为“金毛驯养方法”和“藏獒驯养方法”。当目标问题为“宠物狗有哪些特性?”时,确定出的目标实体可以为“金毛特性”和“藏獒特性”。
S704:若所述目标实体的数量为一个,则根据所述目标实体关联的问答对,获取所述目标问题的应答。
本实施例中,当确定出的目标实体的数量为一个时,说明用户的目标问题的语义较为清楚。该情况下,直接根据目标实体关联的问答对,即可确定出目标问题的应答。示例性的,若该目标实体仅关联了一个问答对,则直接将该问答对中的答案作为目标问题的应答。若该目标实体关联了多个问答对,则将该多个问答对中与目标问题的相似度最高的问答对中的答案作为目标问题的应答。
结合图6,当目标问题为“金毛有哪些特性?”时,确定出的目标实体的数量为一个,即“金毛特性”。由于目标实体“金毛特性”仅关联了一个问答对QA0001,因此可以将问答对QA0001中的答案作为该目标问题的应答。
能够理解,在确定出的目标实体的数量为一个的情况下,说明用户的目标问题的语义较为清楚,根据目标实体关联的问答对得到的目标问题的应答,是用于回答该目标问题的具体答案。该情况下,无须进行多轮交互过程。
S705:若所述目标实体的数量为多个,则在所述知识图谱中确定出每个目标实体各自对应的候选路径,根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答。
其中,一个目标实体对应的候选路径为从所述知识图谱中的上级实体出发到达该目标实体的路径。上级实体也可以称为父级实体。本实施例中的上级实体可以是目标实体的直接上级实体,还可以是间接上级实体。例如:图6所示的知识图谱中,“金毛特性”的直接上级实体为“金毛”,间接上级实体为“宠物狗”。对于目标实体“金毛特性”而言,该目标实体对应的候选路径可以为“金毛->金毛特性”,还可以为“宠物狗->金毛->金毛特性”。
本实施例中,当确定出的目标实体的数量有多个时,说明用户的目标问题的语义较为 模糊。该情况下,可以根据各目标实体对应的候选路径确定出目标问题的应答。该情况下确定出的目标问题的应答,其实是用于进一步明确用户意图的反问问题,而不是针对该目标问题的具体答案。通过反问问题使得用户与问答设备进行多轮的交互,引导用户准确表达自己的问题,从而保证为用户提供最合适的答案。
一种可能的实施方式中,当确定出的目标实体有多个时,可以首先在知识图谱中确定出多个目标实体的公共上级实体,然后将该公共上级实体到每个目标实体之间的路径作为该目标实体对应的候选路径。例如:当目标问题为“我该如何驯养宠物狗?”或者“宠物狗如何驯养?”时,确定出的目标实体为“金毛驯养方法”和“藏獒驯养方法”。在图6所示的知识图谱中寻找这两个目标实体的公共上级实体为“宠物狗”,则确定出两条候选路径,分别为“宠物狗->金毛->金毛驯养方法”、“宠物狗->藏獒->藏獒驯养方法”。
确定出各目标实体对应的候选路径之后,若这些候选路径中包括相同的上级实体,则可以根据各候选路径中的中间实体,生成用于进一步明确用户意图的反问问题,并将该反问问题提供给所述用户。其中,中间实体为位于候选路径中的上级实体和目标实体之间的实体。结合图6,在确定出两条候选路径“宠物狗->金毛->金毛驯养方法”和“宠物狗->藏獒->藏獒驯养方法”之后,根据两条候选路径中的实体之间的层级关系,确定出需要根据第二实体(“金毛”、“藏獒”)进行反问,因此,生成反问问题“请问您的宠物狗为金毛还是藏獒?”,并将该反问问题提供给用户。这样,用户根据反问问题可以清楚的表述自己的问题,从而使得问答设备能够准确返回用户最想要的答案。例如,若用户进一步输入的信息为“金毛”,则将“金毛的驯养方法”关联的问答对QA0002中的答案返回给用户。若用户进一步输入的信息为“藏獒”,则将“藏獒的驯养方法”关联的问答对QA0004中的答案返回给用户。若用户进一步输入的信息为“贵宾犬”,则可以生成信息“对不起,我目前还没有办法回答您的问题”返回给用户。
当然,有些应用场景中,也可能出现多个目标实体不存在公共上级实体的情况。该场景中,各个目标实体对应的候选路径中不包括相同的上级实体。该情况下,可以针对多条候选路径分别生成反问问题。
一种可能的实施方式中,可以依次遍历多个候选路径,针对每个候选路径中的目标实体的上级实体,生成用于进一步明确用户意图的反问问题,将该反问问题提供给用户。结合图6,假设针对目标问题“宠物狗有哪些驯养方法?”确定出的候选路径有两条,分别为“金毛->金毛的驯养方法”、“藏獒->藏獒的驯养方法”。则可以依次针对这两个候选路径分别进行反问,例如,根据第一个候选路径中的上级实体,生成反问问题“您的宠物狗是金毛吗?”,根据第二个候选路径中的上级实体,生成反问问题“您的宠物狗是藏獒吗?”。能够理解,实际应用中,在问答设备向用户提供第一个反问问题“您的宠物狗是金毛吗?”后,若用户进一步输入的信息为“是金毛”,则无需针对后续的候选路径进行反问处理。
另一种可能的实施方式中,针对多个候选路径进行反问时,还可以根据一定的顺序进行反问,使得每次向用户提供的反问问题都是用户大概率回答为是的反问问题。示例性的,根据每条候选路径中的目标实体与目标问题之间的相似度,得到多条候选路径的处理优先级,一条候选路径的处理优先级与该条候选路径中的目标实体与目标问题之间的相似度正相关。即,一条候选路径中的目标实体与目标问题之间的相似度越高,则该候选路径的处理优先级越高。每次从多条候选路径中选择当前处理优先级最高的候选路径,根据该候选 路径中的目标实体的上级实体,生成用于进一步明确用户意图的反问问题,将所述反问问题提供给用户。
上述处理方式的另一种表述方式为:每次在多条候选路径中确定出第一候选路径,所述第一候选路径中的所述目标实体与所述目标问题之间的相似度大于或者等于其他候选路径中的所述目标实体与所述目标问题之间的相似度;根据所述第一候选路径中的目标实体的上级实体,生成用于进一步明确用户意图的反问问题,将该反问问题提供给用户。
下面结合举例说明,假设针对目标问题“宠物狗有哪些特性?”确定出的候选路径有两条,分别为“金毛->金毛特性”、“藏獒->藏獒特性”。其中,“金毛特性”与目标实体之间的相似度高于“藏獒特性”与目标实体之间的相似度,因此,确定出两条候选路径的处理优先级为:“金毛->金毛特性”、“藏獒->藏獒特性”。首先,针对当前处理优先级最高的候选路径“金毛->金毛特性”,生成反问问题“请问您的宠物狗是金毛吗?”,并将该反问问题提供给用户。并将当前处理优先级最高的候选路径去除。若用户进一步输入的信息为“是”,则将“金毛特性”关联的问答对QA0001中的答案返回给用户。若用户进一步输入的信息为“不是”,则根据当前处理优先级最高的候选路径“藏獒->藏獒特性”,生成反问问题“请问您的宠物狗是藏獒吗?”并将该反问问题提供给用户。并将当前处理优先级最高的候选路径去除。若用户进一步输入的信息为“是”,则将“藏獒特性”关联的问答对QA0003中的答案返回给用户。若用户进一步输入的信息为“不是”,由于当前已没有候选路径,可以生成信息“对不起,我目前还没有办法回答您的问题”返回给用户。
由此可见,本实施例的问答方法,在用户提出的目标问题较为模糊的情况下,利用知识图谱指示的不同问答对之间的关联关系,生成用于明确用户意图的反问问题,通过多轮问答交互过程,澄清用户意图,从而向用户返回最合适的答案。
需要说明的是,本实施例的问答方法适用于所有需要通过人机交互进行问答的场景。上述实施例中仅以宠物问答领域为例进行示例性说明。下面再结合一个IT运维领域的实例进行举例说明。
图8为本申请又一个实施例提供的问答方法的示意图。如图8所示,假设知识库中存储了很多IT运维场景的问答对,为了描述方便,本实施例仅以“修改hosts”问答场景为例进行说明。首先构建知识图谱,并建立知识图谱中的实体与问答对之间的关联关系。
示例性的,实际问答场景中用户提出问题的表达形式多样,比如:“windows系统中的hosts文件路径是什么?”,“linux怎么修改hosts配置?”等等。通过对这些问题进行分析,可以发现这类问题通常分成两类解决方案,取决于操作系统所属的类别(windows或者linux),因此本实施例中可以构建如图8所示的知识图谱。如图8所示,知识图谱中包括5个实体,分别为:实体1-操作系统、实体2-windows、实体3-linux、实体4-window hosts修改方法、实体5-linux hosts修改方法。然后可以将知识库中的QA对关联到知识图谱的对应实体上,参见图8,实体4关联了QA0001和QA0002,实体5关联了QA0011和QA0012。这样,利用图8所示的知识图谱以及知识图谱中的实体与问答对之间的关联关系,可以得到一个问答对的语义网络。问答设备可以根据这个语义网络对用户的目标问题进行计算,根据操作系统的类别引导到不同的解决方案,从而得到目标问题对应的应答。
假设用户提出的目标问题为“怎么修改hosts?”。本申请实施例中,首先计算该目标问题与知识库中的各问答对之间的相似度。然后,针对知识图谱中的每个实体,根据该 实体关联的问答对与目标问题之间的相似度,确定出每个实体与该目标问题之间的相似度(例如,将该实体关联的问答对与目标问题之间的相似度的最大值,作为该实体与该目标问题之间的相似度)。进而根据预设阈值进行筛选,确定出实体4和实体5与目标问题之间的相似度较高,将实体4和实体5作为目标实体。
确定出目标实体为实体4和实体5后,获取实体4和实体5的公共上级实体,即实体1-操作系统,这样得到两条候选路径:实体1->实体2->实体4、实体1->实体3->实体5。进而根据两条候选路径中的实体层级关系判断出需要根据实体1(操作系统)进行反问,反问内容为实体1(操作系统)的下级实体的取值(即实体2-windows和实体3-linux)。因此,生成反问问题“请问您的操作系统是windows还是linux?”返回给用户,用于进一步明确用户的意图。当用户针对反问问题输入进一步的信息后,将用户进一步输入的信息作为目标问题的补充信息,使得目标问题的含义较为清楚,重复执行本实施例的方法,直至得到的目标实体唯一,将目标实体所关联与目标问题的相似度最高的问答对中的答案,作为最终向用户返回的答案。
本实施例中,如果采用传统的IRQA方案,因为用户提出的目标问题“怎么修改hosts?”的语义较为模糊,使得该目标问题与多个问答对的相似度均较高,从而只能随机选择一个问答对中的答案进行返回,或者向用户返回大量冗余的问答对中的答案供用户选择,导致问答体验效果很差。而本实施例通过在问答对本身的语义信息的基础上,引入知识图谱对问答对本身的语义信息进行补充,利用知识图谱中的实体之间的关联关系进一步反问用户的意图,从而能够向用户返回更精准的答案,提升问答效果。
图9为本申请一个实施例提供的问答装置的结构示意图。本实施例的问答装置可以为软件和/或硬件的形式。如图9所示,本实施例的问答装置900,包括:通信单元901、处理单元902和知识库903。
其中,所述通信单元901,用于获取用户输入的目标问题;所述处理单元902,用于根据知识库903中的存储内容,获取所述目标问题对应的应答;其中,所述知识库903中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,每个所述问答对包括已知问题和所述已知问题对应的答案。
在一种可能的实现方式中,所述处理单元902具体用于:根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答。
在一种可能的实现方式中,所述处理单元902具体用于:针对所述知识图谱中的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与所述目标问题之间的相似度;在所述知识图谱中确定出目标实体,所述目标实体与所述目标问题之间的相似度大于或者等于预设阈值;若所述目标实体的数量为多个,则在所述知识图谱中确定出每个目标实体各自对应的候选路径,根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答;其中,一个目标实体对应的候选路径为从所述知识图谱中的上级实体出发到达该目标实体的路径。
在一种可能的实现方式中,所述处理单元902还具体用于:若所述目标实体的数量为一个,则根据所述目标实体关联的问答对,获取所述目标问题的应答。
在一种可能的实现方式中,所述处理单元902具体用于:若确定出的多条候选路径中包括相同的上级实体,则根据各所述候选路径中的中间实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户;其中,所述中间实体位于所述候选路径中所述上级实体和所述目标实体之间。
在一种可能的实现方式中,所述处理单元902具体用于:若确定出的多条候选路径中不包括相同的上级实体,则根据所述多条候选路径中的至少一条候选路径中的所述目标实体的上级实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户。
在一种可能的实现方式中,所述处理单元902具体用于:若一个实体关联的问答对的数量为一个,则将该实体所关联的问答对与所述目标问题之间的相似度,确定为该实体与所述目标问题之间的相似度;若一个实体关联的问答对的数量为多个,则从该实体所关联的多个问答对分别与所述目标问题之间的相似度中确定出最高相似度,将该最高相似度确定为该实体与所述目标问题之间的相似度。
本实施例的问答装置,可用于实现上述任一方法实施例中的问答方法,其实现原理和技术效果类似,此处不作赘述。
图10为本申请一个实施例提供的问答设备的结构示意图。如图10所示,本实施例的问答设备1000,包括:处理器1001和存储器1002。
其中,存储器1002,用于存储计算机程序;处理器1001,用于执行存储器1002存储的计算机程序,以实现上述方法实施例中的问答方法。
可选地,存储器1002既可以是独立的,也可以跟处理器1001集成在一起。当所述存储器1002是独立于处理1001之外的器件时,所述控制器1000还可以包括:总线1005,用于连接所述存储器1002和处理器1001。
在一种可能的实施方式中,图9中的通信单元901和处理单元902可以集成在处理器1001中实现,图9中的知识库903可以存储在存储器1002中。
在一种可能的实施方式中,问答设备1000还可以包括输入装置1003和输出装置1004。其中,处理器1001、存储器1002、输入装置1003和输出装置1004可以通过总线或者其他方式连接,图10中以通过总线连接为例。输入装置1003可接收输入的数字或字符信息,以及产生与问答设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆、拾音器等输入装置。输出装置1004可以包括显示设备、扬声器、辅助照明装置和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器、发光二极管显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
本实施例提供的问答设备,可用于执行上述方法实施例中问答方法,其实现原理和技术效果类似,此处不再赘述。
本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现上述方法实施例中的问答方法。
本申请实施例还提供一种芯片,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得安装有所述芯片的设备执行上述方法实施例中的问答方法。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述方法实施例中的问答方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(central processing unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(英文:application specific integrated circuit,ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(industry standard architecture,ISA)总线、外部设备互连(peripheral component,PCI)总线或扩展工业标准体系结构(extended industry standard architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(application specific integrated circuits,ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

Claims (16)

  1. 一种问答方法,其特征在于,包括:
    获取用户输入的目标问题;
    根据知识库中的存储内容,获取所述目标问题对应的应答;其中,所述知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,每个所述问答对包括已知问题和所述已知问题对应的答案。
  2. 根据权利要求1所述的方法,其特征在于,所述根据知识库中的存储内容,获取所述目标问题对应的应答,包括:
    根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答。
  3. 根据权利要求2所述的方法,其特征在于,所述根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答,包括:
    针对所述知识图谱中的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与所述目标问题之间的相似度;
    在所述知识图谱中确定出目标实体,所述目标实体与所述目标问题之间的相似度大于或者等于预设阈值;
    若所述目标实体的数量为多个,则在所述知识图谱中确定出每个目标实体各自对应的候选路径,根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答;其中,一个目标实体对应的候选路径为从所述知识图谱中的上级实体出发到达该目标实体的路径。
  4. 根据权利要求3所述的方法,其特征在于,所述在所述知识图谱中确定出目标实体之后,所述方法还包括:
    若所述目标实体的数量为一个,则根据所述目标实体关联的问答对,获取所述目标问题的应答。
  5. 根据权利要求3或4所述的方法,其特征在于,所述根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答,包括:
    若确定出的多条候选路径中包括相同的上级实体,则根据各所述候选路径中的中间实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户;其中,所述中间实体位于所述候选路径中所述上级实体和所述目标实体之间。
  6. 根据权利要求3或4所述的方法,其特征在于,所述根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答,包括:
    若确定出的多条候选路径中不包括相同的上级实体,则根据所述多条候选路径中的至少一条候选路径中的所述目标实体的上级实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户。
  7. 一种问答装置,其特征在于,包括:通信单元、处理单元和知识库;其中,
    所述通信单元,用于获取用户输入的目标问题;
    所述处理单元,用于根据知识库中的存储内容,获取所述目标问题对应的应答;其中, 所述知识库中的存储内容包括:知识图谱、多个问答对、以及所述知识图谱中的实体与所述多个问答对之间的关联关系,每个所述问答对包括已知问题和所述已知问题对应的答案。
  8. 根据权利要求7所述的装置,其特征在于,所述处理单元具体用于:
    根据所述知识图谱中的各实体所关联的问答对与所述目标问题之间的相似度,以及所述知识图谱中的各实体之间的关联关系,获取所述目标问题对应的应答。
  9. 根据权利要求8所述的装置,其特征在于,所述处理单元具体用于:
    针对所述知识图谱中的每个实体,根据每个实体所关联的问答对与所述目标问题之间的相似度,确定出每个实体与所述目标问题之间的相似度;
    在所述知识图谱中确定出目标实体,所述目标实体与所述目标问题之间的相似度大于或者等于预设阈值;
    若所述目标实体的数量为多个,则在所述知识图谱中确定出每个目标实体各自对应的候选路径,根据确定出的多条候选路径中的实体之间的关联关系,获取所述目标问题对应的应答;其中,一个目标实体对应的候选路径为从所述知识图谱中的上级实体出发到达该目标实体的路径。
  10. 根据权利要求9所述的装置,其特征在于,所述处理单元还具体用于:
    若所述目标实体的数量为一个,则根据所述目标实体关联的问答对,获取所述目标问题的应答。
  11. 根据权利要求9或10所述的装置,其特征在于,所述处理单元具体用于:
    若确定出的多条候选路径中包括相同的上级实体,则根据各所述候选路径中的中间实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户;其中,所述中间实体位于所述候选路径中所述上级实体和所述目标实体之间。
  12. 根据权利要求9或10所述的装置,其特征在于,所述处理单元具体用于:
    若确定出的多条候选路径中不包括相同的上级实体,则根据所述多条候选路径中的至少一条候选路径中的所述目标实体的上级实体,生成用于进一步明确所述用户的意图的反问问题,将所述反问问题提供给所述用户。
  13. 一种问答设备,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于从所述存储器中调用并运行所述计算机程序,使得所述处理器运行所述计算机程序执行如权利要求1至6任一项所述的方法。
  14. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机程序,所述计算机程序用于实现如权利要求1至6任一项所述的方法。
  15. 一种芯片,其特征在于,所述芯片包括至少一个处理器和通信接口,所述通信接口和所述至少一个处理器通过线路连接,所述至少一个处理器用于运行计算机程序或指令,实现如权利要求1至6中任一项所述的方法。
  16. 一种计算机程序产品,其特征在于,所述计算机程序产品被处理器执行时,实现如权利要求1至6中任一项所述的方法。
PCT/CN2020/132899 2019-12-18 2020-11-30 问答方法、装置及设备 WO2021121020A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911311066.1A CN112988988A (zh) 2019-12-18 2019-12-18 问答方法、装置及设备
CN201911311066.1 2019-12-18

Publications (1)

Publication Number Publication Date
WO2021121020A1 true WO2021121020A1 (zh) 2021-06-24

Family

ID=76344011

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/132899 WO2021121020A1 (zh) 2019-12-18 2020-11-30 问答方法、装置及设备

Country Status (2)

Country Link
CN (1) CN112988988A (zh)
WO (1) WO2021121020A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468294A (zh) * 2021-07-20 2021-10-01 上海明略人工智能(集团)有限公司 用于古诗词问答的方法、装置、电子设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7272293B2 (ja) * 2020-01-29 2023-05-12 トヨタ自動車株式会社 エージェント装置、エージェントシステム及びプログラム
CN114510558A (zh) * 2022-01-26 2022-05-17 北京博瑞彤芸科技股份有限公司 一种基于中医知识图谱的问答方法及系统
CN116628167B (zh) * 2023-06-08 2024-04-05 四维创智(北京)科技发展有限公司 一种响应确定方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160171376A1 (en) * 2014-12-12 2016-06-16 International Business Machines Corporation Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays
CN105956168A (zh) * 2016-05-20 2016-09-21 北京市农林科学院 一种信息检索方法及信息检索装置
US20170103069A1 (en) * 2015-10-13 2017-04-13 International Business Machines Corporation Supplementing candidate answers
CN110008326A (zh) * 2019-04-01 2019-07-12 苏州思必驰信息科技有限公司 会话系统中的知识摘要生成方法及系统
CN110287334A (zh) * 2019-06-13 2019-09-27 淮阴工学院 一种基于实体识别和属性抽取模型的学校领域知识图谱构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160171376A1 (en) * 2014-12-12 2016-06-16 International Business Machines Corporation Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays
US20170103069A1 (en) * 2015-10-13 2017-04-13 International Business Machines Corporation Supplementing candidate answers
CN105956168A (zh) * 2016-05-20 2016-09-21 北京市农林科学院 一种信息检索方法及信息检索装置
CN110008326A (zh) * 2019-04-01 2019-07-12 苏州思必驰信息科技有限公司 会话系统中的知识摘要生成方法及系统
CN110287334A (zh) * 2019-06-13 2019-09-27 淮阴工学院 一种基于实体识别和属性抽取模型的学校领域知识图谱构建方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468294A (zh) * 2021-07-20 2021-10-01 上海明略人工智能(集团)有限公司 用于古诗词问答的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112988988A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
WO2021121020A1 (zh) 问答方法、装置及设备
CN110297893B (zh) 自然语言问答方法、装置、计算机装置及存储介质
WO2021135455A1 (zh) 语义召回方法、装置、计算机设备及存储介质
WO2020151690A1 (zh) 语句生成方法、装置、设备及存储介质
CN111382255A (zh) 用于问答处理的方法、装置、设备和介质
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
WO2023178958A1 (zh) 线上医疗问诊的医生分配方法、装置、存储介质及设备
JP2020017272A (ja) ピクチャ検索方法、装置、サーバー及び記憶媒体
WO2021017300A1 (zh) 问题生成方法、装置、计算机设备及存储介质
CN109918627A (zh) 文本生成方法、装置、电子设备及存储介质
CN111400473A (zh) 意图识别模型的训练方法及装置、存储介质及电子设备
CN109492085B (zh) 基于数据处理的答案确定方法、装置、终端及存储介质
WO2023040516A1 (zh) 一种事件整合方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN112686051A (zh) 语义识别模型训练方法、识别方法、电子设备、存储介质
CN112434524A (zh) 一种文本信息处理方法、装置、电子设备及存储介质
CN111444321B (zh) 问答方法、装置、电子设备和存储介质
CN110020429B (zh) 语义识别方法及设备
WO2021239078A1 (zh) 领域识别的方法、交互的方法、电子设备及存储介质
CN111931034B (zh) 数据搜索方法、装置、设备及存储介质
CN113571196A (zh) 构建医疗训练样本的方法及装置、医疗文本的检索方法
WO2023246093A1 (zh) 一种常见问题解答方法、系统、设备和介质
CN110263346B (zh) 基于小样本学习的语意分析方法、电子设备及存储介质
Hantke et al. Trustability-based dynamic active learning for crowdsourced labelling of emotional audio data
CN116468043A (zh) 嵌套实体识别方法、装置、设备及存储介质
CN116844711A (zh) 基于深度学习的疾病辅助识别方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20901570

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20901570

Country of ref document: EP

Kind code of ref document: A1