CN112182177A - 一种用户问题处理方法、装置、电子设备及存储介质 - Google Patents
一种用户问题处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112182177A CN112182177A CN202011025702.7A CN202011025702A CN112182177A CN 112182177 A CN112182177 A CN 112182177A CN 202011025702 A CN202011025702 A CN 202011025702A CN 112182177 A CN112182177 A CN 112182177A
- Authority
- CN
- China
- Prior art keywords
- entity
- type
- question
- answer
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000004590 computer program Methods 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 230000003993 interaction Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种用户问题处理方法、装置、电子设备及存储介质。该方法包括:确定用户问题中关键词所属问题集合;其中,问题集合为实体集合;或者,问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;根据实体集合中的实体元素数量和问题集合的集合类型,确定问题类型;根据问题集合中元素的元素类型和元素名称,问题集合的集合类型,以及问题类型,生成查询语句;根据查询语句查询预先构建的知识图谱,得到用户问题的问题答案。通过运行本发明实施例所提供的技术方案,可以解决人机交互系统中当用户问题不常见或者问题较为复杂时,系统无法给出对应的答案的问题,实现提高用户问题处理效率和准确率的效果。
Description
技术领域
本发明实施例涉及计算机技术,尤其涉及一种用户问题处理方法、装置、电子设备及存储介质。
背景技术
随着计算机技术的发展,可以通过人机交互系统回答用户提出的部分问题。
现有技术中,通常总结用户的提问频率高的常见的简单问题,以便用户通过输入关键字获取问题关联的答案。
然而当问题不常见或者问题较为复杂时,系统无法给出对应的答案。
发明内容
本发明实施例提供一种用户问题处理方法、装置、电子设备及存储介质,以实现提高用户问题处理效率和准确率的效果。
第一方面,本发明实施例提供了一种用户问题处理方法,该方法包括:
确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;
根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;
根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;
根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
第二方面,本发明实施例还提供了一种用户问题处理装置,该装置包括:
问题集合确定模块,用于确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;
问题类型确定模块,用于根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;
查询语句生成模块,用于根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;
问题答案获取模块,用于根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的用户问题处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的用户问题处理方法。
本发明实施例通过确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。解决人机交互系统中当用户问题不常见或者问题较为复杂时,系统无法给出对应的答案的问题,实现提高用户问题处理效率和准确率的效果。
附图说明
图1为本发明实施例一提供的一种用户问题处理方法的流程图;
图2为本发明实施例二提供的一种用户问题处理方法的流程图;
图3为本发明实施例三提供的一种用户问题处理装置的结构示意图;
图4为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种用户问题处理方法的流程图,本实施例可适用于根据用户问题自动获取问题答案的情况,该方法可以由本发明实施例所提供的用户问题处理装置来执行,该装置可以由软件和/或硬件的方式实现。参见图1,本实施例提供的用户问题处理方法,包括:
步骤110、确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合。
其中,用户问题可以为用户输入的文字问题,也可以为根据通过识别用户语音获取的问题,本实施例对此不作限制。用户问题中关键词为与用户问题内容较为相关的词语,示例性的,用户问题为信用卡种类有哪些,则“信用卡”和“种类”为关键词。
问题集合为关键词所属集合的统称,问题集合可以只包括实体集合,也可以在实体集合之外还包括属性集合、属性值集合和关系集合中的至少一项,即关键词中至少包括实体类型的关键词。当不包括实体类型的关键词时,可以显示无查询内容,也可以对客户进一步询问,本实施例对此不作限制。
步骤120、根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型。
其中,实体集合中的实体元素数量为用户问题中为实体类型的关键词的数量。问题集合的集合类型为用户问题中关键词的类型。
问题类型为用户问题的目的,示例性的,可以为已知属性查询、已知实体查询、未知实体查询、全量已知属性查询和全量未知属性查询。其中,已知属性查询和已知实体查询为针对用户问题中的已知实体和已知属性的查询,例如对“信用卡如何还款”问题中,对于“信用卡”和“还款”为已知实体查询。未知实体查询为用户问题中没有直接体现的实体的查询,例如在“河南地区龙卡信用卡的卡样是什么”问题中,需要根据已知实体“河南”和“信用卡”,获取未知实体“河南信用卡”,再对河南信用卡进行查询。全量已知属性查询为针对用户问题中的已知实体,查询已知实体相关的所有属性,例如用户问题为“龙卡信用卡”,则查询与龙卡信用卡相关的所有属性。全量未知属性查询为针对用户问题中的未知实体,查询未知实体相关的所有属性。可以将属性全部返回,也可以返回属性概括,根据用户的选择返回具体的属性,本实施例对此不作限制。
根据实体集合中的实体元素数量和问题集合的集合类型,共同确定问题类型。
本实施例中,可选的,根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型,包括:
若所述实体集合中实体元素数量唯一,则通过如下确定问题类型:
若所述问题集合的集合类型中存在属性集合,但不存在属性值集合,则确定所述问题类型为已知属性查询;
若所述问题集合的集合类型中存在属性集合和属性值集合,则确定所述问题类型为已知实体查询;
若所述问题集合的集合类型中不存在属性集合,但存在关系集合,则确定所述问题类型为未知实体查询;
若所述问题集合的集合类型中不存在属性集合和属性值集合,则确定所述问题类型为全量已知属性查询。
其中,实体集合中实体元素数量唯一,即用户问题中只存在一个实体类型的关键词。
若所述问题集合的集合类型中不存在属性集合,但存在关系集合,则确定所述问题类型为未知实体查询,示例性的,用户问题为“龙卡joy信用卡是什么系列”,其中,“龙卡joy信用卡”是实体,“系列”是关系,即不存在属性集合,但存在关系集合,则确定问题类型,为未知实体查询。
本实施例中,可选的,根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型,包括:
若所述实体集合中实体元素数量不唯一,则通过如下确定问题类型:
若所述问题集合的集合类型中存在属性集合,但不存在属性值集合,则确定所述问题类型为未知属性查询;
若所述问题集合的集合类型中不存在属性集合和属性值集合,则确定所述问题类型为全量未知属性查询。
其它情况则确定问题类型为未知实体查询。
通过实体集合中实体的数量是否唯一以及问题集合的集合类型,共同确定问题类型,提高问题类型确定的准确性,从而提高后续用户问题处理的准确性。
步骤130、根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句。
问题集合中元素的元素类型和元素名称为集合中元素所属集合的类型和元素本身的名称,例如,“信用卡”元素的元素类型为实体,元素名称为信用卡。
根据问题集合中元素的元素类型和元素名称,问题集合的集合类型,以及问题类型,共同确定查询语句的形式以及内容。
将用户问题转换为查询语句,以便于在知识图谱中快速获取相应答案。
本实施例中,可选的,根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句,包括:
若所述问题集合的集合类型为未知实体查询,则生成未知实体节点,以及根据问题集合中元素的元素类型和元素名称生成已知节点;
根据未知实体节点和已知节点,生成第一查询子语句;
根据所述问题集合的集合类型,生成第二查询子语句;
根据所述问题类型,生成第三查询子语句,得到包括所述第一查询子语句、所述第二查询子语句和所述第三查询子语句的查询语句。
其中,若问题集合的集合类型为未知实体查询时,则生成未知实体节点。以及根据问题集合中元素的元素类型和元素名称生成已知节点。
当问题集合的集合类型为其他类型时,则只根据问题集合中元素的元素类型和元素名称生成已知节点。
示例性的,遍历实体集合,对每一个实体元素生成一个实体节点,实体元素名称为节点名称,节点类型为实体类型;
若存在关系集合,则遍历关系集合,对每一个关系元素生成一个关系节点,关系元素名称为节点名称,节点类型为关系类型;
若存在属性集合和属性值集合,则遍历属性集合,根据属性元素获取对应的属性值,对每一个属性元素生成一个属性节点,属性元素名称为节点名称,节点类型为属性类型;
若问题集合的集合类型为未知实体查询时,则生成一个未知实体节点,节点类型为未知实体,节点名称为匿名。
通过生成已知节点和/或未知实体节点,构建部分查询语句。
根据未知实体节点和已知节点,生成第一查询子语句,示例性的,如果不存在未知实体节点,则生成第一查询子语句:(n);如果存在未知实体节点,不存在关系节点,则生成第一查询子语句:(n)-[]->(n{i}),i为实体节点的序号,表明连接未知实体节点和已知实体节点;如果存在未知实体节点,并且存在关系节点,则生成第一查询子语句:f'(n)-[:{name}]-(n{i}),表明连接未知实体节点、关系节点和实体节点,其中{name}为关系节点的名称。
根据所述问题集合的集合类型,生成第二查询子语句,示例性的,如果集合类型中存在属性集合,不存在属性值集合:则生成第二查询子语句:n.{name}IS NOT NULL,name为属性元素的名称;如果集合类型中存在属性集合和属性值集合,则生成第二查询子语句:n.{property}="{value},property为属性元素名称,value为属性值元素的值;如果集合类型中存在实体集合,则生成第二查询子语句:n{i}.name="{name},i为实体元素在实体集合中的序号,name为实体元素名称。需要说明的是,可以生成多类第二查询子语句,即集合类型中可能同时存在属性集合和实体集合,则可以对应生成两类第二查询子语句。
根据所述问题类型,生成第三查询子语句,示例性的,如果问题类型为已知属性查询,则生成第三查询子语句:n.`{name}`as`{name}`,{name}为属性元素的名称;如果问题类型为全量已知属性查询,则生成第三查询子语句:
query_return=‘KEYS(n)as result UNION MATCH(n)-[:继承]->(n{i})where
n{i}.name="{name}"AND n.name STARTS WITH n{i}.name RETURN KEYS(n)asresult’。
得到包括所述第一查询子语句、所述第二查询子语句和所述第三查询子语句的查询语句,示例性的,查询语句为:MATCH{match}WHERE{where}RETURN{return},其中match为第一查询子语句,where为第二查询子语句,return为第三查询子语句。通过将根据问题集合中元素的元素类型和元素名称,问题集合的集合类型,以及问题类型生成的第一查询子语句、第二查询子语句和第三查询子语句,共同构成查询语句,以提高查询语句的全面性以及对用户问题解析的准确性,从而提高用户问题处理准确率;并且可以通过修改第一查询子语句、第二查询子语句和第三查询子语句中的任意一部分,修改查询语句,提高查询语句修改的效率。
步骤140、根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
其中,预先构建的知识图谱可以为按照业务领域构建的知识图谱,例如针对信用卡领域构建的知识图谱。可以通过分析信用卡的相关知识,确定信用卡涉及的产品领域;构建信用卡的分类体系以及知识表示,并定义信用卡产品实例与各个业务支撑实例之间的关系、以及各类实例的属性。
从信用卡知识库抽取出操作、操作参数、系列、信用卡、渠道、卡组织,卡等级等知识图谱实体以及继承、渠道、卡组织、系列等知识图谱实体之间的关系,构建知识图谱,从而提高知识图谱构建的针对性。
通过查询语句查询知识图谱,获取知识图谱中与查询语句相关的结果,作为问题答案返回至用户。
本实施例中,可选的,根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案,包括:
将所述预先构建的知识图谱存储至Neo4j图形数据库;
根据所述查询语句查询所述Neo4j图形数据库中的所述知识图谱,得到所述用户问题的问题答案。
Neo4j是一个高性能的图形数据库,它将结构化数据存储在网络上,具有很强的适应能力,而且能够自始至终保持高效的查询性能。通过查询Neo4j图形数据库中的知识图谱获取用户问题的问题答案,提高答案获取的效率。
本实施例所提供的技术方案,通过确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。解决人机交互系统中当用户问题不常见或者问题较为复杂时,系统无法给出对应的答案的问题,实现提高用户问题处理效率和准确率的效果。
实施例二
图2为本发明实施例二提供的一种用户问题处理方法的流程图,本技术方案是针对得到用户问题的问题答案的过程进行补充说明的。与上述方案相比,本方案具体优化为,得到所述用户问题的问题答案,包括:
判断所述问题答案中包含的答案实体数量;
若所述答案实体数量不唯一,则根据答案集合更新所述查询语句,并根据更新后的查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案;其中,所述答案集合由所述答案实体构成。具体的,用户问题处理方法的流程图如图2所示:
步骤210、确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合。
本实施例中,可选的,确定用户问题中关键词所属问题集合,包括:
通过对获取的用户问题进行问题识别,获取所述用户问题中的关键词;
将所述关键词与问题词表进行匹配,确定所述关键词所属问题集合;其中,所述问题词表包括实体词表、属性词表、属性值词表和关系词表中的至少一项。
通过对获取的用户问题进行问题识别,获取用户问题中的关键词,可以通过文档主题生成模型等关键词提取算法进行获取,本实施例对此不作限制。
问题词表为预先构建的与业务领域相关的词表,可以通过Aho-Corasick等匹配算法,将关键词与问题词表进行匹配,确定所述关键词所匹配的问题词表,从而确定关键词所属问题集合。问题词表包括实体词表、属性词表、属性值词表和关系词表中的至少一项。示例性的,关键词为“信用卡”,实体词表中包括信用卡,则关键词与实体词表匹配,则信用卡属于实体集合。通过问题中的关键词与问题词表进行匹配,确定关键词所属问题集合,提高关键词分类的准确性和针对性。
步骤220、根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型。
步骤230、根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句。
步骤240、根据所述查询语句查询预先构建的知识图谱,判断所述问题答案中包含的答案实体数量。
其中,问题答案中包含的答案实体数量为查询预先构建的知识图谱后返回的答案个数。若答案实体数量唯一,则答案实体则为问题答案,可直接返回至用户。
步骤250、若所述答案实体数量不唯一,则根据答案集合更新所述查询语句,并根据更新后的查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案;其中,所述答案集合由所述答案实体构成。
若所述答案实体数量不唯一,根据对答案集合中的答案实体的确定更新查询语句,其中,当查询语句包括第一查询子语句、第二查询子语句和第三查询子语句时,更新查询语句可以为更新查询语句中的第一查询子语句,避免从头开始更新,提高查询语句更新效率。并根据更新后的查询语句查询预先构建的知识图谱,得到用户问题的问题答案。
本实施例中,可选的,根据答案集合更新所述查询语句,包括:
根据所述知识图谱确定所述答案实体在所述知识图谱中的实体关系,并根据所述答案实体的实体关系确定所述答案集合关联的候选答案集合;
响应于用户对所述候选答案集合中候选答案实体的选择,更新所述查询语句。
获取答案实体在知识图谱中的实体关系为与答案实体相关的所有关系,据实体关系确定答案集合关联的候选答案集合。候选答案集合为答案集合关联的集合,用于返回至用户供用户选择,以更新查询语句。示例性的,答案实体为信用卡短信申办和信用卡微信申办,则根据实体关系获取信用卡短信申办相关的候选答案为短信,根据实体关系获取信用卡微信申办相关的候选答案为微信,则将微信和短信返回至用户,供用户选择,若用户选择微信,则将微信作为新的实体节点,更新查询语句。从而提高问题的处理的准确性。
本实施例中,可选的,根据所述答案实体的实体关系确定所述答案集合关联的候选答案集合,包括:
获取每个所述答案实体的实体关系类型;
确定每个所述答案实体与所述答案集合中其它所述答案实体的实体关系中所述实体关系类型相同的共有实体关系;
根据所述共有关系获取每个所述答案实体关联的候选答案实体,根据所述候选答案实体确定所述答案集合关联的候选答案集合。
获取每个答案实体的实体关系类型,并确定答案实体的共有实体关系,示例性的,答案实体的实体关系包括继承,渠道,卡组织,系列等类型,答案实体A包括继承、卡组织类型的实体关系,答案实体B包括继承、系列类型的实体关系。则答案实体A和答案实体B的共有实体关系为继承。
根据共有关系获取每个答案实体关联的候选答案实体,示例性的,获取与答案实体A为继承关系的候选答案实体A;获取与答案实体B为继承关系的候选答案实体B。则候选答案集合包括候选答案实体A和候选答案实体B。通过共有实体关系确定候选答案集合,提高获取需要用户确定的候选答案实体的准确率,从而提高用户问题处理的准确性。
本发明实施例通过根据答案实体数量,更新查询语句,从而获取与用户问题最匹配的问题答案,提高用户问题处理的准确性。
实施例三
图3为本发明实施例三提供的一种用户问题处理装置的结构示意图。该装置可以由硬件和/或软件的方式来实现,可执行本发明任意实施例所提供的一种用户问题处理方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置包括:
问题集合确定模块310,用于确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;
问题类型确定模块320,用于根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;
查询语句生成模块330,用于根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;
问题答案获取模块340,用于根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
本实施例所提供的技术方案,通过确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。解决人机交互系统中当用户问题不常见或者问题较为复杂时,系统无法给出对应的答案的问题,实现提高用户问题处理效率和准确率的效果。
在上述各技术方案的基础上,可选的,所述问题集合确定模块,包括:
关键词获取单元,用于通过对获取的用户问题进行问题识别,获取所述用户问题中的关键词;
问题集合确定单元,用于将所述关键词与问题词表进行匹配,确定所述关键词所属问题集合;其中,所述问题词表包括实体词表、属性词表、属性值词表和关系词表中的至少一项。
在上述各技术方案的基础上,可选的,所述问题类型确定模块,包括:
若所述实体集合中实体元素数量唯一,则通过如下确定问题类型:
已知属性查询确定单元,用于若所述问题集合的集合类型中存在属性集合,但不存在属性值集合,则确定所述问题类型为已知属性查询;
已知实体查询单元,用于若所述问题集合的集合类型中存在属性集合和属性值集合,则确定所述问题类型为已知实体查询;
未知实体查询单元,用于若所述问题集合的集合类型中不存在属性集合,但存在关系集合,则确定所述问题类型为未知实体查询;
全量已知属性查询单元,用于若所述问题集合的集合类型中不存在属性集合和属性值集合,则确定所述问题类型为全量已知属性查询。
在上述各技术方案的基础上,可选的,所述问题类型确定模块,包括:
若所述实体集合中实体元素数量不唯一,则通过如下确定问题类型:
未知属性查询单元,用于若所述问题集合的集合类型中存在属性集合,但不存在属性值集合,则确定所述问题类型为未知属性查询;
全量未知属性查询单元,用于若所述问题集合的集合类型中不存在属性集合和属性值集合,则确定所述问题类型为全量未知属性查询。
在上述各技术方案的基础上,可选的,所述查询语句生成模块,包括:
节点生成单元,用于若所述问题集合的集合类型为未知实体查询,则生成未知实体节点,以及根据问题集合中元素的元素类型和元素名称生成已知节点;
第一查询子语句生成单元,用于根据未知实体节点和已知节点,生成第一查询子语句;
第二查询子语句生成单元,用于根据所述问题集合的集合类型,生成第二查询子语句;
第三查询子语句生成单元,用于根据所述问题类型,生成第三查询子语句,得到包括所述第一查询子语句、所述第二查询子语句和所述第三查询子语句的查询语句。
在上述各技术方案的基础上,可选的,所述问题答案获取模块,包括:
答案实体数量判断子模块,用于判断所述问题答案中包含的答案实体数量;
查询语句更新子模块,用于若所述答案实体数量不唯一,则根据答案集合更新所述查询语句,并根据更新后的查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案;其中,所述答案集合由所述答案实体构成。
在上述各技术方案的基础上,可选的,所述查询语句更新子模块,包括:
候选答案集合获取单元,用于根据所述知识图谱确定所述答案实体在所述知识图谱中的实体关系,并根据所述答案实体的实体关系确定所述答案集合关联的候选答案集合;
查询语句更新单元,用于响应于用户对所述候选答案集合中候选答案实体的选择,更新所述查询语句。
在上述各技术方案的基础上,可选的,所述候选答案集合获取单元,包括:
实体关系类型获取子单元,用于获取每个所述答案实体的实体关系类型;
共有实体关系确定子单元,用于确定每个所述答案实体与所述答案集合中其它所述答案实体的实体关系中所述实体关系类型相同的共有实体关系;
候选答案集合确定子单元,用于根据所述共有关系获取每个所述答案实体关联的候选答案实体,根据所述候选答案实体确定所述答案集合关联的候选答案集合。
在上述各技术方案的基础上,可选的,所述问题答案获取模块,包括:
知识图谱存储单元,用于将所述预先构建的知识图谱存储至Neo4j图形数据库;
数据库查询单元,用于根据所述查询语句查询所述Neo4j图形数据库中的所述知识图谱,得到所述用户问题的问题答案。
实施例四
图4为本发明实施例四提供的一种电子设备的结构示意图,如图4所示,该电子设备包括处理器40、存储器41、输入装置42和输出装置43;电子设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;电子设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的用户问题处理方法对应的程序指令/模块。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的用户问题处理方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种用户问题处理方法,该方法包括:
确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;
根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;
根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;
根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的用户问题处理方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述用户问题处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (13)
1.一种用户问题处理方法,其特征在于,包括:
确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;
根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;
根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;
根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
2.根据权利要求1所述的方法,其特征在于,确定用户问题中关键词所属问题集合,包括:
通过对获取的用户问题进行问题识别,获取所述用户问题中的关键词;
将所述关键词与问题词表进行匹配,确定所述关键词所属问题集合;其中,所述问题词表包括实体词表、属性词表、属性值词表和关系词表中的至少一项。
3.根据权利要求1所述的方法,其特征在于,根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型,包括:
若所述实体集合中实体元素数量唯一,则通过如下确定问题类型:
若所述问题集合的集合类型中存在属性集合,但不存在属性值集合,则确定所述问题类型为已知属性查询;
若所述问题集合的集合类型中存在属性集合和属性值集合,则确定所述问题类型为已知实体查询;
若所述问题集合的集合类型中不存在属性集合,但存在关系集合,则确定所述问题类型为未知实体查询;
若所述问题集合的集合类型中不存在属性集合和属性值集合,则确定所述问题类型为全量已知属性查询。
4.根据权利要求1所述的方法,其特征在于,根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型,包括:
若所述实体集合中实体元素数量不唯一,则通过如下确定问题类型:
若所述问题集合的集合类型中存在属性集合,但不存在属性值集合,则确定所述问题类型为未知属性查询;
若所述问题集合的集合类型中不存在属性集合和属性值集合,则确定所述问题类型为全量未知属性查询。
5.根据权利要求1所述的方法,其特征在于,根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句,包括:
若所述问题集合的集合类型为未知实体查询,则生成未知实体节点,以及根据问题集合中元素的元素类型和元素名称生成已知节点;
根据未知实体节点和已知节点,生成第一查询子语句;
根据所述问题集合的集合类型,生成第二查询子语句;
根据所述问题类型,生成第三查询子语句,得到包括所述第一查询子语句、所述第二查询子语句和所述第三查询子语句的查询语句。
6.根据权利要求1所述的方法,其特征在于,得到所述用户问题的问题答案,包括:
判断所述问题答案中包含的答案实体数量;
若所述答案实体数量不唯一,则根据答案集合更新所述查询语句,并根据更新后的查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案;其中,所述答案集合由所述答案实体构成。
7.根据权利要求6所述的方法,其特征在于,根据答案集合更新所述查询语句,包括:
根据所述知识图谱确定所述答案实体在所述知识图谱中的实体关系,并根据所述答案实体的实体关系确定所述答案集合关联的候选答案集合;
响应于用户对所述候选答案集合中候选答案实体的选择,更新所述查询语句。
8.根据权利要求7所述的方法,其特征在于,根据所述答案实体的实体关系确定所述答案集合关联的候选答案集合,包括:
获取每个所述答案实体的实体关系类型;
确定每个所述答案实体与所述答案集合中其它所述答案实体的实体关系中所述实体关系类型相同的共有实体关系;
根据所述共有关系获取每个所述答案实体关联的候选答案实体,根据所述候选答案实体确定所述答案集合关联的候选答案集合。
9.根据权利要求1所述的方法,其特征在于,根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案,包括:
将所述预先构建的知识图谱存储至Neo4j图形数据库;
根据所述查询语句查询所述Neo4j图形数据库中的所述知识图谱,得到所述用户问题的问题答案。
10.一种用户问题处理装置,其特征在于,包括:
问题集合确定模块,用于确定用户问题中关键词所属问题集合;其中,所述问题集合为实体集合;或者,所述问题集合为属性集合、属性值集合和关系集合中的至少一项,以及实体集合;
问题类型确定模块,用于根据所述实体集合中的实体元素数量和所述问题集合的集合类型,确定问题类型;
查询语句生成模块,用于根据所述问题集合中元素的元素类型和元素名称,所述问题集合的集合类型,以及所述问题类型,生成查询语句;
问题答案获取模块,用于根据所述查询语句查询预先构建的知识图谱,得到所述用户问题的问题答案。
11.根据权利要求10所述的装置,其特征在于,所述问题集合确定模块,包括:
关键词获取单元,用于通过对获取的用户问题进行问题识别,获取所述用户问题中的关键词;
问题集合确定单元,用于将所述关键词与问题词表进行匹配,确定所述关键词所属问题集合;其中,所述问题词表包括实体词表、属性词表、属性值词表和关系词表中的至少一项。
12.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的用户问题处理方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的用户问题处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011025702.7A CN112182177B (zh) | 2020-09-25 | 2020-09-25 | 一种用户问题处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011025702.7A CN112182177B (zh) | 2020-09-25 | 2020-09-25 | 一种用户问题处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112182177A true CN112182177A (zh) | 2021-01-05 |
CN112182177B CN112182177B (zh) | 2024-10-01 |
Family
ID=73943940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011025702.7A Active CN112182177B (zh) | 2020-09-25 | 2020-09-25 | 一种用户问题处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182177B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749266A (zh) * | 2021-01-19 | 2021-05-04 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、系统、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160378851A1 (en) * | 2015-06-25 | 2016-12-29 | International Business Machines Corporation | Knowledge Canvassing Using a Knowledge Graph and a Question and Answer System |
CN108897867A (zh) * | 2018-06-29 | 2018-11-27 | 北京百度网讯科技有限公司 | 用于知识问答的数据处理方法、装置、服务器和介质 |
CN109800284A (zh) * | 2018-12-19 | 2019-05-24 | 中国电子科技集团公司第二十八研究所 | 一种面向任务的非结构化信息智能问答系统构建方法 |
CN110287209A (zh) * | 2019-06-10 | 2019-09-27 | 北京百度网讯科技有限公司 | 问答处理方法、装置、设备和存储介质 |
CN110502645A (zh) * | 2019-08-28 | 2019-11-26 | 中国联合网络通信集团有限公司 | 信息查询方法及装置 |
CN110929016A (zh) * | 2019-12-10 | 2020-03-27 | 北京爱医生智慧医疗科技有限公司 | 一种基于知识图谱的智能问答方法及装置 |
CN111259653A (zh) * | 2020-01-15 | 2020-06-09 | 重庆邮电大学 | 基于实体关系消歧的知识图谱问答方法、系统以及终端 |
CN111680133A (zh) * | 2019-03-11 | 2020-09-18 | 阿里巴巴集团控股有限公司 | 直播问答方法及装置 |
-
2020
- 2020-09-25 CN CN202011025702.7A patent/CN112182177B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160378851A1 (en) * | 2015-06-25 | 2016-12-29 | International Business Machines Corporation | Knowledge Canvassing Using a Knowledge Graph and a Question and Answer System |
CN108897867A (zh) * | 2018-06-29 | 2018-11-27 | 北京百度网讯科技有限公司 | 用于知识问答的数据处理方法、装置、服务器和介质 |
CN109800284A (zh) * | 2018-12-19 | 2019-05-24 | 中国电子科技集团公司第二十八研究所 | 一种面向任务的非结构化信息智能问答系统构建方法 |
CN111680133A (zh) * | 2019-03-11 | 2020-09-18 | 阿里巴巴集团控股有限公司 | 直播问答方法及装置 |
CN110287209A (zh) * | 2019-06-10 | 2019-09-27 | 北京百度网讯科技有限公司 | 问答处理方法、装置、设备和存储介质 |
CN110502645A (zh) * | 2019-08-28 | 2019-11-26 | 中国联合网络通信集团有限公司 | 信息查询方法及装置 |
CN110929016A (zh) * | 2019-12-10 | 2020-03-27 | 北京爱医生智慧医疗科技有限公司 | 一种基于知识图谱的智能问答方法及装置 |
CN111259653A (zh) * | 2020-01-15 | 2020-06-09 | 重庆邮电大学 | 基于实体关系消歧的知识图谱问答方法、系统以及终端 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749266A (zh) * | 2021-01-19 | 2021-05-04 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112182177B (zh) | 2024-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704743B (zh) | 一种基于知识图谱的语义搜索方法及装置 | |
CN110543517B (zh) | 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质 | |
CN106776544B (zh) | 人物关系识别方法及装置和分词方法 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN112749266B (zh) | 一种工业问答方法、装置、系统、设备及存储介质 | |
JP2020521210A (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
CN112860727B (zh) | 基于大数据查询引擎的数据查询方法、装置、设备及介质 | |
CN110019712A (zh) | 多意图查询方法和装置、计算机设备及计算机可读存储介质 | |
CN110727857A (zh) | 针对业务对象识别潜在用户的关键特征的方法及装置 | |
CN106202440B (zh) | 数据处理方法、装置及设备 | |
CN114564595A (zh) | 知识图谱更新方法、装置及电子设备 | |
CN111159334A (zh) | 用于房源跟进信息处理的方法及系统 | |
CN111198898A (zh) | 大数据查询方法及大数据查询装置 | |
CN112182177B (zh) | 一种用户问题处理方法、装置、电子设备及存储介质 | |
CN114254014A (zh) | 一种业务数据的展示方法、装置、设备及存储介质 | |
CN110019714A (zh) | 基于历史结果的多意图查询方法、装置、设备及存储介质 | |
CN112286916A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN111984797A (zh) | 客户身份识别装置及方法 | |
CN115292370A (zh) | 一种业务单据数据处理方法、装置、介质 | |
CN111737425B (zh) | 一种应答方法、装置、服务器及存储介质 | |
CN113886422A (zh) | 一种数据提取方法、装置、设备及存储介质 | |
CN103577560B (zh) | 一种输入数据库操作指令的方法和装置 | |
CN112612817A (zh) | 数据处理方法、装置、终端设备及计算机可读存储介质 | |
CN111695031A (zh) | 基于标签的搜索方法、装置、服务器及存储介质 | |
CN111311329B (zh) | 标签数据获取方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |