CN110580284B - 一种实体消歧方法、装置、计算机设备及存储介质 - Google Patents
一种实体消歧方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110580284B CN110580284B CN201910699489.9A CN201910699489A CN110580284B CN 110580284 B CN110580284 B CN 110580284B CN 201910699489 A CN201910699489 A CN 201910699489A CN 110580284 B CN110580284 B CN 110580284B
- Authority
- CN
- China
- Prior art keywords
- entity
- subtree
- user
- user portrait
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种实体消歧方法、装置、计算机设备及存储介质,包括:获取用户目标问题,并识别目标问题中第一实体;判断是否存在已构建的用户画像子树,若未建立用户画像子树,依据第一实体确定目标问题对应的回答实体,同;若已建立用户画像子树,建立以第一实体为顶点的实体子树,比较实体子树与用户画像子树的距离是否大于预设长度;若小于预设长度,选取实体子树中层级最低且与用户画像子树距离最近的实体作为目标问题对应的回答实体;若大于预设长度,依据第一实体确定目标问题对应的回答实体,从而有效利用所挖掘用户的关注点和喜好进行实体消歧,降低了问答对话系统交互轮数,提升了用户在使用问答系统时的便捷性。
Description
技术领域
本发明涉及任务管理技术领域,尤其涉及一种实体消歧方法、装置、计算机设备及存储介质。
背景技术
在知识图谱的问答系统中,实体链接是首要模块,即将用户问句中的主题实体识别出来,并与知识图谱做链接,为了确定出目标问题中的实体,需要进行实体消歧,即专门用于解决同名实体产生歧义问题的技术。目前进行实体消歧的主要方法是依靠字符串相似度,再辅以人工抽取的特征和规则,来一次性的给出可能的多个实体,并结合问句的语义来做出一定的消歧。
但在知识图谱中,相同名称的实体可能有多个,仅仅通过问题中的语义理解将很难明确用户究竟想询问的是哪一个具体的实体,因此,需要额外的信息进行实体消歧,以确定目标问题的答案。在智能对话机器人场景可以通过向用户提问的方式来做实体消歧,但是这样简单通过实体的属性来做交互式消歧,一般交互轮数比较多,用户体验不好。
发明内容
本发明的目的是提供一种实体消歧方法、装置、计算机设备及存储介质,用于解决现有技术存在的问题。
为实现上述目的,本发明提供一种实体消歧方法,包括以下步骤:
获取用户终端输入的目标问题文本,并识别所述目标问题文本中的第一实体;
判断预先构建的知识图谱中是否有所述用户的用户画像子树,其中所述用户画像子树根据所述用户的用户信息中包含的实体建立;
若未建立所述用户的用户画像子树,依据所述第一实体确定所述目标问题文本中的目标问题对应的回答实体,同时基于所述目标问题文本,建立所述用户的用户画像子树;
若已建立所述用户的用户画像子树,在知识图谱中建立以所述第一实体为顶点的实体子树,并比较所述实体子树与所述用户画像子树的距离是否大于预设长度;
若所述实体子树与所述用户画像子树之间的距离小于预设长度,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体,输出所述回答实体至所述用户终端;
若所述实体子树与所述用户画像子树之间的距离大于预设长度,依据所述第一实体确定所述目标问题对应的回答实体,并输出所述回答实体至所述用户终端,同时基于所述目标问题,更新所述用户画像子树。
优选的,所述预设长度为0,若判断出所述实体子树与所述用户画像子树存在重叠节点,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体;若所述实体子树与所述用户画像子树没有重叠节点,则依据所述第一实体确定所述目标问题对应的回答实体,同时基于本次用户目标问题文本,更新用户画像子树。
优选的,若所述实体子树中层级最低且与所述用户画像子树距离最近的实体有多个,则以最低层级的上一层节点作为所述目标问题对应的回答实体。
优选的,所述依据所述第一实体确定所述目标问题对应的回答实体包括以下步骤:
将所述第一实体与知识图谱中的实体进行比对,确定与所述第一实体匹配的第二实体:若所述知识图谱中只有一组与所述第一实体相匹配的第二实体,则以所述第二实体作为所述目标问题对应的回答实体;若所述知识图谱中有多组与所述第一实体相匹配的匹配的第二实体,则从多组第二实体中选取重要性最高的第二实体,作为所述目标问题对应的回答实体。
优选的,所述第二实体在知识图谱中所链接的其他实体个数越多,则所述第二实体的重要性越高。
优选的,基于NER模型识别所述目标问题中的第一实体。
优选的,基于Neo4j中的cypher语句功能查找以所述第一实体为顶点的实体子树。
为实现上述目的,本发明还提供一种实体消歧装置,其包括:
识别模块,用于获取用户终端输入的目标问题文本,并识别所述目标问题文本中的第一实体;
用户画像子树确定模块,用于判断预先构建的知识图谱中是否有所述用户的用户画像子树,其中所述用户画像子树根据所述用户的用户信息中包含的实体建立;
处理模块,用于依据所述用户画像子树确定所述目标问题文本中目标问题对应的回答实体,其包括:
第一处理单元,用于若未建立所述用户的用户画像子树,依据所述第一实体确定所述目标问题对应的回答实体,同时基于所述目标问题,建立所述用户的用户画像子树;
第二处理单元,用于若已建立所述用户的用户画像子树,在知识图谱中建立以所述第一实体为顶点的实体子树,并比较所述实体子树与所述用户画像子树的距离是否大于预设长度,其包括:
第一处理子单元,用于若所述实体子树与所述用户画像子树之间的距离小于预设长度,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体,输出所述回答实体至所述用户终端;
第二处理子单元,用于判断所述实体子树与所述用户画像子树之间的距离大于预设长度时,依据所述第一实体确定所述目标问题对应的回答实体,同时基于本次用户目标问题,更新用户画像子树。
作为一优选方案,所述识别模块中,基于NER模型识别所述目标问题中的第一实体。
作为一优选方案,所述用户画像子树确定模块中,基于Neo4j中的cypher语句功能查找以所述第一实体为顶点的实体子树。
作为一优选方案,第二处理子模块中所述预设长度为0,则所述第一处理单元包括:
重叠节点判断子单元,用于判断所述实体子树与所述用户画像子树是否存在重叠节点;
以及第一回答实体确定子单元,用于判断所述实体子树与所述用户画像子树存在重叠节点时,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体;以及判断所述实体子树与所述用户画像子树没有重叠节点时,依据所述第一实体确定所述目标问题对应的回答实体,同时基于本次用户目标问题文本,更新用户画像子树。
作为一优选方案,所述第一回答实体确定子单元中,若所述实体子树中层级最低且与所述用户画像子树距离最近的实体有多个,则以最低层级的上一层节点作为所述目标问题对应的回答实体。
作为一优选方案,所述第一处理模块与所述第二处理单元分别包括:
第二实体确定子单元,用于将所述第一实体与知识图谱中的实体进行比对,确定与所述第一实体匹配的第二实体:
第二回答实体确定子单元,用于判断所述知识图谱中只有一组与所述第一实体相匹配的第二实体时,以所述第二实体作为所述目标问题对应的回答实体;判断所述知识图谱中有多组与所述第一实体相匹配的匹配的第二实体时,从多组第二实体中选取重要性最高的第二实体,作为所述目标问题对应的回答实体。
进一步的,第二回答实体确定子单元中,所述第二实体在知识图谱中所链接的其他实体个数越多,则所述第二实体的重要性越高。
为实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的实体消歧方法、装置、计算机设备及存储介质,其植入于知识图谱问答对话系统之中,不断地根据用户使用来更新其用户画像子树,以有效挖掘用户的关注点和喜好,并根据用户画像子树与用户目标问题中涉及的实体子树之间的距离来精简消歧过程,当判断用户本次目标问题所涉及的实体子树与用户画像子树之间的距离小于预设长度,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为用户本次目标问题的回答实体,从而有效利用所挖掘用户的关注点和喜好进行实体消歧,避免了用户多次重复输入已提供信息的情况,降低了问答对话系统交互轮数,提升了用户在使用问答系统时的便捷性。
附图说明
图1为本发明实体消歧方法实施例一的流程图;
图2为本发明实体消歧装置实施例一的程序模块示意图;
图3为本发明实体消歧装置实施例一的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参阅图1,本实施例的一种实体消歧方法,包括以下步骤:
S10获取用户终端输入的目标问题文本,并识别所述目标问题文本中的第一实体;
S20判断预先构建的知识图谱中是否有所述用户的用户画像子树,其中所述用户画像子树根据所述用户的用户信息中包含的实体建立,所述用户画像子树随所述用户信息的更新而更新;
S30若未建立所述用户的用户画像子树,依据所述第一实体确定所述目标问题文本对应的回答实体,同时基于所述目标问题文本,建立所述用户的用户画像子树;
S40若已建立所述用户的用户画像子树,在知识图谱中建立以所述第一实体为顶点的实体子树,并比较所述实体子树与所述用户画像子树的距离是否大于预设长度;
S41若所述实体子树与所述用户画像子树之间的距离小于预设长度,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题中的目标问题对应的回答实体,输出所述回答实体至所述用户终端;
S42若所述实体子树与所述用户画像子树之间的距离大于预设长度,依据所述第一实体确定所述目标问题文本中的目标问题对应的回答实体,并输出所述回答实体至所述用户终端,同时基于所述目标问题文本,更新所述用户画像子树。
本申请所示的实体消歧方法,其植入于知识图谱问答对话系统之中,不断地根据用户使用来更新其用户画像子树,以有效挖掘用户的关注点和喜好,并根据用户画像子树与用户目标问题中涉及的实体子树之间的距离来精简消歧过程,当判断用户本次目标问题所涉及的实体子树与用户画像子树之间的距离小于预设长度,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为用户本次目标问题的回答实体,从而有效利用所挖掘用户的关注点和喜好进行实体消歧,避免了用户多次重复输入已提供信息的情况,降低了问答对话系统交互轮数,提升了用户在使用问答系统时的便捷性。
其中,步骤S10中,可基于NER模型确定提问问句中涉及的实体描述(entitymention),同时基于实体链接以根据实体描述在知识图谱中确定目标问题对应的第一实体。
步骤S20中,通过收集用户信息,识别用户信息中所包含的实体以构建用户画像子树,上述用户信息可为用户基本信息、用户关注点信息以及历次提问信息中的一种或多种组合,并通过不断地根据用户使用来更新其对应的用户画像子树,即根据用户初始画像中涉及的实体,以及该用户在使用过程中所涉及的实体,构成知识图谱上面的一个子图(即用户画像子树),如新用户开始使用问答系统服务的时候,可通过挖掘其初始注册时所填写的信息,建立该用户的用户画像子树,同时,用户使用过程中,在"关注的疾病"选项中选择了二型糖尿病,则将二型糖尿病收录至该用户的用户画像子树中,以建立并不断更新用户画像子树。若预先构建的知识图谱未收集或存储过指定用户的用户信息,则该用户未建立用户画像子树,若曾经收集或存储过指定用户的用户信息,则判断存在该用户的用户画像子树
步骤S30中,若未建立所述用户的用户画像子树,依据第一实体确定目标问题对应的回答实体包括以下步骤:
将第一实体与知识图谱中的实体进行比对,确定与第一实体匹配的第二实体:若知识图谱中只有一组与第一实体相匹配的第二实体,则以第二实体作为目标问题对应的回答实体;若知识图谱中有多组与第一实体相匹配的匹配的第二实体,则从多组第二实体中选取重要性最高的第二实体,作为目标问题对应的回答实体,其中,第二实体在知识图谱中所链接的其他实体个数越多,则对应的第二实体的重要性越高。
在申请本公开的一些示例性实施方式中,知识图谱通过三元组的形式记录其中包含的实体以及实体之间的关系,知识图谱可以采用(实体1,关系,实体2)的方式记录两个实体之间的关系,也可以采用(实体,属性,属性值)的方式记录该实体的某一属性。将第一实体与知识图谱中的实体进行比对,确定与第一实体匹配的第二实体时,可能只存在一组与第一实体匹配的第二实体,即知识图谱中只有一组第二实体与第一实体名称相同,此时,选择将唯一一组匹配的第二实体作为本次实体消歧的回答实体;也存在多组与第一实体匹配的第二实体,虽然这些第二实体与第一实体名称相同,但各组第二实体可能具有不同的含义,举例而言,如目标问题为“张三的职业是什么?”时,NER模型识别出第一实体为“张三”,当将“张三”(第一实体)与知识图谱中的实体进行比对时,会匹配出多个“张三”(第二实体),但每个“张三”(第二实体)的含义并不相同,如第二实体“张三”可以为网球运动员张三,也可以为学生张三,或者职员张三,即多个第二实体为“表示张三名称的人的集合”,此时系统计算各第二实体中在知识图谱中的重要性,经计算之后选取网球运动员张三这子结点(在知识图谱中所链接的其他实体个数最多)重要性最高的第二实体作为回答实体。
步骤S40中,在知识图谱数据库中,基于Neo4j中的cypher语句功能查找以实体为顶点的实体子树,并计算实体子树与所述用户画像子树二者之间的距离。然后比较二者之间距离与预设长度的大小。
步骤S41中,若二者距离小于预设长度,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为用户本次提问问句的回答实体;此外,若所述实体子树中层级最低且与所述用户画像子树距离最近的实体有多个,则以最低层级的上一层节点作为所述目标问题对应的回答实体。
举例说明,当用户询问“夏天适合可以吃什么水果”,系统判断该用户存在用户画像子树,系统在知识图谱中找到用户提问中以“水果”为顶点的实体子树,并通过用户画像子树知道该用户是糖尿病患者,然后基于实体子树与用户画像子树计算二者之间距离为0,则选取低糖的夏季水果这一在实体子树中层级最低且与所述用户画像子树距离最近的实体作为用户本次回答的实体,而不需要向用户进一步询问“您希望吃高糖水果还是低糖水果”,从而有效提升用户在使用问答系统时的体验。
其中,关于预设长度取值,一般取较小的数字,考虑到预设长度取值较小,消歧步骤会更多,但是会更精细;预设长度取值大一些,消歧步骤会更少,用户体验会好一些,本实施例中,在两者之间取一个折中,预设长度取值可为1、2,或0。当预设长度取值为0时,说明实体子树与用户画像子树存在重叠节点,则选取实体子树中层级最低且与用户画像子树距离最近的实体,作为目标问题对应的回答实体;若实体子树与用户画像子树没有重叠节点,则依据第一实体确定目标问题对应的回答实体,同时基于本次用户目标问题,更新用户画像子树。
步骤S42中,若实体子树与用户画像子树大于预设长度,则也直接依据第一实体确定目标问题对应的回答实体,同时基于本次用户目标问题,更新用户画像子树。
如前所述,依据第一实体确定目标问题对应的回答实体包括以下步骤:将第一实体与知识图谱中的实体进行比对,确定与第一实体匹配的第二实体:若知识图谱中只有一组与第一实体相匹配的第二实体,则以第二实体作为目标问题对应的回答实体;若知识图谱中有多组与第一实体相匹配的匹配的第二实体,则从多组第二实体中选取重要性最高的第二实体,作为目标问题对应的回答实体,其中,第二实体在知识图谱中所链接的其他实体个数越多,则对应的第二实体的重要性越高。
本申请所示的实体消歧方法,其植入于知识图谱问答对话系统之中,不断地根据用户使用来更新其用户画像子树,以有效挖掘用户的关注点和喜好,并根据用户画像子树与用户目标问题中涉及的实体子树之间的距离来精简消歧过程,当判断用户本次目标问题所涉及的实体子树与用户画像子树之间的距离小于预设长度,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为用户本次目标问题的回答实体,从而有效利用所挖掘用户的关注点和喜好进行实体消歧,避免了用户多次重复输入已提供信息的情况,降低了问答对话系统交互轮数,提升了用户在使用问答系统时的便捷性。
实施例二
请继续参阅图2,本发明示出了一种实体消歧装置,在本实施例中,实体消歧装置10可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述实体消歧方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述实体消歧装置10在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
一种实体消歧装置,包括:
识别模块11,用于获取用户终端输入的目标问题文本,并识别所述目标问题文本中的第一实体;
用户画像子树确定模块12,用于判断预先构建的知识图谱中是否有所述用户的用户画像子树,其中所述用户画像子树根据所述用户的用户信息中包含的实体建立;
处理模块13,用于依据所述用户画像子树确定所述目标问题对应的回答实体,其包括:
第一处理单元,用于若未建立所述用户的用户画像子树,依据所述第一实体确定所述目标问题对应的回答实体,同时基于所述目标问题,建立所述用户的用户画像子树;
第二处理单元,用于若已建立所述用户的用户画像子树,在知识图谱中建立以所述第一实体为顶点的实体子树,并比较所述实体子树与所述用户画像子树的距离是否大于预设长度,其包括:
第一处理子单元,用于若所述实体子树与所述用户画像子树之间的距离小于预设长度,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体,输出所述回答实体至所述用户终端;
第二处理子单元,用于判断所述实体子树与所述用户画像子树之间的距离大于预设长度时,依据所述第一实体确定所述目标问题对应的回答实体,同时基于本次用户目标问题,更新用户画像子树。
作为一优选方案,所述识别模块11中,基于NER模型识别所述目标问题中的第一实体。
作为一优选方案,所述用户画像子树确定模块12中,基于Neo4j中的cypher语句功能查找以所述第一实体为顶点的实体子树。
作为一优选方案,第二处理子模块中所述预设长度为0,则所述第一处理单元包括:
重叠节点判断子单元,用于判断所述实体子树与所述用户画像子树是否存在重叠节点;
以及第一回答实体确定子单元,用于判断所述实体子树与所述用户画像子树存在重叠节点时,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体;以及判断所述实体子树与所述用户画像子树没有重叠节点时,依据所述第一实体确定所述目标问题对应的回答实体,同时基于本次用户目标问题,更新用户画像子树。
作为一优选方案,所述第一回答实体确定子单元中,若所述实体子树中层级最低且与所述用户画像子树距离最近的实体有多个,则以最低层级的上一层节点作为所述目标问题对应的回答实体。
作为一优选方案,所述第一处理模块与所述第二处理单元分别包括:
第二实体确定子单元,用于将所述第一实体与知识图谱中的实体进行比对,确定与所述第一实体匹配的第二实体:
第二回答实体确定子单元,用于判断所述知识图谱中只有一组与所述第一实体相匹配的第二实体时,以所述第二实体作为所述目标问题对应的回答实体;判断所述知识图谱中有多组与所述第一实体相匹配的匹配的第二实体时,从多组第二实体中选取重要性最高的第二实体,作为所述目标问题对应的回答实体。
进一步的,第二回答实体确定子单元中,所述第二实体在知识图谱中所链接的其他实体个数越多,则所述第二实体的重要性越高。
本申请所示的实体消歧装置10,其植入于知识图谱问答对话系统之中,不断地根据用户使用来更新其用户画像子树,以有效挖掘用户的关注点和喜好,并根据用户画像子树与用户目标问题中涉及的实体子树之间的距离来精简消歧过程,当判断用户本次目标问题所涉及的实体子树与用户画像子树之间的距离小于预设长度,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为用户本次目标问题的回答实体,从而有效利用所挖掘用户的关注点和喜好进行实体消歧,避免了用户多次重复输入已提供信息的情况,降低了问答对话系统交互轮数,提升了用户在使用问答系统时的便捷性。
实施例三
本发明还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器22,如图3所示。需要指出的是,图3仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备20的操作系统和各类应用软件,例如实施例一的实体消歧装置10的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行实体消歧装置10,以实现实施例一的实体消歧方法。
实施例四
本发明还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储实体消歧装置10,被处理器执行时实现实施例一的实体消歧方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种实体消歧方法,其特征在于,包括:
获取用户终端输入的目标问题文本,并识别所述目标问题文本中的第一实体;
判断预先构建的知识图谱中是否有所述用户的用户画像子树,其中所述用户画像子树根据所述用户的用户信息中包含的实体建立;
若未建立所述用户的用户画像子树,依据所述第一实体确定所述目标问题文本对应的回答实体,同时基于所述目标问题文本,建立所述用户的用户画像子树;
若已建立所述用户的用户画像子树,在知识图谱中建立以所述第一实体为顶点的实体子树,并比较所述实体子树与所述用户画像子树的距离是否大于预设长度;
若所述实体子树与所述用户画像子树之间的距离小于预设长度,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题中的目标问题对应的回答实体,输出所述回答实体至所述用户终端;
若所述实体子树与所述用户画像子树之间的距离大于预设长度,依据所述第一实体确定所述目标问题文本中的目标问题对应的回答实体,并输出所述回答实体至所述用户终端,同时基于所述目标问题文本,更新所述用户画像子树。
2.根据权利要求1所述的实体消歧方法,其特征在于:所述预设长度为0,若判断所述实体子树与所述用户画像子树存在重叠节点,则选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体;若判断出所述实体子树与所述用户画像子树没有重叠节点,则依据所述第一实体确定所述目标问题对应的回答实体,同时所述目标问题文本,更新所述用户画像子树。
3.根据权利要求1或2所述的实体消歧方法,其特征在于:若所述实体子树中层级最低且与所述用户画像子树距离最近的实体有多个,则以最低层级的上一层节点作为所述目标问题对应的回答实体。
4.根据权利要求1或2所述的实体消歧方法,其特征在于,所述依据所述第一实体确定所述目标问题对应的回答实体包括以下步骤:
将所述第一实体与知识图谱中的第二实体进行比对,确定与所述第一实体匹配的第二实体:若所述知识图谱中只有一组与所述第一实体相匹配的第二实体,则以所述第二实体作为所述目标问题对应的回答实体;若所述知识图谱中有多组与所述第一实体相匹配的匹配的第二实体,则从多组第二实体中选取重要性最高的第二实体,作为所述目标问题对应的回答实体。
5.根据权利要求4所述的实体消歧方法,其特征在于,所述第二实体在知识图谱中所链接的其他实体个数越多,则所述第二实体的重要性越高。
6.根据权利要求1所述的实体消歧方法,其特征在于,基于NER模型识别所述目标问题文本中的第一实体。
7.根据权利要求1所述的实体消歧方法,其特征在于,基于Neo4j中的cypher语句功能查找以所述第一实体为顶点的实体子树。
8.一种实体消歧装置,其特征在于,包括:
识别模块,用于获取用户终端输入的目标问题文本,并识别所述目标问题文本中的第一实体;
用户画像子树确定模块,用于判断预先构建的知识图谱中是否有所述用户的用户画像子树,其中所述用户画像子树根据所述用户的用户信息中包含的实体建立;
处理模块,用于依据所述用户画像子树确定所述目标问题文本中目标问题对应的回答实体,其包括:
第一处理单元,用于若未建立到所述用户的用户画像子树,依据所述第一实体确定所述目标问题对应的回答实体,同时基于所述目标问题文本,建立所述用户的用户画像子树;
第二处理单元,用于若已建立所述用户的用户画像子树,在知识图谱中建立以所述第一实体为顶点的实体子树,并比较所述实体子树与所述用户画像子树的距离是否大于预设长度,其包括:
第一处理子单元,用于若所述实体子树与所述用户画像子树之间的距离小于预设长度,选取所述实体子树中层级最低且与所述用户画像子树距离最近的实体,作为所述目标问题对应的回答实体,输出所述回答实体至所述用户终端;
第二处理子单元,用于判断所述实体子树与所述用户画像子树之间的距离大于预设长度时,依据所述第一实体确定所述目标问题对应的回答实体,同时基于本次用户目标问题文本,更新用户画像子树。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910699489.9A CN110580284B (zh) | 2019-07-31 | 2019-07-31 | 一种实体消歧方法、装置、计算机设备及存储介质 |
PCT/CN2020/099471 WO2021017734A1 (zh) | 2019-07-31 | 2020-06-30 | 一种实体消歧方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910699489.9A CN110580284B (zh) | 2019-07-31 | 2019-07-31 | 一种实体消歧方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110580284A CN110580284A (zh) | 2019-12-17 |
CN110580284B true CN110580284B (zh) | 2023-08-18 |
Family
ID=68810869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910699489.9A Active CN110580284B (zh) | 2019-07-31 | 2019-07-31 | 一种实体消歧方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110580284B (zh) |
WO (1) | WO2021017734A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110580284B (zh) * | 2019-07-31 | 2023-08-18 | 平安科技(深圳)有限公司 | 一种实体消歧方法、装置、计算机设备及存储介质 |
CN111259653B (zh) * | 2020-01-15 | 2022-06-24 | 重庆邮电大学 | 基于实体关系消歧的知识图谱问答方法、系统以及终端 |
CN115203436B (zh) * | 2022-07-15 | 2023-12-15 | 国网江苏省电力有限公司信息通信分公司 | 一种基于有向图数据融合的电力知识图谱构建方法和装置 |
CN117556058B (zh) * | 2024-01-11 | 2024-05-24 | 安徽大学 | 知识图谱增强网络嵌入的作者名称消歧方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484764A (zh) * | 2016-08-30 | 2017-03-08 | 江苏名通信息科技有限公司 | 基于人群画像技术的用户相似度计算方法 |
CN108964998A (zh) * | 2018-07-06 | 2018-12-07 | 北京建筑大学 | 一种网络实体行为奇异性检测方法及装置 |
CN109657135A (zh) * | 2018-11-13 | 2019-04-19 | 华南理工大学 | 一种基于神经网络的学者用户画像信息抽取方法及模型 |
CN110046238A (zh) * | 2019-03-29 | 2019-07-23 | 华为技术有限公司 | 对话交互方法、图形用户界面、终端设备以及网络设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10628458B2 (en) * | 2017-01-31 | 2020-04-21 | Walmart Apollo, Llc | Systems and methods for automated recommendations |
CN110019836A (zh) * | 2017-08-23 | 2019-07-16 | 中兴通讯股份有限公司 | 一种智能问答方法及装置 |
CN109241251B (zh) * | 2018-07-27 | 2022-05-27 | 众安信息技术服务有限公司 | 一种会话交互方法 |
CN110580284B (zh) * | 2019-07-31 | 2023-08-18 | 平安科技(深圳)有限公司 | 一种实体消歧方法、装置、计算机设备及存储介质 |
-
2019
- 2019-07-31 CN CN201910699489.9A patent/CN110580284B/zh active Active
-
2020
- 2020-06-30 WO PCT/CN2020/099471 patent/WO2021017734A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106484764A (zh) * | 2016-08-30 | 2017-03-08 | 江苏名通信息科技有限公司 | 基于人群画像技术的用户相似度计算方法 |
CN108964998A (zh) * | 2018-07-06 | 2018-12-07 | 北京建筑大学 | 一种网络实体行为奇异性检测方法及装置 |
CN109657135A (zh) * | 2018-11-13 | 2019-04-19 | 华南理工大学 | 一种基于神经网络的学者用户画像信息抽取方法及模型 |
CN110046238A (zh) * | 2019-03-29 | 2019-07-23 | 华为技术有限公司 | 对话交互方法、图形用户界面、终端设备以及网络设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110580284A (zh) | 2019-12-17 |
WO2021017734A1 (zh) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110580284B (zh) | 一种实体消歧方法、装置、计算机设备及存储介质 | |
US10120876B2 (en) | Unguided application crawling architecture | |
CN110532397B (zh) | 基于人工智能的问答方法、装置、计算机设备及存储介质 | |
US11321361B2 (en) | Genealogical entity resolution system and method | |
EP2626831A1 (en) | Tag Inheritance | |
US11232134B2 (en) | Customized visualization based intelligence augmentation | |
US10268655B2 (en) | Method, device, server and storage medium of searching a group based on social network | |
CN111324535B (zh) | 一种控件异常检测方法、装置和计算机设备 | |
CN110502740B (zh) | 问句实体识别与链接方法、装置、计算机设备及存储介质 | |
CN108427702A (zh) | 目标文档获取方法及应用服务器 | |
CN112883030A (zh) | 数据收集方法、装置、计算机设备和存储介质 | |
US20170235464A1 (en) | Computerized Search System Providing Nested Application Card Results | |
CN110569419A (zh) | 问答系统优化方法、装置、计算机设备及存储介质 | |
CN116662583B (zh) | 一种文本生成方法、地点检索方法及相关装置 | |
US8257091B2 (en) | Matching learning objects with a user profile using top-level concept complexity | |
WO2019080419A1 (zh) | 标准知识库的构建方法、电子装置及存储介质 | |
CN115544214B (zh) | 一种事件处理方法、设备及计算机可读存储介质 | |
CN112860869B (zh) | 基于分层强化学习网络的对话方法、装置及存储介质 | |
CN114218378A (zh) | 一种基于知识图谱的内容推送方法、装置、设备及介质 | |
CN113868481A (zh) | 组件获取方法、装置及电子设备和存储介质 | |
US20190385715A1 (en) | Systems and methods for facilitating computer-assisted linkage of healthcare records | |
CN111310016A (zh) | 标签挖掘方法、装置、服务器和存储介质 | |
CN112199380B (zh) | 账户信息修改方法、装置、电子设备和存储介质 | |
CN117787290A (zh) | 基于知识图谱的绘图提示方法和装置 | |
CN115544041A (zh) | 一种合并冲突的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |