CN111414459A - 人物关系获取方法、装置、电子设备及存储介质 - Google Patents

人物关系获取方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111414459A
CN111414459A CN201811577413.0A CN201811577413A CN111414459A CN 111414459 A CN111414459 A CN 111414459A CN 201811577413 A CN201811577413 A CN 201811577413A CN 111414459 A CN111414459 A CN 111414459A
Authority
CN
China
Prior art keywords
character
relationship
person
sentence
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811577413.0A
Other languages
English (en)
Other versions
CN111414459B (zh
Inventor
徐晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201811577413.0A priority Critical patent/CN111414459B/zh
Publication of CN111414459A publication Critical patent/CN111414459A/zh
Application granted granted Critical
Publication of CN111414459B publication Critical patent/CN111414459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本申请实施例提供一种人物关系获取方法、装置、电子设备及存储介质,属于数据处理领域。该方法通过预先构建的人物拓扑关系,确定待处理语句中的主人物与每个其他人物之间的链接关系,再基于该链接关系,可以直接确定主人物与最后出现在待处理语句中的目标人物之间的人物关系,相对比现有技术中在信息缺失时无法确定最后的人物关系或者在信息错误时获得错误的人物关系结果,本方案可以直接获得主人物与目标人物的人物关系,从而可以提高获得的人物关系的准确性。

Description

人物关系获取方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理领域,具体而言,涉及一种人物关系获取方法、装置、电子设备及存储介质。
背景技术
现有的智能问答系统中,该系统可以基于用户输入的查询语句做出相应的回答,比如查询语句为推导家族亲缘关系,如查询语句为“李某的儿子的曾爷爷的堂弟是谁”,现有技术是基于“李某”建立了关于“李某”的家族关系图谱,在获取查询语句对应的查询结果的过程中,需先查找到李某的儿子是谁,然后在基于李某的儿子查找到儿子的曾爷爷是谁,最后再查找曾爷爷的堂弟是谁,但是若中间的某个信息错误或者缺失,如若李某的儿子信息是错误或缺失的,则可能获得错误的查询结果或者无法获得查询结果,即向用户返回错误的查询结果或空的查询结果。
发明内容
本申请实施例的目的在于提供一种人物关系获取方法、装置、电子设备及存储介质,以提高获得的人物关系的准确性。
第一方面,本申请实施例提供了一种人物关系获取方法,应用于一电子设备,所述方法包括:获取用户通过输入设备输入的待处理语句;对所述待处理语句进行拆分,获得多个关键词;判断所述多个关键词中是否包含多个人物的多个人物称谓;在为是时,基于所述多个人物称谓从所述多个人物中确定主人物,以及读取并调用预先存储在所述电子设备中的人物拓扑关系;基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系;基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
在上述实现过程中,可以通过预先构建的人物拓扑关系,确定待处理语句中的主人物与每个其他人物之间的链接关系,再基于该链接关系,可以直接确定主人物与最后出现在待处理语句中的目标人物之间的人物关系,相对比现有技术中在信息缺失时无法确定最后的人物关系或者在信息错误时获得错误的人物关系结果,本方案可以直接获得主人物与目标人物的人物关系,从而可以提高获得的人物关系的准确性。
可选地,对所述待处理语句进行拆分,获得多个关键词,包括:对所述待处理语句进行分词,获得多个分词;将所述多个分词根据预设停留词表进行去停留词处理,获得多个关键词。
在上述实现过程中,通过对待处理语句进行分词后再进行去停留词处理,获得多个关键词,从而可以去掉多个分词中无用的词,获得有用的多个关键词,为后续对多个关键词进行处理提供了帮助。
可选地,对所述待处理语句进行分词,获得多个分词,包括:采用结巴分词方法、基于字符串匹配的匹配方法、基于理解的分词方法或基于统计的分词方法对所述待处理语句进行分词,获得多个分词。
在上述实现过程中,采用这些分词算法可以获得准确的分词结果。
可选地,判断所述多个关键词中是否包含多个人物的多个人物称谓,包括:从所述电子设备中调用预先存储的预设人物称谓词库;根据所述预设人物称谓词库,判断所述多个关键词中是否包含至少三个人物称谓。
在上述实现过程中,由于预设人物称谓词库预先包括有多个人物称谓,所以可通过数据比对,判断多个关键词是否包含至少三个人物称谓,提高了数据处理效率。
可选地,基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系,包括:基于所述人物拓扑关系,获取所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物在所述人物拓扑关系中的标准称谓;确定所述主人物与每个其他人物在所述人物拓扑关系中的标准称谓之间的链接关系,共获得至少两个链接关系。
在上述实现过程中,在多个人物称谓不是人物拓扑关系中的标准称谓时,可能对后续处理过程有影响,所以可将不是标准称谓的人物称谓转换为标准称谓后再进行后续的处理,从而可以便于继续后续处理过程。
可选地,基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系,包括:获取所述至少两个链接关系中每个链接关系的至少一个关系节点,共获得M个关系节点,M为大于等于2的整数;按照所述多个人物称谓在所述待处理语句中的出现顺序,将所述主人物与所述M个关系节点进行排序,获得排序结果;根据所述排序结果确定所述M个关系节点中与所述主人物相邻的第一个关系节点,基于所述主人物与所述第一个关系节点生成第一个当前人物关系,并基于所述第一个当前人物关系与第二个关系节点生成第二个当前人物关系;依次取i为2到M,获取第i个当前人物关系与第i+1个关系节点生成第i+1个当前人物关系,所述第i个当前人物关系为基于第i-1个当前人物关系与第i个关系节点生成的,当i为M时,获得第M个当前人物关系;将所述第M个当前人物关系确定为所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
在上述实现过程中,实质上是利用广度优先节点搜索算法对预先建立的人物拓扑关系进行处理获得最后的主人物与目标人物之间的人物关系,由此可以直接获得主人物与目标人物的人物关系,从而可以提高获得的人物关系的准确性。
可选地,基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系之后,还包括:根据所述人物关系获得所述待处理语句的处理结果;将所述处理结果发送至所述用户的输入设备。
在上述实现过程中,通过将处理结果发送至用户的输入设备,便于用户可以直接从输入设备查看到对待处理语句的处理结果,完成对待处理语句的查询。
第二方面,本申请实施例提供了一种人物关系获取装置,运行于一电子设备,所述装置包括:
语句获取模块,用于获取用户通过输入设备输入的待处理语句;
语句拆分模块,用于对所述待处理语句进行拆分,获得多个关键词;
判断模块,用于判断所述多个关键词中是否包含多个人物的多个人物称谓;
确定模块,用于在所述多个关键词中包含多个人物的多个人物称谓时,基于所述多个人物称谓从所述多个人物中确定主人物,以及读取并调用预先存储在所述电子设备中的人物拓扑关系;
链接关系获取模块,用于基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系;
人物关系获取模块,用于基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
可选地,所述语句拆分模块,用于对所述待处理语句进行分词,获得多个分词;将所述多个分词根据预设停留词表进行去停留词处理,获得多个关键词。
可选地,所述语句拆分模块,还用于采用结巴分词方法、基于字符串匹配的匹配方法、基于理解的分词方法或基于统计的分词方法对所述待处理语句进行分词,获得多个分词。
可选地,所述判断模块,用于从所述电子设备中调用预先存储的预设人物称谓词库;根据所述预设人物称谓词库,判断所述多个关键词中是否包含至少三个人物称谓。
可选地,所述链接关系获取模块,用于基于所述人物拓扑关系,获取所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物在所述人物拓扑关系中的标准称谓;确定所述主人物与每个其他人物在所述人物拓扑关系中的标准称谓之间的链接关系,共获得至少两个链接关系。
可选地,所述人物关系获取模块,具体用于:
获取所述至少两个链接关系中每个链接关系的至少一个关系节点,共获得M个关系节点,M为大于等于2的整数;
按照所述多个人物称谓在所述待处理语句中的出现顺序,将所述主人物与所述M个关系节点进行排序,获得排序结果;
根据所述排序结果确定所述M个关系节点中与所述主人物相邻的第一个关系节点,基于所述主人物与所述第一个关系节点生成第一个当前人物关系,并基于所述第一个当前人物关系与第二个关系节点生成第二个当前人物关系;
依次取i为2到M,获取第i个当前人物关系与第i+1个关系节点生成第i+1个当前人物关系,所述第i个当前人物关系为基于第i-1个当前人物关系与第i个关系节点生成的,当i为M时,获得第M个当前人物关系;
将所述第M个当前人物关系确定为所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
可选地,所述装置还包括:
处理结果获取模块,用于根据所述人物关系获得所述待处理语句的处理结果;
处理结果发送模块,用于将所述处理结果发送至所述用户的输入设备。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种人物关系获取方法的流程图;
图2为本申请实施例提供的一种预先构建的人物拓扑关系的可视化结构图;
图3为本申请实施例提供的一种人物关系获取方法中步骤S160的流程图;
图4为本申请实施例提供的一种应用实施例的结构示意图;
图5为本申请实施例提供的一种人物关系获取装置的结构框图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1为本申请实施例提供的一种人物关系获取方法的流程图,所述方法包括如下步骤:
步骤S110:获取用户通过输入设备输入的待处理语句。
本实施例中的方法可以应用于下述的电子设备,该电子设备可以是服务器等终端设备,用户的输入设备可以指用户终端,用户终端可以为是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digital assistant,PDA)、可穿戴设备等终端。
若用户想要查询谁和谁的关系是怎么样的,则可先在输入设备上输入对应的待处理语句,该待处理语句包括有想要推理的人物关系,如“黄某的曾爷爷的儿子的儿媳妇是谁”,或者如“黄某的儿子是谁”等形式的语句。
步骤S120:对所述待处理语句进行拆分,获得多个关键词。
由于待处理语句为连续的句子,所以,需要对待处理语句进行拆分,获得多个关键词。
其中,对待处理语句进行拆分,获得多个关键词即是对待处理语句进行分词处理获得多个关键词的过程,其采用的分词方法有:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法等。
下面分别对上述的三种分词方法进行介绍。
基于字符串匹配的分词方法:该方法又称机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(即识别出一个词)。
按照扫描方向的不同,字符串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,可以分为单纯分词方法和分词与词性标注相结合的一体化方法,常用的字符串匹配方法有如下几种:正向最大匹配法、逆向最大匹配法、最小切分法和双向最大匹配法。
在基于字符串匹配的分词方法的基础上还有一种正向最大增字匹配分词算法,正向最大增字匹配分词算法实现思想是准备一个分词的词典,然后利用算法对输入的语句(如待处理语句)进行从左到右进行扫描,其目的是将待处理语句中的字符串与词典中的词条进行逐个匹配。匹配字段是从一个字开始,匹配中不断增字,直到匹配不下去为止,每一轮结束得到的结果,取最大的可以匹配成功的当前匹配字段,例如,输入的待处理语句为“黄某的曾爷爷的儿子的儿媳妇是谁”,词典中有“黄某”、“曾爷爷”、“儿子”、“儿媳妇”等词,然后从“黄”字开始,向后依次扫描,分别取“黄”、“黄某”、“黄某的”、“黄某的曾”等进行匹配,词典中最长的匹配字符串是“黄某”,那么该词被切分出来,接下来从“的”字开始扫描,重复上述操作,结果为“黄某/的/曾爷爷/的/儿子/的/儿媳妇/是/谁/”,由此可对待处理语句进行分词处理,获得多个分词。
基于字符串匹配的分词方法的优点是速度快,时间复杂度可以保持在O(n),实现简单,效果较佳。
基于理解的分词方法:该方法是通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。通常包括三部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语音知识和信息。
基于统计的分词方法:该方法是在给定大量已经分词的文本的前提下,利用统计机器学习模型学习词语切分的规律,即训练,从而实现对未知文本的切分。例如最大概率分词方法和最大熵分词方法等。其中,主要的统计机器学习模型有:N元文法模型、隐马尔科夫模型、最大熵模型、条件随机场模型等。
在实际应用中,基于统计的分词系统都需要使用分词词典来进行字符串匹配分词,同时使用统计方法是把一些新词,即将字符串频率统计和字符串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。
另外,还可利用分词工具进行分词,常用的分词工具有结巴分词、SnowNLP分词(python写的类库)、中文词汇分析器(THU Lexical Analyzer for Chinese,THULAC)分词、汉语分词系统NLPIR等分词工具。
由于采用上述方法对待处理语句进行分词处理获得多个分词,如果将多个分词作为多个关键词,则很可能多个关键词中包含有无语的词,如介词等,所以,可以对待处理语句进行分词,获得多个分词,将该多个分词根据预设停留词表进行去停留词处理,获得多个关键词。
通过对待处理语句进行分词后再进行去停留词处理,获得多个关键词,从而可以去掉多个分词中无用的词,获得有用的多个关键词,为后续对多个关键词进行处理提供了帮助。
其中,可以采用结巴分词方法、基于字符串匹配的匹配方法、基于理解的分词方法或基于统计的分词方法对该待处理语句进行分词,获得多个分词,具体可参照上述描述过程,采用这些分词算法可以获得准确的分词结果。
并且,根据预设停留词表自动过滤掉没有实际意义的词汇,如介词、冠词、语气助词、副词、连接词以及标点等。如上述的多个分词为“黄某/的/曾爷爷/的/儿子/的/儿媳妇/是/谁/”,对其进行去停留词处理后,获得的多个关键词为:黄某、曾爷爷、儿子、儿媳妇。
步骤S130:判断所述多个关键词中是否包含多个人物的多个人物称谓。
从上述步骤中获得待处理语句中的多个关键词,为了进行人物关系获取,所述还需判断多个关键词中是否包含多个人物的多个人物称谓,其中,人物称谓可以是指姓名、以及其他关系称谓,如爸爸、妈妈、祖父、儿子等称谓。
若从待处理语句为“你周末要不要去xx公园玩?”,对其进行关键词提取,获得多个关键词为“你、周末、xx公园”,显然,该多个关键词中只包含一个人物称谓“你”,所以该多个关键词不满足条件,若获得的多个关键词为“黄某、曾爷爷、儿子、儿媳妇”,则该多个关键词中包含多个人物称谓“黄某、曾爷爷、儿子、儿媳妇”,所以,该多个关键词满足条件。
在判断多个关键词中包含有多个人物的多个人物称谓时,执行步骤S140:基于所述多个人物称谓从所述多个人物中确定主人物,以及读取并调用预先存储在所述电子设备中的人物拓扑关系。
主人物可以是指第一个出现在待处理语句中的人物称谓,或者是待处理语句的主语,如上述的“黄某”,若待处理语句为“我的父亲的堂弟是谁”,其中的主人物为“我”。
人物拓扑关系是预先建立好并存储在电子设备中的,其是预先通过标注、数据爬取的方式,产生称谓的同义词表,比如:父亲的同义词为“爹、老爸、爸爸、爹地、爹啊”等,母亲的同义词为“妈妈、娘、母上”等,祖父的同义词为“爷爷、奶爷、爷”等,在人物拓扑关系中包括人物实体称谓和其同义词组成,如人物实体称谓“父亲”和其同义词“爹、老爸、爸爸、爹地、爹啊”组成。
人物拓扑关系中是以主人物为中心,向外拓展拓扑关系,其中包括称谓间的10种基本关系:父、母、子、女、兄、弟、姐、妹、夫、妻,这10种关系涵盖了与某个人之间相关的所有家族关系。
其中,以主人物“我”为中心词,依次向外拓展这10种基本关系,通过数据爬取、人工标注、文本理解的方式产生如下数据:父亲=父,祖父=父-父,伯伯=父-兄,等数据。
基于这些数据,构建上述的人物拓扑关系,该人物拓扑关系中的每个节点是一个标准称为,每个边是定义的10种基本关系中的一种,如图2所示,图2为构建的人物拓扑关系的可视化结构图。
需要说明的是,每个节点对应有其相应的同义词,在图2中并未进行显示。
在构建好上述的人物拓扑关系后,将该人物拓扑关系存储在电子设备中。
步骤S150:基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系。
以待处理语句为“黄某的曾爷爷的儿子的儿媳妇是谁”为例进行说明,其确定的主人物为“黄某”,“黄某”即对应人物拓扑关系中的“我”,其他人物为“曾爷爷、儿子、儿媳妇”,根据人物拓扑关系,确定主人物“黄某”与分别其他人物“曾爷爷、儿子、儿媳妇”之间的链接关系,如获取“黄某”与“曾爷爷”的链接关系
需要说明的是,由于人物拓扑关系中存储的是人物标准称谓,而获取的多个关键词中包含的人物称谓不是标准称谓,则还需将多个关键词中的人物称谓进行同义词转换,转换为人物拓扑关系中的标准称谓,即基于所述人物拓扑关系,获取所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物在所述人物拓扑关系中的标准称谓;确定所述主人物与每个其他人物在所述人物拓扑关系中的标准称谓之间的链接关系,共获得至少两个链接关系。
例如,在人物拓扑关系中“曾爷爷”的的标准称谓为“曾祖父”,所以,还需将“曾爷爷”进行同义词替换为“曾祖父”,如下表1所示:
表1
Figure BDA0001911723690000121
而根据人物拓扑关系,“黄某”与“曾爷爷”的链接关系为“父-父-父”,“黄某”与“儿子”的链接关系为“子”,“黄某”与“儿媳妇”的链接关系为“子-妻”,所以,获得如表2所示的链接关系:
表2
Figure BDA0001911723690000122
所以,在多个人物称谓不是人物拓扑关系中的标准称谓时,可能对后续处理过程有影响,所以可将不是标准称谓的人物称谓转换为标准称谓后再进行后续的处理,从而可以便于继续后续处理过程。
步骤S160:基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
其中,目标人物为上述的“儿媳妇”,即最后出现在待处理语句中的人物称谓,根据上述的链接关系,确定主人物与目标人物之间的人物关系,即确定“黄某”与“儿媳妇”之间的人物关系,也就是说,最后获得的是“黄某”与“儿媳妇”之间的人物关系,而不是获得“儿子”与“儿媳妇”之间的人物关系。
所以,本申请实施例中,可以通过预先构建的人物拓扑关系,确定待处理语句中的主人物与每个其他人物之间的链接关系,再基于该链接关系,可以直接确定主人物与最后出现在待处理语句中的目标人物之间的人物关系,相对比现有技术中在信息缺失时无法确定最后的人物关系或者在信息错误时获得错误的人物关系结果,本方案可以直接获得主人物与目标人物的人物关系,从而可以提高获得的人物关系的准确性。
另外,在上述实施例中,判断多个关键词是否包含多个人物的多个人物称谓的方式还可以为:从电子设备中调用预先存储的预设人物称谓词库,再根据该预设人物称谓词库,判断该多个关键词中是否包含至少三个人物称谓。
例如,预设人物称谓词库包括有上述的人物拓扑关系中各个节点的称谓,如“我”,“父亲”和其同义词“爹、老爸、爸爸、爹地、爹啊”等,“母亲”和其同义词“妈妈、娘、母上”等,“祖父”和其同义词为“爷爷、奶爷、爷”等,当然,该预设人物称谓词库中还可包括有多个姓名,所以,可以提取出待处理语句中的多个关键词后,查找预设人物称谓词库,判断该多个关键词中是否有预设人物称谓词库中的至少三个人物称谓,若判断多个关键词中包含有至少三个人物称谓,则执行步骤S140。
由于预设人物称谓词库预先包括有多个人物称谓,所以可通过数据比对,判断多个关键词是否包含至少三个人物称谓,提高了数据处理效率。
另外,若待处理语句中没有包含姓名时,如待处理语句为“我的爷爷的堂弟是谁”,此时无法知道“我”是谁,即无法确定主人物,则可电子设备可从输入设备中“我”的账号关联的姓名获取,若用户是通过输入设备中的某个应用输入的待处理语句,一般用户在注册该应用时需填写自己的姓名、性别等个人信息,所以,可直接从账号关联的姓名获得“我”对应的姓名,从而确定待处理语句中的主人物。
或者,在获取待处理语句中的多个关键词时,还可以命名实体识别(Named EntityRecognition,NER)算法获取待处理语句中的多个关键词,NER可以识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,所以通过NER算法可以获取待处理语句中的多个关键词,即可直接从待处理语句中获取多个人物称谓。
作为一种可能的实施方式,如图3所示,步骤S160包括如下步骤:
步骤S161:获取所述至少两个链接关系中每个链接关系的至少一个关系节点,共获得M个关系节点。
其中,M为大于等于2的整数。如表2所示,“黄某”与“曾爷爷”的链接关系为“父-父-父”,其对应的关系节点为“父,父,父”,“黄某”与“儿子”的链接关系为“子”,其对应的关系节点为“子”,“黄某”与“儿媳妇”的链接关系为“子-妻”,其对应的关系节点为“子,妻”,所以,共获得6个关系节点,即M=6。
步骤S162:按照所述多个人物称谓在所述待处理语句中的出现顺序,将所述主人物与所述M个关系节点进行排序,获得排序结果。
以上述待处理语句为“黄某的曾爷爷的儿子的儿媳妇是谁”为例,将所述主人物与所述M个关系节点进行排序,获得排序结果,其排序结果为:黄某、父、父、父、子、子、妻。
步骤S163:根据所述排序结果确定所述M个关系节点中与所述主人物相邻的第一个关系节点,基于所述主人物与所述第一个关系节点生成第一个当前人物关系,并基于所述第一个当前人物关系与第二个关系节点生成第二个当前人物关系。
在上述排序结果中,与主人物相邻的第一关系节点为“父”,根据预先构建的人物拓扑关系,该主人物与第一个关系节点生成的第一个当前人物关系为“父亲”,第二个关系节点为“父”,第一个当前人物“父亲”与第二个关系节点“父”生成的第二个当前人物关系“祖父”。
步骤S164:依次取i为2到M,获取第i个当前人物关系与第i+1个关系节点生成第i+1个当前人物关系。
其中,所述第i个当前人物关系为基于第i-1个当前人物关系与第i个关系节点生成的,当i为M时,获得第M个当前人物关系。
以步骤S163中的方式,可以获得第6个当前人物关系,例如,在i为2时,获取第2个当前人物关系“祖父”与第3个关系节点“父”生成的第3个当前人物关系为“曾祖父”;当i为3时,获取第3个当前人物关系“曾祖父”与第4个关系节点“子”生成的第4个当前人物关系为“伯祖父”、“叔祖父”和“祖父”;当i为4时,获取第4个当前人物关系“伯祖父”、“叔祖父”和“祖父”分别与第5个关系节点“子”生成的第5个当前人物关系为“堂伯”、“堂叔”、“伯伯”和“叔叔”;当i为5时,获取第5个当前人物关系“堂伯”、“堂叔”、“伯伯”和“叔叔”分别与第6个关系节点“妻”生成的第6个当前人物关系为“堂母”、“堂婶”、“伯母”和“婶婶”。
步骤S165:将所述第M个当前人物关系确定为所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
当M=6时,将上述获得的第6个当前人物关系“堂母”、“堂婶”、“伯母”和“婶婶”为主人物“黄某”与目标人物“儿媳妇”之间的人物关系,即上述待处理语句“黄某的曾爷爷的儿子的儿媳妇是谁”实质上等于“黄某的堂母、堂婶、伯母和婶婶是谁”。
上述步骤S160的具体实现过程可参见图4,其实质上是利用广度优先节点搜索算法对预先建立的人物拓扑关系进行处理获得的,由此可以直接获得主人物与目标人物的人物关系,从而可以提高获得的人物关系的准确性。。
在获得上述的人物关系后,即可根据该人物关系获得对待处理语句进行处理的处理结果,即输出“黄某的堂母、堂婶、伯母和婶婶的姓名”,并将该处理结果发送至用户的输入设备,从而便于用户可在输入设备上查看该处理结果,完成对待处理语句的查询。
请参照图5,图5为本申请实施例提供的一种人物关系获取装置200的结构框图,该装置运行于电子设备,所述装置包括:
语句获取模块210,用于获取用户通过输入设备输入的待处理语句;
语句拆分模块220,用于对所述待处理语句进行拆分,获得多个关键词;
判断模块230,用于判断所述多个关键词中是否包含多个人物的多个人物称谓;
确定模块240,用于在所述多个关键词中包含多个人物的多个人物称谓时,基于所述多个人物称谓从所述多个人物中确定主人物,以及读取并调用预先存储在所述电子设备中的人物拓扑关系;
链接关系获取模块250,用于基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系;
人物关系获取模块260,用于基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
可选地,所述语句拆分模块220,用于对所述待处理语句进行分词,获得多个分词;将所述多个分词根据预设停留词表进行去停留词处理,获得多个关键词。
可选地,所述语句拆分模块220,还用于采用结巴分词方法、基于字符串匹配的匹配方法、基于理解的分词方法或基于统计的分词方法对所述待处理语句进行分词,获得多个分词。
可选地,所述判断模块230,用于从所述电子设备中调用预先存储的预设人物称谓词库;根据所述预设人物称谓词库,判断所述多个关键词中是否包含至少三个人物称谓。
可选地,所述链接关系获取模块250,用于基于所述人物拓扑关系,获取所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物在所述人物拓扑关系中的标准称谓;确定所述主人物与每个其他人物在所述人物拓扑关系中的标准称谓之间的链接关系,共获得至少两个链接关系。
可选地,所述人物关系获取模块260,具体用于:
获取所述至少两个链接关系中每个链接关系的至少一个关系节点,共获得M个关系节点,M为大于等于2的整数;
按照所述多个人物称谓在所述待处理语句中的出现顺序,将所述主人物与所述M个关系节点进行排序,获得排序结果;
根据所述排序结果确定所述M个关系节点中与所述主人物相邻的第一个关系节点,基于所述主人物与所述第一个关系节点生成第一个当前人物关系,并基于所述第一个当前人物关系与第二个关系节点生成第二个当前人物关系;
依次取i为2到M,获取第i个当前人物关系与第i+1个关系节点生成第i+1个当前人物关系,所述第i个当前人物关系为基于第i-1个当前人物关系与第i个关系节点生成的,当i为M时,获得第M个当前人物关系;
将所述第M个当前人物关系确定为所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
可选地,所述装置还包括:
处理结果获取模块,用于根据所述人物关系获得所述待处理语句的处理结果;
处理结果发送模块,用于将所述处理结果发送至所述用户的输入设备。
请参照图6,图6为本申请实施例提供的一种电子设备的结构示意图,所述电子设备可以包括:至少一个处理器110,例如CPU,至少一个通信接口120,至少一个存储器130和至少一个通信总线140。其中,通信总线140用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口120用于与其他节点设备进行信令或数据的通信。存储器130可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器130可选的还可以是至少一个位于远离前述处理器的存储装置。存储器130中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器110执行时,电子设备执行上述图1所示方法过程。
本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图1所示方法实施例中电子设备所执行的方法过程。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本申请实施例提供一种人物关系获取方法、装置、电子设备及存储介质,该方法通过预先构建的人物拓扑关系,确定待处理语句中的主人物与每个其他人物之间的链接关系,再基于该链接关系,可以直接确定主人物与最后出现在待处理语句中的目标人物之间的人物关系,相对比现有技术中在信息缺失时无法确定最后的人物关系或者在信息错误时获得错误的人物关系结果,本方案可以直接获得主人物与目标人物的人物关系,从而可以提高获得的人物关系的准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (16)

1.一种人物关系获取方法,其特征在于,应用于一电子设备,所述方法包括:
获取用户通过输入设备输入的待处理语句;
对所述待处理语句进行拆分,获得多个关键词;
判断所述多个关键词中是否包含多个人物的多个人物称谓;
在为是时,基于所述多个人物称谓从所述多个人物中确定主人物,以及读取并调用预先存储在所述电子设备中的人物拓扑关系;
基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系;
基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
2.根据权利要求1所述的方法,其特征在于,对所述待处理语句进行拆分,获得多个关键词,包括:
对所述待处理语句进行分词,获得多个分词;
将所述多个分词根据预设停留词表进行去停留词处理,获得多个关键词。
3.根据权利要求2所述的方法,其特征在于,对所述待处理语句进行分词,获得多个分词,包括:
采用结巴分词方法、基于字符串匹配的匹配方法、基于理解的分词方法或基于统计的分词方法对所述待处理语句进行分词,获得多个分词。
4.根据权利要求1-3中任一权项所述的方法,其特征在于,判断所述多个关键词中是否包含多个人物的多个人物称谓,包括:
从所述电子设备中调用预先存储的预设人物称谓词库;
根据所述预设人物称谓词库,判断所述多个关键词中是否包含至少三个人物称谓。
5.根据权利要求1-3中任一权项所述的方法,其特征在于,基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系,包括:
基于所述人物拓扑关系,获取所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物在所述人物拓扑关系中的标准称谓;
确定所述主人物与每个其他人物在所述人物拓扑关系中的标准称谓之间的链接关系,共获得至少两个链接关系。
6.根据权利要求5所述的方法,其特征在于,基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系,包括:
获取所述至少两个链接关系中每个链接关系的至少一个关系节点,共获得M个关系节点,M为大于等于2的整数;
按照所述多个人物称谓在所述待处理语句中的出现顺序,将所述主人物与所述M个关系节点进行排序,获得排序结果;
根据所述排序结果确定所述M个关系节点中与所述主人物相邻的第一个关系节点,基于所述主人物与所述第一个关系节点生成第一个当前人物关系,并基于所述第一个当前人物关系与第二个关系节点生成第二个当前人物关系;
依次取i为2到M,获取第i个当前人物关系与第i+1个关系节点生成第i+1个当前人物关系,所述第i个当前人物关系为基于第i-1个当前人物关系与第i个关系节点生成的,当i为M时,获得第M个当前人物关系;
将所述第M个当前人物关系确定为所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
7.根据权利要求1所述的方法,其特征在于,基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系之后,还包括:
根据所述人物关系获得所述待处理语句的处理结果;
将所述处理结果发送至所述用户的输入设备。
8.一种人物关系获取装置,其特征在于,运行于一电子设备,所述装置包括:
语句获取模块,用于获取用户通过输入设备输入的待处理语句;
语句拆分模块,用于对所述待处理语句进行拆分,获得多个关键词;
判断模块,用于判断所述多个关键词中是否包含多个人物的多个人物称谓;
确定模块,用于在所述多个关键词中包含多个人物的多个人物称谓时,基于所述多个人物称谓从所述多个人物中确定主人物,以及读取并调用预先存储在所述电子设备中的人物拓扑关系;
链接关系获取模块,用于基于所述人物拓扑关系,确定所述主人物与所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物之间的链接关系,共获得至少两个链接关系;
人物关系获取模块,用于基于所述至少两个链接关系,确定所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
9.根据权利要求8所述的装置,其特征在于,所述语句拆分模块,用于对所述待处理语句进行分词,获得多个分词;将所述多个分词根据预设停留词表进行去停留词处理,获得多个关键词。
10.根据权利要求9所述的装置,其特征在于,所述语句拆分模块,还用于采用结巴分词方法、基于字符串匹配的匹配方法、基于理解的分词方法或基于统计的分词方法对所述待处理语句进行分词,获得多个分词。
11.根据权利要求8-10任一所述的装置,其特征在于,所述判断模块,用于从所述电子设备中调用预先存储的预设人物称谓词库;根据所述预设人物称谓词库,判断所述多个关键词中是否包含至少三个人物称谓。
12.根据权利要求8-10任一所述的装置,其特征在于,所述链接关系获取模块,用于基于所述人物拓扑关系,获取所述多个人物中除所述主人物以外的至少两个其他人物中每个其他人物在所述人物拓扑关系中的标准称谓;确定所述主人物与每个其他人物在所述人物拓扑关系中的标准称谓之间的链接关系,共获得至少两个链接关系。
13.根据权利要求12所述的装置,其特征在于,所述人物关系获取模块,具体用于:
获取所述至少两个链接关系中每个链接关系的至少一个关系节点,共获得M个关系节点,M为大于等于2的整数;
按照所述多个人物称谓在所述待处理语句中的出现顺序,将所述主人物与所述M个关系节点进行排序,获得排序结果;
根据所述排序结果确定所述M个关系节点中与所述主人物相邻的第一个关系节点,基于所述主人物与所述第一个关系节点生成第一个当前人物关系,并基于所述第一个当前人物关系与第二个关系节点生成第二个当前人物关系;
依次取i为2到M,获取第i个当前人物关系与第i+1个关系节点生成第i+1个当前人物关系,所述第i个当前人物关系为基于第i-1个当前人物关系与第i个关系节点生成的,当i为M时,获得第M个当前人物关系;
将所述第M个当前人物关系确定为所述主人物与所述至少两个其他人物中最后出现在所述待处理语句中的目标人物之间的人物关系。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
处理结果获取模块,用于根据所述人物关系获得所述待处理语句的处理结果;
处理结果发送模块,用于将所述处理结果发送至所述用户的输入设备。
15.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-7任一所述方法中的步骤。
16.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-7任一所述方法中的步骤。
CN201811577413.0A 2018-12-18 2018-12-18 人物关系获取方法、装置、电子设备及存储介质 Active CN111414459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811577413.0A CN111414459B (zh) 2018-12-18 2018-12-18 人物关系获取方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811577413.0A CN111414459B (zh) 2018-12-18 2018-12-18 人物关系获取方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111414459A true CN111414459A (zh) 2020-07-14
CN111414459B CN111414459B (zh) 2023-07-04

Family

ID=71492566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811577413.0A Active CN111414459B (zh) 2018-12-18 2018-12-18 人物关系获取方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111414459B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270173A (zh) * 2020-10-27 2021-01-26 北京百度网讯科技有限公司 文本中的人物挖掘方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008112432A (ja) * 2006-10-06 2008-05-15 Nippon Hoso Kyokai <Nhk> 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム
CN102880623A (zh) * 2011-07-13 2013-01-16 富士通株式会社 同名人物搜索方法及系统
CN103235772A (zh) * 2013-03-08 2013-08-07 北京理工大学 一种文本集人物关系自动提取方法
CN106776544A (zh) * 2016-11-24 2017-05-31 四川无声信息技术有限公司 人物关系识别方法及装置和分词方法
CN107526722A (zh) * 2017-07-31 2017-12-29 努比亚技术有限公司 一种人物关系分析方法及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008112432A (ja) * 2006-10-06 2008-05-15 Nippon Hoso Kyokai <Nhk> 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム
CN102880623A (zh) * 2011-07-13 2013-01-16 富士通株式会社 同名人物搜索方法及系统
CN103235772A (zh) * 2013-03-08 2013-08-07 北京理工大学 一种文本集人物关系自动提取方法
CN106776544A (zh) * 2016-11-24 2017-05-31 四川无声信息技术有限公司 人物关系识别方法及装置和分词方法
CN107526722A (zh) * 2017-07-31 2017-12-29 努比亚技术有限公司 一种人物关系分析方法及终端

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270173A (zh) * 2020-10-27 2021-01-26 北京百度网讯科技有限公司 文本中的人物挖掘方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111414459B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
CN108287822B (zh) 一种中文相似问题生成系统与方法
US11693894B2 (en) Conversation oriented machine-user interaction
CN108647205B (zh) 细粒度情感分析模型构建方法、设备及可读存储介质
CN106537370B (zh) 在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统
CN108304375B (zh) 一种信息识别方法及其设备、存储介质、终端
CN106156204B (zh) 文本标签的提取方法和装置
CN110096567B (zh) 基于qa知识库推理的多轮对话回复选择方法、系统
WO2018157789A1 (zh) 一种语音识别的方法、计算机、存储介质以及电子装置
CN108681574B (zh) 一种基于文本摘要的非事实类问答答案选择方法及系统
CN111611356B (zh) 信息查找方法、装置、电子设备及可读存储介质
CN106570180B (zh) 基于人工智能的语音搜索方法及装置
CN103970798B (zh) 数据的搜索和匹配
JPWO2018097091A1 (ja) モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
CN109271524B (zh) 知识库问答系统中的实体链接方法
CN114580382A (zh) 文本纠错方法以及装置
CN112417102A (zh) 一种语音查询方法、装置、服务器和可读存储介质
CN111414763A (zh) 一种针对手语计算的语义消歧方法、装置、设备及存储装置
CN110991180A (zh) 一种基于关键词和Word2Vec的命令识别方法
CN113821605B (zh) 一种事件抽取方法
CN113704416A (zh) 词义消歧方法、装置、电子设备及计算机可读存储介质
CN116227466B (zh) 一种语义不同措辞相似的句子生成方法、装置及设备
CN114298010A (zh) 一种融合双语言模型和句子检测的文本生成方法
CN110705285B (zh) 一种政务文本主题词库构建方法、装置、服务器及可读存储介质
Chang et al. Introduction to a proofreading tool for Chinese spelling check task of SIGHAN-8

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant