CN107633060A - 一种信息处理方法及电子设备 - Google Patents

一种信息处理方法及电子设备 Download PDF

Info

Publication number
CN107633060A
CN107633060A CN201710855517.2A CN201710855517A CN107633060A CN 107633060 A CN107633060 A CN 107633060A CN 201710855517 A CN201710855517 A CN 201710855517A CN 107633060 A CN107633060 A CN 107633060A
Authority
CN
China
Prior art keywords
information
question
answer
default
knowledge mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710855517.2A
Other languages
English (en)
Other versions
CN107633060B (zh
Inventor
胡长建
邱立坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201710855517.2A priority Critical patent/CN107633060B/zh
Publication of CN107633060A publication Critical patent/CN107633060A/zh
Application granted granted Critical
Publication of CN107633060B publication Critical patent/CN107633060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息处理方法及电子设备,方法包括:基于预设的知识图谱生成包括多个查询串的查询串集合;分别将每个所述查询串输入预设的问答系统,得到对应各所述查询串的多个信息问答对;对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板。

Description

一种信息处理方法及电子设备
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息处理方法及电子设备。
背景技术
基于机器学习、深度学习的问答系统是人工智能的重要应用领域,以一问一答的形式,精确的定位用户的提问所需要的答案,通过与用户进行信息交互,为用户提供个性化的信息服务。
目前的问答系统对用户问题的响应通常是基于关键词提取,将提取的关键词与数据库中的问题模板进行匹配,基于匹配结果确定用户提问对应的答案。然而,当前问答系统中的问题模板的来源通常为人工撰写,耗费大量的人力资源,且句式简单、种类单一、通用性和精准度不高。
发明内容
本发明实施例提供一种信息处理方法及电子设备,能够实现多个问题模板的自动获取,覆盖面广、通用性强、准确性高。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种信息处理方法,所述方法包括:
基于预设的知识图谱生成包括多个查询串的查询串集合;
分别将每个所述查询串输入预设的问答系统,得到对应各所述查询串的多个信息问答对;
对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板。
上述方案中,所述基于预设的知识图谱生成包括多个查询串的查询串集合之前,所述方法还包括:
从预设的数据源中抽取指定类型的信息;
依据预设的构建策略对所述指定类型的信息进行结构化处理,形成所述知识图谱。
上述方案中,所述基于预设的知识图谱生成包括多个查询串的查询串集合,包括:
基于预设的第一提取策略对所述知识图谱进行信息提取,得到多个信息三元组;每个所述信息三元组包括:第一实体信息、第二实体信息、实体关系信息;
基于预设的第二提取策略分别对每个所述信息三元组进行信息提取,得到对应各所述信息三元组的所述查询串,形成所述包括多个查询串的查询串集合。
上述方案中,所述对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板,包括:
分别提取各所述信息三元组中的所述第二实体信息;
基于所述第二实体信息,依据预设的筛选策略对所述信息问答对集合中的多个信息问答对进行筛选,得到符合预设条件的信息问答对;
依据预设的聚类策略,对所述符合预设条件的信息问答对中的问题信息进行聚类处理,得到对应所述知识图谱的多个问题模板。
上述方案中,所述基于所述第二实体信息,依据预设的筛选策略对所述信息问答对集合中的多个信息问答对进行筛选,得到符合预设条件的信息问答对,包括:
将所述第二实体信息与所述信息问答对集合中每个所述信息问答对的答案信息进行相似度匹配;
确定与所述第二实体信息的相似度超过预设的相似度阈值的答案信息对应的信息问答对,为所述符合预设条件的信息问答对。
上述方案中,所述依据预设的聚类策略,对所述符合预设条件的信息问答对中的问题信息进行聚类处理,得到对应所述知识图谱的多个问题模板,包括:
从所述符合预设条件的信息问答对的问题信息中提取预设信息类型的关键词;
对提取的所述预设信息类型的关键词进行聚类处理,得到聚类结果;
基于所述聚类结果生成对应所述知识图谱的多个问题模板。
上述方案中,所述得到对应所述知识图谱的多个问题模板之后,所述方法还包括:
获取每个所述问题模板对应的所述查询串的数目;
基于所述问题模板对应的所述查询串的数目,对所述多个问题模板进行排序,得到排序结果;
基于所述排序结果,依据预设的推荐策略将所述多个问题模板中至少一个问题模板作为候选推荐问题模板。
本发明实施例还提供了一种电子设备,包括:
存储器,用于存储可执行程序;
处理器,用于通过执行所述存储器中存储的可执行程序时实现:
基于预设的知识图谱生成包括多个查询串的查询串集合;
分别将每个所述查询串输入预设的问答系统,得到对应各所述查询串的多个信息问答对;
对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板。
上述方案中,所述处理器,还用于通过执行所述存储器中存储的可执行程序时实现:
基于预设的第一提取策略对所述知识图谱进行信息提取,得到多个信息三元组;每个所述信息三元组包括:第一实体信息、第二实体信息、实体关系信息;
基于预设的第二提取策略分别对每个所述信息三元组进行信息提取,得到对应各所述信息三元组的所述查询串,形成所述包括多个查询串的查询串集合。
上述方案中,所述处理器,还用于通过执行所述存储器中存储的可执行程序时实现:
获取每个所述问题模板对应的所述查询串的数目;
基于所述问题模板对应的所述查询串的数目,对所述多个问题模板进行排序,得到排序结果;
基于所述排序结果,依据预设的推荐策略将所述多个问题模板中至少一个问题模板作为候选推荐问题模板。
本发明实施例还提供了一种计算机可读存储介质,存储有可执行程序,所述可执行程序被处理器执行时,实现上述的信息处理方法。
应用本发明实施例提供的信息处理方法、电子设备及存储介质,从知识图谱出发得到多个查询串,并借助问答系统得到对应查询串的多个信息问答对,基于得到的多个信息问答对生成多个问题模板。如此,实现了不同类型的多个问题模板的自动获取,覆盖面广、通用性强、准确性高。
附图说明
图1为本发明实施例中信息处理方法的流程示意图一;
图2为本发明实施例中信息处理方法的流程示意图二;
图3为本发明实施例中电子设备的组成结构示意图。
具体实施方式
以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本发明,并不用于限定本发明。另外,以下所提供的实施例是用于实施本发明的部分实施例,而非提供实施本发明的全部实施例,在不冲突的情况下,本发明实施例记载的技术方案可以任意组合的方式实施。
需要说明的是,本发明实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)知识图谱,从各种结构化/半结构化/非结构化数据中,抽取实体/实体属性/实体之间的关系,形成的以信息三元组格式进行数据存储的、涵盖各个学科的知识体系的基础的知识库。
2)信息三元组,由实体、实体关系作为元素构成的三元素集合。
3)查询串,进行信息检索时输入问答系统的至少包括实体、实体关系的信息字段。
4)问答系统,信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。
5)问答对,由问题信息及答案信息组成的问句-答句形式的信息对。
本发明实施例提供了一种信息处理方法,图1为本发明实施例提供的信息处理方法的一个可选的流程示意图,如图1所示,本发明实施例提供的信息处理方法包括:
步骤101:基于预设的知识图谱生成包括多个查询串的查询串集合。
步骤102:分别将每个查询串输入预设的问答系统,得到对应各查询串的多个信息问答对。
步骤103:对由各查询串对应的多个信息问答对组成的信息问答对集合进行聚类处理,得到对应知识图谱的多个问题模板。
作为上述信息处理方法的另一个可选实施例,图2示出了本发明实施例提供的信息处理方法的一个可选的流程示意图,参见图2,本发明实施例提供的信息处理方法包括:
步骤200:基于预设的数据源构造知识图谱。
这里,在实际应用中,预设的数据源可以为任意形式的知识库数据,例如:维基百科(Wikipedia)、百度百科等。
在一实施例中,可以通过如下方式进行知识图谱的构造:
从预设的数据源中抽取指定类型的信息;
依据预设的构建策略对指定类型的信息进行结构化处理,形成知识图谱。
在实际实施时,从预设的数据源中抽取不同类型的信息,如表征概念、实体、属性和关系的信息,然后依据预设的构建策略对抽取的信息进行结构化处理,形成以信息三元组格式进行数据存储的知识图谱。
在一实施例中,还可以基于已公开或现有的知识图谱构造成本发明实施例中的以信息三元组格式进行数据存储的知识图谱。
接下来对信息三元组进行说明,信息三元组包括:第一实体信息、第二实体信息、实体关系信息;采用关系式表示可以为TRIPLE=<A,P,B>,相应的,知识图谱则可表示为KB=<TRIPLE>;其中,A表示第一实体、B表示第二实体,P表示第一实体和第二实体间的实体关系,即A与B的关系;例如:三元组(广州,市花,木棉花),即A=“广州”,B=“木棉花”,P=“市花”,可知“市花”建立了“广州”和“木棉花”间的关系;再如:三元组(中国,首都,北京),即A=“中国”,B=“北京”,P=“首都”,可知“首都”建立了“中国”和“北京”间的关系。
步骤201:对知识图谱进行信息提取,得到多个信息三元组。
在实际应用中,基于构造的或预设的知识图谱提取不同的实体关系,以及与实体关系相关联的第一实体及第二实体,以形成以(第一实体、实体关系、第二实体)形式存在的多个信息三元组。由于知识图谱涵盖了各个学科领域的知识体系内容,因此,得到的多个信息三元组也涵盖了各个学科领域,覆盖范围广。
步骤202:分别对每个信息三元组进行信息提取,得到对应各信息三元组的查询串,形成包括多个查询串的查询串集合。
在一实施例中,查询串包含了实体、实体关系,可以以第一实体+实体关系,即A+P的形式存在,相应的,查询串集合可表示为QPair=<A+P>;在实际应用中,每个信息三元组可以对应一个查询串,即提取每个信息三元组中的第一实体及对应的实体关系组成一个查询串,如:信息三元组为:(小明,出生日期,X年X月X日),对应的查询串即为:(小明,出生日期);信息三元组为:(广州,市花,木棉花),对应的查询串即为:(广州,市花)。也就是说,如果将包含查询串信息的内容作为检索信息(或问句),则对应的信息三元组中的第三实体则可看作对应该检索信息(或问句)的答案信息。
步骤203:分别将每个查询串输入预设的问答系统,得到对应各查询串的多个信息问答对,形成对应各查询串的信息问答对集合。
这里,问答系统通常采用于web形式的问答网站呈现,如:百度知道、新浪爱问、天涯问答等即问即答网站。在实际应用中,可以预先设置问答系统对应的网址信息,将每个查询串输入问答系统后,可得到多个对应查询串的信息问答对,形成对应该查询串的问答对集合。
示例性地,将“AA”(人名),“出生日期”输入问答系统(如百度知道)后,通过检索可得到包括多个如下类似的信息问答对:
问:AA是哪年出生的?答:X年X月X日。
问:AA的出生日期是什么时候?答:AA,字XX,笔名XX,X年X月X日出生于湖南湘潭的一个农民家庭当中。
问:AA什么时候出生的?答:AA的出生日期是:X年X月X日。
问:AA的出生日期是哪年哪月哪天?答:X年X月X日出生在湖南湘潭。
问:请问AA的出生日期是什么年代?答:AA于X年X月X日出生。
问:AA的出生年月日是什么?答:中医五行学说指心属生相蛇,石芽子生相蛇。
步骤204:依据预设的筛选策略对信息问答对集合中的多个信息问答对进行筛选,得到符合预设条件的信息问答对。
这里,在实际应用中,可通过如下方式对信息问答对集合中的多个信息问答对进行筛选:
分别提取得到的各个信息三元组中的第二实体信息;
分别将提取的第二实体信息与对应的信息问答对集合中每个信息问答对的答案信息进行相似度匹配;
确定与第二实体信息的相似度超过预设的相似度阈值(可依据实际需要进行设定)的答案信息对应的信息问答对,为符合预设条件的信息问答对。
在实际实施时,可知得到的问答对集合与查询串具有对应关系,而查询串基于信息三元组得来,继而可知问答对集合与第二实体也存在对应关系。
在一实施例中,可以通过计算第二实体信息与对应的信息问答对集合中的每个信息问答对的答案信息的距离,确定相似度,距离越近表明相似度越高,距离越远表明相似度越低,
这里的距离可以采用多种距离,如采用编辑距离,将第二实体信息及问答对的答案信息看作两个不同长度的字符串,确定两个字符串之间,由一个转成另一个所需的最少编辑操作次数,编辑距离越大表明两篇文章相似性越差。或者,表征第二实体信息及问答对的答案信息间的距离采用杰卡德距离,此时将第二实体信息及问答对的答案信息看作两个字符集合,杰卡德距离越大表明二者相似性越差。
在不同实施例中,可通过如下方式对信息问答对集合中的多个信息问答对进行筛选:
分别提取得到的各个信息三元组中的第二实体信息;
分别判断信息问答对集合中每个信息问答对的答案信息是否包含了该信息问答对集合对应的第二实体信息;
如果判断结果表征答案信息包含了信息问答对集合对应的第二实体信息,确定该答案信息对应的信息问答对,为符合预设条件的信息问答对;
过滤掉判断结果表征答案信息未包含信息问答对集合对应的第二实体信息所对应的信息问答对,例如对于步骤203中得到的多个信息问答对中,最后一个信息问答对的答案信息中未包含第二实体(X年X月X日),因此为不符合预设条件的信息问答对,对其进行过滤(删除)。
步骤205:依据预设的聚类策略,对符合预设条件的信息问答对中的问题信息进行聚类处理,得到对应知识图谱的多个问题模板。
这里,在实际实施时,可以通过如下方式得到对应知识图谱的多个问题模板:
从符合预设条件的信息问答对的问题信息中提取预设信息类型的关键词;
对提取的预设信息类型的关键词进行聚类处理,得到聚类结果;
基于聚类结果生成对应知识图谱的多个问题模板。
示例性地,从各个符合预设条件的信息问答对的问题信息中提取实体类型(不限于一种类型的关键词,可同时提取多种类型的关键词)的关键词,然后对提取的实体类型的关键词进行聚类处理,如将“小明”、“小红”、“小兰”等聚类得到“人名”。基于聚类结果生成对应知识图谱的多个问题模板,如:“人名”是哪年出生的?“人名”的出生日期是什么时候?“人名”是什么时候出生的?等。
在一实施中,本发明实施例的信息处理方法还可以包括:
获取每个问题模板对应的查询串的数目;
基于问题模板对应的查询串的数目,对多个问题模板进行排序,得到排序结果;
基于排序结果,依据预设的推荐策略将多个问题模板中至少一个问题模板作为候选推荐问题模板。
在实际应用中,由于问题模板是通过对信息问答对中的问题信息聚类得到,因此,对于相同的实体关系,每个问题模板可能对应多个查询串,如模板“【人名】是哪年出生的?”可对应的查询串为(小明,出生日期)、(小红,出生日期);而模板“【人名】的出生日期是什么时候?”可对应的查询串为(小明,出生日期)、(小红,出生日期)、(小兰,出生日期)。采用问题模板可对应的查询串的数目表征该问题模板的可信度,基于可信度高低对问题模板排序,这里具体可以对实体关系相同的问题模板进行排序,然后依据排序结果选取部分问题模板作为推荐问题模板。
在不同实施例中,可以通过预设的扩展策略对得到的问题模板进行模板扩展,示例性地:采用预设的句式变换策略,将问题模板中疑问词提前,如:“【人名】是哪年出生的?”进行句式变换后得到“是哪年【人名】出生的?”。在实际应用中,经问句扩展后得到的问题模板,会存在问题模板重复的情况,因此,可对扩展后的问题模板进行去重处理。
本发明实施例还提供了一种电子设备,图3为本发明实施例中电子设备作为硬件实体的一个示例图,如图3所示,电子设备包括处理器31、存储器32以及至少一个外部通信接口33;所述处理器31、存储器32以及外部通信接口33均通过总线34连接;其中,
存储器32,用于存储可执行程序;
处理器31,用于通过执行所述存储器中存储的可执行程序时实现:
基于预设的知识图谱生成包括多个查询串的查询串集合;
分别将每个所述查询串输入预设的问答系统,得到对应各所述查询串的多个信息问答对;
对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板。
在一实施例中,处理器31,还用于通过执行所述存储器中存储的可执行程序时实现:
从预设的数据源中抽取指定类型的信息;
依据预设的构建策略对所述指定类型的信息进行结构化处理,形成所述知识图谱。
在一实施例中,处理器31,还用于通过执行所述存储器中存储的可执行程序时实现:
基于预设的第一提取策略对所述知识图谱进行信息提取,得到多个信息三元组;每个所述信息三元组包括:第一实体信息、第二实体信息、实体关系信息;
基于预设的第二提取策略分别对每个所述信息三元组进行信息提取,得到对应各所述信息三元组的所述查询串,形成所述包括多个查询串的查询串集合。
在一实施例中,处理器31,还用于通过执行所述存储器中存储的可执行程序时实现:
分别提取各所述信息三元组中的所述第二实体信息;
基于所述第二实体信息,依据预设的筛选策略对所述信息问答对集合中的多个信息问答对进行筛选,得到符合预设条件的信息问答对;
依据预设的聚类策略,对所述符合预设条件的信息问答对中的问题信息进行聚类处理,得到对应所述知识图谱的多个问题模板。
在一实施例中,处理器31,还用于通过执行所述存储器中存储的可执行程序时实现:
将所述第二实体信息与所述信息问答对集合中每个所述信息问答对的答案信息进行相似度匹配;
确定与所述第二实体信息的相似度超过预设的相似度阈值的答案信息对应的信息问答对,为所述符合预设条件的信息问答对。
在一实施例中,处理器31,还用于通过执行所述存储器中存储的可执行程序时实现:
从所述符合预设条件的信息问答对的问题信息中提取预设信息类型的关键词;
对提取的所述预设信息类型的关键词进行聚类处理,得到聚类结果;
基于所述聚类结果生成对应所述知识图谱的多个问题模板。
在一实施例中,处理器31,还用于通过执行所述存储器中存储的可执行程序时实现:
获取每个所述问题模板对应的所述查询串的数目;
基于所述问题模板对应的所述查询串的数目,对所述多个问题模板进行排序,得到排序结果;
基于所述排序结果,依据预设的推荐策略将所述多个问题模板中至少一个问题模板作为候选推荐问题模板。
需要说明的是:上述实施例提供的电子设备与信息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。对于本发明所述电子设备实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本发明实施例还提供了一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述信息处理方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种信息处理方法,其特征在于,所述方法包括:
基于预设的知识图谱生成包括多个查询串的查询串集合;
分别将每个所述查询串输入预设的问答系统,得到对应各所述查询串的多个信息问答对;
对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的知识图谱生成包括多个查询串的查询串集合之前,所述方法还包括:
从预设的数据源中抽取指定类型的信息;
依据预设的构建策略对所述指定类型的信息进行结构化处理,形成所述知识图谱。
3.根据权利要求1所述的方法,其特征在于,所述基于预设的知识图谱生成包括多个查询串的查询串集合,包括:
基于预设的第一提取策略对所述知识图谱进行信息提取,得到多个信息三元组;每个所述信息三元组包括:第一实体信息、第二实体信息、实体关系信息;
基于预设的第二提取策略分别对每个所述信息三元组进行信息提取,得到对应各所述信息三元组的所述查询串,形成所述包括多个查询串的查询串集合。
4.根据权利要求3所述的方法,其特征在于,所述对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板,包括:
分别提取各所述信息三元组中的所述第二实体信息;
基于所述第二实体信息,依据预设的筛选策略对所述信息问答对集合中的多个信息问答对进行筛选,得到符合预设条件的信息问答对;
依据预设的聚类策略,对所述符合预设条件的信息问答对中的问题信息进行聚类处理,得到对应所述知识图谱的多个问题模板。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第二实体信息,依据预设的筛选策略对所述信息问答对集合中的多个信息问答对进行筛选,得到符合预设条件的信息问答对,包括:
将所述第二实体信息与所述信息问答对集合中每个所述信息问答对的答案信息进行相似度匹配;
确定与所述第二实体信息的相似度超过预设的相似度阈值的答案信息对应的信息问答对,为所述符合预设条件的信息问答对。
6.根据权利要求4所述的方法,其特征在于,所述依据预设的聚类策略,对所述符合预设条件的信息问答对中的问题信息进行聚类处理,得到对应所述知识图谱的多个问题模板,包括:
从所述符合预设条件的信息问答对的问题信息中提取预设信息类型的关键词;
对提取的所述预设信息类型的关键词进行聚类处理,得到聚类结果;
基于所述聚类结果生成对应所述知识图谱的多个问题模板。
7.根据权利要求1所述的方法,其特征在于,所述得到对应所述知识图谱的多个问题模板之后,所述方法还包括:
获取每个所述问题模板对应的所述查询串的数目;
基于所述问题模板对应的所述查询串的数目,对所述多个问题模板进行排序,得到排序结果;
基于所述排序结果,依据预设的推荐策略将所述多个问题模板中至少一个问题模板作为候选推荐问题模板。
8.一种电子设备,其特征在于,包括:
存储器,用于存储可执行程序;
处理器,用于通过执行所述存储器中存储的可执行程序时实现:
基于预设的知识图谱生成包括多个查询串的查询串集合;
分别将每个所述查询串输入预设的问答系统,得到对应各所述查询串的多个信息问答对;
对由各所述查询串对应的所述多个信息问答对组成的信息问答对集合进行聚类处理,得到对应所述知识图谱的多个问题模板。
9.根据权利要求8所述的电子设备,其特征在于,
所述处理器,还用于通过执行所述存储器中存储的可执行程序时实现:
基于预设的第一提取策略对所述知识图谱进行信息提取,得到多个信息三元组;每个所述信息三元组包括:第一实体信息、第二实体信息、实体关系信息;
基于预设的第二提取策略分别对每个所述信息三元组进行信息提取,得到对应各所述信息三元组的所述查询串,形成所述包括多个查询串的查询串集合。
10.根据权利要求8所述的电子设备,其特征在于,
所述处理器,还用于通过执行所述存储器中存储的可执行程序时实现:
获取每个所述问题模板对应的所述查询串的数目;
基于所述问题模板对应的所述查询串的数目,对所述多个问题模板进行排序,得到排序结果;
基于所述排序结果,依据预设的推荐策略将所述多个问题模板中至少一个问题模板作为候选推荐问题模板。
CN201710855517.2A 2017-09-20 2017-09-20 一种信息处理方法及电子设备 Active CN107633060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710855517.2A CN107633060B (zh) 2017-09-20 2017-09-20 一种信息处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710855517.2A CN107633060B (zh) 2017-09-20 2017-09-20 一种信息处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN107633060A true CN107633060A (zh) 2018-01-26
CN107633060B CN107633060B (zh) 2020-05-26

Family

ID=61102042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710855517.2A Active CN107633060B (zh) 2017-09-20 2017-09-20 一种信息处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN107633060B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033229A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 问答处理方法和装置
CN109145084A (zh) * 2018-07-10 2019-01-04 阿里巴巴集团控股有限公司 数据处理方法、数据处理装置和服务器
CN110866174A (zh) * 2018-08-17 2020-03-06 阿里巴巴集团控股有限公司 庭审问题的推送方法、装置和系统
CN111090736A (zh) * 2018-10-24 2020-05-01 马上消费金融股份有限公司 问答模型的训练方法、问答方法、装置及计算机存储介质
CN111666393A (zh) * 2020-04-29 2020-09-15 平安科技(深圳)有限公司 智能问答系统的验证方法、装置、计算机设备及存储介质
WO2021037045A1 (zh) * 2019-08-26 2021-03-04 华为技术有限公司 知识图谱构建方法及装置、计算设备、存储介质
CN113297044A (zh) * 2020-06-11 2021-08-24 阿里巴巴集团控股有限公司 一种运维风险预警方法及装置
CN113377934A (zh) * 2021-05-21 2021-09-10 海南师范大学 一种实现智能客服的系统及方法
CN116823140A (zh) * 2023-04-21 2023-09-29 华腾建信科技有限公司 工程项目问题信息上报方法及系统
US11983640B2 (en) 2019-12-30 2024-05-14 International Business Machines Corporation Generating question templates in a knowledge-graph based question and answer system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086049A1 (en) * 1999-11-12 2005-04-21 Bennett Ian M. System & method for processing sentence based queries
CN103049433A (zh) * 2012-12-11 2013-04-17 微梦创科网络科技(中国)有限公司 自动问答方法、自动问答系统及构建问答实例库的方法
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
CN106934012A (zh) * 2017-03-10 2017-07-07 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086049A1 (en) * 1999-11-12 2005-04-21 Bennett Ian M. System & method for processing sentence based queries
CN103049433A (zh) * 2012-12-11 2013-04-17 微梦创科网络科技(中国)有限公司 自动问答方法、自动问答系统及构建问答实例库的方法
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
CN106934012A (zh) * 2017-03-10 2017-07-07 上海数眼科技发展有限公司 一种基于知识图谱的自然语言问答实现方法和系统

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033229A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 问答处理方法和装置
CN109145084A (zh) * 2018-07-10 2019-01-04 阿里巴巴集团控股有限公司 数据处理方法、数据处理装置和服务器
CN110866174B (zh) * 2018-08-17 2023-05-02 阿里巴巴集团控股有限公司 庭审问题的推送方法、装置和系统
CN110866174A (zh) * 2018-08-17 2020-03-06 阿里巴巴集团控股有限公司 庭审问题的推送方法、装置和系统
CN111090736A (zh) * 2018-10-24 2020-05-01 马上消费金融股份有限公司 问答模型的训练方法、问答方法、装置及计算机存储介质
WO2021037045A1 (zh) * 2019-08-26 2021-03-04 华为技术有限公司 知识图谱构建方法及装置、计算设备、存储介质
US11983640B2 (en) 2019-12-30 2024-05-14 International Business Machines Corporation Generating question templates in a knowledge-graph based question and answer system
CN111666393A (zh) * 2020-04-29 2020-09-15 平安科技(深圳)有限公司 智能问答系统的验证方法、装置、计算机设备及存储介质
CN113297044A (zh) * 2020-06-11 2021-08-24 阿里巴巴集团控股有限公司 一种运维风险预警方法及装置
CN113297044B (zh) * 2020-06-11 2024-01-09 阿里巴巴集团控股有限公司 一种运维风险预警方法及装置
CN113377934A (zh) * 2021-05-21 2021-09-10 海南师范大学 一种实现智能客服的系统及方法
CN113377934B (zh) * 2021-05-21 2022-07-05 海南师范大学 一种实现智能客服的系统及方法
CN116823140A (zh) * 2023-04-21 2023-09-29 华腾建信科技有限公司 工程项目问题信息上报方法及系统

Also Published As

Publication number Publication date
CN107633060B (zh) 2020-05-26

Similar Documents

Publication Publication Date Title
CN107633060A (zh) 一种信息处理方法及电子设备
US10372739B2 (en) Corpus search systems and methods
CN106844723B (zh) 基于问答系统的医学知识库构建方法
US10565508B2 (en) Inferred facts discovered through knowledge graph derived contextual overlays
CN109284363A (zh) 一种问答方法、装置、电子设备及存储介质
CN113535974B (zh) 诊断推荐方法及相关装置、电子设备、存储介质
US8296309B2 (en) System and method for high precision and high recall relevancy searching
US20050015381A1 (en) Database management system
WO2020010834A1 (zh) 一种faq问答库泛化方法、装置及设备
CN111625658A (zh) 基于知识图谱的语音交互方法、装置、设备及存储介质
CN110442725B (zh) 实体关系抽取方法及装置
GB2293667A (en) Database management system
CN108154198A (zh) 知识库实体归一方法、系统、终端和计算机可读存储介质
US8583669B2 (en) Query suggestion for efficient legal E-discovery
CN109948710A (zh) 基于api相似度的微服务识别方法
US20160124952A1 (en) Using Synthetic Events to Identify Complex Relation Lookups
CN107967285A (zh) 数据处理方法和数据处理装置
CN112633012A (zh) 一种基于实体类型匹配的未登录词替换方法
An et al. Automatic generation of ontology from the deep web
CN110119404A (zh) 一种基于自然语言理解的智能取数系统及其方法
CN114647719A (zh) 一种基于知识图谱的问答方法及装置
CN115878814A (zh) 一种基于机器阅读理解的知识图谱问答方法及其系统
Goldfarb et al. Art history on wikipedia, a macroscopic observation
CN112463920A (zh) 一种信息应答方法及装置
CN110413899A (zh) 服务器存储新闻的存储资源优化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant