CN110427478A - 一种基于知识图谱的问答搜索方法及系统 - Google Patents

一种基于知识图谱的问答搜索方法及系统 Download PDF

Info

Publication number
CN110427478A
CN110427478A CN201910739232.1A CN201910739232A CN110427478A CN 110427478 A CN110427478 A CN 110427478A CN 201910739232 A CN201910739232 A CN 201910739232A CN 110427478 A CN110427478 A CN 110427478A
Authority
CN
China
Prior art keywords
predicate
corpus
question
entity
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910739232.1A
Other languages
English (en)
Other versions
CN110427478B (zh
Inventor
李晓飞
郭苗苗
任云青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910739232.1A priority Critical patent/CN110427478B/zh
Publication of CN110427478A publication Critical patent/CN110427478A/zh
Application granted granted Critical
Publication of CN110427478B publication Critical patent/CN110427478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱的问答搜索方法及系统,方法包括从QA语料库中每条语料中抽取对应的实体、谓词和值;以三元组形式导入图形数据库,形成乒乓球领域的知识图谱;选取QA语料库中的问题表示为问题模板,形成问题模板知识库;根据问题模板知识库中的每个问题模板所对应的实体和值,查找连接实体和值的直接谓词,将问题模板映射到此谓词构建谓词模板知识库;对用户提出的问题抽取实体,在谓词模板知识库中查找出该实体所对应的谓词,得到对应的实体‑谓词对;根据实体‑谓词对在知识图谱中进行查询,得到对应的值即为答案。本发明使用问题模板进行问题表示,相比于之前基于关键字、规则、同义词的问题表示方法更加准确方便。

Description

一种基于知识图谱的问答搜索方法及系统
技术领域
本发明涉及人工智能中的自然语言处理技术领域,具体涉及一种基于知识图谱的问答搜索方法及系统。
背景技术
问答是计算机与人类以自然语言的形式进行交流的一种方式,是人工智能领域的一个分支,也是互联网搜索、人机交互等多个领域的关键应用技术。互联网的快速发展,导致网络上的信息量呈现出爆炸式增长的势头,准确的问答搜索方法显得尤为重要。基于知识库的问答搜索历史悠久,近年来,大规模的知识库,包括谷歌的知识图谱,Freebase,YAG02等,大大提高了问答系统的重要性和商业价值,大多数此类知识库采用RDF(资源描述框架,用于描述Web资源的标记语言)作为数据格式,它们包含数百万条的SPO(主题,谓词和对象)的三元组。除此之外,国外已经有几个比较成熟的问答系统,如Start,Webclopedia,AnswerBus等系统,这些问答系统允许用户以一种自然语言的形式进行提问,并且直接给出答案。但是相比之下,由于中文本身的语义、语法复杂性等多方面因素,中文问答系统的发展相对逊色一点。
优秀的问答搜索系统有两个关键点,精确的问题理解和高质量的知识来源。近年来,随着大数据的发展,这两点纷纷迎来了数据层面的发展契机。由于问题的多样性和复杂性,社交类问答网站的兴起,提供了问答理解的优质语料。知识图谱,本质上是一种语义网络,其节点代表实体,边代表实体之间的各种语义关系。鉴于乒乓球领域的问答语料多数为陈述性语料形式,并且可以按照人物、技术、赛事等类别进行分类,便于进行构建类别清晰的知识图谱。
给出一个针对知识库的问题,我们面临两个挑战,如何理解问题进行问题表示,以及如何将问题表示映射到针对知识库的结构化查询。在问题表示中,我们知道问题描述了多个意图,一个意图对应多个问题模板,问答系统针对不同问题设计不同的问题表示,这种问题表示必须能够识别不同的具有相同语义的问题,并且区分不同的问题意图。在确定了问题表示之后,我们需要将问题表示映射到结构化查询,结构化查询主要依赖于知识库中的谓词,由于谓词和问题表示之间的差距,找到这样的映射非常重要。
针对以前基于知识库的问答系统如何表示问题,我们大致将问题表示分为三类,基于规则、基于关键字、基于同义词。基于规则的方法通过使用手动构建的规则将问题映射到谓词,基于关键字的方法通过提取问题关键字并且通过关键字将问题映射到谓词,基于同义词的方法通过考虑预测的同义词来扩展基于关键字的方法。基于规则的方法,需要付出大量的人工标签工作,基于关键字或基于同义词的方法,一个单词或一个短语不能完全代表问题的语义意图。
发明内容
本发明的目的在于克服现有技术中的不足,提出了一种基于知识图谱的问答搜索方法,解决问答系统中无法明确识别具体问题,答案搜索速度慢的技术问题。
为解决上述技术问题,本发明提供了一种基于知识图谱的问答搜索方法,其特征是,包括以下过程:
从网站上爬取乒乓球相关语料形成QA语料库;
从QA语料库中每条语料中抽取对应的实体、谓词和值;
将每条语料以(实体、谓词、值)三元组形式导入图形数据库,形成乒乓球领域的知识图谱;
选取QA语料库中的问题表示为问题模板,形成问题模板知识库;
根据问题模板知识库中的每个问题模板所对应的实体和值,查找连接实体和值的直接谓词,将问题模板映射到此谓词构建谓词模板知识库;
对用户提出的问题抽取实体,在谓词模板知识库中查找出该实体所对应的谓词,得到对应的实体-谓词对;根据实体-谓词对在知识图谱中进行查询,得到对应的值即为答案。
进一步的,从QA语料库中每条语料中抽取对应的实体、谓词和值包括:
采用MITIE抽取工具从QA语料库中每条语料中抽取对应的实体、谓词和值。
进一步的,图形数据库为Neo4j图形数据库。
进一步的,问题表示为问题模板包括:
使用概念化机制将问题表示为问题模板。
相应的,本发明提供了一种基于知识图谱的问答搜索系统,其特征是,包括获取语料模块、语料抽取模块、知识图谱构建模块、问题模板构建模块、谓词模板构建模块和问答搜索模块;
获取语料模块,用于从网站上爬取乒乓球相关语料形成QA语料库;
语料抽取模块,用于从QA语料库中每条语料中抽取对应的实体、谓词和值;
知识图谱构建模块,用于将每条语料以(实体、谓词、值)三元组形式导入图形数据库,形成乒乓球领域的知识图谱;
问题模板构建模块,用于选取QA语料库中的问题表示为问题模板,形成问题模板知识库;
谓词模板构建模块,用于根据问题模板知识库中的每个问题模板所对应的实体和值,查找连接实体和值的直接谓词,将问题模板映射到此谓词构建谓词模板知识库;
问答搜索模块,用于对用户提出的问题抽取实体,在谓词模板知识库中查找出该实体所对应的谓词,得到对应的实体-谓词对;根据实体-谓词对在知识图谱中进行查询,得到对应的值即为答案。
进一步的,语料抽取模块中,从QA语料库中每条语料中抽取对应的实体、谓词和值包括:
采用MITIE抽取工具从QA语料库中每条语料中抽取对应的实体、谓词和值。
进一步的,知识图谱构建模块中,图形数据库为Neo4j图形数据库。
进一步的,问题模板构建模块中,问题表示为问题模板包括:
使用概念化机制将问题表示为问题模板。
与现有技术相比,本发明所达到的有益效果是:
1、本发明选取乒乓球网站爬取八千多条语料构建了乒乓球领域的知识图谱,为乒乓球领域的问答搜索提供了优质的语料库;
2、本发明使用问题模板进行问题表示,相比于之前基于关键字、规则、同义词的问题表示方法更加准确方便;
3、本发明选取语料库的部分语料进行问题模板的构建,提高计算速度;
4、本发明实现了乒乓球领域的问答系统,使得乒乓球领域的人机交互更加灵活。
附图说明
图1为本发明方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的一种基于知识图谱的问答搜索方法,参见图1所示,包括以下步骤:
第一步,从乒乓球相关网站上爬取乒乓球相关语料,各语料以QA问答对形式存储形成QA语料库。
第二步,将第一步得到的QA语料库中的语料进行分类,用于在之后的知识图谱构建过程中导入指定节点。语料分为技术、赛事、人物等类别,每条语料使用已有的MITIE抽取工具进行实体抽取、谓词抽取、值抽取。
MITIE 即 MIT (麻省理工)的 NLP 团队发布的一个信息抽取库和工具,提供了训练自定义抽取器和谓词检测器的工具。
第三步,将第二步经过抽取之后的语料存入知识库,知识库中每条语料都是以(S,P,O)(S代表实体,P代表谓词,O代表值)形式的三元组来描述,例如:马龙-出生日期-1988.8。
第四步,将第三步得到的知识库中的(S,P,O)三元组数据人工参与质量评估,消除歧义。歧义的产生是因为有些词语在不同领域有不同意思,比如乒乓球拍的牌子“蝴蝶”和昆虫界的蝴蝶系统是区分不了的,所以需要消除歧义。这些易产生歧义的词可以根据生活经验自己设定。
第五步,将第四步中经过消除歧义的知识库语料以实体-谓词-值的形式导入Neo4j图形数据库,导入过程使用Neo4j相关指令,比如import,自动构建乒乓球领域的知识图谱,知识图谱是以图形形式展示上述(SPO)三元组的关系图,实际就是图形数据库的展示形式。
第六步,随机选取第一步中的QA语料库中30%的问题进行问题模板知识库的构建,选取部分语料而不是全部是为了提升计算速度。
构建过程为:使用现有的概念化机制(概念化机制是指将具体的实体表示为它的专有名词,比如南京可以用城市表示,概念即指实体的所属范畴词,这里的“城市”即指概念),该机制将自动对问题进行消歧,比如出现“蝴蝶”的时候,概念化机制将蝴蝶表示为乒乓球拍而不是昆虫,用概念替换问题中的实体,将问题表示为问题模板,构建问题模板知识库;
第七步,根据第六步中的问题模板知识库中的每个问题模板所对应的实体和值,在第四步处理后形成的知识库中查找连接实体和值的直接谓词,如果问题模板的大多数实例共享相同的谓词,将问题模板映射到此谓词,构建谓词模板知识库,存储形式为问题模板-谓词。
第八步,对用户提出的问题使用MITIE抽取工具进行实体抽取,同样使用概化机制进行问题模板构建,之后在第七步形成的问题模板知识库中查找出该问题模板所对应的谓词,得到对应的实体-谓词对。
第九步,根据第八步得到的实体-谓词对在第四步形成的Neo4j图形数据库中使用相关的查询语句进行查询,得到对应的值即答案,并返回。
相应的,本发明提供了一种基于知识图谱的问答搜索系统,其特征是,包括获取语料模块、语料抽取模块、知识图谱构建模块、问题模板构建模块、谓词模板构建模块和问答搜索模块;
获取语料模块,用于从网站上爬取乒乓球相关语料形成QA语料库;
语料抽取模块,用于从QA语料库中每条语料中抽取对应的实体、谓词和值;
知识图谱构建模块,用于将每条语料以(实体、谓词、值)三元组形式导入图形数据库,形成乒乓球领域的知识图谱;
问题模板构建模块,用于选取QA语料库中的问题表示为问题模板,形成问题模板知识库;
谓词模板构建模块,用于根据问题模板知识库中的每个问题模板所对应的实体和值,查找连接实体和值的直接谓词,将问题模板映射到此谓词构建谓词模板知识库;
问答搜索模块,用于对用户提出的问题抽取实体,在谓词模板知识库中查找出该实体所对应的谓词,得到对应的实体-谓词对;根据实体-谓词对在知识图谱中进行查询,得到对应的值即为答案。
进一步的,语料抽取模块中,从QA语料库中每条语料中抽取对应的实体、谓词和值包括:
采用MITIE抽取工具从QA语料库中每条语料中抽取对应的实体、谓词和值。
进一步的,知识图谱构建模块中,图形数据库为Neo4j图形数据库。
进一步的,问题模板构建模块中,问题表示为问题模板包括:
使用概念化机制将问题表示为问题模板。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (8)

1.一种基于知识图谱的问答搜索方法,其特征是,包括以下过程:
从网站上爬取乒乓球相关语料形成QA语料库;
从QA语料库中每条语料中抽取对应的实体、谓词和值;
将每条语料以实体、谓词和值三元组形式导入图形数据库,形成乒乓球领域的知识图谱;
选取QA语料库中的问题表示为问题模板,形成问题模板知识库;
根据问题模板知识库中的每个问题模板所对应的实体和值,查找连接实体和值的直接谓词,将问题模板映射到此谓词构建谓词模板知识库;
对用户提出的问题抽取实体,在谓词模板知识库中查找出该实体所对应的谓词,得到对应的实体-谓词对;根据实体-谓词对在知识图谱中进行查询,得到对应的值即为答案。
2.根据权利要求1所述的一种基于知识图谱的问答搜索方法,其特征是,从QA语料库中每条语料中抽取对应的实体、谓词和值包括:
采用MITIE抽取工具从QA语料库中每条语料中抽取对应的实体、谓词和值。
3.根据权利要求1所述的一种基于知识图谱的问答搜索方法,其特征是,图形数据库为Neo4j图形数据库。
4.根据权利要求1所述的一种基于知识图谱的问答搜索方法,其特征是,问题表示为问题模板包括:
使用概念化机制将问题表示为问题模板。
5.一种基于知识图谱的问答搜索系统,其特征是,包括获取语料模块、语料抽取模块、知识图谱构建模块、问题模板构建模块、谓词模板构建模块和问答搜索模块;
获取语料模块,用于从网站上爬取乒乓球相关语料形成QA语料库;
语料抽取模块,用于从QA语料库中每条语料中抽取对应的实体、谓词和值;
知识图谱构建模块,用于将每条语料以实体、谓词和值三元组形式导入图形数据库,形成乒乓球领域的知识图谱;
问题模板构建模块,用于选取QA语料库中的问题表示为问题模板,形成问题模板知识库;
谓词模板构建模块,用于根据问题模板知识库中的每个问题模板所对应的实体和值,查找连接实体和值的直接谓词,将问题模板映射到此谓词构建谓词模板知识库;
问答搜索模块,用于对用户提出的问题抽取实体,在谓词模板知识库中查找出该实体所对应的谓词,得到对应的实体-谓词对;根据实体-谓词对在知识图谱中进行查询,得到对应的值即为答案。
6.根据权利要求5所述的一种基于知识图谱的问答搜索系统,其特征是,语料抽取模块中,从QA语料库中每条语料中抽取对应的实体、谓词和值包括:
采用MITIE抽取工具从QA语料库中每条语料中抽取对应的实体、谓词和值。
7.根据权利要求5所述的一种基于知识图谱的问答搜索系统,其特征是,知识图谱构建模块中,图形数据库为Neo4j图形数据库。
8.根据权利要求5所述的一种基于知识图谱的问答搜索系统,其特征是,问题模板构建模块中,问题表示为问题模板包括:
使用概念化机制将问题表示为问题模板。
CN201910739232.1A 2019-08-12 2019-08-12 一种基于知识图谱的问答搜索方法及系统 Active CN110427478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910739232.1A CN110427478B (zh) 2019-08-12 2019-08-12 一种基于知识图谱的问答搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910739232.1A CN110427478B (zh) 2019-08-12 2019-08-12 一种基于知识图谱的问答搜索方法及系统

Publications (2)

Publication Number Publication Date
CN110427478A true CN110427478A (zh) 2019-11-08
CN110427478B CN110427478B (zh) 2022-09-16

Family

ID=68414078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910739232.1A Active CN110427478B (zh) 2019-08-12 2019-08-12 一种基于知识图谱的问答搜索方法及系统

Country Status (1)

Country Link
CN (1) CN110427478B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909140A (zh) * 2019-11-13 2020-03-24 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN110991183A (zh) * 2019-12-06 2020-04-10 北京百度网讯科技有限公司 问题的谓词确定方法、装置、设备及存储介质
CN111159365A (zh) * 2019-11-26 2020-05-15 国网湖南省电力有限公司 调度模型本体智能问答系统的实现方法、系统及存储介质
CN112115234A (zh) * 2020-09-28 2020-12-22 中国银行股份有限公司 一种问题库分析方法和装置
CN112487214A (zh) * 2020-12-23 2021-03-12 中译语通科技股份有限公司 基于实体共现矩阵的知识图谱关系抽取方法及系统
CN113127610A (zh) * 2019-12-31 2021-07-16 北京猎户星空科技有限公司 一种数据处理方法、装置、设备及介质
CN113326358A (zh) * 2021-08-04 2021-08-31 中国测绘科学研究院 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN112487214B (zh) * 2020-12-23 2024-06-04 中译语通科技股份有限公司 基于实体共现矩阵的知识图谱关系抽取方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729493A (zh) * 2017-09-29 2018-02-23 北京创鑫旅程网络技术有限公司 旅行知识图谱的构建方法、装置及旅行问答方法、装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729493A (zh) * 2017-09-29 2018-02-23 北京创鑫旅程网络技术有限公司 旅行知识图谱的构建方法、装置及旅行问答方法、装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MITHUN BALAKRISHNA 等: "K-Extractor: Automatic Knowledge Extraction for", 《2016 IEEE TENTH INTERNATIONAL CONFERENCE ON SEMANTIC COMPUTING》 *
曹明宇 等: "基于知识图谱的原发性肝癌知识问答系统", 《中文信息学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909140A (zh) * 2019-11-13 2020-03-24 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN110909140B (zh) * 2019-11-13 2022-08-23 国网江苏省电力有限公司电力科学研究院 一种图谱问答与检索问答结合的中枢路由方法及装置
CN111159365A (zh) * 2019-11-26 2020-05-15 国网湖南省电力有限公司 调度模型本体智能问答系统的实现方法、系统及存储介质
CN111159365B (zh) * 2019-11-26 2023-11-17 国网湖南省电力有限公司 调度模型本体智能问答系统的实现方法、系统及存储介质
CN110991183A (zh) * 2019-12-06 2020-04-10 北京百度网讯科技有限公司 问题的谓词确定方法、装置、设备及存储介质
CN113127610A (zh) * 2019-12-31 2021-07-16 北京猎户星空科技有限公司 一种数据处理方法、装置、设备及介质
CN113127610B (zh) * 2019-12-31 2024-04-19 北京猎户星空科技有限公司 一种数据处理方法、装置、设备及介质
CN112115234A (zh) * 2020-09-28 2020-12-22 中国银行股份有限公司 一种问题库分析方法和装置
CN112487214A (zh) * 2020-12-23 2021-03-12 中译语通科技股份有限公司 基于实体共现矩阵的知识图谱关系抽取方法及系统
CN112487214B (zh) * 2020-12-23 2024-06-04 中译语通科技股份有限公司 基于实体共现矩阵的知识图谱关系抽取方法及系统
CN113326358A (zh) * 2021-08-04 2021-08-31 中国测绘科学研究院 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN113326358B (zh) * 2021-08-04 2021-12-07 中国测绘科学研究院 基于知识图谱语义匹配的地震灾害信息服务方法和系统

Also Published As

Publication number Publication date
CN110427478B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
US10642938B2 (en) Artificial intelligence based method and apparatus for constructing comment graph
JP7247441B2 (ja) セマンティック表現モデルの処理方法、装置、電子機器、及び記憶媒体
CN110192210B (zh) 构建和处理用于动态结构化机器学习模型的计算图
US10496749B2 (en) Unified semantics-focused language processing and zero base knowledge building system
CN110427478A (zh) 一种基于知识图谱的问答搜索方法及系统
US10984031B2 (en) Text analyzing method and device, server and computer-readable storage medium
US9606934B2 (en) Matrix ordering for cache efficiency in performing large sparse matrix operations
CN104361127B (zh) 基于领域本体和模板逻辑的多语种问答接口快速构成方法
KR20210116379A (ko) 텍스트 창작 방법, 텍스트 창작 장치, 전자 기기 및 저장 매체
CN106462640B (zh) 对多媒体内容进行的场境搜索
US9842100B2 (en) Functional ontology machine-based narrative interpreter
US20090119090A1 (en) Principled Approach to Paraphrasing
US20170371860A1 (en) Latent Ambiguity Handling in Natural Language Processing
CN110059177B (zh) 一种基于用户画像的活动推荐方法及装置
US20150066476A1 (en) Methods and Systems of Four Valued Analogical Transformation Operators Used in Natural Language Processing and Other Applications
Park et al. Systematic review on chatbot techniques and applications
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
WO2024011813A1 (zh) 一种文本扩展方法、装置、设备及介质
Stancheva et al. A model for generation of test questions
CN110795544B (zh) 内容搜索方法、装置、设备和存储介质
CN113553411B (zh) 查询语句的生成方法、装置、电子设备和存储介质
Sun A natural language interface for querying graph databases
CN109657052A (zh) 一种论文摘要蕴含细粒度知识元的抽取方法及装置
Volkova et al. Lightly supervised learning of procedural dialog systems
Karkar et al. An educational ontology-based m-learning system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant