CN104615724A - 知识库的建立以及基于知识库的信息搜索方法和装置 - Google Patents
知识库的建立以及基于知识库的信息搜索方法和装置 Download PDFInfo
- Publication number
- CN104615724A CN104615724A CN201510064151.8A CN201510064151A CN104615724A CN 104615724 A CN104615724 A CN 104615724A CN 201510064151 A CN201510064151 A CN 201510064151A CN 104615724 A CN104615724 A CN 104615724A
- Authority
- CN
- China
- Prior art keywords
- data
- answer
- knowledge
- knowledge data
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种知识库的建立以及基于知识库的信息搜索方法和装置。所述知识库的建立方法包括:根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构;对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;将所述知识数据按照设定数据结构存储于知识库中。本发明构造了一个能够查询问答查询式答案的知识库,通过查询该知识库,可以将用户输入的问答查询式的答案作为改写词以优选现有的改写变换技术,满足人们日益增长的个性化、精准化的网络搜索请求,在大大提高搜索相关性的同时,减少了二次查询的次数。
Description
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种知识库的建立以及基于知识库的信息搜索方法和装置。
背景技术
随着互联网技术的不断发展以及互联网应用对人们工作、学习与生活的不断渗透,人们越来越多的通过网络获取信息。典型的,用户通过搜索引擎输入查询式(query),搜索引擎通过采用一定的搜索排序方式向用户返回与输入查询式相匹配的搜索结果。一般来说,搜索结果是否能够准确命中用户实际需求的信息与用户输入的查询式的准确度密切相关。因此,在用户输入的查询式并不能准确、全面的表达用户实际搜索需求时,如何提升搜索相关性是目前大搜索技术需要解决的首要问题。
针对上述技术问题,现有技术主要通过对用户输入的查询式改写变换的技术手段,将用户输入的查询式改写为更通用、更准确的改写查询式后,连同用户输入的原始查询式一起进行网络搜索,进而提高搜索相关性的。其中,现有的改写变换技术主要是基于原始查询式中的查询词(term)实现的。即:通过查询近义词词库,将用户输入的原始查询式中的一个或者多个查询词改写为意思相近的查询词后,生成新的改写查询式以进行网络搜索。例如,在用户输入的原始查询式为“谢霆锋媳妇”的时候,现有技术会将“媳妇”改写为同义词“老婆”,并生成新的改写查询式“谢霆锋老婆”后,搜索与“谢霆锋媳妇”和“谢霆锋老婆”分别对应的匹配结果,其中,具体的搜索结果如图1所示。
但是,技术的进步也使得人们对于改写变换技术的要求变得更高,传统的改写变换技术已经无法满足人们日益增强的个性化、精准化的网络搜索请求。
发明内容
有鉴于此,本发明实施例提供一种知识库的建立以及基于知识库的信息搜索方法和装置,以优化现有的改写变换技术,满足人们日益增长的个性化、精准化的网络搜索请求。
在第一方面,本发明实施例提供了一种知识库的建立方法,包括:
根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构;
对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
将所述知识数据按照设定数据结构存储于知识库中。
在第二方面,本发明实施例提供了一种基于知识库的信息搜索方法,包括:
根据用户输入的问答查询式,生成问答知识数据;
根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案,其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
在第三方面,本发明实施例提供了一种知识库的建立装置,包括:
子结构分解模块,用于根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构;
知识数据生成模块,用于对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
知识数据存储模块,用于将所述知识数据按照设定数据结构存储于知识库中。
在第四方面,本发明实施例提供了一种基于知识库的信息搜索装置,包括:
问答知识数据生成模块,用于根据用户输入的问答查询式,生成问答知识数据;
答案获取模块,用于根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案,其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
网络搜索模块,用于根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
本发明实施例基于句子的句法结构,获取实体数据,并在知识库中保存实体之间的关联关系,从而使得知识库中的实体为有机组合的数据,而非孤立的信息。将用户输入的查询式,也基于实体和实体之间的关联在该知识库中进行查询,优选了现有的改写变换技术,满足人们日益增长的个性化、精准化的网络搜索请求,在大大提高搜索相关性的同时,减少了二次查询的次数。
附图说明
图1是现有技术中的一种通过对用户输入的查询式进行改写变换后的搜索结果示意图;
图2是本发明第一实施例的一种基于知识库的建立方法的流程图;
图3a是本发明第一实施例的一种基于NLP技术的词法句法结构分析结果示意图;
图3b是本发明第一实施例的另一种基于NLP技术的词法句法结构分析结果示意图;
图4是本发明第一实施例的一种子结构的结构示意图;
图5是本发明第二实施例的一种基于知识库的建立方法的流程图;
图6是本发明第二实施例的一种子结构合并示意图;
图7是本发明第三实施例的一种基于知识库的建立方法的流程图。
图8是本发明第四实施例的一种信息搜索方法的流程图;
图9是本发明第四实施例的一种问答查询式的词法句法分析的示意图;
图10是本发明第五实施例的一种基于知识库的建立装置的结构图;
图11是本发明第六实施例的一种信息搜索装置的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
第一实施例
图2为本发明第一实施例提供的一种知识库的建立方法的流程图,本实施例的方法可以由知识库的建立装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可以集成于用于提供知识库建立的知识库服务器中,与用于提供网络搜索的搜索服务器配合使用,所述知识库服务器与搜索服务器可以是两个不同的服务器,也可以是同一个服务器,本实施例对此不进行限制。
本实施例的方法具体包括如下操作:
210、根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构。
在本实施例中,知识库服务器根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构。
其中,所述待处理句子是指对网络中存储的文档(例如网页)中的长文本进行分句、指代消解之后所得到的句子。对文本进行分句比较简单,基本上按着代表句子结束的标点符号(例如“!”、“?”或者“。”等)进行处理后即可完成,在此不再赘述。
指代消解技术,具体是指在句子中确定代词指向哪个名词短语的问题。按照指向,可以分为回指和预指。回指就是代词的先行语在代词前面,预指就是代词的先行语在代词后面。当前指代消解技术在学术界以及工业界都有较成熟的技术,在此不再赘述。在本实施例中,重点针对指示代词进行消解,使用的是NLP(Natural Language Processing,自然语言处理)技术。
通过上述分句及指代消解,可获取待处理的句子。之后,通过NLP中的句子的词法、句法结构分析技术,可获取待处理句子的词法、语法结构。例如:通过使用百度公司现有的NLP基础模块:分词模块、实体识别模块、词性标注模块、依存分析模块分析待处理句子的词法句法结构。
例如,待处理句子为“在大坯山下颜良被关公突然袭击快马奔到面前一刀杀死的”,通过词法句法分析后得到的分析结果如图3a所示;待处理句子为“冰雨是刘德华演唱的歌曲”,通过词法句法分析后得到的分析结果如图3b所示。
本实施例在上述词法、句法结构分析基础上,可以将待处理的句子分解为包括实体的子结构。
其中,实体一般是指待处理句子中包括的名词,子结构是指包括有实体的句子结构。
在本实施例中,将待处理的句子分解为包括实体的子结构可以具体包括:
根据对待处理句子的词法句法分析结果,将该待处理句子转化为至少一个子树,每一个词均转化为一个节点,各个节点通过箭头直接或者间接相连。其中,每个子树包括根节点以及与所述根节点相连的子节点。其中,在图4中示出了一种与图3a对应的子树结构示意图;
之后,获取与子树对应的根节点以及与所述根节点对应的子节点,并由根节点和其对应的必须子节点(具有实际含义的子节点)组成包括实体的子结构。
以待处理句子“在大坯山下颜良被关公突然袭击快马奔到面前一刀杀死的”为例,根据NLP词法句法技术分析结果,生成子树1和子树2,子树1的根节点为“杀死”,对应的子节点为“在大坯山下”、“颜良”、“被关公”、“一刀”、“奔到”和“的”;其中,为了使得子结构的内容尽可能简洁,去除作为子树2根节点的“奔到”,同时除去无意义的子节点“的”,选取必须的子节点“在大坯山下”、“颜良”、“被关公”、“一刀”,构成的子结构1为{在大坯山下颜良被关公一刀杀死};子树2的根节点为“奔到”,对应的子节点为“快马”、“面前”等,根据句法语法结构分析结果,选取必须的子节点为“快马”、“面前”,构成的子结构2为{快马奔到面前}。
再以句子“冰雨是刘德华演唱的歌曲”为例,根据NLP词法句法技术分析结果,生成子树1和子树2,子树1的根节点为“是”,对应的子节点为“冰雨”、“歌曲”,其均为必须子节点,构成的子结构1为{冰雨是歌曲};子树2的根节点为“演唱”,对应的子节点为“刘德华”、“歌曲”和“的”,去除无意义子节点“的”,构成的子结构2为{刘德华演唱歌曲}。
220、对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系。
在本实施例中,知识服务器对所述子结构进行数据处理,生成知识数据。
具体的,所述数据处理过程可以包括:根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据。例如,如果子结构为“颜良被关公杀死”,通过句式转换,将其调整为规范的子结构“关公杀死颜良”,从而生成知识数据;所述数据处理过程还可以包括:对同一个待处理的句子所获取的至少两个子结构进行数据挖掘,生成新的子结构,并在新的子结构的基础上生成知识数据等,对此并不进行限制。
其中,所述至少两个实体所满足的设定关联关系,可以包括:第一实体是第二实体的下位概念(例如知识数据“苹果是水果”);第一实体的属性的具体属性值是第二实体(例如知识数据“刘德华的老婆是朱丽倩”);第一实体与第二实体通过动作连接(例如知识数据“在大坯山下关公一刀杀死颜良”)等。设定关联关系不限于上述三种,还可以根据需要添加,通常是经常出现的实体之间的关系。
230、将所述知识数据按照设定数据结构存储于知识库中。
在本实施例中,知识服务器将所述知识数据按照设定数据结构存储于知识库中,其可以具体为将所述知识数据按照如下数据结构存储于所述知识库中:(实体1,实体2,实体关联);还可以为将所述知识数据按照如下数据结构存储于所述知识库中:(实体1,实体2,实体关联,关联发生条件1,…,关联发生条件M);其中,M≥0。对此并不进行限制。实体关联就是两个实体之间的设定关联关系,而关联发生条件则是两个实体发生此关联关系的条件,例如时间条件、地点条件等。
本发明实施例基于句子的句法结构,获取实体数据,并在知识库中保存实体之间的关联关系,从而使得知识库中的实体为有机组合的数据,而非孤立的信息。将用户输入的查询式,也基于实体和实体之间的关联在该知识库中进行查询,优选了现有的改写变换技术,满足人们日益增长的个性化、精准化的网络搜索请求,在大大提高搜索相关性的同时,减少了二次查询的次数。
第二实施例
图5是本发明第二实施例的一种知识库的建立方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,将操作对所述子结构进行数据处理,生成知识数据优化为:根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据;
进一步的,对所述子结构进行数据处理,生成知识数据优化为:如果至少两个所述子结构中包括等价关系词,则提取所述等价关系词对应的等价主体;根据所述等价主体,对所述至少两个子结构进行合并,生成等价子结构,作为所述知识数据;
进一步的,将所述知识数据按照设定数据结构存储于知识库中优化为:
将所述知识数据按照如下数据结构存储于所述知识库中:(实体1,实体2,实体关联)。
相应的,本实施例的方法包括如下操作:
510、根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构。
520、根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据。
在本实施例中,知识服务器根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据。。规范子结构是能够方便进行后续处理的句式,实际上是将各种不同句式统一为相同的句式(例如,例如将被动句统一为主动句等)。典型的,为了后续处理方便,所述规范子结构具体可以优化为主动句形式的子结构。
优选的,当所述子结构的句式为被动句时,根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构具体可以包括:确定所述子结构中是否包括被动词(典型的,“被”),若是,则将所述子结构中的主语和宾语位置进行调换,并删除该被动词后的子结构作为所述知识数据;否则,直接将所述子结构作为所述知识数据。
当然,可以理解的是,所述子结构还可以为其他的句式,例如,把字句或者倒装句等,在实际应用时,根据不同的句式,可以采取不同的句式调整方式,这里不再赘述。
530、判断所述待处理句子是否分解出至少两个子结构:若是,执行540;否则,执行570。
在本实施例中,知识服务器判断所述待处理句子是否分解出至少两个子结构。这样设置的原因是:在待处理句子可以分解为至少两个子结构时,进一步挖掘子结构之间的关联关系,如果所述至少两个子结构之间满足一定的条件时,对所述至少两个子结构进行合并,以生成新的子结构,并根据新的子结构生成新的知识数据。
540、判断至少两个所述子结构中是否包括等价关系词:若是,执行550;否则,执行570。
在本实施例中,知识服务器判断至少两个所述子结构中是否包括等价关系词。
其中,所述等价关系词具体是指可以用来表示等价关系的词,例如:“是”、“相当于”或者“等价于”等词。
550、提取所述等价关系词对应的等价主体。
在本实施例中,所述等价主体具体是指等价关系词所连接的两个词。
560、根据所述等价主体,对所述至少两个子结构进行合并,生成等价子结构,作为新的知识数据。
在本实施例中,知识服务器根据所述等价主体,对所述至少两个子结构进行合并,生成等价子结构,作为新的知识数据。
在一个具体例子中,待处理句子“冰雨是刘德华演唱的歌曲”可以分解出“冰雨是歌曲”以及“刘德华演唱歌曲”这两个子结构,其中,“冰雨是歌曲”包括等价词“是”,因此,可以提取与该等价词对应的两个等价主体:“冰雨”以及“歌曲”。之后,通过使用等价主体“冰雨”代替子结构“刘德华演唱歌曲”中的等价主体“歌曲”,可以合并出一个新的子结构“刘德华演唱冰雨”,并将该合并出的子结构作为新的知识数据。其中,在图6中示出了上述过程的子结构合并示意图。
570、将所述知识数据按照设定数据结构存储于知识库中
在本实施例中,知识服务器将所述知识数据按照如下数据结构存储于所述知识库中:(实体1,实体2,实体关联)。
其中,实体1和实体2代表所述知识数据中的两个实体,实体关联代表实体1和实体2之间的关联关系。
典型的,如果实体1是实体2的下位概念或者实体1与实体2通过动作连接时,可以直接将知识数据中的谓语部分作为实体关联,如果实体1的属性的具体属性值是实体2,可以直接将实体1的属性作为实体关联。
本发明实施例介绍了对子结构进行优化数据处理的具体方式,能够更准确、精炼的在知识库中体现实体之间的关系。
在上述各实施例的基础上,对所述子结构进行数据处理,生成知识数据之后,还可以优选包括:对所述知识数据的准确性进行验证,去除不可信的知识数据。
在本优选实施方式中,对所述知识数据内容的准确性指标进行验证具体可以包括:
根据所述知识数据对应的待处理句子的来源网站的质量,和/或生成所述知识数据的来源网站的数目,对所述知识数据内容的准确性指标进行验证。
第三实施例
图7是本发明第三实施例的一种知识库的建立方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,优选的将操作将所述知识数据按照设定数据结构存储于知识库中优化为:
将所述知识数据按照如下数据结构存储于所述知识库中:
(实体1,实体2,实体关联,关联发生条件1,…,关联发生条件M);
其中,M≥0。
进一步的,将操作在将所述知识数据按照设定数据结构存储于知识库的同时,还优选包括:
根据所述知识数据的实体关联参数的属性,对所述知识数据进行分类,
其中,所述实体关联参数的属性包括下述至少一项:上下位关系、归属关系和行为动作关系。
相应的,本实施例的方法包括如下操作:
710、根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构。
720、对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系。
730、将所述知识数据按照如下数据结构存储于所述知识库中:(实体1,实体2,实体关联,关联发生条件1,…,关联发生条件M);其中,M≥0。
在本实施例中,为了除了在知识库中存储实体1、实体2以及实体关联之外,还存储了关联发生条件,所述关联发生条件代表所述实体关联发生的条件,例如,地点、时间和原因等。
740、根据所述知识数据的实体关联参数的属性,对所述知识数据进行分类。
在本实施例中,所述实体关联参数的属性包括下述至少一项:上下位关系、归属关系和行为动作关系。
在本实施例中,如果知识库中存储的知识数据中,实体1是实体2的下位概念,则将该知识数据分类为上下位关系的知识数据,例如,(实体1=冰雨,实体2=歌曲,实体关联=是);如果实体1与实体2通过动作连接,则将该知识数据分类为行为动作关系的知识数据,例如,(实体1=刘德华,实体2=冰雨,实体关联=演唱);如果实体1的属性的具体属性值是实体2,则将该知识数据分类为归属关系的知识数据,例如,(实体1=刘德华,实体2=朱丽倩,关联关系=老婆)。
在本实施例的一个优选的实施方式中,为了提高对知识库中知识数据的查询速度,可以分别为根据知识数据中的包括的记录(实体1、实体2以及实体关联等)建立倒排库和/或正排库。典型的,对于倒排库,每一个记录均会作为关键词建立倒排拉链。顺排库是将数据库的全部记录按照记录号的大小排列而成的文献集合,它构成了数据库的主体内容。在倒排库中,记录的特征标识作为排列依据,其后列出含有此标识的记录号,使用倒排文档可以大大提高检索的效率。
本发明实施例进一步在知识数据中设置了关联发生条件,这样在知识数据中,对具有关联关系的实体的描述更加具体,则后续匹配查询式时,也能更精细化的匹配和改写。
第四实施例
图8是本发明第四实施例的一种信息搜索方法的流程图流程图。本实施例的方法可以由信息搜索装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可以集成于用于提供网络搜索的搜索服务器中,与用于提供知识库建立的知识库服务器配合使用,所述知识库服务器与搜索服务器可以是两个不同的服务器,也可以是同一个服务器,本实施例对此不进行限制。
相应的,本实施例的方法包括如下操作:
810、根据用户输入的问答查询式,生成问答知识数据。
在本实施例中,搜索服务器根据用户输入的问答查询式,生成问答知识数据。
其中,所述问答查询式是指包括问答查询词的查询式。具体的,问答查询词可以包括:“哪些”、“哪种”、“谁”、“什么”、“哪里”等词,对此并不进行限制。
所述问答知识数据是指包括至少两个实体,且所述至少两个实体满足设定关联关系的数据。其中,生成所述问答知识数据的过程与第一实施例中生成知识数据的过程相同,此处不再赘述。
在一个例子中,用户输入的问答查询式为“吸收甲醛的植物有哪些”,如图9所示,根据该问答查询式生成的问答知识数据为:“植物吸收甲醛”。
820、根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案。
在本实施例中,搜索服务器根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案。
其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系。即,该知识库可以为本发明实施例中知识库建立方法所建立的知识库。
在本实施例中,根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案具体可以包括:
根据所述问答知识数据中包括的答案类型实体,查询所述知识库中的第一结构的数据,获取第一答案,其中,所述第一结构数据的关联关系为上下位关系;
根据所述问答知识数据中包括的关联关系以及辅助答案实体,查询所述知识库中的第二结构的数据或者第三结构的数据,获取第二答案,其中,所述第二结构数据的关联关系为归属关系,所述第三结构数据的关联关系为行为动作关系;
将所述第一答案与所述第二答案的交集,作为所述问答知识数据对应的答案。
在一个具体的例子中,获取的问答知识数据为“植物吸收甲醛”,其中,“植物”为答案类型实体,“甲醛”为辅助答案实体,“吸收”为关联关系。
首先构造结构(实体1=第一答案,实体2=植物,实体关联=*),在知识库中查询上下位关系的知识数据,获取第一答案。其中,关联关系为*,表示关系不进行查询,因为上下位关系的知识数据已经表示实体2是上位词,关系并不重要。
接着构造结构(实体1=第二答案,实体2=甲醛,实体关联=吸收),在知识库中查询行为动作的知识数据,获取第二答案。优选的,针对实体关联会进行同义词变换,如“吸收”同义变换为“吸”等;
然后,将得到的第一答案与第二答案进行“与”操作,获取最终的一系列答案{答案1,答案2,答案3,……}。
830、根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
在本实施例中,搜索服务器根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
如上例所示,将问答查询式“吸收甲醛的植物有哪些”改写为“答案1吸收甲醛”、“答案2吸收甲醛”等几个查询式后,与原有的问答查询式一起进行网络搜索。
优选的,为了不影响针对用户实际输入的问答查询式的查询结果的,可以将所述改写结果对应的查询词的查询重要度设置为可省。
优选的,为了进一步提高提高搜索效果,可以将与所述改写结果对应的搜索结果排列于所述问答查询式对应的搜索结果之前,生成优化搜索结果,并将所述优化搜索结果提供给用户。
本发明实施例基于前述知识库进行问答查询式的改写,并非孤立的考虑查询词,而是考虑实体之间的关联,从而能够对查询式进行更精准的改写,满足人们日益增长的个性化、精准化的网络搜索请求,在大大提高搜索相关性的同时,减少了二次查询的次数。
具体来说,对于有获取答案需求的问答查询式,例如,“补钙的蔬菜有哪些”等,用户往往希望搜索引擎返回的搜索结果能够直接给出“补钙的蔬菜有哪些”这一问题的答案(例如,“芥菜补钙”或者“苋菜补钙”等),通过本实施例的方法,搜索结果中仅仅会包括“补钙的蔬菜”等搜索结果,而且还会包括由具体蔬菜名,例如,“芥菜补钙”或者“苋菜补钙”等构成的搜索结果。
第五实施例
在图10中示出了本发明第五实施例的一种知识库建立装置的结构图,如图10所示,所述装置包括:
子结构分解模块101,用于根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构。
知识数据生成模块102,用于对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系。
知识数据存储模块103,用于将所述知识数据按照设定数据结构存储于知识库中。
本发明实施例通过根据待处理句子的句法结构,将所述待处理句子分解为至少一个子结构;对所述至少一个子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;将所述知识数据按照设定数据结构存储于知识库中的技术手段,构造了一个能够查询问答查询式答案的知识库,通过查询该知识库,可以将用户输入的问答查询式的答案作为改写词以优选现有的改写变换技术,满足人们日益增长的个性化、精准化的网络搜索请求,在大大提高搜索相关性的同时,减少了二次查询的次数。
在上述各实施例的基础上,对所述子结构进行数据处理,生成知识数据可以包括:
根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据。
在上述各实施例的基础上,对所述子结构进行数据处理,生成知识数据包括:
如果至少两个所述子结构中包括等价关系词,则提取所述等价关系词对应的等价主体;
根据所述等价主体,对所述至少两个子结构进行合并,生成等价子结构,作为所述知识数据。
在上述各实施例的基础上,对所述子结构进行数据处理,生成知识数据之后,还可以包括:
对所述知识数据的准确性进行验证,去除不可信的知识数据。
在上述各实施例的基础上,将所述知识数据按照设定数据结构存储于知识库中包括:
将所述知识数据按照如下数据结构存储于所述知识库中:
(实体1,实体2,实体关联)。
在上述各实施例的基础上,将所述知识数据按照设定数据结构存储于知识库中可以包括:
将所述知识数据按照如下数据结构存储于所述知识库中:
(实体1,实体2,实体关联,关联发生条件1,…,关联发生条件M);
其中,M≥0。
在上述各实施例的基础上,在将所述知识数据按照设定数据结构存储于知识库的同时,还可以包括:
根据所述知识数据的实体关联参数的属性,对所述知识数据进行分类,
其中,所述实体关联参数的属性包括下述至少一项:上下位关系、归属关系和行为动作关系。
本发明实施例所提供的知识库建立装置可用于执行本发明任意实施例提供的知识库建立方法,具备相应的功能模块,实现相同的有益效果。
第六实施例
在图11中示出了本发明第六实施例的一种基于知识库的信息搜索装置的结构图,如图11所示,所述装置包括:
问答知识数据生成模块111,用于根据用户输入的问答查询式,生成问答知识数据。
答案获取模块112,用于根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案,其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系。
网络搜索模块113,用于根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
本发明实施例通过根据用户输入的问答查询式,生成问答知识数据;根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案,其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索的技术手段,可以将用户输入的问答查询式的答案作为改写词以优选现有的改写变换技术,满足人们日益增长的个性化、精准化的网络搜索请求,在大大提高搜索相关性的同时,减少了二次查询的次数。
在上述各实施例的基础上,所述答案获取模块具体可以用于:
根据所述问答知识数据中包括的答案类型实体,查询所述知识库中的第一结构的数据,获取第一答案,其中,所述第一结构数据的关联关系为上下位关系;
根据所述问答知识数据中包括的关联关系以及辅助答案实体,查询所述知识库中的第二结构的数据或者第三结构的数据,获取第二答案,其中,所述第二结构数据的关联关系为归属关系,所述第三结构数据的关联关系为行为动作关系;
将所述第一答案与所述第二答案的交集,作为所述问答知识数据对应的答案
本发明实施例所提供的基于知识库的信息搜索装置可用于执行本发明任意实施例提供的基于知识库的信息搜索方法,具备相应的功能模块,实现相同的有益效果。
显然,本领域技术人员应该明白,上述的本发明的各模块或各步骤可以通过如上所述的服务器实施。可选地,本发明实施例可以用计算机装置可执行的程序来实现,从而可以将它们存储在存储装置中由处理器来执行,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等;或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种知识库的建立方法,其特征在于,包括:
根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构;
对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
将所述知识数据按照设定数据结构存储于知识库中。
2.根据权利要求1所述的方法,其特征在于,对所述子结构进行数据处理,生成知识数据包括:
根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据。
3.根据权利要求1或2所述的方法,其特征在于,对所述子结构进行数据处理,生成知识数据包括:
如果至少两个所述子结构中包括等价关系词,则提取所述等价关系词对应的等价主体;
根据所述等价主体,对所述至少两个子结构进行合并,生成等价子结构,作为所述知识数据。
4.根据权利要求1所述的方法,其特征在于,对所述子结构进行数据处理,生成知识数据之后,还包括:
对所述知识数据的准确性进行验证,去除不可信的知识数据。
5.根据权利要求1所述的方法,其特征在于,将所述知识数据按照设定数据结构存储于知识库中包括:
将所述知识数据按照如下数据结构存储于所述知识库中:
(实体1,实体2,实体关联)。
6.根据权利要求1所述的方法,其特征在于,将所述知识数据按照设定数据结构存储于知识库中包括:
将所述知识数据按照如下数据结构存储于所述知识库中:
(实体1,实体2,实体关联,关联发生条件1,…,关联发生条件M);
其中,M≥0。
7.根据权利要求5或6所述的方法,其特征在于,在将所述知识数据按照设定数据结构存储于知识库的同时,还包括:
根据所述知识数据的实体关联参数的属性,对所述知识数据进行分类,
其中,所述实体关联参数的属性包括下述至少一项:上下位关系、归属关系和行为动作关系。
8.一种基于知识库的信息搜索方法,其特征在于,包括:
根据用户输入的问答查询式,生成问答知识数据;
根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案,其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
9.根据权利要求8所述的方法,其特征在于,根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案包括:
根据所述问答知识数据中包括的答案类型实体,查询所述知识库中的第一结构的数据,获取第一答案,其中,所述第一结构数据的关联关系为上下位关系;
根据所述问答知识数据中包括的关联关系以及辅助答案实体,查询所述知识库中的第二结构的数据或者第三结构的数据,获取第二答案,其中,所述第二结构数据的关联关系为归属关系,所述第三结构数据的关联关系为行为动作关系;
将所述第一答案与所述第二答案的交集,作为所述问答知识数据对应的答案。
10.一种知识库的建立装置,其特征在于,包括:
子结构分解模块,用于根据待处理句子的句法结构,将所述待处理句子分解为包括实体的子结构;
知识数据生成模块,用于对所述子结构进行数据处理,生成知识数据,其中,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
知识数据存储模块,用于将所述知识数据按照设定数据结构存储于知识库中。
11.根据权利要求10所述的装置,其特征在于,所述知识数据生成模块具体用于:
根据所述子结构的句式,将所述子结构调整为标准句式的规范子结构,作为所述知识数据。
12.根据权利要求10或11所述的装置,其特征在于,所述知识数据生成模块进一步具体用于:
如果至少两个所述子结构中包括等价关系词,则提取所述等价关系词对应的等价主体;
根据所述等价主体,对所述至少两个子结构进行合并,生成等价子结构,作为所述知识数据。
13.根据权利要求10所述的装置,其特征在于,所述知识数据存储模块具体用于:
将所述知识数据按照如下数据结构存储于所述知识库中:
(实体1,实体2,实体关联,关联发生条件1,…,关联发生条件M);
其中,M≥0。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
属性分类模块,用于在将所述知识数据按照设定数据结构存储于知识库的同时,根据所述知识数据的实体关联参数的属性,对所述知识数据进行分类,
其中,所述实体关联参数的属性包括下述至少一项:上下位关系、归属关系和行为动作关系。
15.一种基于知识库的信息搜索装置,其特征在于,包括:
问答知识数据生成模块,用于根据用户输入的问答查询式,生成问答知识数据;
答案获取模块,用于根据所述问答知识数据,查询知识库,获取所述问答知识数据对应的答案,其中,所述知识库中包括至少一条设定数据结构的知识数据,所述知识数据包括至少两个实体,且所述至少两个实体满足设定关联关系;
网络搜索模块,用于根据获取的所述答案,改写所述问答查询式,并根据改写结果进行网络搜索。
16.根据权利要求15所述的装置,其特征在于,所述答案获取模块具体用于:
根据所述问答知识数据中包括的答案类型实体,查询所述知识库中的第一结构的数据,获取第一答案,其中,所述第一结构数据的关联关系为上下位关系;
根据所述问答知识数据中包括的关联关系以及辅助答案实体,查询所述知识库中的第二结构的数据或者第三结构的数据,获取第二答案,其中,所述第二结构数据的关联关系为归属关系,所述第三结构数据的关联关系为行为动作关系;
将所述第一答案与所述第二答案的交集,作为所述问答知识数据对应的答案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510064151.8A CN104615724B (zh) | 2015-02-06 | 2015-02-06 | 知识库的建立以及基于知识库的信息搜索方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510064151.8A CN104615724B (zh) | 2015-02-06 | 2015-02-06 | 知识库的建立以及基于知识库的信息搜索方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104615724A true CN104615724A (zh) | 2015-05-13 |
CN104615724B CN104615724B (zh) | 2018-01-23 |
Family
ID=53150166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510064151.8A Active CN104615724B (zh) | 2015-02-06 | 2015-02-06 | 知识库的建立以及基于知识库的信息搜索方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104615724B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899279A (zh) * | 2015-05-29 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 用于数据处理的系统以及数据处理的方法 |
CN105404660A (zh) * | 2015-11-05 | 2016-03-16 | 上海智臻智能网络科技股份有限公司 | 多级数据存储方法及装置、多级数据结构、信息检索方法 |
CN107229698A (zh) * | 2017-05-24 | 2017-10-03 | 北京神州泰岳软件股份有限公司 | 一种信息处理的方法及装置 |
CN107256226A (zh) * | 2017-04-28 | 2017-10-17 | 北京神州泰岳软件股份有限公司 | 一种知识库的构建方法及装置 |
CN107368479A (zh) * | 2016-05-11 | 2017-11-21 | 江苏食品药品职业技术学院 | 一种利用计算机应用的信息检索方法 |
CN107688616A (zh) * | 2016-08-05 | 2018-02-13 | 谷歌有限责任公司 | 使实体的独特事实显现 |
CN107885842A (zh) * | 2017-11-10 | 2018-04-06 | 上海智臻智能网络科技股份有限公司 | 智能问答的方法、装置、服务器及存储介质 |
CN107908637A (zh) * | 2017-09-26 | 2018-04-13 | 北京百度网讯科技有限公司 | 一种基于知识库的实体更新方法及系统 |
WO2018113532A1 (zh) * | 2016-12-22 | 2018-06-28 | 腾讯科技(深圳)有限公司 | 信息抽取方法和系统 |
CN108733702A (zh) * | 2017-04-20 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 用户查询上下位关系提取的方法、装置、电子设备和介质 |
CN109408628A (zh) * | 2019-01-15 | 2019-03-01 | 深兰人工智能芯片研究院(江苏)有限公司 | 一种解析句子语义结构的方法及相关设备 |
US10394956B2 (en) | 2015-12-31 | 2019-08-27 | Shanghai Xiaoi Robot Technology Co., Ltd. | Methods, devices, and systems for constructing intelligent knowledge base |
CN110427471A (zh) * | 2019-07-26 | 2019-11-08 | 四川长虹电器股份有限公司 | 一种基于知识图谱的自然语言问答方法及系统 |
CN110727786A (zh) * | 2019-09-12 | 2020-01-24 | 武汉儒松科技有限公司 | 自学习的知识库管理方法、装置、终端设备及存储介质 |
CN110799970A (zh) * | 2017-06-27 | 2020-02-14 | 华为技术有限公司 | 一种问答系统及问答方法 |
CN113254622A (zh) * | 2021-06-23 | 2021-08-13 | 中国银行股份有限公司 | 知识点查询方法、装置及服务器 |
CN115017255A (zh) * | 2022-08-08 | 2022-09-06 | 杭州实在智能科技有限公司 | 一种基于树状结构的知识库构建和搜索方法 |
CN117076648A (zh) * | 2023-10-13 | 2023-11-17 | 腾讯科技(深圳)有限公司 | 一种对话文本处理方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576909A (zh) * | 2009-05-11 | 2009-11-11 | 内蒙古蒙科立软件有限责任公司 | 一种蒙古语数字化知识库系统构建方法 |
CN102254039A (zh) * | 2011-08-11 | 2011-11-23 | 武汉安问科技发展有限责任公司 | 一种基于搜索引擎的网络搜索方法 |
CN102880645A (zh) * | 2012-08-24 | 2013-01-16 | 上海云叟网络科技有限公司 | 语义化的智能搜索方法 |
US20130117202A1 (en) * | 2011-11-03 | 2013-05-09 | Microsoft Corporation | Knowledge-based data quality solution |
CN103425714A (zh) * | 2012-05-25 | 2013-12-04 | 北京搜狗信息服务有限公司 | 一种搜索方法和系统 |
-
2015
- 2015-02-06 CN CN201510064151.8A patent/CN104615724B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576909A (zh) * | 2009-05-11 | 2009-11-11 | 内蒙古蒙科立软件有限责任公司 | 一种蒙古语数字化知识库系统构建方法 |
CN102254039A (zh) * | 2011-08-11 | 2011-11-23 | 武汉安问科技发展有限责任公司 | 一种基于搜索引擎的网络搜索方法 |
US20130117202A1 (en) * | 2011-11-03 | 2013-05-09 | Microsoft Corporation | Knowledge-based data quality solution |
CN103425714A (zh) * | 2012-05-25 | 2013-12-04 | 北京搜狗信息服务有限公司 | 一种搜索方法和系统 |
CN102880645A (zh) * | 2012-08-24 | 2013-01-16 | 上海云叟网络科技有限公司 | 语义化的智能搜索方法 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899279A (zh) * | 2015-05-29 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 用于数据处理的系统以及数据处理的方法 |
CN105404660A (zh) * | 2015-11-05 | 2016-03-16 | 上海智臻智能网络科技股份有限公司 | 多级数据存储方法及装置、多级数据结构、信息检索方法 |
US10394956B2 (en) | 2015-12-31 | 2019-08-27 | Shanghai Xiaoi Robot Technology Co., Ltd. | Methods, devices, and systems for constructing intelligent knowledge base |
US11301637B2 (en) | 2015-12-31 | 2022-04-12 | Shanghai Xiaoi Robot Technology Co., Ltd. | Methods, devices, and systems for constructing intelligent knowledge base |
US11017178B2 (en) | 2015-12-31 | 2021-05-25 | Shanghai Xiaoi Robot Technology Co., Ltd. | Methods, devices, and systems for constructing intelligent knowledge base |
US11227118B2 (en) | 2015-12-31 | 2022-01-18 | Shanghai Xiaoi Robot Technology Co., Ltd. | Methods, devices, and systems for constructing intelligent knowledge base |
CN107368479A (zh) * | 2016-05-11 | 2017-11-21 | 江苏食品药品职业技术学院 | 一种利用计算机应用的信息检索方法 |
US11568274B2 (en) | 2016-08-05 | 2023-01-31 | Google Llc | Surfacing unique facts for entities |
CN107688616B (zh) * | 2016-08-05 | 2021-07-09 | 谷歌有限责任公司 | 使实体的独特事实显现 |
CN107688616A (zh) * | 2016-08-05 | 2018-02-13 | 谷歌有限责任公司 | 使实体的独特事实显现 |
US11093520B2 (en) | 2016-12-22 | 2021-08-17 | Tencent Technology (Shenzhen) Company Limited | Information extraction method and system |
WO2018113532A1 (zh) * | 2016-12-22 | 2018-06-28 | 腾讯科技(深圳)有限公司 | 信息抽取方法和系统 |
CN108733702A (zh) * | 2017-04-20 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 用户查询上下位关系提取的方法、装置、电子设备和介质 |
CN108733702B (zh) * | 2017-04-20 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 用户查询上下位关系提取的方法、装置、电子设备和介质 |
CN107256226B (zh) * | 2017-04-28 | 2018-10-30 | 北京神州泰岳软件股份有限公司 | 一种知识库的构建方法及装置 |
CN107256226A (zh) * | 2017-04-28 | 2017-10-17 | 北京神州泰岳软件股份有限公司 | 一种知识库的构建方法及装置 |
CN107229698A (zh) * | 2017-05-24 | 2017-10-03 | 北京神州泰岳软件股份有限公司 | 一种信息处理的方法及装置 |
CN110799970A (zh) * | 2017-06-27 | 2020-02-14 | 华为技术有限公司 | 一种问答系统及问答方法 |
CN107908637A (zh) * | 2017-09-26 | 2018-04-13 | 北京百度网讯科技有限公司 | 一种基于知识库的实体更新方法及系统 |
CN107908637B (zh) * | 2017-09-26 | 2021-02-12 | 北京百度网讯科技有限公司 | 一种基于知识库的实体更新方法及系统 |
CN107885842A (zh) * | 2017-11-10 | 2018-04-06 | 上海智臻智能网络科技股份有限公司 | 智能问答的方法、装置、服务器及存储介质 |
CN109408628B (zh) * | 2019-01-15 | 2019-06-07 | 深兰人工智能芯片研究院(江苏)有限公司 | 一种解析句子语义结构的方法及相关设备 |
CN109408628A (zh) * | 2019-01-15 | 2019-03-01 | 深兰人工智能芯片研究院(江苏)有限公司 | 一种解析句子语义结构的方法及相关设备 |
CN110427471A (zh) * | 2019-07-26 | 2019-11-08 | 四川长虹电器股份有限公司 | 一种基于知识图谱的自然语言问答方法及系统 |
CN110727786A (zh) * | 2019-09-12 | 2020-01-24 | 武汉儒松科技有限公司 | 自学习的知识库管理方法、装置、终端设备及存储介质 |
CN113254622A (zh) * | 2021-06-23 | 2021-08-13 | 中国银行股份有限公司 | 知识点查询方法、装置及服务器 |
CN113254622B (zh) * | 2021-06-23 | 2024-02-20 | 中国银行股份有限公司 | 知识点查询方法、装置及服务器 |
CN115017255A (zh) * | 2022-08-08 | 2022-09-06 | 杭州实在智能科技有限公司 | 一种基于树状结构的知识库构建和搜索方法 |
CN115017255B (zh) * | 2022-08-08 | 2022-11-01 | 杭州实在智能科技有限公司 | 一种基于树状结构的知识库构建和搜索方法 |
CN117076648A (zh) * | 2023-10-13 | 2023-11-17 | 腾讯科技(深圳)有限公司 | 一种对话文本处理方法、装置、电子设备和存储介质 |
CN117076648B (zh) * | 2023-10-13 | 2024-02-06 | 腾讯科技(深圳)有限公司 | 一种对话文本处理方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104615724B (zh) | 2018-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104615724B (zh) | 知识库的建立以及基于知识库的信息搜索方法和装置 | |
Su et al. | Information resources processing using linguistic analysis of textual content | |
More et al. | Generating UML diagrams from natural language specifications | |
Tablan et al. | Mímir: An open-source semantic search framework for interactive information seeking and discovery | |
CN105868313A (zh) | 一种基于模板匹配技术的知识图谱问答系统及方法 | |
CN106776797A (zh) | 一种基于本体推理的知识问答系统及其工作方法 | |
CN105389344A (zh) | 一种自助式查新方法及系统 | |
Nakashole et al. | Real-time population of knowledge bases: opportunities and challenges | |
Agrawal et al. | Semantic analysis of natural language queries using domain ontology for information access from database | |
Lesmo et al. | TULSI: an NLP system for extracting legal modificatory provisions | |
CN110717014B (zh) | 一种本体知识库动态构建方法 | |
Fudholi et al. | Ontology-based information extraction for knowledge enrichment and validation | |
Mvumbi | Natural language interface to relational database: a simplified customization approach | |
Dixit et al. | Design of an ontology based adaptive crawler for hidden web | |
Kraychev et al. | Computationally effective algorithm for information extraction and online review mining | |
KR102298397B1 (ko) | 인용 유형 기반의 인용 관계 분석 방법 및 시스템 | |
Rahimtoroghi et al. | A structural rule-based stemmer for Persian | |
CN114391142A (zh) | 使用结构化和非结构化数据的解析查询 | |
Buey et al. | An approach for automatic query expansion based on NLP and semantics | |
Shaikh et al. | Framework for web content mining using semantic search and natural language queries | |
Brauer et al. | RankIE: document retrieval on ranked entity graphs | |
Pipitone et al. | Cognitive linguistics as the underlying framework for semantic annotation | |
English | An extensible schema for building large weakly-labeled semantic corpora | |
Sadasivam et al. | Hypergraph-based Wikipedia search with semantics | |
Hamaz et al. | A novel method for providing relational databases with rich semantics and natural language processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |