CN109101565A - 一种基于图数据库的语义搜索实现方法 - Google Patents

一种基于图数据库的语义搜索实现方法 Download PDF

Info

Publication number
CN109101565A
CN109101565A CN201810778497.8A CN201810778497A CN109101565A CN 109101565 A CN109101565 A CN 109101565A CN 201810778497 A CN201810778497 A CN 201810778497A CN 109101565 A CN109101565 A CN 109101565A
Authority
CN
China
Prior art keywords
semantic search
attribute
data
name
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810778497.8A
Other languages
English (en)
Inventor
柳廷娜
胡晓庆
肖雪
王建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Group Co Ltd
Original Assignee
Inspur Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Group Co Ltd filed Critical Inspur Software Group Co Ltd
Priority to CN201810778497.8A priority Critical patent/CN109101565A/zh
Publication of CN109101565A publication Critical patent/CN109101565A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图数据库的语义搜索实现方法,该方法步骤如下:1)进行数据抽象;2)构建元数据信息;3)构建语义搜索模型;4)查询语句到语义搜索模型的转换;5)语义搜索模型到图查询语言的转换;6)图查询语言的执行与结果处理。本发明和现有技术相比,通过制定简单易用的模型,使其更具可维护性、可操作性和可扩展性,从而达到语义搜索易用性、准确性和灵活性的目的;即避免了维护繁杂的指令集,又借助于图数据库引擎强大的逻辑查询功能与元数据的支持,提高了查询的效率与准确性,最终使得用户获取信息的能力大大增强。

Description

一种基于图数据库的语义搜索实现方法
技术领域
本发明涉及语义搜索技术领域,具体地说是一种基于图数据库的语义搜索实现方法。
背景技术
语义搜索是更加智能的搜索引擎,是未来搜索引擎的发展方向。它代表支持用户表达复杂的查询需求,精确定位并给出答案。语义搜索可以分为:信息预处理和信息抽取、用户需求识别、查询处理、结果表示和用户反馈及优化处理等过程。
发明内容
本发明的技术任务是提供一种基于图数据库的语义搜索实现方法。
本发明的技术任务是按以下方式实现的:
一种基于图数据库的语义搜索实现方法,该方法步骤如下:
步骤1)进行数据抽象;
步骤2)构建元数据信息;
步骤3)构建语义搜索模型;
步骤4)查询语句到语义搜索模型的转换;
步骤5)语义搜索模型到图查询语言的转换;
步骤6)图查询语言的执行与结果处理。
所述的进行数据抽象,包括:
对用户数据进行分析与抽象,分析数据之间的属性包含与关联关系,最终将用户数据抽象为对象与关系两种类型的数据,并将其持久化到JanusGraph图数据库引擎中,形成一张数据图,所述的数据图中的数据就是需要进行搜索的原始数据。
所述的构建元数据信息,包括:
元数据是对用户数据的描述,当前构建的元数据信息中应用于语义搜索的部分包括关系的描述、属性的描述;为了语义搜索灵活性、可扩展的特性,元数据信息支持动态更新,并支持对关系描述和属性描述的添加同义词的特性。
所述的构建语义搜索模型,包括:
简单对象、对象属性、对象的关联对象、对象的多重关联对象;所述的构建语义搜索模型能够适应当前场景下的多数语义搜索需求,也可以根据需求定制新的语义搜索模型而不会对现有的模型造成影响。
所述的查询语句到语义搜索模型的转换,包括:
查询语句在这里指用户的原始查询请求,常常表现为一句话或几个关键词;通过对查询语句的分析,依次经过实体识别、属性识别、关系识别,分别识别出实体三元组、属性三元组和关系三元组;在此基础上,结合实体、属性和关系的上下文信息,最终完成语义搜索模型的建立;其中,实体识别主要基于图数据库引擎对对象名称的遍历,属性识别与关系识别,主要基于对元数据信息的模式匹配。
所述的实体识别流程如下:
查询语句:即用户输入的查询内容;
分词:对查询语句的分词,即将查询内容分割为有意义的汉字词语;
停用词过滤:对分词后的结果进行过滤,去掉其中某些词语;
N-Gram扩展:N-Gram是大词汇连续语音识别中常用的一种语言模型;
图数据查询:将N-Gram扩展后的词组在图数据中进行查询;
所述的属性识别流程如下:
查询语句:即用户输入的查询内容;
模式匹配:是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的所有子串;
属性定义:组成形式为name,key的方式,name就是属性的中文描述,key是属性的唯一标识,也是图数据中实体属性的定义;
AC自动机:首先需要构建字典树,树上的每个节点就是我们的属性定义;其次需要输入需要匹配的字符串,最后完成匹配得到地址的属性定义,返回该属性三元组;
所述的关系识别流程如下:
查询语句:即用户输入的查询内容;
关系定义:识别实体之间的关系;
AC自动机:首先需要构建字典树,树上的每个节点就是我们的属性定义;其次需要输入需要匹配的字符串,最后完成匹配得到地址的属性定义,返回该属性三元组。
所述的实体三元组包括三个维度,即pos、name、id,分别代表实体名在查询语句中的位置、实体名、实体在图数据库中的标识;
所述的属性三元组包括三个维度,即pos、name与key,分别代表属性名在查询语句中的位置,属性名,属性key;
所述的关系三元组包括三个维度,即pos、name与key,分别代表关系名在查询语句中的位置,关系名,关系key。
所述的语义搜索模型到图查询语言的转换,包括:
将所述的步骤4)生成的语义搜索模型转换为具体的查询语言,所述的查询语句是Gremlin查询语言,也是JanusGraph所使用的图数据库查询语言。
所述的图查询语言的执行与结果处理,包括:
执行Gremlin查询语言,完成语义搜索具体执行操作,并对返回的数据进行处理,转换为语义搜索模型中对象或属性的表现形式。
所述的结果包括简单对象详情、分页的对象列表、不分页的对象列表,以及对象属性。
本发明的一种基于图数据库的语义搜索实现方法和现有技术相比,通过制定简单易用的模型,使其更具可维护性、可操作性和可扩展性,从而达到语义搜索易用性、准确性和灵活性的目的;即避免了维护繁杂的指令集,又借助于图数据库引擎强大的逻辑查询功能与元数据的支持,提高了查询的效率与准确性,最终使得用户获取信息的能力大大增强。
附图说明
图1为实体识别流程图;
图2为属性识别流程图;
图3为关系识别流程图;
图4为实体三元组架构图。
图5为属性三元组架构图。
图6为关系三元组架构图。
具体实施方式
实施例1:
一种基于图数据库的语义搜索实现方法,该方法步骤如下:
步骤1)进行数据抽象;对用户数据进行分析与抽象,分析数据之间的属性包含与关联关系,最终将用户数据抽象为对象与关系两种类型的数据,并将其持久化到JanusGraph图数据库引擎中,形成一张数据图,所述的数据图中的数据就是需要进行搜索的原始数据。
步骤2)构建元数据信息;元数据是对用户数据的描述,当前构建的元数据信息中应用于语义搜索的部分包括关系的描述、属性的描述;为了语义搜索灵活性、可扩展的特性,元数据信息支持动态更新,并支持对关系描述和属性描述的添加同义词的特性。
步骤3)构建语义搜索模型;简单对象、对象属性、对象的关联对象、对象的多重关联对象;所述的构建语义搜索模型能够适应当前场景下的多数语义搜索需求,也可以根据需求定制新的语义搜索模型而不会对现有的模型造成影响。
步骤4)查询语句到语义搜索模型的转换;查询语句在这里指用户的原始查询请求,常常表现为一句话或几个关键词;通过对查询语句的分析,依次经过实体识别、属性识别、关系识别,分别识别出实体三元组、属性三元组和关系三元组;在此基础上,结合实体、属性和关系的上下文信息,最终完成语义搜索模型的建立;其中,实体识别主要基于图数据库引擎对对象名称的遍历,属性识别与关系识别,主要基于对元数据信息的模式匹配。
步骤5)语义搜索模型到图查询语言的转换;将所述的步骤4)生成的语义搜索模型转换为具体的查询语言,所述的查询语句是Gremlin查询语言,也是JanusGraph所使用的图数据库查询语言。
步骤6)图查询语言的执行与结果处理。执行Gremlin查询语言,完成语义搜索具体执行操作,并对返回的数据进行处理,转换为语义搜索模型中对象或属性的表现形式;所述的结果包括简单对象详情、分页的对象列表、不分页的对象列表,以及对象属性。
实施例2:
一种基于图数据库的语义搜索实现方法,该方法步骤如下:
步骤1)进行数据抽象;对用户数据进行分析与抽象,分析数据之间的属性包含与关联关系,最终将用户数据抽象为对象与关系两种类型的数据,并将其持久化到JanusGraph图数据库引擎中,形成一张“数据图”,该“数据图”中的数据(包括对象、属性等)就是需要进行搜索的原始数据。本发明中的语义搜索充分利用既有的“数据图”所能提供的有用信息,使得语义搜索模型构建过程就做到准确、有针对性。
步骤2)构建元数据信息;元数据是对用户数据的描述,当前构建的元数据信息中应用于语义搜索的部分包括关系的描述、属性的描述。为了语义搜索灵活性、可扩展的特性,元数据信息支持动态更新,并支持对关系描述和属性描述的添加同义词的特性,极大程度上解决语言中多义性的问题。
步骤3)构建语义搜索模型;当前构建完成的模型包括简单对象(SO)、对象属性(O:P)、对象的关联对象(O:L)、对象的多重关联对象(O:(n)L)等。已构建完成的模型能够适应当前场景下的多数语义搜索需求,也可以根据需求定制新的语义搜索模型而不会对现有的模型造成影响。
步骤4)查询语句到语义搜索模型的转换;查询语句在这里指用户的原始查询请求,常常表现为一句话或几个关键词;通过对查询语句的分析,依次经过实体识别、属性识别、关系识别,分别识别出实体三元组、属性三元组和关系三元组;在此基础上,结合实体、属性和关系的上下文信息,最终完成语义搜索模型的建立;其中,实体识别主要基于图数据库引擎对对象名称的遍历,属性识别与关系识别,主要基于对元数据信息的模式匹配。
所述的实体识别流程如下:
查询语句:即用户输入的查询内容;
分词:对查询语句的分词,即将查询内容分割为有意义的汉字词语;
停用词过滤:对分词后的结果进行过滤,去掉其中某些词语;
N-Gram扩展:N-Gram是大词汇连续语音识别中常用的一种语言模型;
图数据查询:将N-Gram扩展后的词组在图数据中进行查询;
所述的属性识别流程如下:
查询语句:即用户输入的查询内容;
模式匹配:是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的所有子串;
属性定义:组成形式为name,key的方式,name就是属性的中文描述,key是属性的唯一标识,也是图数据中实体属性的定义;
AC自动机:首先需要构建字典树,树上的每个节点就是我们的属性定义;其次需要输入需要匹配的字符串,最后完成匹配得到地址的属性定义,返回该属性三元组;
所述的关系识别流程如下:
查询语句:即用户输入的查询内容;
关系定义:识别实体之间的关系;
AC自动机:首先需要构建字典树,树上的每个节点就是我们的属性定义;其次需要输入需要匹配的字符串,最后完成匹配得到地址的属性定义,返回该属性三元组。
所述的实体三元组包括三个维度,即pos、name、id,分别代表实体名在查询语句中的位置、实体名、实体在图数据库中的标识;
所述的属性三元组包括三个维度,即pos、name与key,分别代表属性名在查询语句中的位置,属性名,属性key;
所述的关系三元组包括三个维度,即pos、name与key,分别代表关系名在查询语句中的位置,关系名,关系key。
步骤5)语义搜索模型到图查询语言的转换;将所述的步骤4)生成的语义搜索模型转换为具体的查询语言,这里的查询语句就是Gremlin查询语言,也是JanusGraph所使用的图数据库查询语言。通过该步骤,将通用的语义搜索模型转换为特定查询语言,因此该步骤可以看作是模型层到实现层的中间层。
步骤6)图查询语言的执行与结果处理。执行Gremlin查询语言,完成语义搜索具体执行操作,并对返回的数据进行处理,转换为语义搜索模型中对象或属性的表现形式。当前包含的结果包括简单对象详情、分页的对象列表、不分页的对象列表,以及对象属性等。
该发明是对语义搜索的一次成功实践,它基于图数据库引擎,充分利用了图数据库中的节点与边的概念,以及自然语言处理(NLP)等技术手段,凭借模式匹配的优异性能,完成一个快速、高效、动态、可扩展的语义搜索模型构建与查询执行。主要的技术背景包括:JanusGraph图数据库引擎,它集中在图的序列化,图的数据模型和高效的查询;AC自动机,一种多模式串匹配算法,该算法在1975年产生于贝尔实验室,是著名的多模式匹配算法之一;NLP中文分词,主要使用“结巴”中文分词,它致力于做最好的 Python 中文分词组件。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。

Claims (10)

1.一种基于图数据库的语义搜索实现方法,其特征在于,该方法步骤如下:
步骤1)进行数据抽象;
步骤2)构建元数据信息;
步骤3)构建语义搜索模型;
步骤4)查询语句到语义搜索模型的转换;
步骤5)语义搜索模型到图查询语言的转换;
步骤6)图查询语言的执行与结果处理。
2.根据权利要求1所述的语义搜索实现方法,其特征在于,所述的进行数据抽象,包括:
对用户数据进行分析与抽象,分析数据之间的属性包含与关联关系,最终将用户数据抽象为对象与关系两种类型的数据,并将其持久化到JanusGraph图数据库引擎中,形成一张数据图,所述的数据图中的数据就是需要进行搜索的原始数据。
3.根据权利要求1所述的语义搜索实现方法,其特征在于,所述的构建元数据信息,包括:
元数据是对用户数据的描述,当前构建的元数据信息中应用于语义搜索的部分包括关系的描述、属性的描述;为了语义搜索灵活性、可扩展的特性,元数据信息支持动态更新,并支持对关系描述和属性描述的添加同义词的特性。
4.根据权利要求1所述的语义搜索实现方法,其特征在于,所述的构建语义搜索模型,包括:
简单对象、对象属性、对象的关联对象、对象的多重关联对象;所述的构建语义搜索模型能够适应当前场景下的多数语义搜索需求,也可以根据需求定制新的语义搜索模型而不会对现有的模型造成影响。
5.根据权利要求1所述的语义搜索实现方法,其特征在于,所述的查询语句到语义搜索模型的转换,包括:
查询语句在这里指用户的原始查询请求,常常表现为一句话或几个关键词;通过对查询语句的分析,依次经过实体识别、属性识别、关系识别,分别识别出实体三元组、属性三元组和关系三元组;在此基础上,结合实体、属性和关系的上下文信息,最终完成语义搜索模型的建立;其中,实体识别主要基于图数据库引擎对对象名称的遍历,属性识别与关系识别,主要基于对元数据信息的模式匹配。
6.根据权利要求5所述的语义搜索实现方法,其特征在于,所述的实体识别流程如下:
查询语句:即用户输入的查询内容;
分词:对查询语句的分词,即将查询内容分割为有意义的汉字词语;
停用词过滤:对分词后的结果进行过滤,去掉其中某些词语;
N-Gram扩展:N-Gram是大词汇连续语音识别中常用的一种语言模型;
图数据查询:将N-Gram扩展后的词组在图数据中进行查询;
所述的属性识别流程如下:
查询语句:即用户输入的查询内容;
模式匹配:是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的所有子串;
属性定义:组成形式为name,key的方式,name就是属性的中文描述,key是属性的唯一标识,也是图数据中实体属性的定义;
AC自动机:首先需要构建字典树,树上的每个节点就是我们的属性定义;其次需要输入需要匹配的字符串,最后完成匹配得到地址的属性定义,返回该属性三元组;
所述的关系识别流程如下:
查询语句:即用户输入的查询内容;
关系定义:识别实体之间的关系;
AC自动机:首先需要构建字典树,树上的每个节点就是我们的属性定义;其次需要输入需要匹配的字符串,最后完成匹配得到地址的属性定义,返回该属性三元组。
7.根据权利要求5所述的语义搜索实现方法,其特征在于,所述的实体三元组包括三个维度,即pos、name、id,分别代表实体名在查询语句中的位置、实体名、实体在图数据库中的标识;
所述的属性三元组包括三个维度,即pos、name与key,分别代表属性名在查询语句中的位置,属性名,属性key;
所述的关系三元组包括三个维度,即pos、name与key,分别代表关系名在查询语句中的位置,关系名,关系key。
8.根据权利要求1所述的语义搜索实现方法,其特征在于,所述的语义搜索模型到图查询语言的转换,包括:
将所述的步骤4)生成的语义搜索模型转换为具体的查询语言,所述的查询语句是Gremlin查询语言,也是JanusGraph所使用的图数据库查询语言。
9.根据权利要求1所述的语义搜索实现方法,其特征在于,所述的图查询语言的执行与结果处理,包括:
执行Gremlin查询语言,完成语义搜索具体执行操作,并对返回的数据进行处理,转换为语义搜索模型中对象或属性的表现形式。
10.根据权利要求1或9所述的语义搜索实现方法,其特征在于,所述的结果包括简单对象详情、分页的对象列表、不分页的对象列表,以及对象属性。
CN201810778497.8A 2018-07-16 2018-07-16 一种基于图数据库的语义搜索实现方法 Pending CN109101565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810778497.8A CN109101565A (zh) 2018-07-16 2018-07-16 一种基于图数据库的语义搜索实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810778497.8A CN109101565A (zh) 2018-07-16 2018-07-16 一种基于图数据库的语义搜索实现方法

Publications (1)

Publication Number Publication Date
CN109101565A true CN109101565A (zh) 2018-12-28

Family

ID=64846352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810778497.8A Pending CN109101565A (zh) 2018-07-16 2018-07-16 一种基于图数据库的语义搜索实现方法

Country Status (1)

Country Link
CN (1) CN109101565A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543517A (zh) * 2019-08-26 2019-12-06 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN110609904A (zh) * 2019-09-11 2019-12-24 深圳众赢维融科技有限公司 图数据库数据处理方法、装置、电子设备及存储介质
CN110704654A (zh) * 2019-09-27 2020-01-17 三星电子(中国)研发中心 一种图片搜索方法和装置
CN111177188A (zh) * 2019-12-30 2020-05-19 浙江邦盛科技有限公司 一种基于聚合边与时序聚合边的快速海量时序数据处理方法
CN111831787A (zh) * 2020-06-08 2020-10-27 中国科学院计算机网络信息中心 一种基于次级属性的非结构化数据信息查询方法及系统
CN112818181A (zh) * 2021-01-25 2021-05-18 杭州绿湾网络科技有限公司 图数据库检索方法、系统、计算机设备和存储介质
CN113051362A (zh) * 2021-03-18 2021-06-29 中国工商银行股份有限公司 数据的查询方法、装置和服务器
CN115203490A (zh) * 2022-09-16 2022-10-18 国网智能电网研究院有限公司 图数据库中List列表容器数据类型的查询方法及装置
CN117493641A (zh) * 2024-01-02 2024-02-02 中国电子科技集团公司第二十八研究所 一种基于语义元数据的二次模糊搜索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020065602A1 (en) * 2000-11-30 2002-05-30 Yuichiro Ohshima Navigation system for vehicles
CN102428469A (zh) * 2009-05-19 2012-04-25 皇家飞利浦电子股份有限公司 检索和查看医疗图像
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN107679484A (zh) * 2017-09-28 2018-02-09 辽宁工程技术大学 一种基于云计算存储的遥感图像目标自动检测与识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020065602A1 (en) * 2000-11-30 2002-05-30 Yuichiro Ohshima Navigation system for vehicles
CN102428469A (zh) * 2009-05-19 2012-04-25 皇家飞利浦电子股份有限公司 检索和查看医疗图像
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN107679484A (zh) * 2017-09-28 2018-02-09 辽宁工程技术大学 一种基于云计算存储的遥感图像目标自动检测与识别方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543517A (zh) * 2019-08-26 2019-12-06 汉纳森(厦门)数据股份有限公司 一种基于Elasticsearch实现海量数据复杂查询方法、装置及介质
CN110609904A (zh) * 2019-09-11 2019-12-24 深圳众赢维融科技有限公司 图数据库数据处理方法、装置、电子设备及存储介质
CN110704654A (zh) * 2019-09-27 2020-01-17 三星电子(中国)研发中心 一种图片搜索方法和装置
CN111177188A (zh) * 2019-12-30 2020-05-19 浙江邦盛科技有限公司 一种基于聚合边与时序聚合边的快速海量时序数据处理方法
CN111831787B (zh) * 2020-06-08 2021-09-28 中国科学院计算机网络信息中心 一种基于次级属性的非结构化数据信息查询方法及系统
CN111831787A (zh) * 2020-06-08 2020-10-27 中国科学院计算机网络信息中心 一种基于次级属性的非结构化数据信息查询方法及系统
CN112818181A (zh) * 2021-01-25 2021-05-18 杭州绿湾网络科技有限公司 图数据库检索方法、系统、计算机设备和存储介质
CN113051362A (zh) * 2021-03-18 2021-06-29 中国工商银行股份有限公司 数据的查询方法、装置和服务器
CN113051362B (zh) * 2021-03-18 2024-03-22 中国工商银行股份有限公司 数据的查询方法、装置和服务器
CN115203490A (zh) * 2022-09-16 2022-10-18 国网智能电网研究院有限公司 图数据库中List列表容器数据类型的查询方法及装置
CN115203490B (zh) * 2022-09-16 2022-12-06 国网智能电网研究院有限公司 图数据库中List列表容器数据类型的查询方法及装置
CN117493641A (zh) * 2024-01-02 2024-02-02 中国电子科技集团公司第二十八研究所 一种基于语义元数据的二次模糊搜索方法
CN117493641B (zh) * 2024-01-02 2024-03-22 中国电子科技集团公司第二十八研究所 一种基于语义元数据的二次模糊搜索方法

Similar Documents

Publication Publication Date Title
CN109101565A (zh) 一种基于图数据库的语义搜索实现方法
CN107609052B (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN104361127B (zh) 基于领域本体和模板逻辑的多语种问答接口快速构成方法
CN107766483A (zh) 一种基于知识图谱的交互式问答方法及系统
CN110990590A (zh) 一种基于强化学习和迁移学习的动态金融知识图谱构建方法
CN109308321A (zh) 一种知识问答方法、知识问答系统及计算机可读存储介质
WO2018153215A1 (zh) 一种自动生成语义相近句子样本的方法
Huang et al. Rethinking chinese word segmentation: tokenization, character classification, or wordbreak identification
JP6733809B2 (ja) 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム
CN105787134B (zh) 智能问答方法、装置及系统
JP2011524579A (ja) 機械言語翻訳のための汎用デジタルセマンティックデータベース
CN107992476B (zh) 面向句子级生物关系网络抽取的语料库生成方法及系统
CN108073576A (zh) 智能搜索方法、搜索装置以及搜索引擎系统
CN110245238A (zh) 基于规则推理和句法图式的图嵌入方法及系统
CN103678287B (zh) 一种关键词翻译统一的方法
CN113157860B (zh) 一种基于小规模数据的电力设备检修知识图谱构建方法
CN108304424A (zh) 文本关键词提取方法及文本关键词提取装置
CN115858758A (zh) 一种多非结构化数据识别的智慧客服知识图谱系统
JPH0816620A (ja) データ分類装置/方法、データ分類木生成装置/方法、派生語抽出装置/方法、シソーラス構築装置/方法、データ処理システム
CN115840812A (zh) 一种根据政策文本智能匹配企业的方法及系统
CN107679124B (zh) 一种基于动态规划算法的知识图谱中文问答检索方法
CN116166688A (zh) 基于自然语言交互的业务数据检索方法、系统及处理设备
CN111259106A (zh) 一种结合神经网络和特征演算的关系抽取方法
JP4103905B2 (ja) 統合化検索システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181228