CN103927360A - 基于图模型的软件项目语义信息表示及检索方法 - Google Patents
基于图模型的软件项目语义信息表示及检索方法 Download PDFInfo
- Publication number
- CN103927360A CN103927360A CN201410156422.8A CN201410156422A CN103927360A CN 103927360 A CN103927360 A CN 103927360A CN 201410156422 A CN201410156422 A CN 201410156422A CN 103927360 A CN103927360 A CN 103927360A
- Authority
- CN
- China
- Prior art keywords
- information
- graph model
- software project
- node
- chart database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种软件项目语义信息的表示及检索方法,尤其是涉及一种采用图模型表示和检索软件项目语义信息的方法。包括:抽取软件项目信息的步骤:从软件项目资源中抽取结构化信息本体和无结构信息本体;存储结构化信息本体的步骤:将结构化信息本体以图模型库形式进行表示和存储;存储无结构信息的步骤:以文件形式存储无结构信息本体,并建立结化信息本体和无结构信息本体之间的关联关系。因此,本发明具有如下优点:1.分别采用图模型和文本索引技术组织存储结构化信息和无结构信息,使数据间关联的表示更加灵活;2.基于图模型、文本索引、关联机制提供综合的问题查询方法,对问题的查询定位更加准确。
Description
技术领域
本发明涉及一种软件项目语义信息的表示及检索方法,尤其是涉及一种采用图模型表示和检索软件项目语义信息的方法。
背景技术
在软件开发中,软件代码、文档等的存储往往以传统的文件系统、关系型数据库等形式为主,对文档中蕴含的语义信息不进行处理和明确的表示。但是,软件代码和文档中提供了理解该软件的重要资源,其中包含了软件业务领域的需求分析、软件的系统架构、程序结构、软件功能的实现流程、软件使用方法等信息,这些包含了描述软件项目语义的信息,对于项目开发者理解软件业务需求、参与代码编写都有重要作用。
目前,关于表示软件项目资源中的语义信息的现有技术主要有基于NOSQL(Not Only SQL)数据库的表示方式和基于语义网表技术的表示方式,但是这些技术的局限之处在于语义网的描述框架的使用和构造存在一定难度,尚未有软件工程领域的应用技术。
因此,对软件构件、软件系统或项目的代码、文档等资源进行深入分析,对其中蕴含的软件项目语义信息进行清晰合理的展示,进而帮助软件复用者、开发者更容易地理解软件项目,是一项亟待解决的问题,对于软件开发效率的提高具有重要意义。。
发明内容
本发明主要是解决现有技术中所存在的缺乏有效表示软件项目文档中所蕴含的丰富语义信息的表示和处理方法等问题,提供了一种软件项目语义信息的表示方法,该方法可以对代码、文档等各类软件资源中蕴含的语义信息进行整合、关联、存储和查询,以帮助软件开发者、复用者对软件项目资源进行更深入的理解,并帮助解决实际开发中可能遇到的问题。
本发明还有一目的是解决现有技术中所存在的缺乏有效查找软件项目中与语义相关的文档代码等问题,提供了一种对基于图模型表示的软件项目语义信息进行检索的方法。该方法将图模型查询技术、文本索引检索技术、关联定位技术相结合,能基于软件项目语义信息快速进行检索。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种基于图模型的软件项目语义信息表示方法,包括:
抽取软件项目信息的步骤:从软件项目资源中抽取结构化信息本体和无结构信息本体;
存储结构化信息本体的步骤:将结构化信息本体以图数据库形式进行表示和存储;
存储无结构信息的步骤:以文件形式存储无结构信息本体,并建立结化信息本体和无结构信息本体之间的关联关系。
优化的,上述的一种基于图模型的软件项目语义信息表示方法,所述抽取软件项目信息的步骤进一步包括以下子步骤:
步骤2.1:将结构化信息本体构建成一个抽象语法树,结构化信息本体的每个元素都对应一个抽象语法树上的结点;
步骤2.2:根据步骤2.1中构建的语法树上的结点所包含的具体元素内容,构建抽象语法树各结点之间的关系;
步骤2.3:将步骤2.1中构建的语法树上的结点和步骤2.2中构建的各结点之间的关系储存在数据库中。
优化的,上述一种基于图模型的软件项目语义信息表示方法,所述结构化信息本体是项目代码,所述步骤2.2中构建的抽象语法树各结点之间的关系是项目代码中的继承、包含、依赖、调用、实现关系中的一种或多种。
优化的,上述一种基于图模型的软件项目语义信息表示方法,所述存储结构化信息本体的步骤进一步包括以下子步骤:
步骤4.1:为每一类结构化信息本体建立图数据库中的本体类型以及每一类本体包含的具体属性;
步骤4.2:对于每一个结构化信息本体,在图数据库中建立相应的实体,并存储其具体的属性值;
步骤4.3:为每一类结构化信息本体之间的关系建立图数据库中的关系类型以及每一类关系包含具体的属性;
步骤4.4:为每一个结构化信息本体之间的关系,在图数据库中建立相应的关系,并存储其具体的属性值,关系两端是步骤4.2中建立的实体。
优化的,上述一种基于图模型的软件项目语义信息表示方法,所述存储无结构信息的步骤进一步包括以下子步骤:
步骤5.1:在图数据库中建立用来表示无结构本体的文档类型以及用来表示结构化信息本体和无结构信息本体之间关联的关系类型;
步骤5.2:将无结构信息按照步骤5.1所建立的文档类型进行存储并建立表示无结构文本与该无结构文本在图模型库中存储的无结构信息本体之间对应关系的索引表;
步骤5.3:提取步骤5.2中存储的无结构信息本体中所包含的元素,若所述元素存在于存储结构化信息本体的步骤中所存储的结构化信息本体中,则在对应的无结构信息本体和结构化信息本体之间建立一个步骤5.1所述的关系类型的属性值。
一种对基于图模型表示的软件项目语义信息进行检索的方法,包括以下步骤:
构造查询请求的步骤:根据待检索问题构造图模型查询请求和无结构信息的查询请求;
无结构信息的查询步骤:在无结构信息中处理无结构信息的查询请求,获取查询结果;
关联结点的定位步骤:采用关联定位技术查询无结构信息与图模型的关联关系,并定位到关联节点;
图模型查询的步骤:在图数据库中根据图模型查询请求对所定位关联节点进行查询,返回数据模型的查询子图,并将关联结点的定位步骤中与结构化信息本体关联的无结构信息作为描述性补充信息。
优化的,上述的一种对基于图模型表示的软件项目语义信息进行检索的方法,所述关联结点的定位步骤进一步包括以下子步骤:
步骤7.1:通过无结构文本与该无结构文本在图数据库中存储的本体之间对应关系的索引表,在图数据库中找出无结构文本本体;
步骤7.2:对无结构文本进行词法分析和句法分析,识别其中的查询关键词或查询目标,并结合步骤7.1中找出的图数据库中的文本本体,构造相应的查询语句;
步骤7.3:根据步骤7.2中生成的查询语句,并按照指定的图查询参数,在图数据库中查询无结构文本相关联的关联结点。
优化的,上述的一种对基于图模型表示的软件项目语义信息进行检索的方法,在所述图模型查询的步骤中,首先解析受限的自然语言查询语句,若查询语句句法正确则继续执行以下子步骤:
步骤8.1:将解析结果规整为结构化的数据库查询指令;
步骤8.2:将数据库查询指令编译为图数据库的通用查询语句并执行该查询语句,返回由关联节点构成的连通子图;
步骤8.3:将步骤8.2得到的子图可视化;
步骤8.4:呈现子步骤8.3中的连通子图的各个节点所关联到的非结构化文本信息。
优化的,上述的一种对基于图模型表示的软件项目语义信息进行检索的方法,在所述图模型查询的步骤中,首先解析受限的自然语言查询语句,若查询语句句法错误则继续执行以下子步骤:
步骤9.1:根据自然语言文本之间的相似度算法,计算自然语言查询语句与图数据库中结构化信息本体之间的相似度,返回图数据库中与自然语言查询语句相似度最高的节点作为关联的节点;
步骤9.2:通过展开步骤9.1中返回的关联节点的邻接节点的方式或通过计算步骤9.1中返回的关联节点子图相似度的方式,在图数据库中找到关联节点的连通子图作为结果;
步骤9.3:将步骤9.2所得到的连通子图可视化;
步骤9.4:呈现子步骤9.3中的连通子图的各个节点所关联到的非结构化文本信息。
因此,本发明具有如下优点:1.分别采用图模型和文本索引技术组织存储结构化信息和无结构信息,使数据间关联的表示更加灵活;2.基于图模型、文本索引、关联机制提供综合的问题查询方法,对问题的查询定位更加准确。
附图说明
附图1是实施例1抽取软件项目信息步骤的流程图。
附图2是实施例1存储结构化信息本体步骤的流程图。
附图3是实施例1存储无结构信息步骤的流程图。
具体实施方式
实施例1:
参照图1,抽取软件项目信息:对项目代码进行静态分析,从软件项目的代码、文档资源中抽取结构化信息本体和无结构信息本体。
结构化信息是指根据预先定义的数据模型,或者客观存在的组织形式进行存储和表达的信息。例如,软件代码是按照程序语言语法表达的结构化信息,软件项目的开发者邮件包含收、发件人,邮件主题,发送时间等固定内容的结构化信息,软件用户文档的章节是符合文档撰写习惯的结构化信息。
无结构信息是指不具备结构化特征的信息,例如,无组织的纯自然语言文本段落。
在本实施例中,结构化信息本体是指项目代码。该抽取软件项目信息的步骤进一步包括以下子步骤:
步骤2.1:将结构化信息本体构建成一个DOM结构的抽象语法树,结构化信息本体的每个元素都对应一个抽象语法树上的结点;
步骤2.2:根据步骤2.1中构建的语法树上的结点所包含的具体元素内容,构建抽象语法树各结点之间的关系,如继承、包含、依赖、调用、实现等关系中的一种或多种。
步骤2.3:将步骤2.1中构建的语法树上的结点和步骤2中构建的各结点之间的关系储存在SQL数据库之中。
在完成抽取软件项目信息的步骤之后,进入如图2所示的存储结构化信息本体的步骤,将抽取软件项目信息步骤中提取出的代码元素以及它们之间的关系以图数据库的形式存储,该步骤进一步包括以下子步骤:
步骤4.1:为每一类代码元素建立图数据库中的本体类型,每一类本体包含具体的属性;
步骤4.2:对于提取出的每一个代码元素,在图数据库中建立相应的实体,并存储其具体的属性值;
步骤4.3:为每一类代码元素之间的关系建立图数据库中的关系类型,每一类关系包含具体的属性;
步骤4.4:为每一个代码元素之间的关系,在图数据库中建立相应的关系,并存储其具体的属性值,关系两端是4.2中建立的实体。
在完成存储无结构信息的步骤之后,进入如图3所示的存储无结构信息的步骤,将项目相关文档存储在图模型库中,并以代码元素为核心建立它们之间的关联。该步骤进一步包括以下子步骤:
步骤5.1:在图模型库中建立用来表示文档本体的文档类型以及用来表示代码元素本体和文档本体之间关联的关系类型;
步骤5.2:将每一个文档按照步骤5.1所建立的文档类型以倒排索引的方式进行组织和存储。
步骤5.3:提取步骤5.2中存储的文档本体中所包含的代码元素,若该代码元素存在于步骤5.2建立的实体中,则在对应的文档本体和5.2建立的实体之间建立一个“关联”关系,并存储其属性值。
本实施例还支持对所抽取并基于图模型表示的软件项目语义信息进行检索。提供将图模型查询技术、文本索引检索技术、关联定位技术相结合的软件项目语义信息检索方法。具体步骤包括:
构造查询请求的步骤、:根据待检索问题构造图模型查询请求和无结构信息的查询请求;
无结构信息的查询步骤:在无结构信息中处理无结构信息的索引查询请求,获取查询结果;其中无结构信息为文本时,无结构信息的查询步骤是在文本索引中处理无结构文本索引的查询请求;
关联结点的定位步骤:采用关联定位技术查询无结构文本与图模型的关联关系,并定位到关联节点;
图模型查询的步骤:在图模型中根据图模型查询请求对所定位关联节点进行查询,返回数据模型的查询子图,并将关联结点的定位步骤中与结构化信息本体关联的无结构信息作为描述性补充信息。
其中,关联结点的定位步骤主要有以下步骤:
步骤7.1:通过无结构文本与该无结构文本在图数据库中存储的本体之间对应关系的索引表,在图数据库中找出无结构文本本体;
步骤7.2:对无结构文本进行词法分析和句法分析,识别其中的查询关键词或查询目标,并结合步骤7.1中找出的图数据库中的文本本体,构造相应的查询语句;
步骤7.3:根据步骤7.2中生成的查询语句,并按照指定的图查询参数,在图数据库中查询无结构文本相关联的关联结点。其中,图查询参数为查询范围、节点类型、邻接节点扩展数量中的一种或多种。
本实施例的图模型查询的步骤中,首先解析受限的自然语言查询语句,若查询语句句法正确则继续执行以下子步骤:
步骤8.1:将解析结果规整为结构化的数据库查询指令;
步骤8.2:将数据库查询指令编译为图数据库的通用查询语句并执行该查询语句,返回由关联节点构成的连通子图;
步骤8.3:将步骤8.2得到的子图可视化;
步骤8.4:呈现子步骤8.3中的连通子图的各个节点所关联到的非结构化文本信息。
解析受限的自然语言查询语句时,若查询语句句法错误则继续执行以下子步骤:
步骤9.1:根据自然语言文本之间的相似度算法,计算自然语言查询语句与图数据库中结构化信息本体之间的相似度,返回图数据库中与自然语言查询语句相似度最高的节点作为关联的节点;
步骤9.2:通过展开步骤9.1中返回的关联节点的邻接节点的方式或通过计算步骤9.1中返回的关联节点子图相似度的方式,在图数据库中找到关联节点的连通子图作为结果;
步骤9.3:将步骤9.2所得到的连通子图可视化;
步骤9.4:呈现子步骤9.3中的连通子图的各个节点所关联到的非结构化文本信息。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (9)
1.一种基于图模型的软件项目语义信息表示方法,其特征在于,包括:
抽取软件项目信息的步骤:从软件项目资源中抽取结构化信息本体和无结构信息本体;
存储结构化信息本体的步骤:将结构化信息本体以图数据库形式进行表示和存储;
存储无结构信息的步骤:以文件形式存储无结构信息本体,并建立结化信息本体和无结构信息本体之间的关联关系。
2.根据权利要求1所述的一种基于图模型的软件项目语义信息表示方法,其特征在于,所述抽取软件项目信息的步骤进一步包括以下子步骤:
步骤2.1:将结构化信息本体构建成一个抽象语法树,结构化信息本体的每个元素都对应一个抽象语法树上的结点;
步骤2.2:根据步骤2.1中构建的语法树上的结点所包含的具体元素内容,构建抽象语法树各结点之间的关系;
步骤2.3:将步骤2.1中构建的语法树上的结点和步骤2.2中构建的各结点之间的关系储存在数据库中。
3.根据权利要求2所述一种基于图模型的软件项目语义信息表示方法,其特征在于,所述结构化信息本体是项目代码,所述步骤2.2中构建的抽象语法树各结点之间的关系是项目代码中的继承、包含、依赖、调用、实现关系中的一种或多种。
4.根据权利要求1所述一种基于图模型的软件项目语义信息表示方法,其特征在于,所述存储结构化信息本体的步骤进一步包括以下子步骤:
步骤4.1:为每一类结构化信息本体建立图数据库中的本体类型以及每一类本体包含的具体属性;
步骤4.2:对于每一个结构化信息本体,在图数据库中建立相应的实体,并存储其具体的属性值;
步骤4.3:为每一类结构化信息本体之间的关系建立图数据库中的关系类型以及每一类关系包含具体的属性;
步骤4.4:为每一个结构化信息本体之间的关系,在图数据库中建立相应的关系,并存储其具体的属性值,关系两端是步骤4.2中建立的实体。
5.根据权利要求1所述一种基于图模型的软件项目语义信息表示方法,其特征在于,所述存储无结构信息的步骤进一步包括以下子步骤:
步骤5.1:在图数据库中建立用来表示无结构本体的文档类型以及用来表示结构化信息本体和无结构信息本体之间关联的关系类型;
步骤5.2:将无结构信息按照步骤5.1所建立的文档类型进行存储并建立表示无结构文本与该无结构文本在图模型库中存储的无结构信息本体之间对应关系的索引表;
步骤5.3:提取步骤5.2中存储的无结构信息本体中所包含的元素,若所述元素存在于存储结构化信息本体的步骤中所存储的结构化信息本体中,则在对应的无结构信息本体和结构化信息本体之间建立一个步骤5.1所述的关系类型的属性值。
6.一种对基于图模型表示的软件项目语义信息进行检索的方法,其特征在于,包括以下步骤:
构造查询请求的步骤:根据待检索问题构造图模型查询请求和无结构信息的查询请求;
无结构信息的查询步骤:在无结构信息中处理无结构信息的查询请求,获取查询结果;
关联结点的定位步骤:采用关联定位技术查询无结构信息与图模型的关联关系,并定位到关联节点;
图模型查询的步骤:在图数据库中根据图模型查询请求对所定位关联节点进行查询,返回数据模型的查询子图,并将关联结点的定位步骤中与结构化信息本体关联的无结构信息作为描述性补充信息。
7.根据权利要求6所述的一种对基于图模型表示的软件项目语义信息进行检索的方法,其特征在于,所述关联结点的定位步骤进一步包括以下子步骤:
步骤7.1:通过无结构文本与该无结构文本在图数据库中存储的本体之间对应关系的索引表,在图数据库中找出无结构文本本体;
步骤7.2:对无结构文本进行词法分析和句法分析,识别其中的查询关键词或查询目标,并结合步骤7.1中找出的图数据库中的文本本体,构造相应的查询语句;
步骤7.3:根据步骤7.2中生成的查询语句,并按照指定的图查询参数,在图数据库中查询无结构文本相关联的关联结点。
8.根据权利要求6所述的一种对基于图模型表示的软件项目语义信息进行检索的方法,其特征在于,在所述图模型查询的步骤中,首先解析受限的自然语言查询语句,若查询语句句法正确则继续执行以下子步骤:
步骤8.1:将解析结果规整为结构化的数据库查询指令;
步骤8.2:将数据库查询指令编译为图数据库的通用查询语句并执行该查询语句,返回由关联节点构成的连通子图;
步骤8.3:将步骤8.2得到的子图可视化;
步骤8.4:呈现子步骤8.3中的连通子图的各个节点所关联到的非结构化文本信息。
9.根据权利要求6所述的一种对基于图模型表示的软件项目语义信息进行检索的方法,其特征在于,在所述图模型查询的步骤中,首先解析受限的自然语言查询语句,若查询语句句法错误则继续执行以下子步骤:
步骤9.1:根据自然语言文本之间的相似度算法,计算自然语言查询语句与图数据库中结构化信息本体之间的相似度,返回图数据库中与自然语言查询语句相似度最高的节点作为关联的节点;
步骤9.2:通过展开步骤9.1中返回的关联节点的邻接节点的方式或通过计算步骤9.1中返回的关联节点子图相似度的方式,在图数据库中找到关联节点的连通子图作为结果;
步骤9.3:将步骤9.2所得到的连通子图可视化;
步骤9.4:呈现子步骤9.3中的连通子图的各个节点所关联到的非结构化文本信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410156422.8A CN103927360A (zh) | 2014-04-18 | 2014-04-18 | 基于图模型的软件项目语义信息表示及检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410156422.8A CN103927360A (zh) | 2014-04-18 | 2014-04-18 | 基于图模型的软件项目语义信息表示及检索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103927360A true CN103927360A (zh) | 2014-07-16 |
Family
ID=51145581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410156422.8A Pending CN103927360A (zh) | 2014-04-18 | 2014-04-18 | 基于图模型的软件项目语义信息表示及检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103927360A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268179A (zh) * | 2014-09-17 | 2015-01-07 | 成都飞机工业(集团)有限责任公司 | 非结构化三维模型数据解析算法 |
CN104391964A (zh) * | 2014-12-01 | 2015-03-04 | 南京大学 | 一种将源代码存入图数据库的方法 |
CN104572970A (zh) * | 2014-12-31 | 2015-04-29 | 浙江大学 | 一种基于本体库内容的sparql查询语句生成系统 |
CN105740260A (zh) * | 2014-12-09 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 提取模板文件数据结构的方法和装置 |
CN106649557A (zh) * | 2016-11-09 | 2017-05-10 | 北京大学(天津滨海)新代信息技术研究院 | 一种缺陷报告与邮件列表语义关联挖掘方法 |
CN107545036A (zh) * | 2017-07-28 | 2018-01-05 | 深圳前海微众银行股份有限公司 | 客服机器人知识库建设方法、客服机器人及可读存储介质 |
CN107958074A (zh) * | 2017-12-11 | 2018-04-24 | 四川隧唐科技股份有限公司 | 工程信息展示方法及装置 |
CN107967290A (zh) * | 2017-10-09 | 2018-04-27 | 国家计算机网络与信息安全管理中心 | 一种基于海量科研资料的知识图谱网络构建方法及系统、介质 |
CN108665141A (zh) * | 2018-04-03 | 2018-10-16 | 山东科技大学 | 一种从突发事件预案中自动抽取应急响应流程模型的方法 |
CN108959433A (zh) * | 2018-06-11 | 2018-12-07 | 北京大学 | 一种从软件项目数据中提取知识图谱并问答的方法与系统 |
CN109033135A (zh) * | 2018-06-06 | 2018-12-18 | 北京大学 | 一种面向软件项目知识图谱的自然语言查询方法及系统 |
CN109271528A (zh) * | 2018-09-30 | 2019-01-25 | 税友软件集团股份有限公司 | 一种基于税务语义的结果查询方法、装置和存储介质 |
CN109582800A (zh) * | 2018-11-13 | 2019-04-05 | 北京合享智慧科技有限公司 | 一种训练结构化模型、文本结构化的方法及相关装置 |
CN110019565A (zh) * | 2018-09-12 | 2019-07-16 | 深圳市极限网络科技有限公司 | 基于图库的数据处理方法 |
CN110168533A (zh) * | 2016-12-15 | 2019-08-23 | 微软技术许可有限责任公司 | 对子图的缓存以及将缓存的子图集成到图查询结果中 |
CN111221785A (zh) * | 2018-11-27 | 2020-06-02 | 中云开源数据技术(上海)有限公司 | 一种多源异构数据的语义数据湖构建方法 |
CN111368090A (zh) * | 2019-06-27 | 2020-07-03 | 北京关键科技股份有限公司 | 项目知识树的构建和检索方法 |
CN111831787A (zh) * | 2020-06-08 | 2020-10-27 | 中国科学院计算机网络信息中心 | 一种基于次级属性的非结构化数据信息查询方法及系统 |
CN111858483A (zh) * | 2020-07-29 | 2020-10-30 | 湖南泛联新安信息科技有限公司 | 基于多种数据库与文件系统的软件样本混合存储系统 |
CN113127630A (zh) * | 2021-04-08 | 2021-07-16 | 国网福建省电力有限公司信息通信分公司 | 一种电力可视化数据资源管理平台系统 |
CN113139389A (zh) * | 2021-04-29 | 2021-07-20 | 南宁师范大学 | 基于动态优化的图模型语义查询扩展方法和装置 |
US11748506B2 (en) | 2017-02-27 | 2023-09-05 | Microsoft Technology Licensing, Llc | Access controlled graph query spanning |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090125872A1 (en) * | 2007-11-08 | 2009-05-14 | Kalapriya Kannan | Extracting Ontological Information from Software Design Data |
US20100122238A1 (en) * | 2008-11-11 | 2010-05-13 | International Business Machines Corporation | Generating functional artifacts from low level design diagrams |
CN102073708A (zh) * | 2010-12-30 | 2011-05-25 | 东北大学 | 面向大规模不确定图数据库的子图查询方法 |
CN102073692A (zh) * | 2010-12-16 | 2011-05-25 | 北京农业信息技术研究中心 | 基于农业领域本体库的语义检索系统和方法 |
US8065655B1 (en) * | 2006-06-20 | 2011-11-22 | International Business Machines Corporation | System and method for the autogeneration of ontologies |
CN102520959A (zh) * | 2011-12-16 | 2012-06-27 | 西安邮电学院 | 一种基于语义的重用代码匹配查询方法 |
CN102929898A (zh) * | 2011-08-12 | 2013-02-13 | 微软公司 | 结构化数据库的语义查询引擎 |
CN103593335A (zh) * | 2013-09-05 | 2014-02-19 | 姜赢 | 基于本体一致性验证推理的中文语义校对方法 |
CN103646079A (zh) * | 2013-12-13 | 2014-03-19 | 武汉大学 | 一种用于图数据库搜索的分布式索引及其并行生成方法 |
-
2014
- 2014-04-18 CN CN201410156422.8A patent/CN103927360A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8065655B1 (en) * | 2006-06-20 | 2011-11-22 | International Business Machines Corporation | System and method for the autogeneration of ontologies |
US20090125872A1 (en) * | 2007-11-08 | 2009-05-14 | Kalapriya Kannan | Extracting Ontological Information from Software Design Data |
US20100122238A1 (en) * | 2008-11-11 | 2010-05-13 | International Business Machines Corporation | Generating functional artifacts from low level design diagrams |
CN102073692A (zh) * | 2010-12-16 | 2011-05-25 | 北京农业信息技术研究中心 | 基于农业领域本体库的语义检索系统和方法 |
CN102073708A (zh) * | 2010-12-30 | 2011-05-25 | 东北大学 | 面向大规模不确定图数据库的子图查询方法 |
CN102929898A (zh) * | 2011-08-12 | 2013-02-13 | 微软公司 | 结构化数据库的语义查询引擎 |
CN102520959A (zh) * | 2011-12-16 | 2012-06-27 | 西安邮电学院 | 一种基于语义的重用代码匹配查询方法 |
CN103593335A (zh) * | 2013-09-05 | 2014-02-19 | 姜赢 | 基于本体一致性验证推理的中文语义校对方法 |
CN103646079A (zh) * | 2013-12-13 | 2014-03-19 | 武汉大学 | 一种用于图数据库搜索的分布式索引及其并行生成方法 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268179A (zh) * | 2014-09-17 | 2015-01-07 | 成都飞机工业(集团)有限责任公司 | 非结构化三维模型数据解析算法 |
CN104391964A (zh) * | 2014-12-01 | 2015-03-04 | 南京大学 | 一种将源代码存入图数据库的方法 |
CN105740260B (zh) * | 2014-12-09 | 2019-07-09 | 阿里巴巴集团控股有限公司 | 提取模板文件数据结构的方法和装置 |
CN105740260A (zh) * | 2014-12-09 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 提取模板文件数据结构的方法和装置 |
CN104572970A (zh) * | 2014-12-31 | 2015-04-29 | 浙江大学 | 一种基于本体库内容的sparql查询语句生成系统 |
CN104572970B (zh) * | 2014-12-31 | 2017-09-12 | 浙江大学 | 一种基于本体库内容的sparql查询语句生成系统 |
CN106649557A (zh) * | 2016-11-09 | 2017-05-10 | 北京大学(天津滨海)新代信息技术研究院 | 一种缺陷报告与邮件列表语义关联挖掘方法 |
CN110168533A (zh) * | 2016-12-15 | 2019-08-23 | 微软技术许可有限责任公司 | 对子图的缓存以及将缓存的子图集成到图查询结果中 |
CN110168533B (zh) * | 2016-12-15 | 2023-08-08 | 微软技术许可有限责任公司 | 对子图的缓存以及将缓存的子图集成到图查询结果中 |
US11748506B2 (en) | 2017-02-27 | 2023-09-05 | Microsoft Technology Licensing, Llc | Access controlled graph query spanning |
CN107545036B (zh) * | 2017-07-28 | 2021-01-19 | 深圳前海微众银行股份有限公司 | 客服机器人知识库建设方法、客服机器人及可读存储介质 |
CN107545036A (zh) * | 2017-07-28 | 2018-01-05 | 深圳前海微众银行股份有限公司 | 客服机器人知识库建设方法、客服机器人及可读存储介质 |
CN107967290A (zh) * | 2017-10-09 | 2018-04-27 | 国家计算机网络与信息安全管理中心 | 一种基于海量科研资料的知识图谱网络构建方法及系统、介质 |
CN107958074A (zh) * | 2017-12-11 | 2018-04-24 | 四川隧唐科技股份有限公司 | 工程信息展示方法及装置 |
CN107958074B (zh) * | 2017-12-11 | 2020-06-26 | 四川隧唐科技股份有限公司 | 工程信息展示方法及装置 |
CN108665141B (zh) * | 2018-04-03 | 2022-03-22 | 山东科技大学 | 一种从突发事件预案中自动抽取应急响应流程模型的方法 |
CN108665141A (zh) * | 2018-04-03 | 2018-10-16 | 山东科技大学 | 一种从突发事件预案中自动抽取应急响应流程模型的方法 |
CN109033135A (zh) * | 2018-06-06 | 2018-12-18 | 北京大学 | 一种面向软件项目知识图谱的自然语言查询方法及系统 |
CN108959433B (zh) * | 2018-06-11 | 2022-05-03 | 北京大学 | 一种从软件项目数据中提取知识图谱并问答的方法与系统 |
CN108959433A (zh) * | 2018-06-11 | 2018-12-07 | 北京大学 | 一种从软件项目数据中提取知识图谱并问答的方法与系统 |
CN110019565A (zh) * | 2018-09-12 | 2019-07-16 | 深圳市极限网络科技有限公司 | 基于图库的数据处理方法 |
CN109271528A (zh) * | 2018-09-30 | 2019-01-25 | 税友软件集团股份有限公司 | 一种基于税务语义的结果查询方法、装置和存储介质 |
CN109582800A (zh) * | 2018-11-13 | 2019-04-05 | 北京合享智慧科技有限公司 | 一种训练结构化模型、文本结构化的方法及相关装置 |
CN111221785A (zh) * | 2018-11-27 | 2020-06-02 | 中云开源数据技术(上海)有限公司 | 一种多源异构数据的语义数据湖构建方法 |
CN111368090A (zh) * | 2019-06-27 | 2020-07-03 | 北京关键科技股份有限公司 | 项目知识树的构建和检索方法 |
CN111831787A (zh) * | 2020-06-08 | 2020-10-27 | 中国科学院计算机网络信息中心 | 一种基于次级属性的非结构化数据信息查询方法及系统 |
CN111831787B (zh) * | 2020-06-08 | 2021-09-28 | 中国科学院计算机网络信息中心 | 一种基于次级属性的非结构化数据信息查询方法及系统 |
CN111858483A (zh) * | 2020-07-29 | 2020-10-30 | 湖南泛联新安信息科技有限公司 | 基于多种数据库与文件系统的软件样本混合存储系统 |
CN113127630A (zh) * | 2021-04-08 | 2021-07-16 | 国网福建省电力有限公司信息通信分公司 | 一种电力可视化数据资源管理平台系统 |
CN113139389B (zh) * | 2021-04-29 | 2023-01-13 | 南宁师范大学 | 基于动态优化的图模型语义查询扩展方法和装置 |
CN113139389A (zh) * | 2021-04-29 | 2021-07-20 | 南宁师范大学 | 基于动态优化的图模型语义查询扩展方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103927360A (zh) | 基于图模型的软件项目语义信息表示及检索方法 | |
CN108959433B (zh) | 一种从软件项目数据中提取知识图谱并问答的方法与系统 | |
CN110941612B (zh) | 基于关联数据的自治数据湖构建系统及方法 | |
US10997167B2 (en) | Disambiguating join paths for natural language queries | |
Shah et al. | Resolving ambiguities in natural language software requirements: a comprehensive survey | |
JP6736173B2 (ja) | データベースへの自然言語インタフェースのための方法、システム、記録媒体およびコンピュータ・プログラム | |
CN110555153A (zh) | 一种基于领域知识图谱的问答系统及其构建方法 | |
Ferrández et al. | The QALL-ME framework: A specifiable-domain multilingual question answering architecture | |
CN109657068B (zh) | 面向智慧博物馆的文物知识图谱生成与可视化方法 | |
Habernal et al. | SWSNL: semantic web search using natural language | |
KR101646754B1 (ko) | 모바일 시멘틱 검색 장치 및 그 방법 | |
Vellucci | Metadata and authority control | |
WO2014105867A4 (en) | Systems and methods for creating, editing, storing and retrieving knowledge contained in specification documents | |
CN105468605A (zh) | 一种实体信息图谱生成方法及装置 | |
WO2013071305A2 (en) | Systems and methods for manipulating data using natural language commands | |
CN112925995B (zh) | 获取poi状态信息的方法及装置 | |
CN102760165B (zh) | 一种使用位图索引的全文检索方法和装置 | |
CN102810114A (zh) | 基于本体的个人计算机资源管理系统 | |
US10642897B2 (en) | Distance in contextual network graph | |
TWI735380B (zh) | 自然語言處理方法與其計算裝置 | |
CN107480197B (zh) | 实体词识别方法及装置 | |
CN112507089A (zh) | 一种基于知识图谱的智能问答引擎及其实现方法 | |
Feng et al. | Geoqamap-geographic question answering with maps leveraging LLM and open knowledge base (short paper) | |
CN111475534B (zh) | 一种数据查询方法及相关设备 | |
Pan et al. | Natural language aided visual query building for complex data access |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20180105 |