CN117033527A - 一种知识图谱的构建方法、装置、存储介质及电子设备 - Google Patents
一种知识图谱的构建方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117033527A CN117033527A CN202311298547.XA CN202311298547A CN117033527A CN 117033527 A CN117033527 A CN 117033527A CN 202311298547 A CN202311298547 A CN 202311298547A CN 117033527 A CN117033527 A CN 117033527A
- Authority
- CN
- China
- Prior art keywords
- concept
- source data
- data table
- user
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 21
- 238000013507 mapping Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000000605 extraction Methods 0.000 claims abstract description 30
- 230000004044 response Effects 0.000 claims abstract description 9
- 238000004590 computer program Methods 0.000 claims description 16
- 230000008676 import Effects 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229910021532 Calcite Inorganic materials 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书公开了一种知识图谱的构建方法、装置、存储介质及电子设备。所述方法包括:获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与另一概念和另一概念的子概念之间也存在所述指定关系;导入各源数据表格,响应于用户的指定操作,确定各源数据表格所关联的概念以及目标关系;针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;确定用户选择的目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对各源数据表格之间的关系进行映射配置;基于映射配置进行知识抽取并根据知识抽取结果构建知识图谱。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种知识图谱的构建方法、装置、存储介质及电子设备。
背景技术
知识图谱是一种描述实体之间关系的结构化数据模型,可以帮助人们更好地组织和理解不同领域的知识和信息,提高信息的利用效率和准确性。知识图谱的应用前景非常广阔,在各种领域发挥重要作用。
然而,现有知识图谱的配置和构建过程较为复杂,在配置时需要用户手动添加和修改大量的属性和关系,浪费大量人力资源,并且对用户的专业知识以及编程技术要求较高,构建出的知识图谱的误差较大。
因此,如何在保证知识图谱精度的前提下,简化知识图谱构建过程,提高构建效率,减少构建成本,是一个亟待解决的问题。
发明内容
本说明书提供一种知识图谱的构建方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种知识图谱的构建方法,包括:
获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与所述另一概念和所述另一概念的子概念之间也存在所述指定关系;
导入各源数据表格,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系;
针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;
确定所述用户选择的所述目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置;
根据各属性的映射配置以及所述各源数据表格之间关系的映射配置,对所述各源数据表格进行知识抽取,以根据知识抽取结果构建知识图谱。
可选地,导入各源数据表格之前,所述方法还包括:
获取各候选源数据并展示数据加载页面;
响应于所述用户在所述数据加载页面中执行的选择操作,导入所述用户选择的各源数据表格。
可选地,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系,具体包括:
展示包含各概念与各概念之间的关系的配置页面;
响应于所述用户在所述配置页面中执行的连线交互操作,确定所述各源数据表格所关联的概念以及目标关系。
可选地,针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置,具体包括:
针对每个源数表格,配置该源数据表格中的各属性与该源数据表格所关联的概念中的各属性之间的映射关系。
可选地,针对每个源数表格,将该源数据表格中的各属性映射到该源数据表格所关联的概念下各实体的属性中,具体包括:
响应于所述用户对该源数据表格与该源数据表格所关联的概念表格之间的连接交互操作,配置该源数据表格中的各属性与该源数据表格所关联的概念中的各属性之间的映射关系。
可选地,确定所述用户选择的所述目标关系的前置概念和后置概念,具体包括:
展示所述目标关系的概念切换页面,确定所述用户在所述概念切换页面中选择的前置概念和后置概念,所述前置概念包括所述目标关系之前的概念或子概念,所述后置概念包括所述目标关系之后的概念或子概念。
可选地,根据所述前置概念和所述后置概念对所述各源数据表格进行映射,具体包括:
确定各源数据表格所对应的键值并保存;
根据所述键值对所述各源数据表格进行映射,其中,概念相同的各源数据表格所对应的键值也相同。
本说明书提供了一种知识图谱的构建装置,包括:
设置模块,获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与所述另一概念和所述另一概念的子概念之间也存在所述指定关系;
导入模块,导入各源数据表格,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系;
第一配置模块,针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;
第二配置模块,确定所述用户选择的所述目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置;
构建模块,根据各属性的映射配置以及所述各源数据表格之间关系的映射配置,对所述各源数据表格进行知识抽取,以根据知识抽取结果构建知识图谱。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述知识图谱的构建方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述知识图谱的构建方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的知识图谱的构建方法中,获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与另一概念和另一概念的子概念之间也存在所述指定关系;导入各源数据表格,响应于用户的指定操作,确定各源数据表格所关联的概念以及目标关系;针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;确定用户选择的目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对各源数据表格之间的关系进行映射配置;基于映射配置进行知识抽取并根据知识抽取结果构建知识图谱。
从上述方法可以看出,本方案在构建知识图谱的过程中,只需要对部分概念之间设置关系,子概念可以对该关系进行继承,并不需要用户额外进行设置,并且,在构建图谱的过程中可以基于已经设置好的概念和关系完成对源数据的属性和关系的映射配置,相比于目前通过用户手动编辑或添加属性以及关系的方式,本方案并不需要用户编写代码,并且只需要执行少量的操作即可完成对知识图谱的构建,极大提高了知识图谱的构建效率,保证了知识图谱的准确性。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种知识图谱的构建方法的流程示意图;
图2为本说明书中提供的一种概念以及关系模块的页面示意图;
图3为本说明书中提供的一种关系配置页面示意图;
图4为本说明书中提供的一种数据加载页面示意图;
图5为本说明书中提供的一种配置页面示意图;
图6为本说明书中提供的一种概念切换页面示意图;
图7为本说明书中提供的一种映射配置页面示意图;
图8为本说明书中提供的一种定义知识页面示意图;
图9为本说明书提供的一种知识图谱的构建装置的示意图;
图10为本说明书提供的一种对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种知识图谱的构建方法的流程示意图,包括以下步骤:
S101:获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与所述另一概念和所述另一概念的子概念之间也存在所述指定关系。
首先,用户可以先基于已有的概念,在客户端中新建关系,在新建关系的过程中,用户需要同时新建关系属性,配置前后置概念。新建关系完成之后,基于关系继承的设计,客户端会在该关系的前置概念及所有子概念与后置概念及所有子概念两两之间均建立该关系。
在本说明书中,上述概念可以为某一类事物的概括性描述,如建筑、企业、城市、车辆等,以城市的概念为例,该概念下有包含有多种子概念,如县、市、镇等,而每个概念或者子概念下存在多个实体,如子概念“镇”中可以包含有若干各自然村或者社区,每个具体的自然村或者社区均可以为一个实体。上述关系用于描述两个概念或概念下的实体之间的层次关系或者语意关联,如人和动物之间的层级关系、某个城市是某个国家的一部分等。
为了便于理解,本说明书提供了一种概念以及关系模块的页面示意图,如图2所示。
图2为本说明书中提供的一种概念以及关系模块的页面示意图。
其中,若用户为概念A与概念B创建了关系X,则概念A与概念B下层级的子概念b之间具有关系X,概念A下层级的子概念a与概念B及概念B下层级的子概念b之间也具有关系X,用户不需要再手动添加概念A及概念A下层级的子概念与概念B及概念B下层级的子概念下更多的X关系。
当用户选中概念配置模块时,客户端可以向用户展示已配置的概念层级;概念A和概念B为父层级,概念a和概念b为子层级。
当用户选中关系配置模块时,客户端在根节点上设置有相应控件,用户点击该控件后出现操作菜单,在用户点击“新增子关系”后客户端展示关系配置页面。为了便于理解,本说明书提供了一种关系配置页面示意图,如图3所示。
图3为本说明书中提供种一种关系配置页面示意图。
其中,图3中分别设置有配置关系前、后置概念的控件,用户可以点击该组件的下拉菜单分别对前、后置概念进行选择,另外,用户可以在该页面中填写关系名称,并点击确认按钮保存该条关系配置。
创建关系的步骤可以为:
{“knowledgeGraphId”(图谱id),“body”: {“id”(关系id),“name”(关系名称),“attributeList”(属性列表):
[{“id”:(属性id), “name”:(属性名称),“optional”:(是否必填), “type”:(值类型),“multiple”:(是否多值),“validation”:(值校验规则), “index”:(属性顺序),“inherit”:(是否可继承),“inheritFrom”:(继承来源),“inheritConcept”:(继承的概念)}],
“parentId”(父关系id),“transferable”(是否可继承),“symmetrical”(是否对称)“preConceptId”(前置概念名称), “postConceptId”(后置概念名称)}}。
S102:导入各源数据表格,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系。
S103:针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置。
关系配置完成之后,客户端可以进入知识抽取模块。客户端可以获取用户预先输入的各候选源数据表格并向用户展示数据加载页面,以使用户可以在数据加载页面中自主选择需要导入目标知识抽取的表格数据,所有导入成功的表格数据以列表的形式展示。为了便于理解,本说明书提供了一种数据加载页面示意图,如图4所示。
图4为本说明书中提供的一种数据加载页面示意图。
其中,用户可以在该页面中选择需要导入的数据,通过点击确认按钮载入选中的源数据表格。
在导入源数据表格时,需要先有一份处理好的数据存储,将数据存储在postgresql数据库中,新建一个表格对象。表格对象中需要有数据存储的名字,数据库名称,schema等信息,同时将表格对象存储在数据库中。开始知识抽取时,通过calcite调用存在数据库中的数据。
在导入目标知识抽取的表格中的导入步骤可以表示为:
{“id”:(表格id),“datasetBinding”:
{“id”:(数据id), “name”:(数据名称), “knowledgeGraphId”:(图谱id),“projectId”:(项目id), “taskId”:(任务id), “updateTime”:(数据更新时间)},
“tableName”:(表格名称),“databaseName”:(表格的数据库名称),“schemaName”:(表格的schema)}。
在导入源数据表格后,客户端可以展示包含各概念与各概念之间的关系的配置页面,而后响应于所述用户在配置页面中执行的连线交互操作,确定各源数据表格所关联的概念以及目标关系。
首先,用户可以从数据列表中选中一个源数据表格,将源数据表格拖动至配置页面中间的可视化图谱区域,在图谱中会渲染对应的概念节点,用户可以将该源数据表格连接到对应的概念节点上与其进行关联,同时将源数据表格连接至目标关系上与其进行关联,重复该操作,建立关系和一个或者多个源数据表格之间的关联,进而完成对源数据表格中各属性的映射配置。为了便于理解,本说明书提供了一种配置页面示意图,如图5所示。
图5为本说明书中提供的一种配置页面示意图。
其中,用户已创建的概念与关系在表格配置区自动展示;从抽取数据管理列表中,将表格拖入表格配置区,执行连接交互操作,将源数据表格连接到对应概念和目标关系,连接后右侧映射配置区出现配置表格,可将表格中的属性映射到概念中各实体对应的属性,从而完成实体属性的映射配置。
在最右侧映射区域,会以非传统Table的形式渲染出源数据表格和关联概念。默认渲染出第一个源数据表格和关联概念。在源数据表格Table上方,点击图标下拉出所有的源数据表格,用户可以通过勾选的方式,选择当前映射配置需要的源数据表格。
S104:确定所述用户选择的所述目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射。
S105:基于映射后的各概念下的每个实体的属性以及关系构建知识图谱。
对于用户选中的目标关系,客户端可以展示目标关系的概念切换页面,确定用户在概念切换页面中选择的前置概念和后置概念,前置概念包括所述目标关系之前的概念或子概念,后置概念包括所述目标关系之后的概念或子概念,而后根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置,为了便于理解,本说明书提供了一种概念切换页面示意图,如图6所示。
图6为本说明书中提供的一种概念切换页面示意图。
在目标关系展示Table中,用下拉框的形式展示前置概念列表和后置概念列表,下拉框默认选中父概念。用户可以下拉选择具体要配置的前后置概念。比如可以配置A和B之间的X关系,也可以切换配置A的某个子概念和B之间的X关系、A的某个子概念和B的某个子概念之间的X关系等等。
在目标关系展示Table上方,以下拉框的形式展示配置历史,即用户配置了哪些X关系,比如配置了A和B之间的X关系和A的某子概念和B之间的X关系、A的某个子概念和B的某个子概念之间的X关系,则该配置历史可以下拉选择这三者中的某一个配置规则,选中之后,右侧映射区域会同步渲染对应的配置规则,方便用户快速查看已配置的知识抽取映射规则。同时,配置历史数据联动目标关系展示Table的前后置概念。
在完成源数据表格和目标关系支持的前后置概念的选择之后,用户可以进行具体的映射配置,包括属性映射、前后置概念映射。在进行映射配置时,若有多个源数据表格,用户可以定义源数据表格的表格主键。在源数据表格Table上方,可以点击设置key值,选中源数据表格的一个字段作为key值。为了便于理解,本说明书提供了一种映射配置页面示意图,如图7所示。
图7为本说明书中提供的一种映射配置页面示意图。
用户可以通过连线的方式,分别将各源数据表格中对应字段映射到前置概念和后置概念中,点击后“设置key值”文案的位置被“完成”按钮替代,选择后点击保存key值设置,其中,概念相同的各源数据表格所对应的键值也相同,完成配置后点击知识抽取按钮进行知识抽取,得到包含有映射后完成后各概念下的实体、属性以及关系的知识抽取结果。
在实际应用中,知识抽取是指通过自然语言技术,从大量文本、图像、视频等非结构化或半结构化数据中,将有用的主体、联系、事件等关键信息提取出来,并映射到知识图谱中的实体、关系和属性上。
之后客户端可以基于知识抽取结果构建知识图谱。在关系与目标抽取表格关联和配置映射中,新建关联的步骤可以表示为:
{“id”:(抽取规则id),“knowledgeGraphId”:(图谱id),“preConceptId”:(关系的前置概念),“postConceptId”:(关系的后置概念),“conceptId”:(关系id),“nameExtractField”:(主键),
“attributeExtractorList”: [{“id”:(映射id),“fieldName”:(数据字段名),“attributeId”:(属性id)}],
“preIndividualNameExtractField”:(前置概念映射),
“postIndividualNameExtractField”:(后置概念映射),
“extractSource”(源数据表格):{“id”:(抽取源数据表格id), “joinRuleList(数据合并规则)”:
[{“id”:(合并规则id),“datasetConnectionId”:(源数据表格id),“keyField”:(主键),“datasetConnectionName”:(数据名称),“hidden”:(是否隐藏)}]}}。
抽取完成后客户端可以向用户展示定义知识页面,查看抽取出的实体与关系,为了便于理解,本说明书提供了一种定义知识页面示意图,如图8所示。
图8为本说明书中提供的一种定义知识页面示意图。
其中,用户选中一个概念,在实体列表中会显示概念下的所有实体,选择实体,在实体关系定义区域,显示该实体的关系以及继承关系。
需要说明的是,在实际应用中用户导入的源数据表格可以为不同业务场景下的结构化数据、包括金融、市政、交通、医疗等,相应的,构建出的知识图谱可以为包含有上述各业务场景知识的知识图谱。
从上述方法可以看出,本方案可以帮助用户简单、快速地完成实体、关系抽取的数据配置流程;目标抽取值与表格数据中的字段间,点到点连线的属性映射配置,无需代码编译即可完成实体名、关系名、属性值的抽取配置流程;将多张挂靠在同一关系上的数据表,通过前后置概念的筛选,与表格切换的操作,完成数据表与目标关系的抽取规则匹配,支持同名关系在一个页面中,一次性完成不同前后置概念的多个关系配置,减少数据匹配的重复操作及抽取页面的过多跳转。
以上为本说明书的一个或多个实施知识图谱的构建方法,基于同样的思路,本说明书还提供了相应的知识图谱的构建装置,如图9所示。
图9为本说明书提供的一种知识图谱的构建装置的示意图,包括:
设置模块901,用于获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与所述另一概念和所述另一概念的子概念之间也存在所述指定关系;
导入模块902,用于导入各源数据表格,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系;
第一配置模块903,用于针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;
第二配置模块904,用于确定所述用户选择的所述目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置;
构建模块905,用于根据各属性的映射配置以及所述各源数据表格之间关系的映射配置,对所述各源数据表格进行知识抽取,以根据知识抽取结果构建知识图谱。
可选地,导入各源数据表格之前,所述设置模块901还用于,获取各候选源数据并展示数据加载页面;响应于所述用户在所述数据加载页面中执行的选择操作,导入所述用户选择的各源数据表格。
可选地,所述导入模块902具体用于,展示包含各概念与各概念之间的关系的配置页面;响应于所述用户在所述配置页面中执行的连线交互操作,确定所述各源数据表格所关联的概念以及目标关系。
可选地,所述第一配置模块903具体用于,针对每个源数表格,配置该源数据表格中的各属性与该源数据表格所关联的概念中的各属性之间的映射关系。
可选地,所述第一配置模块903具体用于,响应于所述用户对该源数据表格与该源数据表格所关联的概念表格之间的连接交互操作,配置该源数据表格中的各属性与该源数据表格所关联的概念中的各属性之间的映射关系。
可选地,所述第二配置模块904具体用于,展示所述目标关系的概念切换页面,确定所述用户在所述概念切换页面中选择的前置概念和后置概念,所述前置概念包括所述目标关系之前的概念或子概念,所述后置概念包括所述目标关系之后的概念或子概念。
可选地,所述第二配置模块904具体用于,确定各源数据表格所对应的键值并保存;根据所述键值对所述各源数据表格进行映射,其中,概念相同的各源数据表格所对应的键值也相同。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种知识图谱的构建方法。
本说明书还提供了图10所示的一种对应于图1的电子设备的示意结构图。如图10所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的知识图谱的构建方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(ProgrammableLogic Device, PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(HardwareDescription Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(AdvancedBoolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(JavaHardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby HardwareDescription Language)等,目前最普遍使用的是VHDL(Very-High-Speed IntegratedCircuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种知识图谱的构建方法,其特征在于,包括:
获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与所述另一概念和所述另一概念的子概念之间也存在所述指定关系;
导入各源数据表格,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系;
针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;
确定所述用户选择的所述目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置;
根据各属性的映射配置以及所述各源数据表格之间关系的映射配置,对所述各源数据表格进行知识抽取,以根据知识抽取结果构建知识图谱。
2.如权利要求1所述的方法,其特征在于,导入各源数据表格之前,所述方法还包括:
获取各候选源数据并展示数据加载页面;
响应于所述用户在所述数据加载页面中执行的选择操作,导入所述用户选择的各源数据表格。
3.如权利要求1所述的方法,其特征在于,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系,具体包括:
展示包含各概念与各概念之间的关系的配置页面;
响应于所述用户在所述配置页面中执行的连线交互操作,确定所述各源数据表格所关联的概念以及目标关系。
4.如权利要求1所述的方法,其特征在于,针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置,具体包括:
针对每个源数表格,配置该源数据表格中的各属性与该源数据表格所关联的概念中的各属性之间的映射关系。
5.如权利要求4所述的方法,其特征在于,针对每个源数表格,将该源数据表格中的各属性映射到该源数据表格所关联的概念下各实体的属性中,具体包括:
响应于所述用户对该源数据表格与该源数据表格所关联的概念表格之间的连接交互操作,配置该源数据表格中的各属性与该源数据表格所关联的概念中的各属性之间的映射关系。
6.如权利要求1所述的方法,其特征在于,确定所述用户选择的所述目标关系的前置概念和后置概念,具体包括:
展示所述目标关系的概念切换页面,确定所述用户在所述概念切换页面中选择的前置概念和后置概念,所述前置概念包括所述目标关系之前的概念或子概念,所述后置概念包括所述目标关系之后的概念或子概念。
7.如权利要求1所述的方法,其特征在于,根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置,具体包括:
确定各源数据表格所对应的键值并保存;
根据所述键值对所述各源数据表格进行映射,其中,概念相同的各源数据表格所对应的键值也相同。
8.一种知识图谱的构建装置,其特征在于,包括:
设置模块,获取用户基于已有概念设置的关系,其中,针对每个概念,若该概念与另一概念之间存在指定关系,则该概念和该概念的子概念,与所述另一概念和所述另一概念的子概念之间也存在所述指定关系;
导入模块,导入各源数据表格,响应于所述用户的指定操作,确定所述各源数据表格所关联的概念以及目标关系;
第一配置模块,针对每个源数据表格,根据该源数据表格所关联的概念对该源数据表格中的各属性进行映射配置;
第二配置模块,确定所述用户选择的所述目标关系的前置概念和后置概念,并根据目标关系的前置概念和后置概念对所述各源数据表格之间的关系进行映射配置;
构建模块,根据各属性的映射配置以及所述各源数据表格之间关系的映射配置,对所述各源数据表格进行知识抽取,以根据知识抽取结果构建知识图谱。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311298547.XA CN117033527B (zh) | 2023-10-09 | 2023-10-09 | 一种知识图谱的构建方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311298547.XA CN117033527B (zh) | 2023-10-09 | 2023-10-09 | 一种知识图谱的构建方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117033527A true CN117033527A (zh) | 2023-11-10 |
CN117033527B CN117033527B (zh) | 2024-01-30 |
Family
ID=88641658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311298547.XA Active CN117033527B (zh) | 2023-10-09 | 2023-10-09 | 一种知识图谱的构建方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117033527B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117608545A (zh) * | 2024-01-17 | 2024-02-27 | 之江实验室 | 一种基于知识图谱的标准作业程序生成方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6560608B1 (en) * | 2000-06-09 | 2003-05-06 | Contivo, Inc. | Method and apparatus for automatically selecting a rule |
WO2018033286A1 (en) * | 2016-08-17 | 2018-02-22 | Luxembourg Institute Of Science And Technology (List) | Method for efficient mapping updates between dynamic knowledge organization systems |
CN108182245A (zh) * | 2017-12-28 | 2018-06-19 | 北京锐安科技有限公司 | 人对象属性分类知识图谱的构建方法及装置 |
CN111753100A (zh) * | 2020-06-30 | 2020-10-09 | 广州小鹏车联网科技有限公司 | 一种针对车载应用的知识图谱生成方法和服务器 |
CN112559772A (zh) * | 2020-12-29 | 2021-03-26 | 厦门市美亚柏科信息股份有限公司 | 一种知识图谱动态维护方法、终端设备及存储介质 |
CN112559704A (zh) * | 2020-12-08 | 2021-03-26 | 北京航天云路有限公司 | 一种用户自定义配置的知识图谱生成工具 |
CN112883192A (zh) * | 2021-02-09 | 2021-06-01 | 江苏名通信息科技有限公司 | 一种异构领域用户与资源关联挖掘方法及系统 |
CN113190694A (zh) * | 2021-06-03 | 2021-07-30 | 云知声智能科技股份有限公司 | 一种知识图谱的知识管理平台 |
CN114386415A (zh) * | 2021-12-22 | 2022-04-22 | 深圳市华尊科技股份有限公司 | 数图融合库构建方法及相关设备 |
CN115510245A (zh) * | 2022-10-14 | 2022-12-23 | 北京理工大学 | 一种面向非结构化数据的领域知识抽取方法 |
CN116187441A (zh) * | 2022-12-23 | 2023-05-30 | 西南交通大学 | 一种基于关系模型转换的复杂装备知识图谱冷启动方法 |
US20230186111A1 (en) * | 2021-12-10 | 2023-06-15 | Infosys Limited | Cognitive platform for knowledge extraction from heterogenous data sources and the method thereof |
-
2023
- 2023-10-09 CN CN202311298547.XA patent/CN117033527B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6560608B1 (en) * | 2000-06-09 | 2003-05-06 | Contivo, Inc. | Method and apparatus for automatically selecting a rule |
WO2018033286A1 (en) * | 2016-08-17 | 2018-02-22 | Luxembourg Institute Of Science And Technology (List) | Method for efficient mapping updates between dynamic knowledge organization systems |
CN108182245A (zh) * | 2017-12-28 | 2018-06-19 | 北京锐安科技有限公司 | 人对象属性分类知识图谱的构建方法及装置 |
CN111753100A (zh) * | 2020-06-30 | 2020-10-09 | 广州小鹏车联网科技有限公司 | 一种针对车载应用的知识图谱生成方法和服务器 |
CN112559704A (zh) * | 2020-12-08 | 2021-03-26 | 北京航天云路有限公司 | 一种用户自定义配置的知识图谱生成工具 |
CN112559772A (zh) * | 2020-12-29 | 2021-03-26 | 厦门市美亚柏科信息股份有限公司 | 一种知识图谱动态维护方法、终端设备及存储介质 |
CN112883192A (zh) * | 2021-02-09 | 2021-06-01 | 江苏名通信息科技有限公司 | 一种异构领域用户与资源关联挖掘方法及系统 |
CN113190694A (zh) * | 2021-06-03 | 2021-07-30 | 云知声智能科技股份有限公司 | 一种知识图谱的知识管理平台 |
US20230186111A1 (en) * | 2021-12-10 | 2023-06-15 | Infosys Limited | Cognitive platform for knowledge extraction from heterogenous data sources and the method thereof |
CN114386415A (zh) * | 2021-12-22 | 2022-04-22 | 深圳市华尊科技股份有限公司 | 数图融合库构建方法及相关设备 |
CN115510245A (zh) * | 2022-10-14 | 2022-12-23 | 北京理工大学 | 一种面向非结构化数据的领域知识抽取方法 |
CN116187441A (zh) * | 2022-12-23 | 2023-05-30 | 西南交通大学 | 一种基于关系模型转换的复杂装备知识图谱冷启动方法 |
Non-Patent Citations (4)
Title |
---|
凡天娣;景旭文;肖志建;李磊;徐建新;: "基于本体的船舶焊接工艺知识图谱构建", 电焊机, no. 12, pages 16 - 21 * |
汤华茂;郭钢;: "基于逆向工程和粗糙集的协同设计领域本体构建方法", 计算机集成制造系统, no. 07, pages 1465 - 1471 * |
潘有能;刘朝霞;: "基于WordNet的关联数据本体映射研究", 情报杂志, no. 02, pages 99 - 102 * |
马刚;李楠;郭叶鹏;: "基于企业质量问题知识图谱的构建及应用", 仪器仪表用户, no. 06, pages 96 - 98 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117608545A (zh) * | 2024-01-17 | 2024-02-27 | 之江实验室 | 一种基于知识图谱的标准作业程序生成方法 |
CN117608545B (zh) * | 2024-01-17 | 2024-05-10 | 之江实验室 | 一种基于知识图谱的标准作业程序生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117033527B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112036736B (zh) | 一种工作流创建方法及装置 | |
CN117033527B (zh) | 一种知识图谱的构建方法、装置、存储介质及电子设备 | |
CN107562777B (zh) | 数据处理方法及其设备 | |
CN110399359B (zh) | 一种数据回溯方法、装置及设备 | |
US20150363705A1 (en) | System and method for utilizing a logical graphical model for scenario analysis | |
CN115756449B (zh) | 一种页面复用方法、装置、存储介质及电子设备 | |
CN109241026A (zh) | 数据管理的方法、装置及系统 | |
CN111158650B (zh) | 报表模板、报表的生成方法、装置 | |
US9720689B2 (en) | Context-specific view of a hierarchical data structure | |
CN117035081B (zh) | 一种多元多模态知识图谱的构建方法及装置 | |
US9875288B2 (en) | Recursive filter algorithms on hierarchical data models described for the use by the attribute value derivation | |
CN116341642B (zh) | 一种数据处理的方法、装置、存储介质及电子设备 | |
CN116136952B (zh) | 一种针对元器件的仿真测试方法及装置 | |
CN108520448A (zh) | 事件管理方法及装置 | |
CN118171910A (zh) | 业务风险识别方法、装置及电子设备 | |
CN116719591A (zh) | 股权图谱的展示方法、装置、存储系统和电子设备 | |
CN113672660B (zh) | 一种数据查询方法、装置及设备 | |
CN109725818A (zh) | 一种信息展示方法、设备及计算机可读介质 | |
CN111124695B (zh) | 一种动效管理方法、系统及设备 | |
CN117033420B (zh) | 一种知识图谱同概念下实体数据可视化展示方法及装置 | |
CN112579690B (zh) | 一种数据展示方法、装置、设备及介质 | |
CN110262724A (zh) | 一种菜单显示方法、装置及设备 | |
CN117170669B (zh) | 一种基于前端高低代码融合的页面展示方法 | |
CN114520770B (zh) | 一种网络设备的拓扑图生成方法、装置、设备及介质 | |
CN103136374A (zh) | 一种对象代理数据库的模式规范化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |