CN117271801A - 知识图谱的构建方法、装置、电子设备和可读存储介质 - Google Patents
知识图谱的构建方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN117271801A CN117271801A CN202311289553.9A CN202311289553A CN117271801A CN 117271801 A CN117271801 A CN 117271801A CN 202311289553 A CN202311289553 A CN 202311289553A CN 117271801 A CN117271801 A CN 117271801A
- Authority
- CN
- China
- Prior art keywords
- target
- knowledge graph
- data
- graph
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims description 40
- 238000000034 method Methods 0.000 claims abstract description 54
- 239000000470 constituent Substances 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 26
- 238000013499 data model Methods 0.000 claims description 20
- 238000012216 screening Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 description 11
- 238000010219 correlation analysis Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000012098 association analyses Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供的一种知识图谱的构建方法、装置、电子设备和可读存储介质,包括:获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;基于所述目标图谱模板构建目标知识图谱;输出所述目标知识图谱。
Description
本申请要求于2023年06月12日提交中国专利局,申请号为202310693374.5,发明名称为“知识图谱的构建方法、装置、电子设备和可读存储介质”的国内申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及数据处理领域,更具体的说,是涉及一种知识图谱的构建方法、装置、电子设备和可读存储介质。
背景技术
传统自然资源数据模型,主要是基于GIS(Geographic Information System,地理信息系统)的建模理论,将数据按照不同类型分层存储在数据库中,并在应用系统中采用图层叠加的方式进行表达,这种数据建模方法忽略了数据中自然资源要素不同时期和业务阶段的关联关系,无法满足用户对于知识图谱中对于时间或者空间变化的管理要求。
发明内容
有鉴于此,本申请提供了一种知识图谱的构建方法、装置、电子设备和可读存储介质,如下:
一种知识图谱的构建方法,包括:
获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;
基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;
基于所述目标图谱模板构建目标知识图谱;
输出所述目标知识图谱。
可选的,上述的方法,所述基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,包括:
分析所述配置操作信息,得到在显示界面中对应的目标区域;
将所述目标区域中显示的组成元素确定为目标配置的目标元素;
基于所述目标元素,得到目标图谱模板。
可选的,上述的方法,所述输出所述目标知识图谱,包括:
接收显示配置信息;
基于所述显示配置信息处理所述目标知识图谱,得到满足预设显示条件的目标显示内容;
输出所述目标显示内容。
可选的,上述的方法,所述基于所述目标图谱模板构建目标知识图谱,包括:
基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;
基于所述三元组数据集合构建目标知识图谱。
可选的,上述的方法,还包括:
构建三元关系数据库,所述三元关系数据库中包含至少两条三元组数据。
可选的,上述的方法,所述构建三元关系数据库,包括:
获得领域数据;
基于所述领域数据构建数据模型;
根据所述数据模型对于目标领域的数据源数据处理得到至少两个三元组数据;
基于所述至少两个三元组数据组合得到三元关系数据库。
可选的,上述的方法,所述基于所述三元组数据集合构建目标知识图谱,包括:
基于预设的分析规则,对于所述三元组数据集合进行分析,得到实体、实体属性以及实体之间的关系;
基于所述三元组数据集合中包含的实体、属性以及关系,构建目标知识图谱。
一种知识图谱的构建装置,包括:
获得模块,用于获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;
配置模块,用于基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;
构建模块,用于基于所述目标图谱模板构建目标知识图谱;
输出模块,用于输出所述目标知识图谱。
一种电子设备,包括:存储器、处理器;
其中,存储器存储有处理程序;
所述处理器用于加载并执行所述存储器存储的所述处理程序,以实现如上述任一项所述的知识图谱的构建方法的各步骤。
一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器调用并执行,实现如上述任一项所述的知识图谱的构建方法的各步骤。
综上所述,本申请提供的一种知识图谱的构建方法,包括:获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;基于所述目标图谱模板构建目标知识图谱;输出所述目标知识图谱。本实施例中,基于操作者对于显示界面中显示的知识图谱的组成元素的操作,生成配置操作信息,基于该配置操作信息配置知识图谱中的目标元素得到目标图谱模板,基于该模板图谱模板构建目标知识图谱并输出,该配置过程是操作者进行的可视化操作,结合操作者的管理要求,对于知识图谱进行设置,贴合用户需求。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的一种知识图谱的构建方法实施例1的流程图;
图2是本申请提供的一种知识图谱的构建方法实施例2的流程图;
图3是本申请提供的一种知识图谱的构建方法实施例3的流程图;
图4是本申请提供的一种知识图谱的构建方法实施例4的流程图;
图5是本申请提供的一种知识图谱的构建方法实施例5的流程图;
图6是现有技术的知识图谱构建流程图;
图7是本申请提供的一种知识图谱的构建方法实施例5中知识图谱构建流程图;
图8是本申请提供的一种知识图谱的构建方法实施例6的流程图;
图9是本申请提供的一种知识图谱的构建装置实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示的,为本申请提供的一种知识图谱的构建方法实施例1的流程图,该方法应用于一电子设备,该方法包括以下步骤:
步骤S101:获得配置操作信息;
其中,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素。
其中,本方法应用于一电子设备,该电子设备为知识图谱的配置端设备,该电子设备具有一显示屏幕,该显示屏幕显示配置界面,该配置界面中由组成知识图谱的多种组成元素。
其中,该组成元素包括:概念、属性、关系等,本申请中不对于配置界面中的组成元素的具体内容做限制。
其中,概念是知识图谱中组成元素的定义,如实体的概念、关系的概念等。
其中,实体是表示数据的主体。
其中,属性是表示数据的属性值。
其中,关系是表示数据之间的关系,包括了时间关系、空间关系以及业务关系等,本实施例中是基于配置操作信息对于关系进行配置。
其中,操作者对于显示界面中显示的各个组成元素进行操作,如进行选择、拖拽、放置等操作。
其中,获得该配置操作信息后,对于该配置操作信息进行分析,得到其对于操作的目标元素。
步骤S102:基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板;
其中,所述目标元素包括概念、属性和/或关系。
其中,基于该配置操作信息确定操作者想要配置的目标元素。
相应,基于该配置操作信息将该目标元素配置到知识图谱中,得到目标图谱模板。
具体的,若该配置操作信息对于概念进行配置,则可以对于实体的概念进行配置,如配置的概念包括:个人、部门等。
其中,该目标图谱模板是基于操作者的配置操作得到,其表征操作者想要了解的领域知识。
步骤S103:基于所述目标图谱模板构建目标知识图谱;
其中,基于该操作者配置的目标图谱模板,构建目标知识图谱,该目标知识图谱中包含的元素是操作者想要了解的内容。
具体的,基于该目标图谱模板,对于操作者选择的领域知识进行处理,构建该领域的目标知识图谱。
后续实施例中会针对构建目标知识图谱的过程进行详细说明,本实施例中不做详述。
步骤S104:输出所述目标知识图谱。
其中,在电子设备的显示屏幕输出该目标知识图谱输出。
具体的,可以基于操作者的操作选择输出形式,后续实施例中会针对该过程进行详细说明,本实施例中不做详述。
综上,本实施例提供的一种知识图谱的构建方法,包括:获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;基于所述目标图谱模板构建目标知识图谱;输出所述目标知识图谱。本实施例中,基于操作者对于显示界面中显示的知识图谱的组成元素的操作,生成配置操作信息,基于该配置操作信息配置知识图谱中的目标元素得到目标图谱模板,基于该模板图谱模板构建目标知识图谱并输出,该配置过程是操作者进行的可视化操作,结合操作者的管理要求,对于知识图谱进行设置,贴合用户需求。
如图2所示的,为本申请提供的一种知识图谱的构建方法实施例2的流程图,该方法包括以下步骤:
步骤S201:获得配置操作信息;
其中,步骤S201与实施例1中的相应步骤一致,本实施例中不做赘述。
步骤S202:分析所述配置操作信息,得到在显示界面中对应的目标区域;
其中,分析该配置操作信息,确定其在显示界面中操作对应的目标区域。
其中,该配置操作信息可以是基于选择操作,如点选操作生成,相应的目标区域为较小的规则区域,如圆形区域;该配置操作信息还可以是基于拖拽操作生成,相应的,该目标区域为长条形的区域,如弧形区域、矩形区域等。
具体的,该配置操作信息还包括操作者通过输入装置输入的配置信息,如配置选择的概念元素分别为个人、部门和公司。
因此,基于该配置操作信息对应的目标区域可以是显示界面中的某一个区域或者多个区域,该多个区域之间可能有重合,也可能不重合,本申请不对于该目标区域的具体形状做限制。
本实施例中,显示界面中以图形方式呈现组成元素,方便操作者基于图形化方式进行配置图谱。
步骤S203:将所述目标区域中显示的组成元素确定为目标配置的目标元素;
其中,显示界面中显示能够形成知识图谱的多个组成元素。
其中,基于该目标区域包括显示的组成元素所在区域,则可以确定配置操作是对于目标区域中的元素进行配置。
其中,该目标区域可以包含多个子区域,每个子区域中显示一个或者多个组成元素。
其中,确定目标区域中显示的一个或者多个组成元素作为目标配置的目标元素。
步骤S204:基于所述目标元素,得到目标图谱模板;
其中,基于操作者选择的目标元素组成目标图谱模板。
其中,该目标元素包括概念时,根据操作者输入的概念相关信息对于目标元素的概念进行定义;该目标元素包括属性时,根据操作者输入的属性相关信息对于该目标元素的属性进行定义;该目标元素包括关系时,根据操作者输入的关系相关信息对于该目标元素的关系进行定义。
其中,基于操作者选择的目标元素以及输入定义信息,对于目标元素进行定义,得到目标图谱模板。
其中,该目标图谱模板是表征操作者需求的图谱,后续基于该目标图谱模板对于领域数据进行处理,得到该操作者所需内容/形式的图谱。
步骤S205:基于所述目标图谱模板构建目标知识图谱;
步骤S206:输出所述目标知识图谱。
其中,步骤S205-206与实施例1中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种知识图谱的构建方法,包括:分析所述配置操作信息,得到在显示界面中对应的目标区域;将所述目标区域中显示的组成元素确定为目标配置的目标元素;基于所述目标元素,得到目标图谱模板。本实施例中,操作者基于显示界面中显示的图形进行配置图谱,根据操作者的操作信息确定其在显示界面中目标选择的目标元素,基于该目标元素得到满足操作者需求的目标图谱模板,根据操作者需求配置目标图谱模板,实现知识图谱的个性化构建。
如图3所示的,为本申请提供的一种知识图谱的构建方法实施例3的流程图,该方法包括以下步骤:
步骤S301:获得配置操作信息;
步骤S302:基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板;
步骤S303:基于所述目标图谱模板构建目标知识图谱;
其中,步骤S301-303与实施例1中的相应步骤一致,本实施例中不做赘述。
步骤S304:接收显示配置信息;
其中,显示配置信息是操作者基于输入装置输入的与目标知识图谱显示相关的配置信息。
具体的,该显示配置信息是可视化展示该目标知识图谱时的显示相关的配置信息。
例如,该显示配置信息包括:调用地图、图表信息等。
需要说明的是,该步骤S304与前述步骤S301-303的执行顺序不限制于本实施例中的先后顺序,二者可以任意先后顺序执行。
步骤S305:基于所述显示配置信息处理所述目标知识图谱,得到满足预设显示条件的目标显示内容;
其中,基于该显示配置信息对于构建的目标知识图谱进行处理,得到与该显示配置信息对应的目标显示内容。
其中,该目标知识图谱中包括各个实体、属性以及实体之间的关系等。
其中,该关系可以包括时空关联关系、业务关联关系等。
例如,该目标知识图谱是森林资源,该显示配置信息包括调用地图,相应的,基于该地图对于目标知识图谱进行处理,将该目标知识图谱与地图结合,得到以地图形式显示的知识图谱,直观的呈现森林资源在不同时间和空间上的分布情况。
步骤S306:输出所述目标显示内容。
其中,在显示屏幕中输出该目标显示内容,以使得该知识图谱进行可视化的展示。
例如,在显示屏幕中输出地图形式的知识图谱,呈现森林资源在不同时间和空间上的分布情况,为后续的自然资源管理和保护提供科学依据。
综上,本实施例提供的一种知识图谱的构建方法,包括:接收显示配置信息;基于所述显示配置信息处理所述目标知识图谱,得到满足预设显示条件的目标显示内容;输出所述目标显示内容。本实施例中,还可以对于显示进行配置,基于显示配置信息对于目标知识图谱进行处理,得到满足预设显示条件的目标显示内容并输出,根据操作者的显示需求进行设置显示方式,实现知识图谱的个性化显示。
如图4所示的,为本申请提供的一种知识图谱的构建方法实施例4的流程图,该方法包括以下步骤:
步骤S401:获得配置操作信息;
步骤S402:基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板;
其中,步骤S401-402与实施例1中的相应步骤一致,本实施例中不做赘述。
步骤S403:基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;
其中,预先生成三元关系数据库,该三元关系数据库中包含有若干三元组数据。
其中,基于该三元组数据是指在数据模型中,每个实体都有一个对应的属性值,这些属性值形成一个三元组数据结构。
具体的,三元组数据中包含以下三个元素:实体标识符(Entity Identifier)、实体属性值(Entity Property Value)和属性标识符(Property Identifier)。
其中,实体标识符用于唯一标识一个实体,实体属性值用于表示实体的属性值,属性标识符用于唯一标识一个属性。
例如,在自然资源领域,三元组数据可以用于表示不同类型的自然资源,如土地、水、大气、生物等。每个自然资源实体都有一个对应的属性值,这些属性值形成一个三元组数据结构。例如,对于一个土地实体,它的属性值可以包括地理位置、面积、质量等。
其中,基于该目标图谱模板中包含的目标元素,在三元关系数据库中进行筛选,筛选与目标元素对应的三元组数据,该筛选得到的多个三元组数据,得到三元组数据集合。
步骤S404:基于所述三元组数据集合构建目标知识图谱;
其中,对于筛选得到的三元组数据集合中的各个三元组数据进行分析,得到实体之间的关系,以及属性值之间的关系等,基于各个实体、属性值以及实体关系、属性关系等,构建目标知识图谱。
其中,构建目标知识图谱的数据是基于目标图谱模板筛选三元关系数据中的三元组数据得到的三元组数据集合,而该目标图谱模板是基于操作者输入的配置操作信息生成,因此,该构建的目标知识图谱中包含的内容是基于操作者的配置要求构建得到,是体现操作者所需内容/形式的知识图谱。
步骤S405:输出所述目标知识图谱。
其中,步骤S405与实施例1中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种知识图谱的构建方法,包括:基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;基于所述三元组数据集合构建目标知识图谱。本实施例中,基于操作者输入的配置信息操作构建的目标图谱模板中目标元素对于三元关系数据库进行筛选,得到三元组数据集合,基于该三元组数据集合中的三元组数据构建目标知识图谱,构建得到的目标知识图谱中包含的内容是基于操作者的配置要求构建得到,是体现操作者所需内容/形式的知识图谱,实现了对于目标知识图谱的个性化配置。
如图5所示的,为本申请提供的一种知识图谱的构建方法实施例5的流程图,该方法包括以下步骤:
步骤S501:构建三元关系数据库;
其中,所述三元关系数据库中包含至少两条三元组数据。
其中,预先构建三元关系数据库,以为后续构建目标知识图谱提供三元组数据。
其中,本实施例中详细解释了构建三元关系数据库的过程,该步骤S501,包括:
步骤S5011:获得领域数据;
其中,该领域数据包含该三元关系数据库中各个实体所属的领域的数据。
例如,该领域数据可以是自然资源领域、汽车领域、自动控制领域等,本申请中不对于领域数据的具体领域做限制。
具体的,该领域数据根据数据源的类型不同分为结构化数据、半结构化数据和非结构化数据等。
其中,结构化数据包含有序的行和列,其中每行代表一个数据元素,每列代表一个属性;半结构化数据,它们通常包含文本或其他非结构化数据类型,例如图像、音频或视频;非结构化数据,它们通常包含大量的文本和其他类型的数据,例如网页、文档和社交媒体帖子。
步骤S5012:基于所述领域数据构建数据模型;
其中,对于领域数据进行信息抽取,再根据抽取的信息进行构建数据模型。
具体实施中,半结构化数据通常需要进行预处理,以提取其中的属性和关系。属性提取通常涉及从文本或其他数据类型中提取关键字、关键词和其他特征。关系提取通常涉及从文本或其他数据类型中提取实体之间的关系。在处理半结构化数据时,通常需要使用自然语言处理(natural language processing,NLP)和其他数据处理技术来处理和分析数据。
具体实施中,非结构化数据通常需要进行数据清洗、预处理和分词等操作,以提取其中的属性和关系。属性提取通常涉及从文本中提取关键字和其他特征。关系提取通常涉及从文本中提取实体之间的关系。在处理非结构化数据时,通常需要使用自然语言处理和其他数据处理技术来处理和分析数据。
其中,在构建数据模型的过程中,我们通常会从各种类型的数据源中抽取出与目标领域相关的信息,并将其转化为数据模型中的实体、属性、实体属性值、实体之间的关系等元素。
具体的,可以采用如下几种方式对于领域数据进行构建数据模型:基于自然语言处理技术:通过自然语言处理技术,从文本数据中提取出与目标领域相关的信息,并将其转化为数据模型中的实体、属性等元素;基于数据挖掘技术:通过数据挖掘技术,从大规模数据集中提取出与目标领域相关的信息,并将其转化为数据模型中的实体、属性、关系等元素;基于领域专家知识:通过领域专家知识,将领域专家的知识和经验转化为数据模型中的实体、属性、关系等元素。
需要说明的是,在构建数据模型的过程中,需要根据抽取到的信息和领域专家的知识,结合现有数据建模技术和知识图谱技术,来确定数据模型中的各个组成和组成间的关系。
其中,当存在多个数据源时,需要对于多个数据源中的数据进行整合。
其中,整合知识的方法包括以下几种:知识抽取、知识融合以及知识加工。
具体的,信息抽取是从各种类型的数据源中提取出实体(概念)﹑属性以及实体间的相互关系,在此基础上形成本体化的知识表达。。数据融合在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等。知识加工,对于经过融合的新知识,需要经过质量评估之后,才能将合格的部分加入到知识库中,以确保知识库的质量,新增数据之后,可以进行知识推理、拓展现有知识﹑得到新知识。
具体实施中,对于经过融合的新知识,需要经过质量评估之后,才能将合格的部分加入到知识库中,以确保知识库的质量,新增数据之后,可以进行知识推理、拓展现有知识,得到新知识。
步骤S5013:根据所述数据模型对于目标领域的数据源数据处理得到至少两个三元组数据;
其中,在构建得到数据模型后,该数据模型对于目标领域的数据源数据进行处理,得到多个三元组数据。
其中,该三元组数据是该目标领域中数据源提供数据的三元组形式。
步骤S5014:基于所述至少两个三元组数据组合得到三元关系数据库。
其中,将该得到的多个三元组数据集合在一起得到三元关系数据库。
后续步骤中,基于该三元关系数据库中的三元组数据进行构建目标知识图谱。
图6所示的是现有的知识图谱构建流程图,包括:数据源,该数据源包括结构化数据、半结构化数据和非结构化数据,半结构化数据和非结构化数据经过信息抽取处理步骤得到抽取后数据,结构化数据和抽取后数据经过知识融合步骤,得到的数据进入知识加工步骤,加工得到知识图谱。其中,该信息抽取包括:属性提取、关系提取、实体提取;该知识融合包括:结构化数据进行的知识融合,抽取后数据进与结构化数据进行共指消解和实体消解后;该知识加工包括对于共指消解和实体消解后的数进行本体抽取,进行知识推理、质量评估和本体抽取,得到知识图谱,而三元关系知识库中的数据与结构化数据进行知识融合。
图7所示的是本方案中的知识图谱构建流程图,包括数据源,该数据源包括结构化数据、半结构化数据和非结构化数据,半结构化数据和非结构化数据经过信息抽取处理步骤得到抽取后数据,结构化数据和抽取后数据经过知识融合步骤,得到的数据进入知识加工步骤,加工得到三元关系数据库,基于配置操作信息对于三元关系数据库进行筛选的结果构建目标知识图谱。
步骤S502:获得配置操作信息;
步骤S503:基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板;
步骤S504:基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;
步骤S505:基于所述三元组数据集合构建目标知识图谱;
步骤S506:输出所述目标知识图谱。
其中,步骤S502-506与实施例1中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种知识图谱的构建方法,还包括:构建三元关系数据库,所述三元关系数据库中包含至少两条三元组数据。本实施例中,预先构建三元关系数据库,为后续基于目标图谱模板中的目标元素筛选三元组数据提供基础。
如图8所示的,为本申请提供的一种知识图谱的构建方法实施例6的流程图,该方法包括以下步骤:
步骤S801:获得配置操作信息;
步骤S802:基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板;
步骤S803:基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;
其中,步骤S801-802与实施例4中的相应步骤一致,本实施例中不做赘述。
步骤S804:基于预设的分析规则,对于所述三元组数据集合进行分析,得到实体、属性以及关系;
其中,预设分析规则,该分析规则对于三元组数据进行分析,确定其包含的实体、实体的属性以及实体之间的关系等。
其中,该实体、实体属性以及实体之间的关系等信息是用于生成目标知识图谱相关的信息。
其中,对于自然资源领域的数据进行处理得到三元关系数据库中的三元组数据进行筛选得到的该三元组数据集合。
相应的,在构建自然资源时空知识图谱的过程中,该分析规则可以采用时空关联分析算法和业务关联分析算法,以获取自然资源的时空变化信息和业务应用关系。
其中,时空关联分析算法是指通过对自然资源领域的数据进行时空分析,获取自然资源在不同时间和空间上的分布情况,以及它们之间的相关性。常见的时空关联分析算法包括:时间序列分析算法、空间统计分析算法和时空相关性分析算法等。
具体的,时间序列分析算法通过对自然资源数据进行时间序列分析,获取它们的周期性、趋势性等信息,从而预测未来的趋势和变化;空间统计分析算法通过对自然资源数据进行空间统计分析,获取它们的分布特征、空间关系等信息,从而进行空间数据的可视化和分析;时空相关性分析算法,通过对自然资源数据进行时空相关性分析,获取它们之间的相关性、协同性等信息,从而进行自然资源的时空预测和分析。
其中,业务关联分析算法是指通过对自然资源领域数据的业务应用关系进行分析,获取它们之间的业务应用关系,以及它们对自然资源的影响。业务关联分析算法包括:关联规则挖掘算法、业务模型建模算法等。
具体的,关联规则挖掘算法通过对自然资源数据进行关联规则挖掘,获取它们之间的相关性、协同性等信息,从而进行自然资源的关联预测和分析;业务模型建模算法通过对自然资源数据的业务应用关系进行建模,获取它们之间的业务应用关系,从而进行自然资源的业务预测和分析。
需要说明的是,通过采用时空关联分析算法和业务关联分析算法,可以获取自然资源的时空变化信息和业务应用关系,并将这些信息整合到自然资源时空知识图谱中,以便于对自然资源的智能化管理和决策。
步骤S805:基于所述三元组数据集合中包含的实体、属性以及所述关系,构建目标知识图谱;
其中,该属性是实体的属性,该关系是实体之间的关系。
具体的,该实体之间的关系包括:时间关系、空间关系以及业务关系等。
其中,基于分析得到的三元组数据集合中包含的各个实体、实体属性以及实体之间的关系,构建目标知识图谱。
其中,该目标知识图谱中包含了该三元组数据集合中的数据知识,而该三元组数据集合是基于操作者配置的目标图谱模板筛选得到,因此,基于该三元组数据集合中包含的数据构建的目标知识图谱是与用户的需求适配。
步骤S806:输出所述目标知识图谱。
其中,步骤S806与实施例4中的相应步骤一致,本实施例中不做赘述。
综上,本实施例提供的一种知识图谱的构建方法,包括:基于预设的分析规则,对于所述三元组数据集合进行分析,得到实体、属性以及关系;基于所述三元组数据集合中包含的实体、属性以及关系,构建目标知识图谱。本实施例中,基于预设的分析规则对于筛选得到的三元组数据集合进行分析,得到的实体、属性以及关系构建目标知识图谱,该三元组数据集合是基于操作者配置的目标图谱模板筛选得到,所以,基于该三元组数据集合中包含的数据构建的目标知识图谱是与用户的需求适配,实现了对于知识图谱的个性化设置。
与上述本申请提供的一种知识图谱的构建方法实施例相对应的,本申请还提供了应用该知识图谱的构建方法的装置实施例。
如图9所示的为本申请提供的一种知识图谱的构建装置实施例的结构示意图,该电子设备包括以下结构:获得模块901、配置模块902、构建模块903和输出模块904;
其中,该获得模块901,用于获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;
其中,该配置模块902,用于基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;
其中,该构建模块903,用于基于所述目标图谱模板构建目标知识图谱;
其中,该输出模块904,用于输出所述目标知识图谱。
可选的,配置模块,包括:
分析单元,用于分析所述配置操作信息,得到在显示界面中对应的目标区域;
确定单元,用于将所述目标区域中显示的组成元素确定为目标配置的目标元素;
得到单元,用于基于所述目标元素,得到目标图谱模板。
可选的,输出模块,包括:
接收单元,用于接收显示配置信息;
处理单元,用于基于所述显示配置信息处理所述目标知识图谱,得到满足预设显示条件的目标显示内容;
输出单元,用于输出所述目标显示内容。
可选的,构建模块,包括:
筛选单元,用于基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;
第一构建单元,用于基于所述三元组数据集合构建目标知识图谱。
可选的,还包括:
第二构建单元,用于构建三元关系数据库,所述三元关系数据库中包含至少两条三元组数据。
可选的,第二构建单元,具体用于:
获得领域数据;
基于所述领域数据构建数据模型;
根据所述数据模型对于目标领域的数据源数据处理得到至少两个三元组数据;
基于所述至少两个三元组数据组合得到三元关系数据库。
可选的,第一构建单元,具体用于:
基于预设的分析规则,对于所述三元组数据集合进行分析,得到实体、实体属性以及实体之间的关系;
基于所述三元组数据集合中包含的实体、属性以及关系,构建目标知识图谱。
需要说明的是,本实施例中提供的一种知识图谱的构建装置中的各个结构功能解释,请参考前述方法实施例中的解释,本实施例中不做赘述。
综上,本实施例提供的一种知识图谱的构建装置,基于操作者对于显示界面中显示的知识图谱的组成元素的操作,生成配置操作信息,基于该配置操作信息配置知识图谱中的目标元素得到目标图谱模板,基于该模板图谱模板构建目标知识图谱并输出,该配置过程是操作者进行的可视化操作,结合操作者的管理要求,对于知识图谱进行设置,贴合用户需求。
与上述本申请提供的一种知识图谱的构建方法实施例相对应的,本申请还提供了与该知识图谱的构建方法相应的电子设备以及可读存储介质。
其中,该电子设备,包括:存储器、处理器;
其中,存储器存储有处理程序;
所述处理器用于加载并执行所述存储器存储的所述处理程序,以实现如上述任一项所述的知识图谱的构建方法的各步骤。
具体该电子设备的实现知识图谱的构建方法,参考前述知识图谱的构建方法实施例即可。
其中,该可读存储介质,其上存储有计算机程序,所述计算机程序被处理器调用并执行,实现如上述任一项所述的知识图谱的构建方法的各步骤。
具体该可读存储介质存储的计算机程序执行实现知识图谱的构建方法,参考前述知识图谱的构建方法实施例即可。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的装置而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所提供的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所提供的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种知识图谱的构建方法,其特征在于,包括:
获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;
基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;
基于所述目标图谱模板构建目标知识图谱;
输出所述目标知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,包括:
分析所述配置操作信息,得到在显示界面中对应的目标区域;
将所述目标区域中显示的组成元素确定为目标配置的目标元素;
基于所述目标元素,得到目标图谱模板。
3.根据权利要求1所述的方法,其特征在于,所述输出所述目标知识图谱,包括:
接收显示配置信息;
基于所述显示配置信息处理所述目标知识图谱,得到满足预设显示条件的目标显示内容;
输出所述目标显示内容。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标图谱模板构建目标知识图谱,包括:
基于所述目标图谱模板中的目标元素筛选三元关系数据库中的三元组数据,得到三元组数据集合;
基于所述三元组数据集合构建目标知识图谱。
5.根据权利要求4所述的方法,其特征在于,还包括:
构建三元关系数据库,所述三元关系数据库中包含至少两条三元组数据。
6.根据权利要求5所述的方法,其特征在于,所述构建三元关系数据库,包括:
获得领域数据;
基于所述领域数据构建数据模型;
根据所述数据模型对于目标领域的数据源数据处理得到至少两个三元组数据;
基于所述至少两个三元组数据组合得到三元关系数据库。
7.根据权利要求4所述的方法,其特征在于,所述基于所述三元组数据集合构建目标知识图谱,包括:
基于预设的分析规则,对于所述三元组数据集合进行分析,得到实体、实体属性以及实体之间的关系;
基于所述三元组数据集合中包含的实体、属性以及关系,构建目标知识图谱。
8.一种知识图谱的构建装置,其特征在于,包括:
获得模块,用于获得配置操作信息,所述配置操作信息是对于显示界面中显示内容进行的操作生成,所述显示内容包括知识图谱的至少两个组成元素;
配置模块,用于基于所述配置操作信息配置知识图谱中的目标元素,得到目标图谱模板,所述目标元素包括概念、属性和/或关系;
构建模块,用于基于所述目标图谱模板构建目标知识图谱;
输出模块,用于输出所述目标知识图谱。
9.一种电子设备,其特征在于,包括:存储器、处理器;
其中,存储器存储有处理程序;
所述处理器用于加载并执行所述存储器存储的所述处理程序,以实现如上述权利要求1-7任一项所述的知识图谱的构建方法的各步骤。
10.一种可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器调用并执行,实现如上述权利要求1-7任一项所述的知识图谱的构建方法的各步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2023106933745 | 2023-06-12 | ||
CN202310693374.5A CN116756336A (zh) | 2023-06-12 | 2023-06-12 | 知识图谱的构建方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117271801A true CN117271801A (zh) | 2023-12-22 |
Family
ID=87947152
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310693374.5A Withdrawn CN116756336A (zh) | 2023-06-12 | 2023-06-12 | 知识图谱的构建方法、装置、电子设备和可读存储介质 |
CN202311289553.9A Pending CN117271801A (zh) | 2023-06-12 | 2023-10-07 | 知识图谱的构建方法、装置、电子设备和可读存储介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310693374.5A Withdrawn CN116756336A (zh) | 2023-06-12 | 2023-06-12 | 知识图谱的构建方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN116756336A (zh) |
-
2023
- 2023-06-12 CN CN202310693374.5A patent/CN116756336A/zh not_active Withdrawn
- 2023-10-07 CN CN202311289553.9A patent/CN117271801A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116756336A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111061859B (zh) | 基于知识图谱的数据处理方法、装置和计算机设备 | |
US11645046B2 (en) | Systems and methods for development and deployment of software platforms having advanced workflow and event processing components | |
US10776569B2 (en) | Generation of annotated computerized visualizations with explanations for areas of interest | |
Mohammadi et al. | Knowledge discovery in smart city digital twins | |
TWI461938B (zh) | 用以識別用於一企業之相關資訊之系統及方法 | |
Bolt et al. | A visual approach to spot statistically-significant differences in event logs based on process metrics | |
KR101773574B1 (ko) | 데이터 테이블의 차트 시각화 방법 | |
Diehl et al. | Visual analysis of spatio‐temporal data: Applications in weather forecasting | |
CN114090838B (zh) | 大数据可视化展示的方法、系统、电子装置和存储介质 | |
CN114218309A (zh) | 数据处理方法、系统和计算机设备 | |
Korpi et al. | Clutter reduction methods for point symbols in map mashups | |
CN114511353A (zh) | 数据分析方法和装置 | |
Portenoy et al. | Leveraging citation networks to visualize scholarly influence over time | |
Chen et al. | RAMPVIS: Towards a new methodology for developing visualisation capabilities for large-scale emergency responses | |
Conrow et al. | A conceptual framework for developing dashboards for big mobility data | |
Bayer et al. | Design and development of a web-based EPANET model catalogue and execution environment | |
Ye et al. | SparseTrajAnalytics: An interactive visual analytics system for sparse trajectory data | |
US11775144B2 (en) | Place-based semantic similarity platform | |
JP7206632B2 (ja) | 2モードネットワークにおけるサブネットワークパターンの視覚的探索のためのシステム及び方法、プログラム | |
Kozlova et al. | Development of the toolkit to process the internet memes meant for the modeling, analysis, monitoring and management of social processes | |
CN113326345A (zh) | 基于动态本体的知识图谱分析、应用方法、平台及设备 | |
US10762116B2 (en) | System and method for analyzing and visualizing team conversational data | |
CN117271801A (zh) | 知识图谱的构建方法、装置、电子设备和可读存储介质 | |
Ghazali et al. | A preliminary review of interface design elements for mobile electronic government systems | |
KR102418853B1 (ko) | 이종 플랫폼 사이의 상호운용성을 증대하기 위한 빅데이터 통합처리 사용자 인터페이스 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |