CN112948547B - 测井知识图谱构建查询方法、装置、设备及存储介质 - Google Patents
测井知识图谱构建查询方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112948547B CN112948547B CN202110102187.6A CN202110102187A CN112948547B CN 112948547 B CN112948547 B CN 112948547B CN 202110102187 A CN202110102187 A CN 202110102187A CN 112948547 B CN112948547 B CN 112948547B
- Authority
- CN
- China
- Prior art keywords
- logging
- data
- query
- knowledge graph
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000010276 construction Methods 0.000 title claims abstract description 41
- 238000003058 natural language processing Methods 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013517 stratification Methods 0.000 claims description 6
- 239000008398 formation water Substances 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 3
- 239000003129 oil well Substances 0.000 abstract description 21
- 230000008569 process Effects 0.000 abstract description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000005553 drilling Methods 0.000 description 7
- 238000005520 cutting process Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000009960 carding Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种测井知识图谱构建查询方法、装置、设备及存储介质,该方法获取用户输入的查询信息;根据自然语言处理,提取查询信息的关键信息;根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据;其中,测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,关键信息包括查询信息中的实体、属性和关系中的至少一种;根据查询信息对应的三元组数据,返回查询信息对应的知识图谱中的相关测井数据;显示返回的知识图谱的相关测井数据,提高了测井人员数据查询的效率,便于测井人员高效地获取油井勘探过程中所需要的主要信息。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种测井知识图谱构建查询方法、装置、设备及存储介质。
背景技术
在油气勘探的开发阶段,对油井进行测井和数据解释处理后,会得到相关的大量数据,如测井曲线、解释成果、钻井取心、岩屑录井和试油等数据。测井相关人员需要根据得到的大量的相关数据对油井进行勘探。
相关技术中,经过测井和解释处理后的数据,测井曲线有特定的格式,而其它数据都是以信息表和表格为主的半结构化数据,这些数据以上述格式分散式地存储在数据库中,测井人员通过在数据库中的大量不同格式的数据进行检索得到需要的数据进行油井勘探。
然而,现有技术中,测井人员在数据查询时花费的时间长、效率低,难以直观、高效地获取油井勘探过程中所需要的主要信息。
发明内容
本申请提供一种测井知识图谱构建查询方法、装置、设备及存储介质,从而解决现有技术测井人员在数据查询时花费的时间长、效率低,难以直观、高效地获取油井勘探过程中所需要的主要信息的技术问题。
第一方面,本申请提供一种测井知识图谱构建查询方法,包括:
获取用户输入的查询信息;
根据自然语言处理,提取所述查询信息的关键信息;
根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据;其中,所述测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,所述关键信息包括所述查询信息中的实体、属性和关系中的至少一种;
根据所述查询信息对应的三元组数据,返回所述查询信息对应的知识图谱中的相关测井数据;
显示所述返回的知识图谱的相关测井数据。
这里,本申请实施例可以通过自然语言处理,提取用户输入的查询信息中的关键信息,根据查询信息中包含的实体、属性或者关系等关键信息,可以在测井知识图谱中确定查询信息对应的三元组数据,根据三元组数据返回查询信息对应的知识图谱中的相关测井数据,由于这里的测井知识图谱中的测井数据样本以实体、属性和关系的形式统一地集中地存储,因此无需在不同格式的分散的杂乱数据中进行检索,只需要在测井知识图谱中的测井数据样本的三元组数据内包含的信息中查询关键信息就可以得到需要查询的结果,从而返回查询信息对应的知识图谱中的相关测井数据,并显示出来,减少了测井人员在数据查询时花费的时间,提高了测井人员数据查询的效率,便于测井人员高效地获取油井勘探过程中所需要的主要信息。
可选的,在所述根据自然语言处理,提取所述查询信息的关键信息之前,还包括:
获取测井数据样本;
对所述测井数据样本通过自然语言处理进行语义分析,提取所述测井数据样本的实体、属性和关系;
根据所述测井数据样本的实体、属性和关系,建立所述测井知识图谱。
这里,本申请实施例提供了一种建立测井知识图谱的方法,首先获取测井数据样本,这里的测井数据样本为当前油井在测井过程中得到的大量测井相关数据,对测井数据样本通过自然语言处理进行语义分析,从而可以得到测井数据中的实体、属性和关系等数据,通过抽取测井数据样本中的实体、属性和关系等数据,将半结构化的测井曲线数据和非结构化的钻井取心、地质分层等表格数据进行统一的处理,可以对不同格式的数据进行统一的存储,从而便于将上述数据统一导入测井知识图谱,便于用户查询,进一步地提高了测井人员测井信息查询的效率。
可选的,在所述根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据之前,还包括:
将所述测井数据样本中提取的实体、属性和关系组合得到三元组数据;
根据所述三元组数据的数据类型和内容,确定所述三元组数据对应的数据导入方法;
根据所述三元组数据对应的数据导入方法,将所述三元组数据导入至测井知识图谱中。
这里,本申请实施例提供了一种建立测井知识图谱的方法,首先将测井数据样本中提取的实体、属性和关系进行组合,得到了多个三元组数据,将这种表示实体、属性和关系的知识图谱三元组数据,进行梳理,根据数据类型和内容,确定三元组数据对应的数据导入方法,将三元组数据导入到测井知识图谱中,得到了包含多个三元组数据的测井知识图谱,便于测井人员根据测井知识图谱得到查询信息的知识图谱,进一步地提高了测井人员测井信息查询的效率。
可选的,所述三元组数据的数据类型包括:测井曲线、岩心数据、试油、解释结论、地质分层、地层水电阻率和解释图版。
这里,本申请实施例中的数据类型包括测井曲线、岩心数据、试油、解释结论、地质分层、地层水电阻率和解释图版,或者更多的数据类型,丰富了查询内容,提高了查询的多样性,进一步提高了用户体验。
可选的,所述获取用户输入的查询信息,包括:
获取用户在预设搜索界面输入的查询信息。
这里,本申请实施例可以通过预设搜索界面,与用户建立通信,这里用户可以是测井人员,用户通过预设搜索界面,输入需要查询的信息,可根据用户输入的查询信息进行查询,无需用户多次输入多个信息,或者在数据库中分散存储的数据中进行多次的筛选,减少了测井人员在数据查询时花费的时间,提高了测井人员数据查询的效率,便于测井人员高效地获取油井勘探过程中所需要的主要信息。
可选的,在所述根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据之后,还包括:
将查询结果显示在预设搜索界面上。
这里,本申请实施例在确定查询信息对应的三元组数据之后,还可以将查询结果显示在预设搜索界面上,这里的查询结果可以是查询信息对应的所有三元组数据,也可以是查询信息对应的三元组数据中的部分信息,用户可以根据显示的信息确认查询结果是否为需要的信息,也可以根据现实结果更好地掌握油井的相关信息,提高了测井人员油井勘探的效率。
第二方面,本申请实施例提供一种测井知识图谱构建查询装置,包括:
第一获取模块,用于获取用户输入的查询信息;
第一提取模块,用于根据自然语言处理,提取所述查询信息的关键信息,;
查询模块,用于根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据,其中,所述测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,所述关键信息包括所述查询信息中的实体、属性和关系中的至少一种;
返回模块,用于根据所述查询信息对应的三元组数据,返回所述查询信息对应的知识图谱中的相关测井数据;
第一显示模块,用于显示所述返回的知识图谱的相关测井数据。
可选的,在所述第一提取模块根据自然语言处理,提取所述查询信息的关键信息之前,上述装置还包括:
第二获取模块,用于获取测井数据样本;
第二提取模块,用于对所述测井数据样本通过自然语言处理进行语义分析,提取所述测井数据样本的实体、属性和关系;
建立模块,用于根据所述测井数据样本的实体、属性和关系,建立所述测井知识图谱。
可选的,在所述查询模块根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据之前,上述装置还包括:
组合模块,用于将所述测井数据样本中提取的实体、属性和关系组合得到三元组数据;
确定模块,用于根据所述三元组数据的数据类型和内容,确定所述三元组数据对应的数据导入方法;
导入模块,用于根据所述三元组数据对应的数据导入方法,将所述三元组数据导入至测井知识图谱中。
可选的,所述三元组数据的数据类型包括:测井曲线、岩心数据、试油、解释结论、地质分层、地层水电阻率和解释图版。
可选的,所述第一获取模块具体用于:
获取用户在预设搜索界面输入的查询信息。
可选的,在所述查询模块在所述根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据之后,上述装置还包括:
第二显示模块,用于将查询结果显示在所述预设搜索界面上。
第三方面,本申请实施例提供一种测井知识图谱构建查询设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面或第一方面的可选方式所述的测井知识图谱构建查询方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当计算机执行指令被处理器执行时用于实现如第一方面或第一方面的可选方式所述的测井知识图谱构建查询方法。
第五方面,本发明实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的测井知识图谱构建查询方法。
本申请实施例提供的测井知识图谱构建查询方法、装置、设备及存储介质,该方法通过自然语言处理,提取用户输入的查询信息中的关键信息,根据查询信息中包含的实体、属性或者关系等关键信息,可以在测井知识图谱中确定查询信息对应的三元组数据,根据三元组数据返回查询信息对应的知识图谱中的相关测井数据,由于这里的测井知识图谱中的测井数据样本以实体、属性和关系的形式统一地集中地存储,因此无需在不同格式的分散的杂乱数据中进行检索,只需要在测井知识图谱中的测井数据样本的三元组数据内包含的信息中查询关键信息就可以得到需要查询的结果,从而返回查询信息对应的知识图谱中的相关测井数据,并显示出来,减少了测井人员在数据查询时花费的时间,提高了测井人员数据查询的效率,便于测井人员高效地获取油井勘探过程中所需要的主要信息。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种测井知识图谱构建查询系统架构示意图;
图2为本申请实施例提供的一种测井知识图谱构建查询方法的流程示意图;
图3为本申请实施例提供的一种搜索结果界面的示意图;
图4为本申请实施例提供的一种与测井人员交互界面的示意图;
图5为本申请实施例提供的一种知识图谱示意图;
图6为本申请实施例提供的另一种测井知识图谱构建查询方法的流程示意图;
图7为本申请实施例提供的一种测井知识图谱构建查询装置的结构示意图;
图8为本申请实施例提供的一种测井知识图谱构建查询设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”及“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在油气勘探的开发阶段,对油井进行测井和数据解释处理后,会得到相关的大量数据,如测井曲线、解释成果、钻井取心、岩屑录井和试油等数据,测井相关人员需要根据得到的大量的相关数据对油井进行勘探。开展智能测井知识图谱技术研究,形成数据提取、关系映射等预处理技术,构建智能测井知识图谱数据库,可以为不同场景下和岗位的测井相关人员提供知识推送、语义搜索、智能问答、业务决策辅助等方面的帮助,发挥重要的辅助作用。
关于油井的大量测井数据中,测井曲线有特定的格式,而其它数据都是以信息表和表格为主的半结构化数据。这些数据都有一定的关系,而且具有一些属性参数,例如工区和井之间有包含的关系,有坐标、井段等属性;测井数据和解释成果有包含、相邻、位于上侧等关系,有储层类型、岩性、物性等属性。这些数据一般都分散在测井数据解释处理软件或数据库中,想要根据关系或属性来查询相关数据,就需要花费较长的时间。所以需要一种将各种数据关联起来,并可以把数据的关系和属性直观、高效提取并显示出来的方法。相关技术中,经过测井和解释处理后的数据,测井曲线有特定的格式,而其它数据都是以信息表和表格为主的半结构化数据,这些数据以上述格式分散式地存储在数据库中,测井人员通过在数据库中的大量不同格式的数据进行检索得到需要的数据进行油井勘探。
然而,现有技术中,测井人员在数据查询时花费的时间长、效率低,难以直观、高效地获取油井勘探过程中所需要的主要信息。
为了解决上述问题,本申请实施例提供一种测井知识图谱构建查询方法、装置、设备及计算机可读存储介质,通过自然语言处理,提取用户输入的查询信息中的关键信息,根据查询信息中包含的实体、属性或者关系等关键信息,可以在测井知识图谱中确定查询信息对应的三元组数据,根据三元组数据返回查询信息对应的知识图谱中的相关测井数据,由于这里的测井知识图谱中的测井数据样本以实体、属性和关系的形式统一地集中地存储,因此无需在不同格式的分散的杂乱数据中进行检索,只需要在测井知识图谱中的测井数据样本的三元组数据内包含的信息中查询关键信息就可以得到需要查询的结果,从而返回查询信息对应的知识图谱中的相关测井数据,并显示出来。
可选的,图1为本申请实施例提供的一种测井知识图谱构建查询系统架构示意图。在图1中,上述架构包括接收装置101、处理器102和显示装置103中至少一种。
可以理解的是,本申请实施例示意的结构并不构成对测井知识图谱构建查询系统架构的具体限定。在本申请另一些可行的实施方式中,上述架构可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置,具体可根据实际应用场景确定,在此不做限制。图1所示的部件可以以硬件,软件,或软件与硬件的组合实现。
在具体实现过程中,接收装置101可以是输入/输出接口,也可以是通信接口。
处理器102可以提取用户输入的查询信息中的关键信息,根据查询信息中包含的实体、属性或者关系等关键信息,可以在测井知识图谱中确定查询信息对应的三元组数据,根据三元组数据建立知识图谱,将知识图谱显示给用户,通过将所有的数据都格式统一地集中存储在测井知识图谱中,减少了测井人员在数据查询时花费的时间,提高了测井人员数据查询的效率。
显示装置103可以用于对上述结果等进行显示。
显示装置还可以是触摸显示屏,用于在显示的上述内容的同时接收用户指令,以实现与用户的交互。
应理解,上述处理器可以通过处理器读取存储器中的指令并执行指令的方式实现,也可以通过芯片电路实现。
另外,本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
下面结合具体的实施例对本申请的技术方案进行详细的说明:
图2为本申请实施例提供的一种测井知识图谱构建查询方法的流程示意图。本申请实施例的执行主体可以为图1中的处理器102,具体执行主体可以根据实际应用场景确定。如图2所示,该方法包括如下步骤:
S201:获取用户输入的查询信息。
可选的,查询信息可以是语音信息,用户可以通过语音输入的方式输入语音,本申请实施例的方法可以接收语音信息,转化为文字信息进行操作,从而简化用户操作,提高查询效率。
可选的,获取用户在预设搜索界面输入的查询信息。
可选的,这里的查询信息可以是查询语句,也可以是查询关键词。
可选的,预设搜索界面可以为多种形式,本申请不作具体限制,这里的预设搜索界面可以安装在用户终端与测井知识图谱构建查询设备进行通信或者安装在测井知识图谱构建查询设备上,便于测井人员进行查询。
可选的,上述预设搜索界面还可以包含更多可选按钮,便于用户进行选择,提高用户体验,例如“查节点”、“查关系”、“一度关系”、“二度关系”和“连通路径”等,本申请对比不作具体限制。
这里,本申请实施例可以通过预设搜索界面,与用户建立通信,这里用户可以是测井人员,用户通过预设搜索界面,输入需要查询的信息,可根据用户输入的查询信息进行查询,无需用户多次输入多个信息,或者在数据库中分散存储的数据中进行多次的筛选,减少了测井人员在数据查询时花费的时间,提高了测井人员数据查询的效率,便于测井人员高效地获取油井勘探过程中所需要的主要信息。
S202:根据自然语言处理,提取查询信息的关键信息。
可选的,可以通过自然语言处理进行信息提取,获取关键信息。
可选的,可以通过对测井数据样本进行自然语言处理的提取和训练,从而建立预设语料库,通过查询信息与预设语料库的匹配来提取关键信息。其中,预设语料库通过测井数据样本训练得到,预设语料库由测井数据样本的实体、属性和关系组成,关键信息包括查询信息中的实体、属性和关系中的至少一种。
其中,实体是一种用户角度定义的数据对象,属性是数据对象的性质,关系是数据对象之间相互连接的方式。所以实体和关系需要站在用户的角度,从大量的数据中进行梳理提取。
可选的,根据自然语言处理,提取查询信息的关键信息包括:
若查询信息中包含有预设语料库中的任意实体、属性和关系,则提取查询信息中心包含的预设语料库的内容为查询信息的关键信息。
可选的,这里的测井数据样本为当前油井的历史测井数据,测井数据样本包括测得的当前油井的测井曲线、解释成果、钻井取心、岩屑录井和试油等数据。
S203:根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据。
其中,测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,关键信息包括查询信息中的实体、属性和关系中的至少一种。
可选的,可以将关键信息与测井知识图谱中的三元组数据进行匹配,确定包含关键信息的三元组数据为查询信息对应的三元组数据。
这里的测井知识图谱为图数据库,可以通过测井知识图谱的查询语法,来查询节点和关系,测井知识图谱中的节点为上述实体和属性,在一种可能的实现方式中,测井知识图谱为Neo4j图数据库,那么可以通过Neo4j图数据库的查询语法,来查询节点或关系。
可选的,调用测井知识图谱的接口确定查询信息对应的三元组数据,这里,关键信息可以是三元组的节点或关系,也可以是节点和关系组成的语句,这里的节点是指三元组的实体和属性。
其中,如果某个三元组中包含有查询信息的关键信息,那么可以将该三元组确定为查询信息对应的三元组数据,该三元组数据中包含的实体、属性和关系等信息可以确定为待查询的信息。
这里,本申请实施例通过将查询信息得到的关键信息与测井知识图谱中的三元组数据进行匹配,可以确定查询信息对应的三元组数据,从而根据查询信息对应的三元组数据生成用户查询的知识图谱。
可选的,可以将关键信息与测井知识图谱中的三元组数据进行匹配,确定包含关键信息的三元组数据,根据包含关键信息的三元组数据,智能推荐三元组数据,将包含关键信息的三元组数据和智能推荐的三元组数据确定为查询信息对应的三元组数据。
可选的,可以通过基于内容的推荐算法-最近邻算法(K-NearestNeighbor,KNN),选出与地质特征最匹配的模型以及模型中的参数,例如推送的解释模型是阿尔齐公式,同时也会推送阿尔齐公式中的a、b、m、n。
这里,智能推荐是通过规则引擎,针对实体、属性或关系进行挖掘,用于发现未知的隐含关系。可应用图计算方法,包括遍历算法、关系发现和源头搜索等,以及解决结构中距离问题的最短路径算法。在知识图谱中主要要应用遍历算法进行知识推理,以发现实体间隐藏的关系。为了更高效地进行图计算,在应用中会使用图计算系统和计算模型,图计算系统分为单机系统和分布式多机系统,对于大规模图结构存储的计算后者更具有优势。而图计算模型被用于解决图计算因频繁迭代带来的数据读取等待和成本高的问题、对相邻节点和边的计算依赖问题,以及难以在分布不均的区块上并行计算的问题。还可以应用图神经网络方法,图谱可看作为邻接矩阵、关系矩阵,将其展开到图神经网络中计算,可得到知识推理的结果。
其中,智能推荐三元组数据的一种可选方式为:根据基于图的推荐算法PersonalRank推荐算法,推荐出距离与包含关键信息的三元组数据所处节点关联度高的节点,根据图神经网络,来进行知识推理,推理出新的节点间的关系,其中,节点包含实体和属性,距离包含关系。
其中,PersonalRank推荐算法是基于PageRank算法进行了一些变化的算法,PageRank算法,是用来衡量搜索引擎中特定网页相对于其他网页重要性的算法,使用这个算法作为搜索结果网页排名相当重要的一部分。在PageRank算法中计算出的每一个节点对于其它节点的相关性,代入到图中,这需要改变为所有节点对于某个特定搜索内容的相关性,其公式如下:
其中,对于不同点r的值不同,u代表根节点,即搜索问题的节点,也就是每次都从根节点出发,进行随机游走,随机从所有节点中进行算法,PersonalRank算法得出的结果便是所有节点对于根节点的相关性。
这里,可以通过图神经网络来实现智能推荐,将测井、地质、岩石物理等成果都可以抽象成节点、边和属性的关系,这样组成的知识图谱突破了传统只能采用对齐数据才能进行公式计算或深度学习的局限,更有利于处理多源数据之间的尺度、维度差异和融合,真正将全量数据应用到业务中去,智能图谱形成的邻接矩阵、关系矩阵展开图神经网络计算,可以得到知识推理的结果。
其中,图神经网络可以高效的进行知识推理,其核心在于实现图数据库类似于传统深度学习的操作,例如卷积、池化等,从而实现网络结构的学习。可以实现图上的节点分类、链接预测、节点聚类和排序等任务。图卷积神经网络主要的半监督图卷积算子,定义如下式:
其中,Hl指l层的隐层表示,当l=0时,为初始输入的属性信息;表示加入了自环的图邻接矩阵;W表示可学习的权重矩阵。
基于图神经网络的知识图谱推理模型均基于自编码结构,即分为解码器和编码器。卷积如神经网络的解码器基于DistMult,定义如下式:
f(s,r,o)=sTRro
示范性的,若关键信息为“冯24、冯55、冯52、黄158、冯59、冯84、查找、解释结论”,根据知识推理,可能要查询的信息是“查找与层位y1、y2、y3相关的井”、“查找层位y1、y2、y3”或“查找名称为y1、y2、y3的井”,因为层位也是解释结论的一部分,且关联度很高。该推荐功能主要使用了图推荐算法,在图数据库中,所有的数据都转化为了三元组的表示方式。推荐问题时可以转化为度量节点与没有边直接相连的节点在图上的相关性,即在两个节点之间没有直接关系时,可以通过计算相关性来推荐其它节点。相关性越高的节点在推荐列表中权重越高。节点的相关性主要体现在如下方面:两个节点之间的路径数、两个节点之间路径的长度和两个节点之间路径经过的长度。如果相关性高的一对节点,会有如下特征:两个顶点之间有很多路径相连、连接两个顶点之间的路径长度都比较短、连接两个顶点之间的路径不会经过度较大的顶点。
可选的,在根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据之后,还包括:将查询结果显示在预设搜索界面上。
这里,本申请实施例在确定查询信息对应的三元组数据之后,还可以将查询结果显示在预设搜索界面上,这里的查询结果可以是查询信息对应的所有三元组数据,也可以是查询信息对应的三元组数据中的部分信息,用户可以根据显示的信息确认查询结果是否为需要的信息,也可以根据现实结果更好地掌握油井的相关信息,提高了测井人员油井勘探的效率。
在一种可能的实现方式中,本申请实施例可以将智能推荐结果显示在预设搜索界面上,或者是预设反馈界面上,示范性的,图3为本申请实施例提供的一种搜索结果界面的示意图,如图3所示,本申请实施例可以通过输入窗口输入查询信息,例如查询信息为:查询条件-层位:y1,y2,y3,查询目标-井,这里,本申请实施例的预设搜索界面可以给出查询结果,如图3下方显示框中内容。其查询过程如下:
主要通过调用数据库接口来实现,其中查节点可以查询给出的关键信息对应的实体,例如查找井34,井是这个节点的输入控件定义文本标签label,接着从数据库中label为井的节点中检索,直到检索到井34,并返回相关信息。查关系是根据给出的关键字返回对应的相关信息,例如找到井34后,想要查看和井34相关的信息,就会在数据库中查找与节点井34相关的节点和对应的关系,和label为井有直接关系的label有区块、曲线、解释结论、岩屑录井等,在从这些对应label的节点中检索和井34相关的信息,并返回相关信息。一度相关和二度相关指的是节点之间连通路径的距离,例如井和区块、曲线文件之间都是一度关系,即节点之间的距离为一,而区块和曲线文件之间就是二度关系,即节点之间的距离为二。所以查询一度关系和二度关系,同样是调用数据库的接口,查询一度关系时,就以初始查询节点为中心来查找节点距离为一的节点,查询二度关系时,以查询到的一度关系节点为中心来查找距离对于初始节点为二的节点。这些调用方法和结果为智能信息推荐提供了基础。其中查询条件中有层位、y1、y2、y3,层位是y1、y2、y3的label,可通过在数据库中直接查找label为层位的节点,查询目标中有井,井也是一个label,所以该查询语句的目标就是查询哪些井中包含y1、y2、y3层位。具体的实现步骤是:输入搜索关键字:类型:“层位”,名称:[“y1”,”y2”,”y3”];输入兴趣关键字:类型:“井”;根据搜索关键字进行知识搜索,搜索到3个层位实体;进行N=1度相关搜索,搜索到13个地质分层实体(“地质分层”“层位”);“地质分层”中没有井,则进行N=2度搜索,从“解释结果”外扩1度,搜到13个相关的井实体;根据搜索结果井和输入层位的相关性进行排序,得到推荐结果。
在一种可能的实现方式中,本申请实施例还可以在查询过程中向测井人员反馈信息、接收测井人员的选择或者确认信息,以便提高查询效率及准确性,此过程可以在预设搜索界面上,或者是预设反馈界面上实现,示范性的,图4为本申请实施例提供的一种与测井人员交互界面的示意图,如图4所示,本申请实施例查找包含对应层位的井时,会按照关联度推荐相应的井,且会返回井对应的解释结论的相关属性,包括结论、储层厚度、顶底深度、岩性等。该功能可以智能推荐用户进一步想要查找的问题,因为层位和解释结论的关联较高,所以当用户搜索层位对应的井时,可能的问题还有该层位对应井的解释结论。搜索结果最开始展示出的只有井,当用户点击下三角符号时,对应的内容会展开,即用户想要查询更多内容时,可以通过点击下三角符号,来智能推荐相关度最高的节点和属性。例如,用户可以通过点击的方式,可以从“油田”->“区块”->“井”->“曲线/解释结论/岩屑录井/钻井取心等”->对应的属性。此过程主要使用数据库的查询接口,可以选择查询实体及其对应的属性,其中一个实体可以对应多个属性,用户一开始搜索时,并不会返回所有的包括推荐的信息,只返回相应的搜索内容对应的,但是当点击下三角符号时,查询语句会响应用户的点击操作,进而智能推荐出更多的内容,所以查询的速度不会因为需要返回的信息过多而变慢。
S204:根据查询信息对应的三元组数据,返回查询信息对应的知识图谱中的相关测井数据。
知识图谱本质上是一种大的语义网络,它旨在描述客观存在的实体及其之间的关系,可以用图的方式来表示半结构化和非结构化数据,能够更简易、高效的将数据中的信息展示给用户。
可选的,可以通过知识图谱的可视化确定查询信息对应的知识图谱中的相关测井数据,知识图谱的可视化是将大量的数据、信息和知识等,转化为图形、符号和颜色等组成来表示,可提高使用者对数据的高效分析和理解。具体的,可以通过应用程序开发框架Qt集成开源的浏览器引擎WebKit来实现知识图谱可视化的功能。
可选的,测井知识图谱可以是图数据库Neo4j,图数据库Neo4j支持创建节点、创建关系、查询两点之间全部路径、查询两点之间最短路径等功能。其中创建节点是生成一个带有标签和属性的节点。创建关系是创建一条关系连接两个节点。查询两点之间的全部路径是根据输入的两个节点来查找两点间的全部连通路径。查询两点间的最短路径是根据输入的两个节点来查找两点间全部连通路径中的最短路径。对于节点和关系组成的子图,还可以通过关系运算符求交集、并集和差集,该功能可以避免多次写入单个节点,从而高效的将多个子图写入图数据库。
可选的,图5为本申请实施例提供的一种知识图谱示意图,如图5所示,该知识图谱由多个三元组数据结合而成,能够使测井人员清晰地了解要查询的油井数据。
可选的,这里的知识图谱可以显示在测井知识图谱构建查询设备的显示界面上,例如图1中的显示装置103,或者是通过通信显示在用户、测井人员的终端设备界面上,本申请对比不作具体限制。
S205:显示返回的知识图谱的相关测井数据。
可选的,在显示返回的知识图谱的相关测井数据之后,还包括:
形成基于测井数据的知识精准搜索、知识推送和辅助储层评价的智能查询助手,并挂接到测井数据处理解释软件上。
形成的插件是基于Python的py2neo库来操作图数据库Neo4j,具有查询、推荐功能,可通过界面展示出来的窗口程序。可将该程序集成到Qt上,进而便于对测井数据处理解释软件进行二次开发,从而形成基于测井数据的知识精准搜索、知识推送和辅助储层评价的智能查询助手,便于测井人员进行查询。
本申请实施例通过自然语言处理,提取用户输入的查询信息中的关键信息,根据查询信息中包含的实体、属性或者关系等关键信息,可以在测井知识图谱中确定查询信息对应的三元组数据,根据三元组数据返回查询信息对应的知识图谱中的相关测井数据,由于这里的测井知识图谱中的测井数据样本以实体、属性和关系的形式统一地集中地存储,因此无需在不同格式的分散的杂乱数据中进行检索,只需要在测井知识图谱中的测井数据样本的三元组数据内包含的信息中查询关键信息就可以得到需要查询的结果,从而返回查询信息对应的知识图谱中的相关测井数据,并显示出来,减少了测井人员在数据查询时花费的时间,提高了测井人员数据查询的效率,便于测井人员高效地获取油井勘探过程中所需要的主要信息。
可选的,本申请实施例可以通过测井数据样本建立测井知识图谱,相应的,图6为本申请实施例提供的另一种测井知识图谱构建查询方法的流程示意图,如图6所示,该方法包括:
S601:获取用户输入的查询信息。
S602:获取测井数据样本。
S603:对测井数据样本通过自然语言处理进行语义分析,提取测井数据样本的实体、属性和关系。
可选的,自然语言处理包括智能分词、语义分析、关键词发现和测井词向量训练;对于自然语言中信息的抽取,基本能力包括分词、词性标注和句法分析,通过加入测井专业词典,对文本内容使用统计法将文章中的词语进行分割,使用CRF或LSTM算法训练模型,对名词、动词、形容词、标点符号等词性类别进行识别和标注,再根据规则法或统计法对语句的主谓宾等句法结构进行分析,得到完整句式,最终产出一个计算机可识别的语料库,供后续需求调取。
可选的,实体抽取的方法可以基于规则、条件随机场算法(Conditional RandomField Algorithm,CRF)、BiLSTM、BiLSTM与CRF结合的方法,或者是联合模型的方法。其中,基于规则的词典/模型方法,是根据数据来自定义实体词典或人工定义语法规则,通过匹配算法来输出实体;基于传统的CRF方法是通过自定义CRF模板和训练语料,根据CRF算法来输出模型,然后将测试样本输入到模型中测试,最后输出实体,该方法适用于小规模数据和人工构建的特征,准确率较高,泛化能力较强,考虑了整个句子局部特征的线性加权组合,计算一种联合概率来优化整个序列;基于BiLSTM的方法,是采用循环神经RNN网络后接softMax层来进行语料分类,该方法适用于大规模数据、无需大量人工特征,且准确率较高,泛化能力强,序列建模强大,能够获取较长的上下文信息,具备神经网络拟合非线性的能力。
可选的,属性/关系的提取可以基于规则、BootStrapping半监督方法、分类监督方法例如支持向量机(support vector machines,SVM)和卷积神经网络(ConvolutionalNeural Networks,CNN)等,或者无监督算法。其中,基于规则的方法,是需要人为的定义,如X如何Y、怎么YX、X有哪些Y等,时间花费大,效率不高,但准确性高;基于BootStrapping半监督的方法,是利用少数几个种子依存关系模板,通过迭代过程来发现新的属性,最后对属性词进行排序过滤,这种种子依存关系模板是可移植的,可根据一种基于关联规则分析的初始种子依存关系模板来获得,这种半监督算法的准确性较高,泛化能力一般,适用于大量关系抽取,无需大量的人工标注;基于分类的监督算法,需要给训练语料中的关系/属性打标签,构造训练集和测试集,再用传统的机器学习算法来进行分类,其中最重要的步骤是构造特征,实体1和实体2之间或前后的词,可以用Bag-of-Words结合Bigram等,人为构造特征需要大量的精力,所以某些特征可以以来自然语言处理(Natural Language Processing,NLP)工具库,这种监督算法的准确性高。
S604:根据测井数据样本的实体、属性和关系,建立测井知识图谱。
可选的,本申请实施例可以根据不同的数据格式,将关键信息导入至测井知识图谱,具体方式如下:
将测井数据样本中提取的实体、属性和关系组合得到三元组数据;根据三元组数据的数据类型和内容,确定三元组数据对应的数据导入方法;根据三元组数据对应的数据导入方法,将三元组数据导入至测井知识图谱中。
其中,三元组是以实体为首尾节点,关系为边,和实体的属性组成的,可以表示为<实体1,关系,实体2>或<实体1,属性1,属性值1>,例如在测井领域中,<井50,属于,长庆油田>,<井50,用途,勘探井>。还可以基于已有的知识图谱三元组推导出新的关系,例如:<测井曲线,属于,井>和<井50,是,井>,可以推导出<测井曲线,属于,井50>。
可选的,根据三元组数据的数据类型和内容,确定三元组数据对应的数据导入方法,因为在图数据库里,所有的数据都表示为三元组的形式,但是在导入之前,测井的数据一般可以转为通用的文本文件和表格文件,对于测井曲线这种文本文件,需要导入曲线文件中的曲线名字和井信息,这些信息对应与文本中的某一行,而其它的文本值是不需要导入的,因此仅解析后导入曲线关键信息;对于其它的表格文件,例如解释结论、钻井取心、试油和岩屑录井等数据,需要根据表头的信息进行解析,表头对应的某一列数据可以表示为该实体的属性,这些都可以通过Python的Numpy或Pandas库来实现。
S605:根据自然语言处理,提取查询信息的关键信息。
这里,本申请实施例提供了一种建立测井知识图谱的方法,首先将测井知识图谱中的实体、属性和关系进行组合,得到了多个三元组数据,将这种表示实体、属性和关系的知识图谱三元组数据,进行梳理,根据数据类型和内容,确定三元组数据对应的数据导入方法,将三元组数据导入到测井知识图谱中,得到了包含多个三元组数据的测井知识图谱,便于测井人员根据测井知识图谱得到查询信息的知识图谱,进一步地提高了测井人员测井信息查询的效率。
S606:根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据。
测井知识图谱由测井数据样本中提取的实体、属性和关系建立的三元组数据组成。
S607:根据查询信息对应的三元组数据,返回查询信息对应的知识图谱中的相关测井数据。
S608:显示返回的知识图谱的相关测井数据。
其中,步骤S606-S608与上述步骤S203-S205的实现方式类似,这里不做多余赘述。
这里,本申请实施例提供了一种建立测井知识图谱的方法,首先获取测井数据样本,这里的测井数据样本为当前油井在测井过程中得到的大量测井相关数据,对测井数据样本通过自然语言处理进行语义分析,从而可以得到测井数据中的实体、属性和关系等数据,通过抽取测井数据样本中的实体、属性和关系等数据,将半结构化的测井曲线数据和非结构化的钻井取心、地质分层等表格数据进行统一的处理,可以对不同格式的数据进行统一的存储,从而便于将上述数据统一导入测井知识图谱,便于用户查询,进一步地提高了测井人员测井信息查询的效率。
图7为本申请实施例提供的一种测井知识图谱构建查询装置的结构示意图,如图7所示,本申请实施例的装置包括:第一获取模块701、第一提取模块702、查询模块703、返回模块704和第一显示模块705。这里的测井知识图谱构建查询装置可以是上述处理器102本身,或者是实现处理器102的功能的芯片或者集成电路。这里需要说明的是,第一获取模块701、第一提取模块702、查询模块703、返回模块704和第一显示模块705的划分只是一种逻辑功能的划分,物理上两者可以是集成的,也可以是独立的。
其中,第一获取模块701,用于获取用户输入的查询信息;
第一提取模块702,用于根据自然语言处理,提取查询信息的关键信息;
查询模块703,用于根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据,其中,测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,关键信息包括查询信息中的实体、属性和关系中的至少一种;
返回模块704,用于根据查询信息对应的三元组数据,返回查询信息对应的知识图谱中的相关测井数据;
第一显示模块705,用于显示返回的知识图谱的相关测井数据。
可选的,在第一提取模块702根据自然语言处理,提取查询信息的关键信息之前,上述装置还包括:
第二获取模块,用于获取测井数据样本;
第二提取模块,用于对测井数据样本通过自然语言处理进行语义分析,提取测井数据样本的实体、属性和关系;
建立模块,用于根据测井数据样本的实体、属性和关系,建立测井知识图谱。
可选的,在查询模块703根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据之前,上述装置还包括:
组合模块,用于将测井数据样本中提取的实体、属性和关系组合得到三元组数据;
确定模块,用于根据三元组数据的数据类型和内容,确定三元组数据对应的数据导入方法;
导入模块,用于根据三元组数据对应的数据导入方法,将三元组数据导入至测井知识图谱中。
可选的,三元组数据的数据类型包括:测井曲线、岩心数据、试油、解释结论、地质分层、地层水电阻率和解释图版。
可选的,第一获取模块701具体用于:
获取用户在预设搜索界面输入的查询信息。
可选的,在查询模块703在根据关键信息,在测井知识图谱中进行查询,确定查询信息对应的三元组数据之后,上述装置还包括:
第二显示模块,用于将查询结果显示在预设搜索界面上。
图8为本申请实施例提供的一种测井知识图谱构建查询设备的结构示意图。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不限制本文中描述的和/或者要求的本申请的实现。
如图8所示,该测井知识图谱构建查询设备包括:处理器801和存储器802,各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器801可以对在测井知识图谱构建查询设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。图8中以一个处理器801为例。
存储器802作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的测井知识图谱构建查询设备的方法对应的程序指令/模块(例如,附图7所示的第一获取模块701、第一提取模块702、查询模块703、返回模块704和第一显示模块705)。处理器801通过运行存储在存储器802中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的测井知识图谱构建查询设备的方法。
测井知识图谱构建查询设备还可以包括:输入装置803和输出装置804。处理器801、存储器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图8中以通过总线连接为例。
输入装置803可接收输入的数字或字符信息,以及产生与测井知识图谱构建查询设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置804可以是测井知识图谱构建查询设备的显示设备等输出设备。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
本申请实施例的测井知识图谱构建查询设备,可以用于执行本申请上述各方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述任一项所述的测井知识图谱构建查询方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,用于实现上述任一项所述的测井知识图谱构建查询方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
Claims (9)
1.一种测井知识图谱构建查询方法,其特征在于,包括:
获取用户输入的查询信息;
根据自然语言处理,提取所述查询信息的关键信息;
根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据;其中,所述测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,所述关键信息包括所述查询信息中的实体、属性和关系中的至少一种;
根据所述查询信息对应的三元组数据,返回所述查询信息对应的知识图谱中的相关测井数据;
显示所述返回的知识图谱的相关测井数据;
响应于用户点击交互页面中任一测井数据的内容显示按钮,显示与所述任一测井数据相关的节点和属性;
其中,所述根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据,具体包括:
根据所述关键信息在所述测井知识图谱中查询一度关系对应的节点作为与所述关键信息相匹配的三元组数据,若没有查询到一度关系对应的节点,则以所述一度关系节点为中心查询二度关系的节点作为与所述关键信息相匹配的三元组数据,所述一度关系表示距离所述关键信息所在的节点的距离为1个节点,所述二度关系表示距离所述关键信息所在的节点的距离为2个节点;
根据与所述关键信息相匹配的三元组数据,通过基于图的推荐算法或目标模型获取新的三元组数据,所述新的三元组数据与所述关键信息相匹配的三元组数据不同,并且所述新的三元组数据与所述关键信息相匹配的三元组数据相关性最高,所述目标模型是基于最近邻算法选出与关键信息对应的地质特征最匹配的模型以及模型的参数;
将与所述关键信息相匹配的三元组数据和所述新的三元组数据确定为所述查询信息对应的三元组数据;
相应的,在所述根据自然语言处理,提取所述查询信息的关键信息之前,还包括:
获取测井数据样本;
对所述测井数据样本通过自然语言处理进行语义分析,提取所述测井数据样本的实体、属性和关系,其中,所述属性或关系的提取方法是基于BootStrapping半监督的方法;
根据所述测井数据样本的实体、属性和关系,通过关系运算符对所述测井数据样本对应的三元组数据的节点求交集、并集和差集的方式建立所述测井知识图谱。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据之前,还包括:
将所述测井数据样本中提取的实体、属性和关系组合得到三元组数据;根据所述三元组数据的数据类型和内容,确定所述三元组数据对应的数据导入方法;
根据所述三元组数据对应的数据导入方法,将所述三元组数据导入至测井知识图谱中。
3.根据权利要求1所述的方法,其特征在于,所述三元组数据的数据类型包括:测井曲线、岩心数据、试油、解释结论、地质分层、地层水电阻率和解释图版。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取用户输入的查询信息,包括:
获取用户在预设搜索界面输入的查询信息。
5.根据权利要求4所述的方法,其特征在于,在所述根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据之后,还包括:
将查询结果显示在所述预设搜索界面上。
6.一种测井知识图谱构建查询装置,其特征在于,包括:
第一获取模块,用于获取用户输入的查询信息;
第一提取模块,用于根据自然语言处理,提取所述查询信息的关键信息;
查询模块,用于根据所述关键信息,在测井知识图谱中进行查询,确定所述查询信息对应的三元组数据;其中,所述测井知识图谱中的测井数据样本以实体、属性和关系的形式存储,所述关键信息包括所述查询信息中的实体、属性和关系中的至少一种;
返回模块,用于根据所述查询信息对应的三元组数据,返回所述查询信息对应的知识图谱中的相关测井数据;
第一显示模块,用于显示所述返回的知识图谱的相关测井数据;
所述第一显示模块,还用于响应于用户点击交互页面中任一测井数据的内容显示按钮,显示与所述任一测井数据相关的节点和属性;
其中,所述查询模块,具体用于:
根据所述关键信息在所述测井知识图谱中查询一度关系对应的节点作为与所述关键信息相匹配的三元组数据,若没有查询到一度关系对应的节点,则以所述一度关系节点为中心查询二度关系的节点作为与所述关键信息相匹配的三元组数据,所述一度关系表示距离所述关键信息所在的节点的距离为1个节点,所述二度关系表示距离所述关键信息所在的节点的距离为2个节点;
根据与所述关键信息相匹配的三元组数据,通过基于图的推荐算法或目标模型获取新的三元组数据,所述新的三元组数据与所述关键信息相匹配的三元组数据不同,并且所述新的三元组数据与所述关键信息相匹配的三元组数据相关性最高,所述目标模型是基于最近邻算法选出与关键信息对应的地质特征最匹配的模型以及模型的参数;
将与所述关键信息相匹配的三元组数据和所述新的三元组数据确定为所述查询信息对应的三元组数据;
相应的,所述装置还包括知识图谱构建模块,所述知识图谱构建模块用于:
获取测井数据样本;
对所述测井数据样本通过自然语言处理进行语义分析,提取所述测井数据样本的实体、属性和关系,其中,所述属性或关系的提取方法是基于BootStrapping半监督的方法;
根据所述测井数据样本的实体、属性和关系,通过关系运算符对所述测井数据样本对应的三元组数据的节点求交集、并集和差集的方式建立所述测井知识图谱。
7.一种测井知识图谱构建查询设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至5任一项所述的测井知识图谱构建查询方法。
9.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述的测井知识图谱构建查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110102187.6A CN112948547B (zh) | 2021-01-26 | 2021-01-26 | 测井知识图谱构建查询方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110102187.6A CN112948547B (zh) | 2021-01-26 | 2021-01-26 | 测井知识图谱构建查询方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112948547A CN112948547A (zh) | 2021-06-11 |
CN112948547B true CN112948547B (zh) | 2024-04-09 |
Family
ID=76236814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110102187.6A Active CN112948547B (zh) | 2021-01-26 | 2021-01-26 | 测井知识图谱构建查询方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112948547B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569030A (zh) * | 2021-07-29 | 2021-10-29 | 北京三快在线科技有限公司 | 信息查询方法、装置、设备及存储介质 |
CN113392228B (zh) * | 2021-08-03 | 2023-07-21 | 广域铭岛数字科技有限公司 | 基于汽车生产的异常预测及追溯方法、系统、设备及介质 |
CN113689697B (zh) * | 2021-08-13 | 2022-06-28 | 南京理工大学 | 一种基于规则匹配和知识图谱的交通事件影响分析方法、系统、设备、可读存储介质 |
CN113934729A (zh) * | 2021-10-20 | 2022-01-14 | 平安国际智慧城市科技股份有限公司 | 一种基于知识图谱的数据管理方法、相关设备及介质 |
CN116662849B (zh) * | 2023-04-21 | 2024-04-09 | 西南石油大学 | 一种基于数字孪生与知识图谱的卡钻类型智能识别方法 |
CN118014072B (zh) * | 2024-04-10 | 2024-08-16 | 中国电建集团昆明勘测设计研究院有限公司 | 水利水电工程用知识图谱的构建方法及系统 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761678A (zh) * | 2014-01-06 | 2014-04-30 | 中国石油大学(华东) | 区块快速测井评价联动平台系统 |
CN104537065A (zh) * | 2014-12-29 | 2015-04-22 | 北京奇虎科技有限公司 | 一种搜索结果的推送方法及系统 |
CN105550190A (zh) * | 2015-06-26 | 2016-05-04 | 许昌学院 | 面向知识图谱的跨媒体检索系统 |
CN107480183A (zh) * | 2017-07-06 | 2017-12-15 | 广州索答信息科技有限公司 | 一种厨房领域知识图谱查询方法、装置和存储介质 |
CN108829858A (zh) * | 2018-06-22 | 2018-11-16 | 北京京东金融科技控股有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN111046193A (zh) * | 2019-12-27 | 2020-04-21 | 南京邮电大学 | 一种基于元学习的领域知识图谱补全方法 |
CN111061750A (zh) * | 2019-12-17 | 2020-04-24 | Oppo广东移动通信有限公司 | 一种查询处理方法、装置及计算机可读存储介质 |
CN111090739A (zh) * | 2019-10-30 | 2020-05-01 | 贝壳技术有限公司 | 信息处理方法、装置以及电子设备、存储介质 |
CN111259653A (zh) * | 2020-01-15 | 2020-06-09 | 重庆邮电大学 | 基于实体关系消歧的知识图谱问答方法、系统以及终端 |
CN111353030A (zh) * | 2020-02-26 | 2020-06-30 | 陕西师范大学 | 基于旅游领域知识图谱的知识问答检索方法及装置 |
CN111472751A (zh) * | 2019-12-27 | 2020-07-31 | 北京国双科技有限公司 | 测井解释方法、知识图谱构建方法及相关装置 |
CN111506722A (zh) * | 2020-06-16 | 2020-08-07 | 平安科技(深圳)有限公司 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
CN111597347A (zh) * | 2020-04-24 | 2020-08-28 | 扬州大学 | 知识嵌入的缺陷报告重构方法及装置 |
CN111625607A (zh) * | 2019-12-27 | 2020-09-04 | 北京国双科技有限公司 | 油气知识图谱的构建方法、装置、电子设备和存储介质 |
CN111651614A (zh) * | 2020-07-16 | 2020-09-11 | 宁波方太厨具有限公司 | 药膳知识图谱的构建方法、系统、电子设备及存储介质 |
CN112084347A (zh) * | 2020-09-15 | 2020-12-15 | 东北大学 | 一种基于知识表示学习的数据检索方法及系统 |
CN112115234A (zh) * | 2020-09-28 | 2020-12-22 | 中国银行股份有限公司 | 一种问题库分析方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11227018B2 (en) * | 2019-06-27 | 2022-01-18 | International Business Machines Corporation | Auto generating reasoning query on a knowledge graph |
-
2021
- 2021-01-26 CN CN202110102187.6A patent/CN112948547B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761678A (zh) * | 2014-01-06 | 2014-04-30 | 中国石油大学(华东) | 区块快速测井评价联动平台系统 |
CN104537065A (zh) * | 2014-12-29 | 2015-04-22 | 北京奇虎科技有限公司 | 一种搜索结果的推送方法及系统 |
CN105550190A (zh) * | 2015-06-26 | 2016-05-04 | 许昌学院 | 面向知识图谱的跨媒体检索系统 |
CN107480183A (zh) * | 2017-07-06 | 2017-12-15 | 广州索答信息科技有限公司 | 一种厨房领域知识图谱查询方法、装置和存储介质 |
CN108829858A (zh) * | 2018-06-22 | 2018-11-16 | 北京京东金融科技控股有限公司 | 数据查询方法、装置及计算机可读存储介质 |
CN109657037A (zh) * | 2018-12-21 | 2019-04-19 | 焦点科技股份有限公司 | 一种基于实体类型和语义相似度的知识图谱问答方法及系统 |
CN111090739A (zh) * | 2019-10-30 | 2020-05-01 | 贝壳技术有限公司 | 信息处理方法、装置以及电子设备、存储介质 |
CN111061750A (zh) * | 2019-12-17 | 2020-04-24 | Oppo广东移动通信有限公司 | 一种查询处理方法、装置及计算机可读存储介质 |
CN111046193A (zh) * | 2019-12-27 | 2020-04-21 | 南京邮电大学 | 一种基于元学习的领域知识图谱补全方法 |
CN111472751A (zh) * | 2019-12-27 | 2020-07-31 | 北京国双科技有限公司 | 测井解释方法、知识图谱构建方法及相关装置 |
CN111625607A (zh) * | 2019-12-27 | 2020-09-04 | 北京国双科技有限公司 | 油气知识图谱的构建方法、装置、电子设备和存储介质 |
CN111259653A (zh) * | 2020-01-15 | 2020-06-09 | 重庆邮电大学 | 基于实体关系消歧的知识图谱问答方法、系统以及终端 |
CN111353030A (zh) * | 2020-02-26 | 2020-06-30 | 陕西师范大学 | 基于旅游领域知识图谱的知识问答检索方法及装置 |
CN111597347A (zh) * | 2020-04-24 | 2020-08-28 | 扬州大学 | 知识嵌入的缺陷报告重构方法及装置 |
CN111506722A (zh) * | 2020-06-16 | 2020-08-07 | 平安科技(深圳)有限公司 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
CN111651614A (zh) * | 2020-07-16 | 2020-09-11 | 宁波方太厨具有限公司 | 药膳知识图谱的构建方法、系统、电子设备及存储介质 |
CN112084347A (zh) * | 2020-09-15 | 2020-12-15 | 东北大学 | 一种基于知识表示学习的数据检索方法及系统 |
CN112115234A (zh) * | 2020-09-28 | 2020-12-22 | 中国银行股份有限公司 | 一种问题库分析方法和装置 |
Non-Patent Citations (2)
Title |
---|
Xiang-Guang Zhou 等.PetroKG: Construction and Application of Knowledge Graph in Upstream Area of PetroChina.《Journal of Computer Science and Technology》.2020,368-378. * |
张富利 等.知识图谱技术在石油天然气勘探开发知识管理中的应用探讨.《信息系统工程》.2020,(第01期),128-130. * |
Also Published As
Publication number | Publication date |
---|---|
CN112948547A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112948547B (zh) | 测井知识图谱构建查询方法、装置、设备及存储介质 | |
CN105760495B (zh) | 一种基于知识图谱针对bug问题进行探索性搜索方法 | |
Zhu et al. | Intelligent learning for knowledge graph towards geological data | |
CN109657068B (zh) | 面向智慧博物馆的文物知识图谱生成与可视化方法 | |
Tuchinda et al. | Building mashups by example | |
CN110781315B (zh) | 一种食品安全知识图谱及相关智能问答系统的构建方法 | |
Ma et al. | Ontology-aided annotation, visualization, and generalization of geological time-scale information from online geological map services | |
Holden et al. | GeoDocA–Fast analysis of geological content in mineral exploration reports: A text mining approach | |
Desimoni et al. | Empirical evaluation of linked data visualization tools | |
CN102968465B (zh) | 网络信息服务平台及其基于该平台的搜索服务方法 | |
JP2009048441A (ja) | 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法 | |
CN102955848A (zh) | 一种基于语义的三维模型检索系统和方法 | |
CN103399862B (zh) | 确定目标查询序列所对应的搜索引导信息的方法与设备 | |
Alam et al. | Latviz: A new practical tool for performing interactive exploration over concept lattices | |
Wang et al. | Visual analytics and information extraction of geological content for text-based mineral exploration reports | |
CN114090861A (zh) | 一种基于知识图谱的教育领域搜索引擎构建方法 | |
NO20130838A1 (no) | Virtuelt tre | |
US11295082B2 (en) | Converting text-based requirements to a live prototype | |
Ma et al. | Multi-granularity retrieval of mineral resource geological reports based on multi-feature association | |
Wang et al. | An ontology-based approach for marine geochemical data interoperation | |
Khurana et al. | Survey of techniques for deep web source selection and surfacing the hidden web content | |
CN111709239A (zh) | 一种基于专家逻辑结构树的地学数据发现方法 | |
RU2571535C2 (ru) | Мера качества для службы контекста данных | |
Onoue et al. | Development of an integrated visualization system for phenotypic character networks | |
CN110457435A (zh) | 一种专利新颖性分析系统及其分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |