CN111475604A - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN111475604A CN111475604A CN201910880999.6A CN201910880999A CN111475604A CN 111475604 A CN111475604 A CN 111475604A CN 201910880999 A CN201910880999 A CN 201910880999A CN 111475604 A CN111475604 A CN 111475604A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- oil
- graph
- framework
- development
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据处理方法及装置,获取油气勘探开发领域的行业知识,基于所述油气勘探开发领域的行业知识,构建油气勘探开发领域的知识图谱框架,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。通过本发明,可以形成油气勘探开发领域的知识图谱,进而通过知识图谱可以快速了解并深度分析油气勘探开发领域的相关知识。
Description
技术领域
本发明涉及数据处理领域,更具体的说,涉及数据处理方法及装置。
背景技术
在石油勘探开发领域,人们已经积累了大量的、格式各异的文献和知识成果,有大型的结构化的勘探开发数据库、Office文档、各类研究成果、地质图件、演示文稿及海量的专业论文和书籍等。亟需对这些知识进行数据建模和管理,让专业用户和研究者能从这些大量的结构化、半结构化和非结构化的成果中快速找到知识和经验,并深度发掘这些知识和经验的价值。
发明内容
鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法及装置。
一种数据处理方法,包括:
获取油气勘探开发领域的行业知识;
基于所述行业知识,构建油气勘探开发领域的知识图谱框架;
根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
可选地,基于所述行业知识,构建油气勘探开发领域的知识图谱框架,包括:
获取用户构建知识图谱框架的需求信息;
从所述行业知识中提取出与所述需求信息对应的本体以及所述本体之间的关联关系;
基于所述本体以及所述本体之间的关联关系,通过本体建模,构建所述知识图谱框架。
可选地,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱,包括:
将与所述知识图谱框架的所述本体有关联关系的实体的结构化数据通过数据链接方式导入到所述知识图谱框架中;
将与所述知识图谱框架的所述本体有关联关系的实体的非结构化数据通过知识抽取方式,抽取到与所述本体有关联关系的实体的实体信息;
将所述实体信息导入到所述知识图谱框架中,形成所述知识图谱。
可选地,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱的过程中,还包括:
若出现与油气勘探开发领域相关但未出现在所述知识图谱框架中的本体时,将出现的所述本体添加到所述知识图谱框架中。
可选地,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
接收用户通过点击所述知识图谱的具体内容生成的修改需求;所述修改需求包括本体的增加、修改或删除、实体的增加、修改或删除、关联关系的增加、修改或删除;
依据所述修改需求,对所述知识图谱框架进行相应修改。
可选地,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
获取用户搜索请求;所述用户搜索请求中携带有待搜索内容;
从所述知识图谱中搜索与所述待搜索内容相关的内容,并进行可视化展示。
一种数据处理装置,包括:
信息获取模块,用于获取油气勘探开发领域的行业知识;
框架生成模块,用于基于所述行业知识,构建油气勘探开发领域的知识图谱框架;
图谱生成模块,用于根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
可选地,所述框架生成模块包括:
信息获取子模块,用于获取用户构建知识图谱框架的需求信息;
数据提取子模块,用于从所述行业知识中提取出与所述需求信息对应的本体以及所述本体之间的关联关系;
框架构建子模块,用于基于所述本体以及所述本体之间的关联关系,通过本体建模,构建所述知识图谱框架。
一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的数据处理方法。
一种电子设备,包括至少一个处理器、以及与所述处理器连接的总线和至少一个存储器;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述的数据处理方法。
借由上述技术方案,本发明提供了数据处理方法及装置,获取油气勘探开发领域的行业知识,基于所述油气勘探开发领域的行业知识,构建油气勘探开发领域的知识图谱框架,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。通过本发明,可以形成油气勘探开发领域的知识图谱,进而通过知识图谱可以快速了解油气勘探开发领域的相关知识。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种数据处理方法的方法流程图;
图2示出了本发明实施例提供的一种知识图谱框架的结构示意图;
图3示出了本发明实施例提供的另一种数据处理方法的方法流程图;
图4示出了本发明实施例提供的再一种数据处理方法的方法流程图;
图5示出了本发明实施例提供的一种知识图谱应用的场景示意图;
图6示出了本发明实施例提供的一种数据处理装置的结构示意图;
图7示出了本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种数据处理方法,通过该数据处理方法可以构建得到油气勘探开发领域的知识图谱。具体的,知识图谱技术是指知识图谱建立和应用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义网络、数据挖掘与机器学习等方向的交叉研究。知识图谱是2012年由谷歌提出,并成功应用于搜索引擎。知识图谱给互联网语义搜索带来了活力,在智能问答中显示出强大威力,已经成为知识驱动的智能应用的基础。知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。
知识图谱的基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性值组成的键值对,实体之间通过关系相互联结,构成网状的知识结构。知识图谱可分为开放域通用知识图谱和垂直行业知识图谱。开放通用知识图谱注重广度,较垂直行业知识图谱而言,其准确度不够高,并且很难借助本体库对公理、规则以及约束条件的支持能力规范其实体、属性、实体间的关系等。行业知识图谱通常需要依靠特定行业的数据来构建,具有特定的行业意义。
知识图谱的构建是指建立图谱的数据模式,就是对整个知识图谱的结构进行定义。知识图谱有自顶向下和自底向上两种构建方式:自底向上构建,是借助一定的技术手段,从公开采集的数据中提取出资源模式,经人工审核之后,加入到知识库中,多用于通用知识图谱;而自顶向下指的是先基于大量数据为知识图谱定义好本体与数据模式,再将实体加入到知识库,多用于行业知识图谱。
本实施例将针对石油勘探开发领域,按照从顶向下的方式,对本行业的各类本体、实体及其属性进行了宏观梳理,构建石油勘探开发行业知识图谱。该图谱作为油气行业领域知识库的起点,可通过可视化界面对本体进行不断扩充修改,并且可对实体知识进行各种增删改查操作,为行业知识的深度利用和共享打下了坚实的基础。
在上述知识图谱的介绍的基础上,参照图1,数据处理方法可以包括:
S11、获取油气勘探开发领域的行业知识。
油气勘探开发领域的专家将油气勘探、开发与生产过程中产生的各类业务流程、及相关的业务实体进行抽象和归纳,形成石油勘探开发综合知识体系。该知识体系中包括油气勘探开发领域的各种知识汇总,如盆地包含一级构造单元和二级构造单元,盆地又包含油气田;油气田有各种属性入作业公司、油气田资源量;油气田包含油气藏;油气藏有油层、储层、烃源岩、盖层、开发动态等等。
S12、基于行业知识,构建油气勘探开发领域的知识图谱框架。
参照图2,图2为一个知识图谱框架。每一个节点表示一个本体,如油气田、井、钻井和录井等等。节点之间的连线表示节点之间的关系。
图2中,知识本体的根节点是盆地,盆地包含一级构造单元和二级构造单元,盆地又包含油气田;油气田有各种属性入作业公司、油气田资源量;油气田包含油气藏;油气藏有油层、储层、烃源岩、盖层、开发动态等子节点(用浅黄色表示),每个子节点有各种属性。通过知识图谱的方式,可以将这些零散的、碎片化的勘探开发知识串联起来,形成一张网状的知识体系。基于该知识体系,可进行各类的图计算和推理,形成油气智能的基础知识平台。
其中,盆地:在一定地史阶段内受构造运动形成的统一的沉降区。地史上的盆地有些已失去盆地外貌和特征,有些依旧是现代地理上的盆地。盆地是石油勘探的基本对象;
油气田:在相同构造、地层、岩性等单一或复合地质因素控制下的,同一面积内的油藏、气藏、油气藏的总和。一个油气田可能有一个或若干个油藏、气藏。在同一面积范围内主要为油藏的称为油田,主要为气藏的则称为气田;
油气藏:在具有统一压力系统和油水界面的单一储层的单一圈闭中的石油和天然气聚集体。它是石油和天然气同时在地壳中聚集的基本单元。形成油气藏必须具备的条件是:存在成熟烃源岩,形成的油气能运移聚集到储集岩的孔隙和裂缝空间,有阻止油气进一步运移的圈闭,即具有统一的压力系统和油气水边界。这些条件在有利的时间和地点组合在一起,才能形成一个油气藏;
井:地面上由人工挖掘或用钻头钻入地下形成的孔眼,通常下入有金属管子。用于勘探和开采有用矿物或获取科学资料。在油气田勘探开发过程中,按不同的目的和用途,把所钻的井分为不同的类别。例如,按勘探阶段所钻井的目的,可分为预探井、详探井或评价井;按开发阶段所钻井的目的或用途,可分为生产井和注入井;而生产井又分采油井、采气井、热采井等;注入井又分注水井、注气井、注蒸汽井等;另外还有观察井、检查井、停产井、停注井、报废井等。按所钻井的井身轨迹和结构,可分为直井、斜井、水平井、多分支井等。
上述给出了知识图谱框架的结构,现对其生成过程进行介绍。参照图3,步骤S12可以包括:
S21、获取用户构建知识图谱框架的需求信息。
用户在设计知识图谱框架时,可能只关心油气勘探开发领域的一部分内容,如只关心勘探、开发或生产中的一方面,也可能同时关心勘探、开发和生产三个方面。
S22、从行业知识中提取出与需求信息对应的本体以及本体之间的关联关系。
在得到用户的需求之后,就从行业知识中搜索与该用户需求对应的内容,并从那些内容中得到油气勘探开发领域的本体,以及本体之间的关联关系,如盆地包含一级构造单元和二级构造单元,本体为:盆地、一级构造单元和二级构造单元,关联关系为包含。
S23、基于本体以及本体之间的关联关系,通过本体建模,构建知识图谱框架。
得到本体以及本体之间的关联关系之后,按照知识图谱的思想,将业务模型通过本体表现出来,通过知识图谱三元组的节点和边,来表现油气行业的盆地、区块、油气田、油气藏、单井(用知识图谱的节点来表示)及它们之间的关系(用知识图谱的边来表示)。
S13、根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。具体的,知识图谱框架中包括本体以及本体之间的关联关系,此时还需要将本体对应的实体内容填充进去,形成完整的知识图谱。
本实施例中,获取油气勘探开发领域的行业知识,基于油气勘探开发领域的行业知识,构建油气勘探开发领域的知识图谱框架,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。通过本发明,可以形成油气勘探开发领域的知识图谱,进而通过知识图谱可以快速了解并深度分析油气勘探开发领域的相关知识。
现对如何从知识图谱框架中添加实体数据,得到完整的知识图谱的过程进行介绍。具体的,参照图4,步骤S13可以包括:
S31、将与知识图谱框架的本体有关联关系的实体的结构化数据通过数据链接方式导入到知识图谱框架中。
S32、将与知识图谱框架的本体有关联关系的实体的非结构化数据通过知识抽取方式,抽取到与本体有关联关系的实体的实体信息。
S33、将实体信息导入到知识图谱框架中,形成知识图谱。
具体的,通过数据链接,可将结构化数据库中的知识导入到知识图谱框架中。
也可通过机器学习、自然语言处理等技术,实现从非结构化文档中抽提实体信息,加载到知识图谱框架中。
本发明的另一实现方式中,在从知识图谱框架中添加与知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱的过程中,还包括:
若出现与油气勘探开发领域相关但未出现在知识图谱框架中的本体时,将出现的本体添加到知识图谱框架中。
具体的,知识加载的过程中,可能会发现一些新的知识,这时可以通过本体管理工具,修改勘探开发本体库,这样新知识即可加载到知识图谱框架中。
在构建得到知识图谱之后,还支持知识图谱的查询、修改和删除,具体的:
接收用户通过点击知识图谱的具体内容生成的修改需求,依据修改需求,对知识图谱框架进行相应修改。
其中,修改需求包括本体的增加、修改或删除、实体的增加、修改或删除、关联关系的增加、修改或删除。
通过可视化的图形界面,用户可以查看各类勘探开发业务相关的实体对象,也可以对这些对象以及它们之间的关系进行增加、删除、修改和查询。参照图6,用户点击某一实体,可以显示该实体的更多细节,如图中的电机显示留62油藏流体实体的更多细节,则显示图6右侧详细的节点信息。此外,用户还可以点击某一实体或者实体之间的连线,则可以对该本体、实体或实体的连接关系进行修改。如修改实体的名称、关联关系等。
用户还可以实现对知识图谱的模糊搜索,用户在搜索框中输入待搜索内容,即获取用户搜索请求;所述用户搜索请求中携带有待搜索内容。则可以在整个知识图谱中搜索到与该待搜索内容对应的信息。如用户搜索“大庆油田”,则会出现与大庆油田相关的信息,对此信息进行可视化展示,如以图或表的形式展示。
本实施例中,对油气知识进行数据建模和管理,让专业用户和研究者能从这些大量的结构化、半结构化和非结构化的成果中快速找到知识,解决实际的油气田勘探、开发、生产问题。
另外,现有技术中,在石油勘探开发行业,已经有很多种类型的知识库,但是这些知识库都是建立在关系数据库基础上,其缺点是数据库模型很难扩展和修改,多表连接时知识查询效率不高,不能进行知识推理和计算,也不能很好地对非结构化知识成果进行存储。而基于图结构存储的勘探开发知识图谱库很好地克服了这些缺点,知识图谱库没有固定的数据模式,数据结构很容易扩充修改,可以非常方便地用来存储非结构化文档中的知识成果;知识图谱库的查询速度快,特别是查询多个存在联系的实体时;基于图论的知识图谱库可以像超级行业专家一样,对各类勘探开发问题进行推理、计算和归纳。
此外,运用知识图谱技术,对石油勘探开发行业的知识进行本体建模,改变了该行业传统的基于关系数据库的业务现状,增加了知识管理的灵活性和效率。在油气行业的知识管理方面,终端用户,包括地质学家和油藏工程师及相关行业专家,不需要写复杂的结构化查询语言SQL(Structured Query Language)查询,也不需要寻求专业人员帮忙,通过可视化的图形界面,即可完成对知识库结构的修改,及对行业知识的增删改查操作,大大降低了知识库使用门槛。
可选的,在上述数据处理方法的实施例的基础上,本发明的另一实施例提供了一种数据处理装置,参照图5,可以包括:
信息获取模块101,用于获取油气勘探开发领域的行业知识;
框架生成模块102,用于基于行业知识,构建油气勘探开发领域的知识图谱框架;
图谱生成模块103,用于根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
进一步,框架生成模块102可以包括:
信息获取子模块,用于获取用户构建知识图谱框架的需求信息;
数据提取子模块,用于从行业知识中提取出与需求信息对应的本体以及本体之间的关联关系;
框架构建子模块,用于基于本体以及本体之间的关联关系,通过本体建模,构建知识图谱框架。
本实施例中,获取油气勘探开发领域的行业知识,基于油气勘探开发领域的行业知识,构建油气勘探开发领域的知识图谱框架,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。通过本发明,可以形成油气勘探开发领域的知识图谱,进而通过知识图谱可以快速了解油气勘探开发领域的相关知识。
需要说明的是,本实施例中的各个模块和子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选的,在上述数据处理装置的实施例的基础上,图谱生成模块103可以包括:
第一生成子模块,用于将与知识图谱框架的本体有关联关系的实体的结构化数据通过数据链接方式导入到知识图谱框架中;
第二生成子模块,用于将与知识图谱框架的本体有关联关系的实体的非结构化数据通过知识抽取方式,抽取到与本体有关联关系的实体的实体信息;
第三生成子模块,用于将实体信息导入到知识图谱框架中,形成知识图谱。
进一步,还包括:
数据添加子模块,用于若出现与油气勘探开发领域相关但未出现在知识图谱框架中的本体时,将出现的本体添加到知识图谱框架中。
进一步,还包括:
修改子模块,用于接收用户通过点击知识图谱的具体内容生成的修改需求,依据修改需求,对知识图谱框架进行相应修改。修改需求包括本体的增加、修改或删除、实体的增加、修改或删除、关联关系的增加、修改或删除。
进一步,还包括:
搜索子模块,用于获取用户搜索请求;用户搜索请求中携带有待搜索内容,从知识图谱中搜索与待搜索内容相关的内容,并进行可视化展示。
本实施例中,对油气知识进行数据建模和管理,让专业用户和研究者能从这些大量的结构化、半结构化和非结构化的成果中快速找到知识,解决实际的油气田勘探、开发、生产问题。
需要说明的是,本实施例中的各个模块和子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
数据处理装置包括处理器和存储器,上述信息获取模块、框架生成模块和图谱生成模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来形成油气勘探开发领域的知识图谱,进而通过知识图谱可以快速了解油气勘探开发领域的相关知识。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现数据处理方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行数据处理方法。
本发明实施例提供了一种设备70,设备70包括至少一个处理器701、以及与处理器连接的总线703和至少一个存储器702;其中,处理器701、存储器702通过总线703完成相互间的通信;处理器701用于调用存储器702中的程序指令,以执行上述的视频生成方法。本文中的设备70可以是服务器、PC、PAD、手机等。具体的,处理器执行程序时实现以下步骤:
一种数据处理方法,包括:
获取油气勘探开发领域的行业知识;
基于所述行业知识,构建油气勘探开发领域的知识图谱框架;
根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
进一步,基于所述行业知识,构建油气勘探开发领域的知识图谱框架,包括:
获取用户构建知识图谱框架的需求信息;
从所述行业知识中提取出与所述需求信息对应的本体以及所述本体之间的关联关系;
基于所述本体以及所述本体之间的关联关系,通过本体建模,构建所述知识图谱框架。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱,包括:
将与所述知识图谱框架的所述本体有关联关系的实体的结构化数据通过数据链接方式导入到所述知识图谱框架中;
将与所述知识图谱框架的所述本体有关联关系的实体的非结构化数据通过知识抽取方式,抽取到与所述本体有关联关系的实体的实体信息;
将所述实体信息导入到所述知识图谱框架中,形成所述知识图谱。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱的过程中,还包括:
若出现与油气勘探开发领域相关但未出现在所述知识图谱框架中的本体时,将出现的所述本体添加到所述知识图谱框架中。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
接收用户通过点击所述知识图谱的具体内容生成的修改需求;所述修改需求包括本体的增加、修改或删除、实体的增加、修改或删除、关联关系的增加、修改或删除;
依据所述修改需求,对所述知识图谱框架进行相应修改。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
获取用户搜索请求;所述用户搜索请求中携带有待搜索内容;
从所述知识图谱中搜索与所述待搜索内容相关的内容,并进行可视化展示。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
一种数据处理方法,包括:
获取油气勘探开发领域的行业知识;
基于所述行业知识,构建油气勘探开发领域的知识图谱框架;
根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
进一步,基于所述行业知识,构建油气勘探开发领域的知识图谱框架,包括:
获取用户构建知识图谱框架的需求信息;
从所述行业知识中提取出与所述需求信息对应的本体以及所述本体之间的关联关系;
基于所述本体以及所述本体之间的关联关系,通过本体建模,构建所述知识图谱框架。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱,包括:
将与所述知识图谱框架的所述本体有关联关系的实体的结构化数据通过数据链接方式导入到所述知识图谱框架中;
将与所述知识图谱框架的所述本体有关联关系的实体的非结构化数据通过知识抽取方式,抽取到与所述本体有关联关系的实体的实体信息;
将所述实体信息导入到所述知识图谱框架中,形成所述知识图谱。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱的过程中,还包括:
若出现与油气勘探开发领域相关但未出现在所述知识图谱框架中的本体时,将出现的所述本体添加到所述知识图谱框架中。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
接收用户通过点击所述知识图谱的具体内容生成的修改需求;所述修改需求包括本体的增加、修改或删除、实体的增加、修改或删除、关联关系的增加、修改或删除;
依据所述修改需求,对所述知识图谱框架进行相应修改。
进一步,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
获取用户搜索请求;所述用户搜索请求中携带有待搜索内容;
从所述知识图谱中搜索与所述待搜索内容相关的内容,并进行可视化展示。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取油气勘探开发领域的行业知识;
基于所述行业知识,构建油气勘探开发领域的知识图谱框架;
根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
2.根据权利要求1所述的数据处理方法,其特征在于,基于所述行业知识,构建油气勘探开发领域的知识图谱框架,包括:
获取用户构建知识图谱框架的需求信息;
从所述行业知识中提取出与所述需求信息对应的本体以及所述本体之间的关联关系;
基于所述本体以及所述本体之间的关联关系,通过本体建模,构建所述知识图谱框架。
3.根据权利要求2所述的数据处理方法,其特征在于,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱,包括:
将与所述知识图谱框架的所述本体有关联关系的实体的结构化数据通过数据链接方式导入到所述知识图谱框架中;
将与所述知识图谱框架的所述本体有关联关系的实体的非结构化数据通过知识抽取方式,抽取到与所述本体有关联关系的实体的实体信息;
将所述实体信息导入到所述知识图谱框架中,形成所述知识图谱。
4.根据权利要求3所述的数据处理方法,其特征在于,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱的过程中,还包括:
若出现与油气勘探开发领域相关但未出现在所述知识图谱框架中的本体时,将出现的所述本体添加到所述知识图谱框架中。
5.根据权利要求1所述的数据处理方法,其特征在于,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
接收用户通过点击所述知识图谱的具体内容生成的修改需求;所述修改需求包括本体的增加、修改或删除、实体的增加、修改或删除、关联关系的增加、修改或删除;
依据所述修改需求,对所述知识图谱框架进行相应修改。
6.根据权利要求1所述的数据处理方法,其特征在于,根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱之后,还包括:
获取用户搜索请求;所述用户搜索请求中携带有待搜索内容;
从所述知识图谱中搜索与所述待搜索内容相关的内容,并进行可视化展示。
7.一种数据处理装置,其特征在于,包括:
信息获取模块,用于获取油气勘探开发领域的行业知识;
框架生成模块,用于基于所述行业知识,构建油气勘探开发领域的知识图谱框架;
图谱生成模块,用于根据所述知识图谱框架,添加与所述知识图谱框架有关联关系的数据,形成油气勘探开发领域的知识图谱。
8.根据权利要求7所述的数据处理装置,其特征在于,所述框架生成模块包括:
信息获取子模块,用于获取用户构建知识图谱框架的需求信息;
数据提取子模块,用于从所述行业知识中提取出与所述需求信息对应的本体以及所述本体之间的关联关系;
框架构建子模块,用于基于所述本体以及所述本体之间的关联关系,通过本体建模,构建所述知识图谱框架。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至6中任意一项所述的数据处理方法。
10.一种电子设备,其特征在于,包括至少一个处理器、以及与所述处理器连接的总线和至少一个存储器;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至6中任意一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910880999.6A CN111475604A (zh) | 2019-09-18 | 2019-09-18 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910880999.6A CN111475604A (zh) | 2019-09-18 | 2019-09-18 | 数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111475604A true CN111475604A (zh) | 2020-07-31 |
Family
ID=71744967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910880999.6A Pending CN111475604A (zh) | 2019-09-18 | 2019-09-18 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111475604A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308464A (zh) * | 2020-11-24 | 2021-02-02 | 中国人民公安大学 | 业务流程数据处理方法和装置 |
CN112883202A (zh) * | 2021-03-26 | 2021-06-01 | 江苏省未来网络创新研究院 | 一种基于知识图谱的多组件建模方法和系统 |
CN113514875A (zh) * | 2021-06-03 | 2021-10-19 | 德仕能源科技集团股份有限公司 | 一种基于大数据的岩性油气藏的勘测和描述方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462501A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于结构化数据的知识图谱构建方法和装置 |
CN106355627A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 一种用于生成知识图谱的方法及系统 |
US20180232443A1 (en) * | 2017-02-16 | 2018-08-16 | Globality, Inc. | Intelligent matching system with ontology-aided relation extraction |
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN109508381A (zh) * | 2018-09-29 | 2019-03-22 | 北京国双科技有限公司 | 知识图谱的处理方法及装置 |
CN109508383A (zh) * | 2018-10-30 | 2019-03-22 | 北京国双科技有限公司 | 知识图谱的构建方法及装置 |
CN110019842A (zh) * | 2018-09-30 | 2019-07-16 | 北京国双科技有限公司 | 一种建立知识图谱的方法及装置 |
-
2019
- 2019-09-18 CN CN201910880999.6A patent/CN111475604A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462501A (zh) * | 2014-12-19 | 2015-03-25 | 北京奇虎科技有限公司 | 基于结构化数据的知识图谱构建方法和装置 |
CN106355627A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 一种用于生成知识图谱的方法及系统 |
US20180232443A1 (en) * | 2017-02-16 | 2018-08-16 | Globality, Inc. | Intelligent matching system with ontology-aided relation extraction |
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN109508381A (zh) * | 2018-09-29 | 2019-03-22 | 北京国双科技有限公司 | 知识图谱的处理方法及装置 |
CN110019842A (zh) * | 2018-09-30 | 2019-07-16 | 北京国双科技有限公司 | 一种建立知识图谱的方法及装置 |
CN109508383A (zh) * | 2018-10-30 | 2019-03-22 | 北京国双科技有限公司 | 知识图谱的构建方法及装置 |
Non-Patent Citations (1)
Title |
---|
田萍芳: "《面向云出版的语义关键技术》", 30 April 2015, 武汉大学出版社 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308464A (zh) * | 2020-11-24 | 2021-02-02 | 中国人民公安大学 | 业务流程数据处理方法和装置 |
CN112308464B (zh) * | 2020-11-24 | 2023-11-24 | 中国人民公安大学 | 业务流程数据处理方法和装置 |
CN112883202A (zh) * | 2021-03-26 | 2021-06-01 | 江苏省未来网络创新研究院 | 一种基于知识图谱的多组件建模方法和系统 |
CN113514875A (zh) * | 2021-06-03 | 2021-10-19 | 德仕能源科技集团股份有限公司 | 一种基于大数据的岩性油气藏的勘测和描述方法及系统 |
CN113514875B (zh) * | 2021-06-03 | 2024-04-02 | 德仕能源科技集团股份有限公司 | 一种基于大数据的岩性油气藏的勘测和描述方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Intelligent learning for knowledge graph towards geological data | |
Hor et al. | A semantic graph database for BIM-GIS integrated information model for an intelligent urban mobility web application | |
CN111475604A (zh) | 数据处理方法及装置 | |
CN107798387B (zh) | 一种适用于高端装备全生命周期的知识服务系统及方法 | |
Cacciotti et al. | Monument damage information system (MONDIS): An ontological approach to cultural heritage documentation | |
CN104462227A (zh) | 一种图形化知识谱系自动构建方法 | |
US20160063070A1 (en) | Project time comparison via search indexes | |
CN113191497B (zh) | 一种面向变电站踏勘选址的知识图谱构建方法和系统 | |
CN111625607A (zh) | 油气知识图谱的构建方法、装置、电子设备和存储介质 | |
Shbita et al. | Building spatio-temporal knowledge graphs from vectorized topographic historical maps | |
CN111472763B (zh) | 地层厚度预测方法及装置 | |
Nimmagadda et al. | Big-data integration methodologies for effective management and data mining of petroleum digital ecosystems | |
Kingdon et al. | A geodata warehouse: Using denormalisation techniques as a tool for delivering spatially enabled integrated geological information to geologists | |
Song et al. | Decision-making framework, enhanced by mutual inspection for first-stage dam construction diversion scheme selection | |
Cai et al. | Intelligent recommendation system based on knowledge graph for scientific research teams | |
Liu et al. | OPSDS: a semantic data integration and service system based on domain ontology | |
CN107038172A (zh) | 一种基于语义的油田搜索引擎构建方法 | |
EP3935521A1 (en) | Curating and graphically presenting unstructured data based on analytics | |
Lin et al. | Construction of Fracturing Knowledge Graph and Fracturing Plan Optimization | |
WO2021051909A1 (zh) | 油气数据处理方法及装置 | |
CN117076463B (zh) | 一种智慧城市多源数据汇聚存储系统 | |
Qubian et al. | A Novel High-Speed AI-Physics Hybrid Model to Predict the Reservoir Behavior; A Case Study | |
Wang | Design and Analysis of Geotechnical Engineering Survey Integrated System Based on GIS | |
Xu et al. | The application of GIS in The digital oilfield construction | |
Zhou et al. | The Construction of Knowledge Graph in Reservoir Geology and Its Application in Identifying Hydrocarbon Pay Zone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200731 |
|
RJ01 | Rejection of invention patent application after publication |