CN113051403A - 数据库故障处理知识图谱构建方法、装置和计算机设备 - Google Patents

数据库故障处理知识图谱构建方法、装置和计算机设备 Download PDF

Info

Publication number
CN113051403A
CN113051403A CN201911383002.2A CN201911383002A CN113051403A CN 113051403 A CN113051403 A CN 113051403A CN 201911383002 A CN201911383002 A CN 201911383002A CN 113051403 A CN113051403 A CN 113051403A
Authority
CN
China
Prior art keywords
database
data
database fault
knowledge
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911383002.2A
Other languages
English (en)
Inventor
吴佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201911383002.2A priority Critical patent/CN113051403A/zh
Publication of CN113051403A publication Critical patent/CN113051403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种数据库故障处理知识图谱构建方法、装置、计算机设备和存储介质,从机器认知角度,将知识图谱与数据库故障处理相结合,设计数据库故障处理方法为数据管理提供支撑,推动开发人员的应急协同,实现基于“一张图”的综合应急。本申请还提供一种数据库故障处理信息生成方法、装置、计算机设备和存储介质,通过识别出数据库故障信息中的数据库类型以及数据库故障类型,并结合预先构建的数据库故障处理知识图谱进行推理查询,能够快速查找出对应的数据库故障处理信息,支持数据库故障的快速定位并及时解决故障,减少损失。

Description

数据库故障处理知识图谱构建方法、装置和计算机设备
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据库故障处理知识图谱构建方法、装置、计算机设备和存储介质以及一种数据库故障处理信息生成方法、装置、计算机设备和存储介质。
背景技术
数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、有共享的、统一管理的数据集合。数据库由于其能更合适的组织数据、更方便的维护数据、更严密的控制数据和更有效的利用数据等优点,得到了个人和企业的广泛运用。
当前,在数据库给个人和企业提供了优秀的数据管理服务的同时,也随之产生了一些问题。在数据库运行过程中,若出现数据库的数据文件损坏、数据块损坏或意外掉电等故障,可能将给个人与企业带来巨大的损失。
因此,需要一种能够支持快速处理数据库故障的数据库故障处理数据生成方案。
发明内容
基于此,有必要针对数据库出现故障可能对给个人和企业造成巨大损失的问题,提供一种便利的数据库故障处理知识图谱构建方法、装置、计算机设备和存储介质以及数据库故障处理信息生成方法、装置、计算机设备和存储介质。
一种数据库故障处理知识图谱构建方法,方法包括:
抽取多元数据源中的数据库故障处理数据;
根据预设数据对应关系对数据库故障处理数据进行整合,预设数据对应关系基于各类数据库的数据库故障数据以及数据库故障处理方案构建;
对整合后的数据库处理故障数据进行知识推理,得到知识推理数据;
基于知识推理数据,构建数据库故障处理知识图谱。
在其中一个实施例中,抽取多元数据源中的数据库故障处理数据包括:
基于多元数据源中的内部工单系统的数据库数据、预设个人知识库的沉淀数据以及第三方知识库数据,抽取初始数据库故障处理数据;
采用数据映射方法,将初始数据库故障处理数据转换为预设格式的知识数据,得到数据库故障处理数据。
在其中一个实施例中,数据库故障数据包括数据库故障类型和数据库故障原因,根据预设数据对应关系对数据库故障处理数据进行整合包括:
对数据库故障处理数据进行知识合并,以将数据库故障处理数据整合为符合数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系的数据。
在其中一个实施例中,对整合后的数据库处理故障数据进行知识推理之前,还包括:
通过相似度排名的方式,对数据库处理故障数据进行去重处理。
一种数据库故障处理知识图谱构建装置,装置包括:
知识抽取模块,用于抽取多元数据源中的数据库故障处理数据;
知识整合模块,用于根据预设数据对应关系对数据库故障处理数据进行整合,预设数据对应关系基于各类数据库的数据库故障数据以及数据库故障处理方案构建;
知识推理模块,用于对整合后的数据库处理故障数据进行知识推理,得到知识推理数据;
知识图谱构建模块,用于基于知识推理数据,构建数据库故障处理知识图谱。
一种计算机设备,包括至少一个处理器、至少一个存储器、以及总线;其中,处理器与所述存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述数据库故障处理知识图谱构建方法中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述数据库故障处理知识图谱构建方法中的步骤。
上述数据库故障处理知识图谱构建方法、装置、计算机设备和存储介质,抽取多元数据源中的数据库故障处理数据,根据基于各类数据库的数据库故障数据以及数据库故障处理方案构建的预设数据对应关系对数据库故障处理数据进行整合,进而对整合后的数据库处理故障数据进行知识推理,构建数据库故障处理知识图谱。从机器认知角度,将知识图谱与数据库故障处理相结合,设计了数据库故障处理方法,可为数据管理提供支撑,加强数据库故障处理信息要素间的建模和理解,推动开发人员的应急协同,实现基于“一张图”的综合应急。
一种数据库故障处理信息生成方法,方法包括:
获取数据库故障处理请求,数据库处理请求携带数据库故障信息;
响应数据库故障处理请求,获取数据库故障处理知识图谱、并识别数据库故障信息中的数据库类型以及数据库故障类型;
根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息;
其中,数据库故障处理知识图谱由上述数据库故障处理知识图谱构建方法构建。
在其中一个实施例中,根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息包括:
对数据库类型以及数据库故障类型进行语义解析,得到语义解析结果;
基于语义解析结果,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
一种数据库故障处理信息生成装置,装置包括:
数据请求接收模块,用于获取数据库故障处理请求,数据库处理请求携带数据库故障信息;
数据请求响应模块,用于响应数据库故障处理请求,获取数据库故障处理知识图谱、并识别数据库故障信息中的数据库类型以及数据库故障类型;
推理查询模块,用于根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
一种计算机设备,包括至少一个处理器、至少一个存储器、以及总线;其中,处理器与所述存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述数据库故障处理信息生成方法中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述数据库故障处理信息生成方法中的步骤。
上述数据库故障处理信息生成方法、装置、计算机设备和存储介质,获取携带数据库故障信息的数据库处理请求,识别出数据库故障信息中的数据库类型以及数据库故障类型,并结合预先构建的数据库故障处理知识图谱进行推理查询,能够快速查找出对应的数据库故障处理信息,支持数据库故障的快速定位并及时解决故障,减少损失。
附图说明
图1为一个实施例中数据库故障处理知识图谱构建方法和数据库故障处理信息生成方法的应用环境图;
图2为一个实施例中数据库故障处理知识图谱构建方法的流程示意图;
图3为另一个实施例中构建模型步骤的流程示意图;
图4为一个实施例中数据库故障处理信息生成方法的流程示意图;
图5为另一个实施例中数据库故障处理信息生成方法的流程示意图;
图6为一个实施例中数据库故障处理知识图谱构建装置的结构框图;
图7为另一个实施例中数据库故障处理知识图谱构建装置的结构框图;
图8为一个实施例中数据库故障处理信息生成装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的数据库故障处理知识图谱构建方法和数据库故障处理信息生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与数据库故障处理知识图谱平台的服务器104(以下简称服务器104)通过网络进行通信。具体的,可以是研发人员于终端102的用户图形界面进行操作,通过终端102发送数据库故障处理知识图谱构建请求至服务器104,服务器104接收该数据库故障处理知识图谱构建请求,抽取多元数据源中的数据库故障处理数据,将数据库故障处理数据整合为符合预设数据对应关系的数据,预设数据对应关系基于各类数据库的数据库故障数据以及数据库故障处理方案构建,对整合后的数据库处理故障数据进行知识推理,基于知识推理后的数据库故障处理数据,构建数据库故障处理知识图谱。
当用户通过终端102发送数据库故障处理请求至服务器104时,服务器104获取数据库故障处理请求,数据库处理请求携带数据库故障信息,响应数据库故障处理请求,获取构建后的数据库故障处理知识图谱、并识别数据库故障信息中的数据库类型以及数据库故障类型,根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在其中一个实施例中,如图2所示,提供了一种数据库故障处理知识图谱构建方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S200,抽取多元数据源中的数据库故障处理数据。
在实际应用中,构建知识图谱的原始数据一般都是从不同来源、不同结构的数据(即多元数据源)获取的知识数据。本实施例中多元数据源可以是企业本身的数据管理平台积累的包含不同存储方式的业务数据、内部工单系统数据、个人知识库、以及第三方数据平台提供的数据等。抽取数据库故障处理数据主要包括数据库故障解决方案记录知识实体、实体属性以及实体关系。具体的,数据库故障案例解决方案记录知识实体包括数据库类型、数据库故障类型、数据库故障原因以及数据库故障解决方案等数据。本实施例中,数据库故障处理数据可以分为结构化数据、半结构化数据和非结构化数据,根据数据的不同的结构化形式,采用不同的方法进行处理。结构化数据一般储存于关系型数据库,抽取方法是通过建立数据库中概念与知识图谱中本体的对应关系,以实现从数据库中自动获取实体、属性及关系。对于半结构化知识,如百度百科中的MySQL数据库信息,一般采用基于封装器的方法进行抽取。非结构化数据是无结构的纯文本模式,一般通过已知的实体对未知文本进行自动标注,转为化有监督学习的方法。
在其中一个实施例中,如图3所示,抽取多元数据源中的数据库故障处理数据包括:步骤S220,基于多元数据源中的内部工单系统的数据库数据、预设个人知识库的沉淀数据以及第三方知识库数据,抽取初始数据库故障处理数据,采用数据映射方法,将初始数据库故障处理数据转换为预设格式的知识数据,得到数据库故障处理数据。
工单系统又称为工单管理系统,是一种网络软件系统,根据不同组织,部门和外部客户的需求,来有针对的管理,维护和追踪一系列的问题和请求。本实施例中,内部工单系统配套拥有一个帮助文档知识库,里面包含研发人员处理过的数据库故障案例相关信息,常见数据库故障的处理方式,和一些其他的帮助文档等。个人知识库的沉淀数据即指研发人员个人处理过的数据库故障记录信息等。本实施例中,数据库故障处理数据以结构化数据为例,可以是从关系型数据库中如内部工单系统的数据库数据、预设个人知识库的沉淀数据以及第三方知识库数据抽取出初始数据库故障处理数据,抽取出初始数据库故障处理数据(MySQL数据)之后,可以是采用D2R技术,将初始数据库故障处理数据转换为RDF(Resource Description Framework,资源描述框架)格式的数据,得到三元组数据,再将三元组数据导入预设的数据库故障处理知识图谱数据库中。RDF即资源描述框架,是W3C提倡的一个数据对应关系,用来描述万维网上的资源及其相互间的关系。RDF数据对应关系的核心包括资源(resource)、属性(property)、RDF陈述(RDF statement)等,最核心的就是三元组,即资源——关系——资源。本实施例中,通过内部工单系统的数据库数据、预设个人知识库的沉淀数据以及第三方知识库数据,抽取初始数据库故障处理数据,保障了原始数据的质量,并通过D2R技术,能够快速将抽取出的数据转换为RDF数据。
步骤S400,根据预设数据对应关系对数据库故障处理数据进行整合,预设数据对应关系基于各类数据库的数据库故障数据以及数据库故障处理方案构建。
如上述实施例所述,数据库故障处理数据包括不同数据结构的数据。在获取数据库故障处理数据之后,可以是对每条数据库故障处理方案记录进行识别,识别其中的数据库类型如MySQL,Postgres,mongo,redis,SQL server,Oracle以及DB2等类型,同时,识别数据库故障类型,定义数据库故障处理知识图谱中的故障类型,如数据文件损坏,数据块损坏,系统表空间损坏,控制文件损坏以及日志文件损坏等数据库故障类型,识别出数据库类型及数据库故障类型之后,统计数据库故障处理案例中的故障原因,定义故障源,如意外断电或认为误操作等,统计数据库故障处理案例中的解决方案,定义故障解决方案。如上述方式,整理出数据库类型、数据库故障类型、数据库故障原因以及数据库故障处理方案四个数据实体后,可进一步基于上述四个数据实体构建统一的数据对应关系,将数据库故障处理数据整合为符合预设数据对应关系的数据。本实施例中,预设数据对应关系为关系型数据对应关系,也可称为实体与实体之间的联系。
在其中一个实施例中,如图3所示,根据预设数据对应关系对数据库故障处理数据进行整合包括:步骤S420,对数据库故障处理数据进行知识合并,以将数据库故障处理数据整合为符合数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系的数据。
知识合并主要包括两种形式:第一种,合并外部知识库,其主要处理数据层和模式层的冲突,第二种,合并关系数据库,有RDB2RDF等方法。本实施例中,以合并关系数据库为例,即采用RDB2RDF方法,将数据库故障处理数据整合为符合数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系的数据,即将每一条数据库故障处理数据按照数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系进行规范化处理。本实施例中,将数据库故障处理数据整合为符合数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系的数据,能够使得数据库故障处理知识图谱在用户输入的搜索关键字中包含数据库类型或数据库故障原因或数据库故障类型中任一项字段时,自动检索出相应的数据库故障解决方案,同时还给出对应的数据库类型、数据库故障类型或数据库故障原因信息。
步骤S600,对整合后的数据库处理故障数据进行知识推理,得到知识推理数据。
知识推理即指根据已有的知识,得出新的知识或新的结论的过程。知识推理包括对实体关系的推理和对实体属性的推理两个部分,前者是对实体间潜在的关系进行推断和理解,后者则是对实体的属性值进行推理和更新。知识推理一般采用基于图或逻辑的推理方法。本实施例中,在构建一个数据库故障处理知识图谱的雏形后,知识图谱中很多数据关系都是残缺的,可采用知识推理技术,完善知识数据间的关系。本实施例中,对整合后的数据库处理故障数据进行知识推理即根据图谱提供的数据库故障处理数据得到更多隐含的知识,具体可包括通过本体或者规则推理技术可以获取数据库处理故障数据中存在的隐含知识,通过链接预测预测实体间隐含的关系,提供知识间关联的路径等,得到知识推理数据。
步骤S800,基于知识推理数据,构建数据库故障处理知识图谱。
知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到data级别,聚合大量知识,从而实现知识的快速响应和推理。在得到知识推理数据之后,可将知识推理数据对应于预设的本体模型存入数据库故障处理知识图谱的数据层,然后进行质量评估和知识更新,构建数据库故障处理知识图谱。
上述数据库故障处理知识图谱构建方法,抽取多元数据源中的数据库故障处理数据,根据基于各类数据库的数据库故障数据以及数据库故障处理方案构建的预设数据对应关系对数据库故障处理数据进行整合,进而对整合后的数据库处理故障数据进行知识推理,构建数据库故障处理知识图谱。从机器认知角度,将知识图谱与数据库故障处理相结合,设计了数据库故障处理方法,可为数据管理提供支撑,加强数据库故障处理信息要素间的建模和理解,推动开发人员的应急协同,真正实现基于“一张图”的综合应急。
在其中一个实施例中,对整合后的数据库处理故障数据进行知识推理之前,还包括:通过相似度排名的方式,对数据库处理故障数据进行去重处理。
在实际应用中,整合后的数据库处理故障数据可能还存在大量冗余和错误的信息。同一个命名实体可能包含多种形式的表达,同时一个名词可能从字面意思上对应多种命名实体。例如,“损坏”可能对应有“破坏”“毁坏”等命名实体。若用名称来识别指定的命名实体,则可能会导致名称模糊。因此,可采用余弦相似度方法,计算各实体之间的相似度,根据相似度的排名,判断实体是否重合,若重合,则去除该实体。可以理解的是,相似度计算方法还可以是其他算法,具体可根据情况进行选择,在此不做限定。本实施例中,通过相似度排名的方式,对数据库处理故障数据进行去重处理,能够消除实体歧义和矛盾,减少数据冗余。
在其中一个实施例中,如图4所示,提供了一种数据库故障处理信息生成方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S900,获取数据库故障处理请求,数据库处理请求携带数据库故障信息。
在实际应用中,可以是用户于终端102登录数据库故障处理知识图谱管理系统,通过对该管理系统进行相应操作生成数据库故障处理请求,并将该请求发送至服务器104。数据库故障信息的形式可以包括日志数据文件以及用户输入的查询语句或关键词等。具体实施时,当某个数据库发生故障时,若用户不明确数据库故障类型以及故障原因,可以到系统日志中复制相应的数据库报错的日志数据,并将该日志数据粘贴至数据库故障处理知识图谱管理系统中的对应的输入框,通过点击“搜索”按钮生成数据库故障处理请求。若用户明确数据库故障类型(如数据文件损坏或数据块损坏)或故障原因(人为误操作),则可在数据库故障处理知识图谱管理系统中的对应的输入框输入包括数据库类型数据库故障原因或故障类型的查询语句,通过点击“搜索”按钮生成数据库故障处理请求。
步骤S920,响应数据库故障处理请求,获取数据库故障处理知识图谱、并识别数据库故障信息中的数据库类型以及数据库故障类型。
具体实施时,数据库故障处理知识图谱由上述数据库故障处理知识图谱构建方法构建得到。在获取到数据库故障处理请求之后,响应该请求,可通过接口调用的方式,获取该数据库故障处理知识图谱,同时,识别出数据库故障信息中的数据库类型以及数据库故障类型,数据库类型可包括MySQL、mongo SQL server,Oracle等,数据库故障类型可包括数据文件损坏,数据块损坏,系统表空间损坏,控制文件损坏以及日志文件损坏等。
步骤S940,根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
当识别出数据库类型以及数据库故障类型之后,可根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,查询出相关的数据库故障处理方案及故障原因等一系列相关的知识数据,生成对应的数据库故障处理信息。
在其中一个实施例中,如图5所示,根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息包括:步骤S942,对数据库类型以及数据库故障类型进行语义解析,得到语义解析结果,基于语义解析结果,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
当前,基于模板问答、语义解析或深度学习是进行知识问答主流方法之一。本实施例中,以基于语义解析的方式进行知识问答为例,在识别出数据库类型以及数据库故障类型之后,对数据库类型以及数据库故障类型进行语义解析,得到数据库故障处理知识图谱能够识别的语义表示(逻辑表达式)。具体的,语义解析过程包括资源映射、逻辑表达式、候选答案生成以及排序。资源映射将自然语言短语或单词节点映射到数据库故障处理知识图谱的实体或实体关系。更具体的,可以通过构造一个词汇表来完成资源映射,而后通过逻辑表达式解决文本的歧义。逻辑表达式可以表示知识图谱中的实体以及实体关系,并且可以像数据库语言一样,进行连接和聚合等操作。当得到逻辑表示式后,根据逻辑表达式在数据库故障处理知识图谱进行推理查询,得到相应的候选答案即数据库故障处理方案,再将数据库故障处理方案进行排序,生成对应的数据库故障处理信息。进一步的,还可将生成的数据库故障处理信息推送至用户终端。可以理解的是,在其他实施例中,可采用模板问答的方式或深度学习的方式进行知识问答,给出数据库故障处理信息。本实施例中,通过语义解析的方式,能够快速且便捷地匹配出相应的数据库故障处理信息。
上述数据库故障处理信息生成方法中,获取携带数据库故障信息的数据库处理请求,识别出数据库故障信息中的数据库类型以及数据库故障类型,并结合预先构建的数据库故障处理知识图谱进行推理查询,能够快速查找出对应的数据库故障处理信息,支持数据库故障的快速定位并及时解决故障,减少损失。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在其中一个实施例中,如图6所示,提供了一种数据库故障处理知识图谱构建装置,包括:知识抽取模块610、知识整合模块620、知识推理模块630以及知识图谱构建模块640,其中:
知识抽取模块610,用于抽取多元数据源中的数据库故障处理数据。
知识整合模块620,用于根据预设数据对应关系对数据库故障处理数据进行整合。
知识推理模块630,用于对整合后的数据库处理故障数据进行知识推理,得到知识推理数据。
知识图谱构建模块640,用于基于知识推理数据,构建数据库故障处理知识图谱。
在其中一个实施例中,知识抽取模块610还用于基于多元数据源中的内部工单系统的数据库数据、预设个人知识库的沉淀数据以及第三方知识库数据,抽取初始数据库故障处理数据,采用D2R技术,将初始数据库故障处理数据转换为RDF数据,得到数据库故障处理数据。
在其中一个实施例中,知识整合模块620还用于对数据库故障处理数据进行知识合并,以将数据库故障处理数据整合为符合数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系的数据。
在其中一个实施例中,如图7所示,数据库故障处理知识图谱构建装置还包括知识去重模块650,用于通过相似度排名的方式,对数据库处理故障数据进行去重处理。
在其中一个实施例中,如图8所示,提供了一种数据库故障处理信息生成装置,装置包括:数据请求接收模块810、数据请求响应模块820以及推理查询模块830,其中:
数据请求接收模块810,用于获取数据库故障处理请求,数据库处理请求携带数据库故障信息;
数据请求响应模块820,用于响应数据库故障处理请求,获取数据库故障处理知识图谱、并识别数据库故障信息中的数据库类型以及数据库故障类型;
推理查询模块830,用于根据数据库类型以及数据库故障类型,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
在其中一个实施例中,推理查询模块830还用于对数据库类型以及数据库故障类型进行语义解析,得到语义解析结果,基于语义解析结果,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
关于数据库故障处理知识图谱构建装置和数据库故障处理信息生成装置的具体限定可以分别参见上文中对于数据库故障处理知识图谱构建方法和数据库故障处理信息生成方法的限定,在此不再赘述。上述数据库故障处理知识图谱构建装置和数据库故障处理信息生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在其中一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力,调用存储器的计算机程序。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据库故障处理数据以及数据库故障处理知识图谱等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据库故障处理方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在其中一个实施例中,提供了一种计算机设备,包括至少一个处理器、至少一个存储器、以及总线;其中,处理器与存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,该处理器执行计算机程序时实现上述数据库故障处理知识图谱构建方法以及数据库故障处理信息生成方法中的步骤。
在其中一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述数据库故障处理知识图谱构建方法以及数据库故障处理信息生成方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据库故障处理知识图谱构建方法,所述方法包括:
抽取多元数据源中的数据库故障处理数据;
根据预设数据对应关系对所述数据库故障处理数据进行整合,所述预设数据对应关系基于各类型数据库的数据库故障数据以及数据库故障处理方案构建;
对整合后的所述数据库处理故障数据进行知识推理,得到知识推理数据;
基于所述知识推理数据,构建数据库故障处理知识图谱。
2.根据权利要求1所述的数据库故障处理知识图谱构建方法,其特征在于,所述抽取多元数据源中的数据库故障处理数据包括:
基于所述多元数据源中的内部工单系统的数据库数据、预设个人知识库的沉淀数据以及第三方知识库数据,抽取初始数据库故障处理数据;
采用数据映射方法,将所述初始数据库故障处理数据转换为预设格式的知识数据,得到数据库故障处理数据。
3.根据权利要求1所述的数据库故障处理知识图谱构建方法,其特征在于,所述数据库故障数据包括数据库故障类型和数据库故障原因,所述根据预设数据对应关系对所述数据库故障处理数据进行整合包括:
对所述数据库故障处理数据进行知识合并,以将所述数据库故障处理数据整合为符合数据库类型-数据库故障类型-数据库故障原因-数据库故障处理方案的对应关系的数据。
4.根据权利要求1所述的数据库故障处理知识图谱构建方法,其特征在于,所述对整合后的所述数据库处理故障数据进行知识推理之前,还包括:
通过相似度排名的方式,对所述数据库处理故障数据进行去重处理。
5.一种数据库故障处理信息生成方法,所述方法包括:
获取数据库故障处理请求,所述数据库处理请求携带数据库故障信息;
响应所述数据库故障处理请求,获取数据库故障处理知识图谱、并识别所述数据库故障信息中的数据库类型以及数据库故障类型;
根据所述数据库类型以及所述数据库故障类型,在所述数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息;
其中,所述数据库故障处理知识图谱由上述权利要求1至4中任一项所述的数据库故障处理知识图谱构建方法构建。
6.根据权利要求5所述的数据库故障处理方法,其特征在于,所述根据所述数据库类型以及所述数据库故障类型,在所述数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息包括:
对所述数据库类型以及所述数据库故障类型进行语义解析,得到语义解析结果;
基于语义解析结果,在数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
7.一种数据库故障处理知识图谱构建装置,其特征在于,所述装置包括:
知识抽取模块,用于抽取多元数据源中的数据库故障处理数据;
知识整合模块,用于根据预设数据对应关系对所述数据库故障处理数据进行整合,所述预设数据对应关系基于各类数据库的数据库故障数据以及数据库故障处理方案构建;
知识推理模块,用于对整合后的所述数据库处理故障数据进行知识推理,得到知识推理数据;
知识图谱构建模块,用于基于知识推理数据,构建数据库故障处理知识图谱。
8.一种数据库故障处理信息生成装置,其特征在于,所述装置包括:
数据请求接收模块,用于获取数据库故障处理请求,所述数据库处理请求携带数据库故障信息;
数据请求响应模块,用于响应所述数据库故障处理请求,获取数据库故障处理知识图谱、并识别所述数据库故障信息中的数据库类型以及数据库故障类型;
推理查询模块,用于根据所述数据库类型以及所述数据库故障类型,在所述数据库故障处理知识图谱中进行推理查询,生成对应的数据库故障处理信息。
9.一种计算机设备,其特征在于,包括至少一个处理器、至少一个存储器、以及总线;其中,所述处理器与所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1-4或5-6中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4或5-6中任一项所述的方法的步骤。
CN201911383002.2A 2019-12-27 2019-12-27 数据库故障处理知识图谱构建方法、装置和计算机设备 Pending CN113051403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911383002.2A CN113051403A (zh) 2019-12-27 2019-12-27 数据库故障处理知识图谱构建方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911383002.2A CN113051403A (zh) 2019-12-27 2019-12-27 数据库故障处理知识图谱构建方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN113051403A true CN113051403A (zh) 2021-06-29

Family

ID=76507127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911383002.2A Pending CN113051403A (zh) 2019-12-27 2019-12-27 数据库故障处理知识图谱构建方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN113051403A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691889A (zh) * 2022-04-15 2022-07-01 中北大学 一种道岔转辙机故障诊断知识图谱构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105429826A (zh) * 2015-12-25 2016-03-23 北京奇虎科技有限公司 一种数据库集群的故障检测方法和装置
WO2019047070A1 (zh) * 2017-09-06 2019-03-14 富璟科技(深圳)有限公司 一种数据库维护方法及其系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105429826A (zh) * 2015-12-25 2016-03-23 北京奇虎科技有限公司 一种数据库集群的故障检测方法和装置
WO2019047070A1 (zh) * 2017-09-06 2019-03-14 富璟科技(深圳)有限公司 一种数据库维护方法及其系统
CN110088744A (zh) * 2017-09-06 2019-08-02 富璟科技(深圳)有限公司 一种数据库维护方法及其系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李新鹏;徐建航;郭子明;李军良;宁文元;王震学;: "调度自动化系统知识图谱的构建与应用", 中国电力, no. 02 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691889A (zh) * 2022-04-15 2022-07-01 中北大学 一种道岔转辙机故障诊断知识图谱构建方法
CN114691889B (zh) * 2022-04-15 2024-04-12 中北大学 一种道岔转辙机故障诊断知识图谱构建方法

Similar Documents

Publication Publication Date Title
CN110291517B (zh) 图数据库中的查询语言互操作性
CN107402995B (zh) 一种分布式newSQL数据库系统及方法
Beheshti et al. Datasynapse: A social data curation foundry
CN107391677B (zh) 携带实体关系属性的中文通用知识图谱的生成方法及装置
CN111339421B (zh) 基于云技术的信息搜索的方法、装置、设备及存储介质
CN108563734B (zh) 制度信息查询方法、装置、计算机设备和存储介质
JP2017513134A (ja) オントロジーマッピング方法及び装置
US20190272478A1 (en) Generating feature vectors from rdf graphs
US20170068891A1 (en) System for rapid ingestion, semantic modeling and semantic querying over computer clusters
CN110275919B (zh) 数据集成方法及装置
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN112559526A (zh) 数据表导出方法、装置、计算机设备及存储介质
CN112445813A (zh) 一种企业服务门户平台搜索语义分析方法
Huaman et al. Knowledge graph curation: a practical framework
Ma et al. A novel data integration framework based on unified concept model
Benny et al. Hadoop framework for entity resolution within high velocity streams
CN113051403A (zh) 数据库故障处理知识图谱构建方法、装置和计算机设备
Liu et al. A general multi-source data fusion framework
CN116414961A (zh) 基于军事领域知识图谱的问答方法和系统
Salam et al. Automatic event coding framework for spanish political news articles
CN115510116A (zh) 数据目录构建方法、装置、介质及设备
Wang et al. A scalable parallel chinese online encyclopedia knowledge denoising method based on entry tags and spark cluster
CN114648121A (zh) 一种数据处理方法、装置、电子设备和存储介质
Kuznetsov Scientific data integration system in the linked open data space
Sachdeva et al. Comparison of data processing tools in hadoop

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination