CN117272399B - 一种数据库融合管理方法、装置及存储介质 - Google Patents
一种数据库融合管理方法、装置及存储介质 Download PDFInfo
- Publication number
- CN117272399B CN117272399B CN202311567488.1A CN202311567488A CN117272399B CN 117272399 B CN117272399 B CN 117272399B CN 202311567488 A CN202311567488 A CN 202311567488A CN 117272399 B CN117272399 B CN 117272399B
- Authority
- CN
- China
- Prior art keywords
- metadata
- unstructured data
- management
- data
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims abstract description 200
- 230000004927 fusion Effects 0.000 title claims abstract description 49
- 238000013500 data storage Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 11
- 238000004806 packaging method and process Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 96
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007906 compression Methods 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 9
- 238000012790 confirmation Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 7
- 238000002595 magnetic resonance imaging Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000003190 augmentative effect Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据库融合管理方法、装置及存储介质,该方法包括:获取元数据在数据字典的当前属性项,将当前属性项封装在一个访问接口中;获取访问接口处理的SQL语句,获取SQL语句的操作对象和调用函数,判断操作对象是否为元数据,同时判断调用函数是否为管理函数;如果操作对象为元数据且调用函数为管理函数,就在数据字典中,获取元数据对应的存储位置信息、存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;定位存储位置信息对应的存储位置;在存储位置中读取元数据对应的非结构化数据,通过密钥解密读取到的非结构化数据,对解密后的非结构化数据执行目标管理操作。本申请有利于提高非结构化数据的管理效率。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据库融合管理方法、装置及存储介质。
背景技术
当今互联网时代,非结构化数据不断增长,为了满足非结构化数据的存储需求,会将非结构化数据存储在分布式存储系统上。
然而,现有技术无法通过关系数据库管理非结构化数据,不利于提高非结构化数据的管理效率。其原因在于,当前常见的做法是将非结构化数据存储在分布式存储系统上。这种做法,会让非结构化数据存在数据孤岛的问题,因此,现有技术不能通过关系数据库管理非结构化数据,不利于提高非结构化数据的管理效率。
发明内容
本申请实施例提供一种数据库融合管理方法、装置及存储介质,以解决上述现有技术无法通过关系数据库管理非结构化数据,不利于提高非结构化数据的管理效率的技术问题。
第一方面,本申请实施例提供了一种数据库融合管理方法,应用于服务端设备,所述服务端设备连接关系数据库,所述关系数据库包括多个管理函数,所述数据库融合管理方法包括:
所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中;
获取所述元数据在所述数据字典的当前属性项,将所述当前属性项封装在一个访问接口中,所述访问接口为访问所述元数据的接口;
获取所述访问接口处理的SQL语句,获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数;
如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典中,获取所述元数据对应的存储位置信息、所述存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;
通过所述服务地址,连接所述非结构化数据存储系统,对所述非结构化数据存储系统进行访问操作;
在所述访问操作通过所述非结构化数据存储系统的鉴权后,在所述非结构化数据存储系统中定位所述存储位置信息对应的存储位置;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作。
作为一个可选的实施方式,所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中,包括:
所述服务端设备获取非结构化数据,提取所述非结构化数据的关键信息,将提取出来的所述关键信息转化为结构化数据;
将所述结构化数据设为所述关系数据库的元数据,将所述元数据存储在所述关系数据库的数据字典中。
作为一个可选的实施方式,所述将所述结构化数据设为所述关系数据库的元数据,将所述元数据存储在所述关系数据库的数据字典中,包括:
将所述结构化数据设为所述关系数据库的元数据,建立所述非结构化数据与所述元数据之间的对应关系;
将所述对应关系以及所述元数据存储在所述关系数据库的数据字典中。
作为一个可选的实施方式,所述在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作,包括:
在预先建立的所述管理函数与管理事件的对应关系中,获取所述管理函数对应的所述管理事件;
将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,根据所述目标管理事件中的操作指令,对解密后的所述非结构化数据执行目标管理操作。
作为一个可选的实施方式,所述将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件,包括:
将所述管理函数对应的所述管理事件显示在所述服务端设备的管理事件创建界面上;
通过所述管理事件创建界面获取用户操作指令,判断所述用户操作指令是否为确认指令;
如果所述用户操作指令为所述确认指令,就将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件。
作为一个可选的实施方式,所述数据字典包括所述元数据和所述存储位置信息的对应关系,还包括所述存储位置信息和所述密钥的对应关系。
作为一个可选的实施方式,所述目标管理操作包括加密操作、压缩操作、去重操作、识别操作中的其中一种或其组合,所述识别操作包括证件识别操作、合同识别操作、人脸识别操作中的其中一种或其组合。
第二方面,本申请实施例还提供了一种数据库融合管理装置,所述数据库融合管理装置包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行上述的数据库融合管理方法。
第三方面,本申请实施例还提供了一种设备,所述设备包括如上述的数据库融合管理装置。
第四方面,本申请实施例还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序被处理器执行时使所述处理器实现上述的数据库融合管理方法。
本申请实施例提供了一种数据库融合管理方法、装置及存储介质,方法包括:
所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中;
获取所述元数据在所述数据字典的当前属性项,将所述当前属性项封装在一个访问接口中,所述访问接口为访问所述元数据的接口;
获取所述访问接口处理的SQL语句,获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数;
如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典中,获取所述元数据对应的存储位置信息、所述存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;
通过所述服务地址,连接所述非结构化数据存储系统,对所述非结构化数据存储系统进行访问操作;
在所述访问操作通过所述非结构化数据存储系统的鉴权后,在所述非结构化数据存储系统中定位所述存储位置信息对应的存储位置;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作。
本申请实施例有益效果在于以下三方面,详述如下:
第一方面,非结构化数据访问的技术栈为SQL协议,降低技术复杂度,提高开发效率;第二方面,将非结构化数据融合进关系数据库中进行管理,方便用户管理非结构化数据,消除了数据孤岛,能减少非结构化数据的存储成本,实现降本增效的目的;第三方面,在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作,因此能通过关系数据库管理非结构化数据,有利于提高非结构化数据的管理效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的数据库融合管理方法的流程示意图;
图2为本申请实施例提供的存储元数据的流程图;
图3为本申请实施例提供的关联非结构化数据与元数据的流程图;
图4为本申请实施例提供的数据库融合管理方法的应用场景图;
图5为本申请实施例提供的数据库融合管理方法的示意性框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在部分实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
请参阅图1,图1是本申请实施例提供的数据库融合管理方法的流程示意图,该方法可以应用于服务端设备。服务端设备与客户端设备通信连接。其中,服务端设备可以是服务端、手机、相机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、个人计算机(personal computer,PC)、上网本、个人数字助理(personal digital assistant,PDA)中任一者,本申请实施例中不作任何限制。
如图1所示,本申请实施例提供的数据库融合管理方法包括以下步骤,详述如下:
S101,所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中;
其中,所述服务端设备获取非结构化数据,包括:
服务端设备获取客户端设备的接入请求,所述接入请求为所述客户端设备接入所述服务端设备时发送的请求;
根据所述接入请求,通过网络与客户端设备建立数据传输通道,通过数据传输通道获取所述客户端设备上传的未存储数据以及所述未存储数据的数据类型;
判断所述未存储数据的数据类型是否为预设类型;
如果所述未存储数据的数据类型为预设类型,就确定所述未存储数据为非结构化数据。
其中,网络包括WIFI网络、以太网、2G网络、3G网络、4G网络、5G网络中的其中一种或其组合。
其中,所述预设类型包括文本类型、图片类型、音频类型、视频类型中的其中一种或其组合。
其中,所述服务端设备连接关系数据库,所述关系数据库包括多个管理函数。客户端设备可以通过管理函数对元数据对应的非结构化数据执行目标管理操作。
S102,获取所述元数据在所述数据字典的当前属性项,将所述当前属性项封装在一个访问接口中,所述访问接口为访问所述元数据的接口;
需说明的是,S102,包括:
获取所述元数据在所述数据字典的当前属性项以及所述当前属性项对应的属性内容;
判断所述元数据对应的预定义属性项是否包括所述当前属性项;
如果所述元数据对应的预定义属性项包括所述当前属性项,就在预先建立的所述预定义属性项与预设接口的对应关系中,调取所述预定义属性项对应的所述预设接口,将所述预定义属性项对应的所述预设接口设置为所述当前属性项对应的所述访问接口,将所述当前属性项对应的属性内容封装在所述访问接口中,所述访问接口为访问所述元数据的接口。这样的技术效果是能利用所述预定义属性项对应的所述预设接口,来设置访问所述元数据的接口,能减少设置时间,提高访问所述元数据的接口的设置效率。
其中,所述元数据的当前属性项包括类型、位置属性、访问模式、时间。
其中,当所述当前属性项为类型时,类型对应的属性内容为数据类型标识。
其中,当所述当前属性项为位置属性时,位置属性对应的属性内容为关系数据库的位置标识。
其中,当所述当前属性项为访问模式时,访问模式对应的属性内容为读访问方式、写访问方式、读写访问方式。
其中,当所述当前属性项为时间时,时间对应的属性内容为创建时间。
其中,数据类型标识包括文本类型的标识、图片类型的标识、音频类型的标识、视频类型的标识中的其中一种或其组合。
需说明的是,获取所述元数据在所述数据字典的当前属性项以及所述当前属性项对应的属性内容,包括:
获取所述元数据在所述数据字典的当前属性项;
获取所述元数据的元数据类型,在所述当前属性项对应的属性内容中定位所述元数据类型对应的截取位置,从截取位置开始截取目标长度为所述元数据类型的对应长度的所述属性内容。
其中,元数据类型包括技术元数据、业务元数据、操作元数据、管理元数据中的其中一种或其组合。
元数据类型用于表示元数据的类型。元数据类型和元数据之间的对应关系为一一对应,不同的元数据类型对应不同的元数据。
其中,技术元数据、业务元数据、操作元数据、管理元数据的截取位置分别数据类型标识、数据类型标识、位置属性、位置属性。
其中,技术元数据、业务元数据、操作元数据、管理元数据的对应长度分别6KB、6KB、8KB、8KB。
为便于说明,举例如下:
比如,所述元数据的元数据类型为技术元数据,在所述当前属性项对应的属性内容中定位所述技术元数据对应的截取位置为数据类型标识,从数据类型标识开始截取目标长度为6KB的所述属性内容。
比如,所述元数据的元数据类型为业务元数据,在所述当前属性项对应的属性内容中定位所述业务元数据对应的截取位置为数据类型标识,从数据类型标识开始截取目标长度为6KB的所述属性内容。
比如,所述元数据的元数据类型为操作元数据,在所述当前属性项对应的属性内容中定位所述操作元数据对应的截取位置为位置属性,从位置属性开始截取目标长度为8KB的所述属性内容。
比如,所述元数据的元数据类型为管理元数据,在所述当前属性项对应的属性内容中定位所述管理元数据对应的截取位置为位置属性,从位置属性开始截取目标长度为8KB的所述属性内容。
S103,获取所述访问接口处理的SQL语句,获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数;
其中,非结构化数据的元数据为所述非结构化数据的数据描述。
需说明的是,S103,包括:
接收客户端设备发送的管理请求,所述管理请求携带有用户身份信息和SQL语句;
从所述管理请求中获取用户身份信息,从所述SQL语句中的一个或者多个关键字中获取所述SQL语句的目标接口;
判断用户身份信息是否为预设身份信息,同时判断SQL语句的目标接口是否为所述访问接口;
如果所述用户身份信息为所述预设身份信息且所述SQL语句的目标接口为所述访问接口,就获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数。
其中,SQL的英文全称为:Structured Query Language,SQL的中文全称为:结构化查询语言。
S104,如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典中,获取所述元数据对应的存储位置信息、所述存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;
需说明的是,S104,包括:
如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典的位置目录中获取所述元数据对应的存储位置信息,在所述数据字典的密钥目录中所述存储位置信息对应的密钥,在所述数据字典的地址目录中非结构化数据存储系统的服务地址。
其中,所述数据字典包括位置目录、密钥目录和地址目录。
其中,密钥目录为存放多个密钥的目录。
其中,位置目录为存放多个位置的目录。
其中,地址目录为存放多个服务地址的目录。
其中,所述数据字典包括所述元数据和所述存储位置信息的对应关系,还包括所述存储位置信息和所述密钥的对应关系。
S105,通过所述服务地址,连接所述非结构化数据存储系统,对所述非结构化数据存储系统进行访问操作;
S106,在所述访问操作通过所述非结构化数据存储系统的鉴权后,在所述非结构化数据存储系统中定位所述存储位置信息对应的存储位置;
其中,非结构化数据存储系统为存储非结构化数据的系统。
其中,为了数据安全,非结构化数据存储系统会将非结构化数据进行加密,再存储加密后的非结构化数据。
S107,在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作。
其中,所述在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作,包括:
在预先建立的所述管理函数与管理事件的对应关系中,获取所述管理函数对应的所述管理事件;
将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,根据所述目标管理事件中的操作指令,对解密后的所述非结构化数据执行目标管理操作。
其中,所述将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件,包括:
将所述管理函数对应的所述管理事件显示在所述服务端设备的管理事件创建界面上;
通过所述管理事件创建界面获取用户操作指令,判断所述用户操作指令是否为确认指令;
如果所述用户操作指令为所述确认指令,就将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件。
其中,所述目标管理操作包括加密操作、压缩操作、去重操作、识别操作中的其中一种或其组合,所述识别操作包括证件识别操作、合同识别操作、人脸识别操作中的其中一种或其组合。
其中,证件识别操作是识别当前证件是否为目标证件的操作。
其中,合同识别操作是识别当前合同是否为目标合同的操作。
其中,人脸识别操作是识别当前人脸是否为目标人脸的操作。
其中,本申请实施例对非结构化数据进行加密操作、压缩操作、去重操作、识别操作,能保证数据的安全性,完成了存储空间的节省和数据的分类管理,丰富非结构化数据的存储方式,增强了非结构化数据的存储能力。
其中,设计管理函数来实现对非结构化数据的读写、加密、压缩、解析、分类和去重等操作,详述如下:
管理函数包括读取非结构化数据的函数、将写入非结构化数据写入表中的函数、对指定ID的非结构化数据进行加密的函数、对指定ID的非结构化数据进行压缩的函数、对指定ID的非结构化数据进行解析的函数、对指定ID的非结构化数据进行分类的函数、对指定ID的非结构化数据进行去重操作的函数中的其中一种或其组合。
其中,读取非结构化数据的函数为ReadUnstructuredData(ID),其技术作用是根据ID读取非结构化数据。ReadUnstructuredData表示非结构化数据的目标管理操作为读取操作。
其中,将写入非结构化数据写入表中的函数为WriteUnstructuredData(Data,Type),其技术作用是将非结构化数据写入表中。WriteUnstructuredData表示非结构化数据的目标管理操作为写入操作。
其中,UnstructuredData为非结构化数据,为便于说明,简写为:Data。
其中,对指定ID的非结构化数据进行加密的函数为EncryptData(ID),其技术作用是对指定ID的非结构化数据进行加密。EncryptData表示非结构化数据的目标管理操作为加密操作。
在加密过程中,使用对称加密算法对非结构化数据进行加密,使用非对称加密算法对上述对称加密算法的密钥进行加密。密钥的管理采用二级密钥管理机制,管理粒度为对象存储的存储位置,也是业务角度的对象隔离机制。
对称加密算法可以为用户指定或系统默认,在此不做限制。
非对称加密算法可以为用户指定或系统默认,在此不做限制。
其中,对指定ID的非结构化数据进行压缩的函数为CompressData(ID),其技术作用是对指定ID的非结构化数据进行压缩。CompressData表示非结构化数据的目标管理操作为压缩操作。
在压缩过程中,使用压缩算法对非结构化数据进行压缩。压缩算法可以为用户指定或系统默认,在此不做限制。
其中,对指定ID的非结构化数据进行解析的函数为ParseData(ID),其技术作用是对指定ID的非结构化数据进行解析。ParseData表示非结构化数据的目标管理操作为解析操作。
其中,对指定ID的非结构化数据进行分类的函数为CategorizeData(ID, Type),其技术作用是对指定ID的非结构化数据进行分类,确定指定ID的非结构化数据所属的类型。Type表示类型。CategorizeData表示非结构化数据的目标管理操作为分类操作。
在分类的过程中,使用机器学习算法对非结构化数据进行分类。分类数据作为元数据存储。机器学习算法包括但不限于决策树、神经网络、支持向量机。
对指定ID的非结构化数据进行去重操作的函数为DeduplicateData(ID),其技术作用是对指定ID的非结构化数据进行去重操作。在去重操作的过程中,解析使用哈希算法对压缩后的数据进行去重。DeduplicateData表示非结构化数据的目标管理操作为去重操作。
本申请实施例有益效果在于以下三方面,详述如下:
第一方面,非结构化数据访问的技术栈为SQL协议,降低技术复杂度,提高开发效率;
第二方面,将非结构化数据融合进关系数据库中进行管理,方便用户管理非结构化数据,消除了数据孤岛,能减少非结构化数据的存储成本,实现降本增效的目的;
第三方面,在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作,因此能通过关系数据库管理非结构化数据,有利于提高非结构化数据的管理效率。
请参阅图2,图2为本申请实施例提供的存储元数据的流程图,详述如下:
S201,所述服务端设备获取非结构化数据,提取所述非结构化数据的关键信息,将提取出来的所述关键信息转化为结构化数据;
其中,所述非结构化数据的关键信息包括文本信息、图片信息、音频信息、视频信息中的其中一种或其组合;
所述文本信息包括文本的标题、作者、发布时间、有效期;
所述图片信息包括图片的尺寸、格式;
所述音频信息包括音频的时长、编码方式;
所述视频信息包括视频的分辨率、帧率。
S202,将所述结构化数据设为所述关系数据库的元数据,将所述元数据存储在所述关系数据库的数据字典中。
在本申请实施例中,将所述元数据存储在所述关系数据库的数据字典中,后续通过关系数据库的数据字典直接查询到元数据,简化了元数据的查询过程,有利于提高元数据的查询效率。
请参阅图3,图3为本申请实施例提供的关联非结构化数据与元数据的流程图,详述如下:
S301,将所述结构化数据设为所述关系数据库的元数据,建立所述非结构化数据与所述元数据之间的对应关系;
S302,将所述对应关系以及所述元数据存储在所述关系数据库的数据字典中。
在本申请实施例中,建立所述非结构化数据与所述元数据之间的对应关系,后续通过元数据查找到非结构化数据,方便管理非结构化数据。
请参阅图4,图4为本申请实施例提供的数据库融合管理方法的应用场景图,详述如下:
数据库融合管理方法的应用场景包括网站的内容管理、企业的文档管理、医院的医疗图像管理、金融机构的金融数据管理中的其中一种或其组合。
其中,不同的应用场景,需要融合进关系数据库的非结构化数据不同。为便于说明,举例如下:
1.当数据库融合管理方法的应用场景为网站的内容管理时,需要融合的非结构化数据包括文章、图片、音频、视频中的其中一种或其组合。
客户端设备将网站上的文章、图片、音频、视频上传到服务端设备,服务端设备将文章、图片、音频、视频融合进关系数据库中进行管理。
2.当数据库融合管理方法的应用场景为企业的文档管理时,需要融合的非结构化数据包括文档、图片、音频、视频中的其中一种或其组合。
客户端设备将企业内部的文档、图片、音频、视频上传到服务端设备,服务端设备将文档、图片、音频、视频融合进关系数据库中进行管理。
3.当数据库融合管理方法的应用场景为医院的医疗图像管理时,需要融合的非结构化数据包括X光片、CT图像、MRI图像中的其中一种或其组合。
客户端设备将医院的X光片、CT图像、MRI图像上传到服务端设备,服务端设备将X光片、CT图像、MRI图像融合进关系数据库中进行管理。
其中,MRI的英文全称为:Magnetic Resonance Imaging,MRI的中文全称为:磁共振成像。
其中,CT的英文全称为:Computed Tomography,CT的中文全称为:电子计算机断层扫描。
4. 当数据库融合管理方法的应用场景为金融机构的金融数据管理时,需要融合的非结构化数据包括交易记录、证券报价、财务报表中的其中一种或其组合。
客户端设备将金融机构的交易记录、证券报价、财务报表上传到服务端设备,服务端设备将交易记录、证券报价、财务报表融合进关系数据库中进行管理。
在本申请实施例中,通过关系数据库管理不同的应用场景的非结构化数据,有利于提高非结构化数据的管理效率。
请参阅图5,图5为本申请实施例提供的数据库融合管理装置的示意性框图。
如图5所示,该数据库融合管理装置200可以包括处理器211和存储器212,处理器211和存储器212通过总线连接,该总线比如为I2C(Inter-integrated Circuit)总线。
具体地,处理器211可以是微控制单元(Micro-controller Unit,MCU)、中央处理单元(Central Processing Unit,CPU)或数字信号处理器(Digital Signal Processor,DSP)等。
具体地,存储器212可以是Flash芯片、只读存储器(ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。存储器212中存储有供处理器211执行的各种计算机程序。
其中,所述处理器211用于运行存储在存储器处理器211中的计算机程序,并在执行所述计算机程序时实现如下步骤:
所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中;
获取所述元数据在所述数据字典的当前属性项,将所述当前属性项封装在一个访问接口中,所述访问接口为访问所述元数据的接口;
获取所述访问接口处理的SQL语句,获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数;
如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典中,获取所述元数据对应的存储位置信息、所述存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;
通过所述服务地址,连接所述非结构化数据存储系统,对所述非结构化数据存储系统进行访问操作;
在所述访问操作通过所述非结构化数据存储系统的鉴权后,在所述非结构化数据存储系统中定位所述存储位置信息对应的存储位置;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作。
在一些实施例中,处理器211,用于实现:
所述服务端设备获取非结构化数据,提取所述非结构化数据的关键信息,将提取出来的所述关键信息转化为结构化数据;
将所述结构化数据设为所述关系数据库的元数据,将所述元数据存储在所述关系数据库的数据字典中。
在一些实施例中,处理器211,用于实现:
将所述结构化数据设为所述关系数据库的元数据,建立所述非结构化数据与所述元数据之间的对应关系;
将所述对应关系以及所述元数据存储在所述关系数据库的数据字典中。
在一些实施例中,处理器211,用于实现:
在预先建立的所述管理函数与管理事件的对应关系中,获取所述管理函数对应的所述管理事件;
将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,根据所述目标管理事件中的操作指令,对解密后的所述非结构化数据执行目标管理操作。
在一些实施例中,处理器211,用于实现:
将所述管理函数对应的所述管理事件显示在所述服务端设备的管理事件创建界面上;
通过所述管理事件创建界面获取用户操作指令,判断所述用户操作指令是否为确认指令;
如果所述用户操作指令为所述确认指令,就将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件。
在一些实施例中,处理器211,用于实现:
所述数据字典包括所述元数据和所述存储位置信息的对应关系,还包括所述存储位置信息和所述密钥的对应关系。
在一些实施例中,处理器211,用于实现:
所述目标管理操作包括加密操作、压缩操作、去重操作、识别操作中的其中一种或其组合,所述识别操作包括证件识别操作、合同识别操作、人脸识别操作中的其中一种或其组合。
本申请的实施例中还提供一种设备,该设备的类型包括但不限于是服务器、手机、相机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、个人计算机(personal computer,PC)、上网本、个人数字助理(personal digital assistant,PDA)等,本申请实施例中不作任何限制。
其中,该设备包括数据库融合管理装置,示例性的,该数据库融合管理装置可以为上述实施例中所述的数据库融合管理装置200。设备可以执行本申请实施例所提供的任一种数据库融合管理方法,因此,可以实现本申请实施例所提供的任一种数据库融合管理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
本申请的实施例中还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现上述实施例提供的数据库融合管理方法的步骤。例如,该计算机程序被处理器加载,可以执行如下步骤:
所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中;
获取所述元数据在所述数据字典的当前属性项,将所述当前属性项封装在一个访问接口中,所述访问接口为访问所述元数据的接口;
获取所述访问接口处理的SQL语句,获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数;
如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典中,获取所述元数据对应的存储位置信息、所述存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;
通过所述服务地址,连接所述非结构化数据存储系统,对所述非结构化数据存储系统进行访问操作;
在所述访问操作通过所述非结构化数据存储系统的鉴权后,在所述非结构化数据存储系统中定位所述存储位置信息对应的存储位置;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作。
本申请实施例有益效果在于以下三方面,详述如下:
第一方面,非结构化数据访问的技术栈为SQL协议,降低技术复杂度,提高开发效率;
第二方面,将非结构化数据融合进关系数据库中进行管理,方便用户管理非结构化数据,消除了数据孤岛,能减少非结构化数据的存储成本,实现降本增效的目的;
第三方面,在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作,因此能通过关系数据库管理非结构化数据,有利于提高非结构化数据的管理效率。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,所述存储介质可以是前述实施例的数据库融合管理装置或设备的内部存储单元,例如数据库融合管理装置或设备的硬盘或内存。所述存储介质也可以是数据库融合管理装置或设备的外部存储设备,例如数据库融合管理装置或设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种数据库融合管理方法,因此,可以实现本申请实施例所提供的任一种数据库融合管理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种数据库融合管理方法,其特征在于,应用于服务端设备,所述服务端设备连接关系数据库,所述关系数据库包括多个管理函数,所述数据库融合管理方法包括:
所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中;
获取所述元数据在所述数据字典的当前属性项,将所述当前属性项封装在一个访问接口中,所述访问接口为访问所述元数据的接口;
获取所述访问接口处理的SQL语句,获取所述SQL语句的操作对象和调用函数,判断所述操作对象是否为所述元数据,同时判断所述调用函数是否为所述管理函数;
如果所述操作对象为所述元数据且所述调用函数为所述管理函数,就在所述数据字典中,获取所述元数据对应的存储位置信息、所述存储位置信息对应的密钥以及非结构化数据存储系统的服务地址;
通过所述服务地址,连接所述非结构化数据存储系统,对所述非结构化数据存储系统进行访问操作;
在所述访问操作通过所述非结构化数据存储系统的鉴权后,在所述非结构化数据存储系统中定位所述存储位置信息对应的存储位置;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作。
2.根据权利要求1所述的数据库融合管理方法,其特征在于,所述服务端设备获取非结构化数据,获取所述非结构化数据的元数据,将所述元数据存储在所述关系数据库的数据字典中,包括:
所述服务端设备获取非结构化数据,提取所述非结构化数据的关键信息,将提取出来的所述关键信息转化为结构化数据;
将所述结构化数据设为所述关系数据库的元数据,将所述元数据存储在所述关系数据库的数据字典中。
3.根据权利要求2所述的数据库融合管理方法,其特征在于,所述将所述结构化数据设为所述关系数据库的元数据,将所述元数据存储在所述关系数据库的数据字典中,包括:
将所述结构化数据设为所述关系数据库的元数据,建立所述非结构化数据与所述元数据之间的对应关系;
将所述对应关系以及所述元数据存储在所述关系数据库的数据字典中。
4.根据权利要求1所述的数据库融合管理方法,其特征在于,所述在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,对解密后的所述非结构化数据执行目标管理操作,包括:
在预先建立的所述管理函数与管理事件的对应关系中,获取所述管理函数对应的所述管理事件;
将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件;
在所述存储位置中读取所述元数据对应的所述非结构化数据,通过所述密钥解密读取到的所述非结构化数据,根据所述目标管理事件中的操作指令,对解密后的所述非结构化数据执行目标管理操作。
5.根据权利要求4所述的数据库融合管理方法,其特征在于,所述将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件,包括:
将所述管理函数对应的所述管理事件显示在所述服务端设备的管理事件创建界面上;
通过所述管理事件创建界面获取用户操作指令,判断所述用户操作指令是否为确认指令;
如果所述用户操作指令为所述确认指令,就将所述管理函数对应的所述管理事件设置为所述调用函数对应的目标管理事件。
6.根据权利要求1至5中任一项所述的数据库融合管理方法,其特征在于,
所述数据字典包括所述元数据和所述存储位置信息的对应关系,还包括所述存储位置信息和所述密钥的对应关系。
7.根据权利要求1至5中任一项所述的数据库融合管理方法,其特征在于,所述目标管理操作包括加密操作、压缩操作、去重操作、识别操作中的其中一种或其组合,所述识别操作包括证件识别操作、合同识别操作、人脸识别操作中的其中一种或其组合。
8.一种数据库融合管理装置,其特征在于,所述数据库融合管理装置包括处理器、存储器,所述存储器存储有可被所述处理器执行的计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的数据库融合管理方法。
9.一种存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至7中任一项所述的数据库融合管理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311567488.1A CN117272399B (zh) | 2023-11-23 | 2023-11-23 | 一种数据库融合管理方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311567488.1A CN117272399B (zh) | 2023-11-23 | 2023-11-23 | 一种数据库融合管理方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117272399A CN117272399A (zh) | 2023-12-22 |
CN117272399B true CN117272399B (zh) | 2024-02-23 |
Family
ID=89206718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311567488.1A Active CN117272399B (zh) | 2023-11-23 | 2023-11-23 | 一种数据库融合管理方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117272399B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776783A (zh) * | 2016-11-24 | 2017-05-31 | 福建亿榕信息技术有限公司 | 非结构化数据存储管理方法、服务器和系统 |
CN115145973A (zh) * | 2022-07-20 | 2022-10-04 | 墨奇科技(北京)有限公司 | 数据操作方法、程序产品、存储介质及电子设备 |
CN116450908A (zh) * | 2023-06-19 | 2023-07-18 | 北京大数据先进技术研究院 | 基于数据湖的自助式数据分析方法、装置和电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070174360A1 (en) * | 2006-01-11 | 2007-07-26 | Yuichi Yagawa | Storage system embedding database |
US7660793B2 (en) * | 2006-11-13 | 2010-02-09 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
DE102007011407A1 (de) * | 2007-03-08 | 2008-09-11 | Fujitsu Siemens Computers Gmbh | System zur Verarbeitung nicht strukturierter Daten |
-
2023
- 2023-11-23 CN CN202311567488.1A patent/CN117272399B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776783A (zh) * | 2016-11-24 | 2017-05-31 | 福建亿榕信息技术有限公司 | 非结构化数据存储管理方法、服务器和系统 |
CN115145973A (zh) * | 2022-07-20 | 2022-10-04 | 墨奇科技(北京)有限公司 | 数据操作方法、程序产品、存储介质及电子设备 |
CN116450908A (zh) * | 2023-06-19 | 2023-07-18 | 北京大数据先进技术研究院 | 基于数据湖的自助式数据分析方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117272399A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11797519B2 (en) | Atomic capture of a set of related files, using a distributed ledger, for proof of authenticity | |
US20230091925A1 (en) | Event notification in interconnected content-addressable storage systems | |
EP3640832B1 (en) | Consent-based data privacy management system | |
US11210426B2 (en) | Tracing objects across different parties | |
US8135750B2 (en) | Efficiently describing relationships between resources | |
US9881015B2 (en) | Method and system for previewing file information | |
US8311337B2 (en) | Systems and methods for organizing and accessing feature vectors in digital images | |
US11563560B2 (en) | Blockchain-based data evidence storage method and apparatus | |
CN104584618B (zh) | Mob源电话视频协作 | |
CN113946851A (zh) | 医疗图像的管理方法、装置、电子设备以及存储介质 | |
CN109448811B (zh) | 处方审核改进方法、装置、电子设备及存储介质 | |
US9811675B2 (en) | Generation and use of a modified protected file | |
CN117272399B (zh) | 一种数据库融合管理方法、装置及存储介质 | |
JP2012182737A (ja) | 秘密資料流出防止システム、判定装置、秘密資料流出防止方法およびプログラム | |
JP2019169143A (ja) | 権利保有者が所有する印刷物のコピーを追跡するシステム、方法、装置、及びプログラム | |
Toubiana et al. | Photo-tape: user privacy preferences in photo tagging | |
CN111143291A (zh) | 加密文件的搜索方法、装置和电子设备 | |
CN117493466B (zh) | 财务数据同步方法及系统 | |
US20240127228A1 (en) | Method, Apparatus, and System for Exporting and Recharging Digital Currency | |
CN112181447A (zh) | 一种便于司法验证的调证方法和装置 | |
CN117874316A (zh) | 电子案卷管理方法、装置、电子设备及存储介质 | |
CN111915424A (zh) | 信息保存方法及相关产品 | |
CN114385710A (zh) | 数据分析方法、装置、电子设备及存储介质 | |
CN116796314A (zh) | 电子文档文件的管控方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |