CN114356851B - 数据文件的存储方法、装置、电子设备及存储介质 - Google Patents
数据文件的存储方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114356851B CN114356851B CN202210034505.4A CN202210034505A CN114356851B CN 114356851 B CN114356851 B CN 114356851B CN 202210034505 A CN202210034505 A CN 202210034505A CN 114356851 B CN114356851 B CN 114356851B
- Authority
- CN
- China
- Prior art keywords
- data
- storage
- target
- database
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 230000004044 response Effects 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 238000013500 data storage Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013497 data interchange Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种数据文件的存储方法、装置、电子设备及存储介质。其中方法,应用于电子设备,在电子设备上设有与关系型数据库相匹配的存储入口;包括:通过存储入口接收数据文件,对数据文件进行数据类型分析得到数据文件的目标数据类型;响应于确定目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与目标数据类型对应的目标存储数据库,确定目标存储数据库中的目标存储地址,根据目标存储地址生成索引信息存储在关系型数据库中,并将数据文件存储在目标存储地址中;响应于确定目标数据类型包括简单数据类型,将数据文件存储在关系型数据库中。无需用户手动选择数据类型存储,存储时在关系型数据库中形成索引进而方便数据查找。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据文件的存储方法、装置、电子设备及存储介质。
背景技术
数据库是结构化信息或数据的有组织的集合,通常由数据库管理系统来控制。现有技术中,针对不同类型的的数据,往往需要针对数据存储使用方式进行技术选型,选用适合场景的数据库。
但是,针对现有技术的情况,如果存储的类型较复杂,需要用户自己去分解需要存储的数据,操作过程复杂,不方便使用。
发明内容
有鉴于此,本申请的目的在于提出一种数据文件的存储方法、装置、电子设备及存储介质以解决或部分解决上述技术问题。
基于上述目的,本申请的第一方面提供了一种数据文件的存储方法,应用于电子设备,在所述电子设备上设有与关系型数据库相匹配的存储入口;
所述方法包括:
通过所述存储入口接收数据文件,对所述数据文件进行数据类型分析得到所述数据文件的目标数据类型;
响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中;
响应于确定所述目标数据类型包括简单数据类型,将所述数据文件存储在所述关系型数据库中。
在一些实施例中,所述复杂数据类型包括下列至少之一:
非结构化对象简谱类、矢量数据类、音视频/文件类、键值对数据类、时序积累数据类、长文本类;
所述复杂类型存储数据库包括下列至少之一:
分布式文件存储数据库、对象-关系型数据库、对象存储数据库、分布式全文检索数据库、开源时序型数据库、远程字典数据库;
所述简单数据类型包括下列至少之一:
短字符串类、标量数据类。
在一些实施例中,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:非结构化对象简谱类;
根据所述非结构化对象简谱类从多个复杂类型存储数据库中匹配分布式文件存储数据库,确定所述数据文件中所述非结构化对象简谱类对应的非结构化数据,在所述分布式文件存储数据库中的目标存储地址;
将所述目标存储地址作为索引信息存储在所述关系型数据库中;
将所述非结构化数据转换成计算机数据交换格式存储在所述分布式文件存储数据库的目标存储地址中。
在一些实施例中,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:矢量数据类;
根据所述矢量数据类从多个复杂类型存储数据库中匹配对象-关系型数据库,确定所述数据文件中所述矢量数据类对应的矢量数据,在所述对象-关系型数据库中的目标存储地址;
将所述矢量数据存储在所述对象-关系型数据库中的目标存储地址;
生成所述矢量数据在所述对象-关系型数据库中的表名;
将所述表名和所述目标存储地址组合作为索引信息存储在所述关系型数据库中。
在一些实施例中,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:音视频/文件类;
根据所述音视频/文件类从多个复杂类型存储数据库中匹配对象存储数据库,确定所述数据文件中所述音视频/文件类对应的音视频/文件数据,在所述对象存储数据库中的目标存储地址;
根据所述目标存储地址生成对应的通用唯一识别码;
将所述通用唯一识别码作为索引信息存储在所述关系型数据库中;
将所述音视频/文件数据存储在所述对象存储数据库中的目标存储地址中。
在一些实施例中,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:长文本类;
根据所述长文本类从多个复杂类型存储数据库中匹配分布式全文检索数据库,确定所述数据文件中所述长文本类对应的长文本数据,在所述分布式全文检索数据库中的目标存储地址;
将所述长文本数据存储在所述分布式全文检索数据库中的目标存储地址;
根据所述目标存储地址和所述长文本数据生成对应的唯一字段;
将所述唯一字段作为索引信息存储在所述关系型数据库中。
在一些实施例中,所述目标数据类型的数量为至少两个,包括:所述简单数据类型中的至少之一和所述复杂数据类型中的至少之一;
所述方法还包括:
将所述数据文件中所述复杂数据类型对应生成的索引信息,与所述数据文件中所述简单数据类型对应的简单数据进行关联,将关联后的数据存储在所述关系型数据库中。
在一些实施例中,所述目标数据类型的数量为至少两个,包括:所述复杂数据类型中的至少两个;
所述方法还包括:
将所述数据文件中至少两个所述复杂数据类型对应生成的至少两个索引信息进行关联,将关联后的至少两个索引信息存储在所述关系型数据库中。
在一些实施例中,所述方法还包括:
响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库;
将所述目标数据从所述关系型数据库中转换存储至所述转换存储数据库中。
在一些实施例中,所述响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库,包括:
响应于所述关系型数据库中存储的目标数据在预定时间段内写入次数大于等于第一预定次数,读取次数小于第二预定次数,确定所述目标数据对应的转换存储数据库为开源时序型数据库;
在一些实施例中,所述响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库,包括:
响应于所述关系型数据库中存储的目标数据的读取频率大于等于预定频率阈值,确定所述目标数据对应的转换存储数据库为远程字典数据库。
在一些实施例中,所述方法还包括:
接收终端发来的查询条件;
响应于确定所述查询条件为单个数据类型的查询条件,根据所述查询条件从对应存储数据库中调取查询数据,根据所述查询数据从所述关系型数据库中确定对应的目标索引信息,基于所述关系型数据库根据所述目标索引信息查找与所述查询数据相关联的关联数据;
将所述查询数据与所述关联数据组合后反馈至所述终端。
在一些实施例中,所述方法还包括:
接收终端发来的查询条件;
响应于确定所述查询条件为组合数据类型的查询条件,根据所述查询条件在所述关系型数据库中筛选多个目标索引信息,其中,组合数据类型包括至少两个数据类型;
基于所述关系型数据库根据所述多个目标索引信息确定多个查询数据,将多个查询数据组合后反馈至所述终端。
基于同一个发明构思,本申请的第二方面提出了一种数据文件的存储装置,所述存储装置设置在所述电子设备上,所述电子设备上设有与所述存储装置中的关系型数据库相匹配的存储入口,所述存储装置包括:
接收模块,用于通过所述存储入口接收数据文件,对所述数据文件进行数据类型分析得到所述数据文件的目标数据类型;
复杂数据存储模块,用于响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中;
简单数据存储模块,用于响应于确定所述目标数据类型包括简单数据类型,将所述数据文件存储在所述关系型数据库中。
基于同一个发明构思,本申请的第三方面提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
基于同一个发明构思,本申请的第四方面提出了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行第一方面所述的方法。
从上面所述可以看出,本申请提供的数据文件的存储方法、装置、电子设备及存储介质,能够利用统一的存储入口接收数据文件,并自动对数据文件进行数据类型分析,这样用户无需手动选择数据类型;然后会根据数据文件的目标数据类型自动分配相应的存储数据库,存储过程中分为两种情况,一种是针对复杂数据类型的存储需要在关系型数据库中形成索引信息,再存储在对应目标存储数据库的目标存储地址中,另一种是针对简单数据类型,可以直接在关系型数据库中进行存储。这样,无需用户手动选择数据类型,给用户带来便利,并且针对复杂数据类型的数据文件还能在关系型数据库中形成索引进而方便根据索引进行数据查找,提高数据查询的效率。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的应用场景示意图;
图2A为本申请实施例的数据文件的存储方法的流程图;
图2B为本申请实施例的转换存储步骤的流程图;
图2C为本申请实施例的数据查询步骤的一个流程图;
图2D为本申请实施例的数据查询步骤的另一个流程图;
图3为本申请实施例的数据文件的存储装置的结构框图;
图4为本申请实施例的电子设备的结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
根据本申请的实施方式,提出了一种程序测试项目的部署方法、访问方法及相关设备。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本申请的若干代表性实施方式,详细阐释本申请的原理和精神。
为了方便理解,下面对本申请实施例中涉及的名词进行解释:
数据库:按照数据结构来组织、存储和管理数据的仓库,是一个长期存储在电子设备内的、有组织的、可共享的、统一管理的大量数据的集合。
MySQL:是一种关系型数据库管理系统,由瑞典MySQL AB公司开发,属于Oracle旗下产品,使用的SQL(Structured Query Language,结构化查询语言)编写,能够将数据保存在不同的表中。
MongoDB:基于分布式文件存储的数据库,有C++语言编写,旨在为WEB(网络)应用提供可扩展的高性能数据存储解决方案。
PostgreSQL:是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),是以加州大学计算机系开发的POSTGRES,4.2版本为基础的对象-关系型数据库管理系统。
Elasticsearch:是一个基于Lucene(全文检索)的搜索服务器,提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口,Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。
对象存储:基于对象的存储,是用来描述解决和处理离散单元的方法的通用术语,这些离散单元被称作为对象,对象包含数据,每个对象都在一个被称作存储池的扁平地址空间的同一级别里,一个对象不会属于另一个对象的下一级;文件和对象都有与它们所包含的数据相关的元数据,对象是以扩展元数据为特征的,每个对象都被分配一个唯一的标识符,允许一个服务器或者最终用户来检索对象,而不必知道数据的物理地址。
Redis:远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。
InfluxDB:由InfluxData开发的开源时序型数据库,由Go写成,着力于高性能地查询与存储时序型数据。
JSON:(JavaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式,基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。
UUID:Universally Unique Identifier,通用唯一识别码,是一种软件建构的标准,亦为开放软件基金会组织在分布式计算环境领域的一部分,其目的,是让分布式系统中的所有元素,都能有唯一的辨识信息,而不需要通过中央控制端来做辨识信息的指定。
本申请提供了一种数据文件的存储方案,能够利用统一的存储入口接收数据文件,并自动对数据文件进行数据类型分析,这样用户无需手动选择数据类型;然后会根据数据文件的目标数据类型自动分配相应的存储数据库,存储过程中分为两种情况,一种是针对复杂数据类型的存储需要在关系型数据库中形成索引信息,再存储在对应目标存储数据库的目标存储地址中,另一种是针对简单数据类型,可以直接在关系型数据库中进行存储。这样,无需用户手动选择数据类型,给用户带来便利,并且针对复杂数据类型的数据文件还能在关系型数据库中形成索引进而方便根据索引进行数据查找,提高数据查询的效率。
参考图1,其为本申请实施例提供的数据文件的存储方法的应用场景示意图。该应用场景包括终端设备101、服务器102、和数据存储系统103。其中,终端设备101、服务器102以及数据存储系统103之间均可通过有线或无线的通信网络连接。终端设备101包括但不限于桌面计算机、移动电话、移动电脑、平板电脑、媒体播放器、智能可穿戴设备视、个人数字助理(personal digital assistant,PDA)或其它能够实现上述功能的电子设备等。服务器102和数据存储系统103均可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
服务器102用于向终端设备101的用户提供数据文件的存储服务,终端设备101中安装有与服务器102通信的客户端,用户可以通过客户端向服务器发送数据文件给服务器。服务器102利用统一的存储入口接收数据文件,并自动对数据文件进行数据类型分析,这样用户无需手动选择数据类型;然后会根据数据文件的目标数据类型自动分配相应的存储数据库,存储过程中分为两种情况,一种是针对复杂数据类型的存储需要在关系型数据库中形成索引信息,再存储在对应目标存储数据库的目标存储地址中,另一种是针对简单数据类型,可以直接在关系型数据库中进行存储。数据存储系统103为服务器102的工作运行提供数据存储支持。
下面结合图1的应用场景,来描述根据本申请示例性实施方式的程序测试项目的部署方法以及程序测试项目的访问方法。需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。
本申请实施例提供了一种数据文件的存储方法,该数据文件的存储方法应用于电子设备,在所述电子设备上设有与关系型数据库相匹配的存储入口。其中,该电子设备优选为服务器。
参考图2A,本实施例的数据文件的存储方法,可以包括以下步骤:
步骤201,通过所述存储入口接收数据文件,对所述数据文件进行数据类型分析得到所述数据文件的目标数据类型。
目标数据类型可以包括复杂数据类型和/或简单数据类型,其中,复杂数据类型组成较为复杂,需要复杂的存储方案进行存储,简单数据类型只需简单的存储方案就可以进行存储。
得到的目标数据类型可能是复杂数据类型和简单数据类型的组合形式,也可能是多个复杂数据类型的组合形式,也可能是只有复杂数据类型的形式,也可能是只有简单数据类型的形式。本实施例是优选针对复杂数据类型和简单数据类型的组合形式或者多个复杂数据类型的组合形式进行存储的方案。
在一些实施例中,复杂数据类型包括下列至少之一:非结构化对象简谱类、矢量数据类、音视频/文件类、键值对数据类、时序积累数据类、长文本类。
对应的复杂类型存储数据库包括下列至少之一:分布式文件存储数据库、对象-关系型数据库、对象存储数据库、分布式全文检索数据库、开源时序型数据库、远程字典数据库。
其中,分布式文件存储数据库用于存储非结构化对象简谱类的数据,对象-关系型数据库用于存储矢量数据类的数据,对象存储数据库用于存储音视频/文件类的数据,分布式全文检索数据库用于存储键值对数据类的数据,开源时序型数据库用于存储时序积累数据类的数据,远程字典数据库用于存储长文本类的数据。
简单数据类型包括下列至少之一:短字符串类、标量数据类。简单数据类型对应分配的存储库为关系型数据库。
其中,复杂数据类型还包括其他数据类。对应复杂类型存储数据库还包括其他数据库。如果不能归类到上述任一数据类型中,就将其归类到其他数据类,并对应存储在其他数据库中。
步骤202,响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中。
复杂数据类型的数据不能直接存储在关系型数据库中,需要根据目标存储地址生成对应的索引信息,将索引信息存储在关系型数据库中。其中,可以先生成索引信息,在存储数据文件;也可以先存储数据文件,再生成索引信息;也可以存储数据文件和生成索引信息同时进行,具体顺序可以根据实际需要进行选定,这里不作具体限定。
针对各种复杂数据类型的存储过程具体如下:
在步骤202中,响应于确定所述目标数据类型包括:非结构化对象简谱类(即,非结构化JSON);根据所述非结构化对象简谱类从多个复杂类型存储数据库中匹配分布式文件存储数据库(即,MongoDB),确定所述数据文件中所述非结构化对象简谱类对应的非结构化数据,在所述分布式文件存储数据库中的目标存储地址;将所述目标存储地址作为索引信息存储在所述关系型数据库中;将所述非结构化数据转换成计算机数据交换格式存储在所述分布式文件存储数据库的目标存储地址中。
在上述实施例中,针对非结构化对象简谱类的数据可以将其在MongoDB中的存储地址作为索引信息存储在关系型数据库中,这样后续查询过程中直接根据关系型数据库中的索引信息从MongoDB中调取对应存储的数据即可完成查询。
在步骤202中,响应于确定所述目标数据类型包括:矢量数据类;根据所述矢量数据类从多个复杂类型存储数据库中匹配对象-关系型数据库(即,PostgreSQL),确定所述数据文件中所述矢量数据类对应的矢量数据(例如,对应的位置坐标),在所述对象-关系型数据库中的目标存储地址;将所述矢量数据存储在所述对象-关系型数据库中的目标存储地址;生成所述矢量数据在所述对象-关系型数据库中的表名;将所述表名和所述目标存储地址组合作为索引信息存储在所述关系型数据库中。
在上述实施例中,针对矢量数据需要存储在PostgreSQL中,如果直接存储在PostgreSQL中不方便查找,由于矢量数据在PostgreSQL中是以表格的方式进行存储的,因此根据矢量数据生成对应的表名,将表名和目标存储地址组合形成索引信息,将索引信息存储在关系型数据库中。这样后续查询矢量数据时,可以根据索引信息中的表名找到对应的查询目标,根据目标存储地址从PostgreSQL中调取其中的矢量数据,进而完成快速查询矢量数据的过程。
在步骤202中,响应于确定所述目标数据类型包括:音视频/文件类;根据所述音视频/文件类从多个复杂类型存储数据库中匹配对象存储数据库,确定所述数据文件中所述音视频/文件类对应的音视频/文件数据,在所述对象存储数据库中的目标存储地址;根据所述目标存储地址生成对应的通用唯一识别码(即,UUID);将所述通用唯一识别码作为索引信息存储在所述关系型数据库中;将所述音视频/文件数据存储在所述对象存储数据库中的目标存储地址中。
在上述实施例中,由于音视频或者大文件(文件大小≥预定存储量)需要的存储空间较大,所以也不能直接存储在关系型数据库中,需要为音视频/文件数据分配对象存储数据库,利用对象存储数据库进行存储。存储过程中利用一种不会重复的字符串UUID代替音视频/文件数据的位置,形成索引信息,将索引信息存储在关系型数据库中。这样就可以根据索引信息中的UUID调取对应的音视频/文件数据,简单快捷。
其中,由于音视频/文件数据一般比较大,所以,会先生成索引信息,再存储音视频/文件数据。
在步骤202中,响应于确定所述目标数据类型包括:长文本类;根据所述长文本类从多个复杂类型存储数据库中匹配分布式全文检索数据库(即,Elasticsearch),确定所述数据文件中所述长文本类对应的长文本数据,在所述分布式全文检索数据库中的目标存储地址;将所述长文本数据存储在所述分布式全文检索数据库中的目标存储地址;根据所述目标存储地址和所述长文本数据生成对应的唯一字段;将所述唯一字段作为索引信息存储在所述关系型数据库中。
在上述实施例中,长文本数据(例如,100字以上的文章)由于内部的文本量较大,也不能直接存储在关系型数据库中,需要给长文本数据分配对应的Elasticsearch进行存储。将长文本数据存储在Elasticsearch中之后,获取长文本数据对应的_uid(即,Elasticsearch中的唯一字段),将_uid作为索引信息存储在关系型数据库中。进而保证后续根据关系型数据库中的索引信息直接从Elasticsearch中调取对应的长文本数据,操作简单方便。
步骤203,响应于确定所述目标数据类型包括简单数据类型,将所述数据文件存储在所述关系型数据库中。
针对简单数据类型的数据文件(例如,短字符串和/或标量数据),可以直接将其存储在关系型数据库中。这样能够将复杂数据类型的数据和简单数据类型的数据进行分别存储,方便用户快速进行调取查找。
在一些实施例中,如果需要存储的数据文件对应的目标数据类型包含有多种,具体可以分为如下两种情况:
第一种:所述目标数据类型包括:所述简单数据类型中的至少之一和所述复杂数据类型中的至少之一。
本实施例的方法还包括:
步骤204a,将所述数据文件中所述复杂数据类型对应生成的索引信息,与所述数据文件中所述简单数据类型对应的简单数据(例如,短字符串和/或标量数据)进行关联,将关联后的数据存储在所述关系型数据库中。
具体实施时,可以按照上述步骤202或203的方式将数据文件按照对应的数据类型进行分解存储,并且将复杂数据类型对应生成的索引信息与简单数据在关系型数据库中的同一行或者同一列中存储,这样能够保证数据文件的完整性。
第二种,目标数据类型包括:所述复杂数据类型中的至少两个。
本实施例的方法还包括:
步骤204b,将所述数据文件中至少两个所述复杂数据类型对应生成的至少两个索引信息进行关联,将关联后的至少两个索引信息存储在所述关系型数据库中。
具体实施时,针对要存储的数据文件可以按照上述步骤202的过程将至少两个复杂数据类型对应的数据分别进行存储之后,为了保证数据的完整性,方便后续查找,需要将至少两个复杂数据类型对应生成的至少两个索引信息存储在关系型数据库的同一行或同一列中。
通过上述实施例,后续进行查找时,只要查找其中的一类数据,就可以依据关系型数据库查找到与该类数据相关的其他数据,并将查找到的所有数据整合形成完整的数据文件。这种方式能够自动完成对存储数据的分解和整合,无需用户手动操作,给用户带来便利的同时,提高数据存储效率。
在一些实施例中,如图2B所示,所述方法还包括:
步骤205,响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库。
步骤206,将所述目标数据从所述关系型数据库中转换存储至所述转换存储数据库中。
具体实施时,对于关系型数据库中存储的简单数据类型的目标数据,也可能在后续存储和查询调用过程中会触发对应的复杂数据类型的转换存储条件,一旦被触发,就会将目标数据转换到对应的复杂类型存储数据库中进行存储。进而能够适配该目标数据的具体使用场景。
其中转换存储条件包括下列至少之一:
属于非结构化JSON、属于矢量数据、属于大文件数据、属于频繁读取小键值对数据、属于时序积累数据、属于长文本数据。
在一些实施例中,针对转换存储条件中的频繁读取小键值对数据的情况,步骤205包括:
响应于所述关系型数据库中存储的目标数据在预定时间段内写入次数大于等于第一预定次数,读取次数小于第二预定次数,确定所述目标数据对应的转换存储数据库为开源时序型数据库(即,influxDB)。
具体实施时,存储时会首先将目标数据存储到MySQL中,在使用时,发现用户对于该目标数据长期积累且写多读少无修改,在保证用户无感知的情况下,将该目标数据从MySQL中转换到influxDB中进行存储,以适配具体使用场景。
在一些实施例中,步骤205还包括:
响应于所述关系型数据库中存储的目标数据的读取频率大于等于预定频率阈值,确定所述目标数据对应的转换存储数据库为远程字典数据库(即,Redis)。
具体实施时,存储时会首先将目标数据存储到MySQL中,在使用时,发现用户读写频繁且数据结构保持简单,在保证用户无感知的情况下,将该目标数据从MySQL中转换到Redis中进行存储,以适配具体使用场景。
在一些实施例中,按照上述实施例的步骤将数据文件存储完成后,用户可以通过终端发送查询条件。
则方法还包括:
步骤207,接收终端发来的查询条件,根据查询条件查找用户需要的数据。
在一些实施例中,如图2C所示,步骤207具体为:
步骤2071,接收终端发来的查询条件。
步骤2072,响应于确定所述查询条件为单个数据类型的查询条件,根据所述查询条件从对应存储数据库中调取查询数据,根据所述查询数据从所述关系型数据库中确定对应的目标索引信息,基于所述关系型数据库根据所述目标索引信息查找与所述查询数据相关联的关联数据。
步骤2073,将所述查询数据与所述关联数据组合后反馈至所述终端。
具体实施时,可以分为如下几种情况:
第一种,如果单个数据类型的查询条件是针对关系型数据库中的字段(例如,短字符串或标量数据)进行查询,调取关系型数据库中的字段,并从关系型数据库中查找该字段相关的目标索引信息,根据目标索引信息调取与该字段相关的关联数据,组合后返给终端以供用户查看。其中,该字段也可能没有对应的关联数据,如果没有,则只将查询到的字段返给终端。
第二种,如果单个数据类型的查询条件是针对复杂数据库中的数据进行查询,从对应的复杂数据库中调取对应的查询数据,然后再根据关系型数据库中查找与该查询数据相关的目标索引信息,根据目标索引信息调取与该查询数据相关的关联数据,组合后返给终端以供用户查看。其中,该查询数据也可能没有对应的关联数据,如果没有,则只将查询到的复杂数据库中的查询数据返给终端。
例如,以长文本作为查询条件,则从Elasticsearch中调取长文本数据,并从Elasticsearch中查出长文本数据对应的_uid,然后通过_uid去从关系型数据库中索引与该长文本相关的短字符串、标量数据或者其他索引信息,根据这些信息查找与长文本相关的所有数据并组合后返给终端。
又如,以矢量数据作为查询条件,则从PostgreSQL中调取矢量数据,并查找对应的存储地址(ID),用矢量数据的表名和ID组合从关系型数据库中索引与该矢量数据相关的短字符串、标量数据或者其他索引信息,根据这些信息查找与矢量数据相关的所有数据并组合后返给终端。
在一些实施例中,如图2D所示,步骤207具体为:
步骤2071’,接收终端发来的查询条件。
步骤2072’,响应于确定所述查询条件为组合数据类型的查询条件,根据所述查询条件在所述关系型数据库中筛选多个目标索引信息,其中,组合数据类型包括至少两个数据类型。
步骤2073’,基于所述关系型数据库根据所述多个目标索引信息确定多个查询数据,将多个查询数据组合后反馈至所述终端。
具体实施时,对应的查询条件可能为组合数据类型的查询条件,需要根据查询条件在关系型数据中筛选,确定与该查询条件对应的多个目标索引信息,从与各个目标索引信息对应的存储数据库中调取相应的查询数据,将这些查询数据组合后返给终端,以供用户查看查询结果。
通过上述实施例的方案,能够利用统一的存储入口接收数据文件,并自动对数据文件进行数据类型分析,这样用户无需手动选择数据类型;然后会根据数据文件的目标数据类型自动分配相应的存储数据库,存储过程中分为两种情况,一种是针对复杂数据类型的存储需要在关系型数据库中形成索引信息,再存储在对应目标存储数据库的目标存储地址中,另一种是针对简单数据类型,可以直接在关系型数据库中进行存储。这样,无需用户手动选择数据类型,给用户带来便利,并且针对复杂数据类型的数据文件还能在关系型数据库中形成索引进而方便根据索引进行数据查找,提高数据查询的效率。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例的数据文件的存储方法相对应的,本申请还提供了一种数据文件的存储装置,所述存储装置设置在所述电子设备上,所述电子设备上设有与所述存储装置中的关系型数据库相匹配的存储入口。
参考图3,数据文件的存储装置,包括:
接收模块31,用于通过所述存储入口接收数据文件,对所述数据文件进行数据类型分析得到所述数据文件的目标数据类型;
复杂数据存储模块32,用于响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中;
简单数据存储模块33,用于响应于确定所述目标数据类型包括简单数据类型,将所述数据文件存储在所述关系型数据库中。
在一些实施例中,所述复杂数据类型包括下列至少之一:
非结构化对象简谱类、矢量数据类、音视频/文件类、键值对数据类、时序积累数据类、长文本类;
所述复杂类型存储数据库包括下列至少之一:
分布式文件存储数据库、对象-关系型数据库、对象存储数据库、分布式全文检索数据库、开源时序型数据库、远程字典数据库;
所述简单数据类型包括下列至少之一:
短字符串类、标量数据类。
在一些实施例中,复杂数据存储模块32还用于:
响应于确定所述目标数据类型包括:非结构化对象简谱类;根据所述非结构化对象简谱类从多个复杂类型存储数据库中匹配分布式文件存储数据库,确定所述数据文件中所述非结构化对象简谱类对应的非结构化数据,在所述分布式文件存储数据库中的目标存储地址;将所述目标存储地址作为索引信息存储在所述关系型数据库中;将所述非结构化数据转换成计算机数据交换格式存储在所述分布式文件存储数据库的目标存储地址中。
在一些实施例中,复杂数据存储模块32还用于:
响应于确定所述目标数据类型包括:矢量数据类;根据所述矢量数据类从多个复杂类型存储数据库中匹配对象-关系型数据库,确定所述数据文件中所述矢量数据类对应的矢量数据,在所述对象-关系型数据库中的目标存储地址;将所述矢量数据存储在所述对象-关系型数据库中的目标存储地址;生成所述矢量数据在所述对象-关系型数据库中的表名;将所述表名和所述目标存储地址组合作为索引信息存储在所述关系型数据库中。
在一些实施例中,复杂数据存储模块32还用于:
响应于确定所述目标数据类型包括:音视频/文件类;根据所述音视频/文件类从多个复杂类型存储数据库中匹配对象存储数据库,确定所述数据文件中所述音视频/文件类对应的音视频/文件数据,在所述对象存储数据库中的目标存储地址;根据所述目标存储地址生成对应的通用唯一识别码;将所述通用唯一识别码作为索引信息存储在所述关系型数据库中;将所述音视频/文件数据存储在所述对象存储数据库中的目标存储地址中。
在一些实施例中,复杂数据存储模块32还用于:
响应于确定所述目标数据类型包括:长文本类;根据所述长文本类从多个复杂类型存储数据库中匹配分布式全文检索数据库,确定所述数据文件中所述长文本类对应的长文本数据,在所述分布式全文检索数据库中的目标存储地址;将所述长文本数据存储在所述分布式全文检索数据库中的目标存储地址;根据所述目标存储地址和所述长文本数据生成对应的唯一字段;将所述唯一字段作为索引信息存储在所述关系型数据库中。
在一些实施例中,所述目标数据类型的数量为至少两个,包括:所述简单数据类型中的至少之一和所述复杂数据类型中的至少之一;
所述装置还包括:
关联模块,用于将所述数据文件中所述复杂数据类型对应生成的索引信息,与所述数据文件中所述简单数据类型对应的简单数据进行关联,将关联后的数据存储在所述关系型数据库中。
在一些实施例中,所述目标数据类型的数量为至少两个,包括:所述复杂数据类型中的至少两个;
关联模块,还用于将所述数据文件中至少两个所述复杂数据类型对应生成的至少两个索引信息进行关联,将关联后的至少两个索引信息存储在所述关系型数据库中。
在一些实施例中,装置还包括:转换存储模块,用于响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库;将所述目标数据从所述关系型数据库中转换存储至所述转换存储数据库中。
在一些实施例中,转换存储模块,还用于响应于所述关系型数据库中存储的目标数据在预定时间段内写入次数大于等于第一预定次数,读取次数小于第二预定次数,确定所述目标数据对应的转换存储数据库为开源时序型数据库。
在一些实施例中,转换存储模块,还用于响应于所述关系型数据库中存储的目标数据的读取频率大于等于预定频率阈值,确定所述目标数据对应的转换存储数据库为远程字典数据库。
在一些实施例中,装置还包括:查询模块,用于接收终端发来的查询条件;响应于确定所述查询条件为单个数据类型的查询条件,根据所述查询条件从对应存储数据库中调取查询数据,根据所述查询数据从所述关系型数据库中确定对应的目标索引信息,基于所述关系型数据库根据所述目标索引信息查找与所述查询数据相关联的关联数据;将所述查询数据与所述关联数据组合后反馈至所述终端。
在一些实施例中,查询模块,还用于接收终端发来的查询条件;响应于确定所述查询条件为组合数据类型的查询条件,根据所述查询条件在所述关系型数据库中筛选多个目标索引信息,其中,组合数据类型包括至少两个数据类型;基于所述关系型数据库根据所述多个目标索引信息确定多个查询数据,将多个查询数据组合后反馈至所述终端。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的方法。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器410、存储器420、输入/输出接口430、通信接口440和总线450。其中处理器410、存储器420、输入/输出接口430和通信接口440通过总线450实现彼此之间在设备内部的通信连接。
处理器410可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器420可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器420可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器420中,并由处理器410来调用执行。
输入/输出接口430用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口440用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线450包括一通路,在设备的各个组件(例如处理器410、存储器420、输入/输出接口430和通信接口440)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器410、存储器420、输入/输出接口430、通信接口440以及总线450,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的数据文件的存储方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种数据文件的存储方法,其特征在于,应用于电子设备,在所述电子设备上设有与关系型数据库相匹配的存储入口;
所述方法包括:
通过所述存储入口接收数据文件,对所述数据文件进行数据类型分析得到所述数据文件的目标数据类型;
响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中;
响应于确定所述目标数据类型包括简单数据类型,将所述数据文件存储在所述关系型数据库中;
所述方法还包括:
响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库;
将所述目标数据从所述关系型数据库中转换存储至所述转换存储数据库中。
2.根据权利要求1所述的方法,其特征在于,所述复杂数据类型包括下列至少之一:
非结构化对象简谱类、矢量数据类、音视频/文件类、键值对数据类、时序积累数据类、长文本类;
所述复杂类型存储数据库包括下列至少之一:
分布式文件存储数据库、对象-关系型数据库、对象存储数据库、分布式全文检索数据库、开源时序型数据库、远程字典数据库;
所述简单数据类型包括下列至少之一:
短字符串类、标量数据类。
3.根据权利要求2所述的方法,其特征在于,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:非结构化对象简谱类;
根据所述非结构化对象简谱类从多个复杂类型存储数据库中匹配分布式文件存储数据库,确定所述数据文件中所述非结构化对象简谱类对应的非结构化数据,在所述分布式文件存储数据库中的目标存储地址;
将所述目标存储地址作为索引信息存储在所述关系型数据库中;
将所述非结构化数据转换成计算机数据交换格式存储在所述分布式文件存储数据库的目标存储地址中。
4.根据权利要求2所述的方法,其特征在于,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:矢量数据类;
根据所述矢量数据类从多个复杂类型存储数据库中匹配对象-关系型数据库,确定所述数据文件中所述矢量数据类对应的矢量数据,在所述对象-关系型数据库中的目标存储地址;
将所述矢量数据存储在所述对象-关系型数据库中的目标存储地址;
生成所述矢量数据在所述对象-关系型数据库中的表名;
将所述表名和所述目标存储地址组合作为索引信息存储在所述关系型数据库中。
5.根据权利要求2所述的方法,其特征在于,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:音视频/文件类;
根据所述音视频/文件类从多个复杂类型存储数据库中匹配对象存储数据库,确定所述数据文件中所述音视频/文件类对应的音视频/文件数据,在所述对象存储数据库中的目标存储地址;
根据所述目标存储地址生成对应的通用唯一识别码;
将所述通用唯一识别码作为索引信息存储在所述关系型数据库中;
将所述音视频/文件数据存储在所述对象存储数据库中的目标存储地址中。
6.根据权利要求2所述的方法,其特征在于,所述响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中,包括:
响应于确定所述目标数据类型包括:长文本类;
根据所述长文本类从多个复杂类型存储数据库中匹配分布式全文检索数据库,确定所述数据文件中所述长文本类对应的长文本数据,在所述分布式全文检索数据库中的目标存储地址;
将所述长文本数据存储在所述分布式全文检索数据库中的目标存储地址;
根据所述目标存储地址和所述长文本数据生成对应的唯一字段;
将所述唯一字段作为索引信息存储在所述关系型数据库中。
7.根据权利要求1所述的方法,其特征在于,所述目标数据类型的数量为至少两个,包括:所述简单数据类型中的至少之一和所述复杂数据类型中的至少之一;
所述方法还包括:
将所述数据文件中所述复杂数据类型对应生成的索引信息,与所述数据文件中所述简单数据类型对应的简单数据进行关联,将关联后的数据存储在所述关系型数据库中。
8.根据权利要求1所述的方法,其特征在于,所述目标数据类型的数量为至少两个,包括:所述复杂数据类型中的至少两个;
所述方法还包括:
将所述数据文件中至少两个所述复杂数据类型对应生成的至少两个索引信息进行关联,将关联后的至少两个索引信息存储在所述关系型数据库中。
9.根据权利要求1所述的方法,其特征在于,所述响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库,包括:
响应于所述关系型数据库中存储的目标数据在预定时间段内写入次数大于等于第一预定次数,读取次数小于第二预定次数,确定所述目标数据对应的转换存储数据库为开源时序型数据库。
10.根据权利要求1所述的方法,其特征在于,所述响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库,包括:
响应于所述关系型数据库中存储的目标数据的读取频率大于等于预定频率阈值,确定所述目标数据对应的转换存储数据库为远程字典数据库。
11.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:
接收终端发来的查询条件;
响应于确定所述查询条件为单个数据类型的查询条件,根据所述查询条件从对应存储数据库中调取查询数据,根据所述查询数据从所述关系型数据库中确定对应的目标索引信息,基于所述关系型数据库根据所述目标索引信息查找与所述查询数据相关联的关联数据;
将所述查询数据与所述关联数据组合后反馈至所述终端。
12.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:
接收终端发来的查询条件;
响应于确定所述查询条件为组合数据类型的查询条件,根据所述查询条件在所述关系型数据库中筛选多个目标索引信息,其中,组合数据类型包括至少两个数据类型;
基于所述关系型数据库根据所述多个目标索引信息确定多个查询数据,将多个查询数据组合后反馈至所述终端。
13.一种数据文件的存储装置,其特征在于,所述存储装置设置在电子设备上,所述电子设备上设有与所述存储装置中的关系型数据库相匹配的存储入口,所述存储装置包括:
接收模块,用于通过所述存储入口接收数据文件,对所述数据文件进行数据类型分析得到所述数据文件的目标数据类型;
复杂数据存储模块,用于响应于确定所述目标数据类型包括复杂数据类型,从多个复杂类型存储数据库中匹配与所述目标数据类型对应的目标存储数据库,确定所述目标存储数据库中的目标存储地址,根据所述目标存储地址生成索引信息存储在所述关系型数据库中,并将所述数据文件存储在所述目标存储地址中;
简单数据存储模块,用于响应于确定所述目标数据类型包括简单数据类型,将所述数据文件存储在所述关系型数据库中;
装置还包括:转换存储模块,用于响应于确定所述关系型数据库中存储的目标数据满足转换存储条件,从多个复杂类型存储数据库中确定所述目标数据对应的转换存储数据库;将所述目标数据从所述关系型数据库中转换存储至所述转换存储数据库中。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至12任意一项所述的方法。
15.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行如权利要求1至12任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210034505.4A CN114356851B (zh) | 2022-01-12 | 2022-01-12 | 数据文件的存储方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210034505.4A CN114356851B (zh) | 2022-01-12 | 2022-01-12 | 数据文件的存储方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114356851A CN114356851A (zh) | 2022-04-15 |
CN114356851B true CN114356851B (zh) | 2024-06-18 |
Family
ID=81109054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210034505.4A Active CN114356851B (zh) | 2022-01-12 | 2022-01-12 | 数据文件的存储方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114356851B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880690B (zh) * | 2022-06-08 | 2023-07-28 | 浙江省交通运输科学研究院 | 一种基于边缘计算的源数据时序精化方法 |
CN115878612B (zh) * | 2022-11-17 | 2023-12-15 | 北京东方京融教育科技股份有限公司 | 一种数据库结构及其检索方法 |
CN116069870A (zh) * | 2023-04-06 | 2023-05-05 | 深圳开鸿数字产业发展有限公司 | 基于分布式系统的数据存储方法、装置、设备及介质 |
CN116701563A (zh) * | 2023-08-08 | 2023-09-05 | 佳瑛科技有限公司 | 基于分布式服务器的非结构化数据处理方法及相关装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779349A (zh) * | 2021-08-11 | 2021-12-10 | 中央广播电视总台 | 数据检索系统、装置、电子设备和可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008209B (zh) * | 2014-06-20 | 2017-02-01 | 南京大学 | 以GeoJSON格式结构化方式存储地理数据的MongoDB集群的地理数据读写方法 |
US10289495B1 (en) * | 2014-12-19 | 2019-05-14 | EMC IP Holding Company LLC | Method and system for performing an item level restore from a backup |
CN105843879B (zh) * | 2016-03-21 | 2019-07-09 | 刘春阳 | 基于光盘的异构类型数据库存储系统及利用该系统的方法 |
CN109947789B (zh) * | 2019-01-28 | 2023-12-19 | 平安科技(深圳)有限公司 | 一种多数据库的数据处理的方法、装置、计算机设备及存储介质 |
CN110069452B (zh) * | 2019-04-26 | 2020-04-03 | 北京字节跳动网络技术有限公司 | 数据存储方法、装置和计算机可读存储介质 |
CN111399762B (zh) * | 2019-11-27 | 2021-06-18 | 杭州海康威视系统技术有限公司 | 数据存储方法、装置及存储系统 |
CN111159192B (zh) * | 2019-12-30 | 2023-09-05 | 北京因特睿软件有限公司 | 基于大数据的数据入库方法、装置、存储介质和处理器 |
CN111309985B (zh) * | 2020-03-10 | 2023-08-25 | 支付宝(杭州)信息技术有限公司 | 基于PostgreSQL数据库的高维向量存储方法和装置 |
-
2022
- 2022-01-12 CN CN202210034505.4A patent/CN114356851B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779349A (zh) * | 2021-08-11 | 2021-12-10 | 中央广播电视总台 | 数据检索系统、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114356851A (zh) | 2022-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114356851B (zh) | 数据文件的存储方法、装置、电子设备及存储介质 | |
CN107038207B (zh) | 一种数据查询方法、数据处理方法及装置 | |
US20210182237A1 (en) | Source data assignment based on metadata | |
CN102214208A (zh) | 一种基于非结构化文本生成结构化信息实体的方法与设备 | |
CN112214472A (zh) | 气象格点数据的存储及查询方法、装置及存储介质 | |
CN112508720A (zh) | 保险客户身份属性的筛选方法、筛选装置及电子设备 | |
CN114153791A (zh) | 文件快速检索方法、装置、电子设备及存储介质 | |
US9798746B2 (en) | Dynamic map template discovery and map creation | |
CN115237920A (zh) | 面向负载的数据索引推荐方法及其装置、存储介质 | |
CN118297056A (zh) | 文本主题词生成方法及相关设备 | |
US9465658B1 (en) | Task distribution over a heterogeneous environment through task and consumer categories | |
CN116610700A (zh) | 查询语句检测方法及装置、存储介质 | |
CN114637761B (zh) | 业务对象生成方法及装置 | |
Levin et al. | owlcpp: a C++ library for working with OWL ontologies | |
CN112100132B (zh) | 一种已删除文件类型识别方法、装置、电子设备及存储介质 | |
CN112379915B (zh) | 一种源代码处理方法及装置 | |
CN111209062A (zh) | 信息获取方法、装置、电子设备及计算机存储介质 | |
CN112463798B (zh) | 跨数据库数据提取方法、装置、电子设备及存储介质 | |
CN117555533B (zh) | 代码生成方法、电子设备及存储介质 | |
CN117290334A (zh) | 一种sql数据库的问题排查方法及装置 | |
WO2024069941A1 (ja) | 情報処理装置、検索方法、及び検索プログラム | |
JP7124961B2 (ja) | 情報処理装置、情報処理システムおよび情報処理プログラム | |
CN116069755A (zh) | mapper文件处理方法及相关设备 | |
CN117763209A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN116069784A (zh) | 一种用于erp系统的数据处理方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |