CN116610735A - 一种数据存储的智能管理方法及系统 - Google Patents
一种数据存储的智能管理方法及系统 Download PDFInfo
- Publication number
- CN116610735A CN116610735A CN202310554884.4A CN202310554884A CN116610735A CN 116610735 A CN116610735 A CN 116610735A CN 202310554884 A CN202310554884 A CN 202310554884A CN 116610735 A CN116610735 A CN 116610735A
- Authority
- CN
- China
- Prior art keywords
- information
- derivative
- tag
- result
- data tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013500 data storage Methods 0.000 title claims abstract description 45
- 238000007726 management method Methods 0.000 title claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims abstract description 89
- 238000001212 derivatisation Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000008569 process Effects 0.000 claims abstract description 31
- 238000012216 screening Methods 0.000 claims abstract description 14
- 238000012163 sequencing technique Methods 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims description 37
- 238000003860 storage Methods 0.000 claims description 28
- 230000005540 biological transmission Effects 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 5
- 238000009795 derivation Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 238000000227 grinding Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据存储的智能管理方法及系统,涉及数据处理技术领域,该方法包括:获取目标数据库的环境信息;根据存储背景信息获得原始数据标签集合;通过随机进行标签衍生处理,将处理结果输入衍生分析模型;对输出结果进行筛选,获得初始衍生结果;结合存储背景信息进行n次标签衍生处理,获得迭代衍生分析结果;构建关联路径,进行排序后获得关联路径序列;将原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中;根据空间配置结果进行目标数据库的数据存储管理。本发明解决了现有技术中数据存储管理混乱,数据存储效率低的技术问题,达到了提升数据存储管理的智能化程度的技术效果。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种数据存储的智能管理方法及系统。
背景技术
通过数据存储的空间,用户可以将数据保存在设备上,在需要的时候对设备上存储的数据进行更新、修改、删除等操作。然而,随着数据量的增多,产生的子目录数量众多,会出现存储空间分配不均的情况,导致数据存储出现问题。现有技术中数据存储管理混乱,数据存储效率低的技术问题。
发明内容
本申请提供了一种数据存储的智能管理方法及系统,用于针对解决现有技术中数据存储管理混乱,数据存储效率低的技术问题。
鉴于上述问题,本申请提供了一种数据存储的智能管理方法及系统。
本申请的第一个方面,提供了一种数据存储的智能管理方法,所述方法包括:
获取目标数据库的环境信息,其中,所述环境信息包括存储背景信息和运行环境信息;
基于所述存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合;
以所述原始数据标签集合为初始化标签,结合所述存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合;
遍历所述第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,所述第一衍生度分析结果包括第一衍生度集合;
根据所述运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果;
基于所述初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入所述衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数;
根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据所述迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列;
将所述原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,所述空间配置信息包括端口信息和传输路径信息;
根据所述原始数据标签集合、所述端口信息和传输路径信息进行目标数据库的数据存储管理。
本申请的第二个方面,提供了一种数据存储的智能管理系统,所述系统包括:
环境信息获得模块,所述环境信息获得模块用于获取目标数据库的环境信息,其中,所述环境信息包括存储背景信息和运行环境信息;
原始数据标签获得模块,所述原始数据标签获得模块用于基于所述存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合;
标签衍生处理模块,所述标签衍生处理模块用于以所述原始数据标签集合为初始化标签,结合所述存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合;
第一衍生度获得模块,所述第一衍生度获得模块用于遍历所述第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,所述第一衍生度分析结果包括第一衍生度集合;
初始衍生结果获得模块,所述初始衍生结果获得模块用于根据所述运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果;
迭代衍生分析模块,迭代衍生分析模块用于基于所述初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入所述衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数;
路径序列获得模块,所述路径序列获得模块用于根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据所述迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列;
空间配置信息获得模块,所述空间配置信息获得模块用于将所述原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,所述空间配置信息包括端口信息和传输路径信息;
数据存储管理模块,所述数据存储管理模块用于根据所述原始数据标签集合、所述端口信息和传输路径信息进行目标数据库的数据存储管理。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请通过获取目标数据库的环境信息,其中,环境信息包括存储背景信息和运行环境信息,然后基于存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合,通过以原始数据标签集合为初始化标签,结合存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合,遍历第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,第一衍生度分析结果包括第一衍生度集合,然后根据运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果,基于初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数,然后根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列,基于原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,空间配置信息包括端口信息和传输路径信息,然后根据原始数据标签集合、端口信息和传输路径信息进行目标数据库的数据存储管理。达到了提高数据存储管理效率,提升数据管理准确性的技术效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据存储的智能管理方法流程示意图;
图2为本申请实施例提供的一种数据存储的智能管理方法中根据第一约束信息和第二约束信息对标签衍生处理过程进行约束的流程示意图;
图3为本申请实施例提供的一种数据存储的智能管理方法中将第一衍生度分析结果作为初始衍生结果的流程示意图;
图4为本申请实施例提供的一种数据存储的智能管理系统结构示意图。
附图标记说明:环境信息获得模块11,原始数据标签获得模块12,标签衍生处理模块13,第一衍生度获得模块14,初始衍生结果获得模块15,迭代衍生分析模块16,路径序列获得模块17,空间配置信息获得模块18,数据存储管理模块19。
实施方式
本申请通过提供了一种数据存储的智能管理方法及系统,用于针对解决现有技术中数据存储管理混乱,数据存储效率低的技术问题。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
实施例
如图1所示,本申请提供了一种数据存储的智能管理方法,其中,所述方法包括:
步骤S100:获取目标数据库的环境信息,其中,所述环境信息包括存储背景信息和运行环境信息;
在一个可能的实施例中,目标数据库是需要进行存储管理,对存放其中的数据进行智能化管理,从而使数据库的存储效率更高的任意一个数据库。所述环境信息是对所述目标数据库的运行状态进行描述的信息,包括存储背景信息和运行环境信息。其中,所述存储背景信息是根据所述目标数据库的使用用途确定的,对目标数据库中存放数据的属性进行描述。数据属性包括数据类别、数据用途等,示例性的,如果目标数据库是对电子设备的生产信息进行存放的数据库,那么目标数据库的存储背景信息就是电子设备生产相关的数据。所述运行环境信息是对目标数据库的运行参数进行描述的信息,反映了目标数据库的运行能力,包括内存配置参数和时间值配置参数。示例性的,用于配置数据缓冲区大小的参数,参数默认单位为数据块的个数,如果将参数的值设为8,当每个数据块的大小为16KB,则数据缓冲区的大小为8*16=128KB。通过对目标数据库的环境信息进行获取,为后续对数据库的配置提供基础数据。
步骤S200:基于所述存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合;
在本申请的实施例中,所述云标签库是在云端对数据标签进行存放的数据库,包含各种存储背景对应的数据标签。通过以所述存储背景信息中的关键词为索引,对所述云标签库中的数据标签进行匹配,也就是说,以存储背景信息中的关键词,对云标签库中的背景信息进行匹配,根据匹配结果获得对应的数据标签集合,将其设定为原始数据标签集合。其中,所述原始数据标签集合是符合所述目标数据库的数据标签。在本申请中,原始数据标签集合中的标签是目标数据库存储的初始数据。示例性的,当目标数据库是对电子设备生产相关数据进行存储的数据库时,原始数据标签集合中的标签是生产的初始数据,包括订单标签、产品标签、设备标签、工艺标签等在电子设备进行生成之前的数据标签。当电子设备进入生产过程后,在原始数据标签集合下会根据生产的不同阶段生成对应的子标签。如在工艺标签下获得磨削工艺标签,其中,磨削工艺标签是对电子设备在磨削工艺过程中产生的数据进行标注进行的标签,包括磨削工艺加工参数标签、磨削工艺质检结果标签等。通过原始数据标签集合可以为后续标签衍生提供基础标签,作为后续衍生处理过程的被衍生对象。
步骤S300:以所述原始数据标签集合为初始化标签,结合所述存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合;
进一步的,如图2所示,本申请实施例步骤S300还包括:
步骤S310:提取所述目标数据库的业务设置模块,并根据业务设置模块中的细分项与云标签库进行属性匹配,获得业务匹配标签属性,并将所述业务匹配标签属性作为第一约束信息;
步骤S320:基于所述目标数据库的运行环境信息获得数据库设置参数,根据所述数据库设置参数匹配多个样本数据库;
步骤S330:对所述多个样本数据库中的标签数量进行峰值提取,获得标签数量峰值,其中,所述标签数量峰值包括标签数量最小值和标签数量最大值;
步骤S340:将所述标签数量峰值作为第二约束信息;
步骤S350:根据所述第一约束信息和第二约束信息对标签衍生处理过程进行约束。
在一个可能的实施例中,所述初始化标签是在标签衍生处理过程中的被衍生对象,根据所述存储背景信息的目标数据库使用用途,确定标签衍生处理的方向,通过利用入侵杂草算法对初始化标签进行扩充生长,也就是对使用初始化标签中的信息后获得的子代信息标签进行衍生。其中,所述入侵杂草优化算法是通过模拟杂草种子在自然界的扩散、生长、繁殖和竞争性消亡的过程,从而对较少的初始样本进行衍生,优点是每一个初始化标签都可以产生子代,也就是说每一个初始化标签,不管标签中信息含量的多少都可以产生对初始化标签被使用后产生信息进行标注的标签,从而有效达到了避免衍生过程遗漏,提高数据的全面性的技术效果。
在一个可能的实施例中,所述第一衍生数据标签集合是对所述原始数据标签集合进行一次衍生,获得的对第一批子代数据进行标注的标签集合。示例性的,在电子设备生产过程中,根据原始数据标签集合中工艺标签进行一次衍生,也就是对电子设备生产过程中使用的第一个工艺产生的数据进行标记获取,如第一个工艺为材料检验,也对材料检验的数据进行标记,获得检验项目标签,如光泽度标签、强度标签、硬度标签等,将获得的检验项目标签设为第一衍生数据标签集合。
具体而言,在利用入侵杂草算法结合存储背景信息对初始化标签进行标签衍生处理的过程中,以第一约束信息和第二约束信息对标签衍生处理过程进行约束。所述第一约束信息是对标签衍生处理过程中的标签衍生方向进行约束的信息。所述第二约束信息是对标签衍生处理过程中每一次衍生的数量进行约束的信息。
在本申请的实施例中,从所述目标数据库中获取业务设置模块(是对目标数据库中存放数据对应的业务信息进行设置的功能模块),从而对业务设置模块中设置的业务子项进行得到细分项,此时的细分项根据衍生的次数进行获取,也就是说,在第一次标签衍生时,对一次细分业务子项(业务设置模块设置好的分类业务下的第一级子业务)进行获取,将其设定为细分项。在第n次标签衍生时,对第n级子业务进行获取,将其设定为细分项。以细分项为索引,从所述云标签库中进行属性匹配,获得所述业务匹配标签属性。其中,所述业务匹配标签属性是对业务匹配标签所属的类型进行描述的信息,包括工艺、质检、生产等属性。通过将所述业务匹配标签属性作为第一约束信息对衍生过程中产生的子代标签类型进行约束,从而避免衍生出的子代标签并不适用于目标数据库的存储对象。
具体的,通过根据所述目标数据库的运行环境信息对数据库的设置参数进行提取,从而获得数据库的运行能力。根据设置参数(如缓冲区配置参数、内存配置参数、时间值配置参数)为索引,在云端匹配与设置参数相同的多个样本数据库。通过对多个样本数据库中的标签数量进行峰值提取,也就是对获得的多个样本数据库标签数量的最大值和最小值进行获取,得到所述标签数量峰值。并将所述标签数量峰值作为第二约束信息,对随机标签衍生过程中产生的标签数量进行约束。
步骤S400:遍历所述第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,所述第一衍生度分析结果包括第一衍生度集合;
进一步的,本申请实施例步骤S300还包括:
所述衍生分析模型包括衍生度计算公式,其中,所述衍生度计算公式用于衍生数据标签与原始数据标签之间的信息扩充程度:
所述衍生度计算公式为:
其中,为衍生度,/>为衍生数据标签的信息量,/>为原始数据标签的信息量,n为迭代总次数,k为得到衍生数据标签时迭代的次数,k为大于等于1的整数,/>为衍生数据标签,X为原始数据标签。
进一步的,本申请实施例步骤S400还包括:
衍生数据标签信息量计算公式为:
其中,为迭代获得进行k次迭代时获得的衍生标签总数;
原始数据标签信息量计算公式为:
其中,为原始数据标签的标签总数。
具体而言,通过将所述第一衍生数据标签集合中的所有标签输入所述衍生分析模型中,利用衍生分析模型中的衍生度计算公式对衍生数据标签与原始数据标签之间的信息扩充程度进行量化计算。进而,根据所述衍生度计算公式,对第一衍生数据标签集合中的每一个衍生数据标签对原始数据标签对应数据的利用以及信息扩充程度进行量化计算,获得所述第一衍生度分析结果集合,其中,所述第一衍生度分析结果集合包括第一衍生度集合。示例性的,当计算第一衍生度分析集合时,n为1,k为1,第一衍生度就是衍生数据标签的信息量加上原始数据标签的信息量。
在一个可能的实施例中,所述衍生度计算公式根据进行衍生度计算时获得衍生数据标签时迭代的总次数,结合获得的衍生数据标签对应数据的信息量,以及原始数据包含的信息量,对经过n次迭代后获得的数据库中一个原始数据标签经过迭代后包含的所有信息量。所述衍生数据标签信息量计算公式是用于对衍生数据标签对应的数据量进行量化的公式。所述原始数据标签信息量计算公式是对原始数据标签对应的信息量进行计算的公式。
步骤S500:根据所述运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果;
进一步的,如图3所示,本申请实施例步骤S500还包括:
步骤S510:对所述第一衍生分析结果进行信息量提取,获得第一信息量计算结果;
步骤S520:基于所述运行环境信息提取目标数据库的负载信息,判断所述第一信息量计算结果是否大于所述负载信息,若是,则对第一衍生分析结果进行筛选;
步骤S530:若否,则将所述第一衍生度分析结果作为初始衍生结果。
进一步的,本申请实施例步骤S500包括:
步骤S540:根据所述第一衍生度集合对所述第一衍生数据标签集合进行从大到小排序,获得第一衍生数据标签序列;
步骤S550:根据所述负载信息确定信息量阈值,利用所述信息量阈值对所述第一衍生数据标签序列进行筛选,获得所述初始衍生结果。
在一个可能的实施例中,通过对所述第一衍生分析结果中的衍生度进行叠加,获得所述第一信息量计算结果,其中,所述第一信息量计算结果反映了经过标签衍生处理后目标数据库需要的存储容量。进而,根据所述运行环境信息中目标数据库的内存配置参数,获得目标数据库可以容纳的最高存储容量,将其作为负载信息。进而,判断所述第一信息量计算结果是否大于所述负载信息,若是,则表明此时第一衍生分析结果中生成的衍生标签过多,目标数据库存储空间不能满足。若否,则表明此时第一衍生度分析结果中衍生标签可以在目标数据库中进行存储,从而将其作为初始衍生结果。
在一个实施例中,通过根据所述第一衍生数据标签集合中每一个衍生数据标签的衍生度大小,按照衍生度从大到小的顺序,对第一衍生数据标签集合进行标签排序,从而获得所述第一衍生数据标签序列。进而,根据所述负载信息确定目标数据库可以承载的信息量阈值,以此为依据对第一衍生数据标签序列进行筛选,根据筛选后的结果获得所述初始衍生结果。
步骤S600:基于所述初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入所述衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数;
步骤S700:根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据所述迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列;
在一个实施例中,利用与第一次标签衍生处理相同的方法进行n次标签衍生处理,将获得的结果输入所述衍生分析模型中进行衍生度计算,获得所述迭代衍生分析结果。根据迭代衍生分析结果中的衍生标签进行原始数据溯源,也就是获取其对应的原始数据,根据溯源结果构建从原始数据标签集合到所述跌倒衍生分析结果之间的关联路径,并按照衍生度的大小对关联路径进行排序,从而获得所述关联路径序列。
步骤S800:将所述原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,所述空间配置信息包括端口信息和传输路径信息;
步骤S900:根据所述原始数据标签集合、所述端口信息和传输路径信息进行目标数据库的数据存储管理。
进一步的,本申请实施例步骤S800还包括:
步骤S810:获取目标数据库在历史时间段内的记录数据,获得历史数据集,其中,所述历史数据集包括历史原始数据标签集合、历史关联路径序列、历史运行环境信息和历史空间配置信息;
步骤S820:以历史数据集对以卷积神经网络为基础框架构建的空间配置模型进行训练,直至训练至收敛,获得所述空间配置模型。
在一个可能的实施例中,所述空间配置模型是对目标数据库内的空间划分以及配置信息进行智能化分析的功能模型,以卷积神经网络为基础框架,以所述原始数据标签集合、关联路径序列和运行环境信息为输入数据,输出所述空间配置信息,包括端口信息和传输路径信息。其中,所述端口信息是每个存储空间对应的端口,所述传输路径是每个存储空间的传输路径。
通过使用历史数据集对空间配置模型进行训练,并对历史空间配置信息进行标注,根据标注的历史空间配置信息对训练过程进行监督,直至模型训练至收敛,获得训练完成的所述空间配置模型。
具体而言,通过根据原始数据标签集合和传输路径信息进行存储路径的确定,然后结合端口信息确定数据存储端口,对目标数据库的数据存储进行智能化管理。可以保证数据存储的空间以及存储路径的准确性。
综上所述,本申请实施例至少具有如下技术效果:
本申请通过对目标数据库的环境进行分析,进而获得原始数据标签集合,通过以原始数据标签集合为初始化标签,进行标签衍生处理获得符合存储背景信息的衍生标签,进而利用衍生分析模型对衍生标签的扩充程度进行分析,从而结合原始数据标签进行关联路径构建,使用智能化的空间配置信息对目标数据库的配置情况进行确定,从而达到了对数据进行高效、准确的存储管理。
实施例
基于与前述实施例中一种数据存储的智能管理方法相同的发明构思,如图4所示,本申请提供了一种数据存储的智能管理系统,本申请实施例中的系统与方法实施例基于同样的发明构思。其中,所述系统包括:
环境信息获得模块11,所述环境信息获得模块11用于获取目标数据库的环境信息,其中,所述环境信息包括存储背景信息和运行环境信息;
原始数据标签获得模块12,所述原始数据标签获得模块12用于基于所述存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合;
标签衍生处理模块13,所述标签衍生处理模块13用于以所述原始数据标签集合为初始化标签,结合所述存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合;
第一衍生度获得模块14,所述第一衍生度获得模块14用于遍历所述第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,所述第一衍生度分析结果包括第一衍生度集合;
初始衍生结果获得模块15,所述初始衍生结果获得模块15用于根据所述运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果;
迭代衍生分析模块16,迭代衍生分析模块16用于基于所述初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入所述衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数;
路径序列获得模块17,所述路径序列获得模块17用于根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据所述迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列;
空间配置信息获得模块18,所述空间配置信息获得模块18用于将所述原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,所述空间配置信息包括端口信息和传输路径信息;
数据存储管理模块19,所述数据存储管理模块19用于根据所述原始数据标签集合、所述端口信息和传输路径信息进行目标数据库的数据存储管理。
进一步的,所述系统还包括:
第一约束信息设定单元,所述第一约束信息设定单元用于提取所述目标数据库的业务设置模块,并根据业务设置模块中的细分项与云标签库进行属性匹配,获得业务匹配标签属性,并将所述业务匹配标签属性作为第一约束信息;
样本数据库获得单元,所述样本数据库获得单元用于基于所述目标数据库的运行环境信息获得数据库设置参数,根据所述数据库设置参数匹配多个样本数据库;
标签数量峰值获得单元,所述标签数量峰值获得单元用于对所述多个样本数据库中的标签数量进行峰值提取,获得标签数量峰值,其中,所述标签数量峰值包括标签数量最小值和标签数量最大值;
第二约束信息设定单元,所述第二约束信息设定单元用于将所述标签数量峰值作为第二约束信息;
衍生处理约束单元,所述衍生处理约束单元用于根据所述第一约束信息和第二约束信息对标签衍生处理过程进行约束。
进一步的,所述系统还包括:
所述衍生分析模型包括衍生度计算公式,其中,所述衍生度计算公式用于衍生数据标签与原始数据标签之间的信息扩充程度:
所述衍生度计算公式为:
其中,为衍生度,/>为衍生数据标签的信息量,/>为原始数据标签的信息量,n为迭代总次数,k为得到衍生数据标签时迭代的次数,k为大于等于1的整数,/>为衍生数据标签,X为原始数据标签。
进一步的,所述系统还包括:
衍生数据标签信息量计算公式为:
其中,为迭代获得进行k次迭代时获得的衍生标签总数;
原始数据标签信息量计算公式为:
其中,为原始数据标签的标签总数。
进一步的,所述系统还包括:
第一信息量计算结果获得单元,所述第一信息量计算结果获得单元用于对所述第一衍生分析结果进行信息量提取,获得第一信息量计算结果;
信息量计算结果判断单元,所述信息量计算结果判断单元用于基于所述运行环境信息提取目标数据库的负载信息,判断所述第一信息量计算结果是否大于所述负载信息,若是,则对第一衍生分析结果进行筛选;
初始衍生结果设定单元,所述初始衍生结果设定单元用于若否,则将所述第一衍生度分析结果作为初始衍生结果。
进一步的,所述系统还包括:
标签序列获得单元,所述标签序列获得单元用于根据所述第一衍生度集合对所述第一衍生数据标签集合进行从大到小排序,获得第一衍生数据标签序列;
衍生结果获得单元,所述衍生结果获得单元用于根据所述负载信息确定信息量阈值,利用所述信息量阈值对所述第一衍生数据标签序列进行筛选,获得所述初始衍生结果。
进一步的,所述系统还包括:
历史数据集获得单元,所述历史数据集获得单元用于获取目标数据库在历史时间段内的记录数据,获得历史数据集,其中,所述历史数据集包括历史原始数据标签集合、历史关联路径序列、历史运行环境信息和历史空间配置信息;
配置模型获得单元,所述配置模型获得单元用于以历史数据集对以卷积神经网络为基础框架构建的空间配置模型进行训练,直至训练至收敛,获得所述空间配置模型。
需要说明的是,上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本说明书和附图仅仅是本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。
Claims (8)
1.一种数据存储的智能管理方法,其特征在于,所述方法包括:
获取目标数据库的环境信息,其中,所述环境信息包括存储背景信息和运行环境信息;
基于所述存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合;
以所述原始数据标签集合为初始化标签,结合所述存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合;
遍历所述第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,所述第一衍生度分析结果包括第一衍生度集合;
根据所述运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果;
基于所述初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入所述衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数;
根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据所述迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列;
将所述原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,所述空间配置信息包括端口信息和传输路径信息;
根据所述原始数据标签集合、所述端口信息和传输路径信息进行目标数据库的数据存储管理。
2.如权利要求1所述的方法,其特征在于,所述方法包括:
提取所述目标数据库的业务设置模块,并根据业务设置模块中的细分项与云标签库进行属性匹配,获得业务匹配标签属性,并将所述业务匹配标签属性作为第一约束信息;
基于所述目标数据库的运行环境信息获得数据库设置参数,根据所述数据库设置参数匹配多个样本数据库;
对所述多个样本数据库中的标签数量进行峰值提取,获得标签数量峰值,其中,所述标签数量峰值包括标签数量最小值和标签数量最大值;
将所述标签数量峰值作为第二约束信息;
根据所述第一约束信息和第二约束信息对标签衍生处理过程进行约束。
3.如权利要求2所述的方法,其特征在于,所述方法包括:
所述衍生分析模型包括衍生度计算公式,其中,所述衍生度计算公式用于衍生数据标签与原始数据标签之间的信息扩充程度:
所述衍生度计算公式为:
其中,为衍生度,/>为衍生数据标签的信息量,/>为原始数据标签的信息量,n为迭代总次数,k为得到衍生数据标签时迭代的次数,k为大于等于1的整数,/>为衍生数据标签,X为原始数据标签。
4.如权利要求3所述的方法,其特征在于,所述方法包括:
衍生数据标签信息量计算公式为:
其中,为迭代获得进行k次迭代时获得的衍生标签总数;
原始数据标签信息量计算公式为:
其中,为原始数据标签的标签总数。
5.如权利要求1所述的方法,其特征在于,所述方法包括:
对所述第一衍生分析结果进行信息量提取,获得第一信息量计算结果;
基于所述运行环境信息提取目标数据库的负载信息,判断所述第一信息量计算结果是否大于所述负载信息,若是,则对第一衍生分析结果进行筛选;
若否,则将所述第一衍生度分析结果作为初始衍生结果。
6.如权利要求5所述的方法,其特征在于,所述方法包括:
根据所述第一衍生度集合对所述第一衍生数据标签集合进行从大到小排序,获得第一衍生数据标签序列;
根据所述负载信息确定信息量阈值,利用所述信息量阈值对所述第一衍生数据标签序列进行筛选,获得所述初始衍生结果。
7.如权利要求1所述的方法,其特征在于,所述方法包括:
获取目标数据库在历史时间段内的记录数据,获得历史数据集,其中,所述历史数据集包括历史原始数据标签集合、历史关联路径序列、历史运行环境信息和历史空间配置信息;
以历史数据集对以卷积神经网络为基础框架构建的空间配置模型进行训练,直至训练至收敛,获得所述空间配置模型。
8.一种数据存储的智能管理系统,其特征在于,所述系统包括:
环境信息获得模块,所述环境信息获得模块用于获取目标数据库的环境信息,其中,所述环境信息包括存储背景信息和运行环境信息;
原始数据标签获得模块,所述原始数据标签获得模块用于基于所述存储背景信息与云标签库进行标签匹配,根据匹配结果获得原始数据标签集合;
标签衍生处理模块,所述标签衍生处理模块用于以所述原始数据标签集合为初始化标签,结合所述存储背景信息随机进行标签衍生处理,获得第一衍生数据标签集合;
第一衍生度获得模块,所述第一衍生度获得模块用于遍历所述第一衍生数据标签集合输入衍生分析模型中,获得第一衍生度分析结果,其中,所述第一衍生度分析结果包括第一衍生度集合;
初始衍生结果获得模块,所述初始衍生结果获得模块用于根据所述运行环境信息对第一衍生分析结果进行筛选,获得初始衍生结果;
迭代衍生分析模块,迭代衍生分析模块用于基于所述初始衍生结果结合存储背景信息进行n次标签衍生处理,并将处理结果输入所述衍生分析模型中获得迭代衍生分析结果,其中,n是迭代总次数,为大于等于1的整数;
路径序列获得模块,所述路径序列获得模块用于根据迭代衍生分析结果和原始数据标签集合构建关联路径,并根据所述迭代衍生分析结果中的衍生度集合对关联路径进行排序,获得关联路径序列;
空间配置信息获得模块,所述空间配置信息获得模块用于将所述原始数据标签集合、关联路径序列和运行环境信息输入空间配置模型中,输出空间配置信息,其中,所述空间配置信息包括端口信息和传输路径信息;
数据存储管理模块,所述数据存储管理模块用于根据所述原始数据标签集合、所述端口信息和传输路径信息进行目标数据库的数据存储管理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310554884.4A CN116610735B (zh) | 2023-05-17 | 2023-05-17 | 一种数据存储的智能管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310554884.4A CN116610735B (zh) | 2023-05-17 | 2023-05-17 | 一种数据存储的智能管理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116610735A true CN116610735A (zh) | 2023-08-18 |
CN116610735B CN116610735B (zh) | 2024-02-20 |
Family
ID=87675897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310554884.4A Active CN116610735B (zh) | 2023-05-17 | 2023-05-17 | 一种数据存储的智能管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116610735B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956363A (zh) * | 2023-09-20 | 2023-10-27 | 微网优联科技(成都)有限公司 | 一种基于云电脑技术的数据管理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111752958A (zh) * | 2020-05-27 | 2020-10-09 | 中国平安财产保险股份有限公司 | 智能关联标签方法、装置、计算机设备及存储介质 |
US20210117869A1 (en) * | 2018-03-29 | 2021-04-22 | Benevolentai Technology Limited | Ensemble model creation and selection |
CN114860759A (zh) * | 2022-05-18 | 2022-08-05 | 建信金融科技有限责任公司 | 一种数据处理方法、装置、设备及可读存储介质 |
CN115438046A (zh) * | 2022-08-25 | 2022-12-06 | 北京万里开源软件有限公司 | 一种基于htap数据库的分布式储存方法 |
-
2023
- 2023-05-17 CN CN202310554884.4A patent/CN116610735B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210117869A1 (en) * | 2018-03-29 | 2021-04-22 | Benevolentai Technology Limited | Ensemble model creation and selection |
CN111752958A (zh) * | 2020-05-27 | 2020-10-09 | 中国平安财产保险股份有限公司 | 智能关联标签方法、装置、计算机设备及存储介质 |
CN114860759A (zh) * | 2022-05-18 | 2022-08-05 | 建信金融科技有限责任公司 | 一种数据处理方法、装置、设备及可读存储介质 |
CN115438046A (zh) * | 2022-08-25 | 2022-12-06 | 北京万里开源软件有限公司 | 一种基于htap数据库的分布式储存方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956363A (zh) * | 2023-09-20 | 2023-10-27 | 微网优联科技(成都)有限公司 | 一种基于云电脑技术的数据管理方法及系统 |
CN116956363B (zh) * | 2023-09-20 | 2023-12-05 | 微网优联科技(成都)有限公司 | 一种基于云电脑技术的数据管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116610735B (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113688304A (zh) | 搜索推荐模型的训练方法、搜索结果排序的方法及装置 | |
CN111667022A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN109272332B (zh) | 一种基于递归神经网络的客户流失预测方法 | |
CN116610735B (zh) | 一种数据存储的智能管理方法及系统 | |
CN113298197B (zh) | 数据聚类方法、装置、设备及可读存储介质 | |
CN110472659B (zh) | 数据处理方法、装置、计算机可读存储介质和计算机设备 | |
CN115795329B (zh) | 一种基于大数据网格下的用电异常行为分析方法和装置 | |
CN114565196B (zh) | 基于政务热线的多事件趋势预判方法、装置、设备及介质 | |
Buschow et al. | Local dimension and recurrent circulation patterns in long-term climate simulations | |
CN114219562A (zh) | 模型的训练方法、企业信用评估方法和装置、设备、介质 | |
CN116186594A (zh) | 基于决策网络结合大数据实现环境变化趋势智能检测方法 | |
US6286012B1 (en) | Information filtering apparatus and information filtering method | |
CN116887201B (zh) | 一种基于用户分析的短信智能推送方法及系统 | |
CN111709766B (zh) | 一种用户行为预测方法、装置、存储介质及电子设备 | |
CN117611272A (zh) | 商品推荐方法、装置及电子设备 | |
CN116049644A (zh) | 特征筛选和聚类分箱方法、装置、电子设备及存储介质 | |
CN114048148A (zh) | 一种众包测试报告推荐方法、装置及电子设备 | |
CN113704617A (zh) | 物品推荐方法、系统、电子设备及存储介质 | |
CN113591632A (zh) | 一种基于多源数据的果树估产方法、装置及设备 | |
Keim et al. | Visual analytics challenges | |
CN117290612B (zh) | 一种基于行为分析的预测匹配方法及系统 | |
CN115455306B (zh) | 推送模型训练、信息推送方法、装置和存储介质 | |
CN113434295B (zh) | 基于边缘计算的农田监控方法、装置、设备及存储介质 | |
CN116910604A (zh) | 用户分类方法、装置、计算机设备、存储介质和程序产品 | |
Lawan et al. | Deep Learning Methods for Filter Extraction in Tomato fruits |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |