CN117827850B - 一种数据存储方法及系统 - Google Patents
一种数据存储方法及系统 Download PDFInfo
- Publication number
- CN117827850B CN117827850B CN202410252660.2A CN202410252660A CN117827850B CN 117827850 B CN117827850 B CN 117827850B CN 202410252660 A CN202410252660 A CN 202410252660A CN 117827850 B CN117827850 B CN 117827850B
- Authority
- CN
- China
- Prior art keywords
- data
- storage
- stored
- space
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013500 data storage Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000003860 storage Methods 0.000 claims abstract description 478
- 238000005457 optimization Methods 0.000 claims abstract description 113
- 238000013507 mapping Methods 0.000 claims abstract description 55
- 238000005192 partition Methods 0.000 claims abstract description 38
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000000638 solvent extraction Methods 0.000 claims abstract description 17
- 238000012300 Sequence Analysis Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims description 189
- 238000011084 recovery Methods 0.000 claims description 54
- 238000009826 distribution Methods 0.000 claims description 40
- 238000011156 evaluation Methods 0.000 claims description 33
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 230000011218 segmentation Effects 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 23
- 230000010354 integration Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 15
- 238000012795 verification Methods 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000004088 simulation Methods 0.000 claims description 5
- 238000013524 data verification Methods 0.000 claims description 4
- 238000009472 formulation Methods 0.000 claims description 4
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005206 flow analysis Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 4
- 239000008186 active pharmaceutical agent Substances 0.000 description 22
- 230000009286 beneficial effect Effects 0.000 description 17
- 230000004044 response Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000008439 repair process Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013523 data management Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001932 seasonal effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011985 exploratory data analysis Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1004—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1012—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using codes or arrangements adapted for a specific type of error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/217—Database tuning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据存储技术领域,尤其涉及一种数据存储方法及系统。所述方法包括以下步骤:获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;本发明通过空间时间优化、访问延迟优化、存储完整性预测和动态可复原编码等步骤,提高了数据存储上的效率和可靠性。
Description
技术领域
本发明涉及数据存储技术领域,尤其涉及一种数据存储方法及系统。
背景技术
近年来,云计算的普及推动了云端存储的发展。云存储服务提供商如Amazon S3、Microsoft Azure Blob Storage等提供了高度可扩展、弹性的存储解决方案。这种模型允许用户按需购买和管理存储资源,实现了更灵活、经济高效的数据存储。此外,分布式存储系统的发展也是关键趋势。Hadoop分布式文件系统(HDFS)和Google的分布式文件系统(GFS)等技术为大规模数据处理提供了支持,使得数据可以在多个节点上分布式存储和处理。当前,区块链技术的兴起为去中心化数据存储提供了新的可能性。去中心化的存储系统如IPFS和Filecoin将数据分散存储在全球网络中,提高了数据的安全性和可用性。然而目前尽管存储介质速度不断提高,但在某些情况下,访问速度仍可能成为限制因素,特别是在大规模数据处理时,同时数据备份和恢复的过程耗时导致数据存储的可靠性和效率仍然不高。
发明内容
基于此,有必要提供一种数据存储方法及系统,以解决至少一个上述技术问题。
为实现上述目的,一种数据存储方法,包括以下步骤:
步骤S1:获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
步骤S2:对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
步骤S3:将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;
步骤S4:利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明通过数据预处理确保了高质量的输入数据,而存储空间分区和映射编码则优化了存储结构,使数据更易于管理和访问。生成存储空间分块有助于提高数据的读写效率。整个过程的有益效果包括提高系统性能、降低存储成本,并确保数据的一致性和安全性。了解标准待存储数据中的时间相关特征。可能包括数据的周期性、趋势、季节性等。通过对时间序列的分析,可以更好地理解数据的变化规律,为后续的时间映射编码提供基础。通过时空编码和哈希索引,系统可以更好地组织和管理数据,减少检索时间。访问延迟的优化和传输通道的优化有助于提高数据的实时性和响应速度,从而改善系统性能。整个过程旨在通过合理的数据组织、哈希索引和传输优化,实现更高效的数据存储和访问。通过动态可复原编码和存储完整性预测,系统可以提供更加可靠和安全的数据存储服务。模拟传输冗余优化数据增加了数据的冗余度,提高了数据的容错性。存储完整性预测使系统能够及时发现并修复可能存在的数据损坏或丢失。生成统一存储API有助于提高系统的一致性和可维护性,简化对数据存储的管理和操作。整个过程的有益效果在于提高了数据存储的可靠性、完整性和可用性。因此,本发明通过空间时间优化、访问延迟优化、存储完整性预测和动态可复原编码等步骤,提高了数据存储上的效率和可靠性。
在本说明书中,提供了一种数据存储系统,用于执行上述的数据存储方法,该数据存储系统包括:
空间映射模块,用于获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
时间映射模块,用于对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
延迟优化模块,用于将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;
接口集成模块,用于利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明的有益效果在于通过获取原始需要存储的数据。对待存储数据进行预处理,生成标准待存储数据。这可能包括数据清理、格式转换、去重等操作,确保数据的质量和一致性。对标准待存储数据进行存储空间分区,生成待存储空间分区数据。这有助于更有效地管理和组织存储空间。对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳。这一步可以用于确定数据的存储时序特征。利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块。这有助于将数据按时间分块,更好地适应时间序列的特性。将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段。这一步将时空信息整合,形成完整的时空编码数据段。对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引。并行计算可以提高哈希计算的效率和速度。利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道。这有助于提高数据的访问效率和响应速度。利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据。这有助于提高数据的冗余度,增强数据的容错性。对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据。这一步有助于及时发现并纠正数据损坏或丢失的情况。利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API。这有助于简化数据存储的管理和操作。动态可复原编码和存储完整性预测有助于提高数据的完整性和可靠性,确保数据在存储和传输过程中不受损坏。通过并行哈希计算和访问延迟优化,可以提高对数据的访问效率,缩短响应时间。生成统一存储API有助于简化数据存储的管理和操作,提高系统的一致性和可维护性。时空编码和时间映射编码有助于更好地适应数据的时空特性,提高数据存储的灵活性和效率。因此,本发明通过空间时间优化、访问延迟优化、存储完整性预测和动态可复原编码等步骤,提高了数据存储上的效率和可靠性。
附图说明
图1为数据存储的步骤流程示意图;
图2为图1中步骤S3的详细实施步骤流程示意图;
图3为图2中步骤S34的详细实施步骤流程示意图;
图4为图1中步骤S4的详细实施步骤流程示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面结合附图对本发明专利的技术方法进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域所属的技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器方法和/或微控制器方法中实现这些功能实体。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
为实现上述目的,请参阅图1至图4,本发明提供一种数据存储方法,包括以下步骤:
步骤S1:获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
步骤S2:对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
步骤S3:将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;
步骤S4:利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明通过数据预处理确保了高质量的输入数据,而存储空间分区和映射编码则优化了存储结构,使数据更易于管理和访问。生成存储空间分块有助于提高数据的读写效率。整个过程的有益效果包括提高系统性能、降低存储成本,并确保数据的一致性和安全性。了解标准待存储数据中的时间相关特征。可能包括数据的周期性、趋势、季节性等。通过对时间序列的分析,可以更好地理解数据的变化规律,为后续的时间映射编码提供基础。通过时空编码和哈希索引,系统可以更好地组织和管理数据,减少检索时间。访问延迟的优化和传输通道的优化有助于提高数据的实时性和响应速度,从而改善系统性能。整个过程旨在通过合理的数据组织、哈希索引和传输优化,实现更高效的数据存储和访问。通过动态可复原编码和存储完整性预测,系统可以提供更加可靠和安全的数据存储服务。模拟传输冗余优化数据增加了数据的冗余度,提高了数据的容错性。存储完整性预测使系统能够及时发现并修复可能存在的数据损坏或丢失。生成统一存储API有助于提高系统的一致性和可维护性,简化对数据存储的管理和操作。整个过程的有益效果在于提高了数据存储的可靠性、完整性和可用性。因此,本发明通过空间时间优化、访问延迟优化、存储完整性预测和动态可复原编码等步骤,提高了数据存储上的效率和可靠性。
本发明实施例中,参考图1所述,为本发明一种数据存储方法的步骤流程示意图,在本实例中,所述一种数据存储方法包括以下步骤:
步骤S1:获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
本发明实施例中,通过从某个来源(可能是传感器、用户输入、其他系统等)获取需要存储的数据。这可能包括文本、图像、视频、音频等各种类型的数据,对待存储数据进行数据清理、去噪、标准化或其他预处理操作,以确保数据的一致性和质量。这也可能包括将数据转换为某种标准格式,以便后续处理,将数据划分为不同的存储空间分区。分区可以根据数据的类型、访问频率、大小等因素进行划分。这有助于更有效地管理和检索数据。空间映射编码通常指的是将数据映射到特定的存储空间地址或块。这可以帮助提高存储效率和访问速度。编码可能包括对数据进行哈希、压缩或其他转换以适应特定存储结构,生成待存储数据空间分块。
步骤S2:对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
本发明实施例中,通过对标准待存储数据进行初步的探索性数据分析,了解数据的分布、趋势和周期性。选择适当的时间序列分析方法,例如移动平均、指数平滑、季节性分解等,以揭示数据中的模式和趋势。从数据中提取时间戳信息,确保时间序列的正确排序。对时间戳进行处理,可能包括归一化、截取关键信息等,生成用于存储空间编码的时间戳。根据需求确定如何将时间划分为块。这可以是固定时间间隔、基于事件触发、基于数据变化等。选择适当的编码方法,例如将时间戳映射到特定范围的整数、使用哈希函数,或者其他编码方式。将标准待存储数据根据时间映射编码分成时间块,形成待存储数据时间分块。
步骤S3:将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;
本发明实施例中,通过根据需求,将待存储数据空间分块和待存储数据时间分块进行片段分割。这可能根据数据的空间特征和时间特征进行切分,例如根据数据的位置、时间范围、大小等因素进行分割。片段分割可以采用一些规则或算法来确定分割点,例如固定的分割大小、基于数据特征的动态分割等。将待存储时空编码数据段并行地应用哈希函数。并行计算可以利用多线程或分布式计算来提高计算速度。哈希函数可以根据需要选择,例如MD5、SHA-1、SHA-256等。注意选择具有良好分布性和较低冲突率的哈希函数。将并行哈希计算得到的哈希值组织成标准存储哈希索引。索引可以采用哈希表、B+树等数据结构,以支持快速的索引查询和访问。索引的设计可以根据数据的特点和查询需求进行优化。例如,可以使用多级索引结构、压缩索引等方法来提高索引的效率和存储利用率。使用标准存储哈希索引,在访问时对待存储时空编码数据段进行访问延迟优化。这可能包括数据预取、缓存、压缩等技术,以减少数据访问延迟。根据访问需求和网络环境,设计和建立优化的传输通道。这可能包括优化网络带宽利用、数据分片传输、数据压缩等策略,以提高数据传输效率和性能。
步骤S4:利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明实施例中,通过选择适当的动态可复原编码算法,例如Erasure Coding(纠删码)或Reed-Solomon编码。这些算法可以通过添加冗余数据片段,实现在部分数据损坏或丢失的情况下进行数据恢复。将待存储时空编码数据段应用动态可复原编码,生成模拟传输冗余优化数据。这可以通过在原始数据块中添加冗余块或使用冗余编码来实现。设计存储完整性预测算法,该算法能够检测数据存储中的错误或损坏。这可能包括使用校验和、哈希函数、循环冗余检测(CRC)等技术。对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据。如果检测到错误或损坏,该算法可能会提供有关损坏位置和程度的信息。制定统一的接口规范,以便将存储完整性预测结果数据与原始时空编码数据段集成。这可能包括定义数据结构、元数据和错误修复机制等。利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成。确保集成后的数据保持一致性,并能够支持后续的存储和检索操作。基于集成后的数据设计和实现统一的存储 API。这个 API 应该提供标准的操作,例如写入数据、读取数据、删除数据等,并且在需要时执行动态可复原编码和存储完整性检测。确保统一存储 API 能够适应不同的存储介质和后端存储系统,以提供灵活性和可扩展性。
优选的,步骤S1包括以下步骤:
步骤S11:通过不同的API调用得到待存储数据;
步骤S12:对待存储数据进行存储数据预处理,生成标准待存储数据,其中数据预处理包括数据去噪、数据缺失值填充、数据格式转换和数据标准化;
步骤S13:对标准待存储数据进行数据分割,生成待存储分割数据;基于待存储分割数据对存储单元进行自适应存储边界检测,生成存储单元边界地图;基于存储单元边界地图对待存储分割数据进行存储空间分区,生成待存储空间分区数据;
步骤S14:对待存储空间分区数据进行空间编码,生成待存储空间编码数据;对待存储空间编码数据进行空间映射,生成待存储空间映射数据;利用哈希算法对待存储空间映射数据进行数据校验,生成待存储数据空间分块。
本发明通过去噪、缺失值填充、格式转换和标准化等处理,可以提高待存储数据的质量,确保数据符合一定的标准和规范。通过将数据分割成适当大小的块并进行自适应存储边界检测,可以优化存储空间的利用效率,避免存储空间的浪费。利用哈希算法对存储空间映射数据进行数据校验,有助于检测数据的完整性,防止数据在存储过程中发生意外损坏或篡改。支持多种数据源的接入,使系统更加灵活,能够适应不同类型和格式的数据。通过对待存储空间分区数据进行空间编码和映射,可以进一步优化数据存储结构,提高读写效率。将数据分块有助于数据的分散存储,从而提高数据的安全性,降低特定区域的风险。
本发明实施例中,通过不同的API进行交互,从不同的数据源获取待存储数据。这可以涉及到与数据库、外部服务、文件系统或其他数据存储系统进行通信。利用合适的算法或方法,去除待存储数据中的噪音,确保数据的质量。使用适当的技术填充待存储数据中的缺失值,以防止由于缺失数据而导致的问题。将待存储数据转换为统一的格式,并进行标准化,以确保数据的一致性和易于处理。将标准待存储数据分割成适当的大小,形成待存储分割数据。通过分析待存储分割数据,自适应地检测存储单元的边界,形成存储单元边界地图。利用存储单元边界地图,对待存储分割数据进行存储空间分区,形成待存储空间分区数据。对待存储空间分区数据进行空间编码,将数据转换为编码格式。将编码后的数据进行空间映射,确定数据在实际存储介质上的位置。利用哈希算法对待存储空间映射数据进行数据校验,生成待存储数据空间分块,以确保数据的完整性和安全性。
优选的,步骤S2包括以下步骤:
步骤S21:对标准待存储数据进行数据变化分析,生成待存储变化数据;对待存储数据空间分块进行时间序列分析,得到待存储空间编码时间戳;
步骤S22:利用待存储空间编码时间戳对待存储变化数据进行时间段划分,生成待存储数据变化时间间隔;根据时间编码算法对待存储数据变化时间间隔进行时间编码,生成待存储时间编码数据;
步骤S23:对待存储时间编码数据进行时间映射,生成待存储时间映射数据;对待存储时间映射数据进行时间序列重构,生成待存储时间序列重构数据;
步骤S24:对待存储时间序列重构数据进行时间编码化验证,生成待存储数据时间分块。
本发明通过对标准待存储数据进行分析,可以提取数据的变化情况,识别数据中的趋势、模式或异常。对待存储数据空间分块进行时间序列分析,可以揭示数据在时间上的演变,有助于了解数据的动态性和趋势。利用待存储空间编码时间戳对数据变化进行时间段划分,有助于将数据的时间演变划分为有意义的部分,方便后续处理。根据时间编码算法对时间间隔进行编码,可以将时间信息转换为更紧凑的表示形式,减少存储空间的需求。对待存储时间编码数据进行时间映射,有助于确定数据在时间轴上的位置,为后续的时间序列重构提供基础。通过对时间映射数据进行重构,可以还原原始的时间序列数据,使得数据在时间上的顺序得以保留。对时间序列重构数据进行时间编码化验证,有助于确保时间信息的准确性和完整性。生成待存储数据时间分块,可能有助于更有效地管理和检索具有时间特征的数据,同时提高数据访问的效率。
本发明实施例中,通过对标准待存储数据进行分析,识别数据的变化模式、趋势和周期性。使用适当的分析工具,如统计方法、机器学习算法等,以获取数据的关键特征。将待存储数据空间进行分块,可以采用空间划分方法,如网格划分或基于数据特征的动态划分。进行时间序列分析,得到每个空间块的时间戳,用于标记数据在空间中的位置和时间。利用空间编码时间戳,对待存储变化数据进行时间段划分。确定数据发生变化的时间间隔。使用时间编码算法对每个时间段进行编码。可能的编码方式包括时间戳、数字编码或其他表示时间关系的方式。将时间编码的数据映射到相应的时间轴上,形成待存储时间映射数据。这可以涉及插值、映射函数或其他数学方法,以确保时间的正确映射。使用待存储时间映射数据进行时间序列的重构。可能需要考虑数据插值、平滑等方法,以填充时间间隔内的数据点。对待存储时间序列重构数据进行时间编码的验证,确保时间编码的准确性和一致性。将验证通过的时间序列重构数据进行分块,形成最终的待存储数据时间分块。分块可以基于时间间隔、数据特征等进行,以提高数据管理和检索的效率。
优选的,步骤S3包括以下步骤:
步骤S31:将待存储数据空间分块和待存储数据时间分块进行数据块合并,生成待存储时空编码数据块;对待存储时空编码数据块进行片段分割,生成待存储时空编码数据段;
步骤S32:将待存储时空编码数据段进行异步计算节点分发,得到异步分发节点;根据异步分发节点对待存储时空编码数据段进行并行哈希计算,生成存储哈希索引;
步骤S33:将存储哈希索引进行索引合并,得到存储哈希表;对存储哈希表进行异步索引优化,生成优化存储哈希表;对优化存储哈希表进行索引校验,生成标准存储哈希索引;
步骤S34:利用标准存储哈希索引对待存储时空编码数据段进行介质存储性能攫取,得到存储介质读写速度数据;对存储介质速度数据进行访问延迟优化,生成优化传输通道。
本发明通过将待存储数据的空间分块和时间分块进行合并,形成待存储时空编码数据块。这有助于优化数据管理和提高检索效率,尤其适用于处理具有时空特征的数据。对时空编码数据块进行片段分割,生成待存储时空编码数据段。这有助于更灵活地处理和传输数据,适应不同的存储和计算环境。异步计算可以提高计算效率,分发计算任务到异步节点有助于并行处理,减少等待时间,提高整体性能。利用异步分发节点对时空编码数据段进行并行哈希计算,可以加速哈希计算过程,提高索引生成的效率。将生成的存储哈希索引进行合并,形成存储哈希表。这有助于优化索引结构,提高数据检索速度。对存储哈希表进行异步索引优化,可以在不中断正常操作的情况下提高索引性能,确保系统的高可用性。对优化存储哈希表进行索引校验,确保索引的准确性和一致性,提高数据检索的可靠性。利用标准存储哈希索引对待存储时空编码数据段进行介质存储性能攫取,得到存储介质读写速度数据。这有助于了解存储介质的性能特征,为后续的数据传输和访问提供基础。对存储介质速度数据进行访问延迟优化,生成优化传输通道。通过优化传输通道,可以降低数据访问的延迟,提高数据传输效率。
作为本发明的一个实例,参考图2所示,在本实例中所述步骤S3包括:
步骤S31:将待存储数据空间分块和待存储数据时间分块进行数据块合并,生成待存储时空编码数据块;对待存储时空编码数据块进行片段分割,生成待存储时空编码数据段;
本发明实施例中,通过将待存储数据的空间划分为相互独立的块,可以采用网格划分、分层划分等方式,根据具体应用场景选择合适的方法。将待存储数据的时间进行分块,例如按照时间窗口或固定时间间隔进行划分。将相应空间块和时间块的数据合并为一个时空编码数据块。这可以通过拼接、组合、聚合等方式完成,具体方法取决于数据的类型和结构。对时空编码数据块进行片段分割,可以根据数据的特性将数据块划分为更小的片段,以便更好地处理和管理数据。这可以通过固定大小的切片或基于数据内容的动态切片来实现。
步骤S32:将待存储时空编码数据段进行异步计算节点分发,得到异步分发节点;根据异步分发节点对待存储时空编码数据段进行并行哈希计算,生成存储哈希索引;
本发明实施例中,通过将待存储的时空编码数据段进行异步计算节点分发。这意味着将数据段发送给多个计算节点进行并行计算。可以使用消息传递协议或分布式计算框架来实现数据的分发,例如使用消息队列、Apache Kafka、Apache Flink等。根据异步分发节点,每个节点负责对收到的数据段进行哈希计算。这意味着每个节点将并行地计算数据段的哈希值,并生成对应的存储哈希索引。并行哈希计算可以通过多线程、多进程或分布式计算等方式实现。
步骤S33:将存储哈希索引进行索引合并,得到存储哈希表;对存储哈希表进行异步索引优化,生成优化存储哈希表;对优化存储哈希表进行索引校验,生成标准存储哈希索引;
本发明实施例中,通过将各个计算节点生成的存储哈希索引进行合并。这可以通过将各个索引合并到一个数据结构中来实现。通常,这个数据结构可以是一个哈希表、搜索树或其他数据结构,用于快速检索数据。合并过程可能需要考虑解决哈希冲突、排序等问题。对合并后的存储哈希表进行异步索引优化。这可能涉及到优化算法的应用,例如使用异步任务对哈希表进行动态调整,以适应数据的动态变化。这也可以包括定期的批量优化过程,以保持哈希表的高效性。对优化后的存储哈希表进行索引校验,以确保其准确性和一致性。这可能包括检查哈希值的正确性、索引的完整性等。生成标准存储哈希索引的过程可能还涉及到一些元数据的添加,用于标识和描述哈希表的属性和状态。
步骤S34:利用标准存储哈希索引对待存储时空编码数据段进行介质存储性能攫取,得到存储介质读写速度数据;对存储介质速度数据进行访问延迟优化,生成优化传输通道。
本发明实施例中,通过使用标准存储哈希索引,根据索引的信息确定存储介质中的数据段位置。这可以通过索引中的元数据或关联信息来实现。根据数据段的位置,可以获取与存储介质相关的性能数据,例如读写速度、IOPS(每秒输入/输出操作数)、吞吐量等。这些数据可以通过与存储系统的集成、API调用或性能监控工具来获取。根据存储介质的性能数据,进行访问延迟优化。这可能包括以下步骤:识别存储介质中的瓶颈:根据性能数据,确定存储介质中存在的访问延迟瓶颈,例如高读取延迟、低写入速度等。优化存储传输通道:根据瓶颈的特点,采取相应的优化措施。例如,增加存储带宽、改进存储设备的读取能力、调整数据传输策略等。调整数据分布:根据存储哈希索引的特点和优化目标,可能需要调整数据的分布方式。这可以包括重新划分存储区域、重新规划数据段位置等,以便更好地利用存储介质的性能优势。
优选的,步骤S34包括以下步骤:
步骤S341:根据标准存储哈希索引对待存储时空编码数据进行存储地址搜索,得到存储地址数据;通过存储地址数据对待存储时空编码数据进行存储介质确认,生成存储介质数据;
步骤S342:利用存储介质数据对存储介质进行介质存储速度测量,生成存储介质读写速度数据;基于存储介质读写速度数据对待存储时空编码数据进行访问频率分析,生成存储访问频率数据;
步骤S343:将存储访问频率数据和预设的标准存储访问频率阈值进行对比,当存储访问频率数据大于或等于预设的标准存储访问频率阈值时,则将存储访问频率数据对应的待存储时空编码数据标记为高优先级访问数据;当存储访问频率数据小于预设的标准存储访问频率阈值时,则将存储访问频率数据对应的待存储时空编码数据标记为低优先级访问数据;
步骤S344:通过存储层次优化公式对高优先级访问数据和低优先级访问数据进行存储层次优化,生成存储层次优化数据;根据存储层次优化数据进行数据缓存策略制定,生成存储数据缓存策略;
步骤S345:利用存储数据缓存策略对高优先级访问数据进行数据预取,得到高优先级存储预取数据;对高优先级访问数据和低优先级访问数据进行访问延迟分析,生成访问延迟差异数据,其中访问延迟差异数据包括高优先级访问延迟数据和低优先级访问延迟数据;
步骤S346:利用高优先级访问延迟数据对高优先级存储预取数据进行预加载,生成高优先级访问延迟优化数据;根据高优先级访问延迟优化数据和低优先级访问延迟数据对存储介质进行传输通道配置,从而生成优化传输通道。
本发明通过标准存储哈希索引搜索待存储时空编码数据的存储地址,然后确认存储介质。这可以减少存储介质的搜索时间,并确保数据被正确存储。这有助于提高存储系统的可靠性和数据管理效率。利用存储介质数据对存储介质进行读写速度测量,得到存储介质的读写速度数据。这可以帮助了解存储介质的性能特征,为后续的性能优化提供基础数据。根据存储介质读写速度数据进行访问频率分析,并与预设的标准存储访问频率阈值进行对比。将高频率访问的数据标记为高优先级访问数据,将低频率访问的数据标记为低优先级访问数据。这有助于优化数据的访问方式,提高存储系统的访问效率。通过存储层次优化公式对高优先级访问数据和低优先级访问数据进行存储层次优化。根据优化结果制定数据缓存策略,以最大程度地减少数据的访问延迟。这可以提高数据访问效率,缩短响应时间。利用存储数据缓存策略对高优先级访问数据进行数据预取。通过预先将高优先级数据加载到缓存中,可以减少数据访问延迟,提高数据的可用性和响应速度。同时,对高优先级和低优先级访问数据进行访问延迟分析,可以更好地了解数据的访问差异,为后续的性能优化提供依据。利用高优先级访问延迟数据对高优先级存储预取数据进行预加载,进一步减少数据的访问延迟,提高存储系统的响应速度。根据高优先级访问延迟优化数据和低优先级访问延迟数据,在存储介质上进行传输通道的配置,以优化数据的传输速度和效率。
作为本发明的一个实例,参考图3所示,在本实例中所述步骤S34包括:
步骤S341:根据标准存储哈希索引对待存储时空编码数据进行存储地址搜索,得到存储地址数据;通过存储地址数据对待存储时空编码数据进行存储介质确认,生成存储介质数据;
本发明实施例中,通过建立一个标准的存储哈希索引。这个索引将根据时空编码数据的特征,为每个数据分配一个唯一的哈希值,以确定其在存储系统中的存储位置。建立一个标准的存储哈希索引。这个索引将根据时空编码数据的特征,为每个数据分配一个唯一的哈希值,以确定其在存储系统中的存储位置。通过得到的存储地址数据,系统可以确认待存储时空编码数据在存储介质上的确切位置。这可能涉及到物理存储介质的选择,例如磁盘、固态硬盘等。确认存储介质时,系统可能会考虑已用空间、性能等因素。确认了存储介质后,系统会生成相应的存储介质数据,将待存储时空编码数据写入存储介质的指定位置。这可能包括将数据写入磁盘块或固态硬盘页等。
步骤S342:利用存储介质数据对存储介质进行介质存储速度测量,生成存储介质读写速度数据;基于存储介质读写速度数据对待存储时空编码数据进行访问频率分析,生成存储访问频率数据;
本发明实施例中,通过实施一套测量方案,以获取存储介质的读写速度数据。这可以通过在系统中引入测试数据,然后测量存储系统在不同条件下的读写性能来实现。测试数据可以包括不同大小、不同类型的数据,以覆盖各种实际应用场景。测量得到的数据可以用于生成存储介质的读写速度数据。这些数据可以包括读取和写入不同大小数据时的速度,随着时间的推移性能的变化等。这些数据将成为后续访问频率分析的基础。利用存储介质读写速度数据,系统可以对待存储时空编码数据的访问频率进行分析。这可能涉及到对不同数据的访问次数、访问时段等进行统计。分析可以基于实际的历史数据,也可以实时地对数据流进行监测。基于访问频率的分析,系统生成存储访问频率数据。这些数据反映了不同数据在存储系统中的被访问程度,可以用于优化存储系统的性能和资源分配。
步骤S343:将存储访问频率数据和预设的标准存储访问频率阈值进行对比,当存储访问频率数据大于或等于预设的标准存储访问频率阈值时,则将存储访问频率数据对应的待存储时空编码数据标记为高优先级访问数据;当存储访问频率数据小于预设的标准存储访问频率阈值时,则将存储访问频率数据对应的待存储时空编码数据标记为低优先级访问数据;
本发明实施例中,通过在系统设计阶段,制定标准存储访问频率阈值。这个阈值可以根据系统的性能需求、资源约束和应用场景进行设定。它可以是一个固定值,也可以根据实时或历史数据进行动态调整。获取到存储访问频率数据后,系统将这些数据与预设的标准存储访问频率阈值进行比较。当存储访问频率数据大于或等于预设的标准存储访问频率阈值时,将对应的待存储时空编码数据标记为高优先级访问数据。当存储访问频率数据小于预设的标准存储访问频率阈值时,将对应的待存储时空编码数据标记为低优先级访问数据。系统需要实现一个有效的标记策略,确保对存储访问频率数据和时空编码数据进行正确的标记。这可能涉及到在存储系统中为数据设置标志位或元数据,以表示其优先级。随着存储访问频率数据的变化,系统需要定期或实时更新标记信息。这可以通过监测实时数据流或定期分析历史数据来实现。标记的优先级信息可以用于存储系统的优化,例如:在数据迁移和备份时,高优先级数据可以被优先处理,以确保对关键数据的及时备份和恢复。在缓存和存储资源分配时,高优先级数据可以被更频繁地缓存,提高对这些数据的访问速度。
步骤S344:通过存储层次优化公式对高优先级访问数据和低优先级访问数据进行存储层次优化,生成存储层次优化数据;根据存储层次优化数据进行数据缓存策略制定,生成存储数据缓存策略;
本发明实施例中,通过在系统设计阶段,定义存储层次优化公式。该公式应该考虑高优先级访问数据和低优先级访问数据之间的权衡,以及存储系统的层次结构。可能的考虑因素包括存储介质的性能、访问延迟、成本等。这个公式可以是系统设计人员基于具体需求和场景制定的一个数学模型。将存储层次优化公式应用于高优先级访问数据和低优先级访问数据。这可能涉及到对数据的分类和分析,以确定哪些数据应该被存储在高性能的存储介质(如固态硬盘)上,哪些数据可以存储在较低性能但成本更低的介质(如机械硬盘)上。基于存储层次优化公式的应用,生成存储层次优化数据。这些数据可以包括每个数据块或文件的最佳存储位置、存储介质的选择等信息。制定数据缓存策略,考虑到存储层次优化数据。缓存策略可以包括以下方面:选择合适的替换算法,确保缓存中存储的数据是最具有价值的数据。常见的算法包括LRU(最近最少使用)、LFU(最不经常使用)等。确定缓存的大小,平衡性能和成本之间的关系。针对高优先级访问数据,可以考虑预取策略,提前将可能会被访问的数据加载到缓存中。在存储系统中实施制定的缓存策略,确保高优先级访问数据得到更快的响应,并根据实际访问情况动态调整缓存策略。
步骤S345:利用存储数据缓存策略对高优先级访问数据进行数据预取,得到高优先级存储预取数据;对高优先级访问数据和低优先级访问数据进行访问延迟分析,生成访问延迟差异数据,其中访问延迟差异数据包括高优先级访问延迟数据和低优先级访问延迟数据;
本发明实施例中,通过根据先前确定的存储数据缓存策略,实施高优先级访问数据的预取。这可能涉及到提前将可能被访问的高优先级数据加载到缓存中,以减少后续访问时的延迟。预取的方式可以根据具体的缓存策略来选择,例如,可以使用预取算法来判断哪些数据是高优先级的,并提前加载到缓存。对高优先级访问数据和低优先级访问数据进行访问延迟分析。这可能包括以下步骤:在系统中插入性能测量工具,以实时或离线方式测量高优先级和低优先级访问数据的延迟。这可以涉及硬件性能监控、日志记录或其他适当的工具。基于测量结果,生成高优先级访问延迟数据和低优先级访问延迟数据。这些数据可以包括每个访问的延迟时间、延迟分布等信息。将高优先级访问延迟数据和低优先级访问延迟数据进行比较和分析,生成访问延迟差异数据。这些数据反映了高优先级和低优先级访问之间的延迟差异。根据生成的访问延迟差异数据,评估存储层次优化公式和缓存策略的效果。根据需要,调整预取算法、缓存替换策略或其他相关参数,以进一步降低高优先级访问的延迟。
步骤S346:利用高优先级访问延迟数据对高优先级存储预取数据进行预加载,生成高优先级访问延迟优化数据;根据高优先级访问延迟优化数据和低优先级访问延迟数据对存储介质进行传输通道配置,从而生成优化传输通道。
本发明实施例中,通过将高优先级访问延迟数据用于预加载高优先级存储预取数据。这可能包括在存储系统中实施一个机制,通过监测高优先级数据访问的模式,提前将这些数据加载到存储介质中,以便在需要时能够更快地访问。在预加载高优先级存储预取数据的过程中,收集和记录相应的高优先级访问延迟数据。这些数据可以包括访问延迟时间、延迟分布、访问频率等。通过分析这些数据,可以得到用于优化高优先级访问延迟的关键信息。根据高优先级访问延迟优化数据和低优先级访问延迟数据,对存储介质的传输通道进行配置。传输通道的配置可能包括以下方面:根据高优先级访问延迟优化数据确保足够的带宽用于高优先级数据的传输。这可能涉及动态调整带宽分配策略,以确保高优先级数据能够快速传输。配置存储介质传输通道,确保高优先级数据的传输具有更高的优先级。这可以通过调整传输队列的优先级、使用Quality of Service (QoS)技术等手段来实现。在传输通道上应用适当的缓存策略,以减少高优先级数据的传输延迟。这可能包括在传输过程中使用缓存来存储高优先级数据的副本,以减少对存储介质的实际访问。结合上述配置,生成优化的存储介质传输通道。这个优化通道能够更好地满足高优先级数据的传输需求,从而降低高优先级数据的访问延迟。部署实时监控机制,以持续监测存储系统的性能和传输通道的效果。根据实时数据,对传输通道进行调整,确保它持续优化以适应不断变化的工作负载和访问模式。
优选的,步骤S344中的存储层次优化公式具体如下:
式中,表示为总访问时间,/>表示为数据访问的总数目,/>表示为第 />个数据的优先级权重,/>表示为第 />个数据所在的存储层次的带宽,/>表示为第 />个数据的访问大小,表示为第 /> 个数据的大小对访问时间的影响权重,/>表示为第 />个数据的存储层次的容量,/>表示为第/>个数据的大小对访问时间的影响权重,/>表示为第/>个数据的大小对访问时间的指数衰减系数,/>表示为访问时间的范围,/>表示为存储层次优化异常调整值。
本发明通过分析并整合了一种存储层次优化公式,通过调整不同数据的优先级权重,可以使高优先级数据的访问时间较低,从而优先满足对这些数据的访问需求。不同存储层次的带宽/>不同,通过合理分配数据在不同层次的存储空间,可以使得数据访问时间更短。较高带宽的存储层次可以更快地满足数据访问需求。数据的访问大小/>也会影响访问时间。较小的数据访问大小可能意味着更短的访问时间,而较大的数据访问大小可能需要更长的访问时间。通过调整数据大小对访问时间的影响权重/>,可以对访问时间产生不同的影响。较大的权重表示数据大小对访问时间的影响更大。存储层次的容量/>限制了能够存储的数据量。合理管理存储层次的容量,可以避免数据过载和访问时间的增加。指数衰减项/>允许对数据大小的影响进行非线性调整。较大的指数衰减系数会导致数据大小对访问时间的衰减更快。通过存储层次优化异常调整值/>,用于校正由于实际系统的复杂性和非理想性而引起的误差和偏差。它可以纠正公式中的理论假设与实际系统之间的差异,提高存储层次优化的准确性和可靠性,更加准确的生成总访问时间/>,同时公式中的第 /> 个数据的大小对访问时间的影响权重、第/>个数据的大小对访问时间的指数衰减系数等参数可以根据实际情况进行调整,从而适应不同的存储层次优化场景,提高了算法的适用性和灵活性。在使用本领域常规的存储层次优化公式时,可以得到总访问时间,通过应用本发明提供的存储层次优化公式,可以更加精确的计算出总访问时间。通过调整这些参数,可以优化存储层次,使得高优先级数据更快地访问,并尽量减少总的访问时间。这有助于提高数据访问的效率和性能,并能更好地满足不同数据访问的需求。
优选的,步骤S4包括以下步骤:
步骤S41:利用优化传输通道对待存储时空编码数据段进行模拟传输处理,生成模拟传输存储数据;
步骤S42:对模拟传输数据进行动态可复原编码,生成传输优化冗余方案;根据传输优化冗余方案对模拟传输存储数据进行冗余优化,得到模拟传输冗余优化数据;
步骤S43:对模拟传输冗余优化数据进行历史数据流量分析,得到历史数据存储流量数据;对历史数据存储流量数据进行数据集划分,生成模型训练集和模型测试集;基于卷积神经网络算法对模型训练集进行模型训练,生成存储完整性预模型;利用模型测试集对存储完整性预模型进行模型测试,生成存储完整性预测模型;
步骤S44:将历史数据存储流量数据导入至存储完整性预测模型进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一访问协议制定,生成访问协议文档;通过分布式计算引擎对访问协议文档进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明通过利用优化传输通道对待存储时空编码数据段进行模拟传输处理,系统能够生成模拟传输存储数据。这有助于评估存储系统在实际传输时的性能和响应情况。对模拟传输数据进行动态可复原编码,生成传输优化冗余方案。这样的方案可以提高数据传输的可靠性和效率,通过冗余优化得到的数据更具备抗故障能力。利用历史数据流量数据进行分析,生成存储完整性预测模型。通过卷积神经网络算法的训练和测试,系统能够预测存储数据的完整性,提前发现可能的数据损坏或错误。利用存储完整性预测结果数据,系统能够对待存储时空编码数据段进行统一访问协议的制定。这有助于确保对存储数据的访问具有一致性,提高了数据的可用性和可访问性。通过分布式计算引擎对访问协议文档进行统一接口集成,生成统一存储API。这简化了对存储系统的访问方式,提高了系统的可扩展性和互操作性。
作为本发明的一个实例,参考图4所示,在本实例中所述步骤S4包括:
步骤S41:利用优化传输通道对待存储时空编码数据段进行模拟传输处理,生成模拟传输存储数据;
本发明实施例中,通过选择一种优化传输通道,这可以是网络通道、存储通道或其他专门设计的通道。选择通道时需要考虑其带宽、延迟、稳定性等性能指标,以确保模拟传输的真实性和有效性。待存储时空编码数据段是需要传输的数据块。这可能是对原始数据进行时空编码、压缩或其他处理得到的。确保数据段的格式和结构适合在模拟传输中使用。利用所选的优化传输通道对时空编码数据段进行模拟传输处理。这可能涉及模拟数据包的传输过程,考虑数据分割、传输顺序、重传机制等。这一步的目的是模拟实际传输过程中可能遇到的各种情况。在模拟传输过程中,记录传输的各个阶段的数据状态。最终,根据模拟传输的结果生成模拟传输存储数据。这包括经过传输通道处理后的数据,可能还包括一些模拟传输中的元数据信息。在模拟传输的过程中,记录关键的传输性能参数,如传输速度、丢包率、延迟等。这些参数对后续的冗余方案和优化步骤可能有影响。
步骤S42:对模拟传输数据进行动态可复原编码,生成传输优化冗余方案;根据传输优化冗余方案对模拟传输存储数据进行冗余优化,得到模拟传输冗余优化数据;
本发明实施例中,通过选择适当的动态可复原编码方案,如Reed-Solomon码、Fountain码等。编码方案的选择要考虑数据的特性、传输通道的性能以及系统的实际需求。将模拟传输数据划分成若干数据块,这些数据块将用于动态可复原编码。划分的大小可以根据具体的编码方案和需求进行调整。利用所选的编码方案对数据块进行编码,生成冗余编码块。这些冗余编码块将用于在传输中修复可能的丢失或损坏。根据系统要求和性能需求,确定冗余编码块的数量和分布。这可能涉及权衡冗余程度和传输效率之间的关系。结合动态可复原编码的结果,生成传输优化的冗余方案。这包括确定如何在传输中使用冗余编码块以提高数据的可靠性。将生成的冗余编码块集成到模拟传输存储数据中。这可能需要修改数据格式或者添加元数据以支持冗余编码。存储包含冗余编码块的模拟传输冗余优化数据。确保在存储过程中保持数据的完整性和一致性。
步骤S43:对模拟传输冗余优化数据进行历史数据流量分析,得到历史数据存储流量数据;对历史数据存储流量数据进行数据集划分,生成模型训练集和模型测试集;基于卷积神经网络算法对模型训练集进行模型训练,生成存储完整性预模型;利用模型测试集对存储完整性预模型进行模型测试,生成存储完整性预测模型;
本发明实施例中,通过收集模拟传输冗余优化数据的历史流量数据,包括传输期间的各种参数、冗余块的使用情况、传输错误情况等。对收集到的历史数据进行清理,去除无效或异常数据,确保数据的质量。利用合适的分析工具或算法对历史数据流量进行分析,了解数据传输的模式、发现潜在的问题和规律。根据具体需求确定训练集和测试集的划分比例,一般采用常见的划分比如80-20或70-30。对历史数据存储流量数据进行随机划分,确保训练集和测试集的数据是随机选择的,以避免模型过拟合。对训练集的数据进行预处理,包括归一化、标准化或其他必要的处理方式。构建卷积神经网络模型,设计合适的层次结构,包括卷积层、池化层、全连接层等。选择适当的损失函数(如均方误差)和优化器(如Adam优化器)。使用训练集对CNN模型进行训练,通过反向传播算法更新模型参数,使其适应历史数据流量的特征。利用模型测试集对训练好的CNN模型进行评估,计算模型在测试集上的性能指标,如准确率、精确度、召回率等。根据评估结果,进行模型参数的调整,以提高模型性能。将训练好且通过测试的CNN模型整合为存储完整性预测模型。部署模型到实际系统中,以用于实时的存储完整性预测。
步骤S44:将历史数据存储流量数据导入至存储完整性预测模型进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一访问协议制定,生成访问协议文档;通过分布式计算引擎对访问协议文档进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明实施例中,通过将历史数据存储流量数据导入已训练好的存储完整性预测模型中。使用导入的数据进行存储完整性预测,预测结果可以是二进制形式(如0表示数据完整性受损,1表示数据完整性正常),也可以是概率形式。生成存储完整性预测结果数据,该数据描述了每个时空编码数据段的完整性预测情况。利用存储完整性预测结果数据,对待存储的时空编码数据段进行统一访问协议制定。统一访问协议根据存储完整性预测结果,针对不同的完整性情况制定访问策略。例如,对于预测完整性受损的数据段,可以采取纠错码(Reed-Solomon等)来修复数据,或者从备份中恢复数据。生成访问协议文档,其中包括对不同情况下的数据访问策略、修复策略等详细说明。利用分布式计算引擎,对访问协议文档进行统一接口集成。设计和实现统一存储API,该API将根据访问协议文档中的指导原则,提供操作数据存储的通用接口。统一存储API可以用于执行数据存储操作,包括数据的写入、读取、修复和恢复等。
优选的,步骤S42包括以下步骤:
步骤S421:对模拟传输数据进行数据切片,生成模拟传输切片数据;对模拟传输切片数据进行冗余编码插入,生成模拟传输冗余切片数据;
步骤S422:将模拟传输冗余切片数据进行分布式云端服务器存储,生成模拟传输分布存储冗余数据;对模拟传输分布存储冗余数据进行存储状况分析,得到存储冗余状态数据;根据存储冗余状态数据对模拟传输分布存储冗余数据进行动态冗余编码位置调整,生成动态传输分布存储冗余数据;
步骤S423:利用数据恢复性能评估公式对动态传输分布存储冗余数据进行恢复性能评估,得到恢复性能评估数据;将恢复性能评估数据和预设的恢复性能阈值进行对比,当恢复性能评估数据大于或等于预设的恢复性能阈值时,则将动态传输分布存储冗余数据标记为正常模拟冗余数据;
步骤S424:当恢复性能评估数据小于预设的恢复性能阈值时,则对动态传输分布存储冗余数据进行修复重建,得到传输冗余复原数据;将正常模拟冗余数据和传输冗余复原数据进行数据整合,得到模拟传输冗余优化数据。
本发明通过对模拟传输数据进行切片和冗余编码插入,可以提高数据的冗余度,从而增强数据的完整性。在传输和存储过程中,即使部分数据损坏,仍能通过冗余数据进行恢复。存储冗余状态分析有助于了解存储系统的状态,从而通过动态调整冗余编码位置来优化存储冗余性能。这可以提高数据的容错性和可靠性。通过使用数据恢复性能评估公式,系统能够迅速评估动态传输分布存储冗余数据的恢复性能。将正常的冗余数据标记为正常,确保在发生数据故障时,能够快速准确地恢复正常状态。当恢复性能评估数据小于预设阈值时,系统能够及时对动态传输分布存储冗余数据进行修复和重建。将修复后的数据与正常冗余数据整合,进一步提高整体数据的可靠性和完整性。
本发明实施例中,通过将模拟传输数据切片成固定大小的数据块,对每个数据块进行冗余编码插入,生成模拟传输冗余切片数据。将模拟传输冗余切片数据分布式存储到多台云端服务器中,对分布存储的冗余数据进行存储状况分析,获取存储冗余状态数据,基于存储冗余状态数据,动态调整冗余编码位置,生成动态传输分布存储冗余数据。利用数据恢复性能评估公式对动态传输分布存储冗余数据进行恢复性能评估,得到恢复性能评估数据。将恢复性能评估数据与预设的恢复性能阈值进行对比,若评估数据大于或等于预设阈值,则将动态传输分布存储冗余数据标记为正常模拟冗余数据。当恢复性能评估数据小于预设阈值时,对动态传输分布存储冗余数据进行修复和重建,得到传输冗余复原数据,将正常模拟冗余数据和传输冗余复原数据进行数据整合,生成模拟传输冗余优化数据。
优选的,步骤S423中的数据恢复性能评估公式具体如下:
式中,表示为恢复性能评估数据,/>表示为恢复时间范围,/>表示为传输数据的重要性权重,/>表示为传输数据的文件大小,/>表示为传输数据的传输时间,/>表示为冗余数据的冗余程度权重,/>表示为冗余数据的冗余切片个数,/>表示为冗余切片的大小,/>表示为存储冗余状况的可用冗余切片数,/>表示为冗余正态分布的标准差,/>表示为冗余正态分布的均值,/>表示为恢复性能评估指标的取值变量。
本发明通过分析并整合了一种数据恢复性能评估公式,通过调整传输数据的重要性权重。该参数用于衡量传输数据的重要性,可以根据不同数据的重要性设置不同的权重值。通过乘以传输数据的文件大小 />,可以将重要性因素纳入考量,确保在评估中更加关注重要的数据。传输时间/>是指将数据传输到恢复设备的时间。通过除以传输时间 />,可以考虑到快速传输所带来的性能提升,因为较短的传输时间将减少整个恢复过程的延迟。冗余程度权重用于衡量冗余数据的重要性,可以根据冗余数据的重要程度设置不同的权重值。通过乘以冗余数据的冗余切片个数/>和冗余切片的大小/> 的平方,可以将冗余程度因素纳入考量,确保在评估中更加关注冗余数据的有效性。存储冗余状况的可用冗余切片数/>,该参数表示可用于恢复的冗余切片的数量。通过除以可用冗余切片数 />,可以考虑到可用冗余切片的相对稀缺性。较少的可用冗余切片将对恢复性能产生负面影响,因此除以可用冗余切片数有助于确保评估中更加关注冗余切片的有效性。冗余正态分布的标准差/>和均值/>,这些参数用于建模冗余数据的分布情况。通过计算冗余数据的概率密度函数,并将其乘以,可以将冗余数据的分布特征纳入评估中。较低的标准差表示冗余数据更加集中,而较高的标准差表示冗余数据更加分散。通过考虑冗余数据的分布特征,可以更准确地评估恢复性能。在使用本领域常规的数据恢复性能评估公式时,可以得到恢复性能评估数据,通过应用本发明提供的数据恢复性能评估公式,可以更加精确的计算出恢复性能评估数据。公式通过综合考虑传输数据的重要性、传输时间、冗余数据的冗余程度、可用冗余切片数和冗余数据的分布情况,对数据恢复性能进行评估。各个参数的设置和相互作用有助于确保评估更加准确地反映实际情况,从而提供对数据恢复性能的有益评估。
在本说明书中,提供了一种数据存储系统,用于执行上述的数据存储方法,该数据存储系统包括:
空间映射模块,用于获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
时间映射模块,用于对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
延迟优化模块,用于将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;
接口集成模块,用于利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储。
本发明的有益效果在于通过获取原始需要存储的数据。对待存储数据进行预处理,生成标准待存储数据。这可能包括数据清理、格式转换、去重等操作,确保数据的质量和一致性。对标准待存储数据进行存储空间分区,生成待存储空间分区数据。这有助于更有效地管理和组织存储空间。对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳。这一步可以用于确定数据的存储时序特征。利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块。这有助于将数据按时间分块,更好地适应时间序列的特性。将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段。这一步将时空信息整合,形成完整的时空编码数据段。对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引。并行计算可以提高哈希计算的效率和速度。利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道。这有助于提高数据的访问效率和响应速度。利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据。这有助于提高数据的冗余度,增强数据的容错性。对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据。这一步有助于及时发现并纠正数据损坏或丢失的情况。利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API。这有助于简化数据存储的管理和操作。动态可复原编码和存储完整性预测有助于提高数据的完整性和可靠性,确保数据在存储和传输过程中不受损坏。通过并行哈希计算和访问延迟优化,可以提高对数据的访问效率,缩短响应时间。生成统一存储API有助于简化数据存储的管理和操作,提高系统的一致性和可维护性。时空编码和时间映射编码有助于更好地适应数据的时空特性,提高数据存储的灵活性和效率。因此,本发明通过空间时间优化、访问延迟优化、存储完整性预测和动态可复原编码等步骤,提高了数据存储上的效率和可靠性。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种数据存储方法,其特征在于,包括以下步骤:
步骤S1:获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
步骤S2:对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
步骤S3:将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;步骤S3包括以下步骤:
步骤S31:将待存储数据空间分块和待存储数据时间分块进行数据块合并,生成待存储时空编码数据块;对待存储时空编码数据块进行片段分割,生成待存储时空编码数据段;
步骤S32:将待存储时空编码数据段进行异步计算节点分发,得到异步分发节点;根据异步分发节点对待存储时空编码数据段进行并行哈希计算,生成存储哈希索引;
步骤S33:将存储哈希索引进行索引合并,得到存储哈希表;对存储哈希表进行异步索引优化,生成优化存储哈希表;对优化存储哈希表进行索引校验,生成标准存储哈希索引;
步骤S34:利用标准存储哈希索引对待存储时空编码数据段进行介质存储性能攫取,得到存储介质读写速度数据;对存储介质速度数据进行访问延迟优化,生成优化传输通道;步骤S34包括以下步骤:
步骤S341:根据标准存储哈希索引对待存储时空编码数据进行存储地址搜索,得到存储地址数据;通过存储地址数据对待存储时空编码数据进行存储介质确认,生成存储介质数据;
步骤S342:利用存储介质数据对存储介质进行介质存储速度测量,生成存储介质读写速度数据;基于存储介质读写速度数据对待存储时空编码数据进行访问频率分析,生成存储访问频率数据;
步骤S343:将存储访问频率数据和预设的标准存储访问频率阈值进行对比,当存储访问频率数据大于或等于预设的标准存储访问频率阈值时,则将存储访问频率数据对应的待存储时空编码数据标记为高优先级访问数据;当存储访问频率数据小于预设的标准存储访问频率阈值时,则将存储访问频率数据对应的待存储时空编码数据标记为低优先级访问数据;
步骤S344:通过存储层次优化公式对高优先级访问数据和低优先级访问数据进行存储层次优化,生成存储层次优化数据;根据存储层次优化数据进行数据缓存策略制定,生成存储数据缓存策略;
步骤S345:利用存储数据缓存策略对高优先级访问数据进行数据预取,得到高优先级存储预取数据;对高优先级访问数据和低优先级访问数据进行访问延迟分析,生成访问延迟差异数据,其中访问延迟差异数据包括高优先级访问延迟数据和低优先级访问延迟数据;
步骤S346:利用高优先级访问延迟数据对高优先级存储预取数据进行预加载,生成高优先级访问延迟优化数据;根据高优先级访问延迟优化数据和低优先级访问延迟数据对存储介质进行传输通道配置,从而生成优化传输通道;
步骤S4:利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储;步骤S4包括以下步骤:
步骤S41:利用优化传输通道对待存储时空编码数据段进行模拟传输处理,生成模拟传输存储数据;
步骤S42:对模拟传输数据进行动态可复原编码,生成传输优化冗余方案;根据传输优化冗余方案对模拟传输存储数据进行冗余优化,得到模拟传输冗余优化数据;
步骤S43:对模拟传输冗余优化数据进行历史数据流量分析,得到历史数据存储流量数据;对历史数据存储流量数据进行数据集划分,生成模型训练集和模型测试集;基于卷积神经网络算法对模型训练集进行模型训练,生成存储完整性预模型;利用模型测试集对存储完整性预模型进行模型测试,生成存储完整性预测模型;
步骤S44:将历史数据存储流量数据导入至存储完整性预测模型进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一访问协议制定,生成访问协议文档;通过分布式计算引擎对访问协议文档进行统一接口集成,从而生成统一存储API,用以执行数据存储。
2.根据权利要求1所述的数据存储方法,其特征在于,步骤S1包括以下步骤:
步骤S11:通过不同的API调用得到待存储数据;
步骤S12:对待存储数据进行存储数据预处理,生成标准待存储数据,其中数据预处理包括数据去噪、数据缺失值填充、数据格式转换和数据标准化;
步骤S13:对标准待存储数据进行数据分割,生成待存储分割数据;基于待存储分割数据对存储单元进行自适应存储边界检测,生成存储单元边界地图;基于存储单元边界地图对待存储分割数据进行存储空间分区,生成待存储空间分区数据;
步骤S14:对待存储空间分区数据进行空间编码,生成待存储空间编码数据;对待存储空间编码数据进行空间映射,生成待存储空间映射数据;利用哈希算法对待存储空间映射数据进行数据校验,生成待存储数据空间分块。
3.根据权利要求1所述的数据存储方法,其特征在于,步骤S2包括以下步骤:
步骤S21:对标准待存储数据进行数据变化分析,生成待存储变化数据;对待存储数据空间分块进行时间序列分析,得到待存储空间编码时间戳;
步骤S22:利用待存储空间编码时间戳对待存储变化数据进行时间段划分,生成待存储数据变化时间间隔;根据时间编码算法对待存储数据变化时间间隔进行时间编码,生成待存储时间编码数据;
步骤S23:对待存储时间编码数据进行时间映射,生成待存储时间映射数据;对待存储时间映射数据进行时间序列重构,生成待存储时间序列重构数据;
步骤S24:对待存储时间序列重构数据进行时间编码化验证,生成待存储数据时间分块。
4.根据权利要求1所述的数据存储方法,其特征在于,步骤S344中的存储层次优化公式如下所示:
式中,表示为总访问时间,/>表示为数据访问的总数目,/>表示为第 />个数据的优先级权重,/>表示为第 />个数据所在的存储层次的带宽,/>表示为第 />个数据的访问大小,/>表示为第 /> 个数据的大小对访问时间的影响权重,/>表示为第 />个数据的存储层次的容量,表示为第/>个数据的大小对访问时间的影响权重,/>表示为第/>个数据的大小对访问时间的指数衰减系数,/>表示为访问时间的范围,/>表示为存储层次优化异常调整值。
5.根据权利要求1所述的数据存储方法,其特征在于,步骤S42包括以下步骤:
步骤S421:对模拟传输数据进行数据切片,生成模拟传输切片数据;对模拟传输切片数据进行冗余编码插入,生成模拟传输冗余切片数据;
步骤S422:将模拟传输冗余切片数据进行分布式云端服务器存储,生成模拟传输分布存储冗余数据;对模拟传输分布存储冗余数据进行存储状况分析,得到存储冗余状态数据;根据存储冗余状态数据对模拟传输分布存储冗余数据进行动态冗余编码位置调整,生成动态传输分布存储冗余数据;
步骤S423:利用数据恢复性能评估公式对动态传输分布存储冗余数据进行恢复性能评估,得到恢复性能评估数据;将恢复性能评估数据和预设的恢复性能阈值进行对比,当恢复性能评估数据大于或等于预设的恢复性能阈值时,则将动态传输分布存储冗余数据标记为正常模拟冗余数据;
步骤S424:当恢复性能评估数据小于预设的恢复性能阈值时,则对动态传输分布存储冗余数据进行修复重建,得到传输冗余复原数据;将正常模拟冗余数据和传输冗余复原数据进行数据整合,得到模拟传输冗余优化数据。
6.根据权利要求5所述的数据存储方法,其特征在于,步骤S423中的数据恢复性能评估公式如下所示:
式中,表示为恢复性能评估数据,/>表示为恢复时间范围,/>表示为传输数据的重要性权重,/>表示为传输数据的文件大小,/>表示为传输数据的传输时间,/>表示为冗余数据的冗余程度权重,/>表示为冗余数据的冗余切片个数,/>表示为冗余切片的大小,/>表示为存储冗余状况的可用冗余切片数,/>表示为冗余正态分布的标准差,/>表示为冗余正态分布的均值,表示为恢复性能评估指标的取值变量。
7.一种数据存储系统,其特征在于,用于执行如权利要求1所述的数据存储方法,该数据存储系统包括:
空间映射模块,用于获取待存储数据;对待存储数据进行数据预处理,生成标准待存储数据;对标准待存储数据进行存储空间分区,生成待存储空间分区数据;对待存储空间分区数据进行空间映射编码,生成待存储数据空间分块;
时间映射模块,用于对标准待存储数据进行存储时间序列分析,得到待存储空间编码时间戳;利用待存储空间编码时间戳对标准待存储数据进行时间映射编码,生成待存储数据时间分块;
延迟优化模块,用于将待存储数据空间分块和待存储数据时间分块进行片段分割,生成待存储时空编码数据段;对待存储时空编码数据段进行并行哈希计算,生成标准存储哈希索引;利用标准存储哈希索引对待存储时空编码数据段进行访问延迟优化,生成优化传输通道;
接口集成模块,用于利用优化传输通道对待存储时空编码数据段进行动态可复原编码,得到模拟传输冗余优化数据;对模拟传输冗余优化数据进行存储完整性预测,生成存储完整性预测结果数据;利用存储完整性预测结果数据对待存储时空编码数据段进行统一接口集成,从而生成统一存储API,用以执行数据存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410252660.2A CN117827850B (zh) | 2024-03-06 | 2024-03-06 | 一种数据存储方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410252660.2A CN117827850B (zh) | 2024-03-06 | 2024-03-06 | 一种数据存储方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117827850A CN117827850A (zh) | 2024-04-05 |
CN117827850B true CN117827850B (zh) | 2024-05-10 |
Family
ID=90506222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410252660.2A Active CN117827850B (zh) | 2024-03-06 | 2024-03-06 | 一种数据存储方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117827850B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118092816B (zh) * | 2024-04-25 | 2024-07-05 | 深圳市铨兴科技有限公司 | 一种存储空间动态分配方法、系统及存储器 |
CN118170325B (zh) * | 2024-05-13 | 2024-08-16 | 北京励栋科技发展有限公司 | 一种大数据存储及处理控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101329642A (zh) * | 2008-06-11 | 2008-12-24 | 华中科技大学 | 基于时间戳日志存储的连续数据保护和恢复方法 |
CN105511801A (zh) * | 2015-11-12 | 2016-04-20 | 长春理工大学 | 数据存储的方法和装置 |
CN106612322A (zh) * | 2016-07-11 | 2017-05-03 | 四川用联信息技术有限公司 | 云存储中一种存数据节点分布优化的数据恢复方法 |
CN110532425A (zh) * | 2019-08-19 | 2019-12-03 | 深圳市网心科技有限公司 | 视频数据分布式存储方法、装置、计算机设备及存储介质 |
CN114428585A (zh) * | 2020-10-29 | 2022-05-03 | 北京奇艺世纪科技有限公司 | 数据存储方法、装置及电子设备 |
CN115407933A (zh) * | 2022-06-30 | 2022-11-29 | 中国科学院计算技术研究所 | 基于非易失内存的文件元数据存储方法与系统 |
-
2024
- 2024-03-06 CN CN202410252660.2A patent/CN117827850B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101329642A (zh) * | 2008-06-11 | 2008-12-24 | 华中科技大学 | 基于时间戳日志存储的连续数据保护和恢复方法 |
CN105511801A (zh) * | 2015-11-12 | 2016-04-20 | 长春理工大学 | 数据存储的方法和装置 |
CN106612322A (zh) * | 2016-07-11 | 2017-05-03 | 四川用联信息技术有限公司 | 云存储中一种存数据节点分布优化的数据恢复方法 |
CN110532425A (zh) * | 2019-08-19 | 2019-12-03 | 深圳市网心科技有限公司 | 视频数据分布式存储方法、装置、计算机设备及存储介质 |
CN114428585A (zh) * | 2020-10-29 | 2022-05-03 | 北京奇艺世纪科技有限公司 | 数据存储方法、装置及电子设备 |
CN115407933A (zh) * | 2022-06-30 | 2022-11-29 | 中国科学院计算技术研究所 | 基于非易失内存的文件元数据存储方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117827850A (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117827850B (zh) | 一种数据存储方法及系统 | |
CN110291509B (zh) | 在分散存储网络的区域中存储数据的方法和系统 | |
US20170060769A1 (en) | Systems, devices and methods for generating locality-indicative data representations of data streams, and compressions thereof | |
JP6341205B2 (ja) | データ圧縮システム | |
US20150106578A1 (en) | Systems, methods and devices for implementing data management in a distributed data storage system | |
Park et al. | Characterizing datasets for data deduplication in backup applications | |
KR20170054299A (ko) | 메모리 관리 시의 중복 제거를 위해서 기준 세트로 기준 블록을 취합하는 기법 | |
US20200401557A1 (en) | Metadata compaction in a distributed storage system | |
US11288186B2 (en) | Adjustment of garbage collection parameters in a storage system | |
CN108416054A (zh) | 基于文件访问热度的动态hdfs副本个数计算方法 | |
US7895247B2 (en) | Tracking space usage in a database | |
CN117707771A (zh) | 基于多线程技术的分布式对象读写性能提升方法 | |
CN117111854A (zh) | 一种基于分布式加密存储的数据存储方法、装置及介质 | |
Xie et al. | Non-sequential striping for distributed storage systems with different redundancy schemes | |
Zhang et al. | NADE: nodes performance awareness and accurate distance evaluation for degraded read in heterogeneous distributed erasure code-based storage | |
US20210334040A1 (en) | Aggressive intent write request cancellation | |
El Sibai et al. | Information technology infrastructure for data streams native filtering | |
Bžoch et al. | Design and implementation of a caching algorithm applicable to mobile clients | |
Wildani et al. | PERSES: Data layout for low impact failures | |
CN111061430A (zh) | 一种多云环境下异构i/o细粒度感知的数据放置方法 | |
US11966393B2 (en) | Adaptive data prefetch | |
CN118467465B (zh) | 一种基于数字化的档案信息数据管理方法 | |
Wu | Optimizing Consensus Protocols with Machine Learning Models: A cache-based approach | |
Nwe et al. | Automatic adjustment of consistency level by predicting staleness rate for distributed key-value storage system | |
US20240152467A1 (en) | Systems and methods to generate a cache miss ratio curve where cache data has a time-to-live |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |