CN113792772B - 一种用于数据分级混合存储的冷热数据识别方法 - Google Patents

一种用于数据分级混合存储的冷热数据识别方法 Download PDF

Info

Publication number
CN113792772B
CN113792772B CN202111020938.6A CN202111020938A CN113792772B CN 113792772 B CN113792772 B CN 113792772B CN 202111020938 A CN202111020938 A CN 202111020938A CN 113792772 B CN113792772 B CN 113792772B
Authority
CN
China
Prior art keywords
data
cold
model
temperature
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111020938.6A
Other languages
English (en)
Other versions
CN113792772A (zh
Inventor
胡昌平
侍守创
刘彩云
朱大鹏
姜厚禄
闫四洋
胡翔宇
孟祥慈
李红星
王纪潼
徐雷
左刚
单文金
吕从飞
尹玉峰
韩占港
许永正
董奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jierui Information Technology Co ltd
716th Research Institute of CSIC
Original Assignee
Jiangsu Jierui Information Technology Co ltd
716th Research Institute of CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jierui Information Technology Co ltd, 716th Research Institute of CSIC filed Critical Jiangsu Jierui Information Technology Co ltd
Priority to CN202111020938.6A priority Critical patent/CN113792772B/zh
Publication of CN113792772A publication Critical patent/CN113792772A/zh
Application granted granted Critical
Publication of CN113792772B publication Critical patent/CN113792772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明是一种用于数据分级混合存储的冷热数据识别方法,属数据存储技术领域。该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;该方法使用温度模型来衡量数据的冷热程度,为每个数据赋予一个持久性的温度属性,不仅可以用于判断系统中数据的冷热程度,即使当数据进行了迁移,温度属性会一直伴随着数据,依然可以使用该属性来衡量和识别数据的冷热程度。

Description

一种用于数据分级混合存储的冷热数据识别方法
技术领域
本发明涉及数据存储技术领域,具体涉及一种用于数据分级混合存储的冷热数据识别方法。
背景技术
数据库中存放的数据通常有冷热之分,我们认为频繁被访问的数据称为热数据(hot data),与之相对的,访问不频繁甚至在一段时间内都不会被访问的数据称之为冷数据(cold data)。所以可以依据数据冷热程度将数据存储在不同的介质上,在保证系统性能的前提下最大程度的降低存储成本或整体上获得更高的性能。所有如何评估数据的冷热程度(为数据进行温度判定)一直都是数据库研究领域中的一大热点。
针对数据的冷热程度,最直接的衡量依据为未来该数据的访问概率,即未来访问概率较大的数据为热数据,而被访问概率较小或不再被访问的数据则为冷数据。在实际应用中,无法预测数据未来的访问情况,因而在数据库中通常会制定其他的衡量办法以期能“预测”未来的访问情况,进而对数据的冷热程度进行表示。目前,识别冷热数据大多依赖于LRU等特定的数据结构,利用数据的相对位置来判定数据的冷热,无法全面反映数据的冷热程度,而且这种识别方式不可量化且不具有可持久性。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种新的用于数据分级混合存储的冷热数据识别方法,该方法使用温度模型来衡量数据的冷热程度,为每个数据赋予一个持久性的温度属性,不仅可以用于判断系统中数据的冷热程度,即使当数据进行了迁移(低速存储设备向高速存储设备或者相反),温度属性会一直伴随着数据,依然可以使用该属性来衡量和识别数据的冷热程度。
本发明所要解决的技术问题是通过以下的技术方案来实现的。本发明是一种用于数据分级混合存储的冷热数据识别方法,其特点是:该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志;然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据;
对训练数据进行访问热度划分,预定义热度级别按0,1,…,n-1标记训练集中的数据;构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。
本发明所要解决的技术问题还可以通过以下的技术方案来实现进一步实现。以上所述的本发明用于数据分级混合存储的冷热数据识别方法,其特点是:其具体步骤如下:
S1、数据采集:在文件日志中对文件的历史访问数据进行采集;
S2、数据预处理:对采集到的数据进行预处理,对数据进行热度划分,并将数据局划分为训练集和测试集;
S3、模型训练:训练集输入预测模型,对模型进行训练;
S4、模型验证:将测试集输入训练好的模型,对模型效果进行验证;
S5、模型封装使用,将验证好的模型进行封装,投入到使用中;
S6、根据温度预测结果,将数据存入到不同的介质中。
本发明所要解决的技术问题还可以通过以下的技术方案来实现进一步实现。以上所述的本发明用于数据分级混合存储的冷热数据识别方法,其特点是:根据访问的频率来划分数据的冷热程度;采用对训练集中的数据进行访问热度划分,定义热度级别按0,1,…,n-1,标记训练集中的数据;N个热度标签分别使用one-hot编码转换为0和1组成的稀疏向量;然后将数据集划分为训练集和测试集,输入到LSTM神经网络中进行训练;
LSTM使用时间记忆单元用以记录当前时刻的状态,一般称为长短期记忆神经网络的细胞与每个细胞相连的有遗忘门ft、输入门it和输出门ot这3个信息传递开关门,其中,xt为预测模型的输入,ht为LSTM输出,ht-1为上一时刻LSTM的输出,Ct为细胞状态,Ct-1为上一时刻的细胞状态;温度预测模型以数据的访问次数、访问类型、每一次访问的时间戳、访问数据所在的存储介质为输入,以该数据对应的温度为输出;
当模型输入xt进入LSTM单元后,第一步是经过遗忘门,通过遗忘门来决定我们会从细胞状态中丢弃什么信息;遗忘门的输出ft为:
ft=sigmoid(Wf·[ht-1,xt]+bf)
输入门决定多少新信息被存储在LSTM细胞中;输入门包含两个处理层次,sigmoid层决定细胞状态中什么值应被更新,tanh层创建一个新的候选值向量Ct′;
it=sigmoid(Wi·[ht-1,xt]+bi)
Ct′=tanh(Wc·[ht-1,xt]+bc)
LSTM细胞状态更新为原始细胞状态丢弃部分信息后,再加上新的候选值向量Ct′的和;
Ct=ft·Ct-1+it·Ct
输出门基于更新后的LSTM细胞状态,通过一个sigmoid层确定将细胞状态的哪个部分输出;细胞状态通过tanh层后和sigmoid输出相乘;
ot=sigmoid(Wo·[ht-1,xt]+bo)
ht=ot·tanh(ct)
隐含层得出结果后将结果ht传入到输出层,输出层输出模型预测结果yt
yt=f(Wyht+by)
经过预测模型预测后,可以得到数据的数据温度,从而进行冷热数据识别。
本发明采用基于LSTM的数据温度预测模型对数据温度进行预测。将数据看作实际物体,随着时间的推移,物理环境中温度高的物体会逐渐冷却,同样的,数据存储中数据的温度也会逐渐降低;当访问数据时,类似于赋予物体新的能量,物体的温度会升高,访问操作也给数据带来了能量,数据的温度会升高,实现数据的“加温”。所以我们可以借助温度模型对数据温度进行计算,然后依据温度对数据进行冷热程度的划分。因此,可以将数据的冷热程度定义为数据温度的高低:数据的冷热程度≈数据温度的高低。
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志。然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据。对训练数据进行访问热度划分,预定义热度级别(0,1,…,n-1)标记训练集中的数据。这样构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。封装后的模型投入到使用中,根据温度预测模型提供的预测结果,将数据按温度的由高到低分别存储到RAM、SSD和HDD中。
与现有技术相比,本发明具有以下有益效果:使用温度模型来衡量数据的冷热程度,为每个数据赋予一个持久性的温度属性,不仅可以用于判断系统中数据的冷热程度,即使当数据进行了迁移(低速存储设备向高速存储设备或者相反),温度属性会一直伴随着数据,依然可以使用该属性来衡量和识别数据的冷热程度。采用基于深度学习的温度预测模型可以对数据温度进行精准预测,对数据按访问热度进行合理划分,以实现在分级混合存储架构下,工业云应用集成开发平台I/O访问性能的极致加速。
附图说明
图1是根据访问频率区间划分冷热数据图;
图2是LSTM神经元结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1,一种用于数据分级混合存储的冷热数据识别方法,该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志;然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据;
对训练数据进行访问热度划分,预定义热度级别按0,1,…,n-1标记训练集中的数据;构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。
其具体步骤如下:
S1、数据采集:在文件日志中对文件的历史访问数据进行采集;
S2、数据预处理:对采集到的数据进行预处理,对数据进行热度划分,并将数据局划分为训练集和测试集;
S3、模型训练:训练集输入预测模型,对模型进行训练;
S4、模型验证:将测试集输入训练好的模型,对模型效果进行验证;
S5、模型封装使用,将验证好的模型进行封装,投入到使用中;
S6、根据温度预测结果,将数据存入到不同的介质中。
实施例2,用于数据分级混合存储的冷热数据识别方法实验:
本实施例以某中文阅读网站为实施对象,对网站中存储的中文文章进行热度识别,以此提供数据分级存储的依据。
首先对网站日志中所有中文文章的数据进行采集,日志需要记录的信息包括中文文章的访问次数、访问类型、每一次访问的时间戳、访问文章所在的存储介质。
然后根据上述的日志信息,计算网站中所有文章操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据。挖掘数据文件访问时间特性需要收集足够长时间跨度的I/O记录,而做出更准确的访问热度预测。
使用训练好的模型对某一文章的访问热度进行预测,就是预测该文章的访问频率落在那个区域内,如图1所示,根据访问的频率来划分中文文章的冷热程度。此时该问题就可以重新表述为一个分类问题,可以采用对训练集中的中文文章进行访问热度划分,定义热度级别(0,1,…,n-1)标记训练集中的数据。N个热度标签分别使用one-hot编码转换为0和1组成的稀疏向量。然后将数据集划分为训练集和测试集,输入到LSTM神经网络中进行训练。
LSTM使用时间记忆单元用以记录当前时刻的状态,一般称为长短期记忆神经网络的细胞与每个细胞相连的有遗忘门ft、输入门it和输出门ot这3个信息传递开关门,如图2所示。其中,xt为预测模型的输入,ht为LSTM输出,ht-1为上一时刻LSTM的输出,Ct为细胞状态,Ct-1为上一时刻的细胞状态。温度预测模型以中文文章的访问次数、访问类型、每一次访问的时间戳、访问文章所在的存储介质为输入,以该中文文章对应的温度为输出。
当模型输入xt进入LSTM单元后,第一步是经过遗忘门,通过遗忘门来决定我们会从细胞状态中丢弃什么信息。遗忘门的输出ft为:
ft=sigmoid(Wf·[ht-1,xt]+bf)
输入门决定多少新信息被存储在LSTM细胞中。输入门包含两个处理层次,sigmoid层决定细胞状态中什么值应被更新,tanh层创建一个新的候选值向量Ct′。
it=sigmoid(Wi·[ht-1,xt]+bi)
Ct′=tanh(Wc·[ht-1,xt]+bc)
LSTM细胞状态更新为原始细胞状态丢弃部分信息后,再加上新的候选值向量Ct′的和。
Ct=ft·Ct-1+it·Ct
输出门基于更新后的LSTM细胞状态,通过一个sigmoid层确定将细胞状态的哪个部分输出。细胞状态通过tanh层后和sigmoid输出相乘。
ot=sigmoid(Wo·[ht-1,xt]+bo)
ht=ot·tanh(ct)
隐含层得出结果后将结果ht传入到输出层,输出层输出模型预测结果yt
yt=f(Wyht+by)
经过预测模型预测后,可以得到中文文章的数据温度,从而进行冷热数据识别。进而作为不同存储介质中数据迁移流动的判据,对网站中的中文文章进行冷热区分后,可以将计算和存储资源对热数据做倾斜分配,或根据热度做更有针对性的处理,从而节约资源或整体上获得更高的性能。
当系统运行一段时间后,处于高速存储介质中的冷数据(不受欢迎的中文文章)和处于低一级别的热数据(受欢迎的中文文章)都会增加。这就说明对于某些文章(高速存储介质中的冷数据(低速存储介质中的热数据))来说,用户在过去很长一段时间内对该文章的需求已经降低(升高)到一定的程度,所以需要对这部分文章数据进行迁移。根据数据的结构中记录的温度,我们可以对冷区(HHD)中的热数据(热区(SSD/Redis)中的冷数据)进行有选择的迁移。

Claims (3)

1.一种用于数据分级混合存储的冷热数据识别方法,其特征在于:该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志;然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据;
对训练数据进行访问热度划分,预定义热度级别按0,1,…,n-1标记训练集中的数据;构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。
2.根据权利要求1所述的用于数据分级混合存储的冷热数据识别方法,其特征在于:其具体步骤如下:
S1、数据采集:在文件日志中对文件的历史访问数据进行采集;
S2、数据预处理:对采集到的数据进行预处理,对数据进行热度划分,并将数据局划分为训练集和测试集;
S3、模型训练:训练集输入预测模型,对模型进行训练;
S4、模型验证:将测试集输入训练好的模型,对模型效果进行验证;
S5、模型封装使用,将验证好的模型进行封装,投入到使用中;
S6、根据温度预测结果,将数据存入到不同的介质中。
3.根据权利要求1所述的用于数据分级混合存储的冷热数据识别方法,其特征在于:根据访问的频率来划分数据的冷热程度;采用对训练集中的数据进行访问热度划分,定义热度级别按0,1,…,n-1,标记训练集中的数据;N个热度标签分别使用one-hot编码转换为0和1组成的稀疏向量;然后将数据集划分为训练集和测试集,输入到LSTM神经网络中进行训练;
LSTM使用时间记忆单元用以记录当前时刻的状态,一般称为长短期记忆神经网络的细胞与每个细胞相连的有遗忘门ft、输入门it和输出门ot这3个信息传递开关门,其中,xt为预测模型的输入,ht为LSTM输出,ht-1为上一时刻LSTM的输出,Ct为细胞状态,Ct-1为上一时刻的细胞状态;温度预测模型以数据的访问次数、访问类型、每一次访问的时间戳、访问数据所在的存储介质为输入,以该数据对应的温度为输出;
当模型输入xt进入LSTM单元后,第一步是经过遗忘门,通过遗忘门来决定我们会从细胞状态中丢弃什么信息;遗忘门的输出ft为:
ft=sigmoid(Wf·[ht-1,xt]+bf)
输入门决定多少新信息被存储在LSTM细胞中;输入门包含两个处理层次,sigmoid层决定细胞状态中什么值应被更新,tanh层创建一个新的候选值向量Ct′;
it=sigmoid(Wi·[ht-1,xt]+bi)
Ct′=tanh(Wc·[ht-1,xt]+bc)
LSTM细胞状态更新为原始细胞状态丢弃部分信息后,再加上新的候选值向量Ct′的和;
Ct=ft·Ct-1+it·Ct
输出门基于更新后的LSTM细胞状态,通过一个sigmoid层确定将细胞状态的哪个部分输出;细胞状态通过tanh层后和sigmoid输出相乘;
ot=sigmoid(Wo·[ht-1,xt]+bo)
ht=ot·tanh(ct)
隐含层得出结果后将结果ht传入到输出层,输出层输出模型预测结果yt
yt=f(Wyht+by)
经过预测模型预测后,可以得到数据的数据温度,从而进行冷热数据识别。
CN202111020938.6A 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法 Active CN113792772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111020938.6A CN113792772B (zh) 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111020938.6A CN113792772B (zh) 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法

Publications (2)

Publication Number Publication Date
CN113792772A CN113792772A (zh) 2021-12-14
CN113792772B true CN113792772B (zh) 2023-11-03

Family

ID=78879358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111020938.6A Active CN113792772B (zh) 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法

Country Status (1)

Country Link
CN (1) CN113792772B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114860160B (zh) * 2022-04-15 2023-04-07 北京科杰科技有限公司 一种针对Hadoop数据平台的扩容资源预测方法及系统
CN118227595B (zh) * 2024-05-24 2024-08-09 杭州宇泛智能科技股份有限公司 基于边缘赋能的数据分类与存储方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016145850A1 (zh) * 2015-03-19 2016-09-22 清华大学 基于选择性注意原理的深度长短期记忆循环神经网络声学模型的构建方法
CN109919193A (zh) * 2019-01-31 2019-06-21 中国科学院上海光学精密机械研究所 一种大数据的智能分级方法、系统及终端
CN112948398A (zh) * 2021-04-29 2021-06-11 电子科技大学 一种面向冷热数据的分级存储系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11669735B2 (en) * 2020-01-23 2023-06-06 Vmware, Inc. System and method for automatically generating neural networks for anomaly detection in log data from distributed systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016145850A1 (zh) * 2015-03-19 2016-09-22 清华大学 基于选择性注意原理的深度长短期记忆循环神经网络声学模型的构建方法
CN109919193A (zh) * 2019-01-31 2019-06-21 中国科学院上海光学精密机械研究所 一种大数据的智能分级方法、系统及终端
CN112948398A (zh) * 2021-04-29 2021-06-11 电子科技大学 一种面向冷热数据的分级存储系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
海量遥感数据的存储迁移策略研究;赵泽亚;杨迪;梁小虎;王荣;金雪;;信息工程大学学报(第01期);全文 *

Also Published As

Publication number Publication date
CN113792772A (zh) 2021-12-14

Similar Documents

Publication Publication Date Title
CN113792772B (zh) 一种用于数据分级混合存储的冷热数据识别方法
CN110532471B (zh) 基于门控循环单元神经网络的主动学习协同过滤方法
CN102072922B (zh) 基于粒子群优化神经网络模型的木材含水率检测方法
CN110968272B (zh) 基于时间序列预测的海量小文件存储性能优化方法及系统
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN110795657A (zh) 文章推送及模型训练方法、装置、存储介质和计算机设备
CN108182500A (zh) 基于加速寿命试验的弹药贮存可靠性预测方法
CN109462578A (zh) 基于统计学习的威胁情报利用与繁殖方法
CN116976530B (zh) 一种电缆设备状态预测方法、装置及存储介质
CN110944295B (zh) 位置预测方法、装置、存储介质及终端
CN106776370A (zh) 基于对象关联性评估的云存储方法及装置
CN116451322A (zh) 基于贝叶斯优化的lstm深度学习网络的力学预测方法
CN115952355A (zh) 基于时空幂律注意力的下一兴趣点推荐系统
CN115203434A (zh) 融合bert网络与位置特征信息的实体关系抽取方法及其应用
Lei et al. Prediction of PM2. 5 concentration considering temporal and spatial features: A case study of Fushun, Liaoning Province
Liu et al. Maintenance spare parts demand forecasting for automobile 4S shop considering weather data
CN116502705A (zh) 兼用域内外数据集的知识蒸馏方法和计算机设备
CN115203073A (zh) 一种内存预取方法、装置及介质
CN115048530A (zh) 融合邻居重要度和特征学习的图卷积推荐系统
CN112733392B (zh) 基于二分类的边坡系统可靠度分析方法
Wang et al. Precipitation prediction in several Chinese regions using machine learning methods
De Souza et al. Switching nonparametric regression models for multi‐curve data
Liu et al. Research on the prediction of short time series based on EMD-LSTM
CN105184311A (zh) 一种测试分类数据集的方法
CN110580261B (zh) 针对高科技公司的深度技术追踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant