CN113792772A - 一种用于数据分级混合存储的冷热数据识别方法 - Google Patents

一种用于数据分级混合存储的冷热数据识别方法 Download PDF

Info

Publication number
CN113792772A
CN113792772A CN202111020938.6A CN202111020938A CN113792772A CN 113792772 A CN113792772 A CN 113792772A CN 202111020938 A CN202111020938 A CN 202111020938A CN 113792772 A CN113792772 A CN 113792772A
Authority
CN
China
Prior art keywords
data
cold
model
temperature
hot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111020938.6A
Other languages
English (en)
Other versions
CN113792772B (zh
Inventor
胡昌平
侍守创
刘彩云
朱大鹏
姜厚禄
闫四洋
胡翔宇
孟祥慈
李红星
王纪潼
徐雷
左刚
单文金
吕从飞
尹玉峰
韩占港
许永正
董奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jierui Information Technology Co Ltd
716th Research Institute of CSIC
Original Assignee
Jiangsu Jierui Information Technology Co Ltd
716th Research Institute of CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jierui Information Technology Co Ltd, 716th Research Institute of CSIC filed Critical Jiangsu Jierui Information Technology Co Ltd
Priority to CN202111020938.6A priority Critical patent/CN113792772B/zh
Publication of CN113792772A publication Critical patent/CN113792772A/zh
Application granted granted Critical
Publication of CN113792772B publication Critical patent/CN113792772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明是一种用于数据分级混合存储的冷热数据识别方法,属数据存储技术领域。该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;该方法使用温度模型来衡量数据的冷热程度,为每个数据赋予一个持久性的温度属性,不仅可以用于判断系统中数据的冷热程度,即使当数据进行了迁移,温度属性会一直伴随着数据,依然可以使用该属性来衡量和识别数据的冷热程度。

Description

一种用于数据分级混合存储的冷热数据识别方法
技术领域
本发明涉及数据存储技术领域,具体涉及一种用于数据分级混合存储的冷热数据识别方法。
背景技术
数据库中存放的数据通常有冷热之分,我们认为频繁被访问的数据称为热数据(hot data),与之相对的,访问不频繁甚至在一段时间内都不会被访问的数据称之为冷数据(cold data)。所以可以依据数据冷热程度将数据存储在不同的介质上,在保证系统性能的前提下最大程度的降低存储成本或整体上获得更高的性能。所有如何评估数据的冷热程度(为数据进行温度判定)一直都是数据库研究领域中的一大热点。
针对数据的冷热程度,最直接的衡量依据为未来该数据的访问概率,即未来访问概率较大的数据为热数据,而被访问概率较小或不再被访问的数据则为冷数据。在实际应用中,无法预测数据未来的访问情况,因而在数据库中通常会制定其他的衡量办法以期能“预测”未来的访问情况,进而对数据的冷热程度进行表示。目前,识别冷热数据大多依赖于LRU等特定的数据结构,利用数据的相对位置来判定数据的冷热,无法全面反映数据的冷热程度,而且这种识别方式不可量化且不具有可持久性。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种新的用于数据分级混合存储的冷热数据识别方法,该方法使用温度模型来衡量数据的冷热程度,为每个数据赋予一个持久性的温度属性,不仅可以用于判断系统中数据的冷热程度,即使当数据进行了迁移(低速存储设备向高速存储设备或者相反),温度属性会一直伴随着数据,依然可以使用该属性来衡量和识别数据的冷热程度。
本发明所要解决的技术问题是通过以下的技术方案来实现的。本发明是一种用于数据分级混合存储的冷热数据识别方法,其特点是:该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志;然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据;
对训练数据进行访问热度划分,预定义热度级别按0,1,…,n-1标记训练集中的数据;构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。
本发明所要解决的技术问题还可以通过以下的技术方案来实现进一步实现。以上所述的本发明用于数据分级混合存储的冷热数据识别方法,其特点是:其具体步骤如下:
S1、数据采集:在文件日志中对文件的历史访问数据进行采集;
S2、数据预处理:对采集到的数据进行预处理,对数据进行热度划分,并将数据局划分为训练集和测试集;
S3、模型训练:训练集输入预测模型,对模型进行训练;
S4、模型验证:将测试集输入训练好的模型,对模型效果进行验证;
S5、模型封装使用,将验证好的模型进行封装,投入到使用中;
S6、根据温度预测结果,将数据存入到不同的介质中。
本发明所要解决的技术问题还可以通过以下的技术方案来实现进一步实现。以上所述的本发明用于数据分级混合存储的冷热数据识别方法,其特点是:根据访问的频率来划分数据的冷热程度;采用对训练集中的数据进行访问热度划分,定义热度级别按0,1,…,n-1,标记训练集中的数据;N个热度标签分别使用one-hot编码转换为0和1组成的稀疏向量;然后将数据集划分为训练集和测试集,输入到LSTM神经网络中进行训练;
LSTM使用时间记忆单元用以记录当前时刻的状态,一般称为长短期记忆神经网络的细胞与每个细胞相连的有遗忘门ft、输入门it和输出门ot这3个信息传递开关门,其中,xt为预测模型的输入,ht为LSTM输出,ht-1为上一时刻LSTM的输出,Ct为细胞状态,Ct-1为上一时刻的细胞状态;温度预测模型以数据的访问次数、访问类型、每一次访问的时间戳、访问数据所在的存储介质为输入,以该数据对应的温度为输出;
当模型输入xt进入LSTM单元后,第一步是经过遗忘门,通过遗忘门来决定我们会从细胞状态中丢弃什么信息;遗忘门的输出ft为:
ft=sigmoid(Wf·[ht-1,xt]+bf)
输入门决定多少新信息被存储在LSTM细胞中;输入门包含两个处理层次,sigmoid层决定细胞状态中什么值应被更新,tanh层创建一个新的候选值向量Ct′;
it=sigmoid(Wi·[ht-1,xt]+bi)
Ct′=tanh(Wc·[ht-1,xt]+bc)
LSTM细胞状态更新为原始细胞状态丢弃部分信息后,再加上新的候选值向量Ct′的和;
Ct=ft·Ct-1+it·Ct
输出门基于更新后的LSTM细胞状态,通过一个sigmoid层确定将细胞状态的哪个部分输出;细胞状态通过tanh层后和sigmoid输出相乘;
ot=sigmoid(Wo·[ht-1,xt]+bo)
ht=ot·tanh(ct)
隐含层得出结果后将结果ht传入到输出层,输出层输出模型预测结果yt
yt=f(Wyht+by)
经过预测模型预测后,可以得到数据的数据温度,从而进行冷热数据识别。
本发明采用基于LSTM的数据温度预测模型对数据温度进行预测。将数据看作实际物体,随着时间的推移,物理环境中温度高的物体会逐渐冷却,同样的,数据存储中数据的温度也会逐渐降低;当访问数据时,类似于赋予物体新的能量,物体的温度会升高,访问操作也给数据带来了能量,数据的温度会升高,实现数据的“加温”。所以我们可以借助温度模型对数据温度进行计算,然后依据温度对数据进行冷热程度的划分。因此,可以将数据的冷热程度定义为数据温度的高低:数据的冷热程度≈数据温度的高低。
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志。然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据。对训练数据进行访问热度划分,预定义热度级别(0,1,…,n-1)标记训练集中的数据。这样构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。封装后的模型投入到使用中,根据温度预测模型提供的预测结果,将数据按温度的由高到低分别存储到RAM、SSD和HDD中。
与现有技术相比,本发明具有以下有益效果:使用温度模型来衡量数据的冷热程度,为每个数据赋予一个持久性的温度属性,不仅可以用于判断系统中数据的冷热程度,即使当数据进行了迁移(低速存储设备向高速存储设备或者相反),温度属性会一直伴随着数据,依然可以使用该属性来衡量和识别数据的冷热程度。采用基于深度学习的温度预测模型可以对数据温度进行精准预测,对数据按访问热度进行合理划分,以实现在分级混合存储架构下,工业云应用集成开发平台I/O访问性能的极致加速。
附图说明
图1是根据访问频率区间划分冷热数据图;
图2是LSTM神经元结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1,一种用于数据分级混合存储的冷热数据识别方法,该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志;然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据;
对训练数据进行访问热度划分,预定义热度级别按0,1,…,n-1标记训练集中的数据;构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。
其具体步骤如下:
S1、数据采集:在文件日志中对文件的历史访问数据进行采集;
S2、数据预处理:对采集到的数据进行预处理,对数据进行热度划分,并将数据局划分为训练集和测试集;
S3、模型训练:训练集输入预测模型,对模型进行训练;
S4、模型验证:将测试集输入训练好的模型,对模型效果进行验证;
S5、模型封装使用,将验证好的模型进行封装,投入到使用中;
S6、根据温度预测结果,将数据存入到不同的介质中。
实施例2,用于数据分级混合存储的冷热数据识别方法实验:
本实施例以某中文阅读网站为实施对象,对网站中存储的中文文章进行热度识别,以此提供数据分级存储的依据。
首先对网站日志中所有中文文章的数据进行采集,日志需要记录的信息包括中文文章的访问次数、访问类型、每一次访问的时间戳、访问文章所在的存储介质。
然后根据上述的日志信息,计算网站中所有文章操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据。挖掘数据文件访问时间特性需要收集足够长时间跨度的I/O记录,而做出更准确的访问热度预测。
使用训练好的模型对某一文章的访问热度进行预测,就是预测该文章的访问频率落在那个区域内,如图1所示,根据访问的频率来划分中文文章的冷热程度。此时该问题就可以重新表述为一个分类问题,可以采用对训练集中的中文文章进行访问热度划分,定义热度级别(0,1,…,n-1)标记训练集中的数据。N个热度标签分别使用one-hot编码转换为0和1组成的稀疏向量。然后将数据集划分为训练集和测试集,输入到LSTM神经网络中进行训练。
LSTM使用时间记忆单元用以记录当前时刻的状态,一般称为长短期记忆神经网络的细胞与每个细胞相连的有遗忘门ft、输入门it和输出门ot这3个信息传递开关门,如图2所示。其中,xt为预测模型的输入,ht为LSTM输出,ht-1为上一时刻LSTM的输出,Ct为细胞状态,Ct-1为上一时刻的细胞状态。温度预测模型以中文文章的访问次数、访问类型、每一次访问的时间戳、访问文章所在的存储介质为输入,以该中文文章对应的温度为输出。
当模型输入xt进入LSTM单元后,第一步是经过遗忘门,通过遗忘门来决定我们会从细胞状态中丢弃什么信息。遗忘门的输出ft为:
ft=sigmoid(Wf·[ht-1,xt]+bf)
输入门决定多少新信息被存储在LSTM细胞中。输入门包含两个处理层次,sigmoid层决定细胞状态中什么值应被更新,tanh层创建一个新的候选值向量Ct′。
it=sigmoid(Wi·[ht-1,xt]+bi)
Ct′=tanh(Wc·[ht-1,xt]+bc)
LSTM细胞状态更新为原始细胞状态丢弃部分信息后,再加上新的候选值向量Ct′的和。
Ct=ft·Ct-1+it·Ct
输出门基于更新后的LSTM细胞状态,通过一个sigmoid层确定将细胞状态的哪个部分输出。细胞状态通过tanh层后和sigmoid输出相乘。
ot=sigmoid(Wo·[ht-1,xt]+bo)
ht=ot·tanh(ct)
隐含层得出结果后将结果ht传入到输出层,输出层输出模型预测结果yt
yt=f(Wyht+by)
经过预测模型预测后,可以得到中文文章的数据温度,从而进行冷热数据识别。进而作为不同存储介质中数据迁移流动的判据,对网站中的中文文章进行冷热区分后,可以将计算和存储资源对热数据做倾斜分配,或根据热度做更有针对性的处理,从而节约资源或整体上获得更高的性能。
当系统运行一段时间后,处于高速存储介质中的冷数据(不受欢迎的中文文章)和处于低一级别的热数据(受欢迎的中文文章)都会增加。这就说明对于某些文章(高速存储介质中的冷数据(低速存储介质中的热数据))来说,用户在过去很长一段时间内对该文章的需求已经降低(升高)到一定的程度,所以需要对这部分文章数据进行迁移。根据数据的结构中记录的温度,我们可以对冷区(HHD)中的热数据(热区(SSD/Redis)中的冷数据)进行有选择的迁移。

Claims (3)

1.一种用于数据分级混合存储的冷热数据识别方法,其特征在于:该方法采用基于LSTM的数据温度预测模型对数据温度进行预测;以数据的温度属性作为数据的冷热程度的识别依据,并且模型假设当前温度较低的数据,在未来被访问的概率也比较低,所以视为冷数据,当前温度较高的数,在未来被访问的概率高,所以视为热数据;将数据的冷热程度定义为数据温度的高低:数据的冷热程度等同于数据温度的高低;
模型的训练样本来自于对文件的历史访问数据进行记录行为文件的访问日志;然后根据日志信息,计算各类文件操作在时间轴上的变化趋势,挖掘文件访问的时间特性,并按照合适的时间窗口整理成文件的时序访问特征序列,构建出用于进行训练的数据;
对训练数据进行访问热度划分,预定义热度级别按0,1,…,n-1标记训练集中的数据;构建的数据集中就蕴含着文件本身的访问热度信息,然后将数据集划分为训练集和测试集,输入到循环神经网络中进行训练,模型训练完成后经测试集进行验证,验证完成后进行模型封装。
2.根据权利要求1所述的用于数据分级混合存储的冷热数据识别方法,其特征在于:其具体步骤如下:
S1、数据采集:在文件日志中对文件的历史访问数据进行采集;
S2、数据预处理:对采集到的数据进行预处理,对数据进行热度划分,并将数据局划分为训练集和测试集;
S3、模型训练:训练集输入预测模型,对模型进行训练;
S4、模型验证:将测试集输入训练好的模型,对模型效果进行验证;
S5、模型封装使用,将验证好的模型进行封装,投入到使用中;
S6、根据温度预测结果,将数据存入到不同的介质中。
3.根据权利要求1所述的用于数据分级混合存储的冷热数据识别方法,其特征在于:根据访问的频率来划分数据的冷热程度;采用对训练集中的数据进行访问热度划分,定义热度级别按0,1,…,n-1,标记训练集中的数据;N个热度标签分别使用one-hot编码转换为0和1组成的稀疏向量;然后将数据集划分为训练集和测试集,输入到LSTM神经网络中进行训练;
LSTM使用时间记忆单元用以记录当前时刻的状态,一般称为长短期记忆神经网络的细胞与每个细胞相连的有遗忘门ft、输入门it和输出门ot这3个信息传递开关门,其中,xt为预测模型的输入,ht为LSTM输出,ht-1为上一时刻LSTM的输出,Ct为细胞状态,Ct-1为上一时刻的细胞状态;温度预测模型以数据的访问次数、访问类型、每一次访问的时间戳、访问数据所在的存储介质为输入,以该数据对应的温度为输出;
当模型输入xt进入LSTM单元后,第一步是经过遗忘门,通过遗忘门来决定我们会从细胞状态中丢弃什么信息;遗忘门的输出ft为:
ft=sigmoid(Wf·[ht-1,xt]+bf)
输入门决定多少新信息被存储在LSTM细胞中;输入门包含两个处理层次,sigmoid层决定细胞状态中什么值应被更新,tanh层创建一个新的候选值向量Ct′;
it=sigmoid(Wi·[ht-1,xt]+bi)
Ct′=tanh(Wc·[ht-1,xt]+bc)
LSTM细胞状态更新为原始细胞状态丢弃部分信息后,再加上新的候选值向量Ct′的和;
Ct=ft·Ct-1+it·Ct
输出门基于更新后的LSTM细胞状态,通过一个sigmoid层确定将细胞状态的哪个部分输出;细胞状态通过tanh层后和sigmoid输出相乘;
ot=sigmoid(Wo·[ht-1,xt]+bo)
ht=ot·tanh(ct)
隐含层得出结果后将结果ht传入到输出层,输出层输出模型预测结果yt
yt=f(Wyht+by)
经过预测模型预测后,可以得到数据的数据温度,从而进行冷热数据识别。
CN202111020938.6A 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法 Active CN113792772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111020938.6A CN113792772B (zh) 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111020938.6A CN113792772B (zh) 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法

Publications (2)

Publication Number Publication Date
CN113792772A true CN113792772A (zh) 2021-12-14
CN113792772B CN113792772B (zh) 2023-11-03

Family

ID=78879358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111020938.6A Active CN113792772B (zh) 2021-09-01 2021-09-01 一种用于数据分级混合存储的冷热数据识别方法

Country Status (1)

Country Link
CN (1) CN113792772B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114860160A (zh) * 2022-04-15 2022-08-05 北京科杰科技有限公司 一种针对Hadoop数据平台的扩容资源预测方法及系统
CN118227595A (zh) * 2024-05-24 2024-06-21 杭州宇泛智能科技股份有限公司 基于边缘赋能的数据分类与存储方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016145850A1 (zh) * 2015-03-19 2016-09-22 清华大学 基于选择性注意原理的深度长短期记忆循环神经网络声学模型的构建方法
CN109919193A (zh) * 2019-01-31 2019-06-21 中国科学院上海光学精密机械研究所 一种大数据的智能分级方法、系统及终端
CN112948398A (zh) * 2021-04-29 2021-06-11 电子科技大学 一种面向冷热数据的分级存储系统及方法
US20210232906A1 (en) * 2020-01-23 2021-07-29 Vmware, Inc. System and method for automatically generating neural networks for anomaly detection in log data from distributed systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016145850A1 (zh) * 2015-03-19 2016-09-22 清华大学 基于选择性注意原理的深度长短期记忆循环神经网络声学模型的构建方法
CN109919193A (zh) * 2019-01-31 2019-06-21 中国科学院上海光学精密机械研究所 一种大数据的智能分级方法、系统及终端
US20210232906A1 (en) * 2020-01-23 2021-07-29 Vmware, Inc. System and method for automatically generating neural networks for anomaly detection in log data from distributed systems
CN112948398A (zh) * 2021-04-29 2021-06-11 电子科技大学 一种面向冷热数据的分级存储系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵泽亚;杨迪;梁小虎;王荣;金雪;: "海量遥感数据的存储迁移策略研究", 信息工程大学学报, no. 01 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114860160A (zh) * 2022-04-15 2022-08-05 北京科杰科技有限公司 一种针对Hadoop数据平台的扩容资源预测方法及系统
CN114860160B (zh) * 2022-04-15 2023-04-07 北京科杰科技有限公司 一种针对Hadoop数据平台的扩容资源预测方法及系统
CN118227595A (zh) * 2024-05-24 2024-06-21 杭州宇泛智能科技股份有限公司 基于边缘赋能的数据分类与存储方法及装置

Also Published As

Publication number Publication date
CN113792772B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
Sainct et al. Efficient methodology for seismic fragility curves estimation by active learning on Support Vector Machines
CN110795657B (zh) 文章推送及模型训练方法、装置、存储介质和计算机设备
Zhang et al. Traffic Accident Prediction Based on LSTM‐GBRT Model
CN104573669A (zh) 图像物体检测方法
CN113792772B (zh) 一种用于数据分级混合存储的冷热数据识别方法
CN109471944A (zh) 文本分类模型的训练方法、装置及可读存储介质
CN111985207B (zh) 一种访问控制策略的获取方法、装置及电子设备
CN113689234B (zh) 一种基于深度学习的平台相关的广告点击率预测方法
CN112966115B (zh) 基于记忆损失预测和延迟训练的主动学习事件抽取方法
CN109462578A (zh) 基于统计学习的威胁情报利用与繁殖方法
CN113190662A (zh) 基于篇章结构图网络的话题分割方法
CN115203434A (zh) 融合bert网络与位置特征信息的实体关系抽取方法及其应用
Zhang The Evaluation on the Credit Risk of Enterprises with the CNN‐LSTM‐ATT Model
Liu et al. Maintenance spare parts demand forecasting for automobile 4S shop considering weather data
US11829442B2 (en) Methods and systems for efficient batch active learning of a deep neural network
Luo et al. A prediction method based on improved ridge regression
CN115600226B (zh) 一种仓单质押数据处理方法及装置
Li et al. A data-driven rutting depth short-time prediction model with metaheuristic optimization for asphalt pavements based on RIOHTrack
Perez-Valiente et al. Identification of reservoir analogues in the presence of uncertainty
Li et al. Evaluating the rationality of judicial decision with LSTM-based case modeling
CN116629716A (zh) 一种智能交互系统工效分析方法
CN116502705A (zh) 兼用域内外数据集的知识蒸馏方法和计算机设备
CN110580261B (zh) 针对高科技公司的深度技术追踪方法
CN113592341A (zh) 度量损失函数、扇区复杂度评估方法及系统
Bahadır et al. A comparative study for employee churn prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant