CN114665885A - 一种时序数据库自适应数据压缩方法 - Google Patents

一种时序数据库自适应数据压缩方法 Download PDF

Info

Publication number
CN114665885A
CN114665885A CN202210330862.5A CN202210330862A CN114665885A CN 114665885 A CN114665885 A CN 114665885A CN 202210330862 A CN202210330862 A CN 202210330862A CN 114665885 A CN114665885 A CN 114665885A
Authority
CN
China
Prior art keywords
delta
compressed
field value
timestamp
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210330862.5A
Other languages
English (en)
Other versions
CN114665885B (zh
Inventor
王宏志
闫浩
郑博
梁栋
叶天生
燕钰
丁小欧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Nosi Spacetime Technology Co ltd
Harbin Institute of Technology
Original Assignee
Beijing Nosi Spacetime Technology Co ltd
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Nosi Spacetime Technology Co ltd, Harbin Institute of Technology filed Critical Beijing Nosi Spacetime Technology Co ltd
Priority to CN202210330862.5A priority Critical patent/CN114665885B/zh
Publication of CN114665885A publication Critical patent/CN114665885A/zh
Application granted granted Critical
Publication of CN114665885B publication Critical patent/CN114665885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种时序数据库自适应数据压缩方法,涉及数据压缩领域。本发明是为了解决目前时序数据压缩方法还存在无法对时序数据的特征和模式自适应压缩以及压缩率低造成内存空间浪费的问题。本发明包括:获取时序数据中的时间戳和Field Value;获取待压缩的时间戳每个时间点的delta‑of‑delta值;根据每个时间点的delta‑of‑delta值进行压缩获得每个时间点的压缩结果;以时间戳每个时间点为间隔将Field Value分为Field Value数据段,利用时间戳时间点的delta‑of‑delta值对Field Value数据段划分,获得Field Value数据小段;将Field Value数据小段输入训练好的神经网络分类器中,获得Field Value数据小段压缩结果;将时间戳压缩结果和Field Value压缩结果存储到内存中,获得时间序列数据压缩结果。本发明用于时序数据的压缩。

Description

一种时序数据库自适应数据压缩方法
技术领域
本发明涉及数据压缩领域,特别涉及一种时序数据库自适应数据压缩方法。
背景技术
时序数据在当前有着极为广泛的需求。包括经济金融领域、环境监控领域、医疗生物领域、工业制造领域、农业生产领域、软硬件系统平台等各方面,都在大量使用时序数据。特别是在金融行业中,金融时序分析是金融变量随时间演变的关键技术,是金融量化分析的基础技术,对规模巨大的金融时间序列进行有效分析的基础是对其时序数据的有效管理。随着5G、“工业互联网”等领域的快速发展和传感器的大量部署,工业环境越来越复杂。在工业检测数据中,超过80%是时序数据,主要为由各行业各类型实时监测设备所采集、产生的数据。因此时序数据的高效管理对提高各个领域的生产效率至关重要。
时序数据的结构并不复杂。针对少量时序数据,添加时间戳和键值就可将数据存储在传统的数据库中,但面对终端设备产生、写入并发量比较高的海量数据场景,传统数据库管理系统的存储与管理存在问题。常用的关系数据库管理系统对于时序数据压缩表现不佳;维护成本高;单机写入吞吐低;对适用于交易处理、海量数据的聚合分析性能差。一种高效的解决方案是用时序数据库对这些时序数据进行存储和查询,时序数据库能够高效地收集、存储和分析海量时序数据,提供快速实时的检测、诊断和分析能力,精准的监控系统各个组件的运行状况和性能,当问题出现时能够快速定位和诊断。因此时序数据库需存储处理大量的时序数据,这对数据库本身的压缩方法与存储结构提出了很高的要求。
目前的时序数据库针对时序数据的不同种类,采用基于数据种类的压缩方法来进行压缩。以目前时序数据库开源社区最稳定的时序数据库InfluxDB为例,数据库中时间戳目前有两种压缩方式分别是Run-Length-Encoding(RLE)和Simple8b,还有可能不压缩。所以 TimeStamps的存储结构就有三种可能通过前4bit来表示它属于存储方式;这种方法的字符串压缩算法采用的是google开源的snappy压缩算法;Float类型使用FacebookGorillal的 XOR算法进行编码。然而现有技术的压缩方法灵活性差,相对比较死板,无法对时序数据的特征和模式自适应。同时随着数据量的增大,导致基于数据种类的压缩方法已经无法满足对压缩率的需求,从而造成了内存空间的浪费。
发明内容
本发明目的是为了解决目前时序数据压缩方法还存在无法对时序数据的特征和模式进行自适应压缩以及目前的压缩方法压缩率低从而造成内存空间浪费的问题,而提出了一种时序数据库自适应数据压缩方法。
一种时序数据库自适应数据压缩方法具体过程为:
步骤一、获取待压缩的时间序列数据;
所述时间序列数据包括:时间戳和Field Value;
步骤二、获取待压缩的时间戳每个时间点的delta-of-delta值;
步骤三、根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值,对待压缩的时间戳每个时间点进行自适应压缩获得待压缩的时间戳每个时间点的压缩结果;
步骤四、以待压缩的时间戳每个时间点为间隔将待压缩的Field Value分为多个Field Value数据段,然后根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值对Field Value数据段进行划分,获得划分好的待压缩的Field Value数据小段;
步骤五、将划分好的待压缩的Field Value数据小段输入到训练好的神经网络分类器中,获得每组待压缩的Field Value数据小段的压缩结果;
步骤六、将步骤三获得的待压缩的时间戳每个时间点的压缩结果和步骤五获得的待压缩的Field Value数据小段的压缩结果按照点位存储到内存中,获得待压缩的时间序列数据的压缩结果。
本发明的有益效果为:
本发明将时序数据的压缩分为时间戳与Field Value两个部分,基于数据特征与模式进行自适应的数据压缩算法选取,提升了数据的压缩比、灵活性和可扩展性,节约了内存空间。本发明针对时间戳的数据形态和时间间隔情况,自适应运用符合其特点的数据压缩算法,在保证解压效率的情况下提高了数据的压缩比,灵活性和可扩展性。本发明针对Field Value数据,基于数据模式自适应运用数据压缩策略,提高了数据的压缩比率,避免了内存空间的浪费。本发明使用神经网络模型形成压缩算法分类器,提升了压缩的自动化程度,提升了压缩效率,避免了内存资源的过多消耗。本发明在数据库内部内置多种压缩算法,从而在不同的需求场景中对数据采用不同的压缩策略,避免了不同特征的数据采用同一压缩算法而造成的压缩率比低和解压缩速率慢的问题。
附图说明
图1为时间戳压缩算法的流程示意图;
图2为Field Value压缩算法的流程示意图;
图3为神经网络分类器结构图。
具体实施方式
具体实施方式一:本实施方式一种时序数据库自适应数据压缩方法具体过程为:
步骤一、获取待压缩的时间序列数据中的时间戳和Field Value;
步骤二、获取待压缩的时间戳每个时间点的delta-of-delta值;
步骤三、根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值,对待压缩的时间戳每个时间点进行自适应压缩获得待压缩的时间戳每个时间点压缩结果,如图1所示;
步骤四、以待压缩的时间戳每个时间点为间隔将待压缩的Field Value分为多个Field Value数据段,然后利用步骤二获得的待压缩的时间戳每个时间点的的delta-of-delta值对 Field Value数据段进行划分,获得划分好的待压缩的Field Value数据小段;
步骤五、将划分好的待压缩的Field Value数据小段输入到训练好的神经网络分类器中,获得每组待压缩的Field Value数据小段的压缩结果,如图2所示;
步骤六、将步骤三获得的待压缩的时间戳每个时间点的压缩结果和步骤五获得的待压缩的Field Value压缩结果按照点位存储到内存中,获得待压缩的时间序列数据的压缩结果;
具体实施方式二:所述步骤二中的获取待压缩的时间戳每个时间点的delta-of-delta值,包括以下步骤:
首先,将待压缩的时间戳中的前两个时间点以原始格式存储在数据中;
然后,利用前两个时间点计算第三个时间点的delta-of-delta值,利用第二、三时间点计算第四个时间点的delta-of-delta值,依次类推进行迭代计算,获得时间戳中每个时间点的 delta-of-delta值;
具体实施方式三:所述步骤三中的根据步骤二获得的待压缩的时间戳每个时间点的 delta-of-delta值,对待压缩的时间戳每个时间点进行自适应压缩获得待压缩的时间戳每个时间点的压缩结果,包括以下步骤:
步骤三一、根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta确定待压缩的时间戳中的时间点时间间隔是否规则,若待压缩的时间戳每个时间点时间间隔相同则采用Run-Length-Encoding(RLE)算法进行编码压缩获得待压缩的时间戳每个时间点的压缩结果,结束时间戳压缩;若待压缩的时间戳每个时间点的时间间隔不规则则执行步骤三二;
待压缩的时间戳每个时间点的时间间隔是否规则通过以下方式确定:若每个时间点的 delta-of-delta值都为0即每个时间点的时间都相同;若所有时间点中任一时间点的delta-of-delta值不为0,则待压缩的时间戳时间点间隔不规则;
所述待压缩的时间戳每个时间点的压缩结果包括:用于delta-of-delta输出的标头和用于不规则数据点的数据;
步骤三二、获取间隔不规则的待压缩的时间戳每个时间点的delta-of-delta的值,若 delta-of-delta的值在{-4,4}范围内,则以4bits进行编码(采用1位二进制(1b’0)表示控制位以及3位二进制表示数据位),获得待压缩的时间戳每个时间点压缩结果;若delta-of-delta的值在{-16,16}范围内,则以7bits进行编码(采用2位二进制(2b’10)表示控制位以及5位二进制表示数据位),获得待压缩的时间戳每个时间点的压缩结果;若delta-of-delta的值在其他范围内则分别采用去除头尾零法和表示零法进行编码,选择压缩比更高的方法进行压缩,将编码压缩比高的编码结果附加到数据段获得待压缩时间戳的压缩结果;
delta-of-delta的绝对值超出16后可选取的Methond如表1所示:
表1
Figure BDA0003570694240000041
去除头尾零法:通过控制信息来存储原始数据中头尾的连续为0的数据段,从而将数据中的非零位提取出来。本文设计的格式为使用后3位来表示数据中从末位开始连续为零的字节数,用前3位来表示数据从首位起连续为零的字节数。3位控制位表示范围[1,8]而不是[0,7]。以表2中的数据为例,输入8字节的原始数据0x00 00 12 65 01 00 00 00,从首位开始有2个字节全为0,从尾部位开始有3字节全为0,因此指示位记录为6b’001010,这之后接其中非零数据信息0x12 65 01。这样,原始消耗8字节(64位)的数据被压缩转换为6位+24位=30位空间存储。
表示零法:对于一个8字节(64位)的数据,表示零法使用8位的二进制控制位来表示其中每8位数据是否是为0,然后在控制信息后将对应非零的字节数据存储。如表1所示,输入的原始数据0x00 24 00 00 00 34 10 00,控制位则以0b01000110依次表示数据的每八位数是否全为0,再将其中非0的数据值存储在控制位后面表示为0x243410。这样,原始消耗8字节(64位)的数据被压缩转换为8位+24位=30位空间存储。
本实施方式中,时间戳通常具有固定的间隔,例如1秒,这种模式可以很容易地通过 delta或者delta-of-delta变换操作来捕获。但是,某些点通常会违反此模式,例如采样抖动、网络延迟或是机器故障等。因此,本发明以字节为单位对齐不规则数据以提高压缩率比率。
具体实施方式四:所述步骤四中的根据步骤二获得的待压缩的时间戳每个时间点的 delta-of-delta值对Field Value数据段进行划分,获得划分好的待压缩的FieldValue数据小段,具体切割规则为:
如果delta-of-delta值的绝对值大于16则认为时间间隔相差很大,则:
首先,在delta-of-delta值的绝对值大于16的时间点进行切割,获得切割后的待压缩的Field Value数据段;
然后,设置阙值最大值max和最小值min,如果切割后的待压缩的Field Value数据段的长度小于min则和前一段数据段就近合并,如果大于max就对半切割,直到所有待压缩的Field Value数据段的长度在min和max之间,获得划分好的待压缩的Field Value数据小段;
根据数据集的具体情况设置max和min,一般情况下,max是min的10倍以上;
若delta-of-delta值的绝对值都不大于16,则直接与预设的min和max进行比较,获得划分好的待压缩的Field Value数据小段。
具体实施方式五:所述步骤五中的训练好的神经网络分类器,通过以下方式获得:
步骤五一、获取Field Value数据,将Field Value数据划分为Field Value数据小段;
其中,划分方法与步骤四一致;
步骤五二、利用划分好的Field Value数据小段构建训练集:
步骤五二一、对每个Field Value数据小段进行细粒度分析,获得细粒度分析结果;
步骤五二二、利用细粒度分析结果采用不同的压缩算法对Field Value数据小段进行压缩,获得每个Field Value数据小段压缩比最高的算法,并对每个Field Value数据小段进行标注,获得训练集;
压缩算法,包括:Delta、Delta-of-delta、XOR、Zigzag、Bit-packing、Delta XOR,如表2所示:
表2
Figure BDA0003570694240000051
Figure BDA0003570694240000061
步骤五三、利用步骤五二获得训练集训练神经网络分类器,获得训练好的神经网络分类器;
所述神经网络分类器包括以下两个部分,如图3所示:
1.word2vec网络
word2vec网络将步骤五二获得的训练集中的Field Value数据小段转化为Embedding向量,来作为神经网络的输入。由于需要保留每一段数据的模式特征,使用word2vec,将数值转换成数字向量。
word2vec是词嵌入方法的一种,在这里将每一个数值看成一个词语,其本质上是简化的神经网络,通过训练可以得到当前词与上下文词的关系模型,模型的权重参数即是当前词的数字编码结果,一般是隐藏层的权重矩阵。使用word2vec获得的数字向量可以在保留词上下文关系的前提下简化向量维度,包含变量在整个段传递的关系。
2.基于Bi-LSTM构造的网络:
压缩算法选择器神经网络模型是基于Bi-LSTM构造的网络。下所示为神经网络的结构图,它有一个Bi-LSTM层,一个Dense layer(全连接层)和一个Softmax层。Bi-LSTM层包含了LSTM神经元,将它们进行前后双向链接,能够前后双向的传播误差,提高算法准确度;Dense layer(全连接层)用学到的分布式特征表示映射到样本标记空间;Softmax层将神经网络的输出结果转化成概率表达式,找到最大概率项,对分类问题来说,不同大小的概率值表示这个结果属于不同类别的可能性大小。
本实施方式中,时间序列包含在一段时间内连续收集的数据点,这导致了连续的时间戳值以相对固定的速率前进并且连续的度量值总是彼此接近。同时,时间序列数据可以由不同的应用程序和领域生成,其中数据模式可能会有很大差异,为某些模式设计的压缩策略通常在其他模式上表现不佳,因此Field Value的压缩需要考虑不同模式情况。时间戳的压缩方法可以判断出时间戳存在的间隔不固定情况,基于时间序列数据的特性,很大程度上可以反映出数据模式发生了变化。

Claims (10)

1.一种时序数据库自适应数据压缩方法,其特征在于所述方法具体过程为:
步骤一、获取待压缩的时间序列数据;
所述时间序列数据包括:时间戳和Field Value;
步骤二、获取待压缩的时间戳每个时间点的delta-of-delta值;
步骤三、根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值,对待压缩的时间戳每个时间点进行自适应压缩获得待压缩的时间戳每个时间点的压缩结果;
步骤四、以待压缩的时间戳每个时间点为间隔将待压缩的Field Value分为多个FieldValue数据段,然后根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值对Field Value数据段进行划分,获得划分好的待压缩的Field Value数据小段;
步骤五、将划分好的待压缩的Field Value数据小段输入到训练好的神经网络分类器中,获得每个待压缩的Field Value数据小段的压缩结果;
步骤六、将步骤三获得的待压缩的时间戳每个时间点的压缩结果和步骤五获得的待压缩的Field Value数据小段的压缩结果按照点位存储到内存中,获得待压缩的时间序列数据的压缩结果。
2.根据权利要求1所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤二中的获取待压缩的时间戳每个时间点的delta-of-delta值,包括以下步骤:
首先,将待压缩的时间戳中的前两个时间点直接以原始格式存储;
然后,利用前两个时间点迭代计算其他时间点的delta-of-delta值。
3.根据权利要求2所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤三中的根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值,对待压缩的时间戳每个时间点进行自适应压缩获得待压缩的时间戳每个时间点压缩结果,包括以下步骤:
步骤三一、根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值确定待压缩的时间戳每个时间点之间的时间间隔是否规则,若待压缩的时间戳每个时间点之间的时间间隔相同则采用RLE算法进行编码压缩获得待压缩的时间戳每个时间点的压缩结果,结束时间戳压缩;若待压缩的时间戳每个时间点之间的时间间隔不规则则执行步骤三二;
步骤三二、获取间隔不规则的待压缩的时间戳每个时间点的delta-of-delta的值,并根据delta-of-delta的值所在范围对待压缩的时间戳每个时间点进行压缩获得待压缩的时间戳每个时间点的压缩结果。
4.根据权利要求3所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤三一中的根据步骤二获得的待压缩的时间戳每个时间点的delta-of-delta确定待压缩的时间戳每个时间点之间的时间间隔是否规则,通过以下方式确定:
若待压缩的时间戳每个时间点的delta-of-delta值都为0则待压缩的时间戳每个时间点之间的时间间隔都相同;若待压缩的时间戳任一时间点的delta-of-delta值不为0,则待压缩的时间戳每个时间点之间的时间间隔不规则。
5.根据权利要求4所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤三二中的根据delta-of-delta的值所在范围对待压缩的时间戳每个时间点进行压缩获得待压缩的时间戳每个时间点的压缩结果,具体方式为:
delta-of-delta的值在{-4,4}范围内的时间点,以4bits进行编码,获得待压缩的时间戳每个时间点的压缩结果;
delta-of-delta的值在{-16,16}范围内的时间点,以7bits进行编码,获得待压缩的时间戳每个时间点的压缩结果;
delta-of-delta的值在其他范围内的时间戳时间点,分别采用去除头尾零法和表示零法进行编码,将编码压缩比高的编码结果作为压缩结果。
6.根据权利要求5所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤四中的利用步骤二获得的待压缩的时间戳每个时间点的delta-of-delta值对Field Value数据段进行划分,获得划分好的待压缩的Field Value数据小段,包括以下步骤:
首先,获得delta-of-delta值的绝对值大于16的时间戳时间点;
然后,在delta-of-delta值的绝对值大于16的时间点处对Field Value数据段进行切割,获得切割后Field Value数据段;
最后,将切割后的每个Field Value数据段的长度与预设的最小阙值min和最大阙值max进行比较,若切割后的Field Value数据段的长度小于min,则与前一段Field Value数据段合并,若切割后的Field Value数据段的长度大于max则将该段Field Value数据段对半切割,直到所有Field Value数据段的长度在min和max之间,获得划分好的待压缩的Field Value数据小段;
若时间戳每个时间点的delta-of-delta值的绝对值均不大于16,则直接将FieldValue数据段的长度与预设的最小阙值min和最大阙值max进行比较,获得划分好的待压缩的Field Value数据小段。
7.根据权利要求6所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤五中的训练好的神经网络分类器,通过以下方式获得:
步骤五一、获取时间序列数据中的Field Value数据,将Field Value数据划分为FieldValue数据小段;
步骤五二、利用划分好的Field Value数据小段构建训练集;
步骤五三、构建神经网络分类器,并利用步骤五二获得的训练集训练神经网络分类器,获得训练好的神经网络分类器。
8.根据权利要求7所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤五二中的利用划分好的Field Value数据小段构建训练集,包括以下步骤:
步骤五二一、对每个Field Value数据小段进行细粒度分析,获得细粒度分析结果;
步骤五二二、利用细粒度分析结果采用多种压缩算法对Field Value数据小段进行压缩,获得每个Field Value数据小段压缩比最高的算法,并对每个Field Value数据小段进行标注,获得训练集。
9.根据权利要求8所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤五二二中的多种压缩算法包括:Delta、Delta-of-delta、XOR、Zigzag、Bit-packing、DeltaXOR。
10.根据权利要求9所述的一种时序数据库自适应数据压缩方法,其特征在于:所述步骤五三中的神经网络分类器包括:word2vec网络和Bi-LSTM网络;
所述word2vec网络用于将步骤五二获得的训练集中的Field Value数据小段转换为数字向量;
所述Bi-LSTM网络包括:Bi-LSTM层、全连接层、Softmax层;
所述Bi-LSTM层包含多个LSTM神经元,用于在word2vec网络和全连接层之间进行双向链接;
所述全连接层用于将Bi-LSTM层输出的分布式特征表示映射到样本标记空间;
所述Softmax层用于将神经网络分类器的输出结果转化成概率表达式,并获得最大概率项。
CN202210330862.5A 2022-03-29 2022-03-29 一种时序数据库自适应数据压缩方法 Active CN114665885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210330862.5A CN114665885B (zh) 2022-03-29 2022-03-29 一种时序数据库自适应数据压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210330862.5A CN114665885B (zh) 2022-03-29 2022-03-29 一种时序数据库自适应数据压缩方法

Publications (2)

Publication Number Publication Date
CN114665885A true CN114665885A (zh) 2022-06-24
CN114665885B CN114665885B (zh) 2022-11-04

Family

ID=82033504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210330862.5A Active CN114665885B (zh) 2022-03-29 2022-03-29 一种时序数据库自适应数据压缩方法

Country Status (1)

Country Link
CN (1) CN114665885B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118282412A (zh) * 2024-05-31 2024-07-02 山东汉方自动化有限公司 一种基于人工智能的自动化数据存储管理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110995273A (zh) * 2019-10-21 2020-04-10 武汉神库小匠科技有限公司 电力数据库的数据压缩方法、装置、设备及介质
CN112234995A (zh) * 2020-10-26 2021-01-15 杭州三汇数字信息技术有限公司 基于时空编码的信令压缩方法及系统
US20210119641A1 (en) * 2019-10-18 2021-04-22 Quasardb Sas Adaptive Delta Compression For Timeseries Data
CN113094346A (zh) * 2021-03-10 2021-07-09 北京四达时代软件技术股份有限公司 基于时间序列的大数据编解码方法及装置
CN113297208A (zh) * 2020-10-30 2021-08-24 阿里巴巴集团控股有限公司 数据处理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210119641A1 (en) * 2019-10-18 2021-04-22 Quasardb Sas Adaptive Delta Compression For Timeseries Data
CN110995273A (zh) * 2019-10-21 2020-04-10 武汉神库小匠科技有限公司 电力数据库的数据压缩方法、装置、设备及介质
CN112234995A (zh) * 2020-10-26 2021-01-15 杭州三汇数字信息技术有限公司 基于时空编码的信令压缩方法及系统
CN113297208A (zh) * 2020-10-30 2021-08-24 阿里巴巴集团控股有限公司 数据处理方法及装置
CN113094346A (zh) * 2021-03-10 2021-07-09 北京四达时代软件技术股份有限公司 基于时间序列的大数据编解码方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAOLONG WAN, HONGZHI WANG: "Efficient Semi-External SCC Computation", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING ( EARLY ACCESS )》 *
丁小欧 等: "时序数据错误检测与修复研究综述", 《智能计算机与应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118282412A (zh) * 2024-05-31 2024-07-02 山东汉方自动化有限公司 一种基于人工智能的自动化数据存储管理系统

Also Published As

Publication number Publication date
CN114665885B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN112766429B (zh) 一种异常检测的方法、装置、计算机设备和介质
CN113094346A (zh) 基于时间序列的大数据编解码方法及装置
CN113328755A (zh) 一种面向边缘计算的压缩数据传输方法
CN114665885B (zh) 一种时序数据库自适应数据压缩方法
CN111597175B (zh) 融合时空信息的传感器缺失值的填充方法
CN115695564B (zh) 一种物联网数据的高效传输方法
CN109376797B (zh) 一种基于二进制编码器和多哈希表的网络流量分类方法
CN102402476A (zh) 数据处理装置、追踪单元和诊断装置
CN114842371B (zh) 一种无监督视频异常检测方法
CN116455941A (zh) 基于物联网的室内环境多源数据传输方法及系统
CN114997313B (zh) 一种海洋在线监测数据的异常检测方法
CN114970717A (zh) 时序数据异常检测方法、电子设备及计算机存储介质
CN116821646A (zh) 数据处理链构建方法、数据缩减方法、装置、设备及介质
CN116318172A (zh) 一种设计仿真软件数据自适应压缩方法
CN116361256A (zh) 基于日志解析的数据同步方法及系统
CN117216022B (zh) 一种数字化工程咨询数据管理系统
CN117807374A (zh) 备件异常领用数据识别方法、装置和计算机设备
CN117009362A (zh) 一种电子标签的信息更新方法
CN111930725A (zh) 一种配用电数据压缩、融合方法及装置
CN109698702B (zh) 基因测序数据压缩预处理方法、系统及计算机可读介质
CN113111096B (zh) 一种面向发电设备高维时序工况数据的异常检测方法
CN110349228B (zh) 一种数据驱动最小二乘预测的三角网格压缩方法
CN115062009A (zh) 一种基于K-means聚类的灵活数据压缩方法
CN110650130B (zh) 基于多分类GoogLeNet-LSTM模型的工控入侵检测方法
Zhang et al. Compressing knowledge graph embedding with relational graph auto-encoder

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant