WO2020024797A1

WO2020024797A1 - 一种时序数据库表结构改变处理方法

Info

Publication number: WO2020024797A1
Application number: PCT/CN2019/096450
Authority: WO
Inventors: 程洪泽; 关胜亮; 廖浩均; 陶建辉
Original assignee: 北京涛思数据科技有限公司
Priority date: 2018-08-03
Filing date: 2019-07-18
Publication date: 2020-02-06
Also published as: EP3832478A4; CN109189783A; CN109189783B; US11586605B2; EP3832478A1; US20210279223A1

Abstract

一种时序数据库表结构改变处理方法，包括每个数据表有唯一的表名ID，表结构中增加schema版本和列ID；每次应用修改表的schema时,将schema版本增加，新增的列按递增的原则分配新的列ID，并提供一缺省值；数据插入时，数据节点维持有每个采集点的schema，应用的数据插入请求需要带所使用的schema的版本，数据节点对保存的schema版本与应用传过来的schema版本进行比较后按照预设的方式进行处理，通过该方法改变表的结构可瞬时完成，无需改变历史数据,新老结构定义可并行使用，能够提高灵活性。

Description

一种时序数据库表结构改变处理方法

技术领域

本发明涉及数据处理领域，具体涉及一种时序数据库表结构改变处理方法。

背景技术

一个数据采集点在同一个时间点往往采集多个参数，而且参数的个数可能随着软件或固件的更新发生改变。为应对这种改变，现有的一种方式是将每个采集的参数作为一个独立的时间序列进行存储，这样十分灵活，但是每个序列都需要保存自己的时间戳，浪费存储空间，而且不便于采集的不同参数之间的计算操作。另外一种方式就是采用传统关系型数据库的方式，每个参数是一列，多个参数就是多列，这样的好处就是多列共享了一个时间戳。但是缺点很明显，增加一新的参数，需要增加新的一列。而对于记录条数海量的表而言，将是极其低效的操作，因为要更新所有现有的数据。

发明内容

本发明的目的在于克服现有技术的不足，提供一种时序数据库表结构改变处理方法，通过该方法改变表的结构可瞬时完成，无需改变历史数据,新老结构定义可并行使用，能够提高灵活性。

本发明提供了一种时序数据库表结构改变处理方法，包括如下步骤：

每个数据表有唯一的表名ID，表结构定义中增加schema版本和列ID；

每次应用修改表的schema时,将schema版本增加，新增的列按递增的原则分配新的列ID，并提供一缺省值；

数据插入时，数据节点维持有每个采集点的schema，应用的数据插入请求需要带所使用的schema的版本，数据节点对保存的schema版本与应用传过来的schema版本进行比较后按照预设的方式进行处理。

进一步地，增加的schema版本从0或某个数开始，每次修改一次schema,schema版本加1。

进一步地，列ID从0或某个数开始，自然增长，某列被删除时对应的列ID也不重复使用。

进一步地，每列能够定义缺省值。

进一步地，如果是删除列，将其从schema中直接删除。

进一步地，修改列的名字时，保证列名字在一张表内的唯一性后可任意修改。

进一步地，进行比较的具体方式为：

如果一致，就正常处理；

如果应用的schema版本小，按出错处理；

如果应用的schema版本大，数据节点采取如下步骤：

a.将该采集点在内存缓存区的数据全部落盘；

b.去元数据节点获取该采集点最新的schema定义；

c.获取最新schema定义后，重新分配新的内存缓存区，将数据写入。

进一步地，数据从缓存区写入磁盘时，创建一数据块和对应的索引块信息，数据块里或者索引块里保存有schema的定义。

进一步地，还包括查询步骤：查询时，应用告知系统需要查询处理的列，系统需要将这些列转换为列ID，然后将查询请求发往相应的数据节点。

进一步地，还包括数据节点根据查询条件，确定满足条件的数据块，如果要查询的列在数据块里有定义，就正常处理，否则返回缺省值。

本发明的时序数据库表结构改变处理方法，可以实现：

1)修改schema瞬间完成，无需修改数据节点上的历史数据，灵活性高；

2)对于插入和查询流程，与传统方式相比，增加的检查所消耗的CPU微不足道，保证功耗的同时，效率提高；

3)应用即使没有更新最新的schema，可继续工作，新旧schema可并行存在，应用性强。

具体实施方式

下面详细说明本发明的具体实施，有必要在此指出的是，以下实施只是用于本发明的进一步说明，不能理解为对本发明保护范围的限制，该领域技术熟练人员根据上述本发明内容对本发明做出的一些非本质的改进和调整，仍然属于本发明的保护范围。

本发明提供了一种时序数据库表结构改变处理方法，下面对该方法进行具体的介绍。

一、表结构(schema)的调整

表结构的定义里需要有schema版本,从0或某个数开始，每次修改一次schema,加1

表结构，列的定义除列名、数据类型外，需要有列ID，列ID从0或某个数开始，自然增长，即使某列被删除，它的列ID不能被重复使用。每列可以定义缺省值，如果采集的时序数据不带此列时，可以设置的缺省值。

二、索引文件里索引块的调整

每个索引块里需要包含schema信息，包括

o数据类型

o字节数

o列ID

Schema参数也可以放在数据文件的数据块里。

三、修改Schema的流程

应用修改表的schema,递交后，维护采集点schema的元数据节点Meta Node只有简单三点，没有其他操作。

1)需要将schema版本增一；

2)新增的列需要按递增的原则分配一新的列ID，而且需要提供一缺省值；

3)如果是删除列，就简单将其从schema中删除。

4)对于修改表或列的名字，只要保证名字的唯一性，可任意修改

四、数据插入流程的调整

1)数据节点维持有每个采集点的schema

2)应用的插入请求需要带所使用的schema的版本

3)数据节点对保存的schema版本与应用传过来的schema版本进行比较。如果一致，就正常处理。如果应用的schema版本小，按出错处理。但如果应用的schema版本大，意味着应用已经更新，已经有最新的schema。这时数据节点需要采取如下步骤：

a.将该采集点在内存缓存区的数据全部落盘；

b.去元数据节点获取该采集点最新的schema定义；

c.获取最新schema后，重新分配新的内存缓存区，将数据写入；

4)数据从缓存区写入磁盘时，需要检查schema版本是否改变，如果已经改变，老的数据块需要关闭，而需要建立一新的数据块，新的数据块里带有新的schema的定义；

五、数据查询流程的调整

1)查询时，应用需要告知系统哪些列需要查询处理，系统需要将这些列换为列ID，然后将查询请求发往相应的数据节点；

2)数据节点根据查询条件，先确定满足条件的数据块；

3)如果要查询的列在数据块里有定义，就正常处理。如果查询的列在数据块里没有定义，就返回缺省值。

尽管为了说明的目的，已描述了本发明的示例性实施方式，但是本领域的技术人员将理解，不脱离所附权利要求中公开的发明的范围和精神的情况下，可以在形式和细节上进行各种修改、添加和替换等的改变，而所有这些改变都应属于本发明所附权利要求的保护范围，并且本发明要求保护的产品各个部门和方法中的各个步骤，可以以任意组合的形式组合在一起。因此，对本发明中所公开的实施方式的描述并非为了限制本发明的范围，而是用于描述本发明。相应地，本发明的范围不受以上实施方式的限制，而是由权利要求或其等同物进行限定。

Claims

一种时序数据库表结构改变处理方法，其特征在于，包括如下步骤：

每个数据表有唯一的表名ID，表结构定义中增加schema版本和列ID；

每次应用修改表的schema时,将schema版本增加，新增的列按递增的原则分配新的列ID，并提供一缺省值；

数据插入时，数据节点维持有每个采集点的schema，应用的数据插入请求需要带所使用的schema的版本，数据节点对保存的schema版本与应用传过来的schema版本进行比较后按照预设的方式进行处理。
如权利要求1所述的方法，其特征在于：增加的schema版本从0或某个数开始，每次修改一次schema,schema版本加1。
如权利要求1所述的方法，其特征在于：列ID从0或某个数开始，自然增长，某列被删除时对应的列ID也不重复使用。
如权利要求1所述的方法，其特征在于：如果是删除列，将其从schema中直接删除。
如权利要求1-4任一项所述的方法，其特征在于：修改列的名字时，保证列名字在一张表里的唯一性后可任意修改。
如权利要求1所述的方法，其特征在于：进行比较的具体方式为：

如果一致，就正常处理；

如果应用的schema版本小，按出错处理；

如果应用的schema版本大，数据节点采取如下步骤：

a.将该采集点在内存缓存区的数据全部落盘；

b.去元数据节点获取该采集点最新的schema定义；

c.获取最新schema定义后，重新分配新的内存缓存区，将数据写入。
如权利要求6所述的方法，其特征在于：数据从缓存区写入磁盘时，建立一新的数据块和对应的索引块信息，新的数据块里或者索引块里保存有其schema的定义。
如权利要求1所述的方法，其特征在于：还包括查询步骤：查询时，应用告知系统需要查询处理的列，系统需要将这些列转换为列ID，然后将查询请求发往相应的数据节点。
如权利要求8所述的方法，其特征在于：还包括数据节点根据查询条件，确定满足条件的数据块，如果要查询的列在数据块里有定义，就正常处理，否则返回缺省值。