CN106250523B - 一种分布式列存储系统索引的方法 - Google Patents

一种分布式列存储系统索引的方法 Download PDF

Info

Publication number
CN106250523B
CN106250523B CN201610634581.3A CN201610634581A CN106250523B CN 106250523 B CN106250523 B CN 106250523B CN 201610634581 A CN201610634581 A CN 201610634581A CN 106250523 B CN106250523 B CN 106250523B
Authority
CN
China
Prior art keywords
data
column
statistical information
thresholding
column data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610634581.3A
Other languages
English (en)
Other versions
CN106250523A (zh
Inventor
孙乔
付兰梅
邓卜侨
孙雷
马慧远
刘炜
崔伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Beijing China Power Information Technology Co Ltd
Beijing Zhongdian Feihua Communication Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Beijing Fibrlink Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Beijing Electric Power Co Ltd, Beijing Guodiantong Network Technology Co Ltd, Beijing Fibrlink Communications Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201610634581.3A priority Critical patent/CN106250523B/zh
Publication of CN106250523A publication Critical patent/CN106250523A/zh
Application granted granted Critical
Publication of CN106250523B publication Critical patent/CN106250523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式列存储系统索引的方法,包括:获取每列数据的分布特征,设定每列数据的域值及划分规则;根据域值及划分规则,得到划分后的连续数据区域;分别对应每个数据区域建立一个区域编码向量;进行统计计算,得到每列数据的统计信息,将统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;将带有统计信息的区域编码向量作为位图索引的位向量进行数据的索引。所述分布式列存储系统索引的方法通过设定每列数据的域值和划分规则,使得分组位图索引的划分方式与查询的过滤条件相符合,通过计算列数据的统计信息,不仅提高了分组位图查询的准确性,而且能够保留列存储系统中数据的统计信息,保证数据信息的完整性。

Description

一种分布式列存储系统索引的方法
技术领域
本发明涉及列存储系统中数据索引的技术领域,特别是指一种分布式列存储系统索引的方法。
背景技术
实现数据库物理数据存储的方法有两种:基于行存储、基于列存储。对于基于行存储:它把逻辑数据表的整个记录存储到文件的数据块中,为了提高查询速度,为某些列建立B+树等类型的索引。对于基于列存储:逻辑数据表中的记录不直接映射到物理数据中,而是把记录按列分开,把所有记录同一列的值存在一起,同时提供连接数据能够把记录相应的列值重新组合起来形成记录。其中,基于行存储的关系型数据库和基于列存储的数据库相比在数据查询性能上有劣势,查询时,它不能只读取部分列,因为数据读取是以数据块为基本单位,所有的列都读取到内存中然后再去掉不需要的列,这样就导致产生了很多不必要的硬盘输入输出,从而影响了数据库的查询性能。而对于基于列存储的关系型数据库,由于它把记录的列分开存储,不同的列存储在不同的数据块中,这样查询引擎就可以按需读取列,从而减少了硬盘输入输出,提高了数据库的查询性能。
在关系数据库中,索引是一种与表有关的数据库结构,为快速查找数据提供了一种捷径,在索引结构类型上,列存储常使用树索引和位图索引,且位图索引使用得较多,因为位图索引不仅压缩效率高,而且能对位图编码的数据直接进行快速的逻辑和连接操作。位图索引中位向量的个数随列基数的增加而线性增加,所以位图索引的方法仅对低基数的列非常有效。已有多种方法改造位图索引,使之适应高基数列。其中一种主要的方法是将位图的概念进行扩充,包括分组位图索引、位片式索引和使用属性特性映射的扩展。其中,所述分组位图索引是将一组值归成一类,将一类值按一个值的方式编码,位向量个数为属性值的组数。按这种方法可以将高基数列的许多位向量合并成很少的位向量,减少了位向量的个数。由于一个位图代表多个值,虽然简化了对查询过程中的条件过滤处理和范围查找。但是,按照这种方法,位图划分的质量将直接影响查询的准确性,如果划分属性的方式与查询的过滤条件对值的划分相符,则查询的准确性高。反之,则准确率较低。同时,上述将位图的概念进行扩充时虽然减少了计算的代价,但是扩展后的位图丢失了数据的统计信息。给后续的统计信息的查询带来不便。
发明内容
有鉴于此,本发明的目的在于提出一种分布式列存储系统索引的方法,能够提高位图划分的质量,同时保留数据的统计信息。
基于上述目的本发明提供的一种分布式列存储系统索引的方法,包括:
获取列存储系统中每列数据的分布特征,根据获取的分布特征设定每列数据的域值以及每列数据的划分规则;
根据所述每列数据的域值以及每列数据的划分规则,计算得到对数据划分后连续的数据区域;
根据划分后的每个数据区域,分别对应建立一个区域编码向量;
对每列数据进行统计计算,得到每列数据的统计信息,并将所述统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;
将所述带有统计信息的区域编码向量作为位图索引的位向量,进行数据的索引操作。
可选的,所述获取列存储系统中数据的分布特征的步骤还包括:
将每列数据按照数值的大小排序,得到由大到小或者由小到大的有序数据;
根据数据的排列顺序,计算得到有序数据的变化曲线;
根据数据的变化曲线,得到每列数据的分布特征。
可选的,所述计算得到有序数据的变化曲线的步骤之前还包括:
从所述有序数据中提取出间隔相等的部分数据,根据提取出的部分数据计算得到有序数据的变化曲线。
可选的,所述根据获取的分布特征设定每列数据的域值以及每列数据的划分规则的步骤还包括:
根据获取的分布特征,查询预先设定的分布特征与域值、划分规则的对应关系列表;
将查询得到的域值 与划分规则作为该列数据的域值和该列数据的划分规则。
可选的,所述对每列数据进行统计计算的步骤之前还包括:
根据位图索引的需求,得到索引目标特征,
检索预设的目标特征与统计信息类型对应的关系列表,得到索引所需的统计信息类型;
将获得的统计信息类型作为进行统计计算的目标值。
可选的,所述统计信息包括:最大值、最小值、平均值、中位值、方差、标准差。
可选的,所述划分规则为递增分配、递减分配以及平均分配。
可选的,所述递增分配为域值的区间长度为递增分布;所述递减分配为所述域值的区间长度为递减分布;所述平均分配为所述域值的区间长度为平均分布。
从上面所述可以看出,本发明提供的分布式列存储系统索引的方法,通过采集列存储系统中数据的分布特征,然后根据所述分布特征设定每列数据的域值和划分规则,进而使得所述分组位图索引的划分方式与查询的过滤条件相符合,最后提高查询的准确性。通过预先计算列数据的统计信息,使得在列数据的分组后获得的区域编码向量依然能够保留列数据的统计信息,为后续的统计信息的查询提供便利。所以,所述分布式列存储系统索引的方法不仅提高了分组位图查询的准确性,而且能够保留列存储系统中数据的统计信息,保证数据信息的完整性。
附图说明
图1为本发明提供的分布式列存储系统索引的方法一个实施例的流程图;
图2为本发明提供的分布式列存储系统索引的方法另一个实施例的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
参照图1所示,为本发明提供的分布式列存储系统索引的方法一个实施例的流程图。所述分布式列存储系统索引的方法包括:
步骤101,获取列存储系统中每列数据的分布特征,根据获取的分布特征设定每列数据的域值以及每列数据的划分规则;
其中,所述列数据是指在列存储系统中针对以列形式存储的数据,是相对于行数据而言的。所述分布特征是指该列数据其数值的范围、所处的区间以及数值变化的趋势等于数据分布有关的参数,例如:某列数据所绘制出的曲线为抛物线,则表示该列数据为上升或者递增趋势的数据。所述域值 是指依据划分规则得到的一个数值区域范围,用于保证每列数据中的每一个值均将落入划分后的域值 内,也即使得所述域值 为连续的数值范围。所述划分规则是指对域值 的数值范围长度划分的一个规则,可以选择规律性的划分方式,也可以根据需要按照随机数值的范围长度进行划分。
步骤102,根据所述每列数据的域值以及每列数据的划分规则,计算得到对数据划分后连续的数据区域;
其中,通过设定后的域值 以及划分的规则,就能够得到连续的数值区域,用于将列存储系统中的数据均划分到这些连续的数值区域中,实现分组位图索引中的分组步骤。
步骤103,根据划分后的每个数据区域,分别对应建立一个区域编码向量;
这里,建立区域编码向量与分组位图索引中建立位向量的方法是相同的,其目的是为了后续检索的时候能够通过区域编码向量确定划分的区域,进而提高数据检索的效率。所述区域编码向量的建立方式既可以是按照顺序规律地编码,也可以根据需要选定合适的编码方式。
步骤104,对每列数据进行统计计算,得到每列数据的统计信息,并将所述统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;
其中,所述对每列数据进行统计计算的步骤也可以在步骤101之前进行;所述统计计算既可以是计算每列数据所共有的统计信息,也可以是对划分后的每个区域分别单独进行统计计算,得到每个区域的统计信息,这样,在后续查询统计信息时皆可以查询得到总的统计信息,也可以得到每个区域中的统计信息。当然,根据检索的需要,也可以增加更多信息的获取,例如:时间信息、位置信息等等。
步骤105,将所述带有统计信息的区域编码向量作为位图索引的位向量,进行数据的索引操作。
在得到带有统计信息的区域编码向量后,就能够按照常规位图索引的方法进行数据的索引,当然,也可以采用不同的索引结构进行索引。具体的,所述位图索引的实现方法的一个实施例为:
假设要对省份、产品类型这两个字段进行分组;其中,在省份里面有两个值:江苏和浙江。首先将江苏的索引给取出来或者说定义出来,为(11001)。然后取出产品类型的位图索引:手机(10100)、家电(01011)。把江苏(11001) 和手机(10100)比较,同时有1的位置就是既有江苏又有手机的位置,也就是对(11001)、(10100)求与运算,得到结果(10000)。(10000)不全为0,说明存在这个分组,而且位置是第0行。再将江苏(11001)和家电(01011)求与得到(01001),存在这个分组,而且位置是第1、4行。如果全部为0,说明不存在这个组合的分组。这样一层一层的遍历下去,就会得到一个树形的数据结构。也就是分组的结果。如下:root---江苏(11001)---手机(10000) ---家电(01001)---浙江(00110)---手机(00100)---家电(00010)。
由上述实施例可知,所述分布式列存储系统索引的方法通过采集列存储系统中数据的分布特征,然后根据所述分布特征设定每列数据的域值和划分规则,进而使得所述分组位图索引的划分方式与查询的过滤条件相符合,最后提高查询的准确性。通过预先计算列数据的统计信息,使得在列数据的分组后获得的区域编码向量依然能够保留列数据的统计信息,为后续的统计信息的查询提供便利。所以,所述分布式列存储系统索引的方法不仅提高了分组位图查询的准确性,而且能够保留列存储系统中数据的统计信息,保证数据信息的完整性。
在本发明一些可选的实施例中,所述获取列存储系统中数据的分布特征的步骤还包括:
将每列数据按照数值的大小排序,得到由大到小或者由小到大的有序数据;
根据数据的排列顺序,计算得到有序数据的变化曲线;根据数据的变化曲线,得到每列数据的分布特征。
这样,可以通过首先将列数据排序,能够快速获得列数据的变化曲线,然后得到准确的分布特征,由此,通过排序,可以进一步提高获取分布特征的速度和准确性,进而提高所述分布式列存储系统索引的方法的索引效率。
进一步,所述计算得到有序数据的变化曲线的步骤之前还包括:从所述有序数据中提取出间隔相等的部分数据,根据提取出的部分数据计算得到有序数据的变化曲线。由于每列数据可能包含了海量的数据,因此,基于已经排序的有序列数据,可以抽取部分中间数据,并且通过分析中间数据的变化曲线推导得到列数据的变化曲线。这样,可以进一步减少数据计算的步骤进而提高计算的效率。优选的,提取数据是每个数据的间隔相同,例如:在具有1-100个数据的排序数据中,选出第1、11、21、31、41、51、61、71、81、91作为部分中间数据(与部分数据含义相同)。
在本发明另一些可选的实施例中,所述根据获取的分布特征设定每列数据的域值以及每列数据的划分规则的步骤还包括:
根据获取的分布特征,查询预先设定的分布特征与域值、划分规则的对应关系列表;将查询得到的域值 与划分规则作为该列数据的域值和该列数据的划分规则。通过预先设定不同数据的额分布特征与域值、划分规则的对应关系,可以时候后续设定列数据的域值、划分规则的时候更为快速。进而提高了所述分布式列存储系统索引方法的效率。其中,所述分布特征既可以是一个数据值,也可以是一个数值范围,或者,还可以是向量形式的表示。
在本发明一些优选的实施例中,所述对每列数据进行统计计算的步骤之前还包括:根据位图索引的需求,得到索引目标特征,检索预设的目标特征与统计信息类型对应的关系列表,得到索引所需的统计信息类型;将获得的统计信息类型作为进行统计计算的目标值。基于每次位图索引可能在建立索引之前就已经确定了索引的目标或者可能索引的范围,这样就能够预先获得需要获取的统计信息的类型,使得在步骤104中,可以根据需要,进行统计信息的计算,从而省略了一些不必要的计算过程。其中,所述统计信息包括:最大值、最小值、平均值、中位值、方差、标准差。
在另一些优选的实施例中,所述划分规则为递增分配、递减分配以及平均分配。其中,所述递增分配为域值的区间长度为递增分布;所述递减分配为所述域值的区间长度为递减分布;所述平均分配为所述域值的区间长度为平均分布。当然,也可以根据实际的需要,将所述划分规则设定为非规则的划分方式,例如:划分后的数值区间长度为增减交替变化的方式。这样,既可以使得所述划分后的数据区域涵盖所有的数据,而且通过有规则的划分方式使得后续的索引效率更高,有利于对数据的进一步分析。
在本发明一些可选的实施例中,所述划分规则的具体实现方式如下:
为了清楚的显示划分规则之间的区别,先结合表格的形式进行介绍。具体参见表1。
表1
如表1所示,划分规则为平均分配时,列数据按照区域长度为1000的方式均匀间隔分配,具体的,0~1000(可以定义区域为(0,1000])的区域编码值为1,1000~2000是2,依次划分,因此,可以得到如表1中所述的数值与编码值的对应关系。
若划分规则为递增分配,则代表划分的区域间隔为递增分布。例如:0~1000 对应1,1000~3000对应2,3000~6000对应3,因此数值5000对应3。
若划分规则为递减分配,则代表划分的区域间隔为递减分布。例如:0~5000 对应1,5000~9000对应2,9000~12000对应3,因此5000对应1。
参照图2所示,为本发明提供的分布式列存储系统索引的方法另一个实施例的流程图。所述分布式列存储系统索引的方法包括:
步骤201,将每列数据按照数值的大小排序,得到由大到小或者由小到大的有序数据;
步骤202,从所述有序数据中提取出间隔相等的部分数据,根据提取出的部分数据计算得到有序数据的变化曲线;
步骤203,根据数据的变化曲线,得到每列数据的分布特征;
步骤204,根据获取的分布特征,查询预先设定的分布特征与域值、划分规则的对应关系列表;
步骤205,将查询得到的域值 与划分规则作为该列数据的域值和该列数据的划分规则;
步骤206,根据所述每列数据的域值以及每列数据的划分规则,计算得到对数据划分后连续的数据区域;
步骤207,根据划分后的每个数据区域,分别对应建立一个区域编码向量;
步骤208,根据位图索引的需求,得到索引目标特征;
步骤209,检索预设的目标特征与统计信息类型对应的关系列表,得到索引所需的统计信息类型;
步骤210,将获得的统计信息类型作为进行统计计算的目标值;
步骤211,对每列数据进行统计计算,得到每列数据的统计信息,并将所述统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;
步骤212,将所述带有统计信息的区域编码向量作为位图索引的位向量,进行数据的索引操作。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源 /接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种分布式列存储系统索引的方法,其特征在于,包括:
获取列存储系统中每列数据按照数值大小排序后的分布特征,根据获取的分布特征设定每列数据的域值以及每列数据的划分规则,所述域值指依据所述划分规则得到的数据区域范围;
根据所述每列数据的域值以及每列数据的划分规则,计算得到对数据划分后连续的数据区域;
根据划分后的每个数据区域,分别对应建立一个区域编码向量;
对每列数据进行统计计算,得到每列数据的统计信息,并将所述统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;
将所述带有统计信息的区域编码向量作为位图索引的位向量,进行数据的索引操作。
2.根据权利要求1所述的方法,其特征在于,所述获取列存储系统中每列数据按照数值大小排序后的分布特征的步骤还包括:
将每列数据按照数值的大小排序,得到由大到小或者由小到大的有序数据;
根据数据的排列顺序,计算得到有序数据的变化曲线;
根据数据的变化曲线,得到每列数据的分布特征。
3.根据权利要求2所述的方法,其特征在于,所述计算得到有序数据的变化曲线的步骤之前还包括:
从所述有序数据中提取出间隔相等的部分数据,根据提取出的部分数据计算得到有序数据的变化曲线。
4.根据权利要求1所述的方法,其特征在于,所述根据获取的分布特征设定每列数据的域值以及每列数据的划分规则的步骤还包括:
根据获取的分布特征,查询预先设定的分布特征与域值、划分规则的对应关系列表;
将查询得到的域值与划分规则作为该列数据的域值和该列数据的划分规则。
5.根据权利要求1所述的方法,其特征在于,所述对每列数据进行统计计算的步骤之前还包括:
根据位图索引的需求,得到索引目标特征,
检索预设的目标特征与统计信息类型对应的关系列表,得到索引所需的统计信息类型;
将获得的统计信息类型作为进行统计计算的目标值。
6.根据权利要求1所述的方法,其特征在于,所述统计信息包括:最大值、最小值、平均值、中位值、方差、标准差。
7.根据权利要求1所述的方法,其特征在于,所述划分规则为递增分配、递减分配以及平均分配。
8.根据权利要求7所述的方法,其特征在于,所述递增分配为域值的区间长度为递增分布;所述递减分配为所述域值的区间长度为递减分布;所述平均分配为所述域值的区间长度为平均分布。
CN201610634581.3A 2016-08-04 2016-08-04 一种分布式列存储系统索引的方法 Active CN106250523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610634581.3A CN106250523B (zh) 2016-08-04 2016-08-04 一种分布式列存储系统索引的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610634581.3A CN106250523B (zh) 2016-08-04 2016-08-04 一种分布式列存储系统索引的方法

Publications (2)

Publication Number Publication Date
CN106250523A CN106250523A (zh) 2016-12-21
CN106250523B true CN106250523B (zh) 2019-04-16

Family

ID=58079137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610634581.3A Active CN106250523B (zh) 2016-08-04 2016-08-04 一种分布式列存储系统索引的方法

Country Status (1)

Country Link
CN (1) CN106250523B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107066551B (zh) * 2017-03-23 2020-04-03 中国科学院计算技术研究所 一种树状数据的行式和列式存储方法及系统
CN108733681B (zh) * 2017-04-14 2021-10-22 华为技术有限公司 信息处理方法及装置
CN107545021B (zh) * 2017-05-10 2020-12-11 新华三信息安全技术有限公司 一种数据存储方法及装置
CN107273430B (zh) * 2017-05-16 2021-05-18 北京奇虎科技有限公司 一种数据存储方法和装置
EP3718023A1 (en) * 2017-12-01 2020-10-07 MemSQL Inc. Accelerated filtering, grouping and aggregation in a database system
US11073828B2 (en) * 2017-12-08 2021-07-27 Samsung Electronics Co., Ltd. Compression of semantic information for task and motion planning
CN112148706B (zh) * 2019-06-28 2024-06-14 重庆小雨点小额贷款有限公司 一种变量分组方法及相关设备
US11386089B2 (en) 2020-01-13 2022-07-12 The Toronto-Dominion Bank Scan optimization of column oriented storage
CN111275203A (zh) * 2020-02-11 2020-06-12 深圳前海微众银行股份有限公司 基于列存储的决策树构造方法、装置、设备及存储介质
CN111723076A (zh) * 2020-06-24 2020-09-29 苏州松鼠山人工智能科技有限公司 一种生成数据库索引的方法和装置
CN112214521A (zh) * 2020-11-20 2021-01-12 深圳前海微众银行股份有限公司 规则查询方法、装置、设备及计算机存储介质
CN114118008B (zh) * 2022-01-21 2022-05-10 西安羚控电子科技有限公司 一种基于bs架构的数据对比系统及方法
CN114547380B (zh) * 2022-01-25 2022-11-15 北京元年科技股份有限公司 数据遍历查询方法、装置、电子设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609491A (zh) * 2012-01-20 2012-07-25 东华大学 一种基于列存储的区级数据压缩方法
CN102663116A (zh) * 2012-04-11 2012-09-12 中国人民大学 面向列存储数据仓库的多维olap查询处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10474652B2 (en) * 2013-03-14 2019-11-12 Inpixon Optimizing wide data-type storage and analysis of data in a column store database

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609491A (zh) * 2012-01-20 2012-07-25 东华大学 一种基于列存储的区级数据压缩方法
CN102663116A (zh) * 2012-04-11 2012-09-12 中国人民大学 面向列存储数据仓库的多维olap查询处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An Adaptive Projection Strategy and Its Implementation in Column Stores;Xiangwu Ding等;《IEEE》;20111231;第468-473页
列存储数据库中压缩位图索引技术;王梅 等;《计算机工程》;20120930;第38卷(第18期);第26-29页

Also Published As

Publication number Publication date
CN106250523A (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN106250523B (zh) 一种分布式列存储系统索引的方法
CN107357846B (zh) 关系图谱的展示方法以及装置
KR101740259B1 (ko) 3차원 포인트 클라우드의 공간 분할 방법
CN103617232B (zh) 一种针对HBase表的分页查询方法
Frentzos Indexing objects moving on fixed networks
CN105574212B (zh) 一种多索引磁盘哈希结构的图像检索方法
CN104246765A (zh) 图像检索装置、图像检索方法、程序以及计算机可读取的存储介质
CN104199986A (zh) 基于hbase和geohash的矢量数据空间索引方法
CN103473268B (zh) 线性要素空间索引构建方法、系统和检索方法及其系统
CN104142946A (zh) 一种同款业务对象聚合、搜索的方法和系统
CN104221015A (zh) 图像检索装置、图像检索方法、程序以及计算机可读取的存储介质
WO2020206671A1 (zh) 一种基于属性的点云条带划分方法
CN107292195A (zh) 基于密度划分的k‑匿名隐私保护方法
CN103699648A (zh) 用于快速检索的树形数据结构及其实现方法
CN103473276A (zh) 超大型数据存储方法、分布式数据库系统及其检索方法
CN105279524A (zh) 基于无权超图分割的高维数据聚类方法
CN104346347A (zh) 数据存储方法、装置、服务器及系统
CN111581236A (zh) 数据查询方法和装置
US8787703B2 (en) Method for simplified storage of data representing forms
CN107644033A (zh) 一种在非关系型数据库中进行数据查询的方法与设备
CN105138527A (zh) 一种数据分类回归方法及装置
CN104102680A (zh) 时间序列的编码索引
CN110399375B (zh) 一种数据表索引创建方法及装置
Pfoser et al. Trajectory indexing using movement constraints
CN106055674B (zh) 一种分布式环境下基于度量空间的top-k支配查询方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20170329

Address after: 100070 Fengtai District, Beijing Feng Feng Road, the era of wealth building, the world's first floor, 28

Applicant after: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: State Grid Corporation of China

Applicant after: STATE GRID BEIJING ELECTRIC POWER Co.

Applicant after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Applicant after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Address before: 100070 Fengtai District, Feng Feng Road, the era of wealth on the 1st floor of the world's 28 floor, Beijing

Applicant before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Applicant before: State Grid Corporation of China

Applicant before: STATE GRID BEIJING ELECTRIC POWER Co.

Applicant before: Beijing Zhongdian Feihua Communications Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180601

Address after: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Applicant after: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Address before: 100070 the 28 tier of fortune World Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Applicant before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Applicant before: State Grid Corporation of China

Applicant before: STATE GRID BEIJING ELECTRIC POWER Co.

Applicant before: Beijing Zhongdian Feihua Communications Co.,Ltd.

Applicant before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190201

Address after: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Applicant after: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: State Grid Corporation of China

Applicant after: STATE GRID BEIJING ELECTRIC POWER Co.

Applicant after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Address before: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Applicant before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Co-patentee after: STATE GRID CORPORATION OF CHINA

Patentee after: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Co-patentee after: STATE GRID BEIJING ELECTRIC POWER Co.

Co-patentee after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Address before: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Co-patentee before: State Grid Corporation of China

Patentee before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Co-patentee before: STATE GRID BEIJING ELECTRIC POWER Co.

Co-patentee before: Beijing Zhongdian Feihua Communications Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190610

Address after: 100085 Beijing city Haidian District Qinghe small Camp Road No. 15

Co-patentee after: STATE GRID CORPORATION OF CHINA

Patentee after: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Co-patentee after: STATE GRID BEIJING ELECTRIC POWER Co.

Co-patentee after: Beijing Zhongdian Feihua Communications Co.,Ltd.

Address before: 100070 the 28 tier of fortune Fortune Plaza, No.1, hang Feng Road, Fengtai District, Beijing.

Co-patentee before: STATE GRID CORPORATION OF CHINA

Patentee before: BEIJING GUODIANTONG NETWORK TECHNOLOGY Co.,Ltd.

Co-patentee before: STATE GRID BEIJING ELECTRIC POWER Co.

Co-patentee before: Beijing Zhongdian Feihua Communications Co.,Ltd.