CN111221816B - 基于位图汇总模型的原子指标存储方法 - Google Patents

基于位图汇总模型的原子指标存储方法 Download PDF

Info

Publication number
CN111221816B
CN111221816B CN201911222980.9A CN201911222980A CN111221816B CN 111221816 B CN111221816 B CN 111221816B CN 201911222980 A CN201911222980 A CN 201911222980A CN 111221816 B CN111221816 B CN 111221816B
Authority
CN
China
Prior art keywords
index
group object
atomic
bitmap
bit set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911222980.9A
Other languages
English (en)
Other versions
CN111221816A (zh
Inventor
彭虎
刘洋
傅尚强
施斌
孙迁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Cloud Computing Co Ltd
Original Assignee
Suning Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Cloud Computing Co Ltd filed Critical Suning Cloud Computing Co Ltd
Priority to CN201911222980.9A priority Critical patent/CN111221816B/zh
Publication of CN111221816A publication Critical patent/CN111221816A/zh
Application granted granted Critical
Publication of CN111221816B publication Critical patent/CN111221816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于位图汇总模型的原子指标存储方法及系统,位图优化器对原子指标的代理键数字指标分组存储,包括元素组对象和位集合组对象;数字编码模块对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;匹配存储模块将待存储的原子指标分别与位图优化器的位集合组对象、元素组对象进行匹配,存储原子指标的代理键数字指标。本发明能够减少数据条目数和存储大小,提高聚合查询效率。

Description

基于位图汇总模型的原子指标存储方法
技术领域
本发明涉及信息处理领域,具体涉及一种基于位图汇总模型的原子指标存储方法及系统。
背景技术
在数仓的指标体系内,存在原子指标(不可再拆分的指标)是不支持累计汇总的,比如访客数、会员数等指标,在数据汇总过程中是需要基于访客ID、会员ID去重计数的,且去重指标汇总事实表无法支持更高度的汇总。
当前数仓设计去重指标汇总表,一般使用预先计算方式,基于细粒度(包含访客ID、会员ID维度粒度)事实表和前端展示维度组合,做固定维度组合预先计算,直接生成前端需要展示的结果数据,此方案存在如下缺点:
1)前端查询的维度灵活多变,一方面维度组合太多,预计算耗费资源大(后台需要对每个维度组合场景计算一次),另一方面如果在原有维度上新增维度组合,预计算汇总表就无法支持业务查询,必须针对新维度组合再计算;
2)使用count distinct效率低下,且对大数据量数据非常容易产生数据倾斜,产生长尾任务。
发明内容
本发明的目的在于提出了一种基于位图汇总模型的原子指标存储方法及系统。
实现本发明目的的技术解决方案为:一种基于位图汇总模型的原子指标存储方法,将原子指标转换为可累计对象存储,包括如下步骤:
初始化位图优化器,所述位图优化器包括元素组对象和位集合组对象,所述元素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
作为一种具体实施方式,所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象匹配,若所述待存储的原子指标的所述组号在所述位图优化器的位集合组对象或者元素组对象中存在对应数组,则将该代理键数字指标存储到位集合组对象或者元素组对象的对应数组中;若所述待存储的原子指标的所述组号在所述位图优化器的元素组对象、位集合组对象均无对应数组,则在元素组对象中新建数组,存储该原子指标的代理键数字指标。
作为一种具体实施方式,如果元素组对象中存在数据个数超过指定的位集合最小存储长度的数组,则将元素组对象中的该组数据转换为位集合存储到位集合组对象中。
作为一种具体实施方式,所述对原子指标进行数字编码,将原子指标除以组长度,将商的余数作为原子指标的代理键数字指标,将商的整数部分作为对应的组号。
一种基于位图汇总模型的原子指标存储系统,包括:
位图优化器,用于对原子指标的代理键数字指标分组存储,包括元素组对象和位集合组对象;
数字编码模块,用于对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
匹配存储模块,用于将待存储的原子指标的代理键数字指标分别与位图优化器的位集合组对象、元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
作为一种具体实施方式,所述数字编码模块对原子指标进行数字编码,将原子指标除以组长度,将商的余数作为原子指标的代理键数字指标,将商的整数部分作为对应的组号。
作为一种具体实施方式,所述匹配存储模块将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,若所述待存储的原子指标的所述组号在所述位图优化器的位集合组对象或者元素组对象中存在对应数组,则将该代理键数字指标存储到位集合组对象或者元素组对象的对应数组中;若所述待存储的原子指标的所述组号在所述位图优化器的元素组对象、位集合组对象均无对应数组,则在元素组对象中新建数组,存储该原子指标的代理键数字指标。
作为一种具体实施方式,存储的过程中,如果元素组对象中存在数据个数超过指定的位集合最小存储长度的数组,则将元素组对象中的该组数据转换为位集合存储到位集合组对象中。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
初始化位图优化器,包括元素组对象和位集合组对象,所述素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
初始化位图优化器,包括元素组对象和位集合组对象,所述素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
本发明与现有技术相比,其显著优点为:1)基于位图汇总模型进行原子指标存储,能够减少数据条目数和存储大小;2)使用BitSet实现SQL聚合查询,能够提高聚合查询效率;3)对会员、访客这种基础超亿、十亿级别基数数据,直接使用BitSet存储,BitSet对象会很大,存储和计算效率低,BitSetOptimizer对BitSet优化存储,对对象分组切分存储,保证BitSet长度在GROUP_LENGTH长度,能够节约存储,提升处理效率;4)有的Group可能就几个或几十个数据,使用BitSet会占用GROUP_LENGTH位长度存储,使用HashSet根据数据个数存储,根据BITSET_MIN_SIZE大小决定数据存储HashSet还是BitSet对象,能够节省存储空间。
附图说明
图1是本发明基于位图汇总模型的原子指标存储方法的流程图。
图2是BitSetOptimizer的数据结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如图1所示,本发明基于位图汇总模型的原子指标存储方法,将原子指标转换为可累计对象存储,包括如下步骤:
步骤1,初始化位图优化器(BitSetOptimizer),包括元素组对象(ElementGroup)和位集合组对象(BitSetGroup),用于对原子指标的代理键数字指标分组存储;
BitSetOptimizer数据结构如图2所示,其中ElementGroup对象和BitSetGroup对象存储原子指标的代理键数字指标以及对应的组号(GroupID),其中ElementGroup对象中采用散列集合(HashSet)进行代理键数字指标存储,BitSetGroup对象中采用位集合(BitSet)进行代理键数字指标存储,两者的GroupID均为整数(Int)型。
步骤2,对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
一些实施例中,将原子指标除以组长度(GROUP_LENGTH),将商的余数作为原子指标的代理键数字指标,将商的整数部分作为对应的GroupID,所述组长度为BitSet中每组数据的最大存储长度。
步骤3,将待存储的原子指标的代理键数字指标分别与位图优化器的位集合组对象、元素组对象进行匹配;
若待存储的原子指标的代理键数字指标所对应的GroupID在BitSetGroup对象中有对应数组,则将该原子指标的代理键数字指标存储到位集合组对象的对应数组中;
若待存储的原子指标的代理键数字指标所对应的GroupID在ElementGroup对象中有对应数组,则将该原子指标的代理键数字指标存储到ElementGroup对象的对应数组中;存储的过程中,如果元素组对象中的该组数据个数超过指定的位集合最小存储长度(BITSET_MIN_SIZE),则将该元素组对象中的该组数据(Set)转换为位集合(BitSet)存储到BitSetGroup对象中;
若待存储的原子指标的代理键数字指标所对应的GroupID在ElementGroup对象和BitSetGroup对象中均无对应数组,则在元素组对象中新建数组,存储该原子指标的代理键数字指标。
本发明将去重指标通过技术手段转换为可累计对象存储,这样汇总事实表不用针对所有维度作固定组合预计算,汇总事实表可支持再汇总,整体减少汇总计算资源消耗,解决去重指标计算count distinct数据倾斜问题,提升了开发效率。待存储的原子指标的代理键数字指标与位图优化器的位集合组对象、元素组对象的匹配,可以同步进行,也可以异步进行。异步匹配的过程中,可以先匹配位集合组对象,再匹配元素组对象,也可以先匹配元素组对象,再匹配位集合组对象。
下面以去重指标访客数举例,表格结构如表1所示。表格中列出了城市、省份、国家的访客ID。由于同一个访客ID可能会出现在不同的城市、省份、国家,统计某一省份或者的访客数时,如仅仅将该省份的所有城市的访客数相加,可能会导致出现重复计数的问题。统计同个国家的访客数时也会存在同样的问题。
表1访客示例表
Figure GDA0003876874670000061
Figure GDA0003876874670000071
利用本发明方法,将访客ID基于位图汇总模型进行存储,首先对访客ID做数字编码,生成访客ID的代理键访客数字ID及对应的GroupID;然后将访客数字ID存储BitSetOptimizer对象中,即ElementGroup对象和BitSetGroup对象中。由于存储的过程中实现了指标去重,即对于重复的代理键访客数字ID进行覆盖,对于不存在的进行新建存储,统计访客数时,不需要再次去重,只需要做组汇总即可,通过SQL调用时,对BitSetOptimizer对象做group汇总计算,用法类似sql中的sum、count等聚合函数。
为了验证本发明方案的优势,抽样流量数据,数据量为2801537,存储大小为123M,提取访问唯一ID、访客ID、会员ID、应用版本、操作系统版本、终端类型、下载渠道、城市代码、运营商代码、网络类型、分辨率。测试直接将去重指标访客ID、会员ID作为维度,使用count distinct统计去重指标的存储方法(方法一),以及使用位图汇总模型,将去重指标访客ID、会员ID作为指标对象存储的方法(方法二),上述两种方法的数据量和存储大小。
将汇总维度为应用版本、操作系统版本、终端类型、下载渠道、城市代码、运营商代码、网络类型、分辨率,汇总指标为访客数、会员数、访问数标记为场景一,对比结果如表2所示。
表2场景一中两种方法的对比表
Figure GDA0003876874670000072
将汇总维度为应用版本、操作系统版本、城市代码、运营商代码,汇总指标为访客数、会员数、访问数标记为场景2,对比结果如表3所示。
表3场景二中两种方法的对比表
Figure GDA0003876874670000081
通过表2、表3可以看出,汇总模型的数据量和存储大小都能减小,并且随着汇总维度越少,数据量和存储越小。
本发明基于位图汇总模型的原子指标存储系统,包括:
位图优化器,包括ElementGroup对象和BitSetGroup对象。ElementGroup对象和BitSetGroup对象存储原子指标的代理键数字指标以及对应的GroupID,其中ElementGroup对象中采用HashSet进行代理键数字指标存储,BitSetGroup对象中采用BitSet进行代理键数字指标存储,两者的GroupID均为Int型。
数字编码模块,用于对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应GroupID;
一些实施例中,将原子指标除以GROUP_LENGTH,将商的余数作为原子指标的代理键数字指标,将商的整数部分作为对应的GroupID。
匹配存储模块,用于用于将待存储的原子指标的代理键数字指标分别与BitSetGroup对象、ElementGroup对象进行匹配;
若待存储的原子指标的代理键数字指标所对应的GroupID在BitSetGroup对象中有对应数组,则将该原子指标的代理键数字指标存储到位集合组对象的对应数组中;
若待存储的原子指标的代理键数字指标所对应的GroupID在ElementGroup对象中有对应数组,则将该原子指标的代理键数字指标存储到ElementGroup对象的对应数组中;存储的过程中,如果元素组对象中的该组数据个数超过指定的BITSET_MIN_SIZE,则将该元素组对象中的Set转换为BitSet存储到BitSetGroup对象中;
若待存储的原子指标的代理键数字指标所对应的GroupID在ElementGroup对象和BitSetGroup对象中均无对应数组,则在元素组对象中新建数组,存储该原子指标的代理键数字指标。
本发明还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
初始化位图优化器,包括元素组对象和位集合组对象,所述素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
初始化位图优化器,包括元素组对象和位集合组对象,所述素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
另,附上本发明涉及的名词解释,如表4所示。
表4名词解释
Figure GDA0003876874670000101
Figure GDA0003876874670000111
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.基于位图汇总模型的原子指标存储方法,其特征在于,将原子指标转换为可累计对象存储,包括如下步骤:
初始化位图优化器,所述位图优化器包括元素组对象和位集合组对象,所述元素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
2.根据权利要求1所述的基于位图汇总模型的原子指标存储方法,其特征在于,所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象匹配,若所述待存储的原子指标的所述组号在所述位图优化器的位集合组对象或者元素组对象中存在对应数组,则将该代理键数字指标存储到位集合组对象或者元素组对象的对应数组中;若所述待存储的原子指标的所述组号在所述位图优化器的元素组对象、位集合组对象均无对应数组,则在元素组对象中新建数组,存储该原子指标的代理键数字指标。
3.根据权利要求2所述的基于位图汇总模型的原子指标存储方法,其特征在于,如果元素组对象中存在数据个数超过指定的位集合最小存储长度的数组,则将元素组对象中的该组数据转换为位集合存储到位集合组对象中。
4.根据权利要求1所述的基于位图汇总模型的原子指标存储方法,其特征在于,所述对原子指标进行数字编码,将原子指标除以组长度,将商的余数作为原子指标的代理键数字指标,将商的整数部分作为对应的组号。
5.基于位图汇总模型的原子指标存储系统,其特征在于,包括:
位图优化器,用于对原子指标的代理键数字指标分组存储,包括元素组对象和位集合组对象;
数字编码模块,用于对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
匹配存储模块,用于将待存储的原子指标的代理键数字指标分别与位图优化器的位集合组对象、元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
6.根据权利要求5所述的基于位图汇总模型的原子指标存储系统,其特征在于,所述数字编码模块对原子指标进行数字编码,将原子指标除以组长度,将商的余数作为原子指标的代理键数字指标,将商的整数部分作为对应的组号。
7.根据权利要求5所述的基于位图汇总模型的原子指标存储系统,其特征在于,所述匹配存储模块将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,若所述待存储的原子指标的所述组号在所述位图优化器的位集合组对象或者元素组对象中存在对应数组,则将该代理键数字指标存储到位集合组对象或者元素组对象的对应数组中;若所述待存储的原子指标的所述组号在所述位图优化器的元素组对象、位集合组对象均无对应数组,则在元素组对象中新建数组,存储该原子指标的代理键数字指标。
8.根据权利要求6所述的基于位图汇总模型的原子指标存储系统,其特征在于,存储的过程中,如果元素组对象中存在数据个数超过指定的位集合最小存储长度的数组,则将元素组对象中的该组数据转换为位集合存储到位集合组对象中。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
初始化位图优化器,包括元素组对象和位集合组对象,所述素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
初始化位图优化器,包括元素组对象和位集合组对象,所述素组对象和位集合组对象用于对原子指标的代理键数字指标分组存储;
对待存储的原子指标进行数字编码,生成原子指标的代理键数字指标及对应组号;
将所述待存储的原子指标的所述组号分别与所述位图优化器的位集合组对象和元素组对象进行匹配,根据匹配结果将所述待存储的原子指标的所述代理键数字指标存储到所述位集合组对象或所述元素组对象中。
CN201911222980.9A 2019-12-03 2019-12-03 基于位图汇总模型的原子指标存储方法 Active CN111221816B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911222980.9A CN111221816B (zh) 2019-12-03 2019-12-03 基于位图汇总模型的原子指标存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911222980.9A CN111221816B (zh) 2019-12-03 2019-12-03 基于位图汇总模型的原子指标存储方法

Publications (2)

Publication Number Publication Date
CN111221816A CN111221816A (zh) 2020-06-02
CN111221816B true CN111221816B (zh) 2023-05-16

Family

ID=70829085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911222980.9A Active CN111221816B (zh) 2019-12-03 2019-12-03 基于位图汇总模型的原子指标存储方法

Country Status (1)

Country Link
CN (1) CN111221816B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645091A (zh) * 2008-08-09 2010-02-10 株式会社其恩斯 图像数据压缩方法、图像处理中的图案模型定位方法,图像处理设备,图像处理程序和计算机可读记录介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681798B (zh) * 2018-07-09 2022-02-01 广东省农业科学院农业经济与信息研究所 基于gis的区域农业规划辅助决策系统及规划方法
CN109684352B (zh) * 2018-12-29 2020-12-01 江苏满运软件科技有限公司 数据分析系统、方法、存储介质及电子设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645091A (zh) * 2008-08-09 2010-02-10 株式会社其恩斯 图像数据压缩方法、图像处理中的图案模型定位方法,图像处理设备,图像处理程序和计算机可读记录介质

Also Published As

Publication number Publication date
CN111221816A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
US11604604B1 (en) Efficient FTL implementation with compression
JP6088506B2 (ja) 範囲に基づく検索のためのデータ格納の管理
US8949189B2 (en) Managing storage of individually accessible data units
KR101515660B1 (ko) 두 번의 패스를 통한 텍스트 스트링의 해시 추출
US11762828B2 (en) Cuckoo filters and cuckoo hash tables with biasing, compression, and decoupled logical sparsity
US8051252B2 (en) Method and apparatus for detecting the presence of subblocks in a reduced-redundancy storage system
US11151126B2 (en) Hybrid column store providing both paged and memory-resident configurations
CN107729406B (zh) 一种数据分类存储方法及装置
EP1866776A1 (en) Method for detecting the presence of subblocks in a reduced-redundancy storage system
US10042873B2 (en) Data encoding and processing columnar data
CN110741637A (zh) 通过使用基本数据滤筛的数据无损简化和对已经使用基本数据滤筛进行无损简化的数据执行多维搜索和内容关联取回
KR20130036094A (ko) 개별적으로 액세스 가능한 데이터 유닛의 스토리지 관리 방법
CN108475508B (zh) 音频数据和保存在块处理存储系统中的数据的简化
US10340945B2 (en) Memory compression method and apparatus
CN111221816B (zh) 基于位图汇总模型的原子指标存储方法
US8976048B2 (en) Efficient processing of Huffman encoded data
CN111078652A (zh) 物流箱码的归档压缩方法及装置
KR20080026772A (ko) Lempel-Ziv 압축 방법의 복원 속도를 보완한압축 방법
CN111538730B (zh) 一种基于哈希桶算法的数据统计的方法及其系统
CN110990640B (zh) 一种数据判定方法、装置、设备及计算机可读存储介质
KR20220049540A (ko) 인코딩 및 디코딩 테이블을 이용한 세미 소팅 압축
US20240061823A1 (en) Memory-frugal index design in storage engine
US10037148B2 (en) Facilitating reverse reading of sequentially stored, variable-length data
CN115934730B (zh) 数据处理方法和装置、介质和计算机设备
US20170308561A1 (en) Indexing and sequentially storing variable-length data to facilitate reverse reading

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant