CN108268537B - 数据过滤方法及装置 - Google Patents

数据过滤方法及装置 Download PDF

Info

Publication number
CN108268537B
CN108268537B CN201611265818.1A CN201611265818A CN108268537B CN 108268537 B CN108268537 B CN 108268537B CN 201611265818 A CN201611265818 A CN 201611265818A CN 108268537 B CN108268537 B CN 108268537B
Authority
CN
China
Prior art keywords
filtering
original data
query
data table
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611265818.1A
Other languages
English (en)
Other versions
CN108268537A (zh
Inventor
洪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201611265818.1A priority Critical patent/CN108268537B/zh
Publication of CN108268537A publication Critical patent/CN108268537A/zh
Application granted granted Critical
Publication of CN108268537B publication Critical patent/CN108268537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据过滤方法及装置。该方法包括:接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件用于在非原始的数据表中进行过滤;根据第一过滤条件对原始的数据表进行过滤;对过滤后的原始的数据表进行去重处理,得到临时表;以及根据第二过滤条件对临时表进行过滤。通过本申请,解决了相关技术中在查询指标数据时引起系统性能开销较大,导致过滤效率较低的问题。

Description

数据过滤方法及装置
技术领域
本申请涉及数据过滤领域,具体而言,涉及一种数据过滤方法及装置。
背景技术
对于类似订单表这样的数据,会存在很多订单状态的变更,每一次订单状态的变更,都会在系统里记录一个状态数据,因此一个订单具有多条记录。在查询订单量这些指标时,相同的订单ID只需要计算一次,因此,需要对一个订单的多条记录进行去重处理。为了进行去重处理,相关技术中采用的方法为:为订单表,添加一个去重的视图,在查询时直接在去重的视图中进行查询。例如,在对视图进行查询时,先将全部的订单数据进行去重后,再用时间来进行过滤,随着历史数据的越来越多,对整个订单量数据进行去重的性能开销也会越来越大,导致过滤效率也较低。
针对相关技术中在查询指标数据时引起系统性能开销较大,导致过滤效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种数据过滤方法及装置,以解决相关技术中在查询指标数据时引起系统性能开销较大,导致过滤效率较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种数据过滤方法。该方法包括:接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件用于在非原始的数据表中进行过滤;根据第一过滤条件对原始的数据表进行过滤;对过滤后的原始的数据表进行去重处理,得到临时表;以及根据第二过滤条件对临时表进行过滤。
进一步地,根据第一过滤条件对原始的数据表进行过滤包括:获取第一过滤条件中涉及的维度;以及基于第一过滤条件中涉及的维度对原始的数据表进行过滤。
进一步地,对过滤后的原始的数据表进行去重处理,得到临时表包括:确定过滤后的原始的数据表中相同的指标;对过滤后的原始的数据表中相同的指标进行去重处理;将去重处理后的数据表作为临时表。
进一步地,在根据第二过滤条件对临时表进行过滤之后,该方法还包括:接收查询请求,其中,查询请求中包括维度和指标,指标为查询请求指示查询的内容,维度为查询请求指示限制查询内容的限制条件;根据过滤后的临时表、查询请求中的维度和指标生成查询语言;基于查询语言在过滤后的临时表中进行数据查询。
进一步地,查询语言为SQL语言。
为了实现上述目的,根据本申请的另一方面,提供了一种数据过滤装置。该装置包括:第一接收单元,用于接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件为不能对原始的数据表中进行过滤的条件;第一过滤单元,用于根据第一过滤条件对原始的数据表进行过滤;去重单元,用于对过滤后的原始的数据表进行去重处理,得到临时表;以及第二过滤单元,用于根据第二过滤条件对临时表进行过滤。
进一步地,第一过滤单元包括:获取模块,用于获取第一过滤条件中涉及的维度;以及过滤模块,用于基于第一过滤条件中涉及的维度对原始的数据表进行过滤。
进一步地,去重单元包括:第一确定模块,用于确定过滤后的原始的数据表中相同的指标;去重模块,用于对过滤后的原始的数据表中相同的指标进行去重处理;第二确定模块,用于将去重处理后的数据表作为临时表。
进一步地,该装置还包括:第二接收单元,用于在根据第二过滤条件对临时表进行过滤之后,接收查询请求,其中,查询请求中包括维度和指标,指标为查询请求指示查询的内容,维度为查询请求指示限制查询内容的限制条件;生成单元,用于根据过滤后的临时表、查询请求中的维度和指标生成查询语言;查询单元,用于基于查询语言在过滤后的临时表中进行数据查询。
进一步地,查询语言为SQL语言。
通过本申请,采用以下步骤:接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件用于在非原始的数据表中进行过滤;根据第一过滤条件对原始的数据表进行过滤;对过滤后的原始的数据表进行去重处理,得到临时表;以及根据第二过滤条件对临时表进行过滤,解决了相关技术中在查询指标数据时引起系统性能开销较大,导致过滤效率较低的问题。进而达到了提升数据过滤效率的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的数据过滤方法的流程图;以及
图2是根据本申请实施例提供的数据过滤装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请的实施例,提供了一种数据过滤方法。
图1是根据本申请实施例的数据过滤方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件用于在非原始的数据表中进行过滤。
例如,接收到的过滤请求中携带的过滤条件为第一季度对产品A的订单量和访问量。如果在原始的数据表中包括第一季度、产品A和订单量这3个维度,第一季度对产品A的订单量能够在原始的数据表中进行过滤,第一季度产品A的访问量不能在原始的数据表中进行过滤,也即,第一季度产品A的订单量为第一过滤条件,第一季度产品A的访问量为第二过滤条件。
需要说明的是,在本申请中提及的原始的数据表可以为事实表(Fact Table),用于实时记录系统中的所有数据的表。
步骤S102,根据第一过滤条件对原始的数据表进行过滤。
由于第一过滤条件能够在原始的数据表中进行过滤,根据第一过滤条件对原始的数据表进行过滤。
可选地,在本申请实施例提供的数据过滤方法中,根据第一过滤条件对原始的数据表进行过滤包括:获取第一过滤条件中涉及的维度;以及基于第一过滤条件中涉及的维度对原始的数据表进行过滤。
例如,第一过滤条件为第一季度产品A的订单量,第一过滤条件中涉及的维度为订单量、第一季度、产品A,基于订单量、第一季度、产品A对原始的数据表进行过滤,也即从原始的数据表中筛选出包含订单量、第一季度、产品A的维度列,作为过滤后的原始的数据表。
步骤S103,对过滤后的原始的数据表进行去重处理,得到临时表。
由于过滤后的原始的数据表中可能包含重复的数据信息,为了提升数据过滤的效率和后续数据查询的准确性,对过滤后的原始的数据表进行去重处理,将去重处理后的数据表作为临时表。
可选地,在本申请实施例提供的数据过滤方法中,对过滤后的原始的数据表进行去重处理,得到临时表包括:确定过滤后的原始的数据表中相同的指标;对过滤后的原始的数据表中相同的指标进行去重处理;将去重处理后的数据表作为临时表。
需要说明的是,在本申请中提及的指标为后续在表中进行数据查询时查询的内容。
例如,每一个订单会有很多订单状态的变更,每一次订单的变更,都会在原始的数据表中记录一个状态数据行,这样一个订单就有多条记录,而在查询订单量这些指标的时候,相同的订单id又只需要计算一次,因此,需要对其中相同的订单id(相同的指标)的多条记录进行去重处理。将去重处理后的数据表作为临时表。
步骤S104,根据第二过滤条件对临时表进行过滤。
基于过滤条件中的第二过滤条件对临时表进行过滤,由于临时表由第一过滤条件对原始的数据表进行过滤并经过去重处理后得到的,因此,再基于过滤条件中的第二过滤条件对临时表进行过滤,加快了数据过滤的速度,提升了数据过滤效率。
可选地,在本申请实施例提供的数据过滤方法中,在根据第二过滤条件对临时表进行过滤之后,该方法还包括:接收查询请求,其中,查询请求中包括维度和指标,指标为查询请求指示查询的内容,维度为查询请求指示限制查询内容的限制条件;根据过滤后的临时表、查询请求中的维度和指标生成查询语言;基于查询语言在过滤后的临时表中进行数据查询。
可选地,在本申请实施例提供的数据过滤方法中,查询语言为SQL语言。
通过以上步骤,在根据查询请求进行数据查询之前,选取符合所有查询条件(过滤条件)的数据列,在这些数据列组成的临时表中进行查询,使其无任何历史负担,减小了系统性能开销,保证了去重的数据集最小同时也保障了查询性能最优,也即,仅选取了需要的数据列,对列式存储的引擎来讲,物理io开销最低。进而达到了提升数据查询效率的效果。
通过以上内容公开了生成查询语言的一个方式,需要说明的是,生成查询语言的方式有很多,生成的查询语言的格式等等也各不相同,在本申请中,不对其具体作限定。在本申请实施例提供的数据过滤方法中,查询语言为SQL语言。也即,根据过滤后的临时表、查询请求中的维度和指标生成SQL语言,基于查询语言在过滤后的临时表中进行数据查询,在查询结束之后,返回查询到的结果。
本申请实施例提供的数据过滤方法,通过接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件用于在非原始的数据表中进行过滤;根据第一过滤条件对原始的数据表进行过滤;对过滤后的原始的数据表进行去重处理,得到临时表;以及根据第二过滤条件对临时表进行过滤,解决了相关技术中在查询指标数据时引起系统性能开销较大,导致过滤效率较低的问题。进而达到了提升数据过滤效率的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种数据过滤装置,需要说明的是,本申请实施例的数据过滤装置可以用于执行本申请实施例所提供的用于数据过滤方法。以下对本申请实施例提供的数据过滤装置进行介绍。
图2是根据本申请实施例的数据过滤装置的示意图。如图2所示,该装置包括:第一接收单元10,第一过滤单元20,去重单元30和第二过滤单元40。
接收单元10,用于接收查询请求,其中,查询请求中携带有查询条件。
第一接收单元10,用于接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件为不能对原始的数据表中进行过滤的条件。
第一过滤单元20,用于根据第一过滤条件对原始的数据表进行过滤。
去重单元30,用于对过滤后的原始的数据表进行去重处理,得到临时表。
第二过滤单元40,用于根据第二过滤条件对临时表进行过滤。
本申请实施例提供的数据过滤装置,通过第一接收单元10接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件为不能对原始的数据表中进行过滤的条件;第一过滤单元20根据第一过滤条件对原始的数据表进行过滤;去重单元30对过滤后的原始的数据表进行去重处理,得到临时表;以及第二过滤单元40根据第二过滤条件对临时表进行过滤。解决了相关技术中在查询指标数据时引起系统性能开销较大,导致过滤效率较低的问题。进而达到了提升数据过滤效率的效果。
可选地,在本申请实施例提供的数据过滤装置中,第一过滤单元包括:获取模块,用于获取第一过滤条件中涉及的维度;以及过滤模块,用于基于第一过滤条件中涉及的维度对原始的数据表进行过滤。
可选地,在本申请实施例提供的数据过滤装置中,去重单元包括:第一确定模块,用于确定过滤后的原始的数据表中相同的指标;去重模块,用于对过滤后的原始的数据表中相同的指标进行去重处理;第二确定模块,用于将去重处理后的数据表作为临时表。
可选地,在本申请实施例提供的数据过滤装置中,该装置还包括:第二接收单元,用于在根据第二过滤条件对临时表进行过滤之后,接收查询请求,其中,查询请求中包括维度和指标,指标为查询请求指示查询的内容,维度为查询请求指示限制查询内容的限制条件;生成单元,用于根据过滤后的临时表、查询请求中的维度和指标生成查询语言;查询单元,用于基于查询语言在过滤后的临时表中进行数据查询。
可选地,在本申请实施例提供的数据过滤装置中,查询语言为SQL语言。
所述数据过滤装置包括处理器和存储器,上述第一接收单元10,第一过滤单元20,去重单元30和第二过滤单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元实现相应功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数去执行查询数据。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:接收过滤请求,其中,过滤请求中携带有过滤条件,过滤条件中包括第一过滤条件和第二过滤条件,第一过滤条件用于在原始的数据表中进行过滤,第二过滤条件用于在非原始的数据表中进行过滤;根据第一过滤条件对原始的数据表进行过滤;对过滤后的原始的数据表进行去重处理,得到临时表;以及根据第二过滤条件对临时表进行过滤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种数据过滤方法,其特征在于,包括:
接收过滤请求,其中,所述过滤请求中携带有过滤条件,所述过滤条件中包括第一过滤条件和第二过滤条件,所述第一过滤条件用于在原始的数据表中进行过滤,所述第二过滤条件用于在非原始的数据表中进行过滤;
根据所述第一过滤条件对所述原始的数据表进行过滤;
对过滤后的原始的数据表进行去重处理,得到临时表;以及
根据所述第二过滤条件对所述临时表进行过滤;
其中,对过滤后的原始的数据表进行去重处理,得到临时表包括:
确定过滤后的原始的数据表中相同的指标;
对过滤后的原始的数据表中相同的指标进行去重处理;
将去重处理后的数据表作为所述临时表。
2.根据权利要求1所述的方法,其特征在于,根据所述第一过滤条件对所述原始的数据表进行过滤包括:
获取所述第一过滤条件中涉及的维度;以及
基于所述第一过滤条件中涉及的维度对所述原始的数据表进行过滤。
3.根据权利要求1所述的方法,其特征在于,在根据所述第二过滤条件对所述临时表进行过滤之后,所述方法还包括:
接收查询请求,其中,所述查询请求中包括维度和指标,所述指标为所述查询请求指示查询的内容,所述维度为所述查询请求指示限制查询内容的限制条件;
根据过滤后的临时表、所述查询请求中的维度和指标生成查询语言;
基于所述查询语言在所述过滤后的临时表中进行数据查询。
4.根据权利要求3所述的方法,其特征在于,所述查询语言为SQL语言。
5.一种数据过滤装置,其特征在于,包括:
第一接收单元,用于接收过滤请求,其中,所述过滤请求中携带有过滤条件,所述过滤条件中包括第一过滤条件和第二过滤条件,所述第一过滤条件用于在原始的数据表中进行过滤,所述第二过滤条件用于在非原始的数据表中进行过滤;
第一过滤单元,用于根据所述第一过滤条件对所述原始的数据表进行过滤;
去重单元,用于对过滤后的原始的数据表进行去重处理,得到临时表;以及
第二过滤单元,用于根据所述第二过滤条件对所述临时表进行过滤;
其中,所述去重单元包括:
第一确定模块,用于确定过滤后的原始的数据表中相同的指标;
去重模块,用于对过滤后的原始的数据表中相同的指标进行去重处理;
第二确定模块,用于将去重处理后的数据表作为所述临时表。
6.根据权利要求5所述的装置,其特征在于,所述第一过滤单元包括:
获取模块,用于获取所述第一过滤条件中涉及的维度;以及
过滤模块,用于基于所述第一过滤条件中涉及的维度对所述原始的数据表进行过滤。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二接收单元,用于在根据所述第二过滤条件对所述临时表进行过滤之后,接收查询请求,其中,所述查询请求中包括维度和指标,所述指标为所述查询请求指示查询的内容,所述维度为所述查询请求指示限制查询内容的限制条件;
生成单元,用于根据过滤后的临时表、所述查询请求中的维度和指标生成查询语言;
查询单元,用于基于所述查询语言在所述过滤后的临时表中进行数据查询。
8.根据权利要求7所述的装置,其特征在于,所述查询语言为SQL语言。
CN201611265818.1A 2016-12-30 2016-12-30 数据过滤方法及装置 Active CN108268537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611265818.1A CN108268537B (zh) 2016-12-30 2016-12-30 数据过滤方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611265818.1A CN108268537B (zh) 2016-12-30 2016-12-30 数据过滤方法及装置

Publications (2)

Publication Number Publication Date
CN108268537A CN108268537A (zh) 2018-07-10
CN108268537B true CN108268537B (zh) 2020-11-06

Family

ID=62771134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611265818.1A Active CN108268537B (zh) 2016-12-30 2016-12-30 数据过滤方法及装置

Country Status (1)

Country Link
CN (1) CN108268537B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593442A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 日志数据的去重方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5806061A (en) * 1997-05-20 1998-09-08 Hewlett-Packard Company Method for cost-based optimization over multimeida repositories
US7979453B2 (en) * 2006-08-23 2011-07-12 Innovative Solutions, Inc. Efficient search result update mechanism
US20100005077A1 (en) * 2008-07-07 2010-01-07 Kickfire, Inc. Methods and systems for generating query plans that are compatible for execution in hardware
CN103714058B (zh) * 2012-09-28 2017-05-17 Sap欧洲公司 用于数据库查询优化的方法以及使用该方法的系统
CN103810300B (zh) * 2014-03-10 2017-08-01 北京国双科技有限公司 用于非索引覆盖的数据查询方法和装置
CN104408169B (zh) * 2014-12-09 2018-02-02 北京国双科技有限公司 基于多维表达式语言的维度查询方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593442A (zh) * 2013-11-15 2014-02-19 北京国双科技有限公司 日志数据的去重方法及装置

Also Published As

Publication number Publication date
CN108268537A (zh) 2018-07-10

Similar Documents

Publication Publication Date Title
CN108140050B (zh) 一种使用布隆过滤器过滤文件的方法及装置
CN106407207B (zh) 一种实时新增数据更新方法和装置
CN105912636B (zh) 一种基于Map/Reduce的ETL数据处理方法和装置
JP6652659B2 (ja) 保険契約書種別状態情報集計方法及び端末機器
CN110879687B (zh) 一种基于磁盘存储的数据读取方法、装置及设备
CN107315657B (zh) 一种数据备份的方法及装置
CN110347724A (zh) 异常行为识别方法、装置、电子设备及介质
WO2018006721A1 (zh) 日志文件的存储方法及装置
CN112487083A (zh) 一种数据校验方法和设备
CN107451204B (zh) 一种数据查询方法、装置及设备
CN113704577A (zh) 基于多线程并发处理的数据查询方法及装置
CN105468623A (zh) 数据处理方法及装置
CN108197338A (zh) 一种浏览器书签生成方法、系统及终端设备
CN104408128A (zh) 一种基于b+树异步更新索引的读优化方法
CN109522305B (zh) 一种大数据去重方法及装置
CN108268523B (zh) 数据库聚合处理方法及装置
CN106933907B (zh) 数据表扩展指标的处理方法及装置
CN108268537B (zh) 数据过滤方法及装置
CN112258690A (zh) 数据存取方法及装置、数据存储方法及装置
CN111191007A (zh) 一种基于区块链的文章关键词过滤方法及设备、介质
CN106776702A (zh) 一种处理主从式数据库系统中的索引的方法和装置
CN108170693B (zh) 推送热词的方法及装置
CN106599326B (zh) 一种云化架构下的记录数据剔重处理方法及系统
CN110968555A (zh) 维度数据处理方法和装置
CN107784022B (zh) 检测法律文书是否重复的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant