CN106997365A - 一种跨数据源的数据处理方法及装置 - Google Patents

一种跨数据源的数据处理方法及装置 Download PDF

Info

Publication number
CN106997365A
CN106997365A CN201610052323.4A CN201610052323A CN106997365A CN 106997365 A CN106997365 A CN 106997365A CN 201610052323 A CN201610052323 A CN 201610052323A CN 106997365 A CN106997365 A CN 106997365A
Authority
CN
China
Prior art keywords
data
data record
record
parameter information
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610052323.4A
Other languages
English (en)
Inventor
郝佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610052323.4A priority Critical patent/CN106997365A/zh
Publication of CN106997365A publication Critical patent/CN106997365A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据库技术领域,尤其涉及一种跨数据源的数据处理方法及装置,用以解决现有的数据处理方式浪费存储资源,数据处理效率较低的问题。本申请实施例提供一种跨数据源的数据处理方法包括:在第一数据源中查询目标数据集合;针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息;将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合。

Description

一种跨数据源的数据处理方法及装置
技术领域
本申请涉及数据库技术领域,尤其涉及一种跨数据源的数据处理方法及装置。
背景技术
对来自不同数据源的数据进行加工处理是数据库处理中经常涉及的问题。目前,解决此问题的常规方案是将不同数据源的数据冗余到同一数据源,然后在同一数据源中执行跨表操作。
比如,对于两个不在同一数据库上的表A和表B,当需要同时针对这两个表进行数据处理时,常规办法是将表B的所有数据都添加到表A所在的数据库中,或者将表A的所有数据都添加到表B所在的数据库中,最终使得表A与表B位于同一数据库中,然后,在该同一数据库中执行跨表操作。
上述方式实现简单,但是却需要耗费大量的存储资源,尤其是在大数据处理中,由于每一张数据表的容量都非常大,这种方式无疑会造成存储资源的巨大浪费。另外,在将一个数据源的数据表添加到另一个数据源后,还需要在该另一个数据源中执行跨数据表的操作,数据处理效率较低。
发明内容
本申请实施例提供一种跨数据源的数据处理方法及装置,用以解决现有的数据处理方式浪费存储资源,数据处理效率较低的问题。
本申请实施例提供一种跨数据源的数据处理方法,包括:
在第一数据源中查询目标数据集合;
针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息;
将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合;
其中,合并后的数据集合中包括每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息。
可选地,针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,包括:
根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言;
基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录。
可选地,根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言,包括:
将所述目标数据集合中各条第一数据记录中的匹配参数信息整体转义为针对第二数据源的结构化查询语言SQL。
可选地,基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录,包括:
将生成的针对所述第二数据源的SQL作为在所述第二数据源中进行查询的限制条件,查询对应所述每一条第一数据记录的第二数据记录。
可选地,将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,包括:
针对每一条第一数据记录,在对应该条第一数据记录的第二数据记录中,提取除该条第一数据记录中的匹配参数信息之外的参数信息;
将提取的参数信息息添加在该条第一数据记录中。
本申请实施例提供一种跨数据源的数据处理装置,包括:
第一查询模块,用于在第一数据源中查询目标数据集合;
第二查询模块,用于针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息;
合并模块,用于将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合;
其中,合并后的数据集合中包括每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息。
本申请实施例在需要将不同数据源中的数据进行合并处理时,针对第一数据源中待合并的目标数据集合中的每一条第一数据记录,查询第二数据源中对应该条第一数据记录的第二数据记录,这样,在将每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并后,可以得到每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息,如此便实现了不同数据源数据之间的不冗余合并。并且,由于将不同数据源的数据合并在了一起,也即合并在同一张表中,从而在后续操作中可以针对这一张表进行操作,避免了执行跨数据表的操作,提高了数据处理效率。
附图说明
图1为本申请实施例提供的跨数据源的数据处理方法流程图;
图2为本申请实施例提供的跨数据源的数据处理装置结构示意图。
具体实施方式
本申请实施例提供的跨数据源的数据处理方案可以应用在数据处理平台中,实现对跨数据源的数据的统一查询及处理。
下面结合说明书附图对本申请实施例作进一步详细描述。
如图1所示,为本申请实施例提供的跨数据源的数据处理方法流程图,包括以下步骤:
S101:在第一数据源中查询目标数据集合。
在具体实施中,数据处理平台在确定需要对第一数据源和第二数据源中的数据记录进行合并查询或处理时,随机选择其中一个数据源作为前置数据源来查询目标数据集合,这里选择第一数据源作为前置数据源来查询目标数据集合。
这里的第一数据源和第二数据源可以指不同的数据库,比如分别为mysql数据库和garuda数据库,mysql数据库为首先查询的前置数据库,对garuda数据库的查询依赖于对mysql数据库的查询结果。
在具体实施中,可以基于待查询的目标数据集合的标识信息,从在第一数据源中查询目标数据集合,这里的目标数据集合具体可以是一张数据表,数据表的标识信息可以指该数据表的名称等任何可以唯一标识该数据表的信息。
S102:针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息。
在具体实施中,针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,在第二数据源中查询具有该匹配参数信息的第二数据记录。
在实际执行时,可以根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言;基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录。
具体地,将所述目标数据集合中各条第一数据记录中的匹配参数信息整体转义为针对第二数据源的结构化查询语言(Structured Query Language,SQL)。将生成的针对所述第二数据源的SQL作为在所述第二数据源中进行查询的限制条件,查询对应所述每一条第一数据记录的第二数据记录。
比如,查询到的目标数据集合为下述表一:
表一
针对表一中的两条第一数据记录(bus_line:bu1、data_version:2015-10-01、store_code:store1、predict_sell_num:100)和(bus_line:bu1、data_version:2015-10-01、store_code:store2、predict_sell_num:200),将这两条第一数据记录中的匹配参数信息(bus_line:bu1、data_version:2015-10-01、store_code:store1)和(bus_line:bu1、data_version:2015-10-01、store_code:store2)转义为针对第二数据源的SQL:
(
bus_line='bu1'and data_version='2015-10-01'and store_code='store1'
or
bus_line='bu1'and data_version='2015-10-01'and store_code='store2'
)
将该SQL作为限制条件塞入查询第二数据源时的where条件中,执行对第二数据源的查询,查询到分别对应上述两条第一数据记录的第二数据记录为:(bus_line:bu1、data_version:2015-10-01、store_code:store1、历史销售量history_sell_num:150)和(bus_line:bu1、data_version:2015-10-01、store_code:store2、history_sell_num:260)。
S103:将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合;其中,合并后的数据集合中包括每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息。
在具体实施中,针对每一条第一数据记录,可以在对应该条第一数据记录的第二数据记录中,提取除该条第一数据记录中的匹配参数信息之外的参数信息;将提取的参数信息息添加在该条第一数据记录中。
比如,在第二数据记录(bus_line:bu1、data_version:2015-10-01、store_code:store1、history_sell_num:150)和(bus_line:bu1、data_version:2015-10-01、store_code store2、history_sell_num:260)中提取除匹配参数信息(bus_line:bu1、data_version:2015-10-01、store_code:store1)和(bus_line:bu1、data_version:2015-10-01、store_code:store2)之外的其它参数信息,也即分别为history_sell_num:150和history_sell_num:260,将其添加在对应的第一数据记录中,则两条第一数据记录变为:(bus_line:bu1、data_version:2015-10-01、store_code:store1、predict_sell_num:100、history_sell_num:150)和(bus_line:bu1、data_version:2015-10-01、store_code:store2、predict_sell_num:200、history_sell_num:260)。则合并后的数据集合表二即为:
bus_line data_version store_code predict_sell_num history_sell_num
bu1 2015-10-01 store1 100 150
bu1 2015-10-01 store2 200 260
表二
在得到合并后的数据集合后,数据处理平台可以将该合并后的数据集合显示给用户,还可以执行用户针对合并后的数据集合的后续操作。
该数据处理方法的执行可概括为:1)抽取节点依赖关系、2)前置节点执行、3)生成前置节点对后置节点的依赖的sql追加至后置节点、4)驱动后置节点执行、5)前后节点合并这五个步骤。其中,1)抽取节点依赖关系,也即:数据处理平台在确定需要对第一数据源和第二数据源中的数据记录进行合并查询或处理时,随机选择其中一个数据源作为前置数据源,另外一个数据源则作为依赖该前置数据源的后置数据源。2)前置节点执行,也即:在第一数据源中查询目标数据集合。3)生成前置节点对后置节点的依赖的sql追加至后置节点,也即:根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言。4)驱动后置节点执行,也即:基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录。5)前后节点合并,也即:将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并。
上述实施例将两个不同数据源中的数据进行合并时,并不是将一个数据源中的数据记录直接冗余到另一个数据源中,而是将两个数据源中的数据记录进行逐条匹配,这样,针对匹配上的两条数据记录,可以只保留一份两者之间共有的数据(比如上述实施例中,针对两个数据源共有的业务线、日期和仓库编码,可以只保留一份),分别记录两者之间不同的数据(比如保留第一数据源中的预计销售量和第二数据源中的历史销售量),如此,便实现了不同数据源的数据之间的不冗余合并。另外,这样合并后的数据可以位于同一张数据表(如表二所示)中,在后续操作中无需再执行跨数据表的操作,从而可以提高数据处理效率。
基于同一发明构思,本申请实施例中还提供了一种与跨数据源的数据处理方法对应的跨数据源的数据处理装置,由于该装置解决问题的原理与本申请实施例跨数据源的数据处理方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
如图2所示,为本申请实施例提供的跨数据源的数据处理装置结构示意图,包括:
第一查询模块21,用于在第一数据源中查询目标数据集合;
第二查询模块22,用于针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息;
合并模块23,用于将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合;
其中,合并后的数据集合中包括每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息。
可选地,所述第二查询模块22具体用于:
根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言;基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录。
可选地,所述第二查询模块22具体用于:
将所述目标数据集合中各条第一数据记录中的匹配参数信息整体转义为针对第二数据源的结构化查询语言SQL。
可选地,所述第二查询模块22具体用于:
将生成的针对所述第二数据源的SQL作为在所述第二数据源中进行查询的限制条件,查询对应所述每一条第一数据记录的第二数据记录。
可选地,所述合并模块23具体用于:
针对每一条第一数据记录,在对应该条第一数据记录的第二数据记录中,提取除该条第一数据记录中的匹配参数信息之外的参数信息;将提取的参数信息息添加在该条第一数据记录中。
本申请实施例提供的跨数据源的数据处理方法和装置,将两个不同数据源中的数据进行合并时,并不是将一个数据源中的数据记录直接冗余到另一个数据源中,而是将两个数据源中的数据记录进行逐条匹配,这样,针对匹配上的两条数据记录,可以只保留一份两者之间共有的数据(比如上述实施例中,针对两个数据源共有的业务线、日期和仓库编码,可以只保留一份),分别记录两者之间不同的数据(比如保留第一数据源中的预计销售量和第二数据源中的历史销售量),如此,便实现了不同数据源的数据之间的不冗余合并。另外,这样合并后的数据可以位于同一张数据表(如表二所示)中,在后续操作中无需再执行跨数据表的操作,从而可以提高数据处理效率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种跨数据源的数据处理方法,其特征在于,该方法包括:
在第一数据源中查询目标数据集合;
针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息;
将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合;
其中,合并后的数据集合中包含每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息。
2.如权利要求1所述的方法,其特征在于,针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,包括:
根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言;
基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录。
3.如权利要求2所述的方法,其特征在于,根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言,包括:
将所述目标数据集合中各条第一数据记录中的匹配参数信息整体转义为针对第二数据源的结构化查询语言SQL。
4.如权利要求3所述的方法,其特征在于,基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录,包括:
将生成的针对所述第二数据源的SQL作为在所述第二数据源中进行查询的限制条件,查询对应所述每一条第一数据记录的第二数据记录。
5.如权利要求1~4任一所述的方法,其特征在于,将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,包括:
针对每一条第一数据记录,在对应该条第一数据记录的第二数据记录中,提取除该条第一数据记录中的匹配参数信息之外的参数信息;
将提取的参数信息息添加在该条第一数据记录中。
6.一种跨数据源的数据处理装置,其特征在于,该装置包括:
第一查询模块,用于在第一数据源中查询目标数据集合;
第二查询模块,用于针对所述目标数据集合中的每一条第一数据记录,根据该条第一数据记录中的匹配参数信息,查询对应该条第一数据记录的第二数据记录,该条第二数据记录中包含所述匹配参数信息;
合并模块,用于将所述目标数据集合中的每一条第一数据记录和对应该条第一数据记录的第二数据记录进行合并,得到合并后的数据集合;
其中,合并后的数据集合中包括每一条第一数据记录和与该条第一数据记录对应的第二数据记录之间的相同且不重复的参数信息,以及每一条第一数据记录和该条第一数据记录对应的第二数据记录之间不相同的参数信息。
7.如权利要求6所述的装置,其特征在于,所述第二查询模块具体用于:
根据所述目标数据集合中的每一条第一数据记录中的匹配参数信息,生成针对第二数据源的查询语言;基于生成的所述针对第二数据源的查询语言,查询对应所述目标数据集合中的每一条第一数据记录的第二数据记录。
8.如权利要求7所述的装置,其特征在于,所述第二查询模块具体用于:
将所述目标数据集合中各条第一数据记录中的匹配参数信息整体转义为针对第二数据源的结构化查询语言SQL。
9.如权利要求7所述的装置,其特征在于,所述第二查询模块具体用于:
将生成的针对所述第二数据源的SQL作为在所述第二数据源中进行查询的限制条件,查询对应所述每一条第一数据记录的第二数据记录。
10.如权利要求6~9任一所述的装置,其特征在于,所述合并模块具体用于:
针对每一条第一数据记录,在对应该条第一数据记录的第二数据记录中,提取除该条第一数据记录中的匹配参数信息之外的参数信息;将提取的参数信息息添加在该条第一数据记录中。
CN201610052323.4A 2016-01-26 2016-01-26 一种跨数据源的数据处理方法及装置 Pending CN106997365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610052323.4A CN106997365A (zh) 2016-01-26 2016-01-26 一种跨数据源的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610052323.4A CN106997365A (zh) 2016-01-26 2016-01-26 一种跨数据源的数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN106997365A true CN106997365A (zh) 2017-08-01

Family

ID=59428632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610052323.4A Pending CN106997365A (zh) 2016-01-26 2016-01-26 一种跨数据源的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN106997365A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107515916A (zh) * 2017-08-18 2017-12-26 北京奇虎科技有限公司 数据查询的性能优化方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110113062A1 (en) * 2006-03-31 2011-05-12 Visto Corporation System and method for searching disparate datastores via a remote device
CN103399944A (zh) * 2013-08-14 2013-11-20 曙光信息产业(北京)有限公司 数据去重查询的实现方法和实现装置
CN105164674A (zh) * 2013-08-29 2015-12-16 惠普发展公司,有限责任合伙企业 涉及多个数据库和执行引擎的查询
CN105224649A (zh) * 2015-09-29 2016-01-06 北京奇艺世纪科技有限公司 一种数据处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110113062A1 (en) * 2006-03-31 2011-05-12 Visto Corporation System and method for searching disparate datastores via a remote device
CN103399944A (zh) * 2013-08-14 2013-11-20 曙光信息产业(北京)有限公司 数据去重查询的实现方法和实现装置
CN105164674A (zh) * 2013-08-29 2015-12-16 惠普发展公司,有限责任合伙企业 涉及多个数据库和执行引擎的查询
CN105224649A (zh) * 2015-09-29 2016-01-06 北京奇艺世纪科技有限公司 一种数据处理方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107515916A (zh) * 2017-08-18 2017-12-26 北京奇虎科技有限公司 数据查询的性能优化方法及装置
CN107515916B (zh) * 2017-08-18 2020-12-04 北京奇虎科技有限公司 数据查询的性能优化方法及装置

Similar Documents

Publication Publication Date Title
TWI476608B (zh) A distributed computing data merging method, system and device thereof
CN107622103B (zh) 管理数据查询
CN103632250A (zh) 一种销售订单快速排序分组筛选方法
JP2017517082A (ja) 並列ディシジョン・ツリー・プロセッサー・アーキテクチャ
CN107016018B (zh) 数据库索引创建方法及装置
CN106611037A (zh) 用于分布式图计算的方法与设备
CN108268586A (zh) 跨多数据表的数据处理方法、装置、介质和计算设备
CN107102999A (zh) 关联分析方法和装置
CN106156070A (zh) 一种查询方法、文件合并方法与相关装置
CN102169491A (zh) 一种多数据集中重复记录动态检测方法
CN107480260A (zh) 大数据实时分析方法、装置、计算设备及计算机存储介质
CN111209341B (zh) 区块链的数据存储方法、装置、设备及介质
CN107451204B (zh) 一种数据查询方法、装置及设备
CN105302915A (zh) 基于内存计算的高性能数据处理系统
US9262472B2 (en) Concatenation for relations
CN107977504A (zh) 一种非对称堆芯燃料管理计算方法、装置及终端设备
CN106997365A (zh) 一种跨数据源的数据处理方法及装置
CN105550220A (zh) 一种异构系统的取数的方法及装置
GB2520049A (en) Real time analysis of big data
CN104376055B (zh) 一种基于分片技术的大模型数据比较方法
CN105117403B (zh) 日志数据分片与查询方法及装置
CN107085603A (zh) 一种数据处理方法及装置
CN104572921B (zh) 一种跨数据中心的数据同步方法和装置
CN113495901B (zh) 一种面向可变长数据块的快速检索方法
CN103810256B (zh) 基于分区技术在大数据网优平台中快速分发数据的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180412

Address after: Four story 847 mailbox of the capital mansion of Cayman Islands, Cayman Islands, Cayman

Applicant after: CAINIAO SMART LOGISTICS HOLDING Ltd.

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Applicant before: ALIBABA GROUP HOLDING Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20170801

RJ01 Rejection of invention patent application after publication