CN102073664B - 一种数据回流的方法和装置 - Google Patents

一种数据回流的方法和装置 Download PDF

Info

Publication number
CN102073664B
CN102073664B CN200910246001.3A CN200910246001A CN102073664B CN 102073664 B CN102073664 B CN 102073664B CN 200910246001 A CN200910246001 A CN 200910246001A CN 102073664 B CN102073664 B CN 102073664B
Authority
CN
China
Prior art keywords
data
refluxed
production system
backflow
object table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910246001.3A
Other languages
English (en)
Other versions
CN102073664A (zh
Inventor
李学升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taobao China Software Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN200910246001.3A priority Critical patent/CN102073664B/zh
Priority to US12/951,464 priority patent/US8374995B2/en
Priority to JP2012541064A priority patent/JP5266420B2/ja
Priority to PCT/US2010/003047 priority patent/WO2011065973A1/en
Priority to EP10833690.0A priority patent/EP2504754A4/en
Publication of CN102073664A publication Critical patent/CN102073664A/zh
Priority to HK11107097.4A priority patent/HK1153019A1/zh
Application granted granted Critical
Publication of CN102073664B publication Critical patent/CN102073664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种数据回流的方法和装置。其中,所述方法包括:将待回流数据从数据仓库抽取到内存中;根据数据回流规则确定所抽取的每个待回流数据在生产系统中的目的表;按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送。本申请实施例有效解决了回流过程中数据仓库大表中的数据回流到多个生产系统中小表的问题。本申请实施例所提供的方法使得数据回流过程中,数据仓库表只需要将待回流数据准备好即可,避免了现有技术中将数据仓库的一个大表分成与生产系统对应的多个小表的冗余操作,极大的提高了回流的配置效率,也极大的降低了回流耗费的时间。

Description

一种数据回流的方法和装置
技术领域
本申请涉及数据仓库技术领域,尤其涉及一种数据回流的方法和装置。
背景技术
数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它用于支持企业或组织的决策分析处理。
生产系统的正常运行需要数据仓库的支持。数据回流就是指将数据仓库的计算结果表中的数据导入生产系统数据库的对应表的过程。随着生产系统复杂度和生产率的大幅提高,生产系统自身的数据库的负载越来越繁重。为了缓解生产系统自身数据库的压力,现有技术中在生产系统自身的数据库中采取了将原本位于一个数据库中的一个大表按照特定的规则划分到多台廉价主机上的多个独立数据库中的多个小表里。显然,通过这种方式降低了对生产系统自身数据库单机的硬件要求和机器负载,但是因为生产系统中的数据库中的数据存储模式发生了从一到多的变化,必然导致数据从数据仓库回流到生产系统数据库的方式发生相应的变化。这是因为,原本数据主要是从数据仓库系统的一个表回流到生产数据库的一个表中即可,现在因为生产系统数据库已经从一个大表变成了多个小表,这就需要将数据仓库的一个表中的数据回流到生产系统中的多个分表中。
例如,当某个数据仓库表对应的生产系统的数据库分表个数非常多的时候(例如有的大表会分成1024个分表),现有的数据回流方法是,针对每一个生产系统数据库的分表都在数据仓库里建一个对应的分表,然后将数据从数据仓库的分表同步到生产系统数据库对应的分表中。
发明人通过研究发现,现有的数据回流方法会导致数据仓库的表数量暴涨,从而使数据仓库中表的维护数量和难度就大大提高,而且在数据仓库里将一个表的数据分布到多个分表的过程非常繁杂,极易出错,会导致表的数据计算和回流时间变长,成为回流的瓶颈,严重的可能会导致回流时间非常长。如果回流数据的时间被延迟到生产系统数据库负载高峰期的时段,还将影响到生产系统的稳定。
发明内容
有鉴于此,本申请实施例的目的是提供一种数据回流的方法和装置,实现快速、高效的数据回流。
为实现上述目的,本申请实施例提供了如下技术方案:
一种数据回流的方法,包括:
将待回流数据从数据仓库抽取到内存中;
根据待回流数据的回流规则确定所抽取的每个待回流数据在生产系统中的目的表;按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送。
将待回流数据从数据仓库抽取到内存中具体为:
通过多个线程同时将待回流数据从数据仓库抽取到内存中。
按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送具体为:
将所有的待回流数据按照在生产系统中的目的表进行分组;
通过多个线程将待回流数据按所述分组进行发送,其中每个线程中每个分组中的待回流数据都被发送至生产系统中的同一个目的表。
所述数据回流规则根据所述生产系统中的目的表的数目以及所述待回流数据的属性确定。
所述待回流数据的属性包括:所述待回流数据的中数字位的数值或者所述待回流数据某个字符串类型字段某一位或者几位的值。
一种数据回流的装置,包括:
抽取单元,用于将待回流数据从数据仓库抽取到内存中;
确定单元,用于根据待回流数据的回流规则确定所抽取的每个待回流数据在生产系统中的目的表;
分发单元,用于按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送。
所述抽取单元,具体通过多个线程同时将待回流数据从数据仓库抽取到内存中。
所述分发单元包括:
分组子单元,用于将所有的待回流数据按照在生产系统中的目的表进行分组;
发送子单元,用于通过多个线程将待回流数据按所述分组进行发送,其中每个线程中每个分组中的待回流数据都被发送至生产系统中的同一个目的表。
所述数据回流规则根据所述生产系统中的目的表的数目以及所述待回流数据的属性确定。
所述待回流数据的属性包括:所述待回流数据的中数字位的数值或者所述待回流数据某个字符串类型字段某一位或者几位的值。
可见,在本申请实施例中,将待回流数据从数据仓库抽取到内存中;根据数据回流规则确定所抽取的每个待回流数据在生产系统中的目的表;按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送。本申请实施例有效解决了回流过程中数据仓库大表中的数据回流到多个生产系统中小表的问题。本申请实施例所提供的方法使得数据回流过程中,数据仓库表只需要将待回流数据准备好即可,避免了现有技术中将数据仓库的一个大表分成与生产系统对应的多个小表的冗余操作,极大的提高了回流的配置效率,也极大的降低了回流耗费的时间。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例所提供的方法流程图;
图2为本申请另一实施例所提供的方法流程图;
图3为本申请一实施例所提供的装置的结构示意图;
图4为本申请一实施例提供的装置中一单元的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
请参考图1,为本申请实施例一方法流程图,可以包括以下步骤:
S101,将待回流数据从数据仓库抽取到内存中;
而本申请实施例中,首先将待回流的数据从数据仓库抽取到内存中。
实际应用中,将待回流数据从数据仓库抽取到内存时,可以通过多个线程同时进行,例如通过10个线程从数据仓库中同时抽取待回流数据到内存中。这样可以提高数据抽取的速率。将待回流数据抽取到内存中可以一次将数据仓库中的所有数据均抽取到内存中,也可以分批抽取,当处理完当前批次的待回流数据后再处理下一批次的待回流数据,这样可以提高处理的效率。
S102,根据数据回流规则确定所抽取的每个待回流数据在生产系统中的目的表;
数据回流规则规定了数据仓库中的数据具体回流到生产系统中的哪个目的表,数据回流规则可以根据生产系统中目的表的数目以及待回流数据的属性确定。例如可以根据待回流数据的某数字字段的值除以生成系统中目的表的数据得到的余数来确定;或者根据待回流数据某个字符串类型字段某几位的值来确定;或者通过对行数据中一列或多列的值进行特殊的函数变化后的结果来确定。
数据仓库中的每个待回流的数据在生产系统中都有目的表,即一个待回流数据要被送往的生产系统中的数据库中的具体的表。一个待回流数据可能只有一个目的表,也可能有多个目的表。
通过S102就确定了每个待回流数据在生产系统中的目的表,就相当于给所有的待回流数据打上了标签。
S103,按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送。
如前所述,通过S102,已经为待回流数据都打好了标签,此时,就是根据每个待回流数据的标签将它们从内存中分别进行发送,发送到它们在生产系统中的目的表中去。实际应用中可以分批将待回流数据抽取到内存中,当确定了该批次中的每个待回流数据在生产系统中的目的表后,将该批次待回流数据从内存发送到相应的目的表中,通过这种方式可以提高数据回流的效率。
可选地,为了提高数据的发送效率,仍然可以通过多个线程对待回流的数据进行同时发送。
进一步地,可以通过如下方式进行:
首先,按照待回流数据在生产系统中的目的表对所有的待回流数据进行分组。
例如,现在有100个待回流数据,通过S102之后,确定它们在生产系统中共有15个目的表,编号分别为001~015,那么就将目的表为001的待回流数据归为001组,将目的表为002的待回流数据归为002组,依次类推,直至将目的表为015的数据归为015组。
然后,通过多个线程将待回流数据进行发送,其中每个线程中每个分组的待回流数据都被发送至生产系统中的同一个目的表。
仍然以上面的情况为例,例如可以通过一个5个线程同时发送上述100个待回流数据,分三批次发送,每个批次发送5个组的数据,例如001~005组的待回流数据作为第一个批次进行发送。其中线程1可以用来发送001组的待回流数据,这组数据的目的表都是编号为001的生产系统中的目的表。依此类推,线程5可以用来发送005组的待回流数据,这组数据的目的表都是编号为005的生产系统中的目的表。
当然,每个组的待回流数据的数据流可能是不等的,那么可能有的线程的数据发送的快,有的发送的慢,应用中可以根据实际情况对每个线程发送的组次进行调节,例如可以将数据最多的组与数据最少的组放在同一个线程中发送,这样从整体上使各个线程发送的数据量达到平衡,最终实现在最短的时间内将所有的待发送数据发送完。
现有的生产系统的数据库将一个逻辑表数据分布到多个物理表中,这使得数据仓库中数据的回流面临了极大的挑战,现有的方法是在数据仓库建立与生产系统中对应的多个物理表,即针对生产系统中每一个分表在数据仓库中建立对应表,首先将数据仓库中大表的数据分别插入到多个分表里,然后将数据仓库中分表中的数据回流到生产系统中对应的生产分表里,这导致在初始化的时候要在数据仓库产生大量的分表和配置工作,配置规则和数量异常庞大,也导致了整体回流时间的延长和复杂度的提高,从而严重的影响了将数据仓库中的数据同步到生产系统中的效率和简便性。
本申请实施例有效解决了回流过程中数据仓库大表中的数据回流到多个生产系统中小表的问题。本申请实施例所提供的方法使得数据回流过程中,数据仓库表只需要将待回流数据准备好即可,避免了现有技术中将数据仓库的一个大表分成与生产系统对应的多个小表的冗余操作,极大的提高了回流的配置效率,也极大的降低了回流耗费的时间。
下面以一个网络中的应用为例对本申请实施例所提供的方法进行进一步的说明。
例如现在要统计电子商务网站上某个用户在近期可能感兴趣的商品,参见图2,对统计结果进行数据分流操作具体包括:
S201,将用户感兴趣的商品放到推荐商品表里,并在数据仓库中生成一个结果表recommend_item_list。
结果表的结构可以参见表1。
表1
  User_id   用户ID
  Item_id   商品ID
从表1中可以看出,结果表包括用户ID以及用户所感兴趣的商品的ID。
S202,从数据库中将待回流的结果表中的数据抽取到内存中。
本申请实施例中,为了提高数据抽取速度,通过10线程同时从数据仓库的结果表中抽取数据。
当采用多线程从数据仓库中抽取数据时,为了避免数据被重复抽取,可以预先设定每个线程的数据抽取范围,这样多个线程分工协作,就能够高效地实现待回流数据的抽取工作。
S203,根据用户的数字ID与1024相除得到的余数(处理函数为用户数字ID与1024相除得到的余数)进行分表,不同的余数分到不同的目的表中。如果ID是字符串,则可以对字符串进行函数处理,将待回流数据对应到目的表中。例如如果目的表为24个,则可以根据字符串的第一位的字母将待回流数据与24个目的表进行对应。
本申请实施例中,生产系统中存在1024张表,编号为recommend_item_list_0001~recommend_item_list_1024,结构与数据仓库中的结果表相同。
本申请实施例中采用的回流规则为根据用户的数字ID与1024相除得到的余数进行分表的。实际上,当分流完成后,每个目的表中的数据内容仅是数据仓库中结果表数据的一个子集,是根据用户的数字ID与1024相除得到的余数进行分表的,不同的余数分到不同的目的表中。
S204,按照待回流数据在生产系统中的目的表将所有的待回流数据分成1024个组。
S205,通过16个线程将待回流数据进行发送,其中每个线程中每个分组的待回流数据都被发送至生产系统中的同一个目的表。
在本申请实施例中,待回流数据被分成1024个组,每个组中的数据都有相同的目的表。为了提高待回流数据的回流速度,本申请实施例通过16个线程来同时发送待回流的数据。每个线程发送64组待回流数据。
具体的线程数和每个线程发送的待回流数据的分组个数可以根据实际设备的情况确定,本申请对此不做限定。
现有技术在进行数据回流时会根据生产系统的要求在数据仓库中生成对应的1024张表,对表结构的变更可能导致表的数据计算和回流时间变长,成为回流的瓶颈,严重的可能会导致回流时间非常长。如果回流数据的时间被延迟到生产系统数据库负载高峰期的时段,还将影响到生产系统的稳定,本申请实施例所提供的方法只需要在数据仓库中生成一个结果表即可,然后确定每个待回流数据的目的表,根据待回流数据的目的表发送数据,避免了在数据仓库中建立众多分表的过程,从而保存了数据仓库原有的数据结构,从而避免了因为对数据仓库结构的改变而可能导致的表的数据计算和回流时间变长,回流时间非常长,甚至影响到生产系统的稳定的问题,极大地缩短了数据回流的时间,提高了数据回流的效率。
参见图3,本申请实施例还提供一种数据回流的装置,包括:
抽取单元301,用于将待回流数据从数据仓库抽取到内存中;
确定单元302,用于根据待回流数据的回流规则确定所抽取的每个待回流数据在生产系统中的目的表;
数据回流规则可以根据生产系统中的目的表的数目以及所述待回流数据的属性确定。待回流数据的属性包括:所述待回流数据的中数字位的数值或者所述待回流数据某个字符串类型字段某一位或者几位的值。
例如,本申请一实施例中的数据规则就根据目的表数目以及待回流数据的数字位的数据值确定。
分发单元303,用于按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送。
实际应用中,为了提高本申请实施例所提供的进行数据回流操作的效率,所述抽取单元301具体通过多个线程同时将待回流数据从数据仓库抽取到内存中。
参见图4,本申请另一实施例中,所述分发单元303包括:
分组子单元401,用于将所有的待回流数据按照在生产系统中的目的表进行分组;
发送子单元402,用于通过多个线程将待回流数据进行发送,其中每个线程中的待回流数据都被发送至生产系统中的同一个目的表。
例如,现在有100个待回流数据,通过确定单元302确定了每个待回流数据的目的表首先通过分组子单元401对它们进行分组,假设确定单元302确定它们在生产系统中共有15个目的表,编号分别为001~015,则分组子单元401就将目的表为001的待回流数据归为001组,将目的表为002的待回流数据归为002组,依次类推,直至将目的表为015的数据归为015组。发送子单元通过一个5个线程同时发送上述100个待回流数据,分三批次发送,每个批次5各组,例如001~005组的待回流数据作为第一个批次进行发送。其中线程1可以用来发送001组的待回流数据,这组数据的目的表都是编号为001的生产系统中的目的表。依此类推,线程5可以用来发送005组的待回流数据,这组数据的目的表都是编号为005的生产系统中的目的表。
当然,每个组的待回流数据的数据流可能是不等的,那么可能有的线程的数据发送的快,有点发送的慢,实际应用中发送子单元可以根据实际情况对每个线程发送的组次进行调节,例如可以将数据最多的组与数据最少的组放在同一个线程中发送,这样从整体上使各个线程发送的数据量达到平衡,最终实现在最短的时间内将所有的待发送数据发送完。
本申请实施例所提供的装置避免了在数据仓库中建立众多分表的过程,保存了数据仓库原有的数据结构,从而避免了因为对数据仓库结构的改变而可能导致的表的数据计算和回流时间变长,回流时间非常长,甚至影响到生产系统的稳定的问题,极大地缩短了数据回流的时间,提高了数据回流的效率。有效解决了回流过程中数据仓库大表中的数据回流到多个生产系统中小表的问题。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims (8)

1.一种数据回流的方法,其特征在于,包括: 
将待回流数据从数据仓库抽取到内存中; 
根据待回流数据的回流规则确定所抽取的每个待回流数据在生产系统中的目的表,所述目的表为一个待回流数据要被送往的生产系统中的数据库中的具体的表,所述数据回流规则规定了数据仓库中的数据具体回流到生产系统中的哪个目的表,根据生产系统中目的表的数目以及待回流数据的属性确定; 
按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送,包括: 
将所有的待回流数据按照在生产系统中的目的表进行分组; 
通过多个线程将待回流数据按所述分组进行发送,其中每个线程中每个分组中的待回流数据都被发送至生产系统中的同一个目的表。 
2.根据权利要求1所述的方法,其特征在于,将待回流数据从数据仓库抽取到内存中具体为: 
通过多个线程同时将待回流数据从数据仓库抽取到内存中。 
3.根据权利要求1~2任意一项所述的方法,其特征在于,所述数据回流规则根据所述生产系统中的目的表的数目以及所述待回流数据的属性确定。 
4.根据权利要求3所述的方法,其特征在于,所述待回流数据的属性包括:所述待回流数据的中数字位的数值或者所述待回流数据某个字符串类型字段某一位或者几位的值。 
5.一种数据回流的装置,其特征在于,包括: 
抽取单元,用于将待回流数据从数据仓库抽取到内存中; 
确定单元,用于根据待回流数据的回流规则确定所抽取的每个待回流数据在生产系统中的目的表,所述目的表为一个待回流数据要被送往的生产系统中的数据库中的具体的表,所述数据回流规则规定了数据仓库中的数据具体回流到生产系统中的哪个目的表,根据生产系统中目的表的数目以及待回 流数据的属性确定; 
分发单元,用于按照所确定的每个待回流数据在生产系统中的目的表将待回流数据进行发送,包括: 
分组子单元,用于将所有的待回流数据按照在生产系统中的目的表进行分组; 
发送子单元,用于通过多个线程将待回流数据按所述分组进行发送,其中每个线程中每个分组中的待回流数据都被发送至生产系统中的同一个目的表。 
6.根据权利要求5所述的装置,其特征在于,所述抽取单元,具体通过多个线程同时将待回流数据从数据仓库抽取到内存中。 
7.根据权利要求5~6任意一项所述的装置,其特征在于,所述数据回流规则根据所述生产系统中的目的表的数目以及所述待回流数据的属性确定。 
8.根据权利要求7所述的装置,其特征在于,所述待回流数据的属性包括:所述待回流数据的中数字位的数值或者所述待回流数据某个字符串类型字段某一位或者几位的值。 
CN200910246001.3A 2009-11-24 2009-11-24 一种数据回流的方法和装置 Active CN102073664B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN200910246001.3A CN102073664B (zh) 2009-11-24 2009-11-24 一种数据回流的方法和装置
US12/951,464 US8374995B2 (en) 2009-11-24 2010-11-22 Efficient data backflow processing for data warehouse
JP2012541064A JP5266420B2 (ja) 2009-11-24 2010-11-23 データウェアハウスのための効率的なデータ逆流処理
PCT/US2010/003047 WO2011065973A1 (en) 2009-11-24 2010-11-23 Efficient data backflow processing for data warehouse
EP10833690.0A EP2504754A4 (en) 2009-11-24 2010-11-23 EFFICIENT DATA RETURN PROCESSING FOR A DATA WAREHOUSE
HK11107097.4A HK1153019A1 (zh) 2009-11-24 2011-07-08 種數據回流的方法和裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910246001.3A CN102073664B (zh) 2009-11-24 2009-11-24 一种数据回流的方法和装置

Publications (2)

Publication Number Publication Date
CN102073664A CN102073664A (zh) 2011-05-25
CN102073664B true CN102073664B (zh) 2014-03-19

Family

ID=44032208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910246001.3A Active CN102073664B (zh) 2009-11-24 2009-11-24 一种数据回流的方法和装置

Country Status (6)

Country Link
US (1) US8374995B2 (zh)
EP (1) EP2504754A4 (zh)
JP (1) JP5266420B2 (zh)
CN (1) CN102073664B (zh)
HK (1) HK1153019A1 (zh)
WO (1) WO2011065973A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175808A (zh) * 2019-04-17 2019-08-27 广州精选速购网络科技有限公司 一种订单管理、查询方法、装置、设备及介质
CN113962316A (zh) * 2021-10-27 2022-01-21 维沃移动通信有限公司 模型训练方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1340174A (zh) * 1999-01-15 2002-03-13 米泰吉公司 提供逆星形模式数据模型的方法
US6665682B1 (en) * 1999-07-19 2003-12-16 International Business Machines Corporation Performance of table insertion by using multiple tables or multiple threads
US6925477B1 (en) * 1998-03-31 2005-08-02 Intellisync Corporation Transferring records between two databases
US7299216B1 (en) * 2002-10-08 2007-11-20 Taiwan Semiconductor Manufacturing Company, Ltd. Method and apparatus for supervising extraction/transformation/loading processes within a database system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314951A (ja) * 1995-05-12 1996-11-29 Hitachi Ltd リレ−ショナルデータベースの構造表示方法およびリレ−ショナルデータベースシステム
US6446092B1 (en) * 1996-11-01 2002-09-03 Peerdirect Company Independent distributed database system
US6151608A (en) * 1998-04-07 2000-11-21 Crystallize, Inc. Method and system for migrating data
US6377934B1 (en) 1999-01-15 2002-04-23 Metaedge Corporation Method for providing a reverse star schema data model
GB2351367A (en) 1999-06-22 2000-12-27 Int Computers Ltd Generating code for processing a database
JP2001282819A (ja) * 2000-01-28 2001-10-12 Fujitsu Ltd データマイニング装置、データマイニング処理プログラムを格納したコンピュータ可読の記憶媒体、及びデータマイニング処理プログラム
US20020143862A1 (en) 2000-05-19 2002-10-03 Atitania Ltd. Method and apparatus for transferring information between a source and a destination on a network
US6850947B1 (en) * 2000-08-10 2005-02-01 Informatica Corporation Method and apparatus with data partitioning and parallel processing for transporting data for data warehousing applications
US7016903B1 (en) 2001-01-25 2006-03-21 Oracle International Corporation Method for conditionally updating or inserting a row into a table
US20030005098A1 (en) 2001-06-28 2003-01-02 International Business Machines Corporation Method and apparatus for using dynamic grouping data to group attributes relating to computer systems
US7313576B2 (en) * 2004-07-30 2007-12-25 Sbc Knowledge Ventures, L.P. System and method for flexible data transfer
US20060072626A1 (en) 2004-09-29 2006-04-06 Lucent Technologies Inc. Data synchronization in a telecommunication management network
US7490207B2 (en) 2004-11-08 2009-02-10 Commvault Systems, Inc. System and method for performing auxillary storage operations
US7996679B2 (en) * 2005-10-05 2011-08-09 International Business Machines Corporation System and method for performing a trust-preserving migration of data objects from a source to a target
CA2542379A1 (en) 2006-04-07 2007-10-07 Cognos Incorporated Packaged warehouse solution system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6925477B1 (en) * 1998-03-31 2005-08-02 Intellisync Corporation Transferring records between two databases
CN1340174A (zh) * 1999-01-15 2002-03-13 米泰吉公司 提供逆星形模式数据模型的方法
US6665682B1 (en) * 1999-07-19 2003-12-16 International Business Machines Corporation Performance of table insertion by using multiple tables or multiple threads
US7299216B1 (en) * 2002-10-08 2007-11-20 Taiwan Semiconductor Manufacturing Company, Ltd. Method and apparatus for supervising extraction/transformation/loading processes within a database system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王黎敏.《组件式DSS开发环境的研究与设计》.《中国优秀硕士学位论文全文数据库》.2002, *

Also Published As

Publication number Publication date
US8374995B2 (en) 2013-02-12
CN102073664A (zh) 2011-05-25
EP2504754A4 (en) 2016-10-05
US20110125707A1 (en) 2011-05-26
EP2504754A1 (en) 2012-10-03
JP2013512502A (ja) 2013-04-11
JP5266420B2 (ja) 2013-08-21
WO2011065973A1 (en) 2011-06-03
HK1153019A1 (zh) 2012-03-16

Similar Documents

Publication Publication Date Title
US10901800B2 (en) Systems for parallel processing of datasets with dynamic skew compensation
EP3637280A1 (en) Data storage method and device, and storage medium
CN112269789A (zh) 存储数据的方法和装置、以及读取数据的方法和装置
US20180329966A1 (en) System and method for providing a hybrid set-based extract, load, and transformation of data
CN103914565A (zh) 一种向数据库插入数据的方法及装置
US10496659B2 (en) Database grouping set query
CN110097302B (zh) 分配订单的方法和装置
CN106970929A (zh) 数据导入方法及装置
WO2016134580A1 (zh) 一种数据查询方法及装置
CN103034935A (zh) 一种用于实时盘点的装置及方法
CN110322318B (zh) 一种客户分群方法、装置及计算机存储介质
CN104537030A (zh) 一种业务数据查询方法及装置、数据库系统
CN107016115B (zh) 数据导出方法、装置、计算机可读存储介质及电子设备
CN106933836A (zh) 一种基于分表的数据存储方法和系统
WO2021189695A1 (zh) 分布式的数据库动态扩容方法、装置、设备及存储介质
CN102073664B (zh) 一种数据回流的方法和装置
CN111753019B (zh) 一种应用于数据仓库的数据分区方法和装置
CN111612385B (zh) 一种对待配送物品进行聚类的方法和装置
CN110704404A (zh) 一种数据质量校验方法、装置、系统
CN109902847B (zh) 预测分库订单量的方法和装置
US10353610B1 (en) Method, apparatus and computer program product for configuring a data storage system
US11675767B1 (en) Hash based rollup with passthrough
CN107729577A (zh) 一种基于多维哈希表的数据查找方法、终端设备及存储介质
CN102457904A (zh) 一种负载均衡的方法、装置、手持终端以及通信设备
CN112009921A (zh) 同心多边形仓库以及物品上下架的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1153019

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1153019

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211110

Address after: Room 554, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: Taobao (China) Software Co., Ltd

Address before: P.O. Box 847, 4th floor, capital building, Grand Cayman, British Cayman Islands

Patentee before: Alibaba Group Holdings Limited