CN107070645A - 比较数据表的数据的方法和系统 - Google Patents

比较数据表的数据的方法和系统 Download PDF

Info

Publication number
CN107070645A
CN107070645A CN201611260662.8A CN201611260662A CN107070645A CN 107070645 A CN107070645 A CN 107070645A CN 201611260662 A CN201611260662 A CN 201611260662A CN 107070645 A CN107070645 A CN 107070645A
Authority
CN
China
Prior art keywords
data
database
signature
server
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611260662.8A
Other languages
English (en)
Other versions
CN107070645B (zh
Inventor
崔鑫
杨磊
蔺若林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201611260662.8A priority Critical patent/CN107070645B/zh
Publication of CN107070645A publication Critical patent/CN107070645A/zh
Priority to PCT/CN2017/108196 priority patent/WO2018121025A1/zh
Application granted granted Critical
Publication of CN107070645B publication Critical patent/CN107070645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information
    • H04L63/126Applying verification of the received information the source of the received data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0866Generation of secret information including derivation or calculation of cryptographic keys or passwords involving user or device identifiers, e.g. serial number, physical or biometrical information, DNA, hand-signature or measurable physical characteristics

Abstract

本申请提供了一种比较数据表的数据的方法和系统,系统包括客户端和多个服务端第一数据库对应至少一个第一服务端,第二数据库对应至少一个第二服务端,客户端获取目标数据表在两个数据库的第一元数据和第二元数据,第一元数据中包括目标数据表的数据对应的第一范围,第二元数据中包括目标数据表的数据对应的第二范围;客户端根据第一范围和第二范围中的至少一个,确定目标范围;第一服务端根据目标范围,对第一数据库中目标数据表的数据进行签名得到第一签名;类似地第二服务端得到第二签名;客户端根据第一签名和第二签名,确定两个数据库中目标数据表的数据是否相同,避免大量的数据传输和比较,运行速度快成本低,网络资源占用量小。

Description

比较数据表的数据的方法和系统
技术领域
本申请涉及数据库领域,并且更具体地,涉及一种比较数据表的数据的方法和系统。
背景技术
对于大数据领域,键值(key-value)数据库是应对大量随机写、随机读场景的一种最佳选择。key-value数据库中的所有数据,均以key-value形式存在。key-value形式具有严格定义的结构,数据库中的所有数据,都以不可改写的文件存在于底层文件系统中。新数据的写入,会生成新的key-value;旧数据的改写或者删除,也会生成新的key-value来标记该改写或者删除。
另外,大数据领域为了追求数据更高的可用性和更好的容灾性,通常在多数据中心方案中采取异地备份数据的功能。因此,备份数据前、中、后校验数据的一致性,成为现在大数据存储领域一项重要的功能特性。
现有的比较工具是基于数据的比较工具。当使用该比较工具对两个数据库(工作数据库和备份数据库)的数据表(两个数据库中数据表的结构应是相同的)进行内容比较时,该比较工具会将校验任务进行并行化处理,例如,提交成映射归约(MapReduce,MR)作业分配到很多节点上并行执行。该比较工具分别从两个数据库的数据表中读取数据,进行比较,得到不一致的数据。
现有的比较工具对数据表中的数据进行逐行比较,比较效率低下,比较工具运行速度慢。另外,现有的比较技术,需要映射框架在本地跟本地数据库的集群的多个服务器进行通信,还可能需要跟远端数据库的集群的服务器进行通信,这会占用大量的网络资源。
发明内容
本申请提供一种比较数据表的数据的方法和系统,能够避免大量的数据传输和比较,运行速度快成本低,网络资源占用量小。
本申请第一方面提供了一种比较数据表的数据的方法,其特征在于,所述方法应用于比较第一数据库和第二数据库的目标数据表的数据的系统,所述系统包括客户端和多个服务端,其中,所述第一数据库对应至少一个第一服务端,所述第二数据库对应至少一个第二服务端,所述方法包括:所述客户端获取所述第一数据库中所述目标数据表的第一元数据和所述第二数据库中所述目标数据表的第二元数据,所述第一元数据中包括所述目标数据表的数据在所述第一数据库的服务器中所对应的第一范围,所述第二元数据中包括所述目标数据表的数据在所述第二数据库的服务器中所对应的第二范围;所述客户端根据所述第一范围和所述第二范围中的至少一个,确定目标范围;所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名;所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名;所述客户端根据所述第一签名和所述第二签名,确定所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据是否相同。
第一方面的比较数据表的数据的方法,客户端根据数据表的数据的分布确定目标范围,服务端根据目标范围对数据进行签名,客户端比较两个数据库中数据表的数据对应的签名是否一致即可判断出这两个数据表的数据是否一致,避免了大量的数据传输和比较,运行速度快成本低,网络资源占用量小。
在第一方面的一种可能的实现方式中,所述第一数据库的每个服务器对应一个第一服务端,所述第一范围包括所述目标数据表的数据在所述第一数据库的每个服务器的子范围,所述第二数据库的每个服务器对应一个第二服务端,所述第二范围包括所述目标数据表的数据在所述第二数据库的每个服务器的子范围,所述客户端根据所述第一范围和所述第二范围中的至少一个,确定目标范围,包括:所述客户端根据所述目标数据表的数据在所述第一数据库的每个服务器的子范围和所述目标数据表的数据在所述第二数据库的每个服务器的子范围,确定所述目标范围的子范围,每个所述子范围对应的数据在所述第一数据库中分布在一个服务器上,并且在所述第二数据库中分布在一个服务器上。本实现方式使得后续在对数据进行签名时,不再需要跨服务器(跨RS)进行数据传输,可以进一步提高运行速度,降低网络资源的占用量。
在第一方面的一种可能的实现方式中,在所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名之前,所述方法还包括:所述客户端、所述至少一个第一服务端和所述至少一个第二服务端中的至少一种为每个所述子范围进行树型分段;所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,包括:所述至少一个第一服务端根据所述树型分段,对所述第一数据库中目标数据表的数据的分段进行签名得到树型的所述第一签名;所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名,包括:所述至少一个第二服务端根据所述树型分段,对所述第二数据库中目标数据表的数据的分段进行签名得到树型的所述第二签名。本实现方式对目标范围的子范围进行树型分段可以得到更细化的签名,能够提高比较签名时的效率。
在第一方面的一种可能的实现方式中,所述客户端根据所述第一签名和所述第二签名,确定所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据是否相同,包括:所述客户端根据树型的所述第一签名和树型的所述第二签名,确定所述第一签名和所述第二签名的树的相同层的签名是否一致,当签名不一致时,确定所述层对应的分段在所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据不同。
在第一方面的一种可能的实现方式中,所述客户端、所述至少一个第一服务端和所述至少一个第二服务端中的至少一种为每个所述子范围进行树型分段,包括:所述至少一个第一服务端和所述至少一个第二服务端对所述目标范围中数据的密度进行统计;所述至少一个第一服务端和所述至少一个第二服务端根据统计的结果,为每个所述子范围进行树型分段。本实现方式可以使得各个服务器负载更均衡。
在第一方面的一种可能的实现方式中,所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,包括:所述至少一个第一服务端根据所述目标范围,通过哈希算法对所述第一数据库中目标数据表的数据进行签名得到第一签名;所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名,包括:所述至少一个第二服务端根据所述目标范围,通过哈希算法对所述第二数据库中目标数据表的数据进行签名得到第二签名。
本申请第二方面提供了一种比较数据表的数据的系统,其特征在于,所述系统用于比较第一数据库和第二数据库的目标数据表的数据,所述系统包括运行客户端的计算设备和运行服务端的多个服务器,其中,所述第一数据库包括运行第一服务端的至少一个第一服务器,所述第二数据库包括运行第二服务端的至少一个第二服务器:所述计算设备用于获取所述第一数据库中所述目标数据表的第一元数据和所述第二数据库中所述目标数据表的第二元数据,所述第一元数据中包括所述目标数据表的数据在所述第一数据库的服务器中所对应的第一范围,所述第二元数据中包括所述目标数据表的数据在所述第二数据库的服务器中所对应的第二范围;所述计算设备还用于根据所述第一范围和所述第二范围中的至少一个,确定目标范围;所述至少一个第一服务器用于根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名;所述至少一个第二服务器用于根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名;所述计算设备还用于根据所述第一签名和所述第二签名,确定所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据是否相同。
在第二方面的一种可能的实现方式中,所述第一数据库中用于存储所述目标数据表的每个服务器均为运行所述第一服务端的所述第一服务器,所述第一范围包括所述目标数据表的数据在所述第一数据库的每个所述第一服务器的子范围,所述第二数据库中用于存储所述目标数据表的每个服务器均为运行所述第二服务端的所述第二服务器,所述第二范围包括所述目标数据表的数据在所述第二数据库的每个所述第二服务器的子范围,所述计算设备具体用于:根据所述目标数据表的数据在所述第一数据库的每个所述第一服务器的子范围和所述目标数据表的数据在所述第二数据库的每个所述第二服务器的子范围,确定所述目标范围的子范围,每个所述子范围对应的数据在所述第一数据库中分布在一个服务器上,并且在所述第二数据库中分布在一个服务器上。
在第二方面的一种可能的实现方式中,在所述第一服务器根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,所述第二服务器根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名之前,所述计算设备、所述至少一个第一服务器和所述至少一个第二服务器中的至少一种用于为每个所述子范围进行树型分段;所述至少一个第一服务器具体用于:根据所述树型分段,对所述第一数据库中目标数据表的数据的分段进行签名得到树型的所述第一签名;所述至少一个第二服务器具体用于:根据所述树型分段,对所述第二数据库中目标数据表的数据的分段进行签名得到树型的所述第二签名。
在第二方面的一种可能的实现方式中,所述计算设备具体用于:根据树型的所述第一签名和树型的所述第二签名,确定所述第一签名和所述第二签名的树的相同层的签名是否一致,当签名不一致时,确定所述层对应的分段在所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据不同。
在第二方面的一种可能的实现方式中,所述至少一个第一服务器和所述至少一个第二服务器用于对所述目标范围中数据的密度进行统计;所述至少一个第一服务器和所述至少一个第二服务器用于根据统计的结果,为每个所述子范围进行树型分段。
在第二方面的一种可能的实现方式中,所述至少一个第一服务器具体用于:根据所述目标范围,通过哈希算法对所述第一数据库中目标数据表的数据进行签名得到第一签名;所述至少一个第二服务器具体用于:根据所述目标范围,通过哈希算法对所述第二数据库中目标数据表的数据进行签名得到第二签名。
本申请第三方面提供了一种存储介质,该存储介质中存储了程序,该程序被计算设备和服务器运行时,该计算设备和服务器执行前述第一方面或第一方面的任一实现方式提供的比较数据表的数据的方法。该存储介质包括但不限于只读存储器,随机访问存储器,快闪存储器、HDD或SSD。
本申请第四方面提供了一种计算机程序产品,该计算机程序产品包括程序指令,当该计算机程序产品被计算设备和服务器执行时,该计算设备和服务器执行前述第一方面或第一方面的任一实现方式提供的比较数据表的数据的方法。该计算机程序产品可以为一个软件安装包,在需要使用前述第一方面或第一方面的任一实现方式提供的比较数据表的数据的方法的情况下,可以下载该计算机程序产品并在计算设备和服务器上执行该计算机程序产品。
附图说明
图1是一种采用比较工具来比较数据表的数据的方法的示意图。
图2是本发明一个实施例的比较数据表的数据的系统的示意性框图。
图3是本发明另一个实施例的比较数据表的数据的系统的示意性框图。
图4是本发明一个实施例的比较数据表的数据的方法的示意性流程图。
图5是本发明一个实施例的切分目标范围的示意图。
图6是本发明另一个实施例的切分目标范围的示意图。
图7是本发明另一个实施例的切分目标范围的示意图。
图8是本发明另一个实施例的切分目标范围的示意图。
图9是本发明另一个实施例的切分目标范围的示意图。
图10是本发明一个实施例的目标范围的切分结果的示意图。
图11是本发明一个实施例的建立树型的签名的示意图。
图12是本发明一个实施例的计算设备或服务器的示意性框图。
具体实施方式
下面将结合附图,对本发明实施例中的技术方案进行描述。
对于校验两个数据库中数据的一致性,现有的比较工具是基于数据的比较工具。当使用该比较工具对两个数据库的数据表进行内容比较时,该比较工具会将校验任务进行并行化处理。
下面结合Hadoop数据库(Hadoop database,Hbase),以现有的比较工具为例,介绍比较数据库中数据表的数据的流程。图1是现有的比较工具比较数据表的数据的方法100的示意图。该方法100包括:
S110,现有的比较工具向数据中心(Data Center,DC)1的数据库对应的Hbase集群提交一个MR作业。
S120,Hbase集群的远程控制器(Remote Master,RM)将MR作业分配到很多节点上并行执行,即将MR作业分配给多个映射任务(map task)。
S130,每一个map task负责一部分数据的比较。每一个map task分别从两个数据中心DC1和DC2的HBase集群读取数据,然后进行数据比较,并打印出不一致的数据。通常,HBase集群中的每个服务器上均配置有服务程序区域服务器(Region Server,RS),RS用于管理服务器上运行的任务。
现有的比较工具对数据表中的数据进行逐行比较,比较效率低下,比较工具运行速度慢。其次,现有的比较工具不仅需要两个HBase集群的参与,还需要集群提供RM作业的运行节点,比较工具的占用和运行成本较高。另外,现有的比较技术,需要映射框架在本地跟本地数据库的HBase集群的多个服务器的RS进行通信,还可能需要跟远端数据库的HBase集群的服务器的RS进行通信,这会占用大量的网络资源。
基于以上问题,本发明实施例提供了一种比较数据表的数据的方法。图2示出了本发明实施例的比较数据表的数据的系统200的示意性框图。应理解,图2示出的系统200是软件的角度的示意性框图。如图2所示,该系统200从软件上看包括客户端210和多个服务端,其中,每个数据库对应至少一个服务端,第一数据库对应至少一个第一服务端221,第二数据库对应至少一个第二服务端222。
图3示出了本发明实施例的比较数据表的数据的系统300的示意性框图。应理解,图3示出的系统300是硬件的角度的示意性框图。与图2的软件相对应地,系统300包括运行客户端的计算设备310和运行服务端的多个服务器。客户端210可以部署在用户的计算设备310上,计算设备310通常不是任意一个数据库对应的服务器,即通常不是DC的服务器;第一服务端221可以部署在第一数据库对应的第一DC的第一服务器321上;第二服务端222可以部署在第二数据库对应的第二DC的第二服务器322上。可选地,第一数据库用于存储数据表的每台服务器上可以部署一个第一服务端221,即部署了第一服务端221的服务器认为是第一服务器321;第二数据库用于存储数据表的每台服务器上可以部署一个第二服务端222,即部署了第二服务端222的服务器认为是第二服务器322。当然每个数据库的多台服务器也可以共用一个服务端,本发明实施例对此不作限定。图2示出的第一服务端和第二服务端的数量,以及图3示出的第一服务器和第二服务器的数量仅是示意性的,而非对本发明实施例的限定。
另外,本发明实施例中涉及获取元数据(meta data),元数据一般存储在meta表中,meta表通常存储在数据库中区别于存储数据表的服务器以外的另外的服务器上。图3中示意性的示出第一数据库的meta表存储在第一数据库的第三服务器323上,第二数据库的meta表存储在第二数据库的第四服务器324上。当然meta表也可以存储在数据库中存储数据表的服务器上,本发明实施例对此不作限定。
应理解,系统300中的计算设备和服务器可以认为是一个节点。其中,用于存储数据表的服务器(例如第一服务器和第二服务器)可以认为是存储节点,存储节点上部署有服务端,服务端可以是RS的部分功能,也可以独立与RS存在。存储meta表的服务器可以认为是元数据管理节点。
还应理解,本发明实施例的服务端可以作为RS的一个功能模块,也可作为单独的模块或单元,本发明实施例对此不作限定。
图4示出了本发明实施例的比较数据表的数据的方法400的示意性流程图。如图4所示,方法400包括:
S410,客户端210获取第一数据库中目标数据表的第一元数据和第二数据库中目标数据表的第二元数据,第一元数据中包括目标数据表的数据在第一数据库的服务器中所对应的第一范围,第二元数据中包括目标数据表的数据在第二数据库的服务器中所对应的第二范围;
S420,客户端210根据第一范围和第二范围中的至少一个,确定目标范围;
S430,至少一个第一服务端221根据目标范围,对第一数据库中目标数据表的数据进行签名得到第一签名;
S440,至少一个第二服务端222根据目标范围,对第二数据库中目标数据表的数据进行签名得到第二签名;
S450,客户端210根据第一签名和第二签名,确定第一数据库中目标数据表的数据与第二数据库中目标数据表的数据是否相同。
本发明实施例的方法,客户端根据数据表的数据的分布确定目标范围,服务端根据目标范围对数据进行签名,客户端比较两个数据库中数据表的数据对应的签名是否一致即可判断出这两个数据表的数据是否一致,避免了大量的数据传输和比较,运行速度快成本低,网络资源占用量小。
具体而言,本发明实施例的待比较的目标数据表所在的第一数据库和第二数据库分别属于不同的数据库,两个数据库进一步可以分别属于不同的数据中心的服务器的集群。当然两个数据库也可以属于同一个数据中心,本发明实施例对此不作限定。
通常,数据库中的数据表较大,一般需将数据表横向切分,在多个服务器存放,以增强并发处理的速度。
在S410中,客户端210分别与存放目标数据表的第一数据库和第二数据库的服务器通信,以得到第一数据库中目标数据表的第一元数据和第二数据库中目标数据表的第二元数据。元数据(meta data)一般存储在meta表中,meta表通常存储在数据库中区别于存储数据表的服务器以外的另外的服务器上,当然meta表也可以存储在数据库中存储数据表的服务器上,本发明实施例对此不作限定。
客户端210得到两个数据库的目标数据表的对应的两张meta表,即得到第一元数据和第二元数据。现假设每个数据库分别包括3台服务器,每台服务器上运行一个RS,每个RS对应存储目标数据表的一个区域(region)。根据第一元数据和第二元数据,得到每个region对应一个范围(range)分布情况,即开始键(start key)和结束键(end key)。其中,第一元数据中包括目标数据表的数据在第一数据库的服务器中所对应的第一范围,第二元数据中包括目标数据表的数据在第二数据库的服务器中所对应的第二范围。在一个具体的例子中,目标数据表table1的分布情况可以如表1所示。
表1目标数据表的分布情况
第一数据库的目标数据表在第一数据库的RS1上的key的范围为1-30,在第一数据库的RS2上的key的范围为31-80,在第一数据库的RS3上的key的范围为81-100。第二数据库的目标数据表在第二数据库的RS1上的key的范围为1-25,在第二数据库的RS2上的key的范围为26-60,在第二数据库的RS3上的key的范围为61-100。
在S320中,客户端210根据第一范围和第二范围中的至少一个,确定目标范围。
可选地,上述例子中的分布符合:第一数据库的每个服务器对应一个第一服务端221,第一范围包括目标数据表的数据在第一数据库的每个服务器的子范围,第二数据库的每个服务器对应一个第二服务端222,第二范围包括目标数据表的数据在第二数据库的每个服务器的子范围。S420中客户端210根据第一范围和第二范围中的至少一个,确定目标范围,可以包括:客户端210根据目标数据表的数据在第一数据库的每个服务器的子范围和目标数据表的数据在第二数据库的每个服务器的子范围,确定目标范围的子范围,每个子范围对应的数据在第一数据库中分布在一个服务器上,并且在第二数据库中分布在一个服务器上。
具体地,客户端210可以根据两个数据表分别对应的第一范围和第二范围(即start key和end key的分布),作出重复范围最大匹配目标的切分,得到目标范围。目标范围包括多个子范围,每个子范围对应的数据在第一数据库中分布在一个服务器上,并且在第二数据库中分布在一个服务器上。这样,后续在对数据进行签名时,不再需要跨服务器(跨RS)进行数据传输,可以进一步提高运行速度,降低网络资源的占用量。
下面详细介绍一种划分目标范围的子范围的方案。这种方案不仅使得目标范围的子范围在第一数据库中分布在一个服务器上,并且在第二数据库中分布在一个服务器上;而且还能保证划分出的子范围的个数最少。切分的具体步骤可以如下。
步骤1.客户端210按照行键(row key)从小到大的顺序将两个数据库的目标数据表在服务器上分布的范围形成两个region队列。第一范围对应region队列A(A1,A2,…),第二范围对应region队列B(B1,B2,…)。客户端210分别从两个region队列中依次选取region。
步骤2.客户端210比较被选中两个region(例如Ax和By)的范围(range),看这两个region是否有重叠。这里又分为几种情况:
a)如果两个region没有重叠,则将start key较小region作为已经切分好的region(即目标范围的一个子范围)输出,然后从start key较小的region所在的region队列中取下一个region,然后继续重复步骤2的操作,继续比较。
b)如果两个region有重叠,又可以分为几种情况:
I.完全重叠的情况:
如图5所示,当两个region(A1和B1)完全重叠时,将其中任意一个region作为已经切分好的region C1(即目标范围的一个子范围)输出,然后从两个region队列中分别取出下一个region,然后继续重复步骤2的操作,继续比较。
II.部分重叠的情况(start key相同,end key不同):
如图6所示,当两个region(A1和B1)有部分重叠时,截取重叠部分,作为已经切分好的region C1(即目标范围的一个子范围)输出。将B1进行截取,并将剩下的部分regionB1-作为新的region跟region队列A的下一个region A2进行步骤2的比较。
III.部分重叠的情况(start key不同,end key也不同,一个region包含另一个region的情况):
如图7所示,当region B1中完全包含region A1时,用region A1的start key和end key将region B1做切分,得到的C1,C2和B1-(region B1剩余的部分)。将C1和C2(分别为目标范围的子范围)作为切分后的结果保存,将B1-和region队列A的下一个region A2作为待比较的两个region,进行步骤2的比较。
IV.部分重叠的情况(start key不同,end key也不同,不存在一个region包含另一个region的情况):
如图8所示,region B1的start key小于region A1的start key,region B1的endkey也小于region A1的end key,将region A1的start key和region B1的end key作为切分标准,对region A1和region B1进行切分。切分后得到的前两个region C1和region C2(分别为目标范围的子范围)作为结果输出,将region A1剩下的部分A1-和region队列B的下一个region B2作为待比较的两个Region进行步骤2的比较。
V.部分重叠的情况(start key不同,end key相同):
在如图9所示的例子中,将region A1的start key作为切分标准,对region A1和region B1进行切分。切分后得到两个region C1和region C2(分别为目标范围的子范围)作为切分结果输出,然后将region队列A的下一个region A2和region队列B的下一个region B2作为待比较的两个region进行步骤2的比较。
步骤3.客户端210依次读取两个数据库的目标数据表对应的第一范围中的region和第二范围中的region,直到划分完毕。
对表1所示的例子中目标数据表的第一范围中的region和第二范围中的region进行划分后的结果如图10所示。目标范围包括5个子范围,每个子范围不论是在第一数据库还是在第二数据库均分布在一个RS上,不会跨RS。
可选地,在S320中,客户端210也可以将第一范围和第二范围中的一个,作为目标范围,本发明实施例对划分目标范围的具体方式不作限定。
在确定目标范围之后,可以直接以上述目标范围的各个子范围作为最细粒度,通过服务端对两个数据库中目标数据表的数据进行签名。
可选地,作为一个实施例,在S330至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,S340至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名之前,方法300还可以包括:客户端、至少一个第一服务端和至少一个第二服务端中的至少一个为每个子范围进行树型分段;S330至少一个第一服务端根据目标范围,对第一数据库中目标数据表的数据进行签名得到第一签名,可以包括:至少一个第一服务端根据树型分段,对第一数据库中目标数据表的数据的分段进行签名得到树型的第一签名;S340至少一个第二服务端根据目标范围,对第二数据库中目标数据表的数据进行签名得到第二签名,可以包括:至少一个第二服务端根据树型分段,对第二数据库中目标数据表的数据的分段进行签名得到树型的第二签名。这样,对目标范围的子范围进行树型分段可以得到更细化的签名,能够提高比较签名时的效率。
下面结合一个具体的实施例说明本发明实施例的方法为每个子范围进行树型分段的过程。在该实施例中,客户端、至少一个第一服务端和至少一个第二服务端中的至少一个为每个子范围进行树型分段,包括:至少一个第一服务端和至少一个第二服务端对目标范围中数据的密度进行统计;至少一个第一服务端和至少一个第二服务端根据统计的结果,为每个子范围进行树型分段。
具体而言,客户端210将切分好的目标范围的子范围的信息封装成统计记数的请求,发送给两个数据库的服务端。因为待比较的两个数据库中的目标数据表的数据结构是相同的,因此对每一个子范围仅需要两个数据库中的任意一个数据库的服务端进行统计记数即可。在本发明的一个实施例中,对两个数据库中的服务端进行负载均衡(loadbalance)操作。如表2所示,将子范围[0-25]分配给第二数据库的第二服务端(对应于RS1)来统计密度,将子范围[26-30]分配给第一数据库的第一服务端(对应于RS1)来统计密度。子范围[81-100]则分配给第一数据库的第一服务端或第二数据库的第二服务端均可。这样,没有RS是闲置的,也没有RS过于繁忙,可以使得各个服务器的负载均衡。
当然,在本发明的其他实施例中,可以不考虑各个服务器的负载均衡,客户端210可以选择两个数据库的任意一个数据库的服务端来统计数据密度;或者,客户端210可以从两个数据库中选择一个数据库,统计数据密度均使用被选中的数据库的服务端,本发明实施例对此不作限定。
表2密度统计示意
目标范围的子范围 第一数据库 第二数据库
1-25 等待 统计密度(RS1)
26-30 统计密度(RS1) 等待
31-58 等待 统计密度(RS2)
59-80 统计密度(RS2) 等待
81-100 等待 统计密度(RS3)
根据表2,第二数据库的RS2统计得到子范围[31-58]中数据的密度,将子范围进行分段后得到,将该子范围[31-58]分成每层具有两个分支的树形,树形的最底层的各段(即粒度最细的各段)分别为[31-37][38-44][45-51][52-58]。第二数据库的RS2将该信息封装起来发送给第一数据库的RS2,格式可以如下“start key,end key,least size,childsize”,其值为“31,58,7,2”。第一数据库的RS2收到该信息后,得到树形分组的信息。第一数据库的第二服务端(对应RS2)根据树型分段读取数据,对第一数据库中目标数据表的数据的分段进行签名得到树型的第一签名。
应理解,在本发明实施例中,读取数据是花费时间较长的一个环节,因此,第二数据库的RS2可以一边对目标范围的子范围中数据的密度进行统计,一边就完成了签名。
服务端根据树型分段,对数据分段进行签名得到树型的签名的过程可以如下。服务端对每个子范围的树形的最底层的各段进行签名运算,然后依据树的分支,进行自下而上的建树操作。图11示出了本发明一个实施例的建立树型的签名的示意图。
步骤a.先建立最细粒度的分段的数据的签名。例如,v1=[31-37],v2=[38-44],v3=[45-51],v4=[52-58]。
步骤b.按照树的分支为2的设置,建立上一层的签名。例如,v5=[31-44]=签名(v1,v2),v6=[45-58]=签名(v3,v4)。
步骤c.如果该层的签名个数不为1,重复执行步骤b;如果该层的签名个数为1则结束。最终得到最上边一层的签名v7=[31-58]=签名(v5,v6)。
可选地,本发明实施例采用哈希算法对数据进行签名,例如,可以通过消息摘要算法第五版(Message Digest Algorithm 5,MD5)对数据进行签名。相应地,S330至少一个第一服务端根据目标范围,对第一数据库中目标数据表的数据进行签名得到第一签名,可以包括:至少一个第一服务端根据目标范围,通过哈希算法对第一数据库中目标数据表的数据进行签名得到第一签名;S340至少一个第二服务端根据目标范围,对第二数据库中目标数据表的数据进行签名得到第二签名,可以包括:至少一个第二服务端根据目标范围,通过哈希算法对第二数据库中目标数据表的数据进行签名得到第二签名。
每个服务端得到签名之后可以将树形的第一签名或树形的第二签名反馈给客户端210。应理解,本发明实施例中每个子范围对应一个树形的签名,因此可能存在多个第一签名以及多个第二签名。每个服务端也可以仅将树形的第一签名的最高层的签名或树形的第二签名的最高层的签名反馈给客户端210。当最高层的签名不一致时,再将下层的签名发送给客户端210用于比较,本发明实施例对此不做限定。
客户端210收到来自两个数据库的目标范围的子范围的签名。客户端210对签名进行比较,如果最高层的签名相等,则认为两个数据库中目标数据表的内容一致,比较结束。
如果客户端210发现最高层的签名不相等,则依次比较下层的签名,直到找到签名不一致的最细粒度的分段,确定是哪些数据不一致。或者,客户端210发现最高层的签名不相等,则要求服务端返回下一层的签名,客户端210继续比较返回回来的签名,如果发现其中有不一致的,继续要求服务端返回下一层的签名,直到找到签名不一致的最细粒度的分段。
概括而言,S350客户端根据第一签名和第二签名,确定第一数据库中目标数据表的数据与第二数据库中目标数据表的数据是否相同,可以包括:客户端根据树型的第一签名和树型的第二签名,确定第一签名和第二签名的树的相同层的签名是否一致,当签名不一致时,确定层对应的分段在第一数据库中目标数据表的数据与第二数据库中目标数据表的数据不同。
客户端210可以根据签名不一致的最细粒度的分段,对两个数据库的目标数据表在该分段内做一次小范围查询,读出来的数据在客户端210内部做一下字符串比较,即可得到详细的数据表的差异。本发明实施例也可以不进行详细的比较,只给出目标数据表的数据是否一致即可,本发明实施例对此不作限定。
图12示出了本发明实施例的设备500的示意性框图,设备500可以对应于本发明实施例的图3中所涉及的任一计算设备或服务器。如图12所示,设备500可以包括处理器510、存储器520和网络接口530。其中,处理器510可以用于执行本发明实施例的方法,存储器520可以用于存储处理器510所执行的代码,网络接口530用于与其他设备进行通信。图3的计算设备310还可以包括输出设备或与输出设备连接的输出接口,用于输出比较结果。输出设备可以包括显示器,打印机等等。设备500中的处理器、存储器和网络接口之间可以通过内部连接通路互相通信,传递控制和/或数据信号。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种比较数据表的数据的方法,其特征在于,所述方法应用于比较第一数据库和第二数据库的目标数据表的数据的系统,所述系统包括客户端和多个服务端,其中,所述第一数据库对应至少一个第一服务端,所述第二数据库对应至少一个第二服务端,所述方法包括:
所述客户端获取所述第一数据库中所述目标数据表的第一元数据和所述第二数据库中所述目标数据表的第二元数据,所述第一元数据中包括所述目标数据表的数据在所述第一数据库的服务器中所对应的第一范围,所述第二元数据中包括所述目标数据表的数据在所述第二数据库的服务器中所对应的第二范围;
所述客户端根据所述第一范围和所述第二范围中的至少一个,确定目标范围;
所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名;
所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名;
所述客户端根据所述第一签名和所述第二签名,确定所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据是否相同。
2.根据权利要求1所述的方法,其特征在于,所述第一数据库的每个服务器对应一个第一服务端,所述第一范围包括所述目标数据表的数据在所述第一数据库的每个服务器的子范围,所述第二数据库的每个服务器对应一个第二服务端,所述第二范围包括所述目标数据表的数据在所述第二数据库的每个服务器的子范围,所述客户端根据所述第一范围和所述第二范围中的至少一个,确定目标范围,包括:
所述客户端根据所述目标数据表的数据在所述第一数据库的每个服务器的子范围和所述目标数据表的数据在所述第二数据库的每个服务器的子范围,确定所述目标范围的子范围,每个所述子范围对应的数据在所述第一数据库中分布在一个服务器上,并且在所述第二数据库中分布在一个服务器上。
3.根据权利要求2所述的方法,其特征在于,在所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名之前,所述方法还包括:
所述客户端、所述至少一个第一服务端和所述至少一个第二服务端中的至少一种为每个所述子范围进行树型分段;
所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,包括:所述至少一个第一服务端根据所述树型分段,对所述第一数据库中目标数据表的数据的分段进行签名得到树型的所述第一签名;
所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名,包括:所述至少一个第二服务端根据所述树型分段,对所述第二数据库中目标数据表的数据的分段进行签名得到树型的所述第二签名。
4.根据权利要求3所述的方法,其特征在于,所述客户端根据所述第一签名和所述第二签名,确定所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据是否相同,包括:
所述客户端根据树型的所述第一签名和树型的所述第二签名,确定所述第一签名和所述第二签名的树的相同层的签名是否一致,当签名不一致时,确定所述层对应的分段在所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据不同。
5.根据权利要求3或4所述的方法,其特征在于,所述客户端、所述至少一个第一服务端和所述至少一个第二服务端中的至少一种为每个所述子范围进行树型分段,包括:
所述至少一个第一服务端和所述至少一个第二服务端对所述目标范围中数据的密度进行统计;
所述至少一个第一服务端和所述至少一个第二服务端根据统计的结果,为每个所述子范围进行树型分段。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述至少一个第一服务端根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,包括:所述至少一个第一服务端根据所述目标范围,通过哈希算法对所述第一数据库中目标数据表的数据进行签名得到第一签名;
所述至少一个第二服务端根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名,包括:所述至少一个第二服务端根据所述目标范围,通过哈希算法对所述第二数据库中目标数据表的数据进行签名得到第二签名。
7.一种比较数据表的数据的系统,其特征在于,所述系统用于比较第一数据库和第二数据库的目标数据表的数据,所述系统包括运行客户端的计算设备和运行服务端的多个服务器,其中,所述第一数据库包括运行第一服务端的至少一个第一服务器,所述第二数据库包括运行第二服务端的至少一个第二服务器:
所述计算设备用于获取所述第一数据库中所述目标数据表的第一元数据和所述第二数据库中所述目标数据表的第二元数据,所述第一元数据中包括所述目标数据表的数据在所述第一数据库的服务器中所对应的第一范围,所述第二元数据中包括所述目标数据表的数据在所述第二数据库的服务器中所对应的第二范围;
所述计算设备还用于根据所述第一范围和所述第二范围中的至少一个,确定目标范围;
所述至少一个第一服务器用于根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名;
所述至少一个第二服务器用于根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名;
所述计算设备还用于根据所述第一签名和所述第二签名,确定所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据是否相同。
8.根据权利要求7所述的系统,其特征在于,所述第一数据库中用于存储所述目标数据表的每个服务器均为运行所述第一服务端的所述第一服务器,所述第一范围包括所述目标数据表的数据在所述第一数据库的每个所述第一服务器的子范围,所述第二数据库中用于存储所述目标数据表的每个服务器均为运行所述第二服务端的所述第二服务器,所述第二范围包括所述目标数据表的数据在所述第二数据库的每个所述第二服务器的子范围,所述计算设备具体用于:
根据所述目标数据表的数据在所述第一数据库的每个所述第一服务器的子范围和所述目标数据表的数据在所述第二数据库的每个所述第二服务器的子范围,确定所述目标范围的子范围,每个所述子范围对应的数据在所述第一数据库中分布在一个服务器上,并且在所述第二数据库中分布在一个服务器上。
9.根据权利要求8所述的系统,其特征在于,在所述第一服务器根据所述目标范围,对所述第一数据库中目标数据表的数据进行签名得到第一签名,所述第二服务器根据所述目标范围,对所述第二数据库中目标数据表的数据进行签名得到第二签名之前,
所述计算设备、所述至少一个第一服务器和所述至少一个第二服务器中的至少一种用于为每个所述子范围进行树型分段;
所述至少一个第一服务器具体用于:根据所述树型分段,对所述第一数据库中目标数据表的数据的分段进行签名得到树型的所述第一签名;
所述至少一个第二服务器具体用于:根据所述树型分段,对所述第二数据库中目标数据表的数据的分段进行签名得到树型的所述第二签名。
10.根据权利要求9所述的系统,其特征在于,所述计算设备具体用于:
根据树型的所述第一签名和树型的所述第二签名,确定所述第一签名和所述第二签名的树的相同层的签名是否一致,当签名不一致时,确定所述层对应的分段在所述第一数据库中目标数据表的数据与所述第二数据库中目标数据表的数据不同。
11.根据权利要求9或10所述的系统,其特征在于,
所述至少一个第一服务器和所述至少一个第二服务器用于对所述目标范围中数据的密度进行统计;
所述至少一个第一服务器和所述至少一个第二服务器用于根据统计的结果,为每个所述子范围进行树型分段。
12.根据权利要求7至11中任一项所述的系统,其特征在于,所述至少一个第一服务器具体用于:根据所述目标范围,通过哈希算法对所述第一数据库中目标数据表的数据进行签名得到第一签名;
所述至少一个第二服务器具体用于:根据所述目标范围,通过哈希算法对所述第二数据库中目标数据表的数据进行签名得到第二签名。
CN201611260662.8A 2016-12-30 2016-12-30 比较数据表的数据的方法和系统 Active CN107070645B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201611260662.8A CN107070645B (zh) 2016-12-30 2016-12-30 比较数据表的数据的方法和系统
PCT/CN2017/108196 WO2018121025A1 (zh) 2016-12-30 2017-10-28 比较数据表的数据的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611260662.8A CN107070645B (zh) 2016-12-30 2016-12-30 比较数据表的数据的方法和系统

Publications (2)

Publication Number Publication Date
CN107070645A true CN107070645A (zh) 2017-08-18
CN107070645B CN107070645B (zh) 2020-06-16

Family

ID=59624007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611260662.8A Active CN107070645B (zh) 2016-12-30 2016-12-30 比较数据表的数据的方法和系统

Country Status (2)

Country Link
CN (1) CN107070645B (zh)
WO (1) WO2018121025A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018121025A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 比较数据表的数据的方法和系统
CN109739831A (zh) * 2018-11-23 2019-05-10 网联清算有限公司 数据库之间数据校验方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960613B (zh) * 2019-03-11 2023-05-12 中国银联股份有限公司 一种数据批处理的方法及装置
CN110287182B (zh) * 2019-05-05 2021-09-14 浙江吉利控股集团有限公司 一种大数据的数据对比方法、装置、设备及终端
CN112395276A (zh) * 2020-11-13 2021-02-23 中国人寿保险股份有限公司 一种数据比对方法及相关设备
CN112613808A (zh) * 2020-12-15 2021-04-06 嘉兴蓝匠仓储系统软件有限公司 一种使用rfid群读出入库物料的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646073A (zh) * 2013-12-11 2014-03-19 浪潮电子信息产业股份有限公司 一种基于HBase表的条件查询优化方法
US20140143206A1 (en) * 2012-11-19 2014-05-22 Compellent Technologies Confirming data consistency in a data storage environment
CN104077373A (zh) * 2014-06-24 2014-10-01 北京京东尚科信息技术有限公司 一种数据一致性校验方法
CN104111937A (zh) * 2013-04-18 2014-10-22 中兴通讯股份有限公司 主、备数据库及其数据一致性检测、修复方法和装置
CN105677645A (zh) * 2014-11-17 2016-06-15 阿里巴巴集团控股有限公司 一种数据表比对方法和装置
CN105988889A (zh) * 2015-02-11 2016-10-05 阿里巴巴集团控股有限公司 一种数据校验方法及装置
CN105989089A (zh) * 2015-02-12 2016-10-05 阿里巴巴集团控股有限公司 一种数据对比方法及装置
US20160378844A1 (en) * 2015-06-25 2016-12-29 International Business Machines Corporation Data synchronization using redundancy detection

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2457694B (en) * 2008-02-21 2012-09-26 Snell Ltd Method of Deriving an Audio-Visual Signature
US8744840B1 (en) * 2013-10-11 2014-06-03 Realfusion LLC Method and system for n-dimentional, language agnostic, entity, meaning, place, time, and words mapping
CN104391894A (zh) * 2014-11-11 2015-03-04 广州科腾信息技术有限公司 一种重复数据的检查处理方法
CN107070645B (zh) * 2016-12-30 2020-06-16 华为技术有限公司 比较数据表的数据的方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140143206A1 (en) * 2012-11-19 2014-05-22 Compellent Technologies Confirming data consistency in a data storage environment
CN104111937A (zh) * 2013-04-18 2014-10-22 中兴通讯股份有限公司 主、备数据库及其数据一致性检测、修复方法和装置
CN103646073A (zh) * 2013-12-11 2014-03-19 浪潮电子信息产业股份有限公司 一种基于HBase表的条件查询优化方法
CN104077373A (zh) * 2014-06-24 2014-10-01 北京京东尚科信息技术有限公司 一种数据一致性校验方法
CN105677645A (zh) * 2014-11-17 2016-06-15 阿里巴巴集团控股有限公司 一种数据表比对方法和装置
CN105988889A (zh) * 2015-02-11 2016-10-05 阿里巴巴集团控股有限公司 一种数据校验方法及装置
CN105989089A (zh) * 2015-02-12 2016-10-05 阿里巴巴集团控股有限公司 一种数据对比方法及装置
US20160378844A1 (en) * 2015-06-25 2016-12-29 International Business Machines Corporation Data synchronization using redundancy detection

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SAVAÚ ÖZKAN.ETC: "ENHANCED SPATIO-TEMPORAL VIDEO COPY DETECTION BY COMBINING TRAJECTORY AND SPATIAL CONSISTENCY", 《IEEE》 *
马莎等: "外包数据库中的哈希连接一致性算法", 《计算机科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018121025A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 比较数据表的数据的方法和系统
CN109739831A (zh) * 2018-11-23 2019-05-10 网联清算有限公司 数据库之间数据校验方法及装置

Also Published As

Publication number Publication date
CN107070645B (zh) 2020-06-16
WO2018121025A1 (zh) 2018-07-05

Similar Documents

Publication Publication Date Title
CN107070645A (zh) 比较数据表的数据的方法和系统
US11120026B1 (en) System and method for executing queries on multi-graphics processing unit systems
CN110113388B (zh) 一种基于改进型聚类算法的区块链系统共识的方法和装置
CN104317650B (zh) 一种面向Map/Reduce型海量数据处理平台的作业调度方法
JP5729466B2 (ja) 仮想マシン管理装置、仮想マシン管理方法、及び、プログラム
CN104601664B (zh) 一种云计算平台资源管理与虚拟机调度的控制系统
CN107291928A (zh) 一种日志存储系统和方法
CN106844041A (zh) 内存管理的方法及内存管理系统
WO2016118429A1 (en) System for efficient processing of transaction requests related to an account in a database
CN106407244A (zh) 基于多数据库的数据查询方法、系统和装置
CN103246549B (zh) 一种数据转存的方法及系统
CN106897409A (zh) 数据分库存储方法及装置
CN107124473A (zh) 云平台的构建方法及云平台
US11221890B2 (en) Systems and methods for dynamic partitioning in distributed environments
CN105007311A (zh) 一种基于云平台和云计算的资源管理系统和方法
US20150120736A1 (en) Data distributed search system, data distributed search method, and management computer
CN109471725A (zh) 资源分配方法、装置和服务器
CN108415912A (zh) 基于MapReduce模型的数据处理方法和设备
CN112764940A (zh) 多级分布式数据处理部署系统及其方法
CN106909556A (zh) 内存集群的存储均衡方法及装置
CN107276914B (zh) 基于cmdb的自助资源分配调度的方法
JP2011216029A (ja) 分散メモリデータベースシステム、データベースサーバ、データ処理方法およびそのプログラム
CN108345699A (zh) 获取多媒体数据的方法、装置及存储介质
CN110196880A (zh) 异构数据库数据同步方法和装置、存储介质及电子装置
CN114328587A (zh) 一种ndc报文分布式解析系统架构集成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220218

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right