CN107317886A - 一种基于大数据的数据同步方法及装置 - Google Patents

一种基于大数据的数据同步方法及装置 Download PDF

Info

Publication number
CN107317886A
CN107317886A CN201710718943.1A CN201710718943A CN107317886A CN 107317886 A CN107317886 A CN 107317886A CN 201710718943 A CN201710718943 A CN 201710718943A CN 107317886 A CN107317886 A CN 107317886A
Authority
CN
China
Prior art keywords
data source
access information
data
target data
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710718943.1A
Other languages
English (en)
Inventor
陈越晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710718943.1A priority Critical patent/CN107317886A/zh
Publication of CN107317886A publication Critical patent/CN107317886A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content

Abstract

本发明实施例提供了一种基于大数据的离线同步方法及装置,所述方法包括:当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问第一目标数据源所需的第一访问信息以参数的形式发送给Data Reader,DataReader依据该参数读取第一目标数据源中的待同步数据,并将该数据保存为第一数据抽象,依据预设的处理逻辑将第一数据抽象进行转换;将访问第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;DataWriter依据该参数将转换后的数据抽象写入第二目标数据源。因此,该过程无需用户手动的进行同步的不同数据源的不同接口类型中不断的切换,不仅操作简便而且节省了成本。

Description

一种基于大数据的数据同步方法及装置
技术领域
本发明涉及大数据处理领域,尤其涉及一种基于大数据的数据同步方法及装置。
背景技术
随着大数据技术的不断发展,当前各类数据存储服务层出不穷,例如:所述存储服务包括:关系型数据库Mysql、非关系型数据库HBase、数据仓库Hive、文件存储HDFS以及具有存储功能的文件索引服务Elasicsearch等。这些存储数据服务可能会应用到相同的存储数据,因此需要进行数据存储服务间的数据服务。
但是,现有技术中,不同类型的数据存储服务之间进行数据同步时,由于不同类型的数据存储服务的接口类型不同,因此需要在不同类型的数据存储服务的接口中不断切换,因此不仅操作过程繁琐、而且实现的成本较高。
发明内容
有鉴于此,本发明实施例提供了一种基于大数据的同步方法及装置,解决了现有技术中由于不同类型的数据存储服务的接口类型不同,需要在不同类型的数据存储服务的接口中不断切换的问题。
本发明实施例提供了一种基于大数据的同步方法,所述方法可以包括:
当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给Data Reader;
所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;
依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;
将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;
所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
优选的,所述将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给Data Reader,包括:
获取访问所述第一目标数据源的第一访问信息;
将所述第一访问信息转换成相对应的参数;
将所述第一访问信息相对应的参数发送给所述DataReader。
优选的,所述DataReader依据获得的所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步的数据保存为第一数据抽象,包括:
对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;
依据所述第一目标数据源的连接信息连接到所述第一目标数据源;
基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源中读取待同步的数据。
优选的,所述将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter,包括:
获取访问所述第二目标数据源所需的第二访问信息;
将所述第二访问信息转换成对应的参数;
将所述第二访问信息对应的参数发送给所述DataWriter。
优选的,所述DataWriter依据获所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源,包括:
将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;
依据所述第二目标数据源的连接信息连接到所述第二目标数据源;
依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所述第二目标数据源。
本发明实施例还提供了一种基于大数据的同步装置,所述装置可以包括:
第一发送单元,用于当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;
读取单元,用于所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;
转换单元,用于依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;
第二发送单元,用于将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;写入单元,用于所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
可选的,所述第一发送单元,包括:
第一获取单元,用于获取访问所述第一目标数据源的第一访问信息;
第一转换子单元,用于将所述第一访问信息转换成相对应的参数;
第一发送子单元,用于将所述第一访问信息相对应的参数发送给所述DataReader。
可选的,所述读取单元,包括:
第一解析子单元,用于对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;
第一连接子单元,用于依据所述第一目标数据源的连接信息连接到所述第一目标数据源;
读取子单元,用于基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源中读取待同步的数据。
可选的,所述第二发送单元,包括:
第二获取子单元,用于获取访问所述第二目标数据源所需的第二访问信息;
第二转换子单元,用于将所述第二访问信息转换成对应的参数;
第二发送子单元,用于将所述第二访问信息对应的参数发送给所述DataWriter。
可选的,所述写入单元,包括:
第二解析子单元,用于将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;
第二连接子单元,用于依据所述第二目标数据源的连接信息连接到所述第二目标数据源;
写入子单元,用于依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所述第二目标数据源。
本实施例中,当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader,所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;依据接收到的预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;其中,所述第一数据抽象和所述第二数据抽象为所述Data Reader和所述DataWriter通用的数据抽象;所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。因此,DataReader从第一目标数据源获取了待同步数据后,可以直接由DataWriter写入到第二目标数据源中,该过程无需用户手动的在第一目标数据源和第二目标数据源的不同接口类型中不断的切换,不仅操作简便而且节省了成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于大数据的离线同步方法的流程示意图;
图2为本发明实施例提供的一种基于大数据的离线同步装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参考图1,示出了本发明实施例一种基于大数据的同步方法,在本实施例中,所述方法可以包括:
S101:当接收到所述第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;
本实施例中,第一目标数据源和第二目标数据源可以是不同类型的数据存储服务,其中,所述第一目标数据和第二目标数据分别可以包括:关系型数据库Mysql、非关系型数据库HBase、数据仓库Hive、文件存储HDFS以及具有存储功能的文件索引服务Elasicsearch等。
本实施例中,需要说明的是,发起第一目标数据源与第二目标数据源进行数据同步指令的执行者可以是用户。
本实施例中,当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,DataReader就会获知从哪个数据源读取待同步的数据,但是在获取所述待同步数据之前,DataReader需要通过S101获知如何访问第一目标数据源,即获知访问第一目标数据源的第一访问信息。
其中,具体的,S101中,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader,可以包括:
获取访问所述第一目标数据源的第一访问信息;
将所述第一访问信息转换成相对应的参数;
将所述第一访问信息相对应的参数发送给所述DataReader。
本实施例中,访问所述第一目标数据源所需的第一访问信息可以包括:第一目标数据源的类型和第一目标数据源的连接信息。其中,所述第一目标数据源的类型可以包括:关系型数据库Mysql、非关系型数据库HBase、数据仓库Hive、文件存储HDFS以及具有存储功能的文件索引服务Elasicsearch等;所述第一目标数据源的连接信息可以包括:第一目标数据源的访问地址、第一目标数据源的端口信息、第一目标数据源的用户名及密码等。
本实施例中,所述第一访问信息中不同的信息可以转换成不同的参数,例如:参数sink表示的是数据源类型、mode表示的是数据的写入方式、specific表示的是不同类型数据源的参数配置情况,其中,对于MySQL类型的数据源的参数配置情况例如可以参看如下的表1:
表1
本实施例中,所述第一目标数据源的访问信息可以有多种来源,例如,可以是从所述第一目标数据源中获得的,也可以是已保存好的,其中对于已保存好的,还可以有两种方式:一种是曾经从所述第二目标数据源中获得的,然后进行了保存,以便以后进行数据同步时使用,也可以是技术人员预先设置的。
S102:所述DataReader依据获得的所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步的数据保存为第一数据抽象。
其中,S102具体可以包括:
对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;
依据所述第一目标数据源的连接信息连接到所述第一目标数据源;
基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源的中读取待同步的数据。
本实施例中,从上文S101中可以得知,所述第一访问信息可以包括第一目标数据源的类型和连接信息,发送给DataReader的数据是转换成参数的第一访问信息,因此DataReader若要知道如何去访问所述第一目标数据源,需要对所述第一访问信息对应的参数进行解析,从而得到所述第一目标数据源的类型和连接信息。
本实施例中,第一目标数据源的连接信息可以包括:第一目标数据源的访问地址、第一目标数据源的端口信息、第一目标数据源的用户名及密码等。DataReader可以依据获知的这些连接信息,与所述第一目标数据源进行连接。
本实施例中,不同的数据类型可以具有不同的接口类型,DataReader在获知第一目标数据源的接口类型时,可以切换到访问该种接口类型兼容的方式访问第一目标数据源中待同步的数据。
S103:依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的。
本实施例中,当用户需要将第一目标数据源中的待同步数据同步到第二目标数据源中时,获取到的第一目标数据源的数据不一定全部都是用户需要的,即不一定要将获取到的所有的待同步的数据写入到第二目标数据源中,或者获取到的待同步的数据的格式不一定是用户需要的,即在将获取到的待同步的数据写入到第二目标数据源时,不一定就按照获取到的待同步的数据的格式。因此,在将获取到的所述待同步的数据写入到第二目标数据源之前,可以先将所述待同步的数据进行转换,具体如何转换,可以依据用户的需求,也就是说用户可以自定义的设置数据转换的处理逻辑,然后可以按照用户设置的处理逻辑将所述第一数据抽象转换成第二数据抽象。
举例说明:用户自定义的处理逻辑可以包括:对所述第一数据抽象进行筛选、格式变换、聚合等,其中,对所述第一数据抽象进行筛选,例如:第一数据抽象中数据可以包括:某个地区的温度、降雨情况、空气指数、污染物浓度等,但是目标用户只需要用到温度和降雨情况,因此可以将控制指数和污染物浓度等数据丢弃掉,即得到的第二数据抽象中只包括某个地区的温度和降雨情况;对所述第一数据抽象进行格式变换,例如:当第一数据抽象中数据可以包括:某个地区的温度、降雨情况、空气指数、污染物浓度等,但是所述数据抽象中温度是用摄氏度表示的,而用户需要用开尔文的形式表示,因此,可以将第一数据抽象中的温度数据进行转换;对所述第一数据抽象进行聚合,例如:第一数据抽象中数据可以包括:某个地区的温度、降雨情况、空气指数、污染物浓度等,若用户需要将空气指数和污染物浓度进行聚合,得到的第二数据抽象中,空气指数和污染物浓度为经过聚合后的数据形式。
本实施例中,需要说明的是,用户自定义的处理逻辑不是仅仅只进行一项操作,例如:用户可以同时执行筛选、格式变换和聚合中的多个操作。
S104:将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;
本实施例中,需要说明的是,DataReader和DataWriter之间传递的数据抽象是通用的,具体的,保存的第一数据抽象和转换后的第二数据抽象是Data Reader和DataWriter中可以兼容的数据抽象。
本实施例中,S104具体可以包括:
获取访问所述第二目标数据源所需的第二访问信息;
将所述第二访问信息转换成对应的参数;
将所述第二访问信息对应的参数发送给所述Data Writer。
本实施例中,访问所述第二目标数据源所需的第二访问信息可以包括:
第二目标数据源的类型和第二目标数据源的连接信息。其中,所述第二目标数据源的类型可以包括:关系型数据库Mysql、非关系型数据库HBase、数据仓库Hive、文件存储HDFS以及具有存储功能的文件索引服务Elasicsearch等;所述第二目标数据源的连接信息可以包括:第二目标数据源的访问地址、第二目标数据源的端口信息、第二目标数据源的用户名及密码等。
本实施例中,第二访问信息中不同的数据可以用不同的参数进行表示,例如:参数sink表示的是数据源类型、mode表示的是数据的写入方式、specific表示的是不同类型数据源的参数配置情况,其中,对于MySQL类型的数据源的参数配置情况例如可以参看如上的表1所示。
本实施例中,所述第二目标数据源的访问信息可以有多种来源,例如,可以是从所述第二目标数据源中获得的,也可以是已保存好的,其中对于已保存好的,还可以有两种方式:一种是曾经从所述第二目标数据源中获得的,然后进行了保存,以便下一次使用,也可以是技术人员设置的。
因此,当出现新的目标数据源时,只需要将所述目标数据源的信息进行保存,进行数据同步时,可以直接应用保存到新的目标数据源的信息,进行数据同步。
S105:所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
本实施例中,S105具体可以包括:
将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;
依据所述第二目标数据源的连接信息连接到所述第二目标数据源;
依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所述第二目标数据源。
本实施例中,从上文S104中可以得知,所述第一访问信息可以包括第一目标数据源的类型和连接信息,发送给DataWriter的数据是转换成参数的第二访问信息,因此DataReader若要知道如何访问所述第二目标数据源,进而将所述第二数据抽象写入到第二目标数据源中,需要对所述第二访问信息对应的参数进行解析,从而得到所述第二目标数据源的类型和连接信息。
本实施例中,第二目标数据源的连接信息可以包括:第二目标数据源的访问地址、第二目标数据源的端口信息、第二目标数据源的用户名及密码等。DataReader可以依据获知的这些连接信息,与所述第二目标数据源进行连接。
本实施例中,不同的数据类型可以具有不同的接口类型,DataReader在获知第二目标数据源的接口类型时,可以切换到访问该种接口类型兼容的方式将所述第二数据抽象写入到所述第二目标数据源中。
本实施例中,当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader,所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;依据接收到的预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;其中,所述第一数据抽象和所述第二数据抽象为所述DataReader和所述DataWriter通用的数据抽象;所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。这样,DataReader从第一目标数据源获取了待同步数据后,可以直接由DataWriter写入到第二目标数据源中,该过程无需用户手动的在第一目标数据源和第二目标数据源的不同接口类型中不断的切换,不仅操作简便而且节省了成本。
参考图2,示出了本发明实施例提供的一种基于大数据的离线同步装置的结构示意图,在本实施例中,所述装置可以包括:
第一发送单元201,用于当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;
读取单元202,用于所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;
转换单元203,用于依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;
第二发送单元204,用于将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;
写入单元205,用于所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
可选的,所述第一发送单元,包括:
第一获取单元,用于获取访问所述第一目标数据源的第一访问信息;
第一转换子单元,用于将所述第一访问信息转换成相对应的参数;
第一发送子单元,用于将所述第一访问信息相对应的参数发送给所述DataReader。
可选的,所述读取单元,包括:
第一解析子单元,用于对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;
第一连接子单元,用于依据所述第一目标数据源的连接信息连接到所述第一目标数据源;
读取子单元,用于基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源中读取待同步的数据。
可选的,所述第二发送单元,包括:
第二获取子单元,用于获取访问所述第二目标数据源所需的第二访问信息;
第二转换子单元,用于将所述第二访问信息转换成对应的参数;
第二发送子单元,用于将所述第二访问信息对应的参数发送给所述DataWriter。
可选的,所述写入单元,包括:
第二解析子单元,用于将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;
第二连接子单元,用于依据所述第二目标数据源的连接信息连接到所述第二目标数据源;
写入子单元,用于依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所述第二目标数据源。
本实施例中,通过本实施例提供的装置,当该装置接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,通过DataReader读取所述第一目标数据源中待同步的数据并保存为数据抽象,通过该装置将该数据抽象转换后,通过DataWriter将转换后的数据抽象写入到第二目标数据源中,该过程无需用户手动的在第一目标数据源和第二目标数据源的不同接口类型中不断的切换,不仅操作简便而且节省了成本。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于大数据的同步方法,其特征在于,所述方法包括:
当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;
所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;
依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;
将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;
所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
2.根据权利要求1所述的方法,其特征在于,所述将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader,包括:
获取访问所述第一目标数据源的第一访问信息;
将所述第一访问信息转换成相对应的参数;
将所述第一访问信息相对应的参数发送给所述DataReader。
3.根据权利要求1所述的方法,其特征在于,所述Data Reader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步的数据保存为第一数据抽象,包括:
对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;
依据所述第一目标数据源的连接信息连接到所述第一目标数据源;
基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源中读取所述待同步的数据。
4.根据权利要求1所述的方法其特征在于,所述将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter,包括:
获取访问所述第二目标数据源所需的第二访问信息;
将所述第二访问信息转换成对应的参数;
将所述第二访问信息对应的参数发送给所述DataWriter。
5.根据权利要求1所述的方法,其特征在于,所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源,包括:
将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;
依据所述第二目标数据源的连接信息连接到所述第二目标数据源;
依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所述第二目标数据源。
6.一种基于大数据的同步装置,其特征在于,所述装置包括:
第一发送单元,用于当接收到将第一目标数据源与第二目标数据源进行数据同步的指令后,将访问所述第一目标数据源所需的第一访问信息以参数的形式发送给DataReader;
读取单元,用于所述DataReader依据所述第一访问信息对应的参数,从所述第一目标数据源中读取待同步的数据,并将所述待同步数据保存为第一数据抽象;
转换单元,用于依据预设的处理逻辑将所述第一数据抽象转换成第二数据抽象;其中,所述预设的处理逻辑为用户自定义设置的;
第二发送单元,用于将访问所述第二目标数据源所需的第二访问信息以参数的形式发送给DataWriter;写入单元,用于所述DataWriter依据所述第二访问信息对应的参数,将所述第二数据抽象写入所述第二目标数据源。
7.根据权利要求6所述的装置,其特征在于,所述第一发送单元,包括:
第一获取单元,用于获取访问所述第一目标数据源的第一访问信息;
第一转换子单元,用于将所述第一访问信息转换成相对应的参数;
第一发送子单元,用于将所述第一访问信息相对应的参数发送给所述DataReader。
8.根据权利要求6所述的装置,其特征在于,所述读取单元,包括:
第一解析子单元,用于对接收到的第一访问信息对应的参数进行解析,获得所述第一目标数据源的类型和连接信息;
第一连接子单元,用于依据所述第一目标数据源的连接信息连接到所述第一目标数据源;
读取子单元,用于基于所述第一目标数据源的类型获得所述第一目标数据源的接口类型,并依据所述第一目标数据源的接口类型从所述第一目标数据源中读取待同步的数据。
9.根据权利要求6所述的装置,其特征在于,所述第二发送单元,包括:
第二获取子单元,用于获取访问所述第二目标数据源所需的第二访问信息;
第二转换子单元,用于将所述第二访问信息转换成对应的参数;
第二发送子单元,用于将所述第二访问信息对应的参数发送给所述DataWriter。
10.根据权利要求1所述的装置,其特征在于,所述写入单元,包括:
第二解析子单元,用于将所述第二访问信息对应的参数进行解析,获得所述第二目标数据源的类型和连接信息;
第二连接子单元,用于依据所述第二目标数据源的连接信息连接到所述第二目标数据源;
写入子单元,用于依据所述第二目标数据源的类型,获取所述第二目标数据源的接口类型,并依据所述第二目标数据源的接口类型,通过所述DataWriter将所述第二数据抽象写入到所述第二目标数据源。
CN201710718943.1A 2017-08-21 2017-08-21 一种基于大数据的数据同步方法及装置 Pending CN107317886A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710718943.1A CN107317886A (zh) 2017-08-21 2017-08-21 一种基于大数据的数据同步方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710718943.1A CN107317886A (zh) 2017-08-21 2017-08-21 一种基于大数据的数据同步方法及装置

Publications (1)

Publication Number Publication Date
CN107317886A true CN107317886A (zh) 2017-11-03

Family

ID=60176268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710718943.1A Pending CN107317886A (zh) 2017-08-21 2017-08-21 一种基于大数据的数据同步方法及装置

Country Status (1)

Country Link
CN (1) CN107317886A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633313A (zh) * 2018-05-31 2019-12-31 贵州白山云科技股份有限公司 一种基于多数据源的数据传输方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915377A (zh) * 2012-11-14 2013-02-06 深圳市宏电技术股份有限公司 数据库转换或同步方法及系统
CN103020071A (zh) * 2011-09-22 2013-04-03 中兴通讯股份有限公司 数据同步方法及装置
CN106469158A (zh) * 2015-08-17 2017-03-01 杭州海康威视系统技术有限公司 数据同步方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020071A (zh) * 2011-09-22 2013-04-03 中兴通讯股份有限公司 数据同步方法及装置
CN102915377A (zh) * 2012-11-14 2013-02-06 深圳市宏电技术股份有限公司 数据库转换或同步方法及系统
CN106469158A (zh) * 2015-08-17 2017-03-01 杭州海康威视系统技术有限公司 数据同步方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633313A (zh) * 2018-05-31 2019-12-31 贵州白山云科技股份有限公司 一种基于多数据源的数据传输方法及装置

Similar Documents

Publication Publication Date Title
CN100499938C (zh) 短消息拆分提示方法及装置
CN103634177B (zh) 基于网络业务的组态实现方法和系统
CN104239315A (zh) 一种图片关联的方法
CN103927314B (zh) 一种数据批量处理的方法和装置
CN102368261A (zh) 一种可扩展的运维报表生成方法
CN105227495B (zh) 用于软件定义网络的转发规则配置方法及装置
CN107911249A (zh) 一种网络设备的命令行发送方法、装置和设备
CN107241221A (zh) 支持不同网管协议的网管协议数据统一处理系统及方法
CN106095923A (zh) 一种在有序榜单中添加上榜数据的方法及系统
CN104144069B (zh) 无线侧呼叫数据记录与用户业务行为关联的方法和装置
CN109408468A (zh) 文件处理方法和装置、计算设备及存储介质
CN105488014B (zh) Xml格式的接口测试案例报文的生成方法和装置
CN110413839A (zh) 一种图像采集设备的标签数据共享方法、装置和设备
CN104836686B (zh) 一种生成服务器的配置文件的方法及装置
CN109377383A (zh) 产品数据同步方法、装置、计算机设备及存储介质
CN104243360B (zh) 一种转发链路的配置方法和装置
CN101583204B (zh) 一种实现通用联合电路卡多应用文件管理的方法及系统
CN107317886A (zh) 一种基于大数据的数据同步方法及装置
CN105007310A (zh) 信息同步方法、装置和系统
CN104536852B (zh) 数据恢复方法及装置
CN109697281A (zh) 在线合并文档的方法、装置及电子设备
CN108429764A (zh) 一种基于私有协议的数据传输和解析的方法
CN108959649A (zh) 一种基于web页面的数据表字段映射配置方法和系统
CN107086960A (zh) 一种报文传输方法和装置
CN104753891A (zh) 一种xml报文解析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171103