CN106599197A - 数据采集交换引擎 - Google Patents

数据采集交换引擎 Download PDF

Info

Publication number
CN106599197A
CN106599197A CN201611155430.6A CN201611155430A CN106599197A CN 106599197 A CN106599197 A CN 106599197A CN 201611155430 A CN201611155430 A CN 201611155430A CN 106599197 A CN106599197 A CN 106599197A
Authority
CN
China
Prior art keywords
data
data acquisition
executor
exchange
exchange tool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611155430.6A
Other languages
English (en)
Other versions
CN106599197B (zh
Inventor
王志安
张伟
田海均
谭红涛
胡均
谢佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tydic Information Technology Co ltd
Original Assignee
Shenzhen Tydic Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tydic Information Technology Co ltd filed Critical Shenzhen Tydic Information Technology Co ltd
Priority to CN201611155430.6A priority Critical patent/CN106599197B/zh
Publication of CN106599197A publication Critical patent/CN106599197A/zh
Application granted granted Critical
Publication of CN106599197B publication Critical patent/CN106599197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供一种数据采集交换引擎,其根据数据采集交换的特点设置配置参数,用户根据需求在控制中心填写配置参数,控制中心即可根据预设的编译规则自动将用户填写的配置参数编译成配置程序,再依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器,并通过通讯与协调模块将配置程序从控制中心发送到选定的执行器,再由所述执行器将配置程序编译成选定的数据交换工具能够识别的执行程序,利用该执行程序驱动选定的数据交换工具进行数据采集交换,将来源数据模型中数据的采集交换到目标数据模型中,通过智能选择数据交换工具,自动完成数据采集交换,能够简化用户操作,降低数据采集交换难度,提升数据采集交换效率。

Description

数据采集交换引擎
技术领域
本发明涉及大数据技术领域,尤其涉及一种数据采集交换引擎。
背景技术
信息科技经过60多年的发展,已渗透到各行业的方方面面。政治、经济活动中很大一部分的活动都与数据的创造、采集、传输和使用相关,随着网络应用日益深化,大数据应用的影响日益扩大。根据机构测算,全世界数据总量以每两年翻一番的速度递增。换句话说,最近两年产生的数据总量相当于人类有史以来所有数据量的总和。在这个背景下,从公司战略到产业生态,从学术研究到生产实践,从城镇管理乃至国家治理,都将发生本质的变化。
大数据指的是大小超出常规的数据工具获取、存储、管理和分析能力的数据集,并不是说一定要超过特定TB值得数据集才能算是大数据。国际数据公司(IDC)从四个特征定义大数据,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)和巨大的数据价值(Value)。大数据几乎渗透到国民经济的所有部门,应用领域涉及信息服务、智慧城市、金融、制造业、国家安全和科学研究等。
随时时代的发展,大数据数据处理和存储引擎不断增多,一种大数据引擎往往满足于某一场景的需求,比如hdfs做分布式文件存储,hive做批处理,hbase做清单查询,redis做内存数据库等。每种引擎都有缺点,比如:hive不适合在线分析查询,redis不适合做大数据量的存储,hbase不适合做批处理分析,大数据平台往往是各种引擎组合在一起,互取所长,共同完成一个大数据处理系统。这样的背景下,数据往往会冗余存储于hive、hbase、redis、ftp、hdfs、sftp、elasticsearch、oracle、以及mysql等各个不同数据环境中,因此,各个引擎之间数据的采集交换也就显得尤为重要。
目前,主流的数据采集交换工具有datax、sqoop、flume以及embulk等,其中,DataX是一个在异构的数据库/文件系统之间高速交换数据的工具,实现了在任意的数据处理系统(RDBMS/Hdfs/Local filesystem)之间的数据交换,Sqoop是协助用户在RDBMS与Hadoop之间进行高效的大数据交流的数据交换工具,用户可以在Sqoop的帮助下,可以轻松地把关系型数据库的数据导入到Hadoop与其相关的系统(如HBase和Hive)中,同时也可以把数据从Hadoop系统里抽取并导出到关系型数据库里。Flume是一个能够将不同数据源的海量日志数据进行高效收集、聚合和移动,最后存储到一个中心化数据存储系统中的数据交换工具。Embulk是一个开源的批量数据交换工具,用来在不同数据库、存储设备、文件格式以及云服务间转移数据。
上述的各种数据交换工具的使用方法各有不同,擅长的数据交换场景也各有不同,Sqoop采用shell命令方式,datax采用配置文件,flume采用conf配置文件,原理深奥,各工具学习成本较高,如遇到问题,需了解其底层原理进行调试,如使用sqoop,需了解大数据相关技术,对企业一般实施人员,技术要求过高。同时,对于一种交换场景,比如oracle交换数据到hive,sqoop、datax以及embulk都可以支持这种交换,此时,那什么时候该用什么工具,用什么引擎最合适最高效,经验不丰富的技术人员往往一时难以判断。而且开源交换引擎支持的场景过于重复,很多场景还未覆盖到。因此需要一种既能使用开源交换引擎的能力,又能补充交换能力,并且具有统一交换配置的工具来解决上述问题。
发明内容
本发明的目的在于提供一种数据采集交换引擎,能够以统一的配置根据用户需求智能选择数据交换工具,自动完成数据采集交换,简化用户操作,降低数据采集交换难度,提升数据采集交换效率。
为实现上述目的,本发明提供了一种数据采集交换引擎,用于异构数据环境之间的数据转移交换,包括:控制中心、与所述控制中心关联的通讯与协调模块,以及与所述通讯与协调模块关联的若干个执行器;
每一个执行器中设有至少一种数据交换工具;
所述控制中心用于提供可视化界面供用户填写用于数据采集交换的配置参数,并根据预设的编译规则自动将用户填写的配置参数编译成配置程序,再依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器;所述配置参数至少包括:来源数据模型、以及目标数据模型;
所述通讯与协调模块用于控制中心与执行器之间的分布式通讯与协调,从控制中心接收配置程序,将配置程序中的配置参数和需要执行的任务发送到选定的执行器;
所述执行器用于从通讯与协调模块接收根据配置程序得到的配置参数和任务,并将配置参数编译成选定的数据交换工具能够识别的执行程序,利用该执行程序驱动选定的数据交换工具进行数据采集交换,将来源数据模型中数据的采集交换到目标数据模型中。
所述数据交换工具包括:DataX、Sqoop、Embulk、以及Flume。
所述数据交换工具还包括:用户按照所述数据采集交换引擎预设的接口标准自定义的数据交换工具。
所述来源数据模型以及目标数据模型为数据库表、文件或消息流。
所述来源数据模型以及目标数据模型有一个为数据库表时,所述配置参数还包括字段映射规则。
所述数据库表的存储介质包括:oracle数据库、mysql数据库、db2数据库、redis数据库、mongodb数据库、hive大数据平台、hbase大数据平台、以及elasticsearch大数据平台;
所述文件的文件系统或文件传输协议包括:FTP传输协议、SFTP传输协议、以及HDFS分布式文件系统;
所述消息流消息中间件包括:kafka消息中间件、以及Apache ActiveMQ消息中间件。
所述控制中心依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器时首先根据配置程序识别交换任务的类型,然后匹配支持该类交换任务的数据交换工具,接着根据该交换任务的能力要求和是否有可供使用的执行器选定一种数据交换工具以及安装有该数据交换工具的执行器。
当所述选定的数据交换工具为Sqoop时,所述执行器将配置程序编译为Sqoop命令,并提交Shell脚本在服务器执行,从而驱动Sqoop进行数据采集交换;
当所述选定的数据交换工具为DataX时,所述执行器将配置程序编译为dataxJson配置文件,将文件保存在临时目录,用python命令启动,传入配置文件路径驱动DataX进行数据采集交换;
当所述选定的数据交换工具为Flume时,所述执行器将配置程序编译为flumeconf配置文件,将文件保存在临时目录,判断对应的flume-ng是否启动,如启动则驱动Flume进行数据采集交换,如未启动,则组装shell命令启动flume-ng驱动Flume进行数据采集交换;
当所述选定的数据交换工具为Embulk时,所述执行器将配置程序编译为Embulk配置文件,将文件保存在临时目录,用shell命令启动,传入配置文件路径驱动Embulk进行数据采集交换。
所述执行器还实时监控执行过程并输出执行日志。
所述通讯与协调模块为Zookeeper。
本发明的有益效果:本发明提供一种数据采集交换引擎,其根据数据采集交换的特点设置配置参数,用户根据需求在控制中心填写配置参数,控制中心即可根据预设的编译规则自动将用户填写的配置参数编译成配置程序,再依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器,并通过通讯与协调模块将配置程序从控制中心发送到选定的执行器,再由所述执行器将配置程序编译成选定的数据交换工具能够识别的执行程序,利用该执行程序驱动选定的数据交换工具进行数据采集交换,将来源数据模型中数据的采集交换到目标数据模型中,通过智能选择数据交换工具,自动完成数据采集交换,能够简化用户操作,降低数据采集交换难度,提升数据采集交换效率。
附图说明
为了能更进一步了解本发明的特征以及技术内容,请参阅以下有关本发明的详细说明与附图,然而附图仅提供参考与说明用,并非用来对本发明加以限制。
附图中,
图1为本发明的数据采集交换引擎的结构图;
图2为本发明的数据采集交换引擎进行数据库表配置的界面图。
图3为本发明的数据采集交换引擎进行文件配置的界面图;
图4为本发明的数据采集交换引擎进行消息流配置的界面图。
具体实施方式
为更进一步阐述本发明所采取的技术手段及其效果,以下结合本发明的优选实施例及其附图进行详细描述。
请参阅图1,本发明提供一种数据采集交换引擎,用于异构数据环境之间的数据转移交换,包括:控制中心1、与所述控制中心1关联的通讯与协调模块2,以及与所述通讯与协调模块2关联的若干个执行器3。
具体地,每一个执行器3中设有至少一种数据交换工具,所述数据交换工可以为:DataX、Sqoop、Embulk、或Flume等。
具体地,所述控制中心1用于提供可视化界面供用户填写用于数据采集交换的配置参数,并根据预设的编译规则自动将用户填写的配置参数编译成配置程序,再依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器3。
具体地,所述控制中心1依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器3时首先根据配置程序识别交换任务的类型,然后匹配支持该类交换任务的数据交换工具,接着根据该交换任务的能力要求和是否有可供使用的执行器3选定一种数据交换工具以及安装有该数据交换工具的执行器3。详细过程为:先进行交换场景识别,即识别交换任务的类型,从什么库/环境交换什么库/环境,比如将数据从oracle采集到hive,接着匹配引擎列表,即匹配支持该类交换任务的引擎列表,比如Sqoop、DataX、和Embulk都支持从oracle导数到hive,然后进行能力项匹配:判断任务的要求(比如文件是否加解压,是否要求高并发)并根据任务的要求进行引擎过滤,例如任务要求高并发,而Embulk为轻量级单机版,过滤Embulk;接着进行部署信息过滤:即判定是否有执行器3中设有且当前可运行目前选定的数据交换工具,并进行过滤;例如判断没有执行器3中设有Sqoop或者当前没有可运行Sqoop的执行器3,则过滤Sqoop;然后进行连接测试:测试安装有目前选定的数据交换工具的执行器3是否都可以连接到来源数据和目标数据,若不能连接则剔除,最后对剩余的执行器3根据每个执行器3执行的历史记录、时间、效率、以及失败次数对执行器3进行评分,按照评分从高到低排序。
进一步地,所述配置参数至少包括:来源数据模型、以及目标数据模型,所述来源数据模型以及目标数据模型为数据库表、文件、或消息流,其中,所述数据库表的存储介质可以为oracle数据库、mysql数据库、或db2数据等传统关系型数据库、也可以为redis数据库、或mongodb数据库等NOSQL数据库,还可以为hive、hbase、以及elasticsearch等大数据平台;所述文件的文件系统或文件传输协议包括:FTP传输协议、SFTP传输协议、以及HDFS分布式文件系统等;所述消息流消息中间件包括:kafka消息中间件、以及Apache ActiveMQ等消息中间件。
具体地,请参阅图2,配置数据库表时,需要填写的内容包括数据表的物理名称、以及数据源,请参阅图3,配置文件时,需要填写的内容包括:存储路径、文件名、存储类型(如TXT)、数据连接方式(如FTP-133.37.253.23)、以及编码(如UTF-8),请参阅图4,配置消息流时,需要填写的内容包括:标题、以及数据连接方式。此外,配置数据库表还可以填写业务分类和中文名称,配置文件时还可以填写压缩方式、和分隔符,配置消息流时还可以填写分隔符。
需要说明的是,若是文件到文件的数据采集交换,则配置完来源数据模型、以及目标数据模型后即可完成整个配置参数的填写,而当数据交换采集涉及到数据库表时还需要填写字段映射规则。与此同时,根据需要还可以有更多配置,例如配置采集SQL(StructuredQuery Language,结构化查询语言),配置整个任务的并发模式,配置过滤条件,配置程序运行时的动态参数等,其中,配置程序运行时的动态参数时,参数来源可以来源于关系型数据库的一个SQL。
所述通讯与协调模块2用于控制中心1与执行器3之间的分布式通讯与协调,从控制中心1接收配置程序,将配置程序中的配置参数和需要执行的任务发送到选定的执行器3,具体地,所述通讯与协调模块2为Zookeeper。
所述执行器3用于从通讯与协调模块接收由配置程序得到的配置参数和任务,并将配置参数编译成选定的数据交换工具能够识别的执行程序,利用该执行程序驱动选定的数据交换工具进行数据采集交换,将来源数据模型中的数据采集交换到目标数据模型中,同时所述执行器3还实时监控执行过程并输出执行日志。
可选地,所述数据交换工具包括但不限于:DataX、Sqoop、Embulk、以及Flume等,此外,该数据交换工具还可以为:用户按照所述数据采集交换引擎预设的接口标准自定义的数据交换工具。
详细地,当所述选定的数据交换工具为Sqoop时,所述执行器3将配置程序编译为Sqoop命令,并提交Shell脚本在服务器执行,从而驱动Sqoop进行数据采集交换;
当所述选定的数据交换工具为DataX时,所述执行器3将配置程序编译为dataxJson配置文件,将文件保存在临时目录,用python命令启动,传入配置文件路径驱动DataX进行数据采集交换;
当所述选定的数据交换工具为Flume时,所述执行器3将配置程序编译为flumeconf配置文件,将文件保存在临时目录,判断对应的flume-ng是否启动,如启动则驱动Flume进行数据采集交换,如未启动,则组装shell命令启动flume-ng驱动Flume进行数据采集交换;
当所述选定的数据交换工具为Embulk时,所述执行器3将配置程序编译为Embulk配置文件,将文件保存在临时目录,用shell命令启动,传入配置文件路径驱动Embulk进行数据采集交换。
综上所述,本发明提供一种数据采集交换引擎,其根据数据采集交换的特点设置配置参数,用户根据需求在控制中心填写配置参数,控制中心即可根据预设的编译规则自动将用户填写的配置参数编译成配置程序,再依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器,并通过通讯与协调模块将配置程序从控制中心发送到选定的执行器,再由所述执行器将配置程序编译成选定的数据交换工具能够识别的执行程序,利用该执行程序驱动选定的数据交换工具进行数据采集交换,将来源数据模型中数据的采集交换到目标数据模型中,通过智能选择数据交换工具,自动完成数据采集交换,能够简化用户操作,降低数据采集交换难度,提升数据采集交换效率。
以上所述,对于本领域的普通技术人员来说,可以根据本发明的技术方案和技术构思作出其他各种相应的改变和变形,而所有这些改变和变形都应属于本发明权利要求的保护范围。

Claims (10)

1.一种数据采集交换引擎,其特征在于,用于异构数据环境之间的数据转移交换,包括:控制中心(1)、与所述控制中心(1)关联的通讯与协调模块(2),以及与所述通讯与协调模块(2)关联的若干个执行器(3);
每一个执行器(3)中设有至少一种数据交换工具;
所述控制中心(1)用于提供可视化界面供用户填写数据采集交换的配置参数,并根据预设的编译规则自动将用户填写的配置参数编译成配置程序,再依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器(3);所述配置参数至少包括:来源数据模型、以及目标数据模型;
所述通讯与协调模块(2)用于控制中心(1)与执行器(3)之间的分布式通讯与协调,从控制中心(1)接收配置程序,将配置程序中的配置参数和需要执行的任务发送到选定的执行器(3);
所述执行器(3)用于从通讯与协调模块(2)接收根据配置程序得到的配置参数和需要执行的任务,并将配置参数编译成选定的数据交换工具能够识别的执行程序,利用该执行程序驱动选定的数据交换工具进行数据采集交换,将来源数据模型中数据的采集交换到目标数据模型中。
2.如权利要求1所述的数据采集交换引擎,其特征在于,所述数据交换工具包括:DataX、Sqoop、Embulk、以及Flume。
3.如权利要求1所述的数据采集交换引擎,其特征在于,所述数据交换工具还包括:用户按照所述数据采集交换引擎预设的接口标准自定义的数据交换工具。
4.如权利要求1所述的数据采集交换引擎,其特征在于,所述来源数据模型以及目标数据模型为数据库表、文件或消息流。
5.如权利要求4所述的数据采集交换引擎,其特征在于,所述来源数据模型以及目标数据模型中有一个为数据库表时,所述配置参数还包括字段映射规则。
6.如权利要求4所述的数据采集交换引擎,其特征在于,所述数据库表的存储介质包括:oracle数据库、mysql数据库、db2数据库、redis数据库、mongodb数据库、hive大数据平台、hbase大数据平台、以及elasticsearch大数据平台;
所述文件的文件系统或文件传输协议包括:FTP传输协议、SFTP传输协议、以及HDFS分布式文件系统;
所述消息流消息中间件包括:kafka消息中间件、以及Apache ActiveMQ消息中间件。
7.如权利要求1所述的数据采集交换引擎,其特征在于,所述控制中心(1)依据配置程序选定数据交换工具以及安装有该数据交换工具的执行器(3)时首先根据配置程序识别交换任务的类型,然后匹配支持该类交换任务的数据交换工具,接着根据该交换任务的能力要求和是否有可供使用的执行器(3)选定一种数据交换工具以及安装有该数据交换工具的执行器(3)。
8.如权利要求2所述的数据采集交换引擎,其特征在于,当所述选定的数据交换工具为Sqoop时,所述执行器(3)将配置程序编译为Sqoop命令,并提交Shell脚本在服务器执行,从而驱动Sqoop进行数据采集交换;
当所述选定的数据交换工具为DataX时,所述执行器(3)将配置程序编译为datax Json配置文件,将文件保存在临时目录,用python命令启动,传入配置文件路径驱动DataX进行数据采集交换;
当所述选定的数据交换工具为Flume时,所述执行器(3)将配置程序编译为flume conf配置文件,将文件保存在临时目录,判断对应的flume-ng是否启动,如启动则驱动Flume进行数据采集交换,如未启动,则组装shell命令启动flume-ng驱动Flume进行数据采集交换;
当所述选定的数据交换工具为Embulk时,所述执行器(3)将配置程序编译为Embulk配置文件,将文件保存在临时目录,用shell命令启动,传入配置文件路径驱动Embulk进行数据采集交换。
9.如权利要求1所述的数据采集交换引擎,其特征在于,所述执行器(3)还实时监控执行过程并输出执行日志。
10.如权利要求1所述的数据采集交换引擎,其特征在于,所述通讯与协调模块(2)为Zookeeper。
CN201611155430.6A 2016-12-14 2016-12-14 数据采集交换引擎 Active CN106599197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611155430.6A CN106599197B (zh) 2016-12-14 2016-12-14 数据采集交换引擎

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611155430.6A CN106599197B (zh) 2016-12-14 2016-12-14 数据采集交换引擎

Publications (2)

Publication Number Publication Date
CN106599197A true CN106599197A (zh) 2017-04-26
CN106599197B CN106599197B (zh) 2020-04-07

Family

ID=58801338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611155430.6A Active CN106599197B (zh) 2016-12-14 2016-12-14 数据采集交换引擎

Country Status (1)

Country Link
CN (1) CN106599197B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107682201A (zh) * 2017-10-26 2018-02-09 苏州市伏泰信息科技股份有限公司 环卫平台运维监控系统
CN107689999A (zh) * 2017-09-14 2018-02-13 北纬通信科技南京有限责任公司 一种云平台全自动计算方法及装置
CN108038182A (zh) * 2017-12-08 2018-05-15 浪潮软件股份有限公司 一种基于Flume的关系数据库存储数据的方法和装置
CN108536853A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于查询资源与精确度的自动路由数据库查询系统及方法
CN108829867A (zh) * 2018-06-22 2018-11-16 深圳云之家网络有限公司 一种大数据的智能采集方法及系统
CN108984603A (zh) * 2018-06-05 2018-12-11 试金石信用服务有限公司 异构数据采集方法、设备、存储介质及系统
CN109558392A (zh) * 2018-11-20 2019-04-02 南京数睿数据科技有限公司 一种跨平台多引擎支持的海量数据迁移装置
CN110032092A (zh) * 2018-12-03 2019-07-19 江苏省肿瘤医院 输液滴速监测精准管理系统及方法
CN110209731A (zh) * 2019-04-25 2019-09-06 深圳壹账通智能科技有限公司 数据同步方法、装置、及存储介质、电子装置
CN110430232A (zh) * 2019-06-27 2019-11-08 苏州浪潮智能科技有限公司 一种可视化的flume配置运行方法及装置
CN110579998A (zh) * 2019-10-24 2019-12-17 苏州良将智能科技有限公司 一种数据采集方法
CN111061798A (zh) * 2019-12-23 2020-04-24 杭州雷数科技有限公司 可配置化数据传输及监控方法、设备及介质
CN111125231A (zh) * 2019-12-31 2020-05-08 中电科华云信息技术有限公司 一种关系型数据库数据交换系统
CN111279278A (zh) * 2017-09-01 2020-06-12 欧姆龙株式会社 制造支持系统和方法
CN113112158A (zh) * 2021-04-13 2021-07-13 青岛海尔科技有限公司 设备使用数据的处理方法及装置、存储介质及电子装置
CN117457136A (zh) * 2023-12-22 2024-01-26 四川大学华西医院 基于医联网的医疗健康信息医患管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092980A (zh) * 2013-01-31 2013-05-08 中国科学院自动化研究所 一种数据自动转换与存储的方法及系统
CN105095327A (zh) * 2014-05-23 2015-11-25 深圳市珍爱网信息技术有限公司 一种分布式etl系统及调度方法
CN105447176A (zh) * 2015-12-09 2016-03-30 冶金自动化研究设计院 企业异构数据交换平台

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092980A (zh) * 2013-01-31 2013-05-08 中国科学院自动化研究所 一种数据自动转换与存储的方法及系统
CN105095327A (zh) * 2014-05-23 2015-11-25 深圳市珍爱网信息技术有限公司 一种分布式etl系统及调度方法
CN105447176A (zh) * 2015-12-09 2016-03-30 冶金自动化研究设计院 企业异构数据交换平台

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111279278A (zh) * 2017-09-01 2020-06-12 欧姆龙株式会社 制造支持系统和方法
CN111279278B (zh) * 2017-09-01 2023-07-28 欧姆龙株式会社 制造支持系统和用于支持制造的计算机实现的方法
CN107689999A (zh) * 2017-09-14 2018-02-13 北纬通信科技南京有限责任公司 一种云平台全自动计算方法及装置
CN107682201A (zh) * 2017-10-26 2018-02-09 苏州市伏泰信息科技股份有限公司 环卫平台运维监控系统
CN108038182A (zh) * 2017-12-08 2018-05-15 浪潮软件股份有限公司 一种基于Flume的关系数据库存储数据的方法和装置
CN108536853A (zh) * 2018-04-11 2018-09-14 上海驰骛信息科技有限公司 一种基于查询资源与精确度的自动路由数据库查询系统及方法
CN108984603A (zh) * 2018-06-05 2018-12-11 试金石信用服务有限公司 异构数据采集方法、设备、存储介质及系统
CN108829867A (zh) * 2018-06-22 2018-11-16 深圳云之家网络有限公司 一种大数据的智能采集方法及系统
CN109558392A (zh) * 2018-11-20 2019-04-02 南京数睿数据科技有限公司 一种跨平台多引擎支持的海量数据迁移装置
CN110032092A (zh) * 2018-12-03 2019-07-19 江苏省肿瘤医院 输液滴速监测精准管理系统及方法
CN110209731A (zh) * 2019-04-25 2019-09-06 深圳壹账通智能科技有限公司 数据同步方法、装置、及存储介质、电子装置
CN110430232A (zh) * 2019-06-27 2019-11-08 苏州浪潮智能科技有限公司 一种可视化的flume配置运行方法及装置
CN110579998A (zh) * 2019-10-24 2019-12-17 苏州良将智能科技有限公司 一种数据采集方法
CN111061798A (zh) * 2019-12-23 2020-04-24 杭州雷数科技有限公司 可配置化数据传输及监控方法、设备及介质
CN111061798B (zh) * 2019-12-23 2024-03-08 杭州雷数科技有限公司 可配置化数据传输及监控方法、设备及介质
CN111125231A (zh) * 2019-12-31 2020-05-08 中电科华云信息技术有限公司 一种关系型数据库数据交换系统
CN111125231B (zh) * 2019-12-31 2024-02-23 中电科华云信息技术有限公司 一种关系型数据库数据交换系统
CN113112158A (zh) * 2021-04-13 2021-07-13 青岛海尔科技有限公司 设备使用数据的处理方法及装置、存储介质及电子装置
CN117457136A (zh) * 2023-12-22 2024-01-26 四川大学华西医院 基于医联网的医疗健康信息医患管理系统

Also Published As

Publication number Publication date
CN106599197B (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN106599197A (zh) 数据采集交换引擎
US11816126B2 (en) Large scale unstructured database systems
US20220261413A1 (en) Using specified performance attributes to configure machine learning pipepline stages for an etl job
Chang et al. HAWQ: a massively parallel processing SQL engine in hadoop
CN103049556B (zh) 一种海量医疗数据的快速统计查询方法
US8495007B2 (en) Systems and methods for hierarchical aggregation of multi-dimensional data sources
CN106202346B (zh) 一种数据加载清洗引擎、调度与存储系统
CN103577528B (zh) 用于数据传送优化的方法和系统
CN110300963A (zh) 大规模数据储存库中的数据管理系统
CN108446326B (zh) 一种基于容器的异构数据管理方法及系统
CN108431810A (zh) 代理数据库
US20120166620A1 (en) System and method for integrated real time reporting and analytics across networked applications
CN104111996A (zh) 基于hadoop平台的医保门诊大数据抽取系统及方法
CN106682213A (zh) 基于Hadoop平台的物联网任务订制方法及系统
CN103605698A (zh) 一种用于分布异构数据资源整合的云数据库系统
US20100268714A1 (en) System and method for analysis of information
CN105787058B (zh) 一种用户标签系统及基于用户标签系统的数据推送系统
CN109815283A (zh) 一种异构数据源可视化查询方法
US20140222787A1 (en) Techniques for accessing a parallel database system via external programs using vertical and/or horizontal partitioning
CN110716952A (zh) 一种多源异构数据处理方法、装置和存储介质
CN107391502A (zh) 时间间隔的数据查询方法、装置及索引构建方法、装置
CN101739398A (zh) 分布式数据库多连接查询优化算法
CN109376142A (zh) 数据迁移方法及终端设备
CN114218218A (zh) 基于数据仓库的数据处理方法、装置、设备及存储介质
CN113779349A (zh) 数据检索系统、装置、电子设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant