CN105205105B - 一种基于storm的数据ETL系统及处理方法 - Google Patents
一种基于storm的数据ETL系统及处理方法 Download PDFInfo
- Publication number
- CN105205105B CN105205105B CN201510533323.1A CN201510533323A CN105205105B CN 105205105 B CN105205105 B CN 105205105B CN 201510533323 A CN201510533323 A CN 201510533323A CN 105205105 B CN105205105 B CN 105205105B
- Authority
- CN
- China
- Prior art keywords
- data
- etl
- controller module
- storm
- distributed computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000013500 data storage Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 238000000465 moulding Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Refuse Collection And Transfer (AREA)
- Processing Of Solid Wastes (AREA)
- Stored Programmes (AREA)
Abstract
Description
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510533323.1A CN105205105B (zh) | 2015-08-27 | 2015-08-27 | 一种基于storm的数据ETL系统及处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510533323.1A CN105205105B (zh) | 2015-08-27 | 2015-08-27 | 一种基于storm的数据ETL系统及处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105205105A CN105205105A (zh) | 2015-12-30 |
CN105205105B true CN105205105B (zh) | 2019-04-16 |
Family
ID=54952789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510533323.1A Active CN105205105B (zh) | 2015-08-27 | 2015-08-27 | 一种基于storm的数据ETL系统及处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105205105B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824892A (zh) * | 2016-03-11 | 2016-08-03 | 广东电网有限责任公司电力科学研究院 | 一种数据池对数据同步和处理的方法 |
CN107545014A (zh) * | 2016-06-28 | 2018-01-05 | 国网天津市电力公司 | 基于Storm的流计算即时处理系统 |
CN106250571A (zh) * | 2016-10-11 | 2016-12-21 | 北京集奥聚合科技有限公司 | 一种etl数据处理的方法及系统 |
CN106777933B (zh) * | 2016-12-02 | 2019-05-10 | 郑州云海信息技术有限公司 | 一种数据采集方法、装置及系统 |
CN106611046B (zh) * | 2016-12-16 | 2020-02-14 | 武汉中地数码科技有限公司 | 一种基于大数据技术的空间数据存储处理中间件系统 |
CN106649119B (zh) * | 2016-12-28 | 2019-09-20 | 深圳市华傲数据技术有限公司 | 流计算引擎的测试方法及装置 |
CN107688592B (zh) * | 2017-04-06 | 2020-03-17 | 平安科技(深圳)有限公司 | 数据清洗的方法及终端 |
CN107688598B (zh) * | 2017-06-25 | 2021-02-09 | 平安科技(深圳)有限公司 | 源表结构解析方法、应用服务器及计算机可读存储介质 |
CN107678852B (zh) * | 2017-10-26 | 2021-06-22 | 携程旅游网络技术(上海)有限公司 | 基于流数据实时计算的方法、系统、设备及存储介质 |
CN108256045A (zh) * | 2018-01-12 | 2018-07-06 | 福建星瑞格软件有限公司 | 实时流数据的结构化解析、流计算的方法及计算机设备 |
CN109522004A (zh) * | 2018-11-09 | 2019-03-26 | 福建南威软件有限公司 | 一种etl流程在分布式架构运行的方法 |
CN110442602B (zh) * | 2019-07-02 | 2021-01-01 | 新华三大数据技术有限公司 | 数据查询方法、装置、服务器及存储介质 |
CN110471977B (zh) * | 2019-08-22 | 2022-04-22 | 杭州数梦工场科技有限公司 | 一种数据交换方法、装置、设备、介质 |
CN112700622B (zh) * | 2020-12-21 | 2022-05-17 | 中铁二院工程集团有限责任公司 | 一种基于storm的铁路地质灾害监测大数据预处理方法及系统 |
CN114048195A (zh) * | 2022-01-13 | 2022-02-15 | 合肥臻谱防务科技有限公司 | 一种数据迁移方法、系统及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955502A (zh) * | 2014-04-24 | 2014-07-30 | 科技谷(厦门)信息技术有限公司 | 一种可视化olap的应用实现方法及系统 |
CN104036025A (zh) * | 2014-06-27 | 2014-09-10 | 蓝盾信息安全技术有限公司 | 一种基于分布式的海量日志采集系统 |
CN104317928A (zh) * | 2014-10-31 | 2015-01-28 | 北京思特奇信息技术股份有限公司 | 一种基于分布式数据库的业务etl方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714151A (zh) * | 2013-12-26 | 2014-04-09 | 北京锐安科技有限公司 | 一种单向光闸以及异构数据库间进行数据同步的方法 |
-
2015
- 2015-08-27 CN CN201510533323.1A patent/CN105205105B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955502A (zh) * | 2014-04-24 | 2014-07-30 | 科技谷(厦门)信息技术有限公司 | 一种可视化olap的应用实现方法及系统 |
CN104036025A (zh) * | 2014-06-27 | 2014-09-10 | 蓝盾信息安全技术有限公司 | 一种基于分布式的海量日志采集系统 |
CN104317928A (zh) * | 2014-10-31 | 2015-01-28 | 北京思特奇信息技术股份有限公司 | 一种基于分布式数据库的业务etl方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105205105A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105205105B (zh) | 一种基于storm的数据ETL系统及处理方法 | |
Mukherjee et al. | A comparative review of data warehousing ETL tools with new trends and industry insight | |
CN107526645B (zh) | 一种通信优化方法及系统 | |
CN103761236A (zh) | 一种增量式频繁模式增长数据挖掘方法 | |
CN106126601A (zh) | 一种社保大数据分布式预处理方法及系统 | |
CN106021484A (zh) | 基于内存计算的可定制多模式大数据处理系统 | |
CN103425762A (zh) | 基于Hadoop平台的电信运营商海量数据处理方法 | |
CN104317928A (zh) | 一种基于分布式数据库的业务etl方法及系统 | |
Leno et al. | Automated discovery of data transformations for robotic process automation | |
CN103430144A (zh) | 数据源分析 | |
CN106325969A (zh) | 需求变更的逆向追踪系统 | |
CN106951475A (zh) | 基于云计算的大数据分布式处理方法及系统 | |
CN107301214A (zh) | 在hive中数据迁移方法、装置及终端设备 | |
CN103077192B (zh) | 一种数据处理方法及其系统 | |
US20150026115A1 (en) | Creation of change-based data integration jobs | |
CN102147813A (zh) | 一种电力云环境下基于k最近邻算法的文档自动分类方法 | |
CN202584217U (zh) | 一种银行数据的并行批量处理系统 | |
CN101165682A (zh) | 一种文档文件的处理方法及系统 | |
CN107479866A (zh) | 基于重构技术实现开放终端应用数据与功能的方法 | |
CN104573002A (zh) | 基于人、事、物分类建档的数据组织模型 | |
CN103984723A (zh) | 一种针对增量数据对频繁项进行更新数据挖掘方法 | |
CN103870540A (zh) | 一种基于结构设计分析一体化的数据库 | |
CN107436883B (zh) | 基于求余的数据抽取的方法、装置及系统 | |
CN108874395A (zh) | 一种组件化流处理过程中的硬编译方法及装置 | |
CN117009038A (zh) | 一种基于云原生技术的图计算平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230320 Address after: 250000 building S02, No. 1036, Langchao Road, high tech Zone, Jinan City, Shandong Province Patentee after: Shandong Inspur Scientific Research Institute Co.,Ltd. Address before: No. 1036, Shun Ya Road, Ji'nan high tech Zone, Shandong Province Patentee before: INSPUR GROUP Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20241014 Address after: 2324, Building 1, Aosheng Building, No. 1166 Xinluo Street, High tech Zone, Jinan City, Shandong Province, 250000 Patentee after: Inspur Computer Technology Co.,Ltd. Country or region after: China Address before: 250000 building S02, No. 1036, Langchao Road, high tech Zone, Jinan City, Shandong Province Patentee before: Shandong Inspur Scientific Research Institute Co.,Ltd. Country or region before: China |