CN105205105B - 一种基于storm的数据ETL系统及处理方法 - Google Patents
一种基于storm的数据ETL系统及处理方法 Download PDFInfo
- Publication number
- CN105205105B CN105205105B CN201510533323.1A CN201510533323A CN105205105B CN 105205105 B CN105205105 B CN 105205105B CN 201510533323 A CN201510533323 A CN 201510533323A CN 105205105 B CN105205105 B CN 105205105B
- Authority
- CN
- China
- Prior art keywords
- data
- etl
- controller module
- storm
- distributed computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000013500 data storage Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 238000000465 moulding Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
- Processing Of Solid Wastes (AREA)
- Refuse Collection And Transfer (AREA)
Abstract
Description
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510533323.1A CN105205105B (zh) | 2015-08-27 | 2015-08-27 | 一种基于storm的数据ETL系统及处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510533323.1A CN105205105B (zh) | 2015-08-27 | 2015-08-27 | 一种基于storm的数据ETL系统及处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105205105A CN105205105A (zh) | 2015-12-30 |
CN105205105B true CN105205105B (zh) | 2019-04-16 |
Family
ID=54952789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510533323.1A Active CN105205105B (zh) | 2015-08-27 | 2015-08-27 | 一种基于storm的数据ETL系统及处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105205105B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824892A (zh) * | 2016-03-11 | 2016-08-03 | 广东电网有限责任公司电力科学研究院 | 一种数据池对数据同步和处理的方法 |
CN107545014A (zh) * | 2016-06-28 | 2018-01-05 | 国网天津市电力公司 | 基于Storm的流计算即时处理系统 |
CN106250571A (zh) * | 2016-10-11 | 2016-12-21 | 北京集奥聚合科技有限公司 | 一种etl数据处理的方法及系统 |
CN106777933B (zh) * | 2016-12-02 | 2019-05-10 | 郑州云海信息技术有限公司 | 一种数据采集方法、装置及系统 |
CN106611046B (zh) * | 2016-12-16 | 2020-02-14 | 武汉中地数码科技有限公司 | 一种基于大数据技术的空间数据存储处理中间件系统 |
CN106649119B (zh) * | 2016-12-28 | 2019-09-20 | 深圳市华傲数据技术有限公司 | 流计算引擎的测试方法及装置 |
CN107688592B (zh) * | 2017-04-06 | 2020-03-17 | 平安科技(深圳)有限公司 | 数据清洗的方法及终端 |
CN107688598B (zh) * | 2017-06-25 | 2021-02-09 | 平安科技(深圳)有限公司 | 源表结构解析方法、应用服务器及计算机可读存储介质 |
CN107678852B (zh) * | 2017-10-26 | 2021-06-22 | 携程旅游网络技术(上海)有限公司 | 基于流数据实时计算的方法、系统、设备及存储介质 |
CN108256045A (zh) * | 2018-01-12 | 2018-07-06 | 福建星瑞格软件有限公司 | 实时流数据的结构化解析、流计算的方法及计算机设备 |
CN109522004A (zh) * | 2018-11-09 | 2019-03-26 | 福建南威软件有限公司 | 一种etl流程在分布式架构运行的方法 |
CN110442602B (zh) * | 2019-07-02 | 2021-01-01 | 新华三大数据技术有限公司 | 数据查询方法、装置、服务器及存储介质 |
CN110471977B (zh) * | 2019-08-22 | 2022-04-22 | 杭州数梦工场科技有限公司 | 一种数据交换方法、装置、设备、介质 |
CN112700622B (zh) * | 2020-12-21 | 2022-05-17 | 中铁二院工程集团有限责任公司 | 一种基于storm的铁路地质灾害监测大数据预处理方法及系统 |
CN114048195A (zh) * | 2022-01-13 | 2022-02-15 | 合肥臻谱防务科技有限公司 | 一种数据迁移方法、系统及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955502A (zh) * | 2014-04-24 | 2014-07-30 | 科技谷(厦门)信息技术有限公司 | 一种可视化olap的应用实现方法及系统 |
CN104036025A (zh) * | 2014-06-27 | 2014-09-10 | 蓝盾信息安全技术有限公司 | 一种基于分布式的海量日志采集系统 |
CN104317928A (zh) * | 2014-10-31 | 2015-01-28 | 北京思特奇信息技术股份有限公司 | 一种基于分布式数据库的业务etl方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714151A (zh) * | 2013-12-26 | 2014-04-09 | 北京锐安科技有限公司 | 一种单向光闸以及异构数据库间进行数据同步的方法 |
-
2015
- 2015-08-27 CN CN201510533323.1A patent/CN105205105B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955502A (zh) * | 2014-04-24 | 2014-07-30 | 科技谷(厦门)信息技术有限公司 | 一种可视化olap的应用实现方法及系统 |
CN104036025A (zh) * | 2014-06-27 | 2014-09-10 | 蓝盾信息安全技术有限公司 | 一种基于分布式的海量日志采集系统 |
CN104317928A (zh) * | 2014-10-31 | 2015-01-28 | 北京思特奇信息技术股份有限公司 | 一种基于分布式数据库的业务etl方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105205105A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105205105B (zh) | 一种基于storm的数据ETL系统及处理方法 | |
CN102033748B (zh) | 一种数据处理流程代码的生成方法 | |
CN107622103B (zh) | 管理数据查询 | |
Leno et al. | Automated discovery of data transformations for robotic process automation | |
CN102819426B (zh) | 一种AUTOSAR模型同步到Simulink模型的方法 | |
CN104317928A (zh) | 一种基于分布式数据库的业务etl方法及系统 | |
CN104021460A (zh) | 一种工作流程管理系统及工作流程处理方法 | |
CN103430144A (zh) | 数据源分析 | |
CN103092980A (zh) | 一种数据自动转换与存储的方法及系统 | |
CN102508880A (zh) | 一种文件合并方法及分解方法 | |
CN106325969A (zh) | 需求变更的逆向追踪系统 | |
CN103309904A (zh) | 一种生成数据仓库etl 代码的方法及装置 | |
CN109669933A (zh) | 交易数据智能处理方法、装置及计算机可读存储介质 | |
CN104731953A (zh) | 一种基于r的数据预处理系统的构建方法 | |
CN110457333A (zh) | 数据实时更新方法、装置及计算机可读存储介质 | |
CN105589739B (zh) | 一种流程控制系统及方法 | |
CN104346378B (zh) | 一种实现复杂数据处理的方法、装置及系统 | |
CN104573002A (zh) | 基于人、事、物分类建档的数据组织模型 | |
CN103870540A (zh) | 一种基于结构设计分析一体化的数据库 | |
CN108874395A (zh) | 一种组件化流处理过程中的硬编译方法及装置 | |
CN103559574A (zh) | 一种工作流操作方法及系统 | |
CN104360899B (zh) | 一种进程管理系统及管理方法 | |
Masouleh et al. | Optimization of ETL process in data warehouse through a combination of parallelization and shared cache memory | |
Kozintsev et al. | A model for storing and presenting design procedures in a distributed service-oriented environment | |
CN102999323B (zh) | 一种生成目标代码的方法、数据处理的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230320 Address after: 250000 building S02, No. 1036, Langchao Road, high tech Zone, Jinan City, Shandong Province Patentee after: Shandong Inspur Scientific Research Institute Co.,Ltd. Address before: No. 1036, Shun Ya Road, Ji'nan high tech Zone, Shandong Province Patentee before: INSPUR GROUP Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20241014 Address after: 2324, Building 1, Aosheng Building, No. 1166 Xinluo Street, High tech Zone, Jinan City, Shandong Province, 250000 Patentee after: Inspur Computer Technology Co.,Ltd. Country or region after: China Address before: 250000 building S02, No. 1036, Langchao Road, high tech Zone, Jinan City, Shandong Province Patentee before: Shandong Inspur Scientific Research Institute Co.,Ltd. Country or region before: China |
|
TR01 | Transfer of patent right |