CN104112011A - 一种海量数据提取的方法及装置 - Google Patents
一种海量数据提取的方法及装置 Download PDFInfo
- Publication number
- CN104112011A CN104112011A CN201410340118.9A CN201410340118A CN104112011A CN 104112011 A CN104112011 A CN 104112011A CN 201410340118 A CN201410340118 A CN 201410340118A CN 104112011 A CN104112011 A CN 104112011A
- Authority
- CN
- China
- Prior art keywords
- data
- block
- sub
- partition
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000005192 partition Methods 0.000 claims description 64
- 238000013075 data extraction Methods 0.000 claims description 17
- 238000013316 zoning Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000000151 deposition Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/278—Data partitioning, e.g. horizontal or vertical partitioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410340118.9A CN104112011B (zh) | 2014-07-16 | 2014-07-16 | 一种海量数据提取的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410340118.9A CN104112011B (zh) | 2014-07-16 | 2014-07-16 | 一种海量数据提取的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104112011A true CN104112011A (zh) | 2014-10-22 |
CN104112011B CN104112011B (zh) | 2017-09-15 |
Family
ID=51708802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410340118.9A Active CN104112011B (zh) | 2014-07-16 | 2014-07-16 | 一种海量数据提取的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104112011B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069084A (zh) * | 2015-07-31 | 2015-11-18 | 南威软件股份有限公司 | 一种面向海量数据高效取差集的方法 |
CN106815260A (zh) * | 2015-12-01 | 2017-06-09 | 阿里巴巴集团控股有限公司 | 一种索引建立方法及设备 |
CN109213746A (zh) * | 2018-09-28 | 2019-01-15 | 北京赛博贝斯数据科技有限责任公司 | Pb级历史数据和在线数据的实时计算的可视化建模方法 |
CN109359100A (zh) * | 2018-09-28 | 2019-02-19 | 北京赛博贝斯数据科技有限责任公司 | Pb级历史数据和在线数据的实时计算的可视化建模方法 |
CN110222046A (zh) * | 2019-04-28 | 2019-09-10 | 阿里巴巴集团控股有限公司 | 列表数据的处理方法、装置、服务器和存储介质 |
CN110352414A (zh) * | 2017-12-29 | 2019-10-18 | 北京嘀嘀无限科技发展有限公司 | 为大数据添加索引的系统和方法 |
CN111858606A (zh) * | 2020-07-24 | 2020-10-30 | 北京金山云网络技术有限公司 | 数据处理方法、装置和电子设备 |
CN112579608A (zh) * | 2020-12-25 | 2021-03-30 | 平安银行股份有限公司 | 案件数据查询方法、系统、设备及计算机可读存储介质 |
CN112579608B (zh) * | 2020-12-25 | 2024-06-21 | 平安银行股份有限公司 | 案件数据查询方法、系统、设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293525A (ja) * | 1999-04-01 | 2000-10-20 | Beacon Information Technology:Kk | データ管理方法及び装置、記録媒体 |
CN102725753A (zh) * | 2011-11-28 | 2012-10-10 | 华为技术有限公司 | 优化数据访问的方法及装置、优化数据存储的方法及装置 |
KR20130008333A (ko) * | 2011-07-12 | 2013-01-22 | (주)선재소프트 | 데이타베이스 관리자를 이용한 융합 데이타베이스 관리 시스템 및 방법 |
CN103324642A (zh) * | 2012-03-23 | 2013-09-25 | 日电(中国)有限公司 | 为数据建立索引的系统和方法以及数据查询方法 |
CN103366015A (zh) * | 2013-07-31 | 2013-10-23 | 东南大学 | 一种基于Hadoop的OLAP数据存储与查询方法 |
-
2014
- 2014-07-16 CN CN201410340118.9A patent/CN104112011B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293525A (ja) * | 1999-04-01 | 2000-10-20 | Beacon Information Technology:Kk | データ管理方法及び装置、記録媒体 |
KR20130008333A (ko) * | 2011-07-12 | 2013-01-22 | (주)선재소프트 | 데이타베이스 관리자를 이용한 융합 데이타베이스 관리 시스템 및 방법 |
CN102725753A (zh) * | 2011-11-28 | 2012-10-10 | 华为技术有限公司 | 优化数据访问的方法及装置、优化数据存储的方法及装置 |
CN103324642A (zh) * | 2012-03-23 | 2013-09-25 | 日电(中国)有限公司 | 为数据建立索引的系统和方法以及数据查询方法 |
CN103366015A (zh) * | 2013-07-31 | 2013-10-23 | 东南大学 | 一种基于Hadoop的OLAP数据存储与查询方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069084A (zh) * | 2015-07-31 | 2015-11-18 | 南威软件股份有限公司 | 一种面向海量数据高效取差集的方法 |
CN105069084B (zh) * | 2015-07-31 | 2018-07-31 | 南威软件股份有限公司 | 一种面向海量数据高效取差集的方法 |
CN106815260A (zh) * | 2015-12-01 | 2017-06-09 | 阿里巴巴集团控股有限公司 | 一种索引建立方法及设备 |
CN106815260B (zh) * | 2015-12-01 | 2021-05-04 | 阿里巴巴集团控股有限公司 | 一种索引建立方法及设备 |
CN110352414A (zh) * | 2017-12-29 | 2019-10-18 | 北京嘀嘀无限科技发展有限公司 | 为大数据添加索引的系统和方法 |
CN110352414B (zh) * | 2017-12-29 | 2022-11-11 | 北京嘀嘀无限科技发展有限公司 | 为大数据添加索引的系统和方法 |
CN109359100A (zh) * | 2018-09-28 | 2019-02-19 | 北京赛博贝斯数据科技有限责任公司 | Pb级历史数据和在线数据的实时计算的可视化建模方法 |
CN109213746A (zh) * | 2018-09-28 | 2019-01-15 | 北京赛博贝斯数据科技有限责任公司 | Pb级历史数据和在线数据的实时计算的可视化建模方法 |
CN110222046A (zh) * | 2019-04-28 | 2019-09-10 | 阿里巴巴集团控股有限公司 | 列表数据的处理方法、装置、服务器和存储介质 |
CN110222046B (zh) * | 2019-04-28 | 2023-11-03 | 北京奥星贝斯科技有限公司 | 列表数据的处理方法、装置、服务器和存储介质 |
CN111858606A (zh) * | 2020-07-24 | 2020-10-30 | 北京金山云网络技术有限公司 | 数据处理方法、装置和电子设备 |
CN112579608A (zh) * | 2020-12-25 | 2021-03-30 | 平安银行股份有限公司 | 案件数据查询方法、系统、设备及计算机可读存储介质 |
CN112579608B (zh) * | 2020-12-25 | 2024-06-21 | 平安银行股份有限公司 | 案件数据查询方法、系统、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104112011B (zh) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104112011A (zh) | 一种海量数据提取的方法及装置 | |
CN107423422B (zh) | 基于网格的空间数据分布式存储及检索方法和系统 | |
CN102646130B (zh) | 一种海量历史数据的存储及索引方法 | |
EP3308303B1 (en) | Mechanisms for merging index structures in molap while preserving query consistency | |
CN104536904B (zh) | 一种数据管理的方法、设备与系统 | |
CN103678339B (zh) | 数据回流、关系型数据库中的数据访问方法及系统 | |
CN103902698A (zh) | 一种数据存储系统和存储方法 | |
CN107408114B (zh) | 基于事务访问模式识别联结关系 | |
CN103902702A (zh) | 一种数据存储系统和存储方法 | |
CN103620601A (zh) | 在映射缩减过程中汇合表 | |
CN103345496B (zh) | 多媒体信息检索方法和系统 | |
CN110275920A (zh) | 数据查询方法、装置、电子设备及计算机可读存储介质 | |
CN104063376A (zh) | 多维度分组运算方法及系统 | |
CN104182508A (zh) | 一种数据处理方法和数据处理装置 | |
CN103902701A (zh) | 一种数据存储系统和存储方法 | |
CN103714086A (zh) | 用于生成非关系数据库的模式的方法和设备 | |
CN104111936A (zh) | 数据查询方法和系统 | |
CN103793493A (zh) | 一种处理车载终端海量数据的方法和系统 | |
CN104424219A (zh) | 一种数据文件的管理方法及装置 | |
CN106055678A (zh) | 一种基于hadoop的全景大数据分布式存储方法 | |
CN107205024A (zh) | 一种云存储系统中数据去重方法及系统 | |
CN107644050A (zh) | 一种基于solr的Hbase的查询方法及装置 | |
CN103092886B (zh) | 一种数据查询操作的实现方法、装置及系统 | |
CN104750673A (zh) | 文本匹配过滤方法及装置 | |
JP2022137281A (ja) | データ照会方法、装置、電子デバイス、記憶媒体、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Address after: 518000 Guangdong city of Shenzhen province Nanshan District two road Nantou checkpoint Gateway Industrial Park 30 building 3 floor forward hot electrons Applicant after: GTA INFORMATION TECHNOLOGY CO., LTD. (GTA) Address before: 518000 Guangdong city of Shenzhen province Nanshan District two road Nantou checkpoint Gateway Industrial Park 30 building 3 floor forward hot electrons Applicant before: Shenzhen GTA Information Technology Co., Ltd. |
|
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: SHENZHEN GTA INFORMATION TECHNOLOGY CO., LTD. TO: SHENZHEN GUOTAIAN EDUCATION TECHNOLOGY CO., LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 518000 12th Floor, Building A4, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Nanshan District, Shenzhen City, Guangdong Province Patentee after: Shenzhen Guotaian Educational Technology Co., Ltd. Address before: 518000 Checkpoint, Nantou, Shenzhen, Guangdong Province, 30 Building 3, Zhiheng Industrial Park, Gate 2, Nanshan District, Shenzhen Patentee before: GTA INFORMATION TECHNOLOGY CO., LTD. (GTA) |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200612 Address after: 518000, 1201, Building A4, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Nanshan District, Shenzhen City, Guangdong Province Patentee after: Shenzhen xishima Data Technology Co.,Ltd. Address before: 518000 12/F, Building A4, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Nanshan District, Shenzhen City, Guangdong Province Patentee before: SHENZHEN GTA EDUCATION TECH Ltd. |