CN104408159A - 一种数据关联、加载、查询方法及装置 - Google Patents
一种数据关联、加载、查询方法及装置 Download PDFInfo
- Publication number
- CN104408159A CN104408159A CN201410734165.1A CN201410734165A CN104408159A CN 104408159 A CN104408159 A CN 104408159A CN 201410734165 A CN201410734165 A CN 201410734165A CN 104408159 A CN104408159 A CN 104408159A
- Authority
- CN
- China
- Prior art keywords
- data
- objects
- association
- data objects
- hbase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000011068 loading method Methods 0.000 title claims abstract description 24
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 238000005192 partition Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 15
- 230000008676 import Effects 0.000 claims description 12
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000002596 correlated effect Effects 0.000 abstract 4
- 230000000875 corresponding effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 18
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 2
- 241000931705 Cicada Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/81—Indexing, e.g. XML tags; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
- G06F16/835—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410734165.1A CN104408159B (zh) | 2014-12-04 | 2014-12-04 | 一种数据关联、加载、查询方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410734165.1A CN104408159B (zh) | 2014-12-04 | 2014-12-04 | 一种数据关联、加载、查询方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104408159A true CN104408159A (zh) | 2015-03-11 |
CN104408159B CN104408159B (zh) | 2018-01-16 |
Family
ID=52645790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410734165.1A Active CN104408159B (zh) | 2014-12-04 | 2014-12-04 | 一种数据关联、加载、查询方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104408159B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731922A (zh) * | 2015-03-26 | 2015-06-24 | 江苏物联网研究发展中心 | 基于分布式数据库HBase的结构化数据的快速检索系统及方法 |
CN105117402A (zh) * | 2015-07-16 | 2015-12-02 | 中国人民大学 | 基于分段保序哈希的日志数据分片方法及装置 |
CN105930479A (zh) * | 2016-04-28 | 2016-09-07 | 乐视控股(北京)有限公司 | 一种数据倾斜处理方法及装置 |
CN106326245A (zh) * | 2015-06-19 | 2017-01-11 | 北京京东尚科信息技术有限公司 | 一种基于Hive数据仓库的快速关联实现方法及装置 |
CN106570108A (zh) * | 2016-11-01 | 2017-04-19 | 中国科学院计算机网络信息中心 | 一种云存储环境下海量数据自适应读取优化方法及系统 |
CN106959948A (zh) * | 2016-01-08 | 2017-07-18 | 普华诚信信息技术有限公司 | 针对分布式特性对大数据进行预处理的系统及其预处理方法 |
CN106970929A (zh) * | 2016-09-08 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 数据导入方法及装置 |
CN107169003A (zh) * | 2017-03-31 | 2017-09-15 | 北京奇艺世纪科技有限公司 | 一种数据关联方法及装置 |
CN107451498A (zh) * | 2016-06-01 | 2017-12-08 | 北京数码视讯科技股份有限公司 | 一种对象间关联关系的提供方法、装置及智能卡 |
CN108021578A (zh) * | 2016-11-03 | 2018-05-11 | 北京国双科技有限公司 | 数据文件的关联查询方法及装置 |
CN108255855A (zh) * | 2016-12-29 | 2018-07-06 | 北京国双科技有限公司 | 数据存储方法和装置 |
CN111723229A (zh) * | 2020-06-24 | 2020-09-29 | 重庆紫光华山智安科技有限公司 | 数据比对方法、装置、计算机可读存储介质和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467570A (zh) * | 2010-11-17 | 2012-05-23 | 日电(中国)有限公司 | 用于分布式数据仓库的连接查询系统和方法 |
CN102629219A (zh) * | 2012-02-27 | 2012-08-08 | 北京大学 | 并行计算框架中的Reduce端自适应负载均衡方法 |
CN103577123A (zh) * | 2013-11-12 | 2014-02-12 | 河海大学 | 一种基于hdfs的小文件优化存储方法 |
EP2706468A1 (en) * | 2012-03-20 | 2014-03-12 | Guangdong Electronics Industry Institute Ltd. | Data storage and query method |
CN103685351A (zh) * | 2012-09-04 | 2014-03-26 | 中国移动通信集团公司 | 一种基于云计算平台的缓存服务节点的调度方法和设备 |
-
2014
- 2014-12-04 CN CN201410734165.1A patent/CN104408159B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467570A (zh) * | 2010-11-17 | 2012-05-23 | 日电(中国)有限公司 | 用于分布式数据仓库的连接查询系统和方法 |
CN102629219A (zh) * | 2012-02-27 | 2012-08-08 | 北京大学 | 并行计算框架中的Reduce端自适应负载均衡方法 |
EP2706468A1 (en) * | 2012-03-20 | 2014-03-12 | Guangdong Electronics Industry Institute Ltd. | Data storage and query method |
CN103685351A (zh) * | 2012-09-04 | 2014-03-26 | 中国移动通信集团公司 | 一种基于云计算平台的缓存服务节点的调度方法和设备 |
CN103577123A (zh) * | 2013-11-12 | 2014-02-12 | 河海大学 | 一种基于hdfs的小文件优化存储方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731922A (zh) * | 2015-03-26 | 2015-06-24 | 江苏物联网研究发展中心 | 基于分布式数据库HBase的结构化数据的快速检索系统及方法 |
CN106326245A (zh) * | 2015-06-19 | 2017-01-11 | 北京京东尚科信息技术有限公司 | 一种基于Hive数据仓库的快速关联实现方法及装置 |
CN105117402B (zh) * | 2015-07-16 | 2018-08-28 | 中国人民大学 | 日志数据分片方法及装置 |
CN105117402A (zh) * | 2015-07-16 | 2015-12-02 | 中国人民大学 | 基于分段保序哈希的日志数据分片方法及装置 |
CN106959948A (zh) * | 2016-01-08 | 2017-07-18 | 普华诚信信息技术有限公司 | 针对分布式特性对大数据进行预处理的系统及其预处理方法 |
CN105930479A (zh) * | 2016-04-28 | 2016-09-07 | 乐视控股(北京)有限公司 | 一种数据倾斜处理方法及装置 |
CN107451498B (zh) * | 2016-06-01 | 2020-06-09 | 北京数码视讯科技股份有限公司 | 一种对象间关联关系的提供方法、装置及智能卡 |
CN107451498A (zh) * | 2016-06-01 | 2017-12-08 | 北京数码视讯科技股份有限公司 | 一种对象间关联关系的提供方法、装置及智能卡 |
CN106970929A (zh) * | 2016-09-08 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 数据导入方法及装置 |
CN106970929B (zh) * | 2016-09-08 | 2020-09-01 | 阿里巴巴集团控股有限公司 | 数据导入方法及装置 |
CN106570108A (zh) * | 2016-11-01 | 2017-04-19 | 中国科学院计算机网络信息中心 | 一种云存储环境下海量数据自适应读取优化方法及系统 |
CN108021578A (zh) * | 2016-11-03 | 2018-05-11 | 北京国双科技有限公司 | 数据文件的关联查询方法及装置 |
CN108255855A (zh) * | 2016-12-29 | 2018-07-06 | 北京国双科技有限公司 | 数据存储方法和装置 |
CN108255855B (zh) * | 2016-12-29 | 2021-10-08 | 北京国双科技有限公司 | 数据存储方法和装置 |
CN107169003A (zh) * | 2017-03-31 | 2017-09-15 | 北京奇艺世纪科技有限公司 | 一种数据关联方法及装置 |
CN111723229A (zh) * | 2020-06-24 | 2020-09-29 | 重庆紫光华山智安科技有限公司 | 数据比对方法、装置、计算机可读存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN104408159B (zh) | 2018-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104408159A (zh) | 一种数据关联、加载、查询方法及装置 | |
CN105786808B (zh) | 一种用于分布式执行关系型计算指令的方法与设备 | |
JP6338817B2 (ja) | データベースミドルウェアを用いたデータ管理システム及びその方法 | |
CN101436192B (zh) | 用于优化针对垂直存储式数据库的查询的方法和设备 | |
CN103544261B (zh) | 一种海量结构化日志数据全局索引管理方法及装置 | |
CN107368527B (zh) | 基于数据流的多属性索引方法 | |
CN109845221A (zh) | 用于服务层的访问控制策略同步 | |
CN103927331B (zh) | 数据查询方法、装置及系统 | |
CN103440288A (zh) | 一种大数据存储方法及装置 | |
CN105302920A (zh) | 一种云存储数据的优化管理方法和系统 | |
CN111221791A (zh) | 一种多源异构数据导入数据湖的方法 | |
US10496648B2 (en) | Systems and methods for searching multiple related tables | |
US20130159347A1 (en) | Automatic and dynamic design of cache groups | |
CN103823846A (zh) | 一种基于图论的大数据存储及查询方法 | |
CN113704291A (zh) | 数据查询方法、装置、存储介质及电子设备 | |
CN111026709B (zh) | 基于集群访问的数据处理方法及装置 | |
CN111723161A (zh) | 一种数据处理方法、装置及设备 | |
Mietz et al. | A p2p semantic query framework for the internet of things | |
CN112417225A (zh) | 一种多源异构数据的联合查询方法与系统 | |
CN104636368A (zh) | 数据检索方法、装置及服务器 | |
CN106339415A (zh) | 数据的查询方法、装置及系统 | |
CN103034650A (zh) | 一种数据处理系统和方法 | |
CN108241709A (zh) | 一种数据集成方法、装置和系统 | |
CN113468571A (zh) | 基于区块链的溯源方法 | |
Liu et al. | Finding smallest k-compact tree set for keyword queries on graphs using mapreduce |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220722 Address after: 100089 building 36, courtyard 8, Dongbeiwang West Road, Haidian District, Beijing Patentee after: Dawning Information Industry (Beijing) Co.,Ltd. Patentee after: DAWNING INFORMATION INDUSTRY Co.,Ltd. Address before: 100193 No. 36 Building, No. 8 Hospital, Wangxi Road, Haidian District, Beijing Patentee before: Dawning Information Industry (Beijing) Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240507 Address after: Room 168, 1st Floor, Building 10, No. 1 Courtyard, Longxing Jiayuan, southeast corner of the intersection of Longhu Inner Ring Road and Longzhiyuan East Ninth Street, Zhengdong New District, Zhengzhou City, Henan Province, 450018 Patentee after: Shuguang Information Industry (Henan) Co.,Ltd. Country or region after: China Address before: 100089 building 36, courtyard 8, Dongbeiwang West Road, Haidian District, Beijing Patentee before: Dawning Information Industry (Beijing) Co.,Ltd. Country or region before: China Patentee before: DAWNING INFORMATION INDUSTRY Co.,Ltd. |