KR101772955B1 - 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법 - Google Patents
맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법 Download PDFInfo
- Publication number
- KR101772955B1 KR101772955B1 KR1020160087887A KR20160087887A KR101772955B1 KR 101772955 B1 KR101772955 B1 KR 101772955B1 KR 1020160087887 A KR1020160087887 A KR 1020160087887A KR 20160087887 A KR20160087887 A KR 20160087887A KR 101772955 B1 KR101772955 B1 KR 101772955B1
- Authority
- KR
- South Korea
- Prior art keywords
- index
- record
- records
- key
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G06F17/30194—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 맵 리듀스에 기반한 분산 처리 시스템에서 레코드 처리 과정을 도시한 예이다.
도 3은 맵 리듀스에 기반한 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 과정에 대한 예이다.
도 4는 맵 리듀스에 기반한 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 과정에 대한 다른 예이다.
102 : 맵리듀스 프레임워크
110 : 마스터 노드
120 : 슬레이브 노드
Claims (10)
- 맵리듀스 기반의 분산 처리 시스템의 분산 노드가, 맵 함수(map function)를 이용하여 입력 데이터를 분석 대상인 레코드들로 분류하여 상기 분산 노드의 저장 장치에 저장하는 단계; 상기 레코드들은 각각 키(key) 및 값(value)의 쌍(pair)으로 구성되며,
상기 분산 노드가, 상기 키 및 각 레코드가 상기 저장 장치에 저장된 저장 위치를 함께 지시하는 인덱스들로 구성되는 인덱스 구조(index structure)를 생성하는 단계; 상기 인덱스들은 상기 레코드들에 각각 대응되며,
상기 분산 노드가, 상기 인덱스 구조에서 상기 키의 순서에 따라 상기 인덱스들에 접근하여 상기 레코드들에 대한 각각의 저장 위치를 식별하고, 상기 식별된 각각의 저장 위치에 저장된 레코드들을 리듀스 작업의 파티션 별로 분류하는 단계; 및
상기 분산 노드가, 리듀스 함수(reduce function)를 이용하여, 상기 파티션 별로 분류된 레코드들에 대해 상기 리듀스 작업을 수행하는 단계를 포함하는 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법. - 제1항에 있어서,
상기 인덱스 구조는 상기 분산 노드의 메모리에 위치하며 상기 키를 기준으로 순차 접근이 가능한 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법. - 삭제
- 제1항에 있어서,
상기 리듀스 작업을 수행하는 단계는, 상기 분류된 레코드들에 대한 병합 정렬을 수행하는 단계 및 상기 병합 정렬된 레코드들을 기준으로 중복 데이터를 제거하는 단계를 포함하는 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법. - 삭제
- 제1항에 있어서,
상기 인덱스 구조를 생성하는 단계에서
상기 분산 노드는 상기 키를 기준으로 레코드의 값(value)을 연산한 결과 값을 더 포함하는 상기 인덱스 구조를 생성하는 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법. - 제6항에 있어서,
상기 연산은 동일한 값을 갖는 키에 대한 합산, 동일한 값을 갖는 키의 개수, 동일한 값을 갖는 키에 대한 값 중 최소값 결정 및 동일한 값을 갖는 키에 대한 값 중 최대값 결정 중 적어도 하나인 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법. - 맵리듀스 기반의 분산 처리 시스템의 분산 노드가, 제1 레코드들에 대해 각 제1 레코드의 키(key) 및 각 제1 레코드가 상기 분산 노드의 저장 장치에 저장된 저장 위치를 함께 지시하는 제1 인덱스들로 구성된 제1 인덱스 구조를 생성하는 단계;
상기 분산 노드가, 제2 레코드들에 대해 각 제2 레코드의 키(key) 및 각 제2 레코드가 상기 분산 노드의 저장 장치에 저장된 저장 위치를 함께 지시하는 제2 인덱스들로 구성된 제2 인덱스 구조를 생성하는 단계;
상기 분산 노드가, 상기 제1 인덱스 구조에서 키의 순서에 따라 상기 제1 인덱스들에 접근하고, 상기 제2 인덱스 구조에서 키의 순서에 따라 상기 제2 인덱스들에 접근하면서 상기 제1 인덱스 구조 및 상기 제2 인덱스 구조에 포함된 모든 인덱스들에 대해 각 레코드의 키, 각 레코드의 저장 위치 및 각 레코드가 소속되었던 인덱스 구조의 식별자를 지시하는 제3 인덱스들로 구성된 제3 인덱스 구조를 생성하는 단계; 및
상기 분산 노드가, 상기 제3 인덱스 구조에서 키의 순서에 따라 상기 제3 인덱스들에 접근하면서, 동일한 키 값을 갖는 제3 인덱스가 지시하는 레코드의 저장 위치 및 자료 구조의 식별자를 기준으로 접근한 레코드에 리듀스 함수를 적용하는 단계를 포함하는 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법. - 삭제
- 삭제
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020160087887A KR101772955B1 (ko) | 2016-07-12 | 2016-07-12 | 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020160087887A KR101772955B1 (ko) | 2016-07-12 | 2016-07-12 | 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR101772955B1 true KR101772955B1 (ko) | 2017-08-31 |
Family
ID=59761245
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020160087887A Expired - Fee Related KR101772955B1 (ko) | 2016-07-12 | 2016-07-12 | 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR101772955B1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102042490B1 (ko) * | 2018-09-21 | 2019-11-27 | 충북대학교 산학협력단 | 맵리듀스를 이용한 선박 외력 추정 시스템 및 방법 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101465447B1 (ko) | 2014-03-31 | 2014-12-10 | 성균관대학교산학협력단 | 외부 병합 정렬 방법, 외부 병합 정렬 시스템 및 외부 병합 정렬을 위한 분산 처리 시스템 |
| KR101515304B1 (ko) | 2013-11-08 | 2015-07-02 | 한국산업기술대학교산학협력단 | 하둡 기반의 리듀스-사이드 조인 처리 시스템의 리듀스-사이드 조인 질의 처리 방법 |
-
2016
- 2016-07-12 KR KR1020160087887A patent/KR101772955B1/ko not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101515304B1 (ko) | 2013-11-08 | 2015-07-02 | 한국산업기술대학교산학협력단 | 하둡 기반의 리듀스-사이드 조인 처리 시스템의 리듀스-사이드 조인 질의 처리 방법 |
| KR101465447B1 (ko) | 2014-03-31 | 2014-12-10 | 성균관대학교산학협력단 | 외부 병합 정렬 방법, 외부 병합 정렬 시스템 및 외부 병합 정렬을 위한 분산 처리 시스템 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102042490B1 (ko) * | 2018-09-21 | 2019-11-27 | 충북대학교 산학협력단 | 맵리듀스를 이용한 선박 외력 추정 시스템 및 방법 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9740706B2 (en) | Management of intermediate data spills during the shuffle phase of a map-reduce job | |
| CN111133409B (zh) | 确保人工智能基础设施中的再现性 | |
| US10990288B2 (en) | Systems and/or methods for leveraging in-memory storage in connection with the shuffle phase of MapReduce | |
| US10223431B2 (en) | Data stream splitting for low-latency data access | |
| US8959138B2 (en) | Distributed data scalable adaptive map-reduce framework | |
| DE112019005770T5 (de) | Speicherverwaltung für ein cloudbasiertes Speichersystem | |
| US9609050B2 (en) | Multi-level data staging for low latency data access | |
| CN107251017B (zh) | 经由基数估计的有效联结路径确定 | |
| Merceedi et al. | A comprehensive survey for hadoop distributed file system | |
| Humbetov | Data-intensive computing with map-reduce and hadoop | |
| DE112020003277T5 (de) | Erzeugen von tags für die datenzuweisung | |
| US10599614B1 (en) | Intersection-based dynamic blocking | |
| Premchaiswadi et al. | Optimizing and tuning MapReduce jobs to improve the large‐scale data analysis process | |
| Senger et al. | BSP cost and scalability analysis for MapReduce operations | |
| Fadnavis et al. | Big data processing using Hadoop | |
| Salehian et al. | Comparison of spark resource managers and distributed file systems | |
| US20250307240A1 (en) | Automatic enterprise database and query optimization | |
| KR101772955B1 (ko) | 맵리듀스 기반의 분산 처리 시스템에서 인덱스를 이용하여 레코드를 처리하는 방법 | |
| Prasad et al. | A Comparative Study of NoSQL Databases. | |
| ELomari et al. | New data placement strategy in the HADOOP framework | |
| Khan et al. | Computational performance analysis of cluster-based technologies for big data analytics | |
| JP2014153935A (ja) | 並列分散処理制御装置、並列分散処理制御システム、並列分散処理制御方法および並列分散処理制御プログラム | |
| Shabeera et al. | A novel approach for improving data locality of mapreduce applications in cloud environment through intelligent data placement | |
| CN108132970A (zh) | 基于云计算的大数据分布式处理方法及系统 | |
| Blinova et al. | Analysis of frameworks and technologies for solving big data storage and processing problems in distributed systems |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
Fee payment year number: 1 St.27 status event code: A-2-2-U10-U11-oth-PR1002 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PC1903 | Unpaid annual fee |
Not in force date: 20200825 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE St.27 status event code: A-4-4-U10-U13-oth-PC1903 |
|
| PC1903 | Unpaid annual fee |
Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20200825 St.27 status event code: N-4-6-H10-H13-oth-PC1903 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R11-asn-PN2301 St.27 status event code: A-5-5-R10-R13-asn-PN2301 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |