KR101255909B1 - 데이터 로컬리티를 보장하는 하둡 파일 시스템 - Google Patents
데이터 로컬리티를 보장하는 하둡 파일 시스템 Download PDFInfo
- Publication number
- KR101255909B1 KR101255909B1 KR1020110032010A KR20110032010A KR101255909B1 KR 101255909 B1 KR101255909 B1 KR 101255909B1 KR 1020110032010 A KR1020110032010 A KR 1020110032010A KR 20110032010 A KR20110032010 A KR 20110032010A KR 101255909 B1 KR101255909 B1 KR 101255909B1
- Authority
- KR
- South Korea
- Prior art keywords
- node
- data
- information
- request information
- client
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/54—Store-and-forward switching systems
- H04L12/56—Packet switching systems
- H04L12/5601—Transfer mode dependent, e.g. ATM
- H04L2012/5678—Traffic aspects, e.g. arbitration, load balancing, smoothing, buffer management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/64—Hybrid switching systems
- H04L12/6418—Hybrid transport
- H04L2012/6443—Network Node Interface, e.g. Routing, Path finding
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
본 발명은 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템에 관한 것으로,
이러한 하둡 파일 시스템은 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트와; 상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버와; 상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어들; 및 상기 다수의 하드웨어들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버;를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버에 저장 및 데이터 요청정보에 포함시켜 상기 클라이언트에 전송하는 기능을 포함하는 것을 특징으로 한다.
이러한 하둡 파일 시스템은 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트와; 상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버와; 상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어들; 및 상기 다수의 하드웨어들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버;를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버에 저장 및 데이터 요청정보에 포함시켜 상기 클라이언트에 전송하는 기능을 포함하는 것을 특징으로 한다.
Description
본 발명은 하둡 파일 시스템에 있어서, 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템에 관한 것이다.
하둡은 하나의 파일의 복사본을 여러 노드에 저장을 하는 분사 파일 시스템이다.
클라이언트에서 여러 노드들 중 한 노드에 파일을 다운로드 요청을 할 때, 그 파일이 다행히 같은 노드에 있으면 그 파일을 바로 클라이언트에게 전달해 줄 수 있지만, 다른 노드에 있으면 파일이 있는 노드에서 파일을 네트웍을 통해 읽어와서 클라이언트에게 전달을 해준다. 많은 요청을 처리할 경우 이러한 구조는 많은 네트웍 트래픽을 유발한다.
본 발명은 상기와 같은 문제를 해결하고자 안출된 것으로, 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템을 제공하는 것을 목적으로 한다.
상기와 같은 본 발명의 목적은,
소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트와;
상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버와;
상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어들; 및
상기 다수의 하드웨어들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버;를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버에 저장 및 데이터 요청정보에 포함시켜 상기 클라이언트에 전송하는 기능을 포함하는 것을 특징으로 하는 데이터 로컬리티를 보장하는 하둡 파일 시스템에 의해 달성된다.
한편, 상기 클라이언트는 어플리케이션 서버로부터 노드검색정보를 포함하는 데이터 요청정보를 수신하면, 노드검색정보를 포함하는 데이터 요청정보를 로드 밸런서 서버에 재전송하고,
로드 밸런서는 노드검색정보에 따른 해당 노드가 구비된 하드웨어의 어플리케이션 서버에 재전송하는 것을 더 포함하는 것이 바람직하다.
본 발명에 의하면, 파일이 있는 서버에서 파일 다운로드 요청을 처리함으로써 클라이언트 응답시간을 최소화할 수 있다.
파일이 있는 서버에서 파일을 클라이언트에 바로 전송함으로써 다른 서버와의 네트웍통신을 최소화하여 성능 향상을 시킬 수 있다.
도 1은 본 발명에 따른 데이터 로컬리티를 보장하는 하둡 파일 시스템의 개략적인 구성도,
도 2 및 도 3은 본 발명에 따른 데이터 로컬리티를 보장하는 하둡 파일 시스템의 동작 관계를 나타낸 도면.
도 2 및 도 3은 본 발명에 따른 데이터 로컬리티를 보장하는 하둡 파일 시스템의 동작 관계를 나타낸 도면.
본 발명은 하둡 파일 시스템에 있어서, 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템에 관한 것이다.
즉, 클라이언트는 어떤 노드에 파일이 있는지 알 수 없으므로 첫번째 요청에서는 무작위 노드에게 요청을 전달하고 다행히 그 노드에 파일이 있으면 요청을 처리해 파일을 클라인언트에게 전달을 하고, 없으면 파일이 있는 노드를 검색한 후 그 노드 정보를 포함하여 클라이언트에게 재요청을 하도록 요구한다. 이때 캐쉬 서버에 해당 결과 즉 파일이름과 노드위치를 캐싱 하므로써 이 후 파일이 있는 노드를 찾는 시간을 줄일 수 있다. 이렇게 하므로써 하둡을 이용할 때 최소한의 네트웍 트래픽으로 많은 클라이언트 요청을 처리할 수 있다.
이를 위해 본 발명에 따른 하둡 파일 시스템은 도 1에 도시한 바와 같이 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트(301,302,303)와; 상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버(10)와; 상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어(41,42,43)들; 및 상기 다수의 하드웨어(41,42,43)들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버(50);를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트(301,302,303)에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버(50)에 저장 및 상기 데이터 요청정보에 포함시켜 상기 클라이언트(301,302,303)에 전송하는 기능을 포함하는 것을 특징으로 한다.
한편, 상기 클라이언트(301,302,303)는 어플리케이션 서버로부터 노드검색정보를 포함하는 데이터 요청정보를 수신하면, 노드검색정보를 포함하는 데이터 요청정보를 로드 밸런서 서버에 재전송하고, 이때 상기 로드 밸런서(10)는 노드검색정보에 따른 해당 노드가 구비된 하드웨어의 어플리케이션 서버에 재전송하는 것을 더 포함함을 특징으로 한다.
상기와 같은 구성으로 이루어진 하둡 파일 시스템에서 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 방법을 도 2를 참조하면 대략 다음과 같다.
① 클라이언트(301)는 소요 데이터 획득을 위한 데이터 요청정보를 로드밸런서 서버(10)에 전송한다. 데이터 요청정보에는 클라이언트(301)가 소요하는, 또는 필요로 하는 데이터 정보(파일이름, 파일종류 등)를 포함하고, 데이터가 저장된 노드 위치정보는 있을 수도, 없을 수도 있다.
② 로드 밸런서 서버(10)가 요청을 받고 요청을 분석한 후 특정 노드의 위치 정보가 없다는 것이 확인되면 무작위로 어느 하나의 어플리케이션 서버(21)에게 상기 데이터 요청정보를 전송한다.
③,④,⑤ 데이터 요청정보를 전송 받은 어플리케이션 서버(21)는 하둡 분산 파일 시스템(100)에서 파일의 위치를 확인 후 같은 장비(#1 H/W)에 속한 노드(31)에 파일이 있으면 해당 파일을 클라이언트에 전송하고 없으면 파일이름과 파일이 있는 노드위치 맵정보를 글로벌 캐쉬 서버(50)에 저장한 후 클라이언트(301)에 노드위치 정보를 포함하여 재요청(redirect)를 하도록 응답한다.
⑥,⑦ 만약 클라이언트(301)가 재요청(redirect)하도록 응답을 받으면 로드 밸런서 서버(10)를 통하여 해당 노드(33)를 갖는 하드웨어(43)에 속한 어플리케이션 서버(23)에 다시 요청을 한다.
⑧ 요청을 받은 어플리케이션 서버(23)는 같은 하드웨어(43)에 속한 노드(33)에서 파일(33a)을 찾아 클라이언트(301)에게 전달을 한다.
이와 같은 동작으로 글로벌 캐쉬 서버(50)에는 파일과 파일위치정보가 누적되므로 이 후 파일이 있는 노드를 찾는 시간이 단축된다. 따라서 본 발명에 따른 하둡 파일 시스템을 이용하면 최소한의 네트웍 트래픽으로 많은 클라이언트 요청을 처리할 수 있다.
한편, 도 3은 클라이언트(301)에서 요청하는 데이터 요청정보에 노드의 위치정보가 포함된 것을 전제로 한 하둡 파일 시스템의 동작관계로서 설명하면,
㉠ 클라이언트(301)에서 데이터 요청정보를 전송하면,
㉡ 로드 밸런서 서버(10)는 해당 노드(31)를 갖는 #1 하드웨어(41)의 어플리케이션 서버(21)에 데이터 요청정보를 전송하고,
㉢,㉣ 어플리케이션 서버(21)는 노드(31)에 저장된 해당 파일(31a)을 상기 클라이언트(301)에 전송한다.
이상 본 발명이 양호한 실시예와 관련하여 설명되었으나, 본 발명의 기술 분야에 속하는 자들은 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에 다양한 변경 및 수정을 용이하게 실시할 수 있을 것이다. 그러므로 개시된 실시예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 진정한 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
10: 로드 밸런서 서버 21,22,23: 어플리케이션 서버
31,32,33: 노드 41,42,43: 하드웨어
50: 글로벌 캐쉬 서버
31,32,33: 노드 41,42,43: 하드웨어
50: 글로벌 캐쉬 서버
Claims (2)
- 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트(301,302,303);
상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버(10);
상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어(41,42,43)들; 및
상기 다수의 하드웨어(41,42,43)들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버(50);를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트(301,302,303)에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버(50)에 저장 및 상기 데이터 요청정보에 포함시켜 상기 클라이언트(301,302,303)에 전송하는 기능을 포함하는 것을 특징으로 하는 데이터 로컬리티를 보장하는 하둡 파일 시스템. - 제 1항에 있어서,
상기 클라이언트(301,302,303)는 어플리케이션 서버로부터 노드검색정보를 포함하는 데이터 요청정보를 수신하면, 노드검색정보를 포함하는 데이터 요청정보를 로드 밸런서 서버(10)에 재전송하고,
상기 로드 밸런서 서버(10)는 노드검색정보에 따른 해당 노드가 구비된 하드웨어의 어플리케이션 서버에 재전송하는 것을 더 포함함을 특징으로 하는 데이터 로컬리티를 보장하는 하둡 파일 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110032010A KR101255909B1 (ko) | 2011-04-07 | 2011-04-07 | 데이터 로컬리티를 보장하는 하둡 파일 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110032010A KR101255909B1 (ko) | 2011-04-07 | 2011-04-07 | 데이터 로컬리티를 보장하는 하둡 파일 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120114483A KR20120114483A (ko) | 2012-10-17 |
KR101255909B1 true KR101255909B1 (ko) | 2013-04-17 |
Family
ID=47283586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110032010A KR101255909B1 (ko) | 2011-04-07 | 2011-04-07 | 데이터 로컬리티를 보장하는 하둡 파일 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101255909B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101523143B1 (ko) * | 2013-11-29 | 2015-05-26 | 건국대학교 산학협력단 | 클라우드 컴퓨팅 환경에서의 하둡-기반의 분산 멀티미디어 스트리밍 서비스 제공 시스템 및 스트리밍 서비스의 제공 방법 |
US10205767B2 (en) | 2013-09-24 | 2019-02-12 | Lg Cns Co., Ltd. | Management system and method for a big data processing device |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160071025A (ko) | 2014-12-11 | 2016-06-21 | 주식회사 케이티 | 컨텐츠 제공 방법 및 시스템 |
-
2011
- 2011-04-07 KR KR1020110032010A patent/KR101255909B1/ko active IP Right Grant
Non-Patent Citations (4)
Title |
---|
HDFS 기반 동적 데이터 관리를 위한 파일 관리자 설계(조성환 외 3인) 2010년 5월 * |
스프링 기반 HDFS 연동 인터페이스 설계(차지훈 외 3인) 2009년 10월 * |
클라우드 컴퓨팅을 위한 분산 파일 시스템 기술(민영수 외2인) 2009년 5월 * |
클라우드 컴퓨팅을 위한 하둡 기반 재분배 샘플 정렬 모델(김지훈 외 2인) 2010년 6월 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10205767B2 (en) | 2013-09-24 | 2019-02-12 | Lg Cns Co., Ltd. | Management system and method for a big data processing device |
KR101523143B1 (ko) * | 2013-11-29 | 2015-05-26 | 건국대학교 산학협력단 | 클라우드 컴퓨팅 환경에서의 하둡-기반의 분산 멀티미디어 스트리밍 서비스 제공 시스템 및 스트리밍 서비스의 제공 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20120114483A (ko) | 2012-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11290418B2 (en) | Hybrid content request routing system | |
CN110290186B (zh) | 一种适用于多超算中心文件传输的系统及方法 | |
US7853721B2 (en) | System and method for transmission of DNS beacons | |
US9525659B1 (en) | Request routing utilizing point of presence load information | |
US9734472B2 (en) | Request routing utilizing cost information | |
CN102299969B (zh) | 一种Web访问方法、七层交换设备和服务网络 | |
US10798199B2 (en) | Network traffic accelerator | |
KR20140009931A (ko) | 컨텐츠 이름 기반의 컨텐츠 중심 네트워크에서 컨텐츠 및 실시간 스트리밍 컨텐츠 제공을 위한 컨텐츠 요청자 및 컨텐츠 제공자의 통신 방법 | |
CN103780679B (zh) | 基于http协议的长延时远程调用方法 | |
US20090248893A1 (en) | Request routing | |
JP2007066161A (ja) | キャッシュシステム | |
WO2014071786A1 (zh) | 一种文件传输的方法及系统 | |
TW201509157A (zh) | 在內容分發網路(cdn)上實現請求精確調度的方法及系統 | |
CN111683013B (zh) | 一种加速网络的路由方法和加速网络 | |
CN104239509B (zh) | 多版本gis切片服务系统 | |
US20110280247A1 (en) | System and method for reducing latency via multiple network connections | |
US20180013610A1 (en) | File delivery method, apparatus and system | |
WO2019006775A1 (zh) | 一种数据传输方法及其系统 | |
CN103685213A (zh) | 一种减少针对dns的攻击的装置、系统和方法 | |
US20170064003A1 (en) | Session control method and computer-readable storage medium storing computer program | |
US8655946B2 (en) | Authenticating method, conversion device, and relay device | |
US20150006622A1 (en) | Web contents transmission method and apparatus | |
KR101255909B1 (ko) | 데이터 로컬리티를 보장하는 하둡 파일 시스템 | |
JP4291284B2 (ja) | キャッシュシステム及びキャッシュサーバ | |
KR102071955B1 (ko) | 분산 캐시 환경에서 멀티캐스트를 수행하는 방법 및 이를 이용한 분산 캐시 서버 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160411 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190410 Year of fee payment: 7 |