KR101255909B1 - 데이터 로컬리티를 보장하는 하둡 파일 시스템 - Google Patents

데이터 로컬리티를 보장하는 하둡 파일 시스템 Download PDF

Info

Publication number
KR101255909B1
KR101255909B1 KR1020110032010A KR20110032010A KR101255909B1 KR 101255909 B1 KR101255909 B1 KR 101255909B1 KR 1020110032010 A KR1020110032010 A KR 1020110032010A KR 20110032010 A KR20110032010 A KR 20110032010A KR 101255909 B1 KR101255909 B1 KR 101255909B1
Authority
KR
South Korea
Prior art keywords
node
data
information
request information
client
Prior art date
Application number
KR1020110032010A
Other languages
English (en)
Other versions
KR20120114483A (ko
Inventor
이종희
Original Assignee
주식회사 넥스알
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 넥스알 filed Critical 주식회사 넥스알
Priority to KR1020110032010A priority Critical patent/KR101255909B1/ko
Publication of KR20120114483A publication Critical patent/KR20120114483A/ko
Application granted granted Critical
Publication of KR101255909B1 publication Critical patent/KR101255909B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5678Traffic aspects, e.g. arbitration, load balancing, smoothing, buffer management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • H04L2012/6443Network Node Interface, e.g. Routing, Path finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템에 관한 것으로,
이러한 하둡 파일 시스템은 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트와; 상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버와; 상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어들; 및 상기 다수의 하드웨어들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버;를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버에 저장 및 데이터 요청정보에 포함시켜 상기 클라이언트에 전송하는 기능을 포함하는 것을 특징으로 한다.

Description

데이터 로컬리티를 보장하는 하둡 파일 시스템{Hadoop file system}
본 발명은 하둡 파일 시스템에 있어서, 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템에 관한 것이다.
하둡은 하나의 파일의 복사본을 여러 노드에 저장을 하는 분사 파일 시스템이다.
클라이언트에서 여러 노드들 중 한 노드에 파일을 다운로드 요청을 할 때, 그 파일이 다행히 같은 노드에 있으면 그 파일을 바로 클라이언트에게 전달해 줄 수 있지만, 다른 노드에 있으면 파일이 있는 노드에서 파일을 네트웍을 통해 읽어와서 클라이언트에게 전달을 해준다. 많은 요청을 처리할 경우 이러한 구조는 많은 네트웍 트래픽을 유발한다.
본 발명은 상기와 같은 문제를 해결하고자 안출된 것으로, 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템을 제공하는 것을 목적으로 한다.
상기와 같은 본 발명의 목적은,
소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트와;
상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버와;
상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어들; 및
상기 다수의 하드웨어들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버;를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버에 저장 및 데이터 요청정보에 포함시켜 상기 클라이언트에 전송하는 기능을 포함하는 것을 특징으로 하는 데이터 로컬리티를 보장하는 하둡 파일 시스템에 의해 달성된다.
한편, 상기 클라이언트는 어플리케이션 서버로부터 노드검색정보를 포함하는 데이터 요청정보를 수신하면, 노드검색정보를 포함하는 데이터 요청정보를 로드 밸런서 서버에 재전송하고,
로드 밸런서는 노드검색정보에 따른 해당 노드가 구비된 하드웨어의 어플리케이션 서버에 재전송하는 것을 더 포함하는 것이 바람직하다.
본 발명에 의하면, 파일이 있는 서버에서 파일 다운로드 요청을 처리함으로써 클라이언트 응답시간을 최소화할 수 있다.
파일이 있는 서버에서 파일을 클라이언트에 바로 전송함으로써 다른 서버와의 네트웍통신을 최소화하여 성능 향상을 시킬 수 있다.
도 1은 본 발명에 따른 데이터 로컬리티를 보장하는 하둡 파일 시스템의 개략적인 구성도,
도 2 및 도 3은 본 발명에 따른 데이터 로컬리티를 보장하는 하둡 파일 시스템의 동작 관계를 나타낸 도면.
본 발명은 하둡 파일 시스템에 있어서, 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 하둡 파일 시스템에 관한 것이다.
즉, 클라이언트는 어떤 노드에 파일이 있는지 알 수 없으므로 첫번째 요청에서는 무작위 노드에게 요청을 전달하고 다행히 그 노드에 파일이 있으면 요청을 처리해 파일을 클라인언트에게 전달을 하고, 없으면 파일이 있는 노드를 검색한 후 그 노드 정보를 포함하여 클라이언트에게 재요청을 하도록 요구한다. 이때 캐쉬 서버에 해당 결과 즉 파일이름과 노드위치를 캐싱 하므로써 이 후 파일이 있는 노드를 찾는 시간을 줄일 수 있다. 이렇게 하므로써 하둡을 이용할 때 최소한의 네트웍 트래픽으로 많은 클라이언트 요청을 처리할 수 있다.
이를 위해 본 발명에 따른 하둡 파일 시스템은 도 1에 도시한 바와 같이 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트(301,302,303)와; 상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버(10)와; 상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어(41,42,43)들; 및 상기 다수의 하드웨어(41,42,43)들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버(50);를 포함하며,
상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트(301,302,303)에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버(50)에 저장 및 상기 데이터 요청정보에 포함시켜 상기 클라이언트(301,302,303)에 전송하는 기능을 포함하는 것을 특징으로 한다.
한편, 상기 클라이언트(301,302,303)는 어플리케이션 서버로부터 노드검색정보를 포함하는 데이터 요청정보를 수신하면, 노드검색정보를 포함하는 데이터 요청정보를 로드 밸런서 서버에 재전송하고, 이때 상기 로드 밸런서(10)는 노드검색정보에 따른 해당 노드가 구비된 하드웨어의 어플리케이션 서버에 재전송하는 것을 더 포함함을 특징으로 한다.
상기와 같은 구성으로 이루어진 하둡 파일 시스템에서 네트웍 트래픽을 현저하게 줄일 수 있도록 클라이언트에서 파일을 요청하면 해당 파일이 있는 노드에서 처리할 수 있도록 데이터 로컬리티를 보장하는 방법을 도 2를 참조하면 대략 다음과 같다.
① 클라이언트(301)는 소요 데이터 획득을 위한 데이터 요청정보를 로드밸런서 서버(10)에 전송한다. 데이터 요청정보에는 클라이언트(301)가 소요하는, 또는 필요로 하는 데이터 정보(파일이름, 파일종류 등)를 포함하고, 데이터가 저장된 노드 위치정보는 있을 수도, 없을 수도 있다.
② 로드 밸런서 서버(10)가 요청을 받고 요청을 분석한 후 특정 노드의 위치 정보가 없다는 것이 확인되면 무작위로 어느 하나의 어플리케이션 서버(21)에게 상기 데이터 요청정보를 전송한다.
③,④,⑤ 데이터 요청정보를 전송 받은 어플리케이션 서버(21)는 하둡 분산 파일 시스템(100)에서 파일의 위치를 확인 후 같은 장비(#1 H/W)에 속한 노드(31)에 파일이 있으면 해당 파일을 클라이언트에 전송하고 없으면 파일이름과 파일이 있는 노드위치 맵정보를 글로벌 캐쉬 서버(50)에 저장한 후 클라이언트(301)에 노드위치 정보를 포함하여 재요청(redirect)를 하도록 응답한다.
⑥,⑦ 만약 클라이언트(301)가 재요청(redirect)하도록 응답을 받으면 로드 밸런서 서버(10)를 통하여 해당 노드(33)를 갖는 하드웨어(43)에 속한 어플리케이션 서버(23)에 다시 요청을 한다.
⑧ 요청을 받은 어플리케이션 서버(23)는 같은 하드웨어(43)에 속한 노드(33)에서 파일(33a)을 찾아 클라이언트(301)에게 전달을 한다.
이와 같은 동작으로 글로벌 캐쉬 서버(50)에는 파일과 파일위치정보가 누적되므로 이 후 파일이 있는 노드를 찾는 시간이 단축된다. 따라서 본 발명에 따른 하둡 파일 시스템을 이용하면 최소한의 네트웍 트래픽으로 많은 클라이언트 요청을 처리할 수 있다.
한편, 도 3은 클라이언트(301)에서 요청하는 데이터 요청정보에 노드의 위치정보가 포함된 것을 전제로 한 하둡 파일 시스템의 동작관계로서 설명하면,
㉠ 클라이언트(301)에서 데이터 요청정보를 전송하면,
㉡ 로드 밸런서 서버(10)는 해당 노드(31)를 갖는 #1 하드웨어(41)의 어플리케이션 서버(21)에 데이터 요청정보를 전송하고,
㉢,㉣ 어플리케이션 서버(21)는 노드(31)에 저장된 해당 파일(31a)을 상기 클라이언트(301)에 전송한다.
이상 본 발명이 양호한 실시예와 관련하여 설명되었으나, 본 발명의 기술 분야에 속하는 자들은 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에 다양한 변경 및 수정을 용이하게 실시할 수 있을 것이다. 그러므로 개시된 실시예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 진정한 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
10: 로드 밸런서 서버 21,22,23: 어플리케이션 서버
31,32,33: 노드 41,42,43: 하드웨어
50: 글로벌 캐쉬 서버

Claims (2)

  1. 소요 데이터 획득을 위한 데이터 요청정보를 전송하는 기능을 포함하는 클라이언트(301,302,303);
    상기 데이터 요청정보에 노드정보를 포함하고 있는지에 대한 여부를 확인한 후, 노드정보가 있으면 해당 노드가 구비된 하드웨어에, 노드정보가 없으면 임의의 하드웨어에 상기 데이터 요청정보를 전송하는 기능을 포함하는 로드 밸런서 서버(10);
    상기 데이터 요청정보를 처리하는 어플리케이션 서버와, 데이터가 저장된 노드를 포함하는 다수의 하드웨어(41,42,43)들; 및
    상기 다수의 하드웨어(41,42,43)들의 노드에 저장된 데이터 정보를 관리하는 기능을 포함하는 글로벌 캐쉬 서버(50);를 포함하며,
    상기 어플리케이션 서버는 노드에 상기 소요 데이터가 존재하는지에 대한 여부를 확인한 후, 소요 데이터가 있으면 상기 클라이언트(301,302,303)에 해당 데이터를 전송하고, 소요 데이터가 없으면 소요 데이터가 저장된 노드를 검색하여 노드검색정보를 취득하고 이를 상기 글로벌 캐쉬 서버(50)에 저장 및 상기 데이터 요청정보에 포함시켜 상기 클라이언트(301,302,303)에 전송하는 기능을 포함하는 것을 특징으로 하는 데이터 로컬리티를 보장하는 하둡 파일 시스템.
  2. 제 1항에 있어서,
    상기 클라이언트(301,302,303)는 어플리케이션 서버로부터 노드검색정보를 포함하는 데이터 요청정보를 수신하면, 노드검색정보를 포함하는 데이터 요청정보를 로드 밸런서 서버(10)에 재전송하고,
    상기 로드 밸런서 서버(10)는 노드검색정보에 따른 해당 노드가 구비된 하드웨어의 어플리케이션 서버에 재전송하는 것을 더 포함함을 특징으로 하는 데이터 로컬리티를 보장하는 하둡 파일 시스템.
KR1020110032010A 2011-04-07 2011-04-07 데이터 로컬리티를 보장하는 하둡 파일 시스템 KR101255909B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110032010A KR101255909B1 (ko) 2011-04-07 2011-04-07 데이터 로컬리티를 보장하는 하둡 파일 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110032010A KR101255909B1 (ko) 2011-04-07 2011-04-07 데이터 로컬리티를 보장하는 하둡 파일 시스템

Publications (2)

Publication Number Publication Date
KR20120114483A KR20120114483A (ko) 2012-10-17
KR101255909B1 true KR101255909B1 (ko) 2013-04-17

Family

ID=47283586

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110032010A KR101255909B1 (ko) 2011-04-07 2011-04-07 데이터 로컬리티를 보장하는 하둡 파일 시스템

Country Status (1)

Country Link
KR (1) KR101255909B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101523143B1 (ko) * 2013-11-29 2015-05-26 건국대학교 산학협력단 클라우드 컴퓨팅 환경에서의 하둡-기반의 분산 멀티미디어 스트리밍 서비스 제공 시스템 및 스트리밍 서비스의 제공 방법
US10205767B2 (en) 2013-09-24 2019-02-12 Lg Cns Co., Ltd. Management system and method for a big data processing device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160071025A (ko) 2014-12-11 2016-06-21 주식회사 케이티 컨텐츠 제공 방법 및 시스템

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HDFS 기반 동적 데이터 관리를 위한 파일 관리자 설계(조성환 외 3인) 2010년 5월 *
스프링 기반 HDFS 연동 인터페이스 설계(차지훈 외 3인) 2009년 10월 *
클라우드 컴퓨팅을 위한 분산 파일 시스템 기술(민영수 외2인) 2009년 5월 *
클라우드 컴퓨팅을 위한 하둡 기반 재분배 샘플 정렬 모델(김지훈 외 2인) 2010년 6월 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10205767B2 (en) 2013-09-24 2019-02-12 Lg Cns Co., Ltd. Management system and method for a big data processing device
KR101523143B1 (ko) * 2013-11-29 2015-05-26 건국대학교 산학협력단 클라우드 컴퓨팅 환경에서의 하둡-기반의 분산 멀티미디어 스트리밍 서비스 제공 시스템 및 스트리밍 서비스의 제공 방법

Also Published As

Publication number Publication date
KR20120114483A (ko) 2012-10-17

Similar Documents

Publication Publication Date Title
US11290418B2 (en) Hybrid content request routing system
CN110290186B (zh) 一种适用于多超算中心文件传输的系统及方法
US7853721B2 (en) System and method for transmission of DNS beacons
US9525659B1 (en) Request routing utilizing point of presence load information
US9734472B2 (en) Request routing utilizing cost information
CN102299969B (zh) 一种Web访问方法、七层交换设备和服务网络
US10798199B2 (en) Network traffic accelerator
KR20140009931A (ko) 컨텐츠 이름 기반의 컨텐츠 중심 네트워크에서 컨텐츠 및 실시간 스트리밍 컨텐츠 제공을 위한 컨텐츠 요청자 및 컨텐츠 제공자의 통신 방법
CN103780679B (zh) 基于http协议的长延时远程调用方法
US20090248893A1 (en) Request routing
JP2007066161A (ja) キャッシュシステム
WO2014071786A1 (zh) 一种文件传输的方法及系统
TW201509157A (zh) 在內容分發網路(cdn)上實現請求精確調度的方法及系統
CN111683013B (zh) 一种加速网络的路由方法和加速网络
CN104239509B (zh) 多版本gis切片服务系统
US20110280247A1 (en) System and method for reducing latency via multiple network connections
US20180013610A1 (en) File delivery method, apparatus and system
WO2019006775A1 (zh) 一种数据传输方法及其系统
CN103685213A (zh) 一种减少针对dns的攻击的装置、系统和方法
US20170064003A1 (en) Session control method and computer-readable storage medium storing computer program
US8655946B2 (en) Authenticating method, conversion device, and relay device
US20150006622A1 (en) Web contents transmission method and apparatus
KR101255909B1 (ko) 데이터 로컬리티를 보장하는 하둡 파일 시스템
JP4291284B2 (ja) キャッシュシステム及びキャッシュサーバ
KR102071955B1 (ko) 분산 캐시 환경에서 멀티캐스트를 수행하는 방법 및 이를 이용한 분산 캐시 서버

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160411

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190410

Year of fee payment: 7