KR20100038800A - 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템 - Google Patents

캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템 Download PDF

Info

Publication number
KR20100038800A
KR20100038800A KR1020080097897A KR20080097897A KR20100038800A KR 20100038800 A KR20100038800 A KR 20100038800A KR 1020080097897 A KR1020080097897 A KR 1020080097897A KR 20080097897 A KR20080097897 A KR 20080097897A KR 20100038800 A KR20100038800 A KR 20100038800A
Authority
KR
South Korea
Prior art keywords
data
cache server
content
priority
server
Prior art date
Application number
KR1020080097897A
Other languages
English (en)
Other versions
KR101131787B1 (ko
Inventor
장현민
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to KR1020080097897A priority Critical patent/KR101131787B1/ko
Publication of KR20100038800A publication Critical patent/KR20100038800A/ko
Application granted granted Critical
Publication of KR101131787B1 publication Critical patent/KR101131787B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Signal Processing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템에 관한 것으로, 본 발명에 의하면 캐시서버에서 특정기간 동안 복수 데이터의 히트(Hit) 수, 스테일 타임(stale time) 및 데이터의 사이즈 정보를 수집하고 데이터 각각의 우선순위를 결정하여 저장할 수 있으며, 이를 통해, 캐시서버의 저장 효율을 높일 수 있고 응답지연을 줄일 수 있다.
CDN, 캐시서버, 우선순위

Description

캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템{Method for updating data stored in cache server, cache server and content delivery system thereof}
본 발명은 데이터의 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템에 관한 것으로, 특히 캐시서버에서 복수 데이터의 히트 수, 스테일 타임 및 데이터 사이즈를 고려하여 우선순위를 결정하고 이에 따라 각 데이터를 저장하는 캐시서버에 저장된 데이터의 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템에 관한 것이다.
일반적으로 컨텐츠 제공자(CP: Content Provider)의 웹 서버가 클라이언트에 제공할 컨텐츠(예컨대, 동영상, 음악, 파일 등)의 수는 매우 많다. 웹 서버가 이들의 일부 또는 전부를 다수의 클라이언트들 각각에게 일대일로 제공하기에는 많은 부하가 발생한다. 왜냐하면, 웹 서버는 단일의 ISP(Internet Service Provider)에 연결되어 있는데 반하여 컨텐츠를 요구하는 클라이언트는 다수의 ISP에 존재하기 때문이다.
따라서 ISP들 간의 트래픽은 컨텐츠 제공자와 클라이언트가 늘어남에 따라 기하급수적으로 증가하게 되고, 트래픽 혼잡으로 인한 전송지연 및/또는 전송실패 율이 높아진다. 최악의 경우에는 웹 서버의 기능장애(fail-over)가 발생하기도 한다.
이러한 문제점을 극복하기 위해 도입된 것이 CDN(Content Delivery Network)이다. CDN이란 클라이언트들로부터 멀리 떨어져 있는 컨텐츠 제공자의 웹 서버에 집중되어 있는 컨텐츠, 예를 들어 그림, 배너, 비디오 또는 오디오와 같이 용량이 크거나 클라이언트들의 요구가 빈번한 컨텐츠를 다수의 ISP 상호 접속점(PoP: Point of Presence)에 광역적으로 분산 배치된 호스트 서버에 미리 저장해 놓고, 클라이언트의 요구가 있을 경우 해당 이용자와 가장 근접한 호스트 서버의 경로를 반환함으로써 클라이언트가 그 반환된 경로를 통해 호스트 서버에 접속한 후 컨텐츠를 제공받을 수 있도록 한 서비스이다. 여기서 호스트 서버는 캐시서버, 복제서버 또는 고스트 서버(이하, 캐시서버로 칭함)로 다양하게 일컬어진다.
캐시서버는 다수의 컨텐츠 서버로부터 수신한 다양한 컨텐츠 들을 저장하는데, 그 저장공간의 한계로 인하여 컨텐츠 서버가 보유한 컨텐츠 중 일부만이 저장될 수 있다. 캐시서버에 저장되는 컨텐츠의 선택에 있어, 종래에는, 클라이언트가 요청하는 컨텐츠가 캐시서버에 저장되어 있는지 확인한 후, 없는 경우 컨텐츠 서버로 요청하여 클라이언트로 전송함과 동시에 캐시서버에 저장하는 방식을 사용해 왔다.
이러한 종래의 기술은 캐시서버의 한정된 저장소에서 어떠한 데이터를 삭제하고 저장할 것인지, 그리고 실제로 클라이언트가 요청하는 컨텐츠가 캐시서버에 저장될 가치가 있을 정도로 인기가 있는(popular) 컨텐츠인지에 대해 고려함이 없 이 저장함으로써, 캐시서버의 저장 효율을 떨어뜨린다는 문제가 있었다.
본 발명은 상기한 종래의 문제점을 해결하기 위해 제안된 것으로서, 데이터의 히트 수, 스테일 타임 및 데이터 사이즈를 고려하여 캐시서버에 저장되는 컨텐츠를 선택함으로써 캐시서버의 저장효율을 높이고 전체 응답지연(latency)을 줄일 수 있는 캐시서버에 저장된 데이터의 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템을 제공하는데 그 목적이 있다.
상기와 같은 목적을 달성하기 위한 본 발명의 캐시서버에 저장된 데이터 갱신방법은, 캐시서버에서 특정기간 동안 복수 데이터의 히트 수, 스테일 타임 및 상기 데이터의 사이즈 정보를 수집하는 수집단계, 상기 캐시서버에서 상기 수집단계에서 수집된 정보를 이용하고 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 상기 데이터의 값들을 계산하여 우선순위를 결정하는 결정단계, 및 상기 캐시서버에서 상기 결정단계에서 결정한 우선순위에 따라 상기 데이터를 저장하는 저장단계를 포함한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 수집단계는, 상기 캐시서버에 기저장된 데이터 및 하나 이상의 컨텐츠서버에 저장된 데이터에 대한 정보를 수집하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 수집단계는, 상기 캐시서버가 상기 하나 이상의 컨텐츠서버로부터 해당 컨텐츠서버에 저 장된 데이터에 대한 정보를 수신하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 결정단계에서, 상기 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 상기 데이터 값들 중 하나 이상의 값은 로그값인 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 결정단계는, 상기 계산한 값들을 이용하여 상기 데이터의 벡터값을 계산하고 해당 벡터값의 절대값을 다른 데이터의 절대값과 비교하여 우선순위를 결정하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 결정단계는, 상기 계산한 데이터의 값들 중 하나 이상의 값에 가중치 값을 곱하여 우선순위를 결정하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 저장단계는, 상기 결정단계에서 결정된 우선순위가 큰 데이터부터 순차적으로 저장하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 저장단계는, 상기 결정단계에서 결정한 우선순위가 큰 데이터부터 순차적으로 해당 데이터의 사이즈를 합하여 그 합이 상기 캐시서버의 저장 용량 이하가 되는 데이터까지 저장하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 저장된 데이터 갱신방법에 있어서, 상기 저장단계는, 상기 저장하는 데이터와 상기 캐시서버에 기저장된 데이터를 비교하여, 중복 되는 데이터를 제외한 나머지 데이터를 저장하는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명의 캐시서버는, 데이터 송수신을 위한 입출력부, 컨텐츠를 저장하는 데이터베이스, 및 특정기간 동안 복수 데이터의 히트 수, 스테일 타임 및 상기 데이터의 사이즈 정보를 수집하고 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 각각의 값을 계산하여 각 데이터의 우선순위를 결정하며 해당 우선순위에 따라 상기 데이터를 상기 데이터베이스에 저장하는 제어모듈을 포함한다.
본 발명에 따른 캐시서버에 있어서, 상기 제어모듈은, 상기 캐시서버에 기저장된 데이터 및 하나 이상의 컨텐츠서버에 저장된 데이터에 대한 정보를 수집하는 것을 특징으로 한다.
본 발명에 따른 캐시서버에 있어서, 상기 제어모듈은, 상기 계산한 값들을 이용하여 상기 데이터의 벡터값을 계산하고 해당 벡터값의 절대값을 다른 데이터의 절대값과 비교하여 우선순위를 결정하는 것을 특징으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명의 컨텐츠 제공시스템은, 컨텐츠 데이터를 제공하며 특정기간 동안 상기 컨텐츠 데이터에 대한 히트 수, 스테일 타임 및 상기 컨텐츠 데이터의 사이즈 정보를 수집하여 전송하는 컨텐츠서버, 및 상기 컨텐츠서버가 제공한 컨텐츠를 저장하여 상기 저장한 컨텐츠 데이터에 대한 특정기간 동안의 히트 수, 스테일 타임 및 상기 데이터의 사이즈 정보를 수집하고, 상기 컨텐츠서버가 전송한 정보를 수신하여, 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 각각의 데이터의 값들을 계산하고 우선순위를 결정하며, 해당 우선순위에 따라 상기 컨텐츠 데이터를 저장하는 캐시서버를 포함한다.
본 발명에 의하면, 클라이언트로부터 빈번히 요청되는 컨텐츠를 선별적으로 캐시서버에 저장할 수 있어 캐시서버의 저장 효율을 높일 수 있게 되고, 이로 인해 클라이언트의 컨텐츠 요청에 따른 응답지연을 줄일 수 있게 된다.
이하 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있는 바람직한 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예에 대한 동작 원리를 상세하게 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 도면 전체에 걸쳐 유사한 기능 및 작용을 하는 부분에 대해서는 동일한 도면 부호를 사용한다.
도 1은 본 발명의 일 실시예에 따른 컨텐츠 제공시스템의 구성도이다. 도 1을 참조하면, 본 실시예에 따른 컨텐츠 제공시스템은 네트워크(network)를 통해 데이터 송수신이 가능한 캐시서버(100), 컨텐츠서버(200) 및 클라이언트(300)를 포함하여 구성된다.
클라이언트(300)는 네트워크로 연결된 서버로부터 정보를 제공받는 컴퓨터 등을 의미한다. 클라이언트(300)는 브라우저에 특정 컨텐츠를 요청(request)하는 URL(Uniform Resource Locater) 등이 입력되면, DNS(Domain Name Server) 등의 네임서버에 액세스(access)하여 도메인명을 해당 컨텐츠를 제공하는 컨텐츠서버(200) 또는 캐시서버(100)의 IP 주소로 변환하고 해당 IP 주소에 대응되는 서버로 접속하는 역할을 한다.
컨텐츠서버(200)는 컨텐츠 제공자가 제공하는 웹페이지 및 객체(object) 등을 저장하고 있다가 클라이언트(300)로부터의 컨텐츠 요청이 있을 경우 응답하는 역할을 하는 서버이다. 즉, 컨텐츠서버(200)는 클라이언트(300)로부터 요청된 컨텐츠를 전송하는 역할을 하며, 컨텐츠서버(200)가 보유한 컨텐츠 중 일부를 캐시서버(100)로 전송하여 저장하도록 한다. 이를 통해, 캐시서버(100)에서 클라이언트(300)의 요청에 따른 컨텐츠를 신속하게 제공하는 것이 가능하게 된다.
캐시서버(cache server)(100)는 예를 들어, 복제서버(copy server) 또는 고스트 서버(ghost server) 등으로 불리며, 컨텐츠서버(200)가 저장 및 관리하는 컨텐츠 데이터의 복사본을 저장하여 클라이언트(300)로부터의 컨텐츠 요청이 있을 경우 신속하게 제공하는 역할을 한다.
본 발명에서 캐시서버(100)는 특정기간 동안 복수 데이터의 히트 수, 스테일 타임 및 상기 데이터의 사이즈 정보를 수집하는 기능을 한다. 데이터의 히트(hit) 수는 해당 컨텐츠에 대한 요청 횟수 또는 요청에 대한 응답 횟수 등을 의미한다. 스테일 타임(stale time)은 해당 컨텐츠가 마지막으로 요청된 시간부터 현재까지의 시간을 의미한다. 데이터의 사이즈는 바이트(byte) 단위 등으로 표현한 각 컨텐츠 데이터의 크기를 의미한다.
캐시서버(100)는 캐시서버(100)에 기저장된 컨텐츠 데이터뿐만 아니라, 캐시서버(100)에는 저장되어 있지 않으나 컨텐츠서버(200)에서 제공하는 컨텐츠 데이터에 대한 정보를 수집할 수도 있다. 컨텐츠서버(200)에서 제공하는 컨텐츠 데이터에 대한 히트 수, 스테일 타임 및 데이터 사이즈 정보를 수집하는 경우에는, 컨텐츠서버(200)에서 해당 정보들을 수집하고 캐시서버(100)가 수신하는 방식으로 정보의 수집이 이루어질 수 있다.
캐시서버(100)는 복수 데이터의 히트 수, 스테일 타임 및 데이터 사이즈 정보를 수집하면, 수집한 정보를 이용하여 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 데이터의 값들을 계산한다. 이는, 히트 수가 높을수록 또는 스테일 타임이 작을수록 클라이언트(300)로부터의 요청이 빈번한 컨텐츠이고, 캐시서버(100)에 저장하여 응답 지연시간을 줄일 필요가 있기 때문이다. 또한, 캐시서버(100)의 저장공간은 한정되어 있으므로, 데이터 사이즈가 상대적으로 작은 컨텐츠에 우선순위를 두어 캐시서버(100)에 저장할 수 있도록 데이터 사이즈의 역수 값을 계산한다.
특정 실시예에서, 계산에 이용하는 히트 수, 스테일 타임 및 데이터 사이즈 등의 정보는 계산에 용이하도록, 예를 들어, 로그 척도(log scale)로 계산된 로그값일 수 있을 것이다. 또 다른 실시예에서, 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 값들 각각에 가중치 값을 곱하여 우선순위를 계산 하는 데 이용할 수도 있다.
본 발명의 일 실시예에서, 캐시서버(100)는 계산한 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 값을 이용하여 각 컨텐츠 데이터의 벡터값을 계산한다. 예를 들어, 이때 계산되는 히트 수의 벡터값은 (히트 수 값, 0, 0), 스테일 타임 역수의 벡터값은 (0, 스테일 타임의 역수값, 0), 데이터 사이즈 역수의 벡터값은 (0, 0, 데이터 사이즈의 역수값)과 같이 표현될 수 있다. 이때, 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수로 표현되는 데이터의 벡터값은 (히트 수 값, 스테일 타임의 역수값, 데이터 사이즈의 역수값)과 같다.
그리고 계산한 벡터값의 절대값을 다른 데이터의 절대값과 비교하여 우선순위를 계산한다. 예를 들어, 각 데이터 벡터값의 절대값을 계산하는 식은 아래의 수학식 1과 같을 수 있을 것이다.
Figure 112008069789944-PAT00001
벡터값의 절대값 =
* 'A' 는 히트 수의 벡터값
* 'B' 는 스테일 타임의 역수의 벡터값
* 'C' 는 데이터 사이즈의 역수의 벡터값
데이터들의 절대값을 비교하여 우선순위를 결정하는 경우, 벡터 각각의 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 값에 가중치 값을 곱하여 우선순위를 결정할 수도 있다. 가중치 값은 세 개의 축에 대응되는 값의 크기 차이가 큰 경우 또는 우선순위 결정에 미치는 중요도에 있어 상대적인 차이가 있는 경우 등에 있어 이를 보정해 주기 위한 인자 값이다. 가중치 값을 주어 각 데이터 벡터값의 절대값을 구하는 식은, 예를 들어, 아래의 수학식 2 또는 수학식 3과 같을 수 있다.
Figure 112008069789944-PAT00002
벡터값의 절대값 =
* 'A' 는 히트 수의 벡터값
* 'B' 는 스테일 타임의 역수의 벡터값
* 'C' 는 데이터 사이즈의 역수의 벡터값
* 'l' 는 히트 수의 가중치 값
* 'm' 는 스테일 타임의 역수의 가중치 값
* 'n' 는 데이터 사이즈의 역수의 가중치 값
Figure 112008069789944-PAT00003
벡터값의 절대값 =
* 'A' 는 히트 수의 벡터값
* 'B' 는 스테일 타임의 역수의 벡터값
* 'C' 는 데이터 사이즈의 역수의 벡터값
* 'l' 는 히트 수의 가중치 값
* 'm' 는 스테일 타임의 역수의 가중치 값
* 'n' 는 데이터 사이즈의 역수의 가중치 값
캐시서버(100)는 각 컨텐츠 데이터 벡터값의 절대값을 구하면 그 값을 서로 비교하여 우선순위가 큰 데이터부터 순차적으로 데이터베이스 등의 저장공간에 저장한다. 우선순위에 따라 저장하는 경우, 캐시서버(100)는 우선순위가 큰 데이터부터 순차적으로 해당 데이터의 사이즈를 합하여 그 합이 캐시서버(100) 내 저장공간의 저장 용량 이하가 되는 데이터까지 저장하도록 할 수 있다. 해당 저장 용량은, 예를 들어, 특정 컨텐츠 제공자에 대해 할당된 저장공간의 용량일 수도 있고, 특정 데이터 종류를 저장하기 위한 저장공간의 용량일 수도 있다.
이때, 데이터 사이즈의 합의 캐시서버(100) 내 저장 용량 이내인 데이터 중, 기존에 캐시서버(100)에 저장되어 있는 컨텐츠와 중복되는 컨텐츠의 데이터가 있다면, 해당 중복 컨텐츠를 제외한 나머지 컨텐츠의 데이터만을 캐시서버(100)에 저장하도록 할 수 있다. 이 경우, 저장되는 컨텐츠 데이터는 컨텐츠서버(200) 등으로부터 수신하여 저장하게 된다.
본 발명의 일 실시예에 따른 캐시서버(100)의 구성에 대해서는 도 2를 참조하여 좀 더 상세히 설명하기로 한다.
도 2는 본 발명의 일 실시예에 따른 캐시서버(100)의 구성도이다. 도 2를 참조하면 캐시서버(100)는 입출력부(110), 제어모듈(120) 및 데이터베이스(130)를 포함하여 구성된다.
입출력부(110)는 데이터 송수신을 위한 인터페이스를 갖는다.
데이터베이스(130)는 캐시서버(100)에 저장되는 컨텐츠 데이터의 저장소이다.
제어모듈(120)은 입출력부(110)를 통해 송수신되는 데이터 및 데이터베이스(130)에 저장되는 데이터를 제어하는 모듈이다. 본 발명의 제어모듈(120)은 특정기간 동안 캐시서버(100) 또는 컨텐츠서버(200)에 저장된 복수 데이터의 히트 수, 스테일 타임 및 데이터 사이즈 정보를 수집한다. 컨텐츠서버(200)에 저장된 데이터에 대한 정보의 수집은 네트워크 및 입출력부(110)를 통하여 컨텐츠서버(200)로부터 해당 정보를 수신하는 방식으로 이루어질 수 있다.
그리고 제어모듈(120)은 수집한 정보를 이용하여 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 각각의 값을 계산하여 각 데이터의 우선순위를 결정한다. 이때, 제어모듈(120) 계산한 값들을 이용하여 대응되는 데이터의 벡터값을 계산하고 해당 벡터값의 절대값을 다른 데이터의 절대값과 비교하여 우선순위를 결정할 수 있다.
제어모듈(120)이 수집한 정보들을 이용하여 우선순위를 결정하는 과정에 대해서는 도 3을 참조하여 좀 더 상세하게 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 우선순위 결정 테이블(300)의 구성도이다. 우선순위 결정 테이블(300)은 상기 수학식 2의 방식으로 우선순위를 결정하는 데에 참조하는 테이블의 일 례이며, 본 발명의 기술적 범위는 아래의 설명에 한정되는 것이 아니다.
본 실시예에서 우선순위 결정 테이블(300)을 참조하면, 데이터, 히트 수, 스테일 타임, 데이터 사이즈, 가중치 값, 절대값 및 우선순위 항목을 포함하여 이루어진다.
데이터 항목은 우선순위를 결정하여 캐시서버(100)에 저장되는 대상이 될 수 있는 데이터를 나타내는 필드이다.
히트 수 항목은 특정 기간 동안 클라이언트(300)로부터 해당 데이터가 요청된 횟수 벡터의 크기를 나타내는 필드이다.
스테일 타임 항목은 마지막으로 해당 데이터가 요청된 이후 현재까지의 경과 시간 벡터의 크기를 나타내는 필드이다.
데이터 사이즈는 해당 데이터 사이즈 벡터의 크기를 나타내는 필드이다.
본 실시예에서 히트 수, 스테일 타임 및 데이터 사이즈 항목은 로그 척도(log scale)로 표현된 값을 나타낸다.
가중치 값 항목은 우선순위 결정에 있어 히트 수의 벡터값, 스테일 타임 역수의 벡터값 및 데이터 사이즈 역수의 벡터값의 보정을 위해 각각의 값에 곱해지는 값을 나타내는 필드이다.
절대값 항목은 각각의 벡터값을 이용하여 계산한 절대값을 나타내는 필드이다.
우선순위 항목은 계산한 절대값을 이용하여 결정된 각 데이터의 우선순위를 나타내는 필드이다.
우선순위 결정 테이블(300)의 1번 행(row)(No.1)을 참조하면, 데이터가 'XXX.gif'이고 로그 척도로 계산한 해당 데이터의 히트 수 벡터값의 크기, 스테일 타임 벡터값의 크기 및 데이터 사이즈 벡터값의 크기가 각각 2, 3, 3 임을 알 수 있다.
가중치 값 항목을 참조하면, 가중치가 '1, 4, 3'으로 되어 있으므로, 벡터값의 절대값을 계산함에 있어, 히트 수의 벡터값(log scale)에는 '1'이, 스테일 타임 역수의 벡터값에는 '4'가, 데이터 사이즈 역수의 벡터값에는 '3'의 가중치 값이 각각 곱해진다.
상기 값들을 이용하여 수학식 2의 계산법으로 데이터 'XXX.gif'의 벡터값의 절대값을 계산하면, l=1, |A|=2, m=4, |B|=1/3, n=3, |C|=1/3이 되므로, 절대값은 대략 2.6이 된다.
마찬가지로, 우선순위 결정 테이블(300)의 2번 행 및 3번 행을 참조하면, 'YYY.gif' 데이터의 히트 수 벡터값의 크기, 스테일 타임 벡터값의 크기 및 데이터 사이즈 벡터값의 크기가 각각 3, 4, 2 이고, 'ZZZ.gif' 데이터의 히트 수 벡터값의 크기, 스테일 타임 벡터값의 크기 및 데이터 사이즈 벡터값의 크기가 각각 2, 4, 3 임을 알 수 있다.
가중치 값은 모두 1, 4, 3 이므로, 1번 행과 같은 방법으로 계산하면 'YYY.gif' 데이터 벡터값의 절대값은 대략 3.5 이고, 'ZZZ.gif' 데이터 벡터값의 절대값은 대략 2.45가 된다.
각 데이터에 대응되는 절대값을 비교하여, 그 절대값이 큰 순서대로 우선순위를 결정하면, 'YYY.gif' 데이터가 우선순위가 제일 높은 '1'의 값을 갖고, 다음으로 'XXX.gif'의 데이터가 '2'의 우선순위를 갖게 되며, 'ZZZ.gif'의 데이터가 '3'의 우선순위를 갖게 된다. 해당 우선순위 값은 다른 데이터에 대한 벡터값의 절대값을 계산하여 바뀔 수 있다.
본 실시예에서 우선순위 결정 테이블(300)의 데이터가 확장자가 'gif'인 파일로 되어 있으나, 본 발명의 기술적 범위가 이것에 한정되지 않는 것은 물론이다. 또한 각 데이터의 우선순위 계산에 있어 상기 수학식 1 또는 수학식 3과 같은 다른 수학식을 이용하거나, 가중치 값을 변경함으로써 본 실시예와 다른 우선순위 값이 결정될 수 있다.
본 발명의 일 실시예에 따른 캐시서버(100)에 저장된 데이터를 갱신하는 과정에 대해서는 도 4를 참조하여 좀 더 상세하게 설명하기로 한다.
도 4는 본 발명의 일 실시예에 따른 캐시서버(100)에 저장된 데이터 갱신방법의 흐름도이다. 도 4를 참조하면, 캐시서버(100)는 내부의 데이터베이스에 저장된 데이터 및/또는 컨텐츠서버(200)에 저장된 데이터의 히트 수, 스테일 타임 및 데이터 사이즈 정보를 수집한다(S410). 컨텐츠서버(200)에 저장된 데이터에 대한 정보는 캐시서버(100)가 컨텐츠서버(200)로 부터 해당 정보를 수신하는 방식으로 이루어질 수 있다.
캐시서버(100)는 수집된 정보를 이용하여 히트 수, 스테일 타임의 역수, 및 데이터 사이즈의 역수 축에 대응되는 데이터 각각의 값을 계산한다(S420). 그리고 단계(S420)에서 계산된 값들을 이용하여 어떠한 데이터가 저장되어야 하는지에 대한 우선순위를 결정한다(S430).
단계(S430)에서 각 데이터의 우선순위가 결정되면, 해당 데이터를 우선순위에 따라 정렬하고(S440), 정렬된 순서에 따라 각 데이터 사이즈의 합을 계산한다(S450).
그리고 캐시서버(100)는 단계(S450)에서 계산한 데이터 사이즈의 합과 설정된 캐시서버(100)의 저장 용량을 고려하여, 데이터 사이즈의 합이 해당 저장 용량 이하가 되는 데이터까지를 캐시서버(100)에 저장될 데이터로 선택한다(S460).
단계(S460)에서 저장될 데이터가 선택되면, 캐시서버(100)는 이미 저장되어 있는 데이터와 중복되는 데이터를 제외하고(S470), 중복되지 않는 데이터를 저장한다(S480).
본 발명에 의하면, 캐시서버에 저장되는 컨텐츠의 우선순위를 고려하고 캐시서버에 이미 저장된 데이터를 제외한 나머지 데이터 만을 저장할 수 있어, 캐시서버의 저장 효율을 높일 수 있으며, 네트워크 대역폭의 낭비를 줄이고 클라이언트로 부터 빈번히 요청되는 컨텐츠에 대한 응답지연을 줄일 수 있다.
도 1은 본 발명의 일 실시예에 따른 컨텐츠 제공시스템의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 캐시서버의 구성도이다.
도 3은 본 발명의 일 실시예에 따른 우선순위 결정 테이블의 구성도이다.
도 4는 본 발명의 일 실시예에 따른 캐시서버에 저장된 데이터 갱신방법의 흐름도이다.

Claims (13)

  1. 캐시서버에서 특정기간 동안 복수 데이터의 히트(Hit) 수, 스테일 타임(stale time) 및 상기 데이터의 사이즈 정보를 수집하는 수집단계;
    상기 캐시서버에서 상기 수집단계에서 수집된 정보를 이용하고 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 상기 데이터의 값들을 계산하여 우선순위를 결정하는 결정단계; 및
    상기 캐시서버에서 상기 결정단계에서 결정한 우선순위에 따라 상기 데이터를 저장하는 저장단계를 포함하는 캐시서버에 저장된 데이터 갱신방법.
  2. 제1항에 있어서, 상기 수집단계는
    상기 캐시서버에 기저장된 데이터 및 하나 이상의 컨텐츠서버에 저장된 데이터에 대한 정보를 수집하는 것을 특징으로 하는 캐시에 저장된 데이터 갱신방법.
  3. 제2항에 있어서, 상기 수집단계는
    상기 캐시서버가 상기 하나 이상의 컨텐츠서버로부터 해당 컨텐츠서버에 저장된 데이터에 대한 정보를 수신하는 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  4. 제1항에 있어서, 상기 결정단계에서
    상기 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 상기 데이터 값들 중 하나 이상의 값은 로그값인 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  5. 제1항에 있어서, 상기 결정단계는
    상기 계산한 값들을 이용하여 상기 데이터의 벡터값을 계산하고 해당 벡터값의 절대값을 다른 데이터의 절대값과 비교하여 우선순위를 결정하는 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  6. 제1항 또는 제5항에 있어서, 상기 결정단계는
    상기 계산한 데이터의 값들 중 하나 이상의 값에 가중치 값을 곱하여 우선순위를 결정하는 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  7. 제1항에 있어서, 상기 저장단계는
    상기 결정단계에서 결정된 우선순위가 큰 데이터부터 순차적으로 저장하는 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  8. 제1항에 있어서, 상기 저장단계는
    상기 결정단계에서 결정한 우선순위가 큰 데이터부터 순차적으로 해당 데이터의 사이즈를 합하여 그 합이 상기 캐시서버의 저장 용량 이하가 되는 데이터까지 저장하는 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  9. 제1항에 있어서, 상기 저장단계는
    상기 저장하는 데이터와 상기 캐시서버에 기저장된 데이터를 비교하여, 중복되는 데이터를 제외한 나머지 데이터를 저장하는 것을 특징으로 하는 캐시서버에 저장된 데이터 갱신방법.
  10. 데이터 송수신을 위한 입출력부;
    컨텐츠를 저장하는 데이터베이스; 및
    특정기간 동안 복수 데이터의 히트 수, 스테일 타임 및 상기 데이터의 사이즈 정보를 수집하고 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 각각의 값을 계산하여 각 데이터의 우선순위를 결정하며 해당 우선순위에 따라 상기 데이터를 상기 데이터베이스에 저장하는 제어모듈을 포함하는 캐시서버.
  11. 제10항에 있어서, 상기 제어모듈은
    상기 캐시서버에 기저장된 데이터 및 하나 이상의 컨텐츠서버에 저장된 데이터에 대한 정보를 수집하는 것을 특징으로 하는 캐시서버.
  12. 제10항에 있어서, 상기 제어모듈은
    상기 계산한 값들을 이용하여 상기 데이터의 벡터값을 계산하고 해당 벡터값 의 절대값을 다른 데이터의 절대값과 비교하여 우선순위를 결정하는 것을 특징으로 하는 캐시서버.
  13. 컨텐츠 데이터를 제공하며 특정기간 동안 상기 컨텐츠 데이터에 대한 히트 수, 스테일 타임 및 상기 컨텐츠 데이터의 사이즈 정보를 수집하여 전송하는 컨텐츠서버; 및
    상기 컨텐츠서버가 제공한 컨텐츠를 저장하여 상기 저장한 컨텐츠 데이터에 대한 특정기간 동안의 히트 수, 스테일 타임 및 상기 데이터의 사이즈 정보를 수집하고, 상기 컨텐츠서버가 전송한 정보를 수신하여, 히트 수, 스테일 타임의 역수 및 데이터 사이즈의 역수 축에 대응되는 각각의 데이터의 값들을 계산하고 우선순위를 결정하며, 해당 우선순위에 따라 상기 컨텐츠 데이터를 저장하는 캐시서버; 를 포함하는 컨텐츠 제공시스템.
KR1020080097897A 2008-10-06 2008-10-06 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템 KR101131787B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080097897A KR101131787B1 (ko) 2008-10-06 2008-10-06 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080097897A KR101131787B1 (ko) 2008-10-06 2008-10-06 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템

Publications (2)

Publication Number Publication Date
KR20100038800A true KR20100038800A (ko) 2010-04-15
KR101131787B1 KR101131787B1 (ko) 2012-03-30

Family

ID=42215458

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080097897A KR101131787B1 (ko) 2008-10-06 2008-10-06 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템

Country Status (1)

Country Link
KR (1) KR101131787B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013100573A1 (ko) * 2011-12-26 2013-07-04 에스케이텔레콤 주식회사 콘텐트 전송 시스템, 그 시스템에서의 네트워크 트래픽 최적화 방법, 중앙 제어 장치 및 로컬 캐싱 장치
KR101381689B1 (ko) * 2012-08-03 2014-04-22 기초과학연구원 콘텐츠 이용 특성에 기초하여 콘텐츠를 관리하는 콘텐츠 제공 장치
US10664235B2 (en) 2014-05-27 2020-05-26 Sk Planet Co., Ltd. Apparatus and method for sorting items using longest increasing subsequence
WO2022111733A1 (zh) * 2020-11-30 2022-06-02 百果园技术(新加坡)有限公司 消息处理方法、装置及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013100573A1 (ko) * 2011-12-26 2013-07-04 에스케이텔레콤 주식회사 콘텐트 전송 시스템, 그 시스템에서의 네트워크 트래픽 최적화 방법, 중앙 제어 장치 및 로컬 캐싱 장치
US9781224B2 (en) 2011-12-26 2017-10-03 Sk Telecom Co., Ltd. Content transmitting system, method for optimizing network traffic in the system, central control device and local caching device
KR101381689B1 (ko) * 2012-08-03 2014-04-22 기초과학연구원 콘텐츠 이용 특성에 기초하여 콘텐츠를 관리하는 콘텐츠 제공 장치
US10664235B2 (en) 2014-05-27 2020-05-26 Sk Planet Co., Ltd. Apparatus and method for sorting items using longest increasing subsequence
WO2022111733A1 (zh) * 2020-11-30 2022-06-02 百果园技术(新加坡)有限公司 消息处理方法、装置及电子设备

Also Published As

Publication number Publication date
KR101131787B1 (ko) 2012-03-30

Similar Documents

Publication Publication Date Title
KR101383905B1 (ko) 해시 함수 결과를 이용한 서버 부하 분산 처리 방법 및 그 장치
US7904345B2 (en) Providing website hosting overage protection by transference to an overflow server
EP2266043B1 (en) Cache optimzation
US9083743B1 (en) Managing request routing information utilizing performance information
US6324580B1 (en) Load balancing for replicated services
US20080243536A1 (en) Providing website hosting overage protection by storage on an independent data server
WO2017101366A1 (zh) Cdn服务节点的调度方法及服务器
WO2015127075A1 (en) Content delivery network architecture with edge proxy
CN108259603B (zh) 一种负载均衡方法及装置
CN102118433A (zh) 多层次的分布式集群系统
EP2724243A1 (en) Dynamic content caching
US10375195B2 (en) Content node selection using network performance profiles
US11372937B1 (en) Throttling client requests for web scraping
JP6972714B2 (ja) データ取得プログラム、装置、及び方法
KR101131787B1 (ko) 캐시서버에 저장된 데이터 갱신방법, 그 캐시서버 및 컨텐츠 제공시스템
KR101066872B1 (ko) 캐시서버를 이용한 컨텐츠 전송시스템 및 방법, 그 캐시서버
KR101150725B1 (ko) 컨텐츠서버 및 캐시서버를 이용한 데이터 저장방법, 그 컨텐츠서버 및 컨텐츠 제공시스템
CN110113446B (zh) 一种客户端寻址方法、装置及系统
JP6793498B2 (ja) データストア装置およびデータ管理方法
EP4227829A1 (en) Web scraping through use of proxies, and applications thereof
US20230018983A1 (en) Traffic counting for proxy web scraping
KR101104727B1 (ko) 캐시서버 및 브라우저캐시를 이용한 컨텐츠 전송시스템 및 방법
KR101066871B1 (ko) 캐시서버 및 브라우저캐시를 이용한 컨텐츠 전송시스템 및 방법
WO2023280593A1 (en) Web scraping through use of proxies, and applications thereof
KR20100048316A (ko) 복수의 캐시서버를 이용한 컨텐츠 전송시스템 및 방법, 그 캐시서버

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150309

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160302

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190219

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200220

Year of fee payment: 9