KR101825294B1 - 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 - Google Patents
인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 Download PDFInfo
- Publication number
- KR101825294B1 KR101825294B1 KR1020160056794A KR20160056794A KR101825294B1 KR 101825294 B1 KR101825294 B1 KR 101825294B1 KR 1020160056794 A KR1020160056794 A KR 1020160056794A KR 20160056794 A KR20160056794 A KR 20160056794A KR 101825294 B1 KR101825294 B1 KR 101825294B1
- Authority
- KR
- South Korea
- Prior art keywords
- file
- files
- data
- popularity
- storage server
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000002123 temporal effect Effects 0.000 title abstract description 4
- 238000000926 separation method Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G06F17/30073—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/185—Hierarchical storage management [HSM] systems, e.g. file migration or policies thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G06F17/30221—
-
- G06F17/30312—
-
- G06F17/30705—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치가 개시된다. 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 방법은 스토리지 서버에 새로운 파일 저장 시 상기 새로운 파일에 대응하는 인간 관계 및 인기도를 고려한 3차원 데이터 구조로 저장하는 단계; 상기 새로운 파일의 인기도에 기초하여 상기 새로운 파일의 우선 순위를 설정하는 단계; 및 상기 스토리지 서버에 저장된 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터(hot data)와 콜드 데이터(cold data)로 구분하는 단계를 포함한다.
Description
본 발명은 스토리지 서버의 데이터를 구분하는 기술에 관한 것으로서, 보다 상세하게는 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 스토리지 티어링 기술의 효율을 극대화시킬 수 있는 데이터 구분 방법 및 장치에 관한 것이다.
소셜 네트워크 서비스와 같은 서비스는 점점 더 보편화되었고, 이로 인해 하루에 생성되는 데이터의 크기가 엄청나다.
수 엑사바이트(exabytes)의 데이터를 모두 고성능의 스토리지 서버에 저장하기에는 설비 및 운영 비용(또는 제반 비용)이 너무 비싸기 때문에 자주 접근 예를 들어, 쓰기, 읽기, 수정 등을 하지 않는 파일은 용량 대비 저렴한 스토리지 서버에 저장해야 한다.
이와 같이, 성능과 비용을 기준으로 2, 3 단계의 스토리지 레벨을 구분하고, 필요에 따라 파일을 분류하는 것을 티어링(tiering)이라고 한다. 또한, 비싸지만 고성능 서버에 들어가는 자주 접근되는 파일을 핫 데이터(hot data)라고 하며, 성능은 낮지만 저렴한 서버에 들어가는 거의 접근이 없는 파일을 콜드 데이터(cold data)라고 한다.
스토리지 티어링을 하기 위해서, 핫 데이터(hot data)와 콜드 데이터(cold data)를 먼저 구분해야 하는데, 구분은 미래에 파일의 접근 여부를 예측한 결과를 바탕으로 하기 때문에 최적화된 것이 없으며, 100% 정확하다고 할 수 없으며, 따라서 현재에는 경험을 바탕으로 인위적으로 작업하거나, 단순히 접근율을 구분의 기준으로 삼고 있다.
하지만, 이러한 작업은 주관적인 판단 요소가 매우 많기 때문에 책임소지가 따르고, 구분의 정확도가 높지 않는 결과를 낳는 문제점이 있다.
이 외의 방법에 대한 예로 딥 러닝(deep learning) 방법으로, 딥 러닝 방법은 정확도를 높일 수 있지만, 알고리즘이 복잡하여 그 오버헤드가 매우 크기 때문에 실현 불가능하거나 추가적인 비용으로 효과가 없어질 수 있는 문제점이 있다.
본 발명의 실시예들은, 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 스토리지 티어링 기술의 효율을 극대화시킬 수 있는 데이터 구분 방법 및 장치를 제공한다.
본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 방법은 스토리지 서버에 새로운 파일 저장 시 상기 새로운 파일에 대응하는 인간 관계 및 인기도를 고려한 3차원 데이터 구조로 저장하는 단계; 상기 새로운 파일의 인기도에 기초하여 상기 새로운 파일의 우선 순위를 설정하는 단계; 및 상기 스토리지 서버에 저장된 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터(hot data)와 콜드 데이터(cold data)로 구분하는 단계를 포함한다.
나아가, 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 방법은 상기 스토리지 서버에 상기 파일들 각각이 저장된 시간 및 상기 파일들 각각의 현재 인기도에 기초하여 상기 파일들 각각의 우선 순위를 업데이트하는 단계를 더 포함하고, 상기 구분하는 단계는 상기 업데이트된 상기 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터와 콜드 데이터로 구분할 수 있다.
상기 핫 데이터와 콜드 데이터로 구분하는 단계는 스토리지 티어링 정책에 기반한 상기 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 상기 핫 데이터와 콜드 데이터로 구분할 수 있다.
상기 핫 데이터와 콜드 데이터로 구분하는 단계는 해당 파일이 상기 스토리지 서버에 저장된 시간, 상기 해당 파일을 업로드한 사람의 인기도, 상기 해당 파일의 인기도, 상기 해당 파일과 관련된 계정 간 접촉 빈도, 상기 해당 파일의 인간관계에 대한 범위, 상기 해당 파일에 대한 최근 접근 빈도, 상기 해당 파일에 대한 최근 노출 빈도, 상기 해당 파일의 나이 및 상기 해당 파일의 속성 중 적어도 하나를 추가적으로 반영하여 상기 해당 파일을 상기 핫 데이터 또는 상기 콜드 데이터로 구분할 수 있다.
상기 3차원 데이터 구조로 저장하는 단계는 상기 인간관계를 2차원으로 표현하고, 2차원으로 표현된 상기 인간관계에 상기 인기도를 표현함으로써, 상기 새로운 파일 저장 시 상기 3차원 데이터 구조로 저장할 수 있다.
본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 장치는 스토리지 서버에 새로운 파일 저장 시 상기 새로운 파일에 대응하는 인간 관계 및 인기도를 고려한 3차원 데이터 구조로 저장하는 저장부; 상기 새로운 파일의 인기도에 기초하여 상기 새로운 파일의 우선 순위를 설정하는 설정부; 및 상기 스토리지 서버에 저장된 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터(hot data)와 콜드 데이터(cold data)로 구분하는 구분부를 포함한다.
나아가, 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 장치는 상기 스토리지 서버에 상기 파일들 각각이 저장된 시간 및 상기 파일들 각각의 현재 인기도에 기초하여 상기 파일들 각각의 우선 순위를 업데이트하는 업데이트부를 더 포함하고, 상기 구분부는 상기 업데이트된 상기 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터와 콜드 데이터로 구분할 수 있다.
상기 구분부는 스토리지 티어링 정책에 기반한 상기 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 상기 핫 데이터와 콜드 데이터로 구분할 수 있다.
상기 구분부는 해당 파일이 상기 스토리지 서버에 저장된 시간, 상기 해당 파일을 업로드한 사람의 인기도, 상기 해당 파일의 인기도, 상기 해당 파일과 관련된 계정 간 접촉 빈도, 상기 해당 파일의 인간관계에 대한 범위, 상기 해당 파일에 대한 최근 접근 빈도, 상기 해당 파일에 대한 최근 노출 빈도, 상기 해당 파일의 나이 및 상기 해당 파일의 속성 중 적어도 하나를 추가적으로 반영하여 상기 해당 파일을 상기 핫 데이터 또는 상기 콜드 데이터로 구분할 수 있다.
상기 저장부는 상기 인간관계를 2차원으로 표현하고, 2차원으로 표현된 상기 인간관계에 상기 인기도를 표현함으로써, 상기 새로운 파일 저장 시 상기 3차원 데이터 구조로 저장할 수 있다.
본 발명의 실시예들에 따르면, 스토리지 서버에 저장되는 자료(또는 파일)를 인간관계와 인기도 나아가 우선 순위를 고려하여 저장함으로써, 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 스토리지 티어링 기술의 효율을 극대화시킬 수 있다.
본 발명의 실시예들에 따르면, 관련성이 높은 파일을 모아둠으로써, 스토리지 서버의 티어링 정책을 효율적으로 운영할 수 있으며, 인간관계와 시간에 영향을 받는 서비스를 운영함에 있어서, 고성능 스토리지 서버의 비율을 줄여 제반 비용을 절감할 수 있다.
도 1은 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 방법에 대한 동작 흐름도를 나타낸 것이다.
도 2는 인간관계와 인기도를 표현한 예시도를 나타낸 것이다.
도 3은 본 발명을 설명하기 위한 일 예시도를 나타낸 것이다.
도 4는 본 발명을 설명하기 위한 다른 일 예시도를 나타낸 것이다.
도 5는 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 장치에 대한 구성을 나타낸 것이다.
도 2는 인간관계와 인기도를 표현한 예시도를 나타낸 것이다.
도 3은 본 발명을 설명하기 위한 일 예시도를 나타낸 것이다.
도 4는 본 발명을 설명하기 위한 다른 일 예시도를 나타낸 것이다.
도 5는 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 장치에 대한 구성을 나타낸 것이다.
이하, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
본 발명의 실시예들은, 소셜 네트워크 서비스와 같이 인간관계와 시간성이 높은 서비스를 제공하기 위한 스토리지 서버의 파일을 핫 데이터와 콜드 데이터로 구분하기 위한 것으로, 인간관계와 인기도를 고려한 3차원 데이터 구조를 제공함으로써, 스토리지 서버의 티어링 정책을 효율적으로 운영할 수 있는 기술을 제공하는 것을 그 요지로 한다.
즉, 본 발명의 실시예들은, 소셜 네트워크 서비스의 파일이 인간관계와 시간에 영향을 받는다는 점을 고려하여 스토리지 서버의 파일을 핫 데이터와 콜드 데이터로 구분하기 위한 명확한 기준을 제공하기 위한 것이다.
인간 사회의 특성 상 대화 및 소통은 아는 사람끼리 하는 경우가 많고, 아는 사람끼리는 유사한 데이터를 주고 받을 경우가 많다. 예를 들어, 같은 학교에 있더라도 공학 전공자와 인문학 전공자는 취하는 정보가 서로 다를 수 있으며, 나라와 민족이 다른 사람끼리는 취하는 정보가 대부분 완전히 다르다.
이러한 사실을 기반으로 서비스 제공사가 스토리지 서버에서 준비해야 하는 파일은 인간관계에 영향을 받는다는 점을 알 수 있다.
소셜 네트워크 서비스의 특성 상 시간이 지남에 따라, 파일의 노출(또는 접근) 빈도가 확연히 줄어들고, 뉴스 성격의 최신 정보를 노출시키며, 옛날 파일은 백업으로 존재하는 경우가 많다.
또한, 유명 인사는 일반인에 비해, 파일의 노출 빈도가 매우 높다. 예를 들어, 일반인이 업로드한 파일은 1주일간 노출되는 반면, 유명 인사가 업로드한 파일은 한 달이 넘어도 노출되는 경우가 많다.
본 발명의 실시예들은, 상술한 사실을 기반으로 파일을 저장할 때 특별한 자료 구조를 가지도록 저장함으로써, 스토리지 티어링 정책에 이용할 수 있다. 예를 들어, 본 발명은 파일을 저장할 때 3차원 데이터 구조 또는 3차원 그래프 구조로 데이터를 저장한다.
이 때, 본 발명은 저장하고자 하는 파일과 관련된 인간관계를 x축과 y축에 나타내고, 인기도를 z축으로 표현함으로써, 3차원 데이터 구조로 파일을 저장할 수 있으며, z 축에 파일의 우선 순위를 함께 표현할 수도 있다.
본 발명에 대해 도 1 내지 도 5를 참조하여 설명하면 다음과 같다.
도 1은 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 방법에 대한 동작 흐름도를 나타낸 것이다.
도 1을 참조하면, 스토리지 서버에 새로운 파일을 저장하기 위하여, 저장하고자 하는 새로운 파일에 대하여 인간관계와 인기도를 고려한 3차원 데이터 구조로 저장한다(S110).
여기서, 스토리지 서버에서 저장하고자 하는 파일에 대한 인간관계를 도 2a에 도시된 바와 같이 x축과 y축을 가지는 망구조의 2차원으로 표현할 수 있고, 2차원의 인간관계와 파일에 대한 인기도를 높이 축 즉, z축으로 표현함으로써, 도 2b에 도시된 바와 같은 파동을 가진 3차원 구조로 표현될 수 있다.
이 때, 파일에 대한 인기도는 친구 수나 팔로워 수, 평가 점수, 파일의 좋아요 수 합계 등과 같은 다양한 방법에 의해 계산될 수 있다.
단계 S110에서 새로운 파일이 3차원 데이터 구조로 스토리지 서버에 저장될 때 새로운 파일의 인기도에 기초하여 새로운 파일의 우선 순위를 설정한다(S120).
여기서, 새로운 파일의 우선 순위는 새로운 파일이 업로드되는 시점의 인기도 값과 동일할 수 있다.
단계 S110과 S120에 의해 파일이 3차원 데이터 구조로 업로드된 후 스토리지 서버에 저장된 파일들 각각에 대하여, 파일들 각각이 저장된 시간(또는 기간)과 현재 인기도에 기초하여 파일들 각각의 우선 순위를 계산함으로써, 파일들 각각의 우선 순위를 업데이트한다(S130).
여기서, 파일들 각각의 인기도는 시간이 지남에 따라 달라질 수 있으며, 따라서 파일을 핫 데이터 또는 콜드 데이터로 구분하기 위한 값인 우선 순위 또한 달라질 수 있기에, 이러한 파일들 각각에 대한 우선 순위를 업데이트할 수 있다.
이 때, 파일들 각각에 대한 우선 순위는 해당 파일의 인기도에만 한정되어 계산되는 것은 아니며, 해당 파일이 스토리지 서버에 저장된 시간(또는 기간), 해당 파일을 업로드한 사람의 인기도, 해당 파일의 인기도, 해당 파일과 관련된 계정 간 접촉 빈도, 해당 파일의 인간관계에 대한 범위, 해당 파일에 대한 최근 접근 빈도, 해당 파일에 대한 최근 노출 빈도, 해당 파일의 나이 및 해당 파일의 속성 등에 의해 달라질 수 있다. 즉, 파일들 각각에 대한 우선 순위는 상술한 파라미터들 중 적어도 하나에 기초하여 계산될 수 있다. 여기서, 계정간 접촉 빈도는 전자메일, 메시지를 주고 받는 회수를 포함할 수 있으며, 파일의 속성은 라이브 타임, 액티브 타임 등을 포함할 수 있다.
물론, 단계 S130은 파일들 각각에 대하여 일정 주기 단위로 파일들 각각에 대한 우선 순위를 업데이트할 수도 있고, 실시간으로 파일들 각각에 대한 우선 순위를 업데이트할 수도 있다.
단계 S130에 의해 파일들 각각에 대한 우선 순위가 업데이트되면, 업데이트된 우선 순위와 미리 결정된 기준 값 예컨대, 기준 순위를 비교하여 파일의 우선 순위가 기준 순위 이상인지 판단한다(S140).
단계 S140 판단 결과, 해당 파일의 우선 순위가 기준 순위 이상인 것으로 판단되면 해당 파일을 핫 데이터로 구분하고, 그렇지 않은 경우에는 해당 파일을 콜드 데이터로 구분한다(S150, S160).
즉, 단계 S140 내지 S160은 스토리지 티어링 정책에 기반한 파일들 각각의 우선 순위에 기초하여 파일들 각각을 핫 데이터와 콜드 데이터로 구분한다.
상술한 3차원 데이터 구조로 스토리지 서버로 업로드되는 파일은 최초 파일의 인기도와 같은 값의 우선 순위를 가지며, 이러한 우선 순위는 시간이 지남에 따라 일정 비율로 감소될 수 있고, 파일의 우선 순위가 기준 순위보다 더 떨어지게 되면 해당 파일을 콜드 데이터로 구분할 수 있다.
이와 같이, 본 발명의 실시예에 따른 방법은 3차원 데이터 구조로 소셜 네트워크 파일을 저장한다면, 파일의 접근율을 복잡한 계산 없이 효율적으로 예측할 수 있으며, 대규모 스토리지 서버에 사용하기에도 용이하다.
본 발명에서는, 3차원 데이터 구조의 높이 축 즉, z축을 인기도 외에 파일의 우선 순위로 표현할 수 있으며, 본 발명에 대해 도 3과 도 4를 참조하여 설명하면 다음과 같다.
도 3에 도시된 예시도는 인간관계를 1차원으로 표현한 것으로, 도 3에서의 파일 1~3은 새로 만들어진 파일을 의미하고, 파일 4는 오래 전에 만들어진 파일이며, 파일 5는 콜드 데이터로 구분된 파일이다. 여기서, x축과 만나는 우선 순위 값이 바로 기준 순위일 수 있다. 즉, x축 아래의 우선 순위를 가지는 파일은 콜드 데이터가 된다.
도 3에서 새로 만들어진 파일 즉, 파일 1~3은 해당 파일의 인기도와 같은 값의 우선 순위를 가지기 때문에 인기도와 같은 곳에 위치하고, 이러한 파일들은 시간이 지남에 따라 일정 시간 주기 또는 단위로 일정 비율로 감소할 수 있다.
예컨대, 도 4에 도시된 바와 같이, 파일 1은 시간이 지남에 따라 해당 파일의 우선 순위가 일정 비율로 감소한 것을 알 수 있으며, 파일 2는 시간이 지남에 따라 인기도가 상승하여 파일의 우선 순위 또한 상승한 것을 알 수 있다. 여기서, 파일 2는 인기도의 증가에 따라 파일 역시 접근이 많아지는 효과가 있기 때문에 우선 순위 또한 상승하게 된다. 파일 3의 경우는 인기도에 비하여 해당 파일만 인기가 있는 경우에 대한 것으로, 인기도에 비례하여 우선 순위가 인기도보다 더 높게 올라갈 수 있는 값이 정해져 있으며, 이렇게 정해진 값을 우선 순위가 상승할 수 있는 최대치로 설정되어 그 최대치만큼 상승할 수 있다. 파일 4는 시간이 지남에 따라 계속 떨어지던 값이 일정 값 이하 즉, 기준 순위보다 작아지게 되어 콜드 데이터로 구분되는 파일이며, 파일 5는 콜드 데이터로 구분된 파일이지만, 예상치 못한 유명세로 우선 순위가 상승하여 핫 데이터로 구분된 파일이다.
여기서, 파일 5와 같은 경우는 콜드 데이터에서 핫 데이터로 변경된 경우로, 해당 파일의 인기도에 반비례하여 설정될 수 있는 최하치에 우선 순위를 결정할 수 있다.
이와 같이, 본 발명의 실시예에 따른 방법은 3차원 데이터 구조를 이용하여 파일을 저장하기 때문에 인기가 있는 파일이 콜드 데이터로 구분될 수 있는 기준 순위까지 내려가는데 시간이 오래 걸려서 오랫동안 핫 데이터로 유지할 수 있으며, 급작스럽게 유명세를 타는 파일 역시 구분하여 처리할 수 있다.
본 발명의 실시예에 따른 방법은 인간관계와 시간성을 고려하여 파일을 3차원 데이터 구조로 저장하기 때문에 인간관계와 시간에 영향을 받는 서비스를 운영함에 있어서, 고성능 스토리지 서버의 비율을 줄여 제반 비용을 절감할 수 있다.
도 5는 본 발명의 일 실시예에 따른 스토리지 서버의 데이터 구분 장치에 대한 구성을 나타낸 것으로, 상술한 도 1 내지 도 4의 동작을 수행하는 장치에 대한 구성을 나타낸 것이다.
도 5를 참조하면, 본 발명의 실시예에 따른 스토리지 서버의 데이터 구분 장치(500)는 저장부(510), 설정부(520), 업데이트부(530) 및 구분부(540)를 포함한다.
저장부(510)는 스토리지 서버에 새로운 파일 저장 시 새로운 파일에 대응하는 인간 관계 및 인기도를 고려한 3차원 데이터 구조로 저장한다.
이 때, 저장부(510)는 파일의 인간관계를 2차원으로 표현하고, 2차원으로 표현된 인간관계에 파일의 인기도를 표현함으로써, 새로운 파일 저장 시 3차원 데이터 구조로 저장할 수 있으며, 인기도는 친구 수나 팔로워 수, 평가 점수, 파일의 좋아요 수 합계 등과 같은 다양한 방법에 의해 계산될 수 있다.
설정부(520)는 새로운 파일의 인기도에 기초하여 새로운 파일의 우선 순위를 설정한다.
업데이트부(530)는 스토리지 서버에 파일들 각각이 저장된 시간(또는 기간) 및 파일들 각각의 현재 인기도에 기초하여 파일들 각각의 우선 순위를 계산하여 업데이트한다.
구분부(540)는 스토리지 서버에 저장된 파일들 각각의 우선 순위에 기초하여 파일들 각각을 핫 데이터와 콜드 데이터로 구분한다.
이 때, 구분부(540)는 파일들 각각에 대해 업데이트된 우선 순위에 기초하여 파일들 각각을 핫 데이터와 콜드 데이터로 구분할 수 있다.
이러한 구분부(540)는 스토리지 티어링 정책에 기반한 파일들 각각의 우선 순위에 기초하여 파일들 각각을 핫 데이터와 콜드 데이터로 구분한다.
나아가, 구분부(540)는 파일이 스토리지 서버에 저장된 시간, 파일을 업로드한 사람의 인기도, 파일의 인기도, 파일과 관련된 계정 간 접촉 빈도, 파일의 인간관계에 대한 범위, 파일에 대한 최근 접근 빈도, 파일에 대한 최근 노출 빈도, 파일의 나이 및 파일의 속성 중 적어도 하나에 기초하여 파일들 각각을 핫 데이터 또는 상기 콜드 데이터로 구분할 수 있다.
이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 시스템, 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예들에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
Claims (10)
- 스토리지 서버에 새로운 파일 저장 시 상기 새로운 파일에 대응하는 인간 관계 및 인기도를 고려한 3차원 데이터 구조로 저장하는 단계;
상기 새로운 파일의 인기도에 기초하여 상기 새로운 파일의 우선 순위를 설정하는 단계; 및
상기 스토리지 서버에 저장된 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터(hot data)와 콜드 데이터(cold data)로 구분하는 단계
를 포함하고,
상기 스토리지 서버에 상기 파일들 각각이 저장된 시간 및 상기 파일들 각각의 현재 인기도에 기초하여 상기 파일들 각각의 우선 순위를 업데이트하는 단계
를 더 포함하며,
상기 3차원 데이터 구조로 저장하는 단계는
상기 인간관계를 2차원의 망구조로 표현하고, 2차원의 망구조로 표현된 상기 인간관계에 상기 인기도를 높이 축으로 표현함으로써, 상기 새로운 파일 저장 시 파동을 가지는 상기 3차원 데이터 구조로 저장하고,
상기 핫 데이터와 콜드 데이터로 구분하는 단계는
스토리지 티어링 정책에 기반한 상기 파일들 각각의 업데이트된 우선 순위에 기초하여 상기 파일들 각각을 상기 핫 데이터와 콜드 데이터로 구분하는 스토리지 서버의 데이터 구분 방법.
- 삭제
- 삭제
- 제1항에 있어서,
상기 핫 데이터와 콜드 데이터로 구분하는 단계는
해당 파일이 상기 스토리지 서버에 저장된 시간, 상기 해당 파일을 업로드한 사람의 인기도, 상기 해당 파일의 인기도, 상기 해당 파일과 관련된 계정 간 접촉 빈도, 상기 해당 파일의 인간관계에 대한 범위, 상기 해당 파일에 대한 최근 접근 빈도, 상기 해당 파일에 대한 최근 노출 빈도, 상기 해당 파일의 나이 및 상기 해당 파일의 속성 중 적어도 하나를 추가적으로 반영하여 상기 해당 파일을 상기 핫 데이터 또는 상기 콜드 데이터로 구분하는 것을 특징으로 하는 스토리지 서버의 데이터 구분 방법.
- 삭제
- 스토리지 서버에 새로운 파일 저장 시 상기 새로운 파일에 대응하는 인간 관계 및 인기도를 고려한 3차원 데이터 구조로 저장하는 저장부;
상기 새로운 파일의 인기도에 기초하여 상기 새로운 파일의 우선 순위를 설정하는 설정부; 및
상기 스토리지 서버에 저장된 파일들 각각의 우선 순위에 기초하여 상기 파일들 각각을 핫 데이터(hot data)와 콜드 데이터(cold data)로 구분하는 구분부
를 포함하고,
상기 스토리지 서버에 상기 파일들 각각이 저장된 시간 및 상기 파일들 각각의 현재 인기도에 기초하여 상기 파일들 각각의 우선 순위를 업데이트하는 업데이트부
를 더 포함하며,
상기 저장부는
상기 인간관계를 2차원의 망구조로 표현하고, 2차원의 망구조로 표현된 상기 인간관계에 상기 인기도를 높이 축으로 표현함으로써, 상기 새로운 파일 저장 시 파동을 가지는 상기 3차원 데이터 구조로 저장하고,
상기 구분부는
스토리지 티어링 정책에 기반한 상기 파일들 각각의 업데이트된 우선 순위에 기초하여 상기 파일들 각각을 상기 핫 데이터와 콜드 데이터로 구분하는 스토리지 서버의 데이터 구분 장치.
- 삭제
- 삭제
- 제6항에 있어서,
상기 구분부는
해당 파일이 상기 스토리지 서버에 저장된 시간, 상기 해당 파일을 업로드한 사람의 인기도, 상기 해당 파일의 인기도, 상기 해당 파일과 관련된 계정 간 접촉 빈도, 상기 해당 파일의 인간관계에 대한 범위, 상기 해당 파일에 대한 최근 접근 빈도, 상기 해당 파일에 대한 최근 노출 빈도, 상기 해당 파일의 나이 및 상기 해당 파일의 속성 중 적어도 하나를 추가적으로 반영하여 상기 해당 파일을 상기 핫 데이터 또는 상기 콜드 데이터로 구분하는 것을 특징으로 하는 스토리지 서버의 데이터 구분 장치.
- 삭제
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160056794A KR101825294B1 (ko) | 2016-05-10 | 2016-05-10 | 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 |
PCT/KR2016/010801 WO2017195943A1 (ko) | 2016-05-10 | 2016-09-27 | 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160056794A KR101825294B1 (ko) | 2016-05-10 | 2016-05-10 | 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170126587A KR20170126587A (ko) | 2017-11-20 |
KR101825294B1 true KR101825294B1 (ko) | 2018-02-02 |
Family
ID=60267468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160056794A KR101825294B1 (ko) | 2016-05-10 | 2016-05-10 | 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101825294B1 (ko) |
WO (1) | WO2017195943A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102175176B1 (ko) * | 2017-12-29 | 2020-11-06 | 한양대학교 산학협력단 | 문자 종류 개수에 기반한 데이터 구분 방법, 데이터 분류기 및 스토리지 시스템 |
CN110442309A (zh) * | 2019-07-24 | 2019-11-12 | 广东紫晶信息存储技术股份有限公司 | 一种基于光存储的冷热数据交换方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140188947A1 (en) | 2012-12-31 | 2014-07-03 | Teradata Corporation | Data storage management based on indicated storage levels and other criteria for multilevel storage systems |
US20150052180A1 (en) * | 2012-08-15 | 2015-02-19 | Facebook, Inc. | File storage system based on coordinated exhaustible and non-exhaustible storage |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8438364B2 (en) * | 2010-12-30 | 2013-05-07 | Facebook Inc. | Distributed cache for graph data |
US20160092353A1 (en) * | 2014-09-25 | 2016-03-31 | Robert C. Swanson | Establishing cold storage pools from aging memory |
-
2016
- 2016-05-10 KR KR1020160056794A patent/KR101825294B1/ko active IP Right Grant
- 2016-09-27 WO PCT/KR2016/010801 patent/WO2017195943A1/ko active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150052180A1 (en) * | 2012-08-15 | 2015-02-19 | Facebook, Inc. | File storage system based on coordinated exhaustible and non-exhaustible storage |
US20140188947A1 (en) | 2012-12-31 | 2014-07-03 | Teradata Corporation | Data storage management based on indicated storage levels and other criteria for multilevel storage systems |
Also Published As
Publication number | Publication date |
---|---|
KR20170126587A (ko) | 2017-11-20 |
WO2017195943A1 (ko) | 2017-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10311108B2 (en) | Cloud-based file prefetching on electronic devices | |
US11620583B2 (en) | Federated machine learning using locality sensitive hashing | |
US10079750B2 (en) | Limiting data output from windowing operations | |
US10652614B2 (en) | System and method for content delivery optimization based on a combined captured facial landmarks and external datasets | |
CN111930486A (zh) | 任务选取数据处理方法、装置、设备及存储介质 | |
JP2022552034A (ja) | クラスタリング方法及び装置、電子機器並びに記憶媒体 | |
CN108243032B (zh) | 一种服务等级信息的获取方法、装置及设备 | |
CN115080248B (zh) | 调度装置的调度优化方法、调度装置和存储介质 | |
KR101825294B1 (ko) | 인간관계와 시간성이 높은 서비스를 위한 스토리지 서버의 데이터 구분 방법 및 장치 | |
WO2017095413A1 (en) | Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors | |
CN111784468B (zh) | 一种账户关联方法、装置及电子设备 | |
Wong et al. | Container deployment strategy for edge networking | |
CN113742580A (zh) | 目标类型数据的召回方法、装置、电子设备及存储介质 | |
CN109358964B (zh) | 一种服务器集群资源调度方法 | |
CN115564450B (zh) | 一种风控方法、装置、存储介质及设备 | |
WO2023093194A1 (zh) | 一种云监控方法和云管理平台 | |
US20230236871A1 (en) | Computing environment predictive provisioning | |
CN115543945A (zh) | 一种模型压缩的方法、装置、存储介质及电子设备 | |
KR20190055023A (ko) | 해시태그의 트리 구조를 가지는 개인화된 토픽 네트워크 서비스 방법 및 시스템 | |
CN115374141A (zh) | 虚拟形象的更新处理方法及装置 | |
US11372861B2 (en) | Streams runtime processing rate adjustment | |
CN114296965A (zh) | 特征检索方法、装置、电子设备及计算机存储介质 | |
US10937121B2 (en) | Memory management for complex image analysis | |
US9380413B1 (en) | Dynamically forming the content of a message to a user based on a perceived emotion | |
CN111723202A (zh) | 一种舆情数据的处理装置、方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |