KR101945430B1

KR101945430B1 - 클라우드 스토리지 페더레이션 환경의 가용성 개선 방법 및 그에 따른 응용 프로그램

Info

Publication number: KR101945430B1
Application number: KR1020170071371A
Authority: KR
Inventors: 허의남; 로페즈 신디; 이진섭
Original assignee: 경희대학교 산학협력단
Priority date: 2016-12-13
Filing date: 2017-06-08
Publication date: 2019-02-07
Also published as: KR20180068271A

Abstract

본 발명은 클라우드 스토리지 페더레이션 환경의 가용성 개선 방법 및 그에 따른 응용 프로그램에 관한 것이다. 본 발명은 하나 이상의 클라우드 스토리지를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 상기 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집하여 통합 로그를 생성하는 단계, 상기 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 상기 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출하는 단계, 상기 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 상기 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출하는 단계, 상기 정량 분석 가용성 점수 및 상기 정성 분석 가용성 점수를 통합하여, 사용 빈도가기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하는 단계, 상기 중요 파일을 상기 최적 스토리지로 복제하는 단계를 포함하는 것을 일 특징으로 한다. 본 발명에 의하면, 작은 파일이나 메타 데이터를 다수의 고성능 클라우드 스토리지에 복제하는 동안 대용량의 파일을 삭제 코딩된 데이터 형태로 비용 효율이 좋은 클라우드 스토리지에 저장함으로써, 클라우드 스토리지 페더레이션 환경의 가용성을 개선할 수 있다.

Description

클라우드 스토리지 페더레이션 환경의 가용성 개선 방법 및 그에 따른 응용 프로그램{METHOD FOR IMPROVING AVAILABILITY OF CLOUD STORAGE FEDERATION ENVIRONMENT}

본 발명은 클라우드 스토리지 페더레이션 환경의 가용성 개선 방법 및 그에 따른 응용 프로그램에 관한 것으로, 보다 자세하게는 로그 데이터를 기반으로 클라우드 스토리지 페더레이션 환경의 가용성을 개선하는 방법 및 응용 프로그램에 관한 것이다.

모바일, 빅데이터, 사물인터넷이 발전함에 따라 다양한 종류의 데이터가 생성되고 데이터의 양은 점점 증가하고 있다. 이러한 환경에서 데이터의 저장과 관리에 대한 중요성 역시 증가하고 있으며, 데이터를 저장하기 위하여 DAS(Direct-Attached Storate), NAS(Network-Attached Storage), 클라우드 스토리지 등 다양한 종류의 스토리지가 활용된다.

데이터가 증가함에 따라 스토리지도 함께 발전하고 있으며 기존 스토리지와 새롭게 개발된 스토리지를 함께 사용할 수 있는 방법이 요구되었다. 그 중 하나가 스토리지 페더레이션으로, 스토리지 페더레이션은 데이터 저장을 위한 다양한 이기종 스토리지를 가상화하여 사용자에게 제공하고, 스토리지에 저장된 데이터를 정책에 따라 공유하여 데이터 활용성을 증대 시킬 수 있는 모델이다.

스토리지 페더레이션 모델을 클라우드 스토리지에 적용한 클라우드 스토리지 페더레이션(Federation)은 더 높은 고객의 사용성 및 Quality-of-Services(QoS)를 제공하기 위해 클라우드 환경에서 복수의 스토리지 서비스를 조합할 수 있는 가장 효과적인 방법이다.

사용자들은 높은 수준의 사용성을 가진 적응형 스토리지 서비스를 요구하고 있는데, 사용자의 만족도를 높이기 위해 QoS를 만족하고 SLA(Service Level Agreement)를 이행하기 위한 방법, 즉 클라우드 스토리지의 가용성을 높이는 몇 가지 방법이 제안된 바 있다.

예를 들어, 높은 수준의 가용성과 기밀성을 지닌 수많은 클라우드 서비스 중에서 데이터를 저장하기 위한 최적의 서비스를 유동적으로 선택하는 접근법이 연구된 바 있다. 또 다른 연구에서는 과제(task)가 갖는 부하 특성과 클라우드 서비스 제공 업체의 다양성을 활용하여, 클라우드-오브-클라우드(Cloud-of-Clouds) 환경에서의 클라우드 스토리지 가용성 개선 방법이 제안된 바 있다.

그러나 종래의 접근법들은 단일 선택 과정(one time selection process)에 집중되어 있으며, 더 높은 수준의 사용성에 대한 사용자 요구를 충족시키지 못하는 단점이 있다.

본 발명은 전술한 문제를 해결하기 위한 것으로, 작은 파일이나 메타 데이터를 다수의 고성능 클라우드 스토리지에 복제하는 동안 대용량의 파일을 삭제 코딩된 데이터 형태로 비용 효율이 좋은 클라우드 스토리지에 저장함으로써, 클라우드 스토리지 페더레이션 환경의 가용성을 개선할 수 있는 방법 및 그에 따른 응용 프로그램을 제공하는 것을 일 목적으로 한다.

또한, 본 발명은 다수의 클라우드 스토리지의 가용성을 정량적, 정성적으로 분석하여 최적의 스토리지 제공자를 선택함으로써, 적은 비용으로 높은 가용성을 가진 클라우드 스토리지 페더레이션을 사용자에게 제공하는 것을 일 목적으로 한다.

이러한 목적을 달성하기 위한 본 발명은 하나 이상의 클라우드 스토리지를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 상기 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집하여 통합 로그를 생성하는 단계, 상기 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 상기 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출하는 단계, 상기 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 상기 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출하는 단계, 상기 정량 분석 가용성 점수 및 상기 정성 분석 가용성 점수를 통합하여, 사용 빈도가 기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하는 단계, 상기 중요 파일을 상기 최적 스토리지로 복제하는 단계를 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 에러 정보는 평균 에러 발생 간격(MTBF) 및 최대 에러 복구 시간(MTTR)을 포함하며, 상기 로그 정보는 로그 시각, 로그 종류, 클라우드 스토리지 식별 정보, 작동 요청 타입, 상기 클라우드 스토리지로 요청이 전송된 시각, 상기 클라우드 스토리지로부터 응답을 수신한 시각, 요청과 관련된 파일의 크기, 상기 클라우드 스토리지의 통신 프로토콜, 에러 코드 또는 에러 메시지 중 적어도 하나를 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 정량 분석 가용성 점수 산출 단계가 상기 로그 정보에 포함된 클라우드 스토리지 식별 정보를 이용하여 임의의 클라우드 스토리지를 식별하는 단계, 상기 에러 정보에 포함된 평균 에러 발생 간격(MTBF)와 최대 에러 복구 시간(MTTR)을 이용하여 상기 식별된 클라우드 스토리지에 대응하는 정량 분석 가용성 점수(A)를 산출하는 단계를 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 상기 중요 파일과 관련된 로그 데이터와 가용성 메트릭을 모니터링하는 단계, 상기 모니터링 결과를 사용자에게 제공하는 단계를 더 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, Elasticsearch, Logstash 또는 Kibana를 포함하는 Elastic Stack tool을 이용하여 정량 분석 가용성 점수를 산출하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 상기 정성 분석 가용성 점수 산출 단계가 상기 통합 로그에서 기 정의된 제 1 에러 코드를 탐색하는 단계, 상기 탐색 결과 상기 통합 로그에 상기 제 1 에러 코드가 포함되어 있으면, 상기 제 1 에러 코드에 대응되는 점수를 상기 제 1 에러 코드를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 상기 정성 분석 가용성 점수 산출 단계가 상기 통합 로그에서 기 정의된 제 1 에러 메시지를 탐색하는 단계, 상기 탐색 결과 상기 통합 로그에 상기 제 1 에러 메시지가 포함되어 있으면, 상기 제 1 에러 메시지의 극성을 판단하는 단계, 상기 극성에 대응되는 점수를 상기 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, Naive Bayes 분류기를 이용하여 상기 제 1 에러 메시지의 극성을 판단하는 단계를 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 클라우드 스토리지 페더레이션의 가용성 개선 방법에 있어서, 상기 정성 분석 가용성 점수 산출 단계가 하나 이상의 제 1 에러 메시지의 극성이 동일하면, 상기 제 1 에러 메시지에 포함된 단어 또는 구문을 이용하여 상기 제 1 에러 메시지의 강도(intensity)를 판단하고, 상기 강도에 대응되는 점수를 상기 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 더 포함하는 것을 일 특징으로 한다.

또한, 본 발명은 하나 이상의 클라우드 스토리지를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 장치에 있어서, 상기 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집하는 로그 수집부, 상기 수집한 로그 데이터를 이용하여 통합 로그를 생성하는 통합 로그 생성부, 상기 통합 로그를 분석하는 로그 분석부, 상기 통합 로그 분석 결과를 이용하여 사용 빈도가 기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하고, 상기 중요 파일을 상기 최적 스토리지에 복제하는 지능형 복제부를 포함하며, 상기 로그 분석부는 상기 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 상기 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출하는 로그 정량 분석부, 상기 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 상기 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출하는 로그 정성 분석부를 포함하고, 상기 지능형 복제부는 상기 정량 분석 가용성 점수 및 상기 정성 분석 가용성 점수를 통합하여, 상기 최적 스토리지를 결정하는 것을 일 특징으로 한다.

전술한 바와 같은 본 발명에 의하면, 작은 파일이나 메타 데이터를 다수의 고성능 클라우드 스토리지에 복제하는 동안 대용량의 파일을 삭제 코딩된 데이터 형태로 비용 효율이 좋은 클라우드 스토리지에 저장함으로써, 클라우드 스토리지 페더레이션 환경의 가용성을 개선할 수 있다.

또한, 본 발명에 의하면 다수의 클라우드 스토리지의 가용성을 정량적, 정성적으로 분석하여 최적의 스토리지 제공자를 선택함으로써, 적은 비용으로 높은 가용성을 가진 클라우드 스토리지 페더레이션을 사용자에게 제공할 수 있다.

도 1은 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션 환경을 설명하기 위한 도면,
도 2는 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션의 가용성 개선 장치를 설명하기 위한 구성도,
도 3은 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션의 가용성 개선 방법을 설명하기 위한 순서도,
도 4는 본 발명의 일 실시 예에 의한 정량 분석 가용성 점수 산출 방법을 보다 구체적으로 설명하기 위한 순서도,
도 5는 본 발명의 일 실시 예에 의한 정성 분석 가용성 점수 산출 방법을 설명하기 위한 순서도,
도 6은 본 발명의 다른 실시 예에 의한 정성 분석 가용성 점수 산출 방법을 설명하기 위한 순서도이다.

전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다.

도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용되며, 명세서 및 특허청구의 범위에 기재된 모든 조합은 임의의 방식으로 조합될 수 있다. 그리고 다른 식으로 규정하지 않는 한, 단수에 대한 언급은 하나 이상을 포함할 수 있고, 단수 표현에 대한 언급은 또한 복수 표현을 포함할 수 있음이 이해되어야 한다.

본 명세서에서 사용되는 용어는 단지 특정 예시적 실시 예들을 설명할 목적을 가지고 있으며 한정할 의도로 사용되는 것이 아니다. 본 명세서에서 사용된 바와 같은 단수적 표현들은 또한, 해당 문장에서 명확하게 달리 표시하지 않는 한, 복수의 의미를 포함하도록 의도될 수 있다. 용어 "및/또는," "그리고/또는"은 그 관련되어 나열되는 항목들의 모든 조합들 및 어느 하나를 포함한다. 용어 "포함한다", "포함하는", "포함하고 있는", "구비하는", "갖는", "가지고 있는" 등은 내포적 의미를 갖는바, 이에 따라 이러한 용어들은 그 기재된 특징, 정수, 단계, 동작, 요소, 및/또는 컴포넌트를 특정하며, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 컴포넌트, 및/또는 이들의 그룹의 존재 혹은 추가를 배제하지 않는다. 본 명세서에서 설명되는 방법의 단계들, 프로세스들, 동작들은, 구체적으로 그 수행 순서가 확정되는 경우가 아니라면, 이들의 수행을 논의된 혹은 예시된 그러한 특정 순서로 반드시 해야 하는 것으로 해석돼서는 안 된다. 추가적인 혹은 대안적인 단계들이 사용될 수 있음을 또한 이해해야 한다.

또한, 각각의 구성요소(110, 130, 150, 170, 190)는 각각 하드웨어 프로세서로 구현될 수 있고, 위 구성요소들이 통합되어 하나의 하드웨어 프로세서로 구현될 수 있으며, 또는 위 구성요소들이 서로 조합되어 복수 개의 하드웨어 프로세서로 구현될 수도 있다.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션 환경을 설명하기 위한 도면이다. 도 1을 참조하면, 클라우드 스토리지 페더레이션(50)은 하나 이상의 클라우드 스토리지(50a, 50b)를 포함하는 일종의 클라우드 스토리지 집합으로, 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션의 가용성 개선 장치(이하, ‘가용성 개선 장치’라 함)(100)은 각 클라우드 스토리지 제공자로부터 로그 데이터(10)를 수집하여 활용한다.

본 발명의 일 실시 예에 의한 가용성 개선 장치(100)는 복수의 클라우드 스토리지 서비스(50)를 통합하여 사용할 수 있는 프레임워크를 제공하며, 서버 또는 단말에 포함되어 그 기능을 구현할 수 있다.

본 발명에 의하면, 작은 파일이나 접근 빈도가 높은 파일 시스템 메타 데이터는 다수의 고성능 클라우드 스토리지에 복제되며 대용량의 파일은 삭제 코딩된 데이터 형태로 비용 효율이 좋은 클라우드 스토리지에 저장됨으로써, 파일 특성에 맞는 클라우드 스토리지를 복합적으로 활용할 수 있다는 장점이 있다.

본 발명의 일 실시 예에 의한 가용성 개선 장치(100)는 전술한 바와 같이 각 클라우드 스토리지 제공자로부터 로그 데이터(10)를 수집하고, 로그 데이터(10)를 데이터베이스에 저장할 수 있다. 가용성 개선 장치(100)는 로그 데이터에 대한 전처리를 수행하여 하나의 통합 로그를 생성하고, 통합 로그를 분석하여 에러(error) 발생 시간, 에러가 발생한 장소(서비스 제공자), 파일 타입, 파일 크기, 작업 유형, 반응 시간 등을 분석할 수 있다.

가용성 개선 장치(100)는 통합 로그의 분석 결과에 따라 접근(또는 사용) 빈도가 높은 중요 파일과 각 클라우드 스토리지에서 자주 발생하는 에러를 식별함으로써 중요 파일에 가장 적합한 클라우드 스토리지(최적 스토리지)를 결정할 수 있다. 중요 파일은 사용자가 빈번하게 사용하는 파일 또는 데이터일 수 있으며, 사용자 설정에 따라 높은 중요도를 갖는 파일 또는 데이터일 수 있다.

최적 스토리지가 결정되면, 가용성 개선 장치(100)는 중요 파일을 최적 스토리지에 복제할 수 있으며, 중요 파일에 관한 로그 데이터와 메트릭을 모니터링할 수 있다. 여기서 메트릭(Metrics)은 클라우드 스토리지 서비스의 품질을 평가하기 위한 수치로, 일종의 측정 지표라고 할 수 있다. 메트릭에 의미를 부여하기 위해서는 분석의 기준이 되는 대상 또는 객체(Dimension)가 있어야 하며, 분석 기준은 환경 설정에 따라 달라질 수 있다. 모니터링 결과는 사용자(200)에게 제공되므로, 본 발명에 의한 클라우드 스토리지 페더레이션 환경은 사용자(200)에게 높은 사용성을 제공할 수 있다.

도 2는 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션의 가용성 개선 장치를 설명하기 위한 구성도이다.

본 발명의 일 실시 예에 의한 가용성 개선 장치(100)는 로그 수집부(110), 통합 로그 생성부(130), 로그 분석부(150), 지능형 복제부(170)를 포함할 수 있으며, 실시 예에 따라 모니터링부(190), 저장부(미도시)를 더 포함할 수 있다.

로그 수집부(110)는 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집할 수 있다.

통합 로그 생성부(130)는 수집한 로그 데이터를 이용하여 통합 로그를 생성한다.

로그 분석부(150)는 통합 로그를 분석한다. 로그 분석부(150)는 로그 정량 분석부(153), 로그 정성 분석부(155)를 포함할 수 있다.

로그 정량 분석부(153)는 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출할 수 있다. 예를 들어, 로그 정량 분석부(153)는 Elasticsearch, Logstash 또는 Kibana를 포함하는 Elastic Stack tool을 이용하여 시각화된 정량 분석 결과를 제공할 수 있다.

로그 정량 분석부(153)는 정량 분석을 통해 클라우드 스토리지의 성능, 실패(에러 발생) 비율, 최대 처리 소요 시간, 반응 시간, 처리 가능한 파일 유형, 작업 유형 및 사용자 별 파일 수요 등에 대한 통계를 산출할 수 있다.

보다 구체적으로, 통합 로그에 포함된 에러 정보는 평균 에러 발생 간격(MTBF) 및 최대 에러 복구 시간(MTTR)을 포함하며, 로그 정보는 로그 데이터가 기록된 생성된 날짜와 시간을 나타내는 로그 시각(LogTime), 로그가 에러 발생에 관한 것인지(“ERROR”), 정보를 기록한 것인지(“INFO”)를 나타내는 로그 종류(LogLevel), 각 클라우드 스토리지 서비스를 식별할 수 있는 정보인 클라우드 스토리지 식별 정보(ServiceId), 작동 요청 타입(RequestType)을 포함할 수 있다. 이 때, 클라우드 스토리지 서비스의 주요 작동 요청 타입의 예시는 아래 표 1과 같이 나타낼 수 있다.

작동 요청 타입	설명
CreateFolder()	새로운 폴더 또는 노드를 생성
DeleteFolder()	폴더 또는 노드를 삭제
RenameFolder()	폴더 또는 노드의 새 이름 생성
WriteFile()	파일 쓰기
ReadFile()	파일 읽기
DeleteFile()	파일 삭제
RenameFile()	파일의 새이름 생성
MoveFile()	폴더로부터 동일 서비스의 다른 폴더로 파일을 이동
SearchFiles()	파일 이름에서 메타데이터 파일을 검색

이밖에 로그 정보에는 클라우드 스토리지 서비스로 요청이 전송된 날짜 및 시각(RequestTime), 클라우드 스토리지로부터 응답을 수신한 시각(ResponseTime), 요청과 관련된 파일의 크기(FileSize), HTTP, FTP, WebDAV 등 클라우드 스토리지의 통신 프로토콜(ServiceProtocol), 에러 코드(ErrorCode) 또는 에러 메시지(ErrorMessage) 중 적어도 하나를 포함할 수 있다.

로그 정량 분석부(153)는 로그 정보에 포함된 클라우드 스토리지 식별 정보를 이용하여 임의의 클라우드 스토리지를 식별하고, 에러 정보에 포함된 평균 에러 발생 간격(MTBF)와 최대 에러 복구 시간(MTTR)을 이용하여 아래 수학식 1과 같이 식별된 클라우드 스토리지에 대응하는 정량 분석 가용성 점수(A)를 산출할 수 있다. 만약 에러가 발생되지 않으면, 정량 분석 가용성 점수 A는 100으로 산출될 것이다.

예를 들어, 로그 정량 분석부(153)는 통합 로그 분석으로 클라우스 스토리지 서비스의 ID를 얻을 수 있다(getIDService). 다음으로는 모든 클라우드 스토리지 서비스의 에러와 평균 에러 발생 간격(MTBF: Mean Time Between Faults)를 얻을 수 있는데, 평균 에러 발생 간격(MTBF)를 얻기 위해 이용되는 수식은 다음과 같다

여기서, MTTD는 평균 에러 검출 시간(Mean Time To Detection), MTTF는 평균 에러 발생 시간(Mean Time To Failure), MTTR은 최대 에러 복구 시간(Maximum Time To Recovery), 즉 에러 발생 후 그 문제를 해결(recovery)하기까지 걸린 시간의 최대값을 의미한다.

일 예로, 로그 정량 분석부(153)는 분석하고자 하는 기간을 입력받을 수 있는데, 해당 기간 동안 임의의 클라우드 스토리지 서비스에서 생성된 로그를 탐색할 수 있다. 로그 정량 분석부(153)는 각 클라우드 스토리지 서비스별로 가용성과 관련된 에러 코드와 에러 메시지를 검출할 수 있으며, 검출된 에러에서 평균 에러 발생 간격(MTBF)를 얻을 수 있다.

로그 정성 분석부(155)는 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출할 수 있다. 즉, 에러 코드를 이용하여 통합 로그를 정성 분석할 수도 있고, 에러 메시지를 이용하여 통합 로그를 정성 분석할 수도 있다.

에러 코드를 이용하여 정성 분석을 수행하는 경우, 로그 정성 분석부(155)는 통합 로그에서 기 정의된 제 1 에러 코드를 탐색하고, 탐색 결과 통합 로그에 제 1 에러 코드가 포함되어 있으면, 제 1 에러 코드에 대응되는 점수를 제 1 에러 코드를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영함으로써 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출할 수 있다.

에러 코드는 서비스 프로토콜과 함께 미리 정의될 수 있으며, 아래 표 2와 같이 테이블 형태로 저장부(미도시)에 저장될 수 있다. 서비스 프로토콜과 에러 코드는 가용성 계산에 고려해야 하는 에러를 포함하도록 미리 구성된 것일 수 있다.

프로토콜	에러 코드	내용
HTTP/WebDAV	423	리소스 잠김(Resource Locked)
	429	너무 많은 요청(Too Many Requests)
	500	내부 서버 에러(Internal server error)
	501	실행되지 않음(Not Implementeed)
	502	게이트웨이 불량(Bad Gateway)
	503	서비스 사용 불가(Service Unavailable)
	504	게이트웨이 시간초과(Gateway Timeout)
FTP	421	서비스 사용 불가(Service Not Available)
	426	연결 불가(Connection Closed); 전송 중단(Transfer Aborted)
	434	요청 호스트 사용 불가(Requested Host Unavailable)
	451	액션 중단 요청(Requested Action Aborted), 로컬 에러 진행중(Local Error in Processing)
	534	서버 연결 불가(could Not Connect to Server)
	10060	멀리 떨어진 서버에 접속 불가(Cannot Connect to Remote Server)
	10068	너무 많은 사용자로 인한 서버 포화(Too Many Users, Server is Full)

즉, 로그 정성 분석부(155)는 통합 로그에서 기 정의된 프로토콜 및/또는 에러 코드를 검색할 수 있다. 예를 들어, 로그 정성 분석부(155)는 통합 로그에 클라우드 스토리지 서비스 프로토콜이 FTP로 표시되어 있으면, 기 정의된 에러 코드 421, 426, 434, 451, 534, 10060, 40068 중 어느 하나가 통합 로그에 포함되는지 탐색할 수 있다. 통합 로그에 만약 ‘534’라는 에러 코드가 포함되어 있으면, 로그 정성 분석부(155)는 클라우드 스토리지 식별 정보를 통해 확인한 스토리지 서비스 X가 서버 연결 불가 상태로 인해 제대로 작동하지 않는 것으로 판단할 수 있다. 또한 저장부(미도시)에는 각 프로토콜과 에러 코드의 조합 별로 정성 분석 가용성 점수가 미리 정의된 테이블이 저장될 수 있는데, 이 경우, 클라우드 스토리지 X의 정성 분석 가용성 점수에는 프로토콜: FTP 에러 코드: 534에 대응하는 가용성 점수가 부여될 수 있다.

에러 메시지를 이용하여 정성 분석을 수행하는 경우, 로그 정성 분석부(155)는 통합 로그에서 기 정의된 제 1 에러 메시지를 탐색하고, 탐색 결과 통합 로그에 제 1 에러 메시지가 포함되어 있으면, 제 1 에러 메시지의 극성을 판단할 수 있다. 에러 메시지를 이용한 정성 분석은 텍스트 감정 분석을 기반으로 한다. 로그 정성 분석부(155)는 Naive Bayes 분류기를 이용하여 제 1 에러 메시지의 극성을 판단할 수 있으며, 네거티브 에러 메시지를 가용성 판단 점수에 반영할 수 있다.

즉, 가용성과 관련된 에러 메시지는 저장부(미도시)에 미리 저장될 수 있는데, 에러 메시지에 포함되는 단어 또는 구문에 대응되는 극성은 아래 표 3과 같이 미리 정의되어 있을 수 있으며, 이를 바탕으로 에러 메시지의 극성이 판단될 수 있다.

구문	극성
Network authentication Required	Positive
Internal issue	Negative
Bad Request	Positive
Insufficient Storage	Positive
Unauthorized	Positive
Failed to write file to disk	Negative
Method Not Allowed	Positive
Unsuppoerted Media Type	Positive
Unable to save or download files	Negative
Server error	Negative
Bandwidth Limit Exceeded	Positive
User is over storage quota	Positive
Invalid username of password	Positive
Requested action not taken. File name not allowed	Positive

로그 정성 분석부(155)는 에러 메시지의 극성을 판단하면 극성에 대응되는 점수를 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영함으로써 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출할 수 있다.

다른 실시 예로, 만약 하나 이상의 제 1 에러 메시지의 극성이 동일하면, 로그 정성 분석부(155)는 제 1 에러 메시지에 포함된 단어 또는 구문을 이용하여 제 1 에러 메시지의 강도(intensity)를 판단하고, 강도에 대응되는 점수를 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영할 수 있다.

강도를 판단함에 있어서는 사용된 단어나 문구 각각에 High / Medium / Low 와 같은 수준(level)을 미리 정의하고, 이를 활용하여 강도를 판단할 수 있다.

또 다른 실시 예로, 로그 정성 분석부(155)는 비판도(criticism)를 판단할 수 있는데, 비판도는 가용성과 관련된 값을 미리 테이블로 정의하고, 전술한 에러 메시지의 극성과 강도를 판단하는 것과 같이 테이블을 참조하여 에러 메시지에 포함된 단어 또는 구문에 매칭되는 비판도를 탐색하여 정성 분석 가용성 점수에 반영할 수 있다.

이밖에, 로그 분석부(150)는 높은 빈도로 발생하는 실패(Failure)를 식별하여, 가용성과 관련된 패턴을 감지할 수 있으며, 이는 가용성 점수를 계산하는데 활용될 수 있다.

지능형 복제부(170)는 통합 로그 분석 결과를 이용하여 사용 빈도가 기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하고, 중요 파일을 최적 스토리지에 복제할 수 있다. 나아가, 지능형 복제부(170)는 정량 분석 가용성 점수 및 정성 분석 가용성 점수를 통합하여, 최적 스토리지를 결정할 수 있다. 즉, 본 발명에 의하면 두 종류의 분석 결과를 이용하여 유동적인 실시간 의사 결정 결과를 얻을 수 있다. 본 발명에 의하면 각 클라우드 스토리지의 성능, 실패 비율, 피크 타임, 반응 시간, 작업 유형, 중요 파일의 파일 유형 등 선택된 통계에 따라 중요 파일의 복제 또는 마이그레이션(migration)이 이루어진다는 점에서 종래 기술과는 차이가 있다.

또한, 본 발명에 의하면 정량적 분석을 통해 서로 다른 구조를 갖는 로그를 분석할 수 있을 뿐 아니라, 사용자에게 QoS를 보장하기 위하여 클라우드 스토리지 페더레이션 환경에서 가용성 향상에 초점을 맞추어 정성 분석과 정량 분석을 수행한다는 점이다. 또한, 본 발명에 의하면 클라우드 스토리지 페더레이션 로그의 메타 데이터 분석을 통해 최적의 스토리지 서비스를 선택할 수 있으므로, 가용성이 현저하게 향상되는 효과가 있다.

모니터링부(190)는 중요 파일과 관련된 로그 데이터와 가용성 메트릭을 모니터링하여, 모니터링 결과를 사용자에게 제공할 수 있다.

도 3은 본 발명의 일 실시 예에 의한 클라우드 스토리지 페더레이션의 가용성 개선 방법을 설명하기 위한 순서도이다. 본 발명의 클라우드 스토리지 페더레이션의 가용성 개선 방법은 가용성이 개선된 서비스를 사용자에게 제공할 수 있는 일종의 프레임워크에 의한 것으로 이해될 수 있다. 따라서 본 발명의 가용성 개선 방법의 실행 주체는 본 발명의 프레임워크를 사용하는 임의의 서버 또는 클라이언트 또는 미들웨어일 수 있다. 본 명세서에서는 설명의 편의를 위하여 실행 주체를 서버로 기재하여 가용성 개선 방법을 설명한다.

도 3을 참조하면, 서버는 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집하고(S100), 수집한 로그 데이터를 이용하여 통합 로그를 생성할 수 있다(S200). 다음으로 서버는 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출할 수 있으며(S300), 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출할 수 있다(S400). 여기서 에러 정보는 평균 에러 발생 간격(MTBF) 및 최대 에러 복구 시간(MTTR)을 포함하며, 로그 정보는 로그 시각, 로그 종류, 클라우드 스토리지 식별 정보, 작동 요청 타입, 클라우드 스토리지로 요청이 전송된 시각, 클라우드 스토리지로부터 응답을 수신한 시각, 요청과 관련된 파일의 크기, 클라우드 스토리지의 통신 프로토콜, 에러 코드 또는 에러 메시지 중 적어도 하나를 포함하는 것일 수 있다.

서버는 정량 분석 가용성 점수 및 정성 분석 가용성 점수를 통합하여, 사용 빈도가 기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하며(S500), 중요 파일을 최적 스토리지로 복제할 수 있다(S600). 중요 파일은 사용자가 빈번하게 사용하는 파일 또는 데이터를 의미하는 것으로, 빈번하게 사용되는 데이터는 가용성 높은 스토리지에 저장할 필요가 있기 때문이다.

서버는 중요 파일과 관련된 로그 데이터와 가용성 메트릭을 모니터링할 수 있으며(S700), 모니터링 결과를 사용자에게 제공함으로써(S800) 사용성을 향상시키고, 클라우드 스토리지 페더레이션 환경을 사용하는 사용자의 만족도를 높일 수 있다.

도 4는 본 발명의 일 실시 예에 의한 정량 분석 가용성 점수 산출 방법을 보다 구체적으로 설명하기 위한 순서도이다. 도 4를 참조하면, 상술한 단계 300에서, 서버는 로그 정보에 포함된 클라우드 스토리지 식별 정보를 이용하여 임의의 클라우드 스토리지를 식별할 수 있다(S330). 그리고 에러 정보에 포함된 평균 에러 발생 간격(MTBF)와 최대 에러 복구 시간(MTTR)을 이용하여 수식 1에 따라 식별된 클라우드 스토리지에 대응하는 정량 분석 가용성 점수(A)를 산출할 수 있다(S350).

단계 300에서 서버는 Elasticsearch, Logstash 또는 Kibana를 포함하는 Elastic Stack tool을 이용하여 정량 분석을 수행할 수 있으나, 이는 일 예에 불과하며 정량 분석에 사용되는 도구는 위에서 나열한 예시에 의해 제한되지 않는다.

Elastric Stack tool은 오픈 소스로, 정형, 비정형, 위치정보, 메트릭 등 다양한 유형의 검색을 수행하고 결합할 수 있는 도구이다. Elasticsearch는 분산형 RESTful 검색 및 분석 엔진이며, Kibana는 데이터를 히스토그램, 라인 그래프, 파이 차트, 선버스트 등으로 데이터를 형상화할 수 있도록 돕는 도구이다. Lostash는 오픈소스 서버측 데이터 처리 파이프라인으로, 다양한 소스에서 동시에 데이터를 수집(Ingest)하여 변환한 후 자주 사용하는 저장소로 보낼 수 있다.

이하에서는 도 5 및 도 6을 참조하며, 본 발명의 일 실시 예에 의한 정성 분석 가용성 점수 산출 방법의 실시 예들을 살펴본다. 도 5는 에러 코드를 이용한 정성 분석 가용성 점수 산출 방법을 설명하기 위한 도면이다. 도 5를 참조하면 서버는 단계 400에서 통합 로그에서 기 정의된 제 1 에러 코드를 탐색하고(S401), 탐색 결과 통합 로그에 제 1 에러 코드가 포함되어 있으면, 제 1 에러 코드에 대응되는 점수를 제 1 에러 코드를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영할 수 있다(S405).

도 6의 실시 예는 에러 메시지를 이용한 정성 분석 가용성 점수 산출 방법을 나타낸다. 도 5을 참조하면, 단계 400에서 서버는 통합 로그에서 기 정의된 제 1 에러 메시지를 탐색하고(S410), 탐색 결과 통합 로그에 제 1 에러 메시지가 포함되어 있으면, 제 1 에러 메시지의 극성을 판단할 수 있다(S420). 단계 420에서, 서버는 Naive Bayes 분류기를 이용하여 제 1 에러 메시지의 극성을 판단할 수 있다. 에러 메시지의 극성을 판단하면, 서버는 극성에 대응되는 점수를 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영할 수 있다(S430).

만약 하나 이상의 에러 메시지들의 극성이 동일하면(S440), 서버는 추가적으로 에러 메시지에 포함된 단어 또는 구문을 이용하여 에러 메시지의 강도를 판단할 수 있다(S450). 서버는 판단한 강도에 대응되는 점수를 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영함으로써(S460), 정성 분석 결과를 중요 파일의 최적 스토리지 선정에 활용할 수 있도록 한다.

본 명세서에서 설명되는 방법들은 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 컴퓨터 프로그램들에 의해 구현될 수 있다. 컴퓨터 프로그램들은 비-일시적인 유형의 컴퓨터 판독가능 매체에 저장되는 프로세서-실행가능 명령들을 포함한다. 컴퓨터 프로그램들은 또한 저장된 데이터를 포함할 수 있다. 비-일시적인 유형의 컴퓨터 판독가능 매체(non-transitory tangible computer readable medium)의 비한정적 예들은 비휘발성 메모리 시스템, 자기 저장소 및 광학 저장소이다.

앞서 설명된 기법들의 특정 실시형태들은 알고리즘 형태로 본 명세서에서 설명되는 처리 단계들 및 명령들을 포함한다. 앞서 설명된 처리 단계들 및 명령들은 소프트웨어, 펌웨어, 혹은 하드웨어로 구현될 수 있고, 소프트웨어로 구현되는 경우 실시간 네트워크 오퍼레이팅 시스템(real time network operating system)들에서 사용되는 다른 플랫폼들 상에 상주하도록 다운로드 될 수 있고 이로부터 동작될 수 있음에 유의해야만 한다.

본 발명은 또한 본 명세서에서의 동작들을 수행하기 위한 장치와 관련된다. 이러한 장치는 원하는 목적을 위해 특별히 구성될 수 있거나, 또는 컴퓨터에 의해 액세스될 수 있는 컴퓨터 판독가능 매체 상에 저장된 컴퓨터 프로그램에 의해 선택적으로 활성화되거나 재구성되는 범용 컴퓨터를 포함할 수 있다. 이러한 컴퓨터 프로그램은 유형의 컴퓨터 판독가능 저장 매체에 저장될 수 있는바, 이러한 유형의 컴퓨터 판독가능 저장 매체는, 예를 들어, 플로피 디스크들, 광학 디스크들, CD-ROM들, 자기-광학 디스크들(magnetic-optical disks), 판독-전용 메모리(Read-Only Memory, ROM)들, 랜덤 액세스 메모리(Random Access Memory, RAM)들, EPROM들, EEPROM들, 자기 혹은 광학 카드들, 애플리케이션 특정 집적 회로(ASIC)들을 포함하는 임의 타입의 디스크, 또는 전자 명령들을 저장하기에 적합하고 그 각각이 컴퓨터 시스템 버스에 결합되는 임의 타입의 매체들이 있지만 이러한 것으로만 한정되는 것은 아니다. 더욱이, 본 명세서에서 지칭되는 컴퓨터들은 단일 프로세서를 포함할 수 있거나, 또는 컴퓨팅 능력 증진을 위해 복수의 프로세서 설계를 사용하는 아키텍처들일 수 있다.

본 명세서에 제시되는 알고리즘들 및 동작들은 본질적으로 임의의 특정 컴퓨터 혹은 다른 장치들과 관련되지 않는다. 다양한 범용 시스템들이 또한, 본 명세서에서의 가르침에 따른 프로그램들과 함께 사용될 수 있고, 또는 원하는 방법의 단계들을 수행하기 위해 더 특수하게 설계된 장치들을 구성하는 것이 편리한 것으로 판명될 수 있다. 다양한 이러한 시스템들을 위해 그 요구되는 구조는 그 등가적 변형물들과 함께 본 발명의 기술 분야에서 숙련된 자들에게 명백할 것이다. 추가적으로, 본 개시내용은 임의의 특정 프로그래밍 언어와 관련되어 설명되는 것이 아니다. 다양한 프로그래밍 언어가 본 명세서에서 설명되는 바와 같은 본 개시내용의 가르침들을 구현하기 위해 사용될 수 있고, 특정 언어에 대한 임의의 언급은 본 발명의 실시예 및 최상의 모드를 설명하기 위한 것임을 이해해야 한다.

본 명세서에서 생략된 일부 실시 예는 그 실시 주체가 동일한 경우 동일하게 적용 가능하다. 또한, 전술한 본 발명은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시 예 및 첨부된 도면에 의해 한정되는 것이 아니다.

10: 로그 데이터
50: 클라우드 스토리지 페더레이션
100: 클라우드 스토리지 페더레이션 가용성 개선 장치
200: 사용자

Claims

서버가 하나 이상의 클라우드 스토리지를 포함하는 클라우드 스토리지 페더레이션의 가용성을 개선하는 방법에 있어서,
상기 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집하여 통합 로그를 생성하는 단계;
상기 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 상기 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출하는 단계;
상기 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 상기 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출하는 단계;
상기 정량 분석 가용성 점수 및 상기 정성 분석 가용성 점수를 통합하여, 사용 빈도가 기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하는 단계;
상기 중요 파일을 상기 최적 스토리지로 복제하는 단계를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제1항에 있어서,
상기 에러 정보는 평균 에러 발생 간격(MTBF) 및 최대 에러 복구 시간(MTTR)을 포함하며,
상기 로그 정보는 로그 시각, 로그 종류, 클라우드 스토리지 식별 정보, 작동 요청 타입, 상기 클라우드 스토리지로 요청이 전송된 시각, 상기 클라우드 스토리지로부터 응답을 수신한 시각, 요청과 관련된 파일의 크기, 상기 클라우드 스토리지의 통신 프로토콜, 에러 코드 또는 에러 메시지 중 적어도 하나를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제1항에 있어서,
상기 정량 분석 가용성 점수 산출 단계는
상기 로그 정보에 포함된 클라우드 스토리지 식별 정보를 이용하여 임의의 클라우드 스토리지를 식별하는 단계;
상기 에러 정보에 포함된 평균 에러 발생 간격(MTBF)와 최대 에러 복구 시간(MTTR)을 이용하여 다음 수식에 따라 상기 식별된 클라우드 스토리지에 대응하는 정량 분석 가용성 점수(A)를 산출하는 단계를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제1항에 있어서,
상기 중요 파일과 관련된 로그 데이터와 가용성 메트릭을 모니터링하는 단계;
상기 모니터링 결과를 사용자에게 제공하는 단계를 더 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제1항에 있어서,
상기 정성 분석 가용성 점수 산출 단계는
상기 통합 로그에서 기 정의된 제 1 에러 코드를 탐색하는 단계;
상기 탐색 결과 상기 통합 로그에 상기 제 1 에러 코드가 포함되어 있으면,
상기 제 1 에러 코드에 대응되는 점수를 상기 제 1 에러 코드를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제1항에 있어서,
상기 정성 분석 가용성 점수 산출 단계는,
상기 통합 로그에서 기 정의된 제 1 에러 메시지를 탐색하는 단계;
상기 탐색 결과 상기 통합 로그에 상기 제 1 에러 메시지가 포함되어 있으면, 상기 제 1 에러 메시지의 극성을 판단하는 단계;
상기 극성에 대응되는 점수를 상기 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제6항에 있어서,
상기 극성을 판단하는 단계는,
Naive Bayes 분류기를 이용하여 상기 제 1 에러 메시지의 극성을 판단하는 단계를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
제6항에 있어서,
상기 정성 분석 가용성 점수 산출 단계는
하나 이상의 제 1 에러 메시지의 극성이 동일하면, 상기 제 1 에러 메시지에 포함된 단어 또는 구문을 이용하여 상기 제 1 에러 메시지의 강도(intensity)를 판단하는 단계;
상기 강도에 대응되는 점수를 상기 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 더 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 방법.
하나 이상의 클라우드 스토리지를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 장치에 있어서,
상기 하나 이상의 클라우드 스토리지의 제공자로부터 각 클라우드 스토리지의 로그 데이터를 수집하는 로그 수집부;
상기 수집한 로그 데이터를 이용하여 통합 로그를 생성하는 통합 로그 생성부;
상기 통합 로그를 분석하는 로그 분석부;
상기 통합 로그 분석 결과를 이용하여 사용 빈도가 기준치 이상인 중요 파일에 대응하는 최적 스토리지를 결정하고, 상기 중요 파일을 상기 최적 스토리지에 복제하는 지능형 복제부를 포함하며,
상기 로그 분석부는
상기 통합 로그에 포함된 에러 정보 및 로그 정보를 이용하여 상기 각 클라우드 스토리지의 정량 분석 가용성 점수를 산출하는 로그 정량 분석부;
상기 통합 로그에 포함된 에러 코드 또는 에러 메시지를 이용하여 상기 각 클라우드 스토리지의 정성 분석 가용성 점수를 산출하는 로그 정성 분석부를 포함하고,
상기 지능형 복제부는
상기 정량 분석 가용성 점수 및 상기 정성 분석 가용성 점수를 통합하여, 상기 최적 스토리지를 결정하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제9항에 있어서,
상기 에러 정보는 평균 에러 발생 간격(MTBF) 및 최대 에러 복구 시간(MTTR)을 포함하며,
상기 로그 정보는 로그 시각, 로그 종류, 클라우드 스토리지 식별 정보, 작동 요청 타입, 상기 클라우드 스토리지로 요청이 전송된 시각, 상기 클라우드 스토리지로부터 응답을 수신한 시각, 요청과 관련된 파일의 크기, 상기 클라우드 스토리지의 통신 프로토콜, 에러 코드 또는 에러 메시지 중 적어도 하나를 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제9항에 있어서,
상기 로그 정량 분석부는
상기 로그 정보에 포함된 클라우드 스토리지 식별 정보를 이용하여 임의의 클라우드 스토리지를 식별하고, 상기 에러 정보에 포함된 평균 에러 발생 간격(MTBF)와 최대 에러 복구 시간(MTTR)을 이용한 다음 수식에 따라 상기 식별된 클라우드 스토리지에 대응하는 정량 분석 가용성 점수(A)를 산출하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제9항에 있어서,
상기 중요 파일과 관련된 로그 데이터와 가용성 메트릭을 모니터링하여, 상기 모니터링 결과를 사용자에게 제공하는 모니터링부를 더 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제9항에 있어서,
상기 로그 정성 분석부는
상기 통합 로그에서 기 정의된 제 1 에러 코드를 탐색하고, 상기 탐색 결과 상기 통합 로그에 상기 제 1 에러 코드가 포함되어 있으면, 상기 제 1 에러 코드에 대응되는 점수를 상기 제 1 에러 코드를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제9항에 있어서,
상기 로그 정성 분석부는
상기 통합 로그에서 기 정의된 제 1 에러 메시지를 탐색하고, 상기 탐색 결과 상기 통합 로그에 상기 제 1 에러 메시지가 포함되어 있으면, 상기 제 1 에러 메시지의 극성을 판단하고, 상기 극성에 대응되는 점수를 상기 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제14항에 있어서,
상기 로그 정성 분석부는 Naive Bayes 분류기를 이용하여 상기 제 1 에러 메시지의 극성을 판단하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제14항에 있어서,
상기 로그 정성 분석부는
하나 이상의 제 1 에러 메시지의 극성이 동일하면, 상기 제 1 에러 메시지에 포함된 단어 또는 구문을 이용하여 상기 제 1 에러 메시지의 강도(intensity)를 판단하고, 상기 강도에 대응되는 점수를 상기 제 1 에러 메시지를 생성한 클라우드 스토리지의 정성 분석 가용성 점수에 반영하는 단계를 더 포함하는 클라우드 스토리지 페더레이션의 가용성 개선 장치.
제 1 항 내지 제 8 항의 방법 중 어느 하나의 방법을 실행시키기 위하여 컴퓨터 판독 가능 매체에 저장된 클라우드 스토리지 페더레이션의 가용성 개선 응용 프로그램.