KR20140098212A - 사용자 간의 중복제거를 허용하기 위한 저장소 할인 - Google Patents

사용자 간의 중복제거를 허용하기 위한 저장소 할인 Download PDF

Info

Publication number
KR20140098212A
KR20140098212A KR1020147017667A KR20147017667A KR20140098212A KR 20140098212 A KR20140098212 A KR 20140098212A KR 1020147017667 A KR1020147017667 A KR 1020147017667A KR 20147017667 A KR20147017667 A KR 20147017667A KR 20140098212 A KR20140098212 A KR 20140098212A
Authority
KR
South Korea
Prior art keywords
data
deduplication
flagged
data store
data center
Prior art date
Application number
KR1020147017667A
Other languages
English (en)
Other versions
KR101583748B1 (ko
Inventor
이제키엘 크룩릭
Original Assignee
엠파이어 테크놀로지 디벨롭먼트 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 filed Critical 엠파이어 테크놀로지 디벨롭먼트 엘엘씨
Publication of KR20140098212A publication Critical patent/KR20140098212A/ko
Application granted granted Critical
Publication of KR101583748B1 publication Critical patent/KR101583748B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

데이터센터 환경에서, 복수의 개별 사용자들 사이에서 데이터 저장소의 중복제거를 위한 기술이 제시된다. 일부 예들에서, 중복제거는, 다양한 데이터 모듈 및 머신 인스턴스의 개별 암호화 및 패키징을 고려할 수 있으며, 고객이 데이터가 중복제거에 가용한 것으로 적극적으로 플래그 표시하는 것에 기초하여 실행될 수 있다. 빌링 시스템 기록이, 할인을 통해 사용자에게 동기 부여를 위해 유보된 공간을 트래킹하는데 사용될 수 있으며, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로 사용될 수 있으며, 이것은 다중 패키지 환경에서는 실행되기 어려울 수 있다.

Description

사용자 간의 중복제거를 허용하기 위한 저장소 할인{STORAGE DISCOUNTS FOR ALLOWING CROSS-USER DEDUPLICATION}
본 개시는, 사용자 사이의 중복제거를 허용하기 위한 저장소 할인을 제공하기 위한 기술을 일반적으로 기술한다.
여기에서 달리 지적되지 않는다면, 본 섹션에서 설명되는 내용은 본 출원에서 청구범위에 대한 종래 기술이 아니며, 본 섹션에 포함함으로써 선행 기술로 인정되지 않는다.
네트워킹 및 데이터 저장 기술의 도래에 따라, 더 많은 수의 컴퓨팅 장치가, 다양한 수준에서 컴퓨팅 자원에 대한 대여 엑세스를 가능하게 하는 클라우드에 기초한 데이터센터에 의해 사용자들 또는 고객들에게 제공되고 있다. 데이터센터는, 개인 및 조직에게 시스템 배치 및 운영에 관한 다양한 해결책을 제공할 수 있다. 데이터센터가 매우 큰 규모의 데이터 저장소 및 프로세싱을 처리할 수 있게 설비를 갖추는 반면, 데이터 저장소는, 자원, 대역폭, 속도 및 장비의 회계 비용에 있어서 여전히 비용이 많이 든다. 데이터센터 운영의 다른 측면은, 사용자들 사이의 데이터(예를 들어, 애플리케이션, 구성 데이터, 및 소비가능한 데이터)의 중복이다. 보안을 보장하기 위해, 많은 데이터센터들은, 사용자 데이터에 대한 인증되지 않은 엑세스를 방지하는 암호화 또는 유사한 기법들을 제공한다.
데이터 중복제거는, 동일한 데이터의 연속을 식별하는 해쉬(hash) 또는 다른 반유일한 식별자(semi-unique identifier)를 사용하고, 그것을 하나의 (또는 몇몇 중복되는) 저장된 사본, 및 그 마스터 사본에 사용되는 데이터의 각 장소로부터의 포인터로 치환하는 기술이다. 개인 클라우드의 VDI(Virtual Desktop Infrastructure) 내에서, 예를 들어, 사용자 운영 체제는 전형적으로 동시에 갱신되고, 실질적으로 운영 체제의 단일 사본 및 애플리케이션의 주요 부분이 사용되어 대부분의 사용자들에게 서비스를 제공되기 때문에, 중복제거는 상당한 효과를 가질 수 있다.
일부 예들에 따르면, 데이터센터 환경에서 복수 사용자를 사이의 데이터 저장소 중복제거를 위한 방법은, 중복제거에 가용하다고 플래그 표시된 데이터 저장소를 결정하는 단계, 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하는 단계, 플래그 표시된 데이터 저장소의 섹션을 제거하는 단계, 및 제거된 섹션을 중복제거 포인터로 대체하는 단계를 포함할 수 있다.
다른 예들에 따르면, 데이터센터 환경에서 복수 사용자 사이의 데이터 저장소 중복제거를 실행하는 서버는, 명령어를 저장하는 메모리, 및 저장된 명령어와 결합하여 데이터 관리 애플리케이션을 실행하는 프로세서를 포함할 수 있다. 프로세서는, 중복제거에 가용하다고 플래그 표시된 데이터 저장소를 결정하고, 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하고, 플래그 표시된 데이터 저장소의 섹션을 제거하고, 제거된 섹션을 중복제거 포인터로 치환하고, 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신할 수 있다.
또 다른 예들에 따르면, 복수 사용자 사이의 데이터 저장소 중복제거를 실행하는 데이터센터는, 복수의 데이터 저장소 및 데이터 관리를 위한 적어도 하나의 서버를 포함할 수 있다. 서버는, 중복제거에 가용하다고 플래그 표시된 데이터 저장소를 결정하고, 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하고, 플래그 표시된 데이터 저장소의 섹션을 제거하고, 제거된 섹션을 중복제거 포인터로 치환하고, 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신할 수 있다.
이상의 요약은 단순히 예시적인 것으로서 어떠한 방식으로든 제한적으로 의도된 것이 아니다. 이하의 상세한 설명과 도면을 참조함으로써, 상기 설명된 예시적인 양태들, 실시예들, 그리고 특징들에 더하여, 추가적인 양태들, 실시예들, 그리고 특징들 또한 명확해질 것이다.
본 개시의 전술한 특징 및 다른 특징은 첨부 도면과 결합하여, 다음의 설명 및 첨부된 청구범위로부터 더욱 충분히 명백해질 것이다. 이들 도면은 본 개시에 따른 단지 몇 개의 예시를 묘사할 뿐이고, 따라서, 본 개시의 범위를 제한하는 것으로 고려되어서는 안 될 것임을 이해하면서, 본 개시는 첨부 도면의 사용을 통해 더 구체적이고 상세하게 설명될 것이다.
도 1은, 사용자 사시의 중복제거를 허용하기 위한 저장소 할인이 제공될 수 있는 예시적인 데이터센터를 도시한다.
도 2는, 단순화된 개인 클라우드에 기초한 시스템 시나리오에서 예시적인 데이터 중복제거를 개념적으로 도시한다.
도 3은, 중복제거 실현의 개요를 도시한다.
도 4는, 반복적인 중복제거 및 빌링 크레딧(billing credit)에서의 예시적인 동작 흐름도 및 구성요소를 도시한다.
도 5는, 사용자 사이의 중복제거를 허용하는 저장소 할인을 제공하는 시스템을 구현하는데 사용될 수 있는 범용 컴퓨팅 장치를 도시한다.
도 6은, 사용자 사이의 중복제거를 허용하는 저장소 할인을 제공하는 예시적인 방법을 도시하는 흐름도이다.
도 7은, 본원에 기술된 적어도 일부 실시예에 따른 예시적인 컴퓨터 프로그램 제품의 블록도를 도시한다.
이하의 상세한 설명에서 본 개시의 일부를 이루는 첨부된 도면이 참조된다. 문맥에서 달리 지시하고 있지 않은 한, 통상적으로, 도면에서 유사한 부호는 유사한 컴포넌트를 나타낸다. 상세한 설명, 도면, 그리고 청구범위에 설명되는 예시적인 예시는 제한적으로 여겨지지 않는다. 본 개시에서 제시되는 대상의 범위 또는 사상에서 벗어나지 않으면서도 다른 예시가 이용되거나, 다른 변경이 이루어질 수 있다. 여기에서 일반적으로 설명되고, 도면에 도시되는 본 개시의 양태는 다양한 다른 구성으로 배열, 대체, 조합, 분리, 및 설계될 수 있음과 이 모두가 여기에서 암시적으로 고려됨이 기꺼이 이해될 것이다.
본 개시는 일반적으로, 무엇보다도, 사용자 사이의 중복제거를 허용하는 저장소 할인을 제공하는데 관련되는 방법, 장치, 시스템, 디바이스, 및/또는 컴퓨터 프로그램 제품에 관한 것이다.
간단히 기술하면, 데이터센터 환경에서 복수의 분리된 사용자들 사이의 데이터 저장소의 중복제거를 위한 기술이 제시된다. 중복제거는, 다양한 비활성화된 데이터 모듈 및 머신 인스턴스(machine instance)의 개별적인 암호화 및 패키징을 고려할 수 있으며, 중복제거에 가용한 데이터에 대한 고객의 적극적인 플래그 표시(flagging)에 기초하여 실행될 수 있다. 빌링 시스템 기록이 사용되어, 할인을 통한 사용자 혜택 제공(incentivizing)을 위해 확보된 공간을 트래킹할 수 있다. 기록은 또한, 다중 패키지 환경에서는 어려울 수 있는, 중복제거 패키지의 사용 트래킹을 위한 가비지 수집 마스터 참조(garbage collection master reference)로써 사용될 수 있다.
본원에서 사용되는 "저장소 할인(storage discount)"이라는 용어는, (단일 사용자 또는 사용자 사이의) 데이터 중복제거에 기초하여 감소된 데이터 저장소 크기에 대해 데이터센터의 사용자에게 제공될 수 있는 금전적 또는 그와 대등한 보상을 의미한다. 이러한 보상은, 실제 지불, 데이터센터 비용의 감액, 크레딧, 또는 유사한 방법의 형태일 수 있다.
도 1은, 본원에 개시된 적어도 일부 실시예에 따라 배열된, 사용자 사이의 중복제거를 허용하는 저장소 할인이 제공될 수 있는 예시적인 데이터센터를 도시한다.
다이어그램(100)에 도시된 바와 같이, 물리적 데이터센터(102)는, 복수의 서버 및, 방화벽, 라우터 및 이와 유사한 장치들과 같은 특수 장비들을 포함할 수 있다. 다수의 가상 서버 또는 가상 머신(104)은, 각 서버 또는 복수의 서버 상에 설치되어, 데이터 사용 클라이언트(108)에 서비스를 제공할 수 있다. 일부 구현에서, 하나 이상의 가상 머신이 가상 데이터센터(106)으로써 그루핑될 수 있다. 데이터 사용 클라이언트(108)은, 개인 컴퓨팅 장치(118)을 통해 하나 이상의 네트워크(110) 상에서 데이터센터(102)와 상호작용(112)하는 개별 사용자, 서버(116)를 통해 데이터센터(102)와 상호작용하는 기업 클라이언트, 또는 서버 그룹(114)를 통해 데이터센터(102)와 상호작용하는 다른 데이터센터를 포함할 수 있다.
최근 데이터센터는 점차적으로 클라우드에 기초한 개체이다. 데이터센터에 의해 제공되는 서비스는, 데이터 저장소, 데이터 프로세싱, 호스트된 애플리케이션, 또는 심지어 가상 데스크탑을 포함하나, 이에 한정되지는 않는다. 다수의 시나리오에서, 상당한 양의 데이터는 복수의 사용자 사이에서 공유될 수 있다. 예를 들어, 호스트된 애플리케이션 시나리오에서, 사용자는, 최소의 커스터마이제이션(customization)으로 동일한 애플리케이션의 사본을 생성할 수 있다. 따라서, 다수의 애플리케이션 데이터 뿐만 아니라 소비된 데이터의 일부는, 많은 수의 사용자를 위해 중복될 수 있으며, 여기서 커스터마이제이션 데이터 및 소비된 데이터의 일부는 유일하다. 공유 데이터 부분의 중복제거를 통해, 많은 양의 저장소 공간을 절감할 수 있다. 많은 양의 데이터가 데이터센터에 의해 유지, 복사 및 다른 방법으로 처리될 필요가 없기 때문에, 대역폭 및 프로세싱 용량과 같은 추가의 자원이 또한 절감될 수 있다.
데이터센터 환경에서 데이터 중복제거에 있어서 하나의 장애물은, 데이터센터의 클라이언트에게 제공되는 보안 및 개인정보 보호 방법들이다. 보안 및 개인정보 보호의 목적으로, 개별 클라이언트와 연관된 데이터의 일부 또는 전부를 암호화 또는 다른 방법으로 보호될 수 있다. 따라서, 중복제거될 수 있는 데이터의 부분을 결정하는 것조차도 어려울 수 있다. 일부 실시예에 따른 시스템은, 사용자로 하여금 데이터 일부를 중복제거할 수 있는 것으로 적극적으로 플래그 표시하게 함으로써, 사용자들 사이의 데이터 중복제거를 가능하게 한다.
도 2는, 본원에 기술된 적어도 일부 실시예에 따라 배열된, 단순화된 개인 클라우드에 기초한 시스템 시나리오에서 예시적인 데이터 중복제거를 개념적으로 도시한다.
단순한 예시적인 데이터 중복제거 시나리오가 도 2의 다이어그램(200)에 도시되며, 여기서 단일 운영 체제 및 애플리케이션 패밀리(application family)가 사용자에게 서비스된다. 이 시나리오에서, 몇 개의 중복적인 사본이 안전과 성능을 위해 저장될 수 있지만, 운영 체제 및 애플리케이션의 하나의 사본은 저장소를 위해 충분하다. 중복제거가 없는 기존 시스템(220)에서, 복수의 가상 머신(222)은, 데이터 저장소(224)에 애플리케이션 및 운영 체제의 개별적 사본을 저장할 수 있으며, 이를 사용자에게 제공할 수 있다. 운영체제 및 애플리케이션의 사본은 또한, 참조번호(227)에 의해 표시된 것과 같은 RAID(Redundant Array of Independent Disk) 레벨(228)에 저장될 수 있다.
중복제거가 동일한 시나리오에 적용될 때, 시스템(230)의 가상 머신(232)은 다시 운영 체제 및 애플리케이션(236)을 데이터 저장소(234)에 제공할 수 있다. 시스템(220)과 달리, 운영 체제 및 애플리케이션(237)의 단일 사본은 중복제거된 볼륨(238)에 저장될 수 있으며, 실제 저장소 위치에 대한 포인터를 이용하여 사용자에게 제공될 수 있다.
이상 기술된 시나리오는, 복수의 테넌트(tenant)를 갖는 데이터센터에 적용되지 않을 수 있다. 예를 들어, 일부 서비스 제공자는, 사용자로 하여금 저장소에 대해 무료이거나 비용을 감액 청구하는 라이브러리 머신 이미지를 실행하도록 일정 수준으로 허용하도록 노력하는 반면, 안정성 획득이나 대부분의 임의의 커스터마이제이션은 머신 이미지를 수정하는 것을 요구할 수 있다. 따라서, 하나의 선택사항은, 라이브러리 머신 이미지로 시작해서, 소프트웨어 패키지 또는 다른 변경사항을 추가해서 이것을 변경한 후, 이것과 연관된 저장소 공간과 함께 유일한 사용자 이미지로써 저장하는 것이다. 변경된 머신 이미지에 포함된 저장소는, 많은 수의 블록, 파일 또는 라이브러리 머신 이미지와 완전 동일한 파일 세그먼트를 가질 수 있다. 그러나, 머신 이미지가 커스터마이즈되거나 애플리케이션이 추가되면, 이것은 사용자 데이터가 되고, 사용자 저장소는, 종종 각 사용자에 대한 (데이터센터에 의해 관리되는) 분리된 암호화를 포함하여, 기존의 데이터센터에서 특별히 고립될 수 있다.
사용자가 임의의 블록 저장소를 "중복제거 허락됨"으로 지정 가능하게 되고, 데이터센터가 사용자 사이의 (또는 심지어 사용자 자체의) 중복제거를 실행 가능하게 되면, 데이터센터 사이의 데이터 중복, 데이터 백업, 데이터를 사용하는 머신의 이주(migrating) 등의 비용은 상당히 감소될 수 있다. 사용자들은 이러한 비용 절감의 일부를 실현하게 되면, 어떤 데이터 세그먼트가 중복제거될 수 있는지 식별하고 표시하도록 동기부여될 수 있다. 복수의 머신 이미지의 경우, 저장소 절감은 실제 저장소 볼륨의 대부분에 해당될 수 있다.
일부 실시예에 따른 중복제거 시스템은, 복수의 상이하게 패키징된 저장된 머신 인스턴스(machine instance)에 대해 작용할 수 있으며, 빌링 시스템과 연계하여 사용자와 절감을 공유하고, 다수의 암호화된 볼륨 사이의 가비지 수집을 관리할 수 있다. 데이터센터에서의 하나의 이점은, 더 낮은 전체 투자 비용, 저장소 절감의 보류된 부분으로부터의 재정 이득, 더 낮은 데이터 이전 필요성, 및 데이터센터가 여분의 용량을 가질 때 실행될 수 있는 중복제거 작업들이 될 수 있다.
도 3은, 본원에 개시된 적어도 일부 실시예에 따라 배열된, 중복제거 구현의 개요를 도시한다.
다이어그램(300)에 도시된 바와 같이, 데이터센터는, 각 사용자를 위한 개별적 암호화된 사용자 패키지(302, 304, 306)를 가질 수 있다. 이 패키지들은 데이터센터에 의해 암호화될 수 있으며, 데이터센터는 머신 이미지 구현에서 키를 가질 수 있다. 개별 사용자 패키지는, 하나 이상의 운영 체제, 운영 체제 변경 및/또는 애드온
동일한 구현 및 방법이 서로 다른 규모에서 사용되어, 예를 들어, 서비스로써 단일 사용자 배치 내에서 중복제거를 제공할 수 있으며, 이 경우, 고객 사이의 중복제거에 의해 얻을 수 있는 것에 비해 적은 전체 중복제거 절감 효과를 가질 수는 있지만, 사용자는 그 저장소 요구 및 비용을 직접 감소할 수 있다. 단일 사용자
일부 실시예에 따른 시스템은, 3개의 주요 구성요소에 의존할 수 있는데, 이것은, 실행하거나 전부 복호화할 필요 없이 암호화된 머신 이미지의 부분을 엑세스하는 능력, 일련의 패키지를 중복제거하고 저장소 절감에 대한 빌링 크레딧을 제공하는 프로세서, 및 결과적인 중복제거 청크를 서비스하는 프로세스를 포함한다. 보안 가상 머신 패키지의 부분이 노출되어 네트워크 상의 가상 저장소로써 엑세스되어, 중복제거 플래그 표시된 패키지를 통해 반복적으로 동작할 수 있다. 패키지는, 상태 데이터를 제외하기 위해 플래그 표시를 허용함으로써 부분적으로 엑세스될 수 있으며, 한 번에 한 부분씩 순차적으로 엑세스될 수 있다. 후자의 방식은, 중복제거를 위해 현재 처리되는 데이터만을 엑세스하고, 데이터의 다음 위치가 처리됨에 따라 메모리를 정리함으로써, 더 높은 보안을 제공할 수 있다. 보안의 추가적인 확장을 위해, 중복제거는, 낮은 레벨의 저장소 엑세스를 처리하는 레이어(layer)와 같은, 임의의 외부 엑세스를 허용하지 않는 데이터센터의 부분 중의 하나에서 실행될 수 있다.
도 4는, 본원에 개시된 적어도 일부 실시예에 따라 배열된, 반복적인 중복제거 및 빌링 크레딧에서의 예시적인 동작 흐름과 구성요소들을 도시한다.
다이어그램(400)에 도시된 바와 같이, 사용자 사이의 중복제거를 허용하는 것에 기초한 저장소 할인 시스템은, 중복제거 서명(404)의 생성과 이에 후속하는 중복제거(406)를 위해 허용된 것으로 플래그 표시된 섹션(즉, 저장소에서의 "히트(hit)" 또는 매칭하는 중복제거 서명)의 제거 및 잠재적 중복제거 리스트의 갱신을 포함할 수 있다. 프로세스는, 각각의 플래그 표시된 데이터 저장소(402)를 통해 반복될 수 있다. 중복제거된 섹션들이 제거됨에 따라, 관련된 빌링 기록(410)이 생성될 수 있다. 빌링 기록(410)은, 할인을 계산하는데 사용될 수 있는 블록 크기 및 링크의 테이블을 수신할 수 있다. 이러한 정보는, 예를 들어, 각 사용자에 기인하는 마스터 중복제거 절감의 상대적 백분율에 기초하여 빌링 할인이 계산될 수 있도록, 복제본의 전체 계수를 허용할 수 있다.
빌링 기록(410)은, 마스터에서 중복제거가 더 이상 필요 없을 때 트래킹을 위한 단일 데이터 보존소이기 때문에, 가비지 수집(412)을 위해 또한 사용될 수 있다. 가비지 수집(412)은 개별적인 데이터 패키지 사이에서는 다른 방법으로는 어려울 수 있고, 관련된 볼륨의 일정하고 전체적인 재스캐닝(rescanning)을 요구한다. 이들 빌링 기록은 또한, 중복제거를 중단하게 하는 변경 또는 제거에 의해, 사용자가 중복제거된 블록을 제거할 때 갱신될 수 있다. 일부 실시예에서, 할인은, 프로세싱 시간을 포함한 중복제거의 오버헤드 비용(overhead cost)을 고려할 수 있다. 일부 예들에서, 가상 데스크탑 서비스 구현, 운영 체제 및 애플리케이션 중복제거는, 디스크 공간의 많은, 예를 들어, 종종 90% 초과의 절감으로 이어질 수 있다.
일부 실시예에 따른 데이터센터에서, 제공된 라이브러리 이미지들 중의 하나에 기초한 임의의 머신 이미지는, 예를 들어, 대부분 중복제거의 대상이 될 수 있다. 중복제거된 데이터의 제공은, 다양한 중복제거 방법을 이용하여 실행될 수 있다. 파일 시스템이 중복제거 링크를 발견할 때, 공유된 중복제거 데이터는 투명하게 제공될 수 있으며, 사용자는 모든 데이터의 전체 사본을 갖고 있는 것처럼 보일 수 있다. 만약 중복제거된 데이터가 변경되면, 변경된 사본이, 사용 갱신의 기록 및 중복제거되지 않은 데이터로써 유일한 저장소에 쓰여질 수 있다.
데이터센터 트래픽의 일부는, 사용자가 복수의 사이트(site)에서 그의 데이터를 엑세스할 수 있도록, 사이트들 사이의 데이터 미러링을 포함할 수 있다. 중복제거 서명 및 마스터는 사이트를 사이에서 부분적으로 또는 완전하게 공유될 수 있으며, 가상 머신과 같은 큰 데이터 저장소의 이전은 몇 개의 중복제거 서명 및 중복제거되지 않은 데이터로 상당히 감소될 수 있다. 이것은, 데이터센터에 있어서 많은 양의 데이터센터 사이의 트래픽을 절감할 수 있다. 중복제거된 데이터를 사용하는 머신 이미지의 이전을 위한 데이터 패키지 및 데이터 백업도, 유사한 크기의 절감의 효과를 가질 수 있다.
일부 시나리오에서, 중복제거는 부정적인 목적으로 데이터센터에서 목표 데이터를 검색하는데 사용될 수 있다. 예를 들어, 공격자는, 데이터가 변경되는 동안에 빌링 크레딧을 관찰함으로써 데이터센터에서 그 데이터가 다른 곳에 존재하는지를 체크하기 위해, 변경되는 데이터를 포함하는 일정 시간 동안의 중복제거에 대한 다양한 경우의 수를 플래그 표시할 수 있다. 중복제거의 잘못된 사용을 방지하게 위해, 할인 크레딧은, 개별적인 크기의 단계를 포함하여 계산될 수 있다. 또한, 내부 측정 방법이 또한 사용되어, 전체 이득을 나타내는 측정 방법, 얼마나 많은 사용자에게 중복제거 패키지가 서비스되는지, 등과 같이, 할인을 계산하는데 사용될 수 있다. 이러한 전략은 결과에 잡음과 비예측성을 도입하게 되어, 공격자들이 더 적은 데이터를 얻도록 한다. 또한, 긴 기간 에 대해서만 크레딧을 중복제거 플래그 표시하는 것의 변경을 허용하게 되면, 공격자가 여분의 데이터에 접근할 가능성을 상당히 감소할 수 있다. 일부 실시예에 따른 시스템은, 데이터 저장소의 일부만 플래그 표시하도록 허용하여, 사용자가 기본적으로는 운영체제 및 애플리케이션 코어만을 플래그 표시하도록 선택할 수 있게 한다.
다른 실시예에 따르면, 중복제거를 위해 실행되는 계산은, 여분의 계산이 가장 비용 효율적이며, 중복제거로부터의 저장소 절감이 충분히 커서 데이터센터에 대해서는 수익의 증가를 가져오면서 고객에는 그 절감 효과가 제공될 가능성이 높은 때에 실행될 수 있는 데이터센터 작업이 될 수 있다. 데이터센터 위치들 사이에서 데이터가 중복제거되면, 위에서 논의된 것과 같이 수 기가바이트의 데이터 대신에 중복제거 서명만을 전송함으로써 많은 양의 트래픽이 제거될 수 있다.
도 5는, 본원에 개시된 적어도 일부 실시예에 따라 배열된, 사용자 사이의 중복제거를 위한 저장소 할인을 구현하는데 사용될 수 있는, 범용 컴퓨팅 장치(500)를 도시한다. 예시적인 기본 구성(502)에서, 컴퓨팅 장치(500)는, 하나 이상의 프로세서(504) 및 시스템 메모리(506)를 포함할 수 있다. 메모리 버스(508)는, 프로세서(504) 및 시스템 메모리(506) 사이의 통신을 위해 사용될 수 있다. 기본 구성(502)은, 내부 쇄선 내의 구성요소들에 의해 도 5에 도시된다.
요구되는 구성에 따라, 프로세서(504)는 마이크로프로세서(μP), 마이크로컨트롤러(μC), 디지털 신호 프로세서(DSP) 또는 그 임의의 조합을 포함하는 임의의 유형일 수 있지만, 이에 한정되는 것은 아니다. 프로세서(504)는 레벨 캐시 메모리(512)와 같은 하나 이상의 레벨의 캐싱, 프로세서 코어(514) 및 레지스터(516)를 포함할 수 있다. 예시적인 프로세서 코어(514)는 ALU(arithmetic logic unit), FPU(floating point unit), DSP 코어(digital signal processing core), 또는 그 임의의 조합을 포함할 수 있다. 예시적인 메모리 컨트롤러(518)는 또한 프로세서(504)와 사용될 수 있거나, 또는 몇몇 구현예에서, 메모리 컨트롤러(518)는 프로세서(504)의 내부 부품일 수 있다.
요구되는 구성에 따라, 시스템 메모리(506)는 (RAM과 같은) 휘발성 메모리, (ROM, 플래시 메모리 등과 같은) 비휘발성 메모리, 또는 그 임의의 조합을 포함할 수 있지만, 이에 한정되지 않는 임의의 유형일 수 있다. 시스템 메모리(506)는 운영 체제(520), 하나 이상의 중복제거 애플리케이션(522), 및 프로그램 데이터(524)를 포함할 수 있다. 중복제거 애플리케이션(522)은, 본원에 개시된 사용자 사이의 중복제거를 실행하고, 중복제거될 수 있는 데이터의 섹션을 결정할 수 있는, 기록 관리 엔진(523)을 포함할 수 있다. 프로그램 데이터(524)는, 다른 데이터 중에서도, 본원에 개시된 바와 같은, 하나 이상의 중복 제거 서명(525), 중복제거 리스트(527), 빌링 기록(529) 등을 포함할 수 있다.
컴퓨팅 장치(500)는 추가적인 특징 또는 기능, 및 기본 구성(502)과 임의의 요구되는 장치와 인터페이스 간 통신을 용이하게 하기 위한 추가적인 인터페이스를 가질 수 있다. 예를 들면, 버스/인터페이스 컨트롤러(530)는 저장 인터페이스 버스(534)를 통한 기본 구성(502)과 하나 이상의 데이터 저장 장치(532) 간의 통신을 용이하게 하는데 사용될 수 있다. 데이터 저장 장치(532)는 분리형 저장 장치(536), 비분리형 저장 장치(538), 또는 그들의 조합일 수 있다. 분리형 저장 장치 및 비분리형 저장 장치의 예로는, 몇 가지 말하자면, 플렉서블 디스크 드라이브 및 하드 디스크 드라이브(HDD)와 같은 자기 디스크 장치, 컴팩트 디스크(CD) 드라이브 또는 디지털 다기능 디스크(DVD) 드라이브와 같은 광 디스크 드라이브, 고체 상태 드라이브(solid state drive; SSD), 및 테이프 드라이브가 포함된다. 예시적인 컴퓨터 저장 매체는, 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 다른 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성의, 분리형 및 비분리형 매체를 포함할 수 있다.
시스템 메모리(506), 분리형 저장 장치(536) 및 비분리형 저장 장치(538)는 모두 컴퓨터 저장 매체의 예이다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기술, CD-ROM, 디지털 다기능 디스크(DVD) 또는 다른 광학 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 다른 자기 저장 장치, 또는 원하는 정보를 저장하는데 사용될 수 있고 컴퓨팅 장치(500)에 의해 액세스될 수 있는 임의의 다른 매체를 포함하지만, 이에 한정되는 것은 아니다. 그러한 임의의 컴퓨터 저장 매체는 장치(500)의 일부일 수 있다. 일부 실시예에 따르면, 이들 저장 장치의 일부는, 중복제거된 저장소 볼륨으로써 구성되거나, 중복제거된 저장소 볼륨에 연결되기 위해서 연결들이 사용될 수 있다.
컴퓨팅 장치(500)는 버스/인터페이스 컨트롤러(540)를 통한 다양한 인터페이스 장치(예를 들면, 하나 이상의 출력 장치(542), 하나 이상의 주변 인터페이스(544) 및 하나 이상의 통신 장치(546))로부터 기본 구성(502)으로의 통신을 용이하게 하기 위한 인터페이스 버스(540)도 포함할 수 있다. 예시적인 출력 장치(542)는 그래픽 처리 유닛(548) 및 오디오 처리 유닛(550)을 포함하며, 이는 하나 이상의 A/V 포트(552)를 통해 디스플레이 또는 스피커와 같은 다양한 외부 장치로 통신하도록 구성될 수 있다. 하나 이상의 예시적인 주변 인터페이스(544)는 직렬 인터페이스 컨트롤러(554) 또는 병렬 인터페이스 컨트롤러(556)를 포함하며, 이는 하나 이상의 I/O 포트(558)를 통해 입력 장치(예를 들면, 키보드, 마우스, 펜, 음성 입력 장치, 터치 입력 장치 등) 또는 다른 주변 장치(예를 들면, 프린터, 스캐너 등)와 같은 외부 장치와 통신하도록 구성될 수 있다. 예시적인 통신 장치(546)는 네트워크 컨트롤러(560)를 포함하며, 이는 하나 이상의 통신 포트(564)를 통해 네트워크 통신 상에서의 하나 이상의 다른 컴퓨팅 장치(562)와의 통신을 용이하게 하도록 배치될 수 있다. 하나 이상의 다른 컴퓨팅 장치(562)는, 데이터센터에서의 서버, 사용자 장치, 및 이와 유사한 장치들을 포함할 수 있다.
네트워크 통신 링크는 통신 매체의 일 예시일 수 있다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파 또는 다른 전송 메커니즘 같은 변조된 데이터 신호 내의 다른 데이터에 의해 구현될 수 있고, 임의의 정보 전달 매체를 포함할 수 있다. "변조된 데이터 신호"는 신호 내에 정보를 인코딩하기 위한 방식으로 설정되거나 변경된 특성 중 하나 이상을 갖는 신호일 수 있다. 제한적인지 않은 예로서, 통신 매체는 유선 네트워크 또는 직접 유선 접속과 같은 유선 매체, 및 음파, 무선 주파수(RF), 마이크로웨이브, 적외선(IR) 및 다른 무선 매체와 같은 무선 매체를 포함할 수 있다. 여기서 사용되는 컴퓨터 판독가능 매체라는 용어는 저장 매체 및 통신 매체 둘 다를 포함할 수 있다.
컴퓨팅 장치(500)는, 범용 또는 특수 목적의 서버, 메인프레임, 또는 이상 기능들 중의 임의의 것을 포함하는 유사한 컴퓨터의 일부로써 구현될 수 있다. 컴퓨팅 장치(500)는, 또한, 랩탑 컴퓨터 및 랩탑이 아닌 컴퓨터 구성을 모두 포함하는 개인 컴퓨터로써 구현될 수 있다.
예시적인 실시예는, 저장소 할인을 통해 데이터센터 환경에서 사용자 사이의 중복제거에 대해 보상하기 위한 방법을 포함할 수도 있다. 이들 방법은, 본원에 개시된 구조를 포함하는, 임의의 수의 방법으로 구현될 수 있다. 그러한 한 가지 방법은, 본원에 개시된 유형의 장치의 머신 동작에 의한 것일 수 있다. 다른 선택적인 방법은, 방법의 개별 동작들의 하나 이상이, 동작들의 일부를 실행하는 하나 이상의 인간 운영자와 결합하여 실행되는 반면, 다른 동작은 머신에 의해 실행되는 것일 수 있다. 이들 인간 동작은 서로 동일 장소에 배치될 필요는 없으며, 각각은 프로그램의 일부를 실행하는 머신과만 함께 있을 수 있다. 다른 예에서, 머신 자동화될 수 있는 사전 선택된 범주에 의한 것과 같이, 인간 상호작용이 자동화될 수 있다.
도 6은, 본원에 개시된 적어도 일부 실시예에 따른, 도 5의 장치(500)와 같은 컴퓨팅 장치에 의해 실행될 수 있는 사용자 사이의 중복제거를 허용하기 위해 저장소 할인을 제공하는 예시적인 방법을 도시하는 흐름도이다. 예시적인 방법은, 블록(622, 624, 626, 및/또는 630) 중의 하나 이상에 의해 도시된 바와 같은 하나 이상의 동작, 기능 또는 행위를 포함할 수 있다. 블록(622 내지 630)에서 기술된 동작은 또한, 컴퓨팅 장치(610)의 컴퓨터 판독가능 매체(620)와 같은 컴퓨터 판독가능 매체에 컴퓨터 실행가능 명령어로써 저장될 수 있다.
사용자 사이의 중복제거를 허용하기 위한 저장소 할인을 제공하는 예시적인 프로세스는, 블록(622) "플래그 표시된 저장소로부터 중복제거 서명을 생성"으로 시작될 수 있으며, 여기서 중복제거 서명은, 사용자에 의한 중복제거를 위한 후보로써 플래그 표시된 데이터 저장소 상에 도 5의 기록 관리 엔진(523)과 같은 중복제거 모듈에 의해 생성될 수 있다. 이것은, 더 큰 저장소의 선택적인 복호화 또는 압축복구(decompression)를 포함할 수 있다.
블록(622)은, 블록(624) "중복제거될 수 있는 섹션을 제거"에 의해 후속될 수 있으며, 여기서, 가상 데스크탑 서비스 또는 가상 머신 인스턴스에서의 애플리케이션(227) 및 운영 체제의 동일한 사본과 같이 중복제거될 수 있는 데이터의 섹션이 제거될 수 있다. 블록(624)는, 블록(626) "제거된 섹션을 중복제거 포인터로 대체"에 의해 후속될 수 있다. 블록(626)에서, 포인터는, 중복제거가 사용자에게 투명하게 실행되고 데이터센터 성능에 영향을 미치지 않도록, 제거된 데이터 섹션 대신에 저장될 수 있다. 블록(626)은, 블록(628) "잠재적 중복제거 리스트를 신규 서명으로 갱신"에 의해 후속될 수 있으며, 여기서, 기록 관리 엔진(523)은 신규 서명을 생성하고, 도 4에 도시된 것과 같은 중복제거를 위한 후보 데이터 섹션의 리스트를 갱신할 수 있다. 블록(628)은, 블록(630) "다음 플래그 표시된 저장소로 이동"에 의해 후속될 수 있으며, 여기서, 중복제거 프로세스는, 사용자에 의해 중복제거 대상으로 플래그 표시된 데이터 섹션을 통해 반복적으로 실행될 수 있다.
이상 기술된 프로세스에 포함된 블록들은 예시적인 목적이다. 사용자 사이의 중복제거를 위한 저장소 할인은, 예를 들어, 도 1 내지 도 4에 도시된 블록들을 사용하여, 더 적은 또는 추가의 블록들을 갖는 유사한 프로세스에 의해 구현될 수 있다. 일부 예들에서, 블록들은 다른 순서로 실행될 수 있다. 일부 다른 예들에서, 다양한 블록들이 제거될 수 있다. 또 다른 예들에서, 다양한 블록들은 추가의 블록들로 분할되거나, 더 적은 블록들로 함께 결합될 수 있다.
도 7은 여기에서 기술된 적어도 일부 실시예에 따라 배열된, 예시적인 컴퓨터 프로그램 제품(700)의 블록도를 도시한다. 도 7에 도시된 바와 같이, 일부 예들에서, 컴퓨터 프로그램 제품(700)은 신호 베어링 매체(signal bearing medium)(702)를 포함할 수 있다. 신호 베어링 매체(702)는 예컨대, 프로세서에 의하여 실행되면, 본원에 기술된 기능을 제공할 수 있는 하나 이상의 머신 판독가능 명령어(704)를 포함할 수 있다. 따라서, 예컨대, 도 5의 프로세서(504)를 참조하여, 기록 관리 엔진(523)은, 본원에 개시된 것과 같은 사용자 사이의 중복제거를 위한 저장소 할인은 제공하는 것과 연관된 동작을 실행하기 위해, 매체(302)에 의하여 프로세서(504)로 전달되는 명령어(704)에 응답하여 도 7에서 도시된 작업들 중 하나 이상을 착수할 수 있다.
일부 구현예에서, 신호 베어링 매체(702)는 하드 디스크 드라이브, CD(Compact Disk), DVD(Digital Video Disk), 디지털 테이프, 메모리 등과 같은 컴퓨터 판독 가능 매체(706)를 포함할 수 있으나, 이에 제한되지는 않는다. 일부 구현예에서, 신호 베어링 매체(702)는 메모리, 읽기/쓰기(R/W) CD, R/W DVD 등과 같은 기록 가능 매체(708)를 포함할 수 있으나, 이에 제한되지는 않는다. 일부 구현예에서, 신호 베어링 매체(702)는 디지털 및/또는 아날로그 통신 매체(예컨대, 광섬유 케이블, 도파관(waveguide), 유선 통신 링크, 무선 통신 링크 등)와 같은 통신 매체(710)를 포함할 수 있으나, 이에 제한되지는 않는다. 따라서, 예컨대, 프로그램 제품(700)은, 신호 베어링 매체(702)가 무선 통신 매체(710)(예컨대, IEEE 802.11 표준에 따르는 무선 통신 매체)에 의해 전달되는 RF 신호 베어링 매체(702)에 의하여 프로세서(704)의 하나 이상의 모듈로 전달될 수 있다.
일부 예들에 따르면, 데이터센터 환경에서 복수의 사용자 사이에서 데이터 저장소 중복제거를 위한 방법은, 중복제거를 위해 가용하다고 플래그 표시한 데이터 저장소를 결정하는 단계, 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하는 단계, 플래그 표시된 데이터 저장소의 섹션을 제거하는 단계, 제거된 섹션을 중복제거 포인터로 대체하는 단계, 및 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신하는 단계를 포함할 수 있다.
다른 예들에 따르면, 방법은 또한, 제거된 섹션에 기초하여 빌링 기록을 생성하는 단계 및 빌링 기록에 기초하여 플래그 표시된 데이터 저장소의 소유자에 대해 할인을 제공하는 단계를 포함할 수 있다. 빌링 기록은, 플래그 표시된 데이터 저장소의 소유자에 대한 할인을 위해 유보된 공간을 트래킹하는데 사용되고, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로써 사용될 수 있다. 할인은 또한, 중복제거와 연관된 프로세싱 시간에 기초할 수 있다.
또 다른 예들에 따르면, 방법은, 제거된 섹션에 기초하여 데이터센터에서 하나 이상의 가비지 관리 동작을 실행하는 단계, 반복적으로 추가의 중복제거 서명을 생성하고 추가의 섹션을 제거하는 단계, 또는 데이터센터가 여분의 용량을 가질 때 중복제거를 실행하는 단계를 포함할 수 있다. 데이터 저장소가 중복제거를 위해 가용한 것으로 결정하는 단계는, 데이터의 소유자로부터 표시를 수신하는 단계를 포함할 수 있다. 중복제거는, 비활성인 데이터 모듈 및 데이터센터의 머신 인스턴스의 패키징 및 별도의 암호화를 고려할 수 있다.
일부 예들에 따르면, 데이터는, 운영 체제(OS) 부분, OS 변경 및/또는 애드온 부분, 애플리케이션 부분, 및 사용자 데이터 부분의 세트로부터의 적어도 하나를 포함하는 패키지를 포함할 수 있다. 방법은, OS 부분 및 중복제거를 위한 애플리케이션 부분의 세트로부터의 적어도 하나를 포함하는 복호화된 데이터 부분을 스캐닝하는 단계, 및 데이터센터에 의해 소유된 개별 패키지에 중복제거 데이터를 저장하는 단계를 더 포함할 수 있다. 암호화된 데이터 부분은, OS 변경 및/또는 애드온 부분, 애플리케이션 부분, 및 사용자 데이터 부분의 세트로부터 적어도 하나를 포함할 수 있다. 패키지는, 한 번에 한 패키지씩 순차적으로 엑세스될 수 있다. 중복제거는, 외부 엑세스를 허용하지 않는 데이터센터의 데이터 저장소 섹션에서 실행될 수 있다. 방법은 또한, 가상 머신과 연관된 중복되지 않는 데이터 및 중복제거 서명을 전송함으로써, 가상 머신을 전송하고, 데이터센터 사이트 사이에서 중복제거 서명을 공유하는 단계를 포함할 수 있다.
다른 예들에 따르면, 데이터센터 환경에서 복수의 사용자 사이의 데이터 저장소 중복제거를 실행하는 서버는, 명령어를 저장하는 메모리, 및 저장된 명령어와 결합하여 데이터 관리 애플리케이션을 실행하는 프로세서를 포함할 수 있다. 프로세서는, 중복제거를 위해 가용한 것으로 플래그 표시된 데이터 저장소를 결정하고, 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하고, 플래그 표시된 데이터 저장소의 섹션을 제거하고, 중복제거 포인터로 제거된 섹션을 대체하며, 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신할 수 있다.
또 다른 예들에 따르면, 프로세서는, 제거된 섹션에 기초하여 빌링 기록을 생성하며, 빌링 기록에 기초하여 플래그 표시된 데이터 저장소의 소유자에 할인을 제공할 수 있다. 빌링 기록은, 플래그 표시된 데이터 저장소의 소유자에 대한 할인을 위해 유보된 공간을 트래킹하는데 사용되고, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로써 사용될 수 있다. 할인은 또한, 중복제거와 연관된 프로세싱 시간에 기초할 수 있다.
또 다른 예들에 따르면, 프로세서는, 제거된 섹션에 기초하여 데이터센터에서 하나 이상의 가비지 관리 동작을 실행하고, 추가의 섹션을 제거하고, 추가의 중복제거 서명을 생성하는 것을 반복하며, 데이터의 소유자로부터 표시를 수신함으로써, 데이터 저장소가 중복제거에 가용한 것으로써 결정하거나, 데이터센터가 여분의 용량을 가질 때, 중복제거를 실행하도록 더 구성될 수 있다.
또 다른 예들에 따르면, 데이터는, 운영 체제(OS) 부분, OS 변경 및/또는 애드온 부분, 애플리케이션 부분, 및 사용자 데이터 부분의 세트로부터의 적어도 하나를 포함하는 패키지를 포함할 수 있다. 프로세서는 또한, OS 부분 및 중복제거를 위한 애플리케이션 부분의 세트로부터의 적어도 하나를 포함하는 복호화된 데이터 부분을 스캐닝하며, 데이터센터에 의해 소유된 개별 패키지에 중복제거 데이터를 저장할 수 있다.
일부 예들에 따르면, 암호화된 데이터 부분은, OS 변경 및/또는 애드온 부분, 애플리케이션 부분, 및 사용자 데이터 부분의 세트로부터 적어도 하나를 포함할 수 있다. 패키지는, 한 번에 한 패키지씩 순차적으로 엑세스될 수 있다. 중복제거는, 외부 엑세스를 허용하지 않는 데이터센터의 데이터 저장소 섹션에서 실행될 수 있다. 프로세서는 또한, 가상 머신과 연관된 중복되지 않는 데이터 및 중복제거 서명을 전송함으로써, 가상 머신을 전송하고, 데이터센터 사이트 사이에서 중복제거 서명을 공유할 수 있다.
다른 예들에 따르면, 복수의 사용자 사이의 데이터 저장소 중복제거를 실행하는 데이터센터는, 복수의 데이터 저장소, 및 데이터 관리를 위한 적어도 하나의 서버를 포함할 수 있다. 서버는, 중복제거를 위해 가용한 것으로 플래그 표시된 데이터 저장소를 결정하고, 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하고, 플래그 표시된 데이터 저장소의 섹션을 제거하고, 중복제거 포인터로 제거된 섹션을 대체하며, 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신할 수 있다.
다른 예들에 따르면, 서버는, 제거된 섹션에 기초하여 빌링 기록을 생성하며, 빌링 기록에 기초하여 플래그 표시된 데이터 저장소의 소유자에 할인을 제공할 수 있다. 빌링 기록은, 플래그 표시된 데이터 저장소의 소유자에 대한 할인을 위해 유보된 공간을 트래킹하는데 사용되고, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로써 사용될 수 있다. 할인은 또한, 중복제거와 연관된 프로세싱 시간에 기초할 수 있다. 서버는, 제거된 섹션에 기초하여 데이터센터에서 하나 이상의 가비지 관리 동작을 실행하고, 반복적으로 추가의 중복제거 서명을 생성하고 추가의 섹션을 제거하며, 데이터의 소유자로부터 표시를 수신함으로써 중복제거에 가용한 것으로 데이터 저장소를 결정하거나, 데이터센터가 여분의 용량을 가질 때 중복제거를 실행할 수 있다.
또 다른 예들에 따르면, 중복제거는, 비활성인 데이터 모듈 및 데이터센터의 머신 인스턴스의 패키징 및 별도의 암호화를 고려할 수 있다. 데이터는, 운영 체제(OS) 부분, OS 변경 및/또는 애드온 부분, 애플리케이션 부분, 및 사용자 데이터 부분의 세트로부터의 적어도 하나를 포함하는 패키지를 포함할 수 있다. 서버는 또한, OS 부분 및 중복제거를 위한 애플리케이션 부분의 세트로부터의 적어도 하나를 포함하는 복호화된 데이터 부분을 스캐닝하며, 데이터센터에 의해 소유된 개별 패키지에 중복제거 데이터를 저장할 수 있다.
일부 예들에 따르면, 암호화된 데이터 부분은, OS 변경 및/또는 애드온 부분, 애플리케이션 부분, 및 사용자 데이터 부분의 세트로부터 적어도 하나를 포함할 수 있다. 패키지는, 한 번에 한 패키지씩 순차적으로 엑세스될 수 있다. 중복제거는, 외부 엑세스를 허용하지 않는 데이터센터의 데이터 저장소 섹션에서 실행될 수 있다. 서버는 또한, 가상 머신과 연관된 중복되지 않는 데이터 및 중복제거 서명을 전송함으로써, 가상 머신을 전송하고, 데이터센터 사이트 사이에서 중복제거 서명을 공유할 수 있다.
시스템 양상들의 하드웨어와 소프트웨어 구현 사이에는 구별이 거의 없다. 하드웨어 또는 소프트웨어의 사용은 일반적으로 (그러나 어떤 맥락에서 하드웨어 및 소프트웨어 사이의 선택이 중요하게 될 수 있다는 점에서 항상 그런 것은 아니지만) 비용 대비 효율의 트레이드오프(tradeoff)를 나타내는 설계상 선택(design choice)이다. 여기에서 기술된 프로세스 및/또는 시스템 및/또는 다른 기술들이 영향 받을 수 있는 다양한 수단(vehicles)(예를 들어, 하드웨어, 소프트웨어 및/또는 펌웨어)이 있으며, 선호되는 수단은 프로세스 및/또는 시스템 및/또는 다른 기술이 사용되는 맥락(context)에 따라 변경될 것이다. 예를 들어, 만약 구현자가 속도 및 정확도가 중요하다고 결정하면, 구현자는 주로 하드웨어 및/또는 펌웨어(firmware) 수단을 선택할 수 있고, 만약 유연성이 중요하다면, 구현자는 주로 소프트웨어 구현을 선택할 수 있으며, 또는, 또 다른 대안으로서, 구현자는 하드웨어, 소프트웨어, 및/또는 펌웨어 중 일부 조합을 선택할 수 있다.
전술한 상세한 설명은 블록도, 흐름도, 및/또는 예시의 사용을 통해 장치 및/또는 프로세스의 다양한 실시예를 설명하였다. 그러한 블록도, 흐름도, 및/또는 예시가 하나 이상의 기능 및/또는 동작을 포함하는 한, 당업자라면 그러한 블록도, 흐름도, 또는 예시 내의 각각의 기능 및/또는 동작은 하드웨어, 소프트웨어, 펌웨어, 또는 실질적으로 그들 임의의 조합의 넓은 범위에 의해 개별적으로 및/또는 집합적으로 구현될 수 있다는 것이 이해될 것이다. 일 실시예에서, 여기에서 기술된 대상의 몇몇 부분은 ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array), DSP(Digital Signal Processor) 또는 다른 집적의 형태를 통해 구현될 수 있다. 그러나, 당업자라면, 여기에서 기술된 실시예의 일부 양상이, 하나 이상의 컴퓨터 상에 실행되는 하나 이상의 컴퓨터 프로그램(예를 들어, 하나 이상의 컴퓨터 시스템 상에 실행되는 하나 이상의 프로그램), 하나 이상의 프로세서 상에서 실행되는 하나 이상의 프로그램(예를 들어, 하나 이상의 마이크로프로세서 상에서 실행되는 하나 이상의 프로그램), 펌웨어 또는 실질적으로 그들의 조합으로서, 전체적으로 또는 부분적으로 균등하게 집적 회로에 구현될 수 있다는 알 수 있으며, 소프트웨어 및/또는 펌웨어를 위한 코드의 작성 및/또는 회로의 설계는 본 개시에 비추어 당업자에게 자명할 것이다.
본 개시는 다양한 태양의 예시로서 의도된 본 출원에 기술된 특정 예시들에 제한되지 않을 것이다. 당업자에게 명백할 바와 같이, 많은 수정과 변형이 그 사상과 범위를 벗어나지 않으면서 이루어질 수 있다. 여기에 열거된 것들에 더하여, 본 개시의 범위 안에서 기능적으로 균등한 방법과 장치가 위의 설명으로부터 당업자에게 명백할 것이다. 그러한 수정과 변형은 첨부된 청구항의 범위에 들어가도록 의도된 것이다. 본 개시는 첨부된 청구항의 용어에 의해서만, 그러한 청구항에 부여된 균등물의 전 범위와 함께, 제한될 것이다. 본 개시가 물론 다양할 수 있는 특정 방법, 시약, 합성 구성 또는 생물학적 시스템에 제한되지 않는 것으로 이해될 것이다. 또한, 여기에서 사용된 용어는 단지 특정 예시들을 기술하기 위한 목적이고, 제한하는 것으로 의도되지 않음이 이해될 것이다.
또한, 당업자라면, 여기에서 기술된 대상의 수단(mechanism)들이 다양한 형태의 프로그램 제품으로 분포될 수 있음을 이해할 것이며, 여기에서 기술된 대상의 예시는, 분배를 실제로 수행하는데 사용되는 신호 베어링 매체(signal bearing medium)의 특정 유형과 무관하게 적용됨을 이해할 것이다. 신호 베어링 매체의 예시는, 플로피 디스크, 하드 디스크 드라이브(HDD), CD(Compact Disc), DVD(Digital Versatile Disk), 디지털 테이프, 컴퓨터 메모리 등과 같은 판독가능 유형의 매체 및 디지털 및/또는 아날로그 통신 매체(예를 들어, 섬유 광학 케이블, 웨이브가이드, 유선 통신 링크, 무선 통신 링크 등)와 같은 전송 유형 매체를 포함할 수 있으나, 이에 제한되지는 않는다.
당업자라면, 여기서 설명된 형식으로 장치 및/또는 프로세스를 기술하고, 이후, 공학 실무를 사용하여 그러한 기술된 장치 및/또는 프로세스을 데이터 처리 시스템에 통합한다는 것은 당해 분야에서는 일반적이란 것을 인식할 것이다. 즉, 여기서 기술된 장치 및/또는 방법의 적어도 일부는 합당한 실험 량을 통해 데이터 처리 시스템에 통합될 수 있다. 당업자라면, 전형적인 데이터 처리 시스템은 일반적으로 시스템 유닛 하우징, 비디오 디스플레이 장치, 휘발성 및 비휘발성 메모리 같은 메모리, 마이크로프로세서 및 디지털 신호 프로세서와 같은 프로세서, 운영 체제, 드라이버, 그래픽 사용자 인터페이스 및 애플리케이션 프로그램과 같은 컴퓨터 엔티티(computational entities), 터치 패드 또는 스크린 같은 하나 이상의 상호작용 장치, 및/또는 피드백 루프 및 제어 모터(예를 들면, 위치 및/또는 속도를 감지하기 위한 피드백; 컴포넌트 및/또는 양(quantities)을 이동하고 및/또는 조정하기 위한 제어 모터)를 포함하는 제어 시스템 중 하나 이상을 일반적으로 포함한다는 것을 인식할 것이다.
전형적인 데이터 처리 시스템은 데이터 컴퓨팅/통신 및/또는 네트워크 컴퓨팅/통신 시스템에서 전형적으로 발견되는 바와 같은 임의의 적절한 상업적으로 이용 가능한 컴포넌트를 이용하여 구현될 수 있다. 여기에서 기술된 대상은 때때로 상이한 다른 컴포넌트 내에 포함되거나 접속된 상이한 컴포넌트를 도시한다. 도시된 그러한 아키텍처는 단순히 예시적인 것이고, 사실상 동일한 기능을 달성하는 다른 많은 아키텍처가 구현될 수 있다는 것이 이해되어야 한다. 개념적으로, 동일한 기능을 달성하기 위한 컴포넌트의 임의의 배치는 원하는 기능이 달성되도록 유효하게 "연관"된다. 이에 따라, 특정 기능을 달성하기 위해 여기서 결합된 임의의 두 개의 컴포넌트는, 아키텍처 또는 중간 컴포넌트와는 무관하게, 원하는 기능이 달성되도록 서로 "연관"된 것으로 볼 수 있다. 마찬가지로, 연관된 임의의 두 개의 컴포넌트는 또한 원하는 기능을 달성하기 위해 서로 "동작적으로 접속"되거나 또는 "동작적으로 연결"되는 것으로 간주될 수 있고, 그와 같이 연관될 수 있는 임의의 두 개의 컴포넌트는 또한 원하는 기능을 달성하기 위해 서로 "동작적으로 연결가능"한 것으로 볼 수 있다. 동작적으로 연결가능하다는 것의 특정예는 물리적으로 연결
여기에서 실질적으로 임의의 복수 및/또는 단수의 용어의 사용에 대하여, 당업자는 맥락 및/또는 응용에 적절하도록, 복수를 단수로 및/또는 단수를 복수로 해석할 수 있다. 다양한 단수/복수의 치환은 명확성을 위해 여기에서 명시적으로 기재될 수 있다.
당업자라면, 일반적으로 본 개시에 사용되며 특히 첨부된 청구범위(예를 들어, 첨부된 청구범위)에 사용된 용어들이 일반적으로 "개방적(open)" 용어(예를 들어, 용어 "포함하는"은 "포함하지만 이에 제한되지 않는"으로, 용어 "갖는"는 "적어도 갖는"으로, 용어 "포함하다"는 "포함하지만 이에 한정되지 않는" 등으로 해석되어야 함)로 의도되었음을 이해할 것이다. 또한, 당업자라면, 도입된 청구항의 기재사항의 특정 수가 의도된 경우, 그러한 의도가 청구항에 명시적으로 기재될 것이며, 그러한 기재사항이 없는 경우, 그러한 의도가 없음을 또한 이해할 것이다. 예를 들어, 이해를 돕기 위해, 이하의 첨부 청구범위는 "적어도 하나" 및 "하나 이상" 등의 도입 구절의 사용을 포함하여 청구항 기재사항을 도입할 수 있다. 그러나, 그러한 구절의 사용이, 부정관사 "하나"("a" 또는 "an")에 의한 청구항 기재사항의 도입이, 그러한 하나의 기재사항을 포함하는 예시들로, 그러한 도입된 청구항 기재사항을 포함하는 특정 청구항을 제한함을 암시하는 것으로 해석되어서는 안되며, 동일한 청구항이 도입 구절인 "하나 이상" 또는 "적어도 하나" 및 "하나"("a" 또는 "an")과 같은 부정관사(예를 들어, "하나"는 "적어도 하나" 또는 "하나 이상"을 의미하는 것으로 전형적으로 해석되어야 함)를 포함하는 경우에도 마찬가지로 해석되어야 한다. 이는 청구항 기재사항을 도입하기 위해 사용된 정관사의 경우에도 적용된다. 또한, 도입된 청구항 기재사항의 특정 수가 명시적으로 기재되는 경우에도, 당업자라면 그러한 기재가 전형적으로 적어도 기재된 수(예를 들어, 다른 수식어가 없는 "두개의 기재사항"을 단순히 기재한 것은, 전형적으로 적어도 두 개의 기재사항 또는 두 개 이상의 기재사항을 의미함)를 의미하도록 해석되어야 함을 이해할 것이다.
또한, "A, B 및 C 등 중의 적어도 하나"와 유사한 규칙이 사용된 경우에는, 일반적으로 그러한 해석은 당업자가 그 규칙을 이해할 것이라는 전제가 의도된 것이다(예를 들어, "A, B 및 C 중의 적어도 하나를 갖는 시스템"은, A만을 갖거나, B만을 갖거나, C만을 갖거나, A 및 B를 함께 갖거나, A 및 C를 함께 갖거나, B 및 C를 함께 갖거나, A, B, 및 C를 함께 갖는 시스템 등을 포함하지만 이에 제한되지 않음). "A, B 또는 C 등 중의 적어도 하나"와 유사한 규칙이 사용된 경우에는, 일반적으로 그러한 해석은 당업자가 그 규칙을 이해할 것이라는 전제가 의도된 것이다(예를 들어, "A, B 또는 C 중의 적어도 하나를 갖는 시스템"은, A만을 갖거나, B만을 갖거나, C만을 갖거나, A 및 B를 함께 갖거나, A 및 C를 함께 갖거나, B 및 C를 함께 갖거나, A, B, 및 C를 함께 갖는 시스템 등을 포함하지만 이에 제한되지 않음). 또한 당업자라면, 실질적으로 임의의 이접 접속어(disjunctive word) 및/또는 두 개 이상의 대안적인 용어들을 나타내는 구절은, 그것이 상세한 설명, 청구범위 또는 도면에 있는지와 상관없이, 그 용어들 중의 하나, 그 용어들 중의 어느 하나, 또는 그 용어들 두 개 모두를 포함하는 가능성을 고려했음을 이해할 것이다. 예를 들어, "A 또는 B"라는 구절은 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.
추가적으로, 개시의 특징 또는 양태가 마쿠시(Markush) 그룹으로 기술되는 경우, 개시는 마쿠시 그룹의 임의의 개별 요소 또는 요소들의 하위 그룹 역시 포함하고 있다는 것을 당업자는 인식할 것이다.
당업자에게 이해될 것과 같이, 임의의 그리고 모든 목적에서든, 기술 내용을 제공하는 것 등에 있어서, 여기에 개시되어 있는 모든 범위는 임의의 그리고 모든 가능한 하위범위와 그러한 하위범위의 조합을 또한 포함한다. 임의의 열거된 범위는 적어도 1/2, 1/3, 1/4, 1/5, 1/10 등으로 나누어지는 동일한 범위를 충분히 설명하고 실시가능하게 하는 것으로서 쉽게 인식될 수 있다. 제한하지 않는 예시로서, 여기서 논의되는 각각의 범위는 하위 1/3, 중앙 1/3, 상위 1/3 등으로 나누어질 수 있다. 또한, "까지", "적어도", "보다 많은", "보다 적은" 등과 같은 언어는 기재된 수를 포함하며, 전술한 하위범위로 후속적으로 나누어질 수 있는 범위를 지칭함이 당업자에게 이해되어야 한다. 마지막으로, 범위는 각각의 개별 요소를 포함함이 이해되어야 한다. 따라서, 예를 들어, 1-3개의 셀을 갖는 그룹은 1, 2 또는 3개의 셀을 갖는 그룹들을 의미한다. 유사하게, 1-5개의 셀을 갖는 그룹은 1, 2, 3, 4 또는 5개의 셀을 갖는 그룹을 의미한다.
다양한 양상 및 예시들이 여기에서 개시되었지만, 다른 양상 및 예시들이 당업자에게 명확할 것이다. 본 개시에 기재된 다양한 양상 및 예시는 예시의 목적으로 제시된 것이고, 제한하려고 의도된 것이 아니며, 진정한 범위와 사상은 이하 청구범위에 의해 나타낸다.

Claims (48)

  1. 데이터센터 환경에서 복수의 사용사 사이의 데이터 저장소 중복제거를 위한 방법으로써,
    중복제거에 가용하다고 플래그 표시된 데이터 저장소를 결정하는 단계;
    상기 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하는 단계;
    상기 플래그 표시된 데이터 저장소의 섹션을 제거하는 단계; 및
    상기 제거된 섹션을 중복제거 포인터로 대체하는 단계를 포함하는, 방법.
  2. 제1항에 있어서,
    상기 제거된 섹션에 기초하여 빌링 기록을 생성하는 단계; 및
    상기 빌링 기록에 기초하여 상기 플래그 표시된 데이터 저장소의 소유자에게 할인을 제공하는 단계를 더 포함하는, 방법.
  3. 제2항에 있어서,
    상기 빌링 기록은, 상기 플래그 표시된 데이터 저장소의 소유자에게 할인을 제공하기 위해 유보된 공간을 트래킹하는데 사용되며, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로써 사용되는, 방법.
  4. 제2항에 있어서,
    상기 할인은 또한 상기 중복제거와 연관된 프로세싱 시간에 기초하는, 방법.
  5. 제1항에 있어서,
    상기 제거된 섹션에 기초하여 상기 데이터센터에서 하나 이상의 가비지 관리 동작을 실행하는 단계를 더 포함하는, 방법.
  6. 제1항에 있어서,
    추가의 섹션을 제거하고, 추가의 중복제거 서명을 생성하는 것을 반복하는 단계를 더 포함하는, 방법.
  7. 제1항에 있어서,
    상기 데이터 저장소가 중복제거에 가용한 것으로써 결정하는 단계는, 상기 데이터의 소유자로부터 표시를 수신하는 단계를 포함하는, 방법.
  8. 제1항에 있어서,
    상기 데이터센터가 여분의 용량을 가질 때, 상기 중복제거를 실행하는 단계를 더 포함하는, 방법.
  9. 제1항에 있어서,
    상기 중복제거는, 상기 데이터센터의 비활성인 데이터 모듈 및 머신 인스턴스의 분리된 암호화 및 패키징을 고려하는, 방법.
  10. 제9항에 있어서,
    상기 데이터는, 사용자 데이터 부분, 애플리케이션 부분, 운영체제(OS) 변경 및/또는 애드온 부분, OS 부분의 세트로부터의 적어도 하나를 포함하는, 방법.
  11. 제10항에 있어서,
    상기 중복제거를 위한 상기 애플리케이션 부분 및 상기 OS 부분의 세트로부터의 적어도 하나를 포함하는 복호화된 데이터 부분을 스캐닝하는 단계; 및
    상기 데이터센터에 의해 소유된 분리된 패키지에서 중복제거된 데이터를 저장하는 단계를 더 포함하는, 방법.
  12. 제10항에 있어서,
    암호화된 부분은, 상기 사용자 데이터 부분, 상기 애플리케이션 부분, 및 상기 OS 변경 및/또는 애드온 부분의 세트로부터의 적어도 하나를 포함하는, 방법.
  13. 제10항에 있어서,
    상기 패키지는, 한 번에 한 패키지씩 순차적으로 엑세스되는, 방법.
  14. 제1항에 있어서,
    상기 중복제거는, 외부 엑세스를 허용하지 않는 상기 데이터센터의 데이터 저장소 섹션에서 실행되는, 방법.
  15. 제1항에 있어서,
    데이터센터 사이트들 사이에서 중복제거 서명을 공유하는 단계; 및
    데이터 저장소와 연관된 중복제거되지 않은 데이터 및 중복제거 서명을 전송함으로써 상기 데이터 저장소를 전송하는 단계를 더 포함하는, 방법.
  16. 제1항에 있어서,
    상기 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신하는 단계를 더 포함하는, 방법.
  17. 데이터센터 환경에서 복수의 사용사 사이의 데이터 저장소 중복제거를 실행하는 서버로써,
    명령어를 저장하는 메모리; 및
    상기 저장된 명령어와 결합하여 데이터 관리 애플리케이션을 실행하는 프로세서를 포함하고,
    상기 프로세서는,
    중복제거에 가용하다고 플래그 표시된 데이터 저장소를 결정하고,
    상기 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하며,
    상기 플래그 표시된 데이터 저장소의 섹션을 제거하고,
    상기 제거된 섹션을 중복제거 포인터로 대체하는, 서버.
  18. 제17항에 있어서,
    상기 프로세서는,
    상기 제거된 섹션에 기초하여 빌링 기록을 생성하며,
    상기 빌링 기록에 기초하여 상기 플래그 표시된 데이터 저장소의 소유자에게 할인을 제공하는, 서버.
  19. 터17항에 있어서,
    상기 빌링 기록은, 상기 플래그 표시된 데이터 저장소의 소유자에게 할인을 제공하기 위해 유보된 공간을 트래킹하는데 사용되며, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로써 사용되는, 서버.
  20. 제17항에 있어서,
    상기 할인은 또한 상기 중복제거와 연관된 프로세싱 시간에 기초하는, 서버.
  21. 제17항에 있어서,
    상기 프로세서는, 상기 제거된 섹션에 기초하여 상기 데이터센터에서 하나 이상의 가비지 관리 동작을 실행하도록 더 구성되는, 서버.
  22. 제17항에 있어서,
    상기 프로세서는, 추가의 섹션을 제거하고, 추가의 중복제거 서명을 생성하는 것을 반복하도록 더 구성되는, 서버.
  23. 제17항에 있어서,
    상기 프로세서는, 상기 데이터의 소유자로부터 표시를 수신함으로써, 상기 데이터 저장소가 중복제거에 가용한 것으로써 결정하도록 더 구성되는, 서버.
  24. 제17항에 있어서,
    상기 프로세서는, 상기 데이터센터가 여분의 용량을 가질 때, 상기 중복제거를 실행하도록 더 구성되는, 서버.
  25. 제17항에 있어서,
    상기 중복제거는, 상기 데이터센터의 비활성인 데이터 모듈 및 머신 인스턴스의 분리된 암호화 및 패키징을 고려하는, 서버.
  26. 제25항에 있어서,
    상기 데이터는, 사용자 데이터 부분, 애플리케이션 부분, 운영체제(OS) 변경 및/또는 애드온 부분, OS 부분의 세트로부터의 적어도 하나를 포함하는, 서버.
  27. 제26항에 있어서,
    상기 프로세서는,
    상기 중복제거를 위한 상기 애플리케이션 부분 및 상기 OS 부분의 세트로부터의 적어도 하나를 포함하는 복호화된 데이터 부분을 스캐닝하며,
    상기 데이터센터에 의해 소유된 분리된 패키지에서 중복제거된 데이터를 저장하도록 더 구성되는, 서버.
  28. 제26항에 있어서,
    암호화된 부분은, 상기 사용자 데이터 부분, 상기 애플리케이션 부분, 및 상기 OS 변경 및/또는 애드온 부분의 세트로부터의 적어도 하나를 포함하는, 서버.
  29. 제26항에 있어서,
    상기 패키지는, 한 번에 한 패키지씩 순차적으로 엑세스되는, 서버.
  30. 제17항에 있어서,
    상기 중복제거는, 외부 엑세스를 허용하지 않는 상기 데이터센터의 데이터 저장소 섹션에서 실행되는, 서버.
  31. 제17항에 있어서,
    상기 프로세서는,
    데이터센터 사이트들 사이에서 중복제거 서명을 공유하고,
    데이터 저장소와 연관된 중복제거되지 않은 데이터 및 중복제거 서명을 전송함으로써 상기 데이터 저장소를 전송하도록 더 구성되는, 서버.
  32. 제17항에 있어서,
    상기 프로세서는, 상기 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신하도록 더 구성되는, 서버.
  33. 복수의 사용사 사이의 데이터 저장소 중복제거를 실행하는 데이터센터로써,
    복수의 데이터 저장소; 및
    데이터 관리를 위한 적어도 하나의 서버를 포함하고,
    상기 서버는,
    중복제거에 가용하다고 플래그 표시된 데이터 저장소를 결정하고,
    상기 플래그 표시된 데이터 저장소로부터 중복제거 서명을 생성하며,
    상기 플래그 표시된 데이터 저장소의 섹션을 제거하고,
    상기 제거된 섹션을 중복제거 포인터로 대체하는, 데이터센터.
  34. 제33항에 있어서,
    상기 서버는,
    상기 제거된 섹션에 기초하여 빌링 기록을 생성하며,
    상기 빌링 기록에 기초하여 상기 플래그 표시된 데이터 저장소의 소유자에게 할인을 제공하는, 데이터센터.
  35. 제34항에 있어서,
    상기 빌링 기록은, 상기 플래그 표시된 데이터 저장소의 소유자에게 할인을 제공하기 위해 유보된 공간을 트래킹하는데 사용되며, 중복제거 패키지의 사용을 트래킹하기 위한 가비지 수집 마스터 참조로써 사용되는, 데이터센터.
  36. 제34항에 있어서,
    상기 할인은 또한 상기 중복제거와 연관된 프로세싱 시간에 기초하는, 데이터센터.
  37. 제33항에 있어서,
    상기 서버는, 상기 제거된 섹션에 기초하여 상기 데이터센터에서 하나 이상의 가비지 관리 동작을 실행하도록 더 구성되는, 데이터센터.
  38. 제33항에 있어서,
    상기 서버는, 추가의 섹션을 제거하고, 추가의 중복제거 서명을 생성하는 것을 반복하도록 더 구성되는, 데이터센터.
  39. 제33항에 있어서,
    상기 서버는, 상기 데이터의 소유자로부터 표시를 수신함으로써, 상기 데이터 저장소가 중복제거에 가용한 것으로써 결정하도록 더 구성되는, 데이터센터.
  40. 제33항에 있어서,
    상기 서버는, 상기 데이터센터가 여분의 용량을 가질 때, 상기 중복제거를 실행하도록 더 구성되는, 데이터센터.
  41. 제33항에 있어서,
    상기 중복제거는, 상기 데이터센터의 비활성인 데이터 모듈 및 머신 인스턴스의 분리된 암호화 및 패키징을 고려하는, 데이터센터.
  42. 제41항에 있어서,
    상기 데이터는, 사용자 데이터 부분, 애플리케이션 부분, 운영체제(OS) 변경 및/또는 애드온 부분, OS 부분의 세트로부터의 적어도 하나를 포함하는, 데이터센터.
  43. 제42항에 있어서,
    상기 서버는,
    상기 중복제거를 위한 상기 애플리케이션 부분 및 상기 OS 부분의 세트로부터의 적어도 하나를 포함하는 복호화된 데이터 부분을 스캐닝하며,
    상기 데이터센터에 의해 소유된 분리된 패키지에서 중복제거된 데이터를 저장하도록 더 구성되는, 데이터센터.
  44. 제42항에 있어서,
    암호화된 부분은, 상기 사용자 데이터 부분, 상기 애플리케이션 부분, 및 상기 OS 변경 및/또는 애드온 부분의 세트로부터의 적어도 하나를 포함하는, 데이터센터.
  45. 제41항에 있어서,
    상기 패키지는, 한 번에 한 패키지씩 순차적으로 엑세스되는, 데이터센터.
  46. 제33항에 있어서,
    상기 중복제거는, 외부 엑세스를 허용하지 않는 상기 데이터센터의 데이터 저장소 섹션에서 실행되는, 데이터센터.
  47. 제33항에 있어서,
    상기 서버는,
    데이터센터 사이트들 사이에서 중복제거 서명을 공유하고,
    데이터 저장소와 연관된 중복제거되지 않은 데이터 및 중복제거 서명을 전송함으로써 상기 데이터 저장소를 전송하도록 더 구성되는, 데이터센터.
  48. 제33항에 있어서,
    상기 서버는, 상기 플래그 표시된 데이터 저장소로부터 생성된 신규 중복제거 서명으로 잠재적 중복제거 리스트를 갱신하도록 더 구성되는, 데이터센터.
KR1020147017667A 2011-12-08 2011-12-08 사용자 간의 중복제거를 허용하기 위한 저장소 할인 KR101583748B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2011/063892 WO2013085519A1 (en) 2011-12-08 2011-12-08 Storage discounts for allowing cross-user deduplication

Publications (2)

Publication Number Publication Date
KR20140098212A true KR20140098212A (ko) 2014-08-07
KR101583748B1 KR101583748B1 (ko) 2016-01-19

Family

ID=48572963

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147017667A KR101583748B1 (ko) 2011-12-08 2011-12-08 사용자 간의 중복제거를 허용하기 위한 저장소 할인

Country Status (5)

Country Link
US (1) US20130151484A1 (ko)
JP (1) JP5851047B2 (ko)
KR (1) KR101583748B1 (ko)
CN (1) CN103975300A (ko)
WO (1) WO2013085519A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9086819B2 (en) * 2012-07-25 2015-07-21 Anoosmar Technologies Private Limited System and method for combining deduplication and encryption of data
WO2014039046A1 (en) * 2012-09-06 2014-03-13 Empire Technology Development, Llc Cost reduction for servicing a client through excess network performance
US9372726B2 (en) 2013-01-09 2016-06-21 The Research Foundation For The State University Of New York Gang migration of virtual machines using cluster-wide deduplication
KR20140114515A (ko) * 2013-03-15 2014-09-29 삼성전자주식회사 불휘발성 메모리 장치 및 그것의 중복 데이터 제거 방법
US9251160B1 (en) * 2013-06-27 2016-02-02 Symantec Corporation Data transfer between dissimilar deduplication systems
US10691310B2 (en) * 2013-09-27 2020-06-23 Vmware, Inc. Copying/pasting items in a virtual desktop infrastructure (VDI) environment
KR102187127B1 (ko) 2013-12-03 2020-12-04 삼성전자주식회사 데이터 연관정보를 이용한 중복제거 방법 및 시스템
JP6404481B2 (ja) * 2015-01-19 2018-10-10 ノキア テクノロジーズ オーユー クラウドコンピューティングにおける異種混合データ記憶管理方法および装置
US10515055B2 (en) * 2015-09-18 2019-12-24 Netapp, Inc. Mapping logical identifiers using multiple identifier spaces
CN105915332B (zh) * 2016-07-04 2019-02-05 广东工业大学 一种云存储加密及去重复方法及其系统
US10404797B2 (en) * 2017-03-03 2019-09-03 Wyse Technology L.L.C. Supporting multiple clipboard items in a virtual desktop infrastructure environment
US10684786B2 (en) * 2017-04-28 2020-06-16 Netapp, Inc. Methods for performing global deduplication on data blocks and devices thereof
US10942906B2 (en) * 2018-05-31 2021-03-09 Salesforce.Com, Inc. Detect duplicates with exact and fuzzy matching on encrypted match indexes
JP2020149229A (ja) * 2019-03-12 2020-09-17 Necソリューションイノベータ株式会社 重複排除装置、重複排除方法、プログラム及び記録媒体
US20210117555A1 (en) * 2020-12-23 2021-04-22 Intel Corporation Methods, systems, articles of manufacture and apparatus to certify multi-tenant storage blocks or groups of blocks

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332456A1 (en) * 2009-06-30 2010-12-30 Anand Prahlad Data object store and server for a cloud storage environment, including data deduplication and data management across multiple cloud storage sites

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8280926B2 (en) * 2003-08-05 2012-10-02 Sepaton, Inc. Scalable de-duplication mechanism
US7313575B2 (en) * 2004-06-14 2007-12-25 Hewlett-Packard Development Company, L.P. Data services handler
US9465823B2 (en) * 2006-10-19 2016-10-11 Oracle International Corporation System and method for data de-duplication
US8204866B2 (en) * 2007-05-18 2012-06-19 Microsoft Corporation Leveraging constraints for deduplication
US8190835B1 (en) * 2007-12-31 2012-05-29 Emc Corporation Global de-duplication in shared architectures
JP2011510405A (ja) * 2008-01-16 2011-03-31 セパトン,インコーポレイテッド 拡張可能な重複排除機構
JP5414223B2 (ja) * 2008-09-16 2014-02-12 株式会社日立ソリューションズ インターネットバックアップにおける転送データ管理システム
US20100082700A1 (en) * 2008-09-22 2010-04-01 Riverbed Technology, Inc. Storage system for data virtualization and deduplication
US7814149B1 (en) * 2008-09-29 2010-10-12 Symantec Operating Corporation Client side data deduplication
CA2747746C (en) * 2008-12-22 2015-08-11 Google Inc. Asynchronous distributed de-duplication for replicated content addressable storage clusters
US20100306175A1 (en) * 2009-01-28 2010-12-02 Digitiliti, Inc. File policy enforcement
WO2010100733A1 (ja) * 2009-03-05 2010-09-10 日立ソフトウエアエンジニアリング株式会社 統合重複排除システム、データ格納装置、及びサーバ装置
US8407186B1 (en) * 2009-03-31 2013-03-26 Symantec Corporation Systems and methods for data-selection-specific data deduplication
CN101582076A (zh) * 2009-06-24 2009-11-18 浪潮电子信息产业股份有限公司 一种基于数据库的重复数据删除方法
US8356017B2 (en) * 2009-08-11 2013-01-15 International Business Machines Corporation Replication of deduplicated data
US8453257B2 (en) * 2009-08-14 2013-05-28 International Business Machines Corporation Approach for securing distributed deduplication software
US20110093439A1 (en) * 2009-10-16 2011-04-21 Fanglu Guo De-duplication Storage System with Multiple Indices for Efficient File Storage
JP5099100B2 (ja) * 2009-10-20 2012-12-12 富士通株式会社 課金額算出プログラム、課金額算出装置、および課金額算出方法
US8849768B1 (en) * 2011-03-08 2014-09-30 Symantec Corporation Systems and methods for classifying files as candidates for deduplication

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332456A1 (en) * 2009-06-30 2010-12-30 Anand Prahlad Data object store and server for a cloud storage environment, including data deduplication and data management across multiple cloud storage sites

Also Published As

Publication number Publication date
US20130151484A1 (en) 2013-06-13
CN103975300A (zh) 2014-08-06
KR101583748B1 (ko) 2016-01-19
JP5851047B2 (ja) 2016-02-03
WO2013085519A1 (en) 2013-06-13
JP2015501988A (ja) 2015-01-19

Similar Documents

Publication Publication Date Title
KR101583748B1 (ko) 사용자 간의 중복제거를 허용하기 위한 저장소 할인
US11922197B2 (en) Virtual server agent load balancing
US10701134B2 (en) Transferring data between block and file storage systems
US9298385B2 (en) System, method and computer program product for deduplication aware quality of service over data tiering
US8447732B2 (en) Deduplication in network storage with data residence compliance
US20140156706A1 (en) Hybrid File Systems
US9390122B2 (en) Tree comparison to manage progressive data store switchover with assured performance
US9632724B1 (en) Point-in-time copy with chain cloning
CN103959264A (zh) 在存储云中使用去重复来管理不可变冗余文件
KR20110070992A (ko) 점증 맵들을 포함하는 플래시카피 캐스케이드에서 맵들의 최적화된 청소를 위한 방법
US11093272B2 (en) Virtual machine allocation and migration between hardware devices by destroying and generating enclaves using transmitted datafiles and cryptographic keys
US10747458B2 (en) Methods and systems for improving efficiency in cloud-as-backup tier
US10838641B2 (en) Defragmenting backup objects
US11467735B2 (en) I/O operations in log structured arrays
TW200945193A (en) Adaptation of contentious storage virtualization configurations
US11199988B2 (en) Data migration across tiers in a multi-tiered storage area network
US10732843B2 (en) Tape drive data reclamation
US10705752B2 (en) Efficient data migration in hierarchical storage management system
US20190370351A1 (en) Object deletion in distributed computing environments
US20170185305A1 (en) Optimization of disk sector duplication in a heterogeneous cloud systems environment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee