KR20210124687A - 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법 - Google Patents

스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법 Download PDF

Info

Publication number
KR20210124687A
KR20210124687A KR1020200042028A KR20200042028A KR20210124687A KR 20210124687 A KR20210124687 A KR 20210124687A KR 1020200042028 A KR1020200042028 A KR 1020200042028A KR 20200042028 A KR20200042028 A KR 20200042028A KR 20210124687 A KR20210124687 A KR 20210124687A
Authority
KR
South Korea
Prior art keywords
storage
storage device
virtual machine
virtual
host
Prior art date
Application number
KR1020200042028A
Other languages
English (en)
Inventor
오태진
Original Assignee
에스케이하이닉스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이하이닉스 주식회사 filed Critical 에스케이하이닉스 주식회사
Priority to KR1020200042028A priority Critical patent/KR20210124687A/ko
Priority to US16/996,632 priority patent/US11720389B2/en
Priority to CN202011072082.2A priority patent/CN113497747B/zh
Publication of KR20210124687A publication Critical patent/KR20210124687A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/382Information transfer, e.g. on bus using universal interface adapter
    • G06F13/387Information transfer, e.g. on bus using universal interface adapter for adaptation of different data processing systems to different peripheral devices, e.g. protocol converters for incompatible systems, open system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0658Controller construction arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0661Format or protocol conversion arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0664Virtualisation aspects at device level, e.g. emulation of a storage device or system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/70Virtual switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45579I/O management, e.g. providing access to device drivers or storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45583Memory management, e.g. access or allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Abstract

일 실시예에 의한 스토리지 시스템은 네트워크를 통해 적어도 하나의 호스트와 접속되며, 네트워크에 연결됨에 따라 생성된 가상 머신에 의해 가상 네트워크를 구성하는 복수의 스토리지 장치를 포함하는 스토리지 시스템으로서, 스토리지 장치 각각은, 가상 머신에 메모리 자원을 할당하고, 가상 머신을 통해 복수의 스토리지 장치의 장치 정보를 공유하며, 호스트가 메인 스토리지 장치를 선택하고 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함하는 스토리지 풀 생성 조건을 전송함에 따라, 메인 스토리지 장치가 가상 머신별 메모리 자원을 이용하여 스토리지 풀 생성 조건을 만족하는 스토리지 풀을 구성할 수 있다.

Description

스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법{Storage System, Storage Device, and Operating Method Therefor}
본 기술은 데이터 처리 장치에 관한 것으로, 보다 구체적으로는 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법에 관한 것이다.
NVMe(Non-Volatile Memory express)는 PCIe(Peripheral Component Interconnect express)의 물리 인터페이스를 사용하는 비휘발성 스토리 장치 전용의 프로토콜이다.
NVMe-oF(over Fabric)은 이더넷(Ethernet), 파이버 채널(Fiber channel) 및 인피니밴드(InfiniBand)와 같은 패브릭 네트워크를 통해 수백, 수천 개의 NVMe 규격의 저장장치들을 연결할 수 있는 기술이다.
빅데이터 처리를 위한 메모리 중심의 컴퓨팅 장치에 대한 요구가 증가함에 따라, 더욱 많은 컴퓨팅 자원, 고대역폭의 네트워크, 고용량 및 고성능의 스토리지 장치가 요구되고 있다.
메모리 중심의 컴퓨팅 장치에서는 호스트가 스토리지 장치로 연산 처리를 오프로드 함으로써 스토리지 장치와 호스트 간의 데이터 이동을 최소화하는 등 호스트의 부담을 최소화하기 위한 다양한 연구가 계속되고 있다.
본 기술의 실시예는 호스트의 부담 없이 복수의 스토리지 장치들이 스토리지 풀을 구성할 수 있는 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법을 제공할 수 있다.
본 기술의 일 실시예에 의한 스토리지 시스템은 네트워크를 통해 적어도 하나의 호스트와 접속되며, 상기 네트워크에 연결됨에 따라 생성된 가상 머신에 의해 가상 네트워크를 구성하는 복수의 스토리지 장치를 포함하는 스토리지 시스템으로서, 상기 스토리지 장치 각각은, 상기 가상 머신에 메모리 자원을 할당하고, 상기 가상 머신을 통해 상기 복수의 스토리지 장치의 장치 정보를 공유하며, 상기 호스트가 메인 스토리지 장치를 선택하고 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함하는 스토리지 풀 생성 조건을 전송함에 따라, 상기 메인 스토리지 장치가 상기 가상 머신별 메모리 자원을 이용하여 상기 스토리지 풀 생성 조건을 만족하는 스토리지 풀을 구성할 수 있다.
본 기술의 일 실시예에 의한 스토리지 장치는 네트워크를 통해 적어도 하나의 호스트와 접속되고, 컨트롤러 및 상기 컨트롤러의 제어에 따라 데이터를 기록 및 판독하는 데이터 저장 장치를 포함하는 스토리지 장치로서, 상기 컨트롤러는, 상기 스토리지 장치가 상기 네트워크를 통해 상기 호스트와 통신하도록 하는 네트워크 인터페이스; 상기 네트워크 인터페이스의 통신 프로토콜과 상기 스토리지 장치 내부의 통신 프로토콜을 변환하는 컨버터; 상기 컨트롤러와 상기 데이터 저장 장치 간의 통신 채널을 제공하는 스토리지 인터페이스; 및 상기 스토리지 장치가 상기 네트워크에 연결됨에 따라 생성되는 적어도 하나의 가상 머신에 메모리 자원을 할당하고, 상기 가상 머신을 통해 상기 스토리지 장치의 장치 정보를 공유하며, 상기 가상 머신별 메모리 자원을 이용하여 상기 호스트가 요구하는 스토리지 풀의 개수 및 각 스토리지 풀 별 용량을 만족하는 스토리지 풀을 구성하는 스토리지 가상화부;를 포함하도록 구성될 수 있다.
본 기술의 일 실시예에 의한 스토리지 장치의 동작 방법은 네트워크를 통해 적어도 하나의 호스트와 접속되는 복수의 스토리지 장치를 포함하는 스토리지 시스템의 동작 방법으로서, 상기 스토리지 장치가 상기 네트워크에 연결됨에 따라 적어도 하나의 가상 머신을 생성하는 단계; 상기 가상 머신에 의해 상기 복수의 스토리리 장치가 가상 네트워크를 구성하는 단계; 상기 복수의 스토리지 장치 각각이 상기 가상 머신에 메모리 자원을 할당하는 단계; 상기 가상 머신을 통해 상기 복수의 스토리지 장치의 장치 정보를 공유하는 단계; 및 상기 호스트가 메인 스토리지 장치를 선택하고 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함하는 스토리지 풀 생성 조건을 전송함에 따라, 상기 메인 스토리지 장치가 상기 가상 머신별 메모리 자원을 이용하여 상기 스토리지 풀 생성 조건을 만족하는 스토리지 풀을 구성하는 단계;를 포함하도록 구성될 수 있다.
본 기술에 의하면, 호스트의 리소스를 사용하지 않고 스토리지 장치들이 스스로 정보를 공유하고 스토리지 풀을 구성할 수 있다. 호스트가 스토리지 풀을 구성하기 위해 스토리지 장치의 정보를 수집하고 자원을 할당하거나 시간을 할애할 필요가 없으므로 호스트 고유의 작업을 보다 고속으로 처리할 수 있다.
나아가, 스토리지 장치가 추가되거나 제거되는 경우에도 스토리지 장치들이 자체적으로 스토리지 풀의 구성을 변경할 수 있으므로 스토리지 풀의 재구성이 용이한 장점이 있다.
도 1 내지 도 3은 실시예들에 의한 스토리지 시스템의 구성도이다.
도 4는 일 실시예에 의한 스토리지 장치의 구성도이다.
도 5는 일 실시예에 의한 스토리지 관리부의 구성도이다.
도 6은 일 실시예에 의한 하이퍼바이저의 구성도이다.
도 7은 일 실시예에 의한 스토리지 풀을 포함하는 네트워크 시스템의 구성도이다.
도 8은 일 실시예에 의한 스토리지 장치의 동작 방법을 설명하기 위한 흐름도이다.
도 9는 일 실시예에 의한 스토리지 시스템의 리퀘스트 처리 방법을 설명하기 위한 개념도이다.
도 10은 일 실시예에 의한 스토리지 시스템의 리퀘스트 처리 방법을 설명하기 위한 개념도이다.
도 11은 일 실시예에 의한 스토리지 장치를 포함하는 네트워크 시스템의 구성도이다.
이하, 첨부된 도면을 참조하여 본 기술의 실시예를 보다 구체적으로 설명한다.
도 1 내지 도 3은 실시예들에 의한 스토리지 시스템의 구성도이다.
도 1을 참조하면, 스토리지 시스템(1)은 적어도 하나의 호스트(110)와 네트워크(130)를 통해 접속되는 복수의 스토리지 장치(200-1~200-n)를 포함할 수 있다.
네트워크(130)는 이더넷(Ethernet), 파이버 채널(Fiber channel) 또는 인피니밴드(InfiniBand)와 같은 패브릭 네트워크일 수 있다.
스토리지 장치(200-1~200-n)는 SSD(Solid State Drive)일 수 있으며, 바람직하게는 이더넷-SSD(eSSD)일 수 있다.
적어도 하나의 호스트(110) 각각은 스토리지 장치(200-1~200-n)와 NVMEe-oF 연결을 설정할 수 있다.
네트워크 스위치(121)는 복수의 스토리지 장치(200-1~200-n, SD1~SDn)가 네트워크(130)를 통해 호스트(110)와 연결될 수 있는 환경을 제공한다. 네트워크 스위치(121)는 내부 메모리(미도시)에 각 스토리지 장치(200-1~200-n, SD1~SDn)를 식별하기 위한 주소를 저장하며, 이를 통해 각각의 호스트(110)가 특정 스토리지 장치(200-1~200-n, SD1~SDn)와 데이터 교환을 수행할 수 있도록 한다.
네트워크 스위치(121)는 업링크 포트를 통해 호스트(110)와 제 1 속도로 통신하고, 다운링크 포트를 통해 복수의 스토리지 장치(200-1~200-n, SD1~SDn)와 제 2 속도로 통신할 수 있다.
복수의 스토리지 장치(200-1~200-n, SD1~SDn)는 고성능 및 대용량 데이터 저장 솔루션을 제공한다. NVMe-oF 프로토콜은 원격 직접 연결(remote Direct-Attached Storage, rDAS) 방식으로 호스트(110)에서 구동되는 어플리케이션이 복수의 스토리지 장치(200-1~200-n, SD1~SDn)에 오프로드되어 처리될 수 있도록 한다.
도 2를 참조하면, 일 실시예에 의한 스토리지 시스템(10)은 적어도 하나의 호스트(110)와 네트워크(130)를 통해 접속되는 스토리지 샤시(120)를 포함할 수 있다.
네트워크(130)는 이더넷(Ethernet), 파이버 채널(Fiber channel) 및 인피니밴드(InfiniBand)와 같은 패브릭 네트워크일 수 있다.
스토리지 샤시(120)는 복수의 스토리지 장치(200-1~200-n)를 포함할 수 있다. 일 실시예에서, 스토리지 장치(200-1~200-n)는 SSD(Solid State Drive)일 수 있으며, 바람직하게는 이더넷-SSD(eSSD)일 수 있다.
적어도 하나의 호스트(110) 각각은 스토리지 샤시(120) 내의 스토리지 장치(200-1~200-n)와 NVMEe-oF 연결을 설정할 수 있다.
스토리지 샤시(120)는 마더보드 또는 베이스보드 상에 결합되는 네트워크 스위치(121), 베이스보드 관리 컨트롤러(Baseboard Management Controller; BMC, 123), BMC 스위치(125) 및 복수의 스토리지 장치(200-1~200-n, SD1~SDn)를 포함할 수 있다.
네트워크 스위치(121)는 복수의 스토리지 장치(200-1~200-n, SD1~SDn)가 네트워크(130)를 통해 호스트(110)와 연결될 수 있는 환경을 제공한다. 네트워크 스위치(121)는 내부 메모리(미도시)에 각 스토리지 장치(200-1~200-n, SD1~SDn)를 식별하기 위한 식별자를 저장하며, 이를 통해 호스트(110)가 특정 스토리지 장치(200-1~200-n, SD1~SDn)와 데이터 교환을 수행할 수 있도록 한다.
네트워크 스위치(121)는 업링크 포트를 통해 호스트(110)와 제 1 속도로 통신하고, 다운링크 포트를 통해 복수의 스토리지 장치(200-1~200-n, SD1~SDn)와 제 2 속도로 통신할 수 있다.
BMC(123)는 스토리지 샤시(120) 내의 내부 구성요소들을 관리하도록 구성될 수 있다. 일 실시예에서, BMC(123)는 시스템 관리자에 의해 제공되는 명령에 따라 복수의 스토리지 장치(200-1~200-n, SD1~SDn) 및 네트워크 스위치(121)를 세팅하여, 부트 및 제어 경로를 설정할 수 있다. BMC(123)는 복수의 스토리지 장치(200-1~200-n, SD1~SDn)의 연결 상태, 수명, 온도, 로그 정보와 같은 하드웨어 헬스 정보 및 전력 소비 정보를 체크할 수 있다.
BMC 스위치(125)는 복수의 스토리지 장치(200-1~200-n, SD1~SDn)와 BMC(123)가 접속할 수 있는 환경을 제공한다. 일 실시예에서, BMC 스위치(125)는 PCIe(Peripheral Component Interconnect express) 스위치를 포함할 수 있다.
복수의 스토리지 장치(200-1~200-n, SD1~SDn), 이들을 호스트와 연결시키는 네트워크 스위치(121), 이들을 관리하기 위한 BMC(123)는 샤시 또는 인클로저에 함께 수납되어 스토리지 샤시(120)를 구성할 수 있다.
복수의 스토리지 장치(200-1~200-n, SD1~SDn)는 고성능 및 대용량 데이터 저장 솔루션을 제공한다. NVMe-oF 프로토콜은 원격 직접 연결(remote Direct-Attached Storage, rDAS) 방식으로 호스트(110)에서 구동되는 어플리케이션이 복수의 스토리지 장치(200-1~200-n, SD1~SDn)에 오프로드되어 처리될 수 있도록 한다.
도 3을 참조하면, 일 실시예에 의한 스토리지 시스템(100)은 적어도 하나의 호스트(110)와 네트워크(130)를 통해 접속되는 스토리지 랙(1200)을 포함할 수 있다.
스토리지 랙(1200)은 랙 스위치(1210) 및 복수의 스토리지 샤시(120-1~120-m)를 포함할 수 있다.
랙 스위치(1210)는 복수의 스토리지 샤시(120-1~120-m) 간의 연결성을 제공하도록 구성될 수 있다.
각각의 스토리지 샤시(120-1~120-m)는 eSSD와 같은 복수의 스토리지 장치가 네트워크 스위치 및 베이스보드 관리 컨트롤러(BMC)와 함께 마더보드 상에 결합 또는 실장된 구성을 가질 수 있다.
일 실시예에서, 스토리지 샤시(120-1~120-m)각각은 도 2에 도시한 스토리시 샤시(120)로 구성될 수 있다.
도 1 내지 도 3의 스토리지 시스템(1, 10, 100)을 구성하는 스토리지 장치(200-1~200-n)는 호스트(110)의 개입 없이, 다른 관점에서는 호스트(110) 독립적으로 복수의 스토리지 장치(200-1~200-n, SD1~SDn) 상호 간에 장치 정보를 공유하고 스토리지 풀을 형성하도록 구성될 수 있다.
일 실시예에서, 스토리지 장치(200-1~200-n) 각각은 스토리지 시스템(1, 10, 100)에 연결됨에 따라 다양한 방법에 의해 자신의 장치 정보를 방송할 수 있다. 장치 정보는 각각의 스토리지 장치(200-1~200-n)가 자신의 하드웨어 정보(물리적 정보) 및 소프트웨어 정보(논리적 정보)를 모니터링하여 수집한 정보일 수 있다. 하드웨어 정보는 총 용량, 잔여 용량, 배드블럭 수, 온도, 수명 등을 포함할 수 있다. 소프트웨어 정보는 비지(Busy) 정도, 처리 중이거나 대기 중인 리퀘스트 양, 자주 요청되는 리퀘스트 패턴, 리드 요청되는 데이터 패턴 등을 포함할 수 있다.
일 실시예에서, 장치 정보는 방송 및 조회 방식에 의해 공유될 수 있다.
방송 및 조회 방식의 일 실시예에서, 스토리지 장치(200-1~200-n)들은 스토리지 시스템(10, 100)에 연결시, 스토리지 시스템(10, 100)에 연결되어 있는 다른 스토리지 장치들로 자신의 장치 정보를 전송(방송)하고, 타 스토리지 장치의 장치 정보를 수신한 스토리지 장치들은 수신된 장치 정보를 저장할 수 있다.
일 실시예에서, 스토리지 장치(200-1~200-n)들은 스토리지 시스템(10, 100)에 연결시, BMC(123)로 장치 정보를 전송(방송)할 수 있고, BMC(123)는 각 스토리지 장치(200-1~200-n) 별로 장치 정보를 저장할 수 있다. 메인 스토리지 장치는 장치는 BMC(123)에 저장된 장치 정보 및 호스트(110)가 요구하는 스토리지 풀 생성 조건에 기초하여 스토리지 풀을 구성할 수 있다.
복수의 스토리지 장치(200-1~200-n)는 자신의 장치 정보가 기 설정된 임계치 이상 변동되면 타 스토리지 장치들 또는 BMC(124)로 변경된 장치 정보를 전송하여 공유된 장치 정보가 갱신되도록 할 수 있고, 메인 스토리지 장치는 스토리지 장치(200-1~200-n)의 최신 상태를 반영하여 스토리지 풀의 구성을 변경할 수 있다.
복수의 스토리지 장치(200-1~200-n) 중 적어도 하나는 호스트(110)에 의해 메인 스토리지 장치로 선택될 수 있고, 이러한 관점에서, 복수의 스토리지 장치(200-1~200-n)는 적어도 하나의 메인 스토리지 장치 및 서브 스토리지 장치를 포함할 수 있다.
메인 스토리지 장치는 호스트(110)로부터 전송되는 스토리지 풀 생성 조건, 자신 및 서브 스토리지 장치의 장치 정보에 기초하여 스토리지 시스템(1, 10, 100)에 연결된 복수의 스토리지 장치(200-1~200-n)의 메모리 자원을 적어도 하나의 스토리지 풀로 구성할 수 있다. 일 실시예에서, 스토리지 풀 생성 조건은 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함할 수 있다.
스토리지 장치(200-1~200-n)들은 스토리지 풀 내에서 가상 네트워크를 통해 상호 통신하고, 메인 스토리지 장치 및 서브 스토리지 장치가 가상 네트워크 상에서 협력하여 호스트(110)의 리퀘스트를 처리할 수 있다.
가상 네트워크란 하드웨어 리소스를 소프트웨어로 추상화한 것을 의미한다. 네트워크를 가상화 또는 추상화한다는 것은 실제 네트워크를 구성하는 물리적인 하드웨어에 직접 접근하는 것처럼 에뮬레이팅하는 소프트웨어를 하드웨어 상에서 실행시키는 것이라 할 수 있다. 가상 네트워크는 통해 적어도 하나의 물리적 네트워크 스위치(121)에 가상 네트워크 스위치를 통해 접속되는 적어도 하나의 가상 시스템울 포함할 수 있다. 가상 네트워크 스위치는 물리적 네트워크 스위치(121)와 동일하게 동작하는 소프트웨어 네트워크 스위치일 수 있다.
메인 스토리지 장치는 복수의 스토리지 장치(200-1~200-n)들에 포함된 하드웨어 리소스들을 추상화한 적어도 하나의 스토리지 풀을 포함하는 가상 시스템을 구성할 수 있다. 따라서 호스트(110)는 메인 스토리지 장치를 통해 적어도 하나의 스토리지 풀과 통신할 수 있고, 스토리지 풀을 구성하는 복수의 스토리지 장치(200-1~200-n)들은 가상 네트워크를 통해 통신할 수 있다.
일 실시예에서, 호스트(110)는 메인 스토리지 장치로 데이터를 라이트하거나 리드하기 위한 리퀘스트를 전송할 수 있고, 메인 스토리지 장치는 호스트의 리퀘스트에 응답하여 자신, 또는 서브 스토리지 장치와 가상 네트워크를 통해 상호 협력하여 데이터를 라이트하거나 리드할 수 있다.
일 실시예에서, 복수의 스토리지 장치(200-1~200-n)들은 상호 간에 데이터를 분산할 수 있다. 복수의 스토리지 장치(200-1~200-n) 중, 데이터 분산을 필요로 하는 스토리지 장치는 소스 스토리지 장치로, 소스 스토리지 장치로부터 분산 대상 데이터를 전송받아 저장하는 스토리지 장치는 타겟 스토리지 장치로 작용할 수 있다.
복수의 스토리지 장치(200-1~200-n)에 포함된 모든 스토리지 장치(200-1~200-n)가 소스 스토리지 장치가 될 수 있고, 소스 스토리지 장치는 자신을 제외한 다른 스토리지 장치의 장치 정보에 기초하여 적어도 하나의 타겟 스토리지 장치를 선택하고 데이터를 분산할 수 있다.
일 실시예에서, 소스 스토리지 장치는, 설정된 기준에 따라 선택된 데이터를 타겟 스토리지 장치로 전송하고, 타겟 스토리지 장치는 소스 스토리지 장치로부터 전송된 데이터를 저장함으로써 소스 스토리지 장치의 데이터를 분산 저장할 수 있다. 소스 스토리지 장치는 분산 대상 데이터를 복수로 분할하고 복수의 타겟 스토리지 장치에 분산 저장하는 것도 가능하다.
도 4는 일 실시예에 의한 스토리지 장치의 구성도이다.
도 4를 참조하면, 일 실시예에 의한 스토리지 장치(200)는 컨트롤러(2100), 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)을 포함하는 데이터 저장 장치(2200), 버퍼 메모리(2230) 및 전원 공급기(2240)을 포함할 수 있다.
컨트롤러(2100)는 호스트 장치(1100) 또는 타 스토리지 장치로부터 입력된 신호를 분석하고 처리할 수 있다. 컨트롤러(2100)는 데이터 저장장치(2200)를 구동하기 위한 펌웨어 또는 소프트웨어에 따라서 동작할 수 있다
일 실시예에서, 컨트롤러(2100)는 데이터 저장 장치(2200)를 관리하기 위한 가비지 콜렉션, 주소맵핑, 웨어레벨링 등을 수행하기 위한 플래시 변환계층(FTL)의 기능, 데이터 저장 장치(2200)로부터 독출된 데이터의 에러를 검출하고 정정하는 기능 등을 수행할 수 있다.
버퍼 메모리(2300)는 데이터 저장 장치(2200)에 저장될 데이터를 임시 저장할 수 있다. 또한, 버퍼 메모리(2300)는 데이터 저장 장치(2200)로부터 리드한 데이터를 임시 저장할 수 있다. 버퍼 메모리(2300)에 임시 저장된 데이터는 컨트롤러(2100)의 제어에 따라 호스트(110), 데이터 저장 장치(2200) 또는 다른 스토리지 장치로 전송될 수 있다. 버퍼 메모리(2300)는 컨트롤러(2100)의 내부에 포함되는 것도 가능하다.
비휘발성 메모리 장치들(2200-0 ~ 2220-L)은 스토리지 장치(200)의 저장 매체로 사용될 수 있다. 비휘발성 메모리 장치들(2200-0 ~ 2220-L) 각각은 복수의 채널들(CH0~CHk)을 통해 컨트롤러(2100)와 연결될 수 있다. 하나의 채널에는 하나 또는 그 이상의 비휘발성 메모리 장치가 연결될 수 있다. 하나의 채널에 연결되는 비휘발성 메모리 장치들은 동일한 신호 버스 및 데이터 버스에 연결될 수 있다.
전원 공급기(2400)는 전원 커넥터를 통해 입력된 전원을 컨트롤러(2100), 비휘발성 메모리 장치들(2200-0 ~ 2220-L) 및 버퍼 메모리(2300)에 제공할 수 있다. 전원 공급기(2400)는 서든 파워 오프(sudden power off)가 발생되는 경우, 스토리지 장치(200)가 정상적으로 종료될 수 있도록 전원을 공급할 수 있는 보조 전원 공급기를 더 포함할 수 있다.
일 실시예에서, 컨트롤러(2100)는 프로세서(2101), 네트워크 인터페이스(2103), 컨버터(2105), 스토리지 인터페이스(2107), BMC 인터페이스(2109) 및 버퍼 메모리(BM) 관리부(2111)를 포함할 수 있다. BMC 인터페이스(2109)는 스토리지 시스템(1, 10, 100)의 구현 형태에 따라 생략하는 것도 가능하다.
프로세서(2101)는 하드웨어 및 하드웨어 상에서 실행되는 소프트웨어가 결합된 형태로 구성되어 스토리지 장치(200)를 동작시키기 위해 로딩된 소프트웨어 또는 펌웨어를 구동시킬 수 있다.
네트워크 인터페이스(2103)는 스토리지 장치(200)가 네트워크 스위치(121)를 통해 네트워크(130)에 접속하여 호스트(110)와 통신할 수 있는 통신 채널을 제공할 수 있다.
컨버터(2105)는 스토리지 장치(200)를 네트워크(130)에 연결시켜주는 네트워크 인터페이스(2103)의 통신 프로토콜과 스토리지 장치(200) 내부의 통신 프로토콜 간을 변환하도록 구성될 수 있다.
스토리지 인터페이스(2107)는 컨트롤러(2100)와 데이터 저장 장치(2200) 간의 신호 송수신을 위한 통신 채널을 제공할 수 있다. 스토리지 인터페이스(2107)는 프로세서(2101)의 제어에 따라 버퍼 메모리(2300)에 일시 저장된 데이터를 데이터 저장 장치(2200)에 기입할 수 있다. 그리고 데이터 저장 장치(2200)로부터 독출되는 데이터를 버퍼 메모리(2300)로 전달하여 일시 저장할 수 있다.
BMC 인터페이스(2109)는 스토리지 장치(200)가 BMC 스위치(125)를 통해 BMC(123)에 접속할 수 있는 통신 채널을 제공할 수 있다. 일 실시예에서, BMC 인터페이스(2109)는 PCIe(Peripheral Component Interconnect express) 인터페이스일 수 있다.
BM 관리부(2111)는 버퍼 메모리(2300)의 사용 상태를 관리하도록 구성될 수 있다. 일 실시예에서, BM 관리부(2111)는 버퍼 메모리(2300)를 복수의 영역(슬롯)으로 분할하고, 데이터를 임시 저장하기 위하여 각 영역들을 할당하거나 해제할 수 있다.
프로세서(2101)는 스토리지 가상화부(2500)를 포함할 수 있다.
일 실시예에서, 스토리지 가상화부(2500)는 스토리지 장치(200)가 스토리지 시스템(10, 100)에 연결됨에 따라 자신이 포함된 스토리지 장치(200)의 식별자 및 물리 주소를 네트워크 스위치(121) 및 호스트(110)에 등록할 수 있다.
아울러, 적어도 하나의 가상 머신을 실행하고 이를 통해 스토리지 시스템(10, 100)에 연결된 스토리지 장치(200-1~200-n)들과 가상 네트워크를 구성할 수 있다.
가상 머신 각각에는 가상 주소가 할당될 수 있고, 스토리지 장치(200)들이 형성한 가상 네트워크 상에서 각 스토리지 장치(200)는 가상 주소에 의해 식별될 수 있다. 스토리지 장치(200)는 가상 네트워크를 통해 장치 정보를 방송하고, 이에 따라 스토리지 장치(200)들이 서로의 장치 정보를 공유할 수 있다.
아울러, 각각의 가상 머신에는 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 적어도 일부 영역이 자원으로 할당될 수 있다.
일 실시예에서, 가상 머신의 실행 및 가상 주소의 할당 등은 하이퍼바이저라 지칭되는 가상 머신 관리자에 의해 수행될 수 있다.
스토리지 장치(200)가 호스트(110)에 의해 메인 스토리지 장치로 지정되는 경우, 스토리지 가상화부(2500)는 호스트(110)로부터 전송되는 스토리지 풀 생성 조건 및 공유된 장치 정보에 기초하여 적어도 하나의 스토리지 장치(200, 200-1~200-n), 또는 적어도 하나의 스토리지 장치(200, 200-1~200-n) 내의 적어도 하나의 데이터 저장 장치(2200)를 포함하는 스토리지 풀을 구성할 수 있다.
일 실시예에서, 메인 스토리지 장치의 제어에 따라 스토리지 장치(200)에는 호스트(110)가 요구하는 스토리지 풀의 개수에 대응하는 개수의 가상 머신이 생성될 수 있다. 동일한 스토리지 풀을 구성하는 가상 머신들에는 동일한 식별자를 할당할 수 있고, 각각의 가상 머신은 하이퍼바이저에 의해 할당된 고유의 가상 주소에 의해 식별될 수 있다. 각각의 가상 머신에는 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 적어도 일부 영역이 자원으로 할당될 수 있다. 따라서, 각 가상 머신은 가상 머신 식별자, 고유의 가상 주소, 각 가상 머신에 할당된 메모리 자원(비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200))의 식별자별 용량을 포함하는 가상 머신 정보에 의해 관리될 수 있다.
스토리지 풀이 구성되면, 메인 스토리지 장치는 호스트(110)로 스토리지 풀 구성 정보를 전송할 수 있다. 일 실시예에서, 스토리지 풀 구성 정보는 스토리지 풀 식별자, 스토리지 풀별 가상 머신 식별자, 스토리지 풀에 포함된 가상 머신의 가상 주소, 메모리 자원(비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200))의 식별자 및 용량을 포함할 수 있다.
메인 스토리지 장치의 식별자와 물리 주소는, 스토리지 풀별 식별자, 각 스토리지 풀을 이루는 가상 머신 식별자, 메인 스토리지 장치에 생성된 가상 머신의 가상 주소와 맵핑되어 네트워크 스위치(121)에 등록될 수 있다.
호스트(110)는 각 스토리지 풀 식별자 및 메인 스토리지 장치에 생성된 가상 머신의 가상 주소에 기초하여 스토리지 풀을 구분할 수 있다. 아울러, 메인 스토리지 장치의 물리 주소에 기초하여, 네트워크 스위치(121)를 통해 원하는 스토리지 풀에 접근하기 위한 리퀘스트를 전송할 수 있다. 일 실시예에서, 스토리지 풀 식별자와 가상 머신 식별자는 같거나 다를 수 있다.
일 실시예에서, 스토리지 시스템(1, 10, 100)에 새로운 스토리지 장치가 추가될 수 있다. 메인 스토리지 장치는 추가된 스토리지 장치에 적어도 하나, 바람직하게는 스토리지 풀의 개수 이상의 가상 머신을 생성하도록 요청할 수 있고, 이에 따라 스토리 풀의 구성을 변경할 수 있다. 일 실시예에서, 추가된 스토리지 장치를 스토리지 풀에 편입시키지 않고 대기 상태로 관리하는 것도 가능하다.
도 5는 일 실시예에 의한 스토리지 가상화부의 구성도이다.
도 5를 참조하면, 일 실시예에 의한 스토리지 가상화부(2500)는 하이퍼바이저(2501), 적어도 하나의 가상 머신(2503), 공유정보 처리부(2505) 및 맵 테이블(2507)을 포함할 수 있다.
하이퍼바이저(2501)는 호스트(110) 또는 메인 스토리지 장치의 요청에 응답하여 적어도 하나의 가상 머신(VM1~VMi)을 생성하고, 가상 머신(VM1~VMi)마다 가상 주소를 할당할 수 있다. 생성된 가상 머신(VM1~VMi)에는 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 적어도 일부 영역이 메모리 자원으로 할당될 수 있다. 가상 머신(VM1~VMi) 및 이에 할당된 가상 주소를 기초로, 각 스토리지 장치(20)들이 가상 네트워크를 구성할 수 있다.
공유 정보 처리부(2505)는 스토리지 장치(200)가 적어도 하나의 가상 머신을 통해 가상 네트워크에 연결됨에 따라 자신의 장치 정보를 방송하는 한편, 타 스토리지 장치의 장치 정보를 수신하고 저장할 수 있다.
장치 정보는 스토리지 장치(200)의 하드웨어 정보(물리적 정보) 및 소프트웨어 정보(논리적 정보)를 포함할 수 있다.
맵 테이블(2507)은 가상 머신(VM1~VMi) 별로 할당된 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 식별자 및 물리 주소를 저장할 수 있다.
스토리지 장치(200)가 메인 스토리지 장치로 지정되는 경우 하이퍼바이저(2501)는 호스트(110)로부터 전송되는 스토리지 풀 생성 조건, 가상 머신(VM1~VMi) 정보 및 공유 정보 처리부(2505)에서 관리하는 장치 정보에 기초하여 스토리지 풀을 구성하고, 스토리지 풀 구성 정보를 호스트(110)로 전송할 수 있다. 이에 따라, 메인 스토리지 장치의 맵 테이블(2507)에는 호스트의 리퀘스트에 따라 스토리지 풀에 저장되는 데이터의 논리 주소에 대응하는 물리적 접근 정보가 저장될 수 있다. 물리적 접근 정보는 예를 들어, 데이터가 저장된 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)의 물리 주소 및 해당 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)를 자원으로 소유하고 있는 가상 머신 주소, 해당 가상 머신이 포함된 스토리지 풀 식별자를 포함할 수 있으나, 이에 한정되는 것은 아니다.
하이퍼바이저(2501)는 호스트(110) 또는 메인 스토리지 장치의 리퀘스트에 따라 맵 테이블(2507)을 참조하여 데이터 저장 장치(220) 또는 타 스토리지 장치(200)에 리드 또는 라이트 요청을 전송할 수 있다.
도 6은 일 실시예에 의한 하이퍼바이저(2501)의 구성도이다.
도 6을 참조하면, 일 실시예에 의한 하이퍼바이저(2501)는 VM 생성부(2511), 가상 주소 할당부(2531), 스토리지 풀 관리부(2551), 리퀘스트 처리부(2571) 및 맵 테이블 관리부(2591)를 포함할 수 있다.
VM 생성부(2511)는 호스트(110) 또는 메인 스토리지 장치의 요청에 응답하여 적어도 하나의 가상 머신(VM1~VMi)을 생성하고, 생성된 가상 머신(VM1~VMi)에 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 적어도 일부 영역을 메모리 자원으로 할당할 수 있다. 가상 머신(VM1~VMi)에 할당되는 메모리 자원의 용량은 메인 스토리지 장치에 의해 결정될 수 있으나 이에 한정되는 것은 아니다.
가상 주소 할당부(2531)는 VM 생성부(2511)에서 생성한 가상 머신(VM1~VMi)마다 고유의 가상 주소를 할당할 수 있다.
이에 따라, 스토리지 시스템(1, 10, 100)에 연결된 복수의 스토리지 장치(200)는 자신 및 타 스토리지 장치에 실행되어 있는 가상 머신을 통해 가상 네트워크를 형성하고, 가상 주소를 통해 상호 식별할 수 있다.
스토리지 풀 관리부(2551)는 호스트(110)로부터 전송되는 스토리지 풀 생성 조건, 가상 머신(VM1~VMi) 정보 및 공유 정보 처리부(2505)에서 수신한 장치 정보에 기초하여 스토리지 풀을 구성할 수 있다. 일 실시예에서, 스토리지 풀 생성 조건은 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함할 수 있다. 가상 머신(VM1~VMi) 정보는 가상 머신 식별자, 가상 주소, 각 가상 머신(VM1~VMi) 에 할당된 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)들의 용량, 물리 주소를 포함할 수 있다.
스토리지 풀이 구성되면, 스토리지 풀 관리부(2551)는 호스트(110)로 스토리지 풀 구성 정보를 전송할 수 있다. 일 실시예에서, 스토리지 풀 구성 정보는 스토리지 풀 식별자, 스토리지 풀별 가상 머신 식별자, 각 스토리지 풀에 포함된 가상 머신별 가상 주소, 스토리지 풀을 구성하는 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)들의 식별자, 용량 및 물리 주소를 포함할 수 있다. 메인 스토리지 장치의 식별자와 물리 주소는, 스토리지 풀별 식별자, 각 스토리지 풀을 이루는 가상 머신 식별자, 메인 스토리지 장치에 생성된 가상 머신의 가상 주소와 맵핑되어 네트워크 스위치(121)에 등록될 수 있다. 호스트(110)는 각 스토리지 풀 식별자 및 메인 스토리지 장치에 생성된 가상 머신의 가상 주소에 기초하여 스토리지 풀을 식별하고, 네트워크 스위치(121)를 통해 스토리지 풀과 통신할 수 있다.
리퀘스트 처리부(2571)는 호스트(110) 또는 메인 스토리지 장치로부터 전송되는 리퀘스트에 따라, 맵 테이블(2507)을 참조하여 스토리지 풀을 구성하는 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200) 또는 스토리지 장치(200)에 접근하여 데이터를 라이트하거나 리드할 수 있다.
맵 테이블 관리부(2591)는 가상 머신(VM1~VMi) 별로 할당된 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 식별자 및 물리 주소를 저장할 수 있다. 스토리지 장치가 호스트(110)에 의해 메인 스토리지 장치로 결정됨에 따라 맵 테이블 관리부(2591)는 호스트가 라이트 요청한 데이터의 논리 주소에 대응하는 물리적 접근 정보를 맵 테이블(2507)에 저장할 수 있다. 물리적 접근 정보는 예를 들어, 데이터가 저장된 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)의 물리 주소 및 해당 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)를 자원으로 소유하고 있는 가상 머신 주소, 해당 가상 머신이 포함된 스토리지 풀 식별자를 포함할 수 있다.
도 7은 일 실시예에 의한 스토리지 풀을 포함하는 네트워크 시스템의 구성도이다.
도 7의 네트워크 시스템(1000)을 참조하면, 스토리지 가상화부(2500)의 제어에 따라 스토리지 장치(SD-a. SD-b, SD-c) 각각에 가상 머신이 생성됨에 따라, 각 가상 머신에 가상 주소 및 메모리 자원이 할당될 수 있다.
예를 들어, 스토리지 장치(SD-a)의 제 1 가상머신(VM1)에는 메모리 블럭 1, 2, 3, 4가 자원으로 할당되고 제 2 가상머신(VM2)에는 메모리 블럭 A, B, C, D가 자원으로 할당될 수 있다. 스토리지 장치(SD-b)의 제 1 가상머신(VM1)에는 메모리 블럭 5, 6, 7, 8이 자원으로 할당될 수 있다. 스토리지 장치(SD-c)의 제 2 가상머신(VM2)에는 메모리 블럭 E, F가 자원으로 할당될 수 있다.
스토리지 장치(SD-a)가 메인 스토리지 장치로 결정된 경우를 가정하면, 메인 스토리지 장치(SD-a)는 스토리지 풀 생성 조건에 기초하여, 스토리지 장치(SD-a)의 제 1 가상머신(VM1)에 할당된 메모리 블럭(1, 2, 3, 4)과, 스토리지 장치(SD-b)의 제 1 가상머신(VM1)에 할당된 메모리 블럭(5, 6, 7, 8)을 이용하여 제 1 스토리지 풀(SP1)을 구성할 수 있다. 아울러, 스토리지 장치(SD-a)의 제 2 가상머신(VM2)에 할당된 메모리 블럭(A, B, C, D)과, 스토리지 장치(SD-c)의 제 2 가상머신(VM2)에 할당된 메모리 블럭(E. F)을 이용하여 제 2 스토리지 풀(SP2)을 구성할 수 있다.
제 1 스토리지 풀(SP1)은 메인 스토리지 장치(SD-a)의 제 1 가상 머신(VM1)에 할당된 가상 주소 및 가상 포트(VPort1)를 통해 가상 스위치(V121)에 접속되고, 제 2 스토리지 풀(SP2)은 메인 스토리지 장치(SD-a)의 제 2 가상 머신(VM2)에 할당된 가상 주소 및 가상 포트(VPort2)를 통해 가상 스위치(V121)에 접속될 수 있다.
스토리지 풀 식별자, 스토리지 풀별 가상 머신 식별자, 각 스토리지 풀에 포함된 가상 머신별 가상 주소, 스토리지 풀을 구성하는 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)들의 식별자, 용량 및 물리 주소를 포함하는 제 1 및 제 2 스토리지 풀(SP1, SP2) 구성 정보는 호스트(110)로 전송될 수 있다.
메인 스토리지 장치(SD-a)의 식별자와 물리 주소는, 스토리지 풀별 식별자(SP1, SP2), 각 스토리지 풀을 이루는 가상 머신 식별자(VM1, VM2), 메인 스토리지 장치에 생성된 가상 머신의 가상 주소와 맵핑되어 네트워크 스위치(121)에 등록될 수 있다.
호스트(110)의 리퀘스트는 네트워크 스위치(121)를 통해 메인 스토리지 장치(SD-a)로 전송될 수 있다. 일 실시예에서, 호스트(110)의 리퀘스트는 목적지 정보를 포함하는 헤더부 및 커맨드를 포함하는 바디부를 포함하는 패킷일 수 있다. 헤더부의 목적지 정보는 스토리지 풀 식별자 및 메인 스토리지 장치에 생성된 가상 머신 중 어느 하나의 가상 주소를 포함할 수 있다. 바디부의 커맨드는 커맨드 식별자, 논리 주소 및 데이터를 포함할 수 있다.
호스트(110)가 네트워크 스위치(121)를 통해 메인 스토리지 장치로 리퀘스트 패킷을 전송함에 따라, 메인 스토리지 장치의 네트워크 인터페이스(2103)는 리퀘스트 패킷의 헤더부로부터 스토리지 풀 식별자 및 가상 주소를 추출하고, 추출된 스토리지 풀을 구성하는 가상 머신으로 바디부에 포함된 내용을 전달할 수 있다. 이를 수신한 스토리지 풀의 하이퍼바이저(2501)는 바디부에 포함된 커맨드를 해석하고, 가상 스위치(V121)에 연결되는 가상 네트워크를 통해 호스트(110)의 논리 주소가 지시하는 스토리지 장치(SD-a, SD-b, SD-c)의 물리 영역에 접근하여 커맨드를 실행할 수 있다.
일 실시예에서, 스토리지 장치(SD-b)의 여분의 메모리 블럭(SD-r)은 스토리지 풀 생성 조건이 변경됨에 따라 제 1 또는 제 2 스토리지 풀(SP1, SP2)에 편입되거나, 별도의 스토리지 풀을 구성할 수 있다.
도 8은 일 실시예에 의한 스토리지 장치의 동작 방법을 설명하기 위한 흐름도이다.
도 8을 참조하면, 스토리지 시스템(1, 10, 100)에 스토리지 장치(200)가 연결됨에 따라, 네트워크 인터페이스(2103)를 통해 스토리지 장치(200)의 식별자 및 물리 주소가 네트워크 스위치(121)에 전송 및 등록될 수 있다(S101). 네트워크 스위치(121)는 스토리지 장치(200)의 식별자 및 물리 주소를 호스트(110)로 전송할 수 있다(S103).
스토리지 장치(200)의 스토리지 가상화부(2500)는 적어도 하나의 가상 머신을 생성하고, 가상 주소 및 자원을 할당할 수 있다(S105). 일 실시예에서, 가상 머신에 할당되는 자원은 비휘발성 메모리 장치들(2200-0 ~ 2200-L; 2200)의 적어도 일부 영역일 수 있다.
이에 따라, 스토리지 시스템(10, 100)에 연결된 복수의 스토리지 장치(200-1~200-n)들이 가상 네트워크를 구성할 수 있다. 가상 네트워크에 포함되는 각 가상 머신은 가상 머신 식별자, 가상머신의 가상 주소, 각 가상 머신에 할당된 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)들의 식별자별 용량을 포함하는 가상 머신 정보에 의해 관리될 수 있다.
스토리지 장치(200)의 스토리지 가상화부(2500)는 가상 네트워크를 통해 장치 정보를 방송하고, 이에 따라 스토리지 장치(200)들이 서로의 장치 정보를 공유할 수 있다(S107).
호스트(110)는 스토리지 장치(200) 중 어느 하나를 메인 스토리지 장치로 결정하고, 메인 스토리지 장치로 스토리지 풀 생성 조건을 전송할 수 있다(S109). 이에 따라, 메인 스토리지 장치의 스토리지 가상화부(2500)는 호스트(110)로부터 전송되는 스토리지 풀 생성 조건 및 공유된 장치 정보에 기초하여 적어도 하나의 스토리지 장치(200, 200-1~200-n), 또는 적어도 하나의 스토리지 장치(200, 200-1~200-n) 내의 적어도 하나의 데이터 저장 장치(2200)를 포함하는 스토리지 풀을 구성할 수 있다(S111).
스토리지 풀이 구성되면, 메인 스토리지 장치는 호스트(110)로 스토리지 풀 구성 정보를 전송할 수 있다(S113). 일 실시예에서, 스토리지 풀 구성 정보는 스토리지 풀 식별자, 스토리지 풀별 가상 머신 식별자, 각 가상 머신별 가상 주소, 메모리 자원을 제공하는 비휘발성 메모리 장치(2200-0 ~ 2200-L; 2200)들의 식별자 및 용량을 포함할 수 있다.
메인 스토리지 장치의 식별자와 물리 주소는, 스토리지 풀별 식별자, 각 스토리지 풀을 이루는 가상 머신 식별자, 메인 스토리지 장치에 생성된 가상 머신의 가상 주소와 맵핑되어 네트워크 스위치(121)에 등록될 수 있다.
호스트(110)는 각 스토리지 풀 식별자에 기초하여 스토리지 풀을 구분할 수 있다. 호스트(110)가 네트워크 스위치(121)를 통해 메인 스토리지 장치로 리퀘스트를 전송함에 따라, 메인 스토리지 장치가 서브 스토리지 장치와 협력하여 리퀘스트를 처리할 수 있다(S115).
일 실시예에서, 스토리지 시스템(1, 10, 100)은 신규 스토리지 장치가 추가되는지 모니터링할 수 있다(S117). 신규 스토리지 장치가 추가되는 경우(S117:Y), 신규 스토리지 장치를 호스트(110)에 등록하고 장치 정보를 공유하여 스토리지 풀을 구성하는 일련의 과정(S101~S113)이 수행될 수 있다. 신규 스토리지 장치가 추가되지 않는 경우(S117:N), 호스트(110)로부터 리퀘스트가 전송되는지 모니터링하고 처리할 수 있다(S115).
일 실시예에서, 추가된 스토리지 장치를 스토리지 풀에 편입시키지 않고 대기 상태로 관리하는 것도 가능하다.
일 실시예에서, 스토리지 장치(200)는 자신의 상태 모니터링을 통해 데이터의 분산이 필요한지 판단할 수 있다. 데이터 분산이 필요한 경우 스토리지 장치는 소스 스토리지 장치로 기능하여 타 스토리지 장치의 장치 정보에 기초하여 적어도 하나의 타겟 스토리지 장치를 선택할 수 있다. 소스 스토리지 장치는 분산할 데이터를 선택하고, 타겟 스토리지 장치로 분산 대상 데이터를 전송하고 분산한 데이터의 위치를 분산 데이터 관리 테이블에 저장할 수 있다.
도 9는 일 실시예에 의한 스토리지 시스템의 리퀘스트 처리 방법을 설명하기 위한 개념도이다.
호스트(110)가 메인 스토리지 장치(SD-a)에 생성된 가상 머신의 가상 주소 중 어느 하나로 리퀘스트 패킷(Req)을 전송함에 따라(①), 메인 스토리지 장치(SD-a)의 하이퍼바이저(2501)는 리퀘스트 패킷의 헤더부로부터 목적지 정보, 예를 들어 스토리지 풀 식별자 및 가상 주소를 추출할 수 있다.
아울러, 메인 스토리지 장치(SD-a)의 하이퍼바이저(2501)는 리퀘스트 패킷의 바디부로부터 논리 주소 및 커맨드를 추출하고, 추출된 논리 주소에 따라 맵 테이블(2507)을 조회하여 물리적 접근 정보를 획득할 수 있다(②). 일 실시예에서, 추출된 커맨드는 라이트 커맨드일 수 있다. 맵 테이블(2507)로부터 획득된 물리적 접근 정보는, 목적지로 설정된 스토리지 풀에 포함된 가상 머신의 가상 주소 및 이에 할당된 비휘발성 메모리 장치의 물리 주소일 수 있다. 아울러, 하이퍼바이저(2501)는 바디부로부터 추출한 라이트 데이터를 버퍼 메모리에 임시 저장할 수 있다(③).
일 실시예에서, 물리적 접근 정보가 리퀘스트 패킷을 수신한 메인 스토리지 장치의 제 1 가상 머신(VM1)에 할당된 비휘발성 메모리 장치의 물리 주소인 경우, 가상 머신(VM1)은 버퍼링된 라이트 데이터를 해당 스토리지 풀의 메모리 블럭(1)에 저장할 수 있다.
일 실시예에서, 물리적 접근 정보에 포함된 가상 주소가 서브 스토리지 장치(SD-b)의 제 1가상 머신(VM1)에 할당된 비휘발성 메모리 장치의 물리 주소인 경우, 메인 스토리지 장치(SD-a)의 제 1 가상 머신(VM1)은 버퍼링된 라이트 데이터를 서브 스토리지 장치(SD-b)의 하이퍼바이저(2501)로 전송하고(④), 서브 스토리지 장치(SD-b)의 제 1 가상 머신(VM1)은 메모리 블럭(5)에 데이터를 저장할 수 있다(⑤).
일 실시예에서, 물리적 접근 정보에 포함된 가상 주소가 서브 스토리지 장치(SD-c)의 제 2 가상 머신(VM2)에 할당된 비휘발성 메모리 장치의 물리 주소인 경우, 제 1 가상 머신(VM1)은 버퍼링된 라이트 데이터를 메인 스토리지 장치에 생성된 제 2 가상 머신(VM2)을 통해(⑥) 서브 스토리지 장치(SD-c)의 하이퍼바이저(2501)로 전송할 수 있다(⑦). 서브 스토리지 장치(SD-c)의 제 2 가상 머신(VM2)은 전달된 데이터를 메모리 블럭(F)에 저장할 수 있다(⑧).
도 10은 일 실시예에 의한 스토리지 시스템의 리퀘스트 처리 방법을 설명하기 위한 개념도이다.
호스트(110)가 메인 스토리지 장치(SD-a)에 생성된 가상 머신의 가상 주소 중 어느 하나로 리퀘스트 패킷(Req)을 전송함에 따라(ⓐ), 메인 스토리지 장치(SD-a)의 하이퍼바이저(2501)는 리퀘스트 패킷의 헤더부로부터 목적지 정보, 예를 들어 스토리지 풀 식별자 및 가상 주소를 추출할 수 있다. 아울러, 리퀘스트 패킷의 바디부로부터 논리 주소 및 커맨드를 추출하고, 추출된 논리 주소에 따라 맵 테이블(2507)을 조회하여 물리적 접근 정보를 획득할 수 있다(ⓑ). 일 실시예에서, 추출된 커맨드는 리드 커맨드일 수 있다.
맵 테이블(2507)로부터 획득된 물리적 접근 정보는, 목적지로 설정된 스토리지 풀에 포함된 가상 머신의 가상 주소 및 이에 할당된 비휘발성 메모리 장치의 물리 주소일 수 있다.
일 실시예에서, 물리적 접근 정보가 리퀘스트를 수신한 메인 스토리지 장치의 제 1 가상 머신(VM1)에 할당된 비휘발성 메모리 장치의 물리 주소인 경우, 제 1 가상 머신(VM1)은 메모리 블럭(1)으로부터 리드(ⓒ)한 데이터를 버퍼 메모리에 임시 저장(ⓓ)한 후 호스트로 전송할 수 있다(ⓔ).
일 실시예에서, 물리적 접근 정보에 포함된 가상 주소가 서브 스토리지 장치(SD-b)의 제 1 가상 머신(VM1)에 할당된 비휘발성 메모리 장치의 물리 주소인 경우, 메인 스토리지 장치(SD-a)의 제 1 가상 머신(VM1)은 서브 스토리지 장치(SD-b)의 하이퍼바이저(2501)로 리드 리퀘스트를 전송하고(ⓕ), 서브 스토리지 장치(SD-b)의 제 1 가상 머신(VM1)은 메모리 블럭(5)으로부터 리드(ⓖ)한 데이터를 하이퍼바이저(2501)를 통해 메인 스토리지 장치(SD-a)의 버퍼 메모리에 저장할 수 있다(ⓗ). 이에 따라 메인 스토리지 장치(SD-a)의 제 1 가상 머신(VM1)은 버퍼링된 리드 데이터를 호스트로 제공할 수 있다(ⓔ).
일 실시예에서, 물리적 접근 정보에 포함된 가상 주소가 서브 스토리지 장치(SD-c)의 가상 머신(VM2)에 할당된 비휘발성 메모리 장치의 물리 주소인 경우, 메인 스토리지 장치(SD-a)의 제 1 가상 머신(VM1)은 메인 스토리지 장치(SD-a)의 제 2 가상 머신(VM2)을 통해(ⓘ) 서브 스토리지 장치(SD-c)의 하이퍼바이저로 리드 리퀘스트를 전송할 수 있다(ⓙ).
서브 스토리지 장치(SD-c)의 하이퍼바이저(2501)는 물리적 접근 정보에 기초하여 메모리 블럭(E)으로부터 리드(ⓚ)한 데이터를 메인 스토리지 장치(SD-a)의 버퍼 메모리에 저장할 수 있다(ⓛ). 이에 따라 메인 스토리지 장치(SD-a)는 버퍼링된 리드 데이터를 호스트로 제공할 수 있다(ⓔ).
도 11은 일 실시예에 의한 데이터 저장 장치를 포함하는 네트워크 시스템의 구성도이다.
도 11을 참조하면, 네트워크 시스템(5000)은 네트워크(5500)를 통해서 연결된 서버 시스템(5300) 및 복수의 클라이언트 시스템들(5410~5430)을 포함할 수 있다.
서버 시스템(5300)은 복수의 클라이언트 시스템들(5410~5430)의 요청에 응답하여 데이터를 서비스할 수 있다. 예를 들면, 서버 시스템(5300)은 복수의 클라이언트 시스템들(5410~5430)로부터 제공된 데이터를 저장할 수 있다. 다른 예로서, 서버 시스템(5300)은 복수의 클라이언트 시스템들(5410~5430)로 데이터를 제공할 수 있다.
서버 시스템(5300)은 호스트 장치(5100) 및 메모리 시스템(5200)을 포함할 수 있다. 메모리 시스템(5200)은 도 1 내지 도 6에 도시한 스토리지 시스템(1, 10, 100)으로 구성될 수 있다.
본 기술에 의하면, 복수의 스토리지 장치들이 호스트 독립적으로 통합하여 가상화된 스토리지 풀을 구성할 수 있다. 스토리지 시스템에 추가되는 스토리지 장치 단위로 지속적인 확장성을 지원할 수 있다.
호스트는 네트워크에 연결된 모든 스토리지 장치를 관리할 필요 없이, 스토리지 풀 만을 관리하므로, 관리 자원을 최소화할 수 있다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
1, 10, 100 : 스토리지 시스템
120 : 스토리지 샤시
1200 : 스토리지 랙
200 : 스토리지 장치

Claims (18)

  1. 네트워크를 통해 적어도 하나의 호스트와 접속되며, 상기 네트워크에 연결됨에 따라 생성된 가상 머신에 의해 가상 네트워크를 구성하는 복수의 스토리지 장치를 포함하는 스토리지 시스템으로서,
    상기 스토리지 장치 각각은, 상기 가상 머신에 메모리 자원을 할당하고, 상기 가상 머신을 통해 상기 복수의 스토리지 장치의 장치 정보를 공유하며,
    상기 호스트가 메인 스토리지 장치를 선택하고 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함하는 스토리지 풀 생성 조건을 전송함에 따라, 상기 메인 스토리지 장치가 상기 가상 머신별 메모리 자원을 이용하여 상기 스토리지 풀 생성 조건을 만족하는 스토리지 풀을 구성하는 스토리지 시스템.
  2. 제 1 항에 있어서,
    상기 호스트는 상기 메인 스토리지 장치와 물리 네트워크 스위치를 통해 접속되고, 상기 복수의 스토리지 장치는 상기 가상 머신이 접속되는 가상 네트워크 스위치를 통해 접속되는 스토리지 시스템.
  3. 제 1 항에 있어서,
    상기 복수의 스토리지 장치 각각은 상기 스토리지 풀의 개수에 대응하는 수의 가상 머신을 생성하고, 상기 가상 머신에 고유의 가상 주소를 부여하도록 구성되는 스토리지 시스템.
  4. 제 3 항에 있어서,
    상기 호스트는 상기 메인 스토리지 장치에 생성된 가상 머신의 가상 주소를 이용하여 상기 스토리지 풀 각각에 접근하도록 구성되는 스토리지 시스템.
  5. 제 1 항에 있어서,
    상기 장치 정보는, 상기 스토리지 장치의 잔여 용량, 배드블럭 수, 온도, 수명을 포함하는 하드웨어 상태 및, 상기 스토리지 장치의 비지(Busy) 정도, 처리 중이거나 처리 대기 중인 리퀘스트 양, 요청되는 리퀘스트 패턴, 요청되는 데이터 패턴을 포함하는 소프트웨어 상태를 포함하는 스토리지 시스템.
  6. 제 1 항에 있어서,
    상기 스토리지 시스템은, 상기 복수의 스토리지 장치를 관리하는 베이스보드 관리 컨트롤러를 포함하고,
    상기 복수의 스토리지 장치 각각은 상기 스토리지 시스템에 연결됨에 따라 상기 베이스보드 관리 컨트롤러로 상기 장치 정보를 전송하도록 구성되는 스토리지 시스템.
  7. 네트워크를 통해 적어도 하나의 호스트와 접속되고, 컨트롤러 및 상기 컨트롤러의 제어에 따라 데이터를 기록 및 판독하는 데이터 저장 장치를 포함하는 스토리지 장치로서,
    상기 컨트롤러는,
    상기 스토리지 장치가 상기 네트워크를 통해 상기 호스트와 통신하도록 하는 네트워크 인터페이스;
    상기 네트워크 인터페이스의 통신 프로토콜과 상기 스토리지 장치 내부의 통신 프로토콜을 변환하는 컨버터;
    상기 컨트롤러와 상기 데이터 저장 장치 간의 통신 채널을 제공하는 스토리지 인터페이스; 및
    상기 스토리지 장치가 상기 네트워크에 연결됨에 따라 생성되는 적어도 하나의 가상 머신에 메모리 자원을 할당하고, 상기 가상 머신을 통해 상기 스토리지 장치의 장치 정보를 공유하며, 상기 가상 머신별 메모리 자원을 이용하여 상기 호스트가 요구하는 스토리지 풀의 개수 및 각 스토리지 풀 별 용량을 만족하는 스토리지 풀을 구성하는 스토리지 가상화부;
    를 포함하도록 구성되는 스토리지 장치.
  8. 제 7 항에 있어서,
    상기 스토리지 장치는 물리 네트워크 스위치를 통해 사익 호스트와 접속되고, 상기 가상 머신이 접속되는 가상 네트워크 스위치를 통해 타 스토리지 장치와 접속되는 스토리지 장치.
  9. 제 7 항에 있어서,
    상기 스토리지 장치는 상기 스토리지 풀의 개수에 대응하는 수의 가상 머신을 생성하고, 상기 가상 머신에 고유의 가상 주소를 부여하도록 구성되는 스토리지 장치.
  10. 제 9 항에 있어서,
    상기 가상 머신의 가상 주소를 이용하여 상기 호스트가 상기 스토리지 풀 각각에 접근하도록 구성되는 스토리지 장치.
  11. 제 7 항에 있어서,
    상기 장치 정보는, 상기 스토리지 장치의 잔여 용량, 배드블럭 수, 온도, 수명을 포함하는 하드웨어 상태 및, 상기 스토리지 장치의 비지(Busy) 정도, 처리 중이거나 처리 대기 중인 리퀘스트 양, 요청되는 리퀘스트 패턴, 요청되는 데이터 패턴을 포함하는 소프트웨어 상태를 포함하는 스토리지 장치.
  12. 제 7 항에 있어서,
    상기 스토리지 장치는 베이스보드 관리 컨트롤러와 접속되어, 상기 베이스보드 관리 컨트롤러로 장치 정보를 전송하도록 구성되는 스토리지 장치.
  13. 네트워크를 통해 적어도 하나의 호스트와 접속되는 복수의 스토리지 장치를 포함하는 스토리지 시스템의 동작 방법으로서,
    상기 스토리지 장치가 상기 네트워크에 연결됨에 따라 적어도 하나의 가상 머신을 생성하는 단계;
    상기 가상 머신에 의해 상기 복수의 스토리리 장치가 가상 네트워크를 구성하는 단계;
    상기 복수의 스토리지 장치 각각이 상기 가상 머신에 메모리 자원을 할당하는 단계;
    상기 가상 머신을 통해 상기 복수의 스토리지 장치의 장치 정보를 공유하는 단계; 및
    상기 호스트가 메인 스토리지 장치를 선택하고 스토리지 풀의 개수 및 각 스토리지 풀의 용량을 포함하는 스토리지 풀 생성 조건을 전송함에 따라, 상기 메인 스토리지 장치가 상기 가상 머신별 메모리 자원을 이용하여 상기 스토리지 풀 생성 조건을 만족하는 스토리지 풀을 구성하는 단계;
    를 포함하도록 구성되는 스토리지 시스템의 동작 방법.
  14. 제 13 항에 있어서,
    상기 메인 스토리지 장치는 물리 네트워크 스위치를 통해 상기 호스트와 접속되고, 상기 복수의 스토리지 장치는 상기 가상 머신이 접속되는 가상 네트워크 스위치를 통해 접속되는 스토리지 시스템의 동작 방법.
  15. 제 13 항에 있어서,
    상기 스토리지 풀을 구성하는 단계는,
    상기 복수의 스토리지 장치 각각이 상기 스토리지 풀의 개수에 대응하는 수의 가상 머신을 생성하는 단계; 및
    상기 복수의 스토리지 장치 각각이 상기 가상 머신에 고유의 가상 주소를 부여하는 단계;
    를 포함하도록 구성되는 스토리지 시스템의 동작 방법.
  16. 제 15 항에 있어서,
    상기 메인 스토리지 장치에 생성된 가상 머신의 가상 주소를 이용하여 상기 호스트가 상기 스토리지 풀 각각에 접근하는 단계를 더 포함하도록 구성되는 스토리지 시스템의 동작 방법.
  17. 제 13 항에 있어서,
    상기 장치 정보는, 상기 스토리지 장치의 잔여 용량, 배드블럭 수, 온도, 수명을 포함하는 하드웨어 상태 및, 상기 스토리지 장치의 비지(Busy) 정도, 처리 중이거나 처리 대기 중인 리퀘스트 양, 요청되는 리퀘스트 패턴, 요청되는 데이터 패턴을 포함하는 소프트웨어 상태를 포함하는 스토리지 시스템의 동작 방법.
  18. 제 13 항에 있어서,
    상기 스토리지 시스템은, 상기 복수의 스토리지 장치를 관리하는 베이스보드 관리 컨트롤러를 포함하고,
    상기 장치 정보를 공유하는 단계는, 상기 복수의 스토리지 장치 각각이 상기 스토리지 시스템에 연결됨에 따라 상기 베이스보드 관리 컨트롤러로 상기 장치 정보를 전송하는 단계를 포함하도록 구성되는 스토리지 시스템의 동작 방법.
KR1020200042028A 2020-04-07 2020-04-07 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법 KR20210124687A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020200042028A KR20210124687A (ko) 2020-04-07 2020-04-07 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법
US16/996,632 US11720389B2 (en) 2020-04-07 2020-08-18 Storage system configuring a storage pool according to shared information, storage device therefor, and operating method thereof
CN202011072082.2A CN113497747B (zh) 2020-04-07 2020-10-09 存储系统、其存储装置及其操作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200042028A KR20210124687A (ko) 2020-04-07 2020-04-07 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법

Publications (1)

Publication Number Publication Date
KR20210124687A true KR20210124687A (ko) 2021-10-15

Family

ID=77922518

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200042028A KR20210124687A (ko) 2020-04-07 2020-04-07 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법

Country Status (3)

Country Link
US (1) US11720389B2 (ko)
KR (1) KR20210124687A (ko)
CN (1) CN113497747B (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220318042A1 (en) * 2021-04-01 2022-10-06 RAMScaler, Inc. Distributed memory block device storage
WO2023184224A1 (en) * 2022-03-30 2023-10-05 Intel Corporation Techniques to utilize near memory compute circuitry for memory-bound workloads

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086424A (ja) * 2008-10-01 2010-04-15 Hitachi Ltd ストレージ装置の管理装置
US20120030306A1 (en) * 2009-04-28 2012-02-02 Nobuharu Kami Rapid movement system for virtual devices in a computing system, management device, and method and program therefor
TW201222246A (en) * 2010-11-30 2012-06-01 Inventec Corp Computer chassis system and hard disk status display method thereof
US8645659B1 (en) * 2010-12-01 2014-02-04 Infinidat Ltd. Method for managing volumes/snapshots in pools of external virtual memory
KR20120097136A (ko) 2011-02-24 2012-09-03 삼성전자주식회사 가상화 환경에서의 메모리 풀 관리
WO2013061375A1 (en) * 2011-10-27 2013-05-02 Hitachi, Ltd. Storage system and its management method
ES2608378T3 (es) * 2011-12-29 2017-04-10 Huawei Technologies Co., Ltd. Sistema y procedimiento de computación en la nube para gestionar recursos de almacenamiento asociados
WO2015123225A1 (en) 2014-02-11 2015-08-20 Atlantis Computing, Inc. Aggregating memory to create a network addressible storage volume for storing virtual machine files
US9600378B2 (en) * 2015-01-29 2017-03-21 Dell Products, Lp Efficient mechanism to replicate data for multiple controllers
US10282094B2 (en) 2017-03-31 2019-05-07 Samsung Electronics Co., Ltd. Method for aggregated NVME-over-fabrics ESSD
JP7007549B2 (ja) * 2017-05-19 2022-01-24 富士通株式会社 情報処理システム、管理装置、及び、情報処理システムの制御方法

Also Published As

Publication number Publication date
CN113497747A (zh) 2021-10-12
US20210311767A1 (en) 2021-10-07
US11720389B2 (en) 2023-08-08
CN113497747B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
US11663029B2 (en) Virtual machine storage controller selection in hyperconverged infrastructure environment and storage system
US10082972B2 (en) Method and system for pooling, partitioning, and sharing network storage resources
US11734137B2 (en) System, and control method and program for input/output requests for storage systems
US7730259B2 (en) Method, computer and system for managing a storage subsystem configuration
US7711896B2 (en) Storage system that is connected to external storage
JP5272709B2 (ja) アドレス割当方法、コンピュータ、物理マシン、プログラム、及びシステム
WO2017072933A1 (ja) 計算機システムの管理システム及び管理方法
WO2012147116A1 (en) Computer system and virtual machine control method
KR20140111589A (ko) 가상 기계들을 지원하는 플래시―기반 캐싱 해결책에서의 동적인 캐시 공유를 위한 시스템, 방법 및 컴퓨터―판독가능한 매체
US20170102874A1 (en) Computer system
JP2005165702A (ja) クラスタストレージのデバイス連結方法
WO2014006656A1 (en) Computer system, cache control method and computer program
JP2009075718A (ja) 仮想i/oパスの管理方法、情報処理システム及びプログラム
CN107924289A (zh) 计算机系统和访问控制方法
US20180203805A1 (en) Computer and memory region management method
JP5515157B2 (ja) I/oデバイス管理方法、及び計算機システム
KR20210124687A (ko) 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법
US20230051825A1 (en) System supporting virtualization of sr-iov capable devices
US11922072B2 (en) System supporting virtualization of SR-IOV capable devices
US20140289728A1 (en) Apparatus, system, method, and storage medium
JP6998419B2 (ja) 制御プログラム
KR20210077329A (ko) 스토리지 시스템, 이를 위한 스토리지 장치 및 동작 방법
JP7281528B2 (ja) 情報処理装置
JP6694007B2 (ja) 情報処理装置
CN117877541A (zh) 用于控制池化存储器装置或存储器扩展器的设备和方法

Legal Events

Date Code Title Description
A201 Request for examination