KR102428791B1 - 집적 회로 메모리의 패키지에 내장된 컨트롤러를 갖는 메모리 시스템 - Google Patents

집적 회로 메모리의 패키지에 내장된 컨트롤러를 갖는 메모리 시스템 Download PDF

Info

Publication number
KR102428791B1
KR102428791B1 KR1020207025384A KR20207025384A KR102428791B1 KR 102428791 B1 KR102428791 B1 KR 102428791B1 KR 1020207025384 A KR1020207025384 A KR 1020207025384A KR 20207025384 A KR20207025384 A KR 20207025384A KR 102428791 B1 KR102428791 B1 KR 102428791B1
Authority
KR
South Korea
Prior art keywords
memory
data
controller
integrated circuit
packets
Prior art date
Application number
KR1020207025384A
Other languages
English (en)
Other versions
KR20200108363A (ko
Inventor
사미르 미탈
구르프리트 아난드
잉 위 타이
청 위안 우
Original Assignee
마이크론 테크놀로지, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크론 테크놀로지, 인크. filed Critical 마이크론 테크놀로지, 인크.
Publication of KR20200108363A publication Critical patent/KR20200108363A/ko
Application granted granted Critical
Publication of KR102428791B1 publication Critical patent/KR102428791B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0658Controller construction arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • G06F13/1684Details of memory controller using multiple buses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4204Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus
    • G06F13/4234Bus transfer protocol, e.g. handshake; Synchronisation on a parallel bus being a memory bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4247Bus transfer protocol, e.g. handshake; Synchronisation on a daisy chain bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C16/00Erasable programmable read-only memories
    • G11C16/02Erasable programmable read-only memories electrically programmable
    • G11C16/06Auxiliary circuits, e.g. for writing into memory
    • G11C16/10Programming or data input circuits
    • G11C16/20Initialising; Data preset; Chip identification

Abstract

임베디드 매체 컨트롤러가 있는 메모리 컴포넌트를 갖는 컴퓨팅 시스템. 메모리 컴포넌트는 집적 회로(IC) 패키지 내에 캡슐화된다. IC 패키지 내의 임베디드 컨트롤러는, 컨트롤러의 직렬 통신 인터페이스를 통해, IC 패키지 외부의 직렬 연결로부터 인입(incoming) 패킷들을 수신하고; 인입 패킷들을 미리 결정된 직렬 통신 프로토콜에 따라 명령들 및 어드레스들로 변환시키고; 명령들 및 어드레스들에 따라 IC 패키지 내에 캡슐화된 메모리 유닛들을 동작시키고; 명령들의 적어도 일부의 결과들을 인출(outgoing) 패킷들로 변환시키고; 인출 패킷들을 직렬 통신 인터페이스를 통해 IC 패키지 외부의 직렬 연결로 전송하도록 구성된다.

Description

집적 회로 메모리의 패키지에 내장된 컨트롤러를 갖는 메모리 시스템
관련 출원들
본 출원은 2018년 10월 17일자로 출원된, "Memory Systems having Controllers Embedded in Packages of Integrated Circuit Memory"이라는 명칭의 미국 특허 출원 일련 번호 제16/162,905호, 및 2018년 2월 5일자로 출원된, "Architecture for Storage Devices using Embedded Media Controllers"이라는 명칭의 미국 임시 특허 출원 일련 번호 제62/626,527호의 출원일들의 이점을 주장하며, 이들 출원들의 전체 개시 내용들은 본원에 참조로서 통합된다.
기술 분야
본원에 개시된 적어도 일부 실시예들은 일반적으로 메모리 시스템에 관한 것으로, 보다 구체적으로는, 이에 제한되는 것은 아니나 집적 회로(IC) 메모리의 패키지에 임베디드된 컨트롤러를 갖는 메모리 시스템에 관한 것이다.
메모리 서브 시스템은 DIMM(dual in-line memory Module), SO-DIMM(small outline DIMM), 또는 NVDIMM(non-volatile dual in-line memory module)과 같은 메모리 모듈일 수 있다. 메모리 서브 시스템은 솔리드 스테이트 드라이브(SSD) 또는 하드 디스크 드라이브(HDD)와 같은 저장 시스템일 수 있다. 메모리 서브 시스템은 데이터를 저장하는 하나 이상의 메모리 컴포넌트들을 포함할 수 있다. 메모리 컴포넌트들은, 예를 들어, 비휘발성 메모리 컴포넌트들 및 휘발성 메모리 컴포넌트들일 수 있다. 메모리 컴포넌트들의 예들은 메모리 집적 회로(IC)들을 포함한다. 일부 메모리 집적 회로들은 휘발성이며 저장된 데이터를 유지하기 위해 전력을 필요로 한다. 일부 메모리 집적 회로들은 비휘발성이며 전력이 공급되지 않을 때에도 저장된 데이터를 유지할 수 있다. 비휘발성 메모리의 예들은 플래시 메모리, 읽기 전용 메모리(ROM), 프로그램 가능 읽기 전용 메모리(PROM), 소거 가능한 프로그램 가능 읽기 전용 메모리(EPROM) 및 전기적으로 소거 가능한 프로그램 가능 읽기 전용 메모리(EEPROM) 메모리 등을 포함한다. 휘발성 메모리의 예들은 동적 랜덤 액세스 메모리(DRAM) 및 정적 랜덤 액세스 메모리(SRAM)를 포함한다. 일반적으로, 호스트 시스템은 메모리 서브 시스템을 사용하여 메모리 컴포넌트들에 데이터를 저장하고 메모리 컴포넌트들로부터 데이터를 검색할 수 있다.
예를 들어, 컴퓨터는 호스트 시스템 및 호스트 시스템에 부착된 하나 이상의 메모리 서브 시스템들을 포함할 수 있다. 호스트 시스템은 데이터 및 인스트럭션들을 저장 및/또는 검색하기 위해 하나 이상의 메모리 서브 시스템들과 통신하는 중앙 처리 유닛(CPU)을 가질 수 있다. 컴퓨터에 대한 인스트럭션들은 운영 체제들, 장치 드라이버들 및 어플리케이션 프로그램들을 포함할 수 있다. 운영 체제는 컴퓨터의 리소스들을 관리하고, 그 리소스들의 메모리 할당 및 시간 공유와 같은 어플리케이션 프로그램들에 공통적인 서비스들을 제공한다. 장치 드라이버는 컴퓨터 내의 특정 유형의 장치들을 동작시키거나 제어하며; 운영 체제는 장치 드라이버를 사용하여 장치들의 유형에 의해 제공되는 리소스들 및/또는 서비스들을 제공한다. 컴퓨터 시스템의 중앙 처리 유닛(CPU)은 운영 체제와 장치 드라이버들을 실행하여 어플리케이션 프로그램들에 서비스들 및/또는 리소스들을 제공할 수 있다. 중앙 처리 유닛(CPU)은 서비스들 및/또는 리소스들을 사용하는 어플리케이션 프로그램을 실행할 수 있다. 예를 들어, 컴퓨터 시스템들의 어플리케이션들의 유형을 구현하는 어플리케이션 프로그램은 데이터를 메모리 서브 시스템의 메모리 컴포넌트들에 저장하고 메모리 컴포넌트들로부터 데이터를 검색하도록 중앙 처리 유닛(CPU)에 지시할 수 있다.
컴퓨터 시스템의 운영 체제는 어플리케이션 프로그램이 가상 메모리 어드레스를 사용하여 컴퓨터 시스템의 하나 이상의 메모리 서브 시스템들의 메모리 컴포넌트들에 데이터를 저장하거나 이로부터 데이터를 검색하게 할 수 있다. 운영 체제는 가상 어드레스들을 컴퓨터 시스템의 중앙 처리 유닛(CPU)에 연결된 하나 이상의 메모리 서브 시스템들의 물리적 어드레스들에 맵핑한다. 운영 체제는 메모리 서브 시스템의 물리적 어드레스를 사용하여 가상 어드레스들에 지정된 메모리 액세스들을 구현한다.
가상 어드레스 공간은 페이지들로 분할될 수 있다. 가상 메모리 페이지는 메모리 서브 시스템의 물리적 메모리 페이지에 맵핑될 수 있다. 운영 체제는 페이징 기술을 사용하여 메모리 모듈의 메모리의 페이지를 통해 저장 장치의 메모리의 페이지에 액세스할 수 있다. 서로 다른 시기에, 메모리 모듈의 동일한 메모리 페이지는 저장 장치 또는 컴퓨터 시스템의 다른 저장 장치의 다른 메모리 페이지에 액세스하기 위해 프록시로 사용될 수 있다.
컴퓨터 시스템은 가상 머신들을 생성하거나 프로비저닝하는 하이퍼바이저(또는 가상 머신 모니터)를 포함할 수 있다. 가상 머신은 컴퓨터 시스템에서 사용할 수 있는 리소스들과 서비스들을 사용하여 가상으로 구현되는 컴퓨팅 장치이다. 하이퍼바이저는 마치 가상 머신의 컴포넌트들이 전용 물리적 컴포넌트들인 것처럼 운영 체제에 대한 가상 머신을 나타낸다. 게스트 운영 체제는 컴퓨터 시스템에서 실행되는 호스트 운영 체제와 유사한 방식으로, 가상 머신에서 사용할 수 있는 리소스들과 서비스들을 관리하기 위해 가상 머신에서 실행된다. 하이퍼바이저는 다수의 가상 머신들이 컴퓨터 시스템의 리소스들을 공유할 수 있도록 하며, 가상 머신들이 실질적으로 서로 독립적으로 컴퓨터에서 동작할 수 있도록 한다.
실시예들은 예로서 도시되며, 유사한 참조 번호들이 유사한 요소들을 나타내는 첨부 도면들의 도면들에 제한되지 않는다.
도 1은 본 개시의 일부 실시예들에 따른 메모리 서브 시스템을 갖는 예시적인 컴퓨팅 시스템을 예시한다.
도 2는 본원에 개시된 적어도 일부 실시예들에 따른 데이터 액세스를 가속화하기 위해 상이한 계층의 메모리에 임베디드 컨트롤러들 및 데이터 스트림 분리기를 갖는 컴퓨팅 시스템을 도시한다.
도 3은 일 실시예에 따른 임베디드 컨트롤러를 갖는 메모리 컴포넌트를 예시한다.
도 4는 일 실시예에 따른 외부 컨트롤러에 개별적으로 연결되는 임베디드 컨트롤러들을 갖는 메모리 컴포넌트들을 예시한다.
도 5는 데이터 스트림 분리의 예를 예시한다.
도 6은 데이터 스트림 분리기를 갖는 시스템을 도시한다.
도 7은 예측 모델을 갖는 데이터 스트림 분리기의 구현예를 예시한다.
도 8은 임베디드 매체 컨트롤러를 갖는 메모리 서브 시스템의 방법을 도시한다.
도 9는 본 개시의 실시예들이 동작할 수 있는 예시적인 컴퓨터 시스템의 블록도이다.
본 개시의 적어도 일부 측면들은 집적 회로(IC) 메모리 내의 임베디드 매체 컨트롤러들을 갖는 메모리 서브 시스템에 관한 것이다. 메모리 서브 시스템은 이하에서 "메모리 디바이스"로도 지칭된다. 메모리 서브 시스템의 예로는 메모리 버스를 통해 중앙 처리 유닛(CPU)에 연결되는 메모리 모듈이 있다. 메모리 모듈들의 예들은 DIMM(Dual In-line Memory Module), SO-DIMM(Small Outline DIMM), NVDIMM(Non-Volatile Dual In-line Memory Module) 등을 포함한다. 메모리 서브 시스템의 다른 예로는 주변 장치 인터커넥트(예를 들어, 입력/출력 버스, 저장 영역 네트워크)를 통해 중앙 처리 유닛(CPU)에 연결되는 저장 장치가 있다. 저장 장치들의 예들은 솔리드 스테이트 드라이브(SSD), 플래시 드라이브, 범용 직렬 버스(USB) 플래시 드라이브 및 하드 디스크 드라이브(HDD)를 포함한다. 일부 실시예들에서, 메모리 서브 시스템은 메모리 기능들 및 저장 기능들 둘 다를 제공하는 하이브리드 메모리/저장 서브 시스템이다. 일반적으로, 호스트 시스템은 하나 이상의 메모리 컴포넌트들을 포함하는 메모리 서브 시스템을 이용할 수 있다. 호스트 시스템은 메모리 서브 시스템에 저장될 데이터를 제공할 수 있으며 메모리 서브 시스템에 검색될 데이터를 요청할 수 있다.
기존의 솔리드 스테이트 드라이브는 컨트롤러를 사용하여 집적 회로(IC)들의 형태로 구현되는 메모리의 동작들을 관리한다. 컨트롤러와 집적 회로 메모리 패키지들 사이의 미리 결정된 통신 구조는 이러한 메모리 서브 시스템의 확장 성을 제한한다.
본 개시의 적어도 일부 측면들은 집적 회로 메모리의 패키지들에 매체 컨트롤러들을 내장함으로써 상기 및 다른 결함들을 해결한다. 각 임베디드 매체 컨트롤러는 직렬 통신 연결을 사용하여 외부 컨트롤러와 통신하기 위한 직렬 통신 인터페이스를 갖도록 구성될 수 있다. 더 많은 집적 회로 메모리 패키지들이 메모리 용량을 늘리기 위해 메모리 서브 시스템에 추가될 경우, 더 많은 병렬 직렬 통신 연결들이 외부 컨트롤러와 IC 패키지들에 캡슐화된 집적 회로 메모리를 통해 구현된 메모리 풀(pool) 사이에 추가될 수 있다. 따라서, 외부 컨트롤러와 메모리 풀 사이의 통신 대역폭은 메모리 서브 시스템의 메모리 용량이 확장됨에 따라 증가할 수 있다. 매체 컨트롤러들은 외부 컨트롤러가 데이터 스트림 분리, 메모리의 전체 풀에 걸친 웨어 레벨링(wear leveling) 및/또는 메모리 풀에 걸친 분배형 플래시 변환 계층 동작(예를 들어, 논리 대 물리 어드레스 맵핑, 가비지(garbage) 수집 등)과 같은 어드밴스드 기능들을 구현할 수 있도록 한다.
도 1은 본 개시의 일부 실시예들에 따른 메모리 서브 시스템(110)을 갖는 예시적인 컴퓨팅 시스템(100)을 예시한다. 메모리 서브 시스템(110)은 메모리 컴포넌트들(109A 내지 109N)과 같은 매체를 포함할 수 있다. 메모리 컴포넌트들(109A 내지 109N)은 휘발성 메모리 컴포넌트들, 비휘발성 메모리 컴포넌트들 또는 이들의 조합일 수 있다. 일부 실시예들에서, 메모리 서브 시스템(110)은 메모리 모듈이다. 메모리 모듈의 예들로는 DIMM, NVDIMM 및 NVDIMM-P을 포함한다. 일부 실시예들에서, 메모리 서브 시스템은 저장 시스템이다. 저장 시스템의 예로는 SSD가 있다. 일부 실시예들에서, 메모리 서브 시스템(110)은 하이브리드 메모리/저장 서브 시스템이다. 일반적으로, 컴퓨팅 환경은 메모리 서브 시스템(110)을 사용하는 호스트 시스템(120)을 포함할 수 있다. 예를 들어, 호스트 시스템(120)은 데이터를 메모리 서브 시스템(110)에 기록하고 메모리 서브 시스템(110)으로부터 데이터를 판독할 수 있다.
호스트 장치(120)는 데스크탑 컴퓨터, 랩탑 컴퓨터, 네트워크 서버, 모바일 장치, 또는 메모리와 프로세싱 장치를 포함하는 이러한 컴퓨팅 장치와 같은 컴퓨팅 장치일 수 있다. 호스트 시스템(120)은 호스트 시스템(120)이 메모리 서브 시스템(110)로부터 데이터를 판독하거나 이에 데이터를 기록할 수 있도록 메모리 서브 시스템(110)을 포함하거나 이에 결합될 수 있다. 호스트 시스템(120)은 물리적 호스트 인터페이스를 통해 메모리 서브 시스템(110)에 결합될 수 있다. 본원에 사용된 바와 같이, "~에 결합된(coupled to)"은 일반적으로 전기적, 광학적, 자기적 등과 같은 연결들을 포함하여 유선이든 또는 무선이든, 간접 통신 연결 또는 (예를 들어, 중간 컴포넌트들이 없는) 직접 통신 연결일 수 있는, 컴포넌트들 사이의 연결을 지칭한다. 물리적 호스트 인터페이스의 예들은, 이에 제한되는 것은 아니나, SATA(serial advanced technology attachment) 인터페이스, PCIe(peripheral component interconnect express) 인터페이스, USB(universal serial bus) 인터페이스, 광섬유 채널, SAS(Serial Attached SCSI), DDR(double data rate) 메모리 버스 등을 포함한다. 물리적 호스트 인터페이스는 호스트 시스템(120)과 메모리 서브 시스템(110) 사이에서 데이터를 전송하는 데 사용될 수 있다. 호스트 시스템(120)은 메모리 서브 시스템(110)이 PCIe 인터페이스에 의해 호스트 시스템(120)과 결합되는 경우 NVMe(NVM Express) 인터페이스를 추가로 이용하여 메모리 컴포넌트들(109A 내지 109N)에 액세스할 수 있다. 물리적 호스트 인터페이스는 메모리 서브 시스템(110)과 호스트 시스템(120) 사이에서 제어, 어드레스, 데이터 및 다른 신호들을 전달하기 위한 인터페이스를 제공할 수 있다. 도 1은 예로서 메모리 서브 시스템(110)을 예시한다. 일반적으로, 호스트 시스템(120)은 동일한 통신 연결, 다수의 개별 통신 연결들 및/또는 통신 연결들의 조합을 통해 다수의 메모리 서브 시스템들에 액세스할 수 있다.
호스트 시스템(120)은 프로세싱 장치(118) 및 컨트롤러(116)를 포함한다. 호스트 시스템(120)의 프로세싱 장치(118)는 예를 들어, 마이크로프로세서, 중앙 처리 유닛(CPU), 프로세서의 프로세싱 코어, 실행 유닛 등일 수 있다. 일부 경우, 컨트롤러(116)는 메모리 컨트롤러, 메모리 관리 유닛 및/또는 이니시에이터(nitiator)로 지칭될 수 있다. 일 예에서, 컨트롤러(116)는 호스트 시스템(120)과 메모리 서브 시스템(110) 사이에 결합된 버스를 통한 통신들을 제어한다.
일반적으로, 컨트롤러(116)는 메모리 컴포넌트들(109A 내지 109N)에 대한 원하는 액세스를 위해 명령들 또는 요청들을 메모리 서브 시스템(110)에 전송할 수 있다. 컨트롤러(116)는 메모리 서브 시스템(110)과 통신하기 위한 인터페이스 회로부를 더 포함할 수 있다. 인터페이스 회로부는 메모리 서브 시스템(110)으로부터 수신된 응답들을 호스트 시스템(120)에 대한 정보로 변환할 수 있다.
호스트 시스템(120)의 컨트롤러(116)는 메모리 서브 시스템(110)의 컨트롤러(115)와 통신하여 메모리 컴포넌트들(109A 내지 109N)에서의 데이터 판독, 데이터 기록 또는 소거와 같은 동작들 및 다른 이러한 동작들을 수행할 수 있다. 일부 경우, 컨트롤러(116)는 프로세싱 장치(118)의 동일한 패키지 내에 통합된다. 다른 경우, 컨트롤러(116)는 프로세싱 장치(118)의 패키지로부터 분리된다. 컨트롤러(116) 및/또는 프로세싱 장치(118)는 하나 이상의 집적 회로(IC)들 및/또는 개별 컴포넌트들, 버퍼 메모리, 캐시 메모리 또는 이들의 조합과 같은 하드웨어를 포함할 수 있다. 컨트롤러(116) 및/또는 프로세싱 장치(118)는 마이크로컨트롤러, 특수 목적 논리 회로부(예를 들어, 필드 프로그램 가능 게이트 어레이(field programmable gate array; FPGA), 어플리케이션별 집적 회로(application specific integrated circuit; ASIC) 등), 또는 다른 적절한 프로세서일 수 있다.
메모리 컴포넌트들(109A 내지 109N)은 상이한 유형의 비휘발성 메모리 컴포넌트들 및/또는 휘발성 메모리 컴포넌트들의 임의의 조합을 포함할 수 있다. 비휘발성 메모리 컴포넌트들의 예는 NAND(negative-and)형 플래시 메모리를 포함한다. 메모리 컴포넌트들(109A 내지 109N) 각각은 단일 레벨 셀(single level cells; SLC)들 또는 다중 레벨 셀(multi-level cells; MLC)들(예를 들어, 트리플 레벨 셀(triple level cells; TLC)들 또는 쿼드 레벨 셀(quad-level cells; QLC)들)과 같은 하나 이상의 메모리 셀 어레이들을 포함할 수 있다. 일부 실시예들에서, 특정 메모리 컴포넌트는 메모리 셀의 SLC 부분 및 MLC 부분 둘 다를 포함할 수 있다. 메모리 셀 각각은 호스트 시스템(120)에 의해 사용된 하나 이상의 데이터 비트들(예를 들어, 데이터 블록들)을 저장할 수 있다. NAND형 플래시 메모리와 같은 비휘발성 메모리 컴포넌트들이 설명되어 있지만, 메모리 컴포넌트들(109A 내지 109N)은 휘발성 메모리와 같은 임의의 다른 유형의 메모리에 기초할 수 있다. 일부 실시예들에서, 메모리 컴포넌트들(109A 내지 109N)은, 이에 제한되는 것은 아니나, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 동적 랜덤 액세스 메모리(DRAM), 동기식 동적 랜덤 액세스 메모리(SDRAM), 위상 변화 메모리(PCM), 자기 랜덤 액세스 메모리(MRAM), 스핀 전송 토크(STT)-MRAM, 강유전성 랜덤 액세스 메모리(FeTRAM), 강유전성 RAM (FeRAM), 전도성 브리징 RAM(CBRAM), 저항성 랜덤 액세스 메모리(RRAM), OxRAM(Oxide-based RRAM), NOR(Negative-or) 플래시 메모리, 전기적으로 소거 가능한 프로그램 가능 읽기 전용 메모리(EEPROM), 나노 와이어 기반 비휘발성 메모리, 멤리스터 기술을 통합한 메모리 및 비휘발성 메모리 셀들의 교차점 어레이일 수 있다. 비휘발성 메모리의 교차점 어레이는 스택 가능한 크로스 그리드 데이터 액세스 어레이(stackable cross-gridded data access array)와 함께 벌크 저항의 변화에 기초하여 비트 저장(bit storage)을 수행할 수 있다. 추가로, 많은 플래시 기반 메모리들과 달리, 교차점 비휘발성 메모리는 제자리에 기록(write in-place) 동작을 수행할 수 있으며, 여기서 비휘발성 메모리 셀은 비휘발성 메모리 셀이 미리 소거되지 않고 프로그래밍될 수 있다. 게다가, 메모리 컴포넌트들(109A 내지 109N)의 메모리 셀들은 데이터를 저장하는데 사용되는 메모리 컴포넌트의 단위를 지칭할 수 있는 메모리 페이지들 또는 데이터 블록들로서 그룹화될 수 있다.
메모리 서브 시스템(110)의 컨트롤러(115)는 메모리 컴포넌트들(109A 내지 109N)과 통신하여 데이터 판독, 데이터 기록, 또는 메모리 컴포넌트들(109A 내지 109N)에서의 데이터 소거와 같은 동작들 및 다른 이러한 동작들(예를 들어, 컨트롤러(116)에 의해 명령 버스 상에서 스케줄링된 명령들에 응답하는)을 수행할 수 있다. 컨트롤러(115)는 하나 이상의 집적 회로(IC)들 및/또는 개별 컴포넌트들, 버퍼 메모리 또는 이들의 조합과 같은 하드웨어를 포함할 수 있다. 컨트롤러(115)는, 마이크로컨트롤러, 특수 목적 논리 회로부(예를 들어, 필드 프로그램 가능 게이트 어레이(FPGA), 어플리케이션별 집적 회로(ASIC) 등), 또는 다른 적절한 프로세서일 수 있다. 컨트롤러(115)는 로컬 메모리(119)에 저장된 인스트럭션들을 실행하도록 구성된 프로세싱 장치(117)(프로세서)를 포함할 수 있다. 예시된 예에서, 컨트롤러(115)의 로컬 메모리(119)는 메모리 서브 시스템(110)과 호스트 시스템(120) 간의 통신들을 처리하는 것을 포함하여, 메모리 서브 시스템(110)의 동작을 제어하는 다양한 프로세스들, 동작들, 논리 흐름들 및 루틴들을 수행하기 위한 인스트럭션들을 저장하도록 구성된 임베디드된 메모리를 포함한다. 일부 실시예들에서, 로컬 메모리(119)는 메모리 포인터, 페치 데이터(fetched data) 등을 저장하는 메모리 레지스터들을 포함할 수 있다. 로컬 메모리(119)는 또한 마이크로-코드를 저장하기 위한 읽기 전용 메모리(ROM)를 포함할 수 있다. 도 1의 예시적인 메모리 서브 시스템(110)은 컨트롤러(115)를 포함하는 것으로 예시되어 있지만, 본 개시의 다른 실시예에서, 메모리 서브 시스템(110)은 컨트롤러(115)를 포함하지 않을 수 있으며, 대신 (예를 들어, 외부 호스트에 의해 또는 메모리 서브 시스템으로부터 분리된 프로세서나 컨트롤러에 의해 제공된) 외부 제어에 의존할 수 있다.
일반적으로, 컨트롤러(115)는 호스트 시스템(120)으로부터 명령들 또는 동작들을 수신할 수 있으며, 메모리 컴포넌트들(109A 내지 109N)에 대한 원하는 액세스를 달성하기 위해 명령들 또는 동작들을 인스트럭션들 또는 적절한 명령들로 변환할 수 있다. 컨트롤러(115)는 웨어 레벨링(wear leveling) 동작들, 가비지 수집 동작들, 에러 검출 및 에러 정정 코드(error-correcting code; ECC) 동작들, 암호화 동작들, 캐싱 동작들 및 메모리 컴포넌트들(109A 내지 109N)과 관련되는 논리 블록 어드레스와 물리 블록 어드레스 간의 어드레스 변환들과 같은 다른 동작들을 담당할 수 있다. 컨트롤러(115)는 물리적 호스트 인터페이스를 통해 호스트 시스템(120)과 통신하기 위한 호스트 인터페이스 회로부를 더 포함할 수 있다. 호스트 인터페이스 회로부는 메모리 컴포넌트들(109A 내지 109N)과 연관된 응답들을 호스트 시스템(120)에 대한 정보로 변환할 뿐만 아니라, 호스트 시스템으로부터 수신된 명령들을 메모리 컴포넌트들(109A 내지 109N)에 액세스하기 위한 명령 인스트럭션들로 변환할 수 있다.
메모리 서브 시스템(110)은 또한 예시되지 않은 추가 회로부 또는 컴포넌트들을 포함할 수 있다. 일부 실시예들에서, 메모리 서브 시스템(110)은 컨트롤러(115)로부터 어드레스를 수신하고 메모리 컴포넌트들(109A 내지 109N)에 액세스하기 위해 어드레스를 디코딩할 수 있는 캐시나 버퍼(예를 들어, DRAM) 및 어드레스 회로부(예를 들어, 행 디코더 또는 열 디코더)를 포함할 수 있다.
메모리 컴포넌트들(109A, ..., 119N)은 개별 통신 연결들(441, ..., 443)을 통해 컨트롤러(115)와 통신하는 임베디드 컨트롤러들(104)을 가질 수 있다. 메모리 컴포넌트들(109A, ..., 119N)과 컨트롤러(115) 사이의 개별 연결들(441, ..., 443)은 병행하여 동작할 수 있으며, 따라서 메모리 컴포넌트들(109A, ..., 119N) 전체와 컨트롤러(115) 사이의 통신 대역폭을 증가시킬 수 있다.
예를 들어, 각 임베디드 컨트롤러(104)는 직렬 연결(441, ..., 또는 443)을 통해 컨트롤러(115)와 통신할 수 있다. 직렬 연결(441, ..., 또는 443)은 미리 정의된 통신 표준에 따라 동작할 수 있다. 예를 들어, 직렬 연결(441, ..., 또는 443)은 PCIe(peripheral component interconnect express), SATA(serial advanced technology attachment), USB(universal serial bus), 또는 인터라켄(Interlaken) 등의 표준에 따를 수 있다.
컨트롤러(115)는 직렬 연결들 및/또는 직렬 버스들의 네트워크를 통해 연결되는 (예를 들어, 도 2에 예시된 바와 같은) 연결된 컨트롤러들의 계층을 통해 선택적으로 구현될 수 있다. 예를 들어, 컨트롤러(115)를 구현하는 계층의 하위 계층에서, 컨트롤러 세트는 각각 임베디드 컨트롤러들(104)에 대한 병렬 직렬 연결들(441, ..., 443)을 가질 수 있다.
컨트롤러(115)는, 호스트 시스템(120)으로부터의 데이터 액세스 요청들의 스트림으로부터, 전체적으로 컴퓨터 시스템의 데이터 액세스 속도를 향상시키기 위해 성능 특성들에 따라 메모리 컴포넌트들(109A 내지 109N)에 적합한 개별 데이터 스트림들을 생성할 수 있는 데이터 스트림 분리기(113)를 포함할 수 있다. 일부 실시예들에서, 메모리 서브 시스템(110)의 컨트롤러(115)는 데이터 스트림 분리기(113)의 적어도 일부를 포함한다. 다른 실시예들에서, 또는 조합에서, 호스트 시스템(120)의 컨트롤러(116) 및/또는 프로세싱 장치(118)는 데이터 스트림 분리기(113)의 적어도 일부를 포함한다. 예를 들어, 컨트롤러(115), 컨트롤러(116) 및/또는 프로세싱 장치(118)는 데이터 스트림 분리기(113)를 구현하는 논리 회로부를 포함할 수 있다. 예를 들어, 호스트 시스템(120)의 컨트롤러(115) 또는 프로세싱 장치(118)(프로세서)는 본원에 설명된 데이터 스트림 분리기(113)의 동작들을 수행하기 위해 메모리에 저장된 인스트럭션들을 실행하도록 구성될 수 있다. 일부 실시예들에서, 데이터 스트림 분리기(113)는 메모리 서브 시스템(110)에 배치된 집적 회로에 구현된다. 다른 실시예들에서, 데이터 스트림 분리기(113)는 호스트 시스템(120)의 운영 체제, 장치 드라이버 또는 어플리케이션의 일부이다.
데이터 스트림 분리기(113)는 호스트 시스템(120)으로부터의 데이터 액세스 요청들을 재구성 및 서비스할 수 있다. 호스트 시스템(120)과 데이터 스트림 분리기(113) 간 혼합된 데이터 스트림은 상이한 유형들의 메모리 컴포넌트들(109A 내지 109N)을 대상으로 하는 상이한 데이터 스트림들로 분리될 수 있다. 예를 들어, 랜덤 액세스가 빈번한 데이터는 빠른 메모리 컴포넌트(예: 109A)로 재배치되고/되거나 캐싱될 수 있으며; 순차적 액세스가 빈번한 데이터는 빠른 메모리 컴포넌트를 거치지 않고 느린 메모리 컴포넌트(예: 109N)에서 동작될 수 있다. 데이터 스트림 분리는 더 빠른 메모리(예: 109A) 및 더 느린 메모리 (예: 109N)와 같이, 최근 데이터 액세스 패턴 및/또는 상이한 계층들의 메모리들에 걸쳐 예측된 데이터 사용 및 데이터 이동에 기초하여 수행될 수 있다. 어플리케이션들은 시퀀스들의 특정 데이터에 액세스할 수 있으며; 특정 오브젝트들이 함께 사용될 수 있다. 따라서, 사용자 계정, 어플리케이션, 가상 시스템에서의 데이터 아이템의 사용은, 오브젝트의 일부로서, 다른 관련 데이터 아이템의 후속 사용의 표시일 수 있다. 데이터 스트림 분리기(113)는 전체 성능을 개선하기 위해 상이한 데이터 스트림들이 각각의 물리적 저장 위치들로 각각 보내질 수 있도록, 메모리 서브 시스템(110) 내의 데이터 아이템들의 물리적 저장 위치들을 재 배열하도록 컨트롤러(115)에 지시할 수 있다. 데이터 스트림 분리기(113)는 데이터 분리 시 데이터 사용 및/또는 이동을 예측하기 위해 선택적으로 인공 신경망을 사용할 수 있으며; 인공 신경망은 초기에 이력 데이터 액세스 기록들을 사용하여 오프라인으로 트레이닝된 다음, 실시간 데이터 액세스 기록들을 사용하여 실시간 사용으로 지속적으로 트레이닝될 수 있다. 데이터 스트림 분리기(113)의 동작들에 관한 추가 세부 사항이 아래에 설명된다.
예를 들어, 호스트 시스템(120)으로부터의 기록 요청들의 혼합된 스트림으로부터, 데이터 스트림 분리기(113)는 순차적 기록 동작들의 스트림을 식별할 수 있다. 예를 들어, 기록 동작들의 어드레스들은 어드레스들에 의해 식별되는 메모리 유닛들에서 동작하기 위한 물리적 어드레스 공간으로 추가 변환될 수 있는 논리 주소 공간에 있을 수 있다. 기록 동작들이 논리 주소 공간에서 순차적인 어드레스들을 지정할 때, 데이터 스트림 분리기(113)는 연속적인 물리적 메모리 세트를 할당하여 데이터를 순차적으로 저장할 수 있다.
예를 들어, 데이터 스트림 분리기(113)는 기록 동작들의 완료가 호스트 시스템(120)의 성능에 직접적인 영향을 미치지 않는 느린 메모리(예: 109N)에 데이터의 물리적 저장 위치를 맵핑할 수 있다.
예를 들어, 호스트 시스템(120)으로부터의 기록 요청들의 혼합된 스트림으로부터, 데이터 스트림 분리기(113)는 데이터가 또한 자주 사용되는 랜덤 기록 동작들의 스트림을 식별할 수 있다. 데이터 스트림 분리기(113)는 데이터 액세스 시간이 호스트 시스템(120)에 대해 감소될 수 있도록 데이터의 물리적 저장 위치를 빠른 메모리(예: 109A)에 맵핑할 수 있다. 데이터가 더 이상 자주 사용되지 않도록 호스트 시스템(120)에서의 계산 활동들이 변경되는 경우, 데이터 스트림 분리기(113)는 데이터의 물리적 저장 위치를 느린 메모리(예: 109N)에 재맵핑할 수 있으며, 이에 따라 데이터에 대해 이전에 사용된 더 빠른 메모리(예: 109A)의 일부가 가장 최근 기간에 자주 사용되는(또는 후속 기간에 자주 사용될 것으로 예측되는) 다른 데이터에 의해 사용되도록 데이터가 해제되도록 할 수 있다.
예를 들어, 호스트 시스템(120)으로부터의 기록 요청들의 혼합된 스트림으로부터, 데이터 스트림 분리기(113)는 랜덤 기록 동작들의 스트림을 식별하고, 병합(coalescing) 및/또는 직렬화(serialization)를 위해 빠른 메모리(예: 109A)에 데이터를 캐싱하며, 데이터를 느린 메모리(예: 109N)로 저장하도록 순차적 기록 동작들을 생성할 수 있다. 느린 메모리가 반복적인 기록/소거 동작들에 대한 제한적 내구성을 갖는 경우, 느린 메모리(예: 109N)의 수명을 향상시키도록 설계된 빈도에 따라 느린 메모리(예: 109N)로의 데이터의 저장이 수행될 수 있다.
데이터 스트림 분리기(113)는 사용 빈도에 기초하여 데이터 그룹들을 식별하고 분류할 수 있다. 예를 들어, 제1 임계값을 초과하는 빈도로 액세스되는 데이터는 핫(hot) 데이터로 분류될 수 있으며, 가장 빠른 액세스 속도를 갖는 상위 계층 메모리(예: 109A)에 저장되도록 구성될 수 있다. 제2 임계값 미만의 빈도로 액세스되는 데이터는 콜드(cold) 데이터로 분류될 수 있으며, 가장 느린 액세스 속도를 갖는 하위 계층 메모리(예: 109N)에 저장되도록 구성될 수 있다. 제1 및 제2 임계값들 사이의 빈도로 액세스되는 데이터는 웜(warm) 데이터로 분류될 수 있으며, 상위 계층보다 느리지만 하위 계층보다 빠른 중간 계층 메모리에 저장되도록 구성될 수 있다. 예를 들어, 상위 계층은 반복되는 기록/소거 동작들에 대한 내구성 문제없이 고성능 랜덤 액세스를 지원할 수 있는 DRAM 또는 교차점 메모리를 사용하여 구현될 수 있고; 중간 계층은 단일 레벨 셀(SLC) NAND 플래시 메모리를 사용하여 구현될 수 있으며; 제3 계층은 트리플 레벨 셀(TLC) 또는 쿼드 레벨 셀(QLC) NAND 플래시 메모리를 사용하여 구현될 수 있다. SLC 플래시 메모리는 DRAM 또는 교차점 메모리보다 저렴하지만 TLC 또는 QLC 플래시 메모리보다 비쌀 수 있으며; SLC 플래시 메모리는 TLC 또는 QLC 플래시 메모리보다 더 나은 성능과 적은 내구성 문제를 가질 수 있다. 데이터 스트림 분리는 전체적으로 메모리 시스템의 액세스 성능이 상위 또는 중간 계층 메모리의 성능에 도달하는 동시에, 비용을 하위 계층 메모리의 비용으로 절감할 수 있게 개선되도록 한다.
일부 경우에, 상위 계층 메모리는 정원 장애 시 DRAM 내의 콘텐트가 교차점 메모리에 저장될 수 있는 DRAM과 교차점 메모리의 조합이다. 따라서, DRAM 및 교차점 메모리의 조합은 비휘발성 메모리로 기능할 수 있다.
데이터 스트림 분리기(113)는 사용 빈도뿐만 아니라, 데이터 액세스가 스트리밍되는지의 여부, 데이터 액세스가 순차적인지 랜덤인지의 여부, 워크로드가 동기식인지 동시 발생식인지의 여부, 데이터 액세스의 서비스 품질(QoS) 우선순위, 데이터 액세스가 판독인지 기록인지의 여부, 입력/출력 크기, 원자성(atomicity), 휘발성, 액세스 패턴 등과 같은 데이터 스트림들의 다양한 속성들을 식별하는 워크로드 힌트들 및/또는 태그들에 기초하여 데이터 스트림을 분리하도록 구성될 수 있다. 데이터 워크로드 힌트들 및/또는 태그들에 기초하여, 컨트롤러(115)는 액세스된 데이터의 위치, 메모리 서브 시스템(110)에서의 데이터 배치(예를 들어, 데이터 액세스 빈도에 기초함), 메모리 서브 시스템(110) 내에서 계층화된 데이터 캐싱 수행, 비-차단(non-blocking) 기록 스트림 구성 등을 결정한다.
워크로드 힌트들 및/또는 태그들은 호스트 시스템(120)에서 실행되는 메모리 서브 시스템(110)의 장치 드라이버를 통해 제공될 수 있다. 장치 드라이브의 일부 세부사항들 및 예들은 2018년 8월 3일자로 출원된, "Memory Virtualization for Accessing Heterogeneous Memory Components"이라는 명칭의 미국 특허 출원 일련 번호 제16/054,719호에서 찾아볼 수 있다.
선택적으로, TCL/QLC NAND 메모리를 사용하여 구현된 메모리 계층에 대한 기록 액세스는 처음에 메모리의 내구성 및 메모리의 원하는 액세스/변경 빈도에 따라 커스터마이징되는 정의된 속성들을 갖는 기록 스트림들로 변환하기 위해 상위 계층 메모리에 캐싱될 수 있다. 상위 계층을 사용하여 기록 스트림을 캐싱하고 재구성하는 것은 기록 증폭을 줄이고, 기록 동작들에 의해 야기되는 판독 동작들의 차단/지연을 제거하여, 기록 동작들보다 판독 동작들의 우선순위화를 허용하고, 워크 로드 요구사항들에 대한 메모리 매체 기능의 공동 최적화를 허용할 수 있다. 순차적 기록 동작들을 TCL/QLC NAND 메모리로 스트리밍하는 것은 메모리의 단편화(fragmentation)를 줄이거나 제거할 수 있다.
데이터 스트림 분리기(113)는 다양한 특성화에 기초하여 데이터 스트림을 식별하여 메모리 시스템에서 데이터 저장의 시퀀스, 타이밍 및/또는 위치의 관리에 대한 인텔리전트한 의사결정을 가능하게 할 수 있다. 예를 들어, 데이터 스트림은 판독 및 기록 액세스를 위한 상이한 레이턴시 및/또는 데이터 액세스에 대한 내구성을 갖는 서로 다른 유형의 메모리 중에서 메모리 유형에 적합한 것으로 식별 및 구성된다.
호스트 시스템(120)으로부터 들어오는 데이터 스트림은 의도되거나, 예상되거나 또는 기대된 데이터의 향후 사용을 나타내는, 데이터에 대한 정보(예를 들어, 태그들, 속성들, 힌트들)를 포함할 수 있다. 예를 들어, 정보 또는 힌트들은 메타데이터 또는 속성 태그들, QoS(quality of service) 파라미터들, 우선순위 파라미터들 등을 포함할 수 있다. 컨트롤러는 저장 매체 성능 및 데이터 스트림들의 특성들에 따라 데이터 목적지의 우선 순위를 지정할 수 있다.
일반적으로, 다른 카테고리들 또는 스트림들로의 데이터의 분리는 데이터의 특성(예를 들어, 스트리밍, 순차적 대 랜덤, 워크로드 유형 및/또는 데이터에 대한 향후 성능 요구들을 예측하는 데 사용될 수 있는 기타 데이터 속성들)에 대해 호스트 시스템(120)에 의해 제공되거나, 이로부터 수집되거나, 또는 이에 요청되는 특성들 및/또는 다른 정보에 기초하여 수행될 수 있다.
일 예에서, 데이터 스트림 분리기(113)는 컨트롤러(115)의 제어 하에서 하나 이상의 메모리 시스템들에 제공된 적어도 두 개의 메모리 세트들을 갖는다. 예를 들어, 한 메모리 세트는 다른 메모리 세트보다 더 느릴 수 있으며; 컨트롤러(115)는 마치 메모리 서브 시스템(110)에 단일의 균일한 메모리 세트가 있는 것처럼 두 개의 메모리 세트들의 용량을 CPU에 제시한다. 컨트롤러(115) 및/또는 데이터 스트림 분리기(113)는 호스트 시스템(120)으로부터의 메모리 세트들의 차이를 쉴드할 수 있다. 예를 들어, 컨트롤러(115)는 메모리 서브 시스템(110)의 메모리 유닛을 메모리 컴포넌트(예를 들어, 109A 또는 109N)의 물리적 어드레스로 어드레싱하기 위해 호스트 시스템(120)에 의해 사용되는 메모리 어드레스를 재맵핑할 수 있으며; 맵핑은 데이터가 데이터 스트림 분리기(113)에 의해 식별된 현재 데이터 스트림에 적합한 위치에서 물리적으로 호스팅될 수 있도록 조정될 수 있다.
선택적으로, 더 빠른 메모리(예: 109A)가 더 느린 메모리(예: 109B)의 캐시로 사용될 수 있으며, 더 빠른 메모리에 저장된 데이터는 더 느린 메모리에 대응되는 사본을 갖는다. 더 빠른 메모리가 변경되면, 더 느린 메모리에 대응되는 사본은 쓸모 없게 된다. 더 빠른 메모리의 변경된 콘텐트는 업데이트를 위해 더 느린 메모리로 플러시(flushed)되어야 한다.
대안으로, 더 느린 메모리의 콘텐트는 일부 경우 더 빠른 메모리를 거치지 않고 액세스될 수 있으며; 더 빠른 메모리의 콘텐트는 더 느린 메모리에 대응되는 사본을 가질 수 없다. 더 느린 메모리와 더 빠른 메모리의 콘텐츠 분배는 현재 워크로드의 운영 성능을 최적화하기 위해 동적으로 변경될 수 있다. 이러한 상황에서, 더 빠른 메모리는 여전히 캐시 히트율의 추적을 위해 캐시로 간주될 수 있다. 예를 들어, 액세스 중인 데이터 아이템이 더 빠른 메모리에서 서비스되는 경우, 캐시 히트가 카운팅되며; 액세스 중인 데이터 아이템이 더 느린 메모리에서 서비스되는 경우, 캐시 미스가 카운팅된다. 따라서, 캐시 히트율은 더 빠른 메모리가 더 느린 메모리의 캐시로 구성되지 않은 경우에도 성능 모니터링 및/또는 데이터 사용 예측을 위해 추적될 수 있다.
일부 경우, 메모리 버추얼라이저(memory virtualizer)는 서로 다른 계층들의 메모리들에 대한 메모리 액세스를 가상화하여 어플리케이션들 및/또는 가상 머신들과 메모리 컴포넌트들(109A 내지 109N)과의 차이를 쉴드(shield)하기 위해 메모리 컴포넌트의 장치 드라이버에서 구현될 수 있다. 메모리 버추얼라이저는 컴퓨팅 시스템의 성능을 최적화하기 위해 서로 다른 계층들의 메모리들에 걸쳐 데이터 저장 위치들을 자동으로 조정한다. 메모리 버추얼라이저들의 일부 세부사항들 및 예들은 2018년 8월 3일자로 출원된, "Memory Virtualization for Accessing Heterogeneous Memory Components"이라는 명칭의 미국 특허 출원 일련 번호 제16/054,719호에서 찾아볼 수 있다.
액세스 중인 데이터 아이템이 더 느린 메모리 세트에 있지만 더 빠른 메모리 세트에 있지 않은 경우, 데이터 아이템은 더 느린 메모리 세트에서 직접 액세스되거나, 더 빠른 메모리 세트에 액세스하기 위해 더 빠른 메모리 세트로 스와핑되거나, 더 빠른 메모리 세트에 캐시될 수 있다. 데이터 아이템에 액세스하는 워크로드가 데이터 스트림 분리기(113)에 의해 예측되는 경우, 데이터 스트림 분리기(113)는 데이터 액세스 전에 데이터 아이템을 더 빠른 메모리 세트로 스와핑하거나 데이터 아이템을 더 빠른 메모리 세트에 캐시하도록 컨트롤러(115)에 지시한다. 데이터 이동이 워크로드 예측에 따라 수행된 후, 데이터 아이템이 액세스될 때 데이터 액세스는 더 빠른 메모리 세트로부터 서비스될 수 있다. 데이터 액세스가 더 빠른 메모리 세트로부터 서비스되기 때문에, 데이터 액세스를 완료하는 시간은 더 느린 메모리 세트로부터 서비스되거나, 서비스를 위해 더 빠른 메모리 세트로 스와핑되거나, 캐싱한 다음 서비스하기 위해 더 느린 메모리 세트로부터 더 빠른 메모리 세트로 데이터를 로딩하는 것보다 더 짧다.
예를 들어, 액세스 중인 가상 메모리의 페이지가 현재 더 느린 메모리 세트에는 있지만 더 빠른 메모리 세트에는 없는 경우, 페이지는 더 느린 메모리 세트에서 페이지를 서비스하기 위해 더 빠른 메모리 세트로부터 할당될 수 있으며; 페이지의 데이터는 더 느린 메모리 세트로부터 페치되고 더 빠른 메모리 세트의 할당된 페이지에 저장되어, 가상 메모리의 페이지의 데이터 액세스가 후속 동작들에서 더 빠른 메모리 세트의 할당된 페이지에 액세스하는 것을 통해 이루어질 수 있도록 한다.
일부 경우, 페이지 스와핑은 더 느린 메모리에서 단순히 요청된 데이터 요소에 액세스하는 것보다 더 오랜 시간이 걸린다. 따라서, 요청된 데이터 요소는 요청자에게 먼저 서비스되며, 페이지 스와핑은 핫 페이지의 데이터 요소들에 대한 후속 액세스 속도를 높이기 위해 수행된다. 따라서, 전반적인 성능은 페이지 스왑이 완료될 때까지 데이터 요소에 대한 요청을 홀딩하는 것보다 더 낫다.
또한, 더 느린 메모리 세트의 페이지들의 사용과 관련된 정보는 페이지들의 사용을 예측하는 자가 학습(self-learning) 예측 엔진을 트레이닝시키는 데 사용될 수 있다. 예를 들어, 감독된 기계 학습 기법은 상기 정보를 사용하여, 예측들과 페이지들의 실제 사용 사이의 에러들을 줄임으로써 더 느린 메모리 세트에서 페이지들의 사용을 예측하기 위한 인공 신경망을 트레이닝시키는데 사용될 수 있다. 인공 신경망의 트레이닝 이후, 예측 엔진은 현재 정보를 사용하여 사용될 다음 페이지들을 예측할 수 있다. 또한, 추가 트레이닝을 위한 예측에 따른 실제 사용으로부터의 트레이닝, 예측 및 피드백은 인공 신경망의 예측 모델을 가장 최근의 메모리 페이지 사용 패턴들에 적응시키기 위해 지속적인 방식으로 수행될 수 있다.
더 느린 메모리 세트의 페이지를 곧 사용할 것이라는 메모리 사용 예측에 응답하여, 데이터 스트림 분리기(113)는 더 느린 메모리 세트에서 더 빠른 메모리 세트로 데이터 페이지를 선제적으로 스왑하거나 캐시하도록 컨트롤러(115)에 지시하여, 처리에 필요한 경우, 데이터의 페이지가 이미 더 빠른 메모리 세트에 있도록 하며, 이 배치는 데이터 페이지의 데이터 액세스 속도를 향상시킨다.
예측의 정확도는 이후의 실제 페이지 사용에 대해 측정될 수 있으며; 예측 및 이후의 실제 페이지 사용은 메모리 페이지들의 가장 최근의 사용 패턴들을 추적하기 위해 인공 신경망을 더 트레이닝시키거나 조정하는 데 사용될 수 있다.
대안으로 또는 조합하여, 기계 학습 기반 예측은 정책 기반 예측 규칙들로 대체되거나 강화될 수 있다. 예를 들어, 주민 코드들을 저장하는 페이지들(예: 하위 어드레스들)은 자주 사용되는 페이지들의 스와핑을 줄이기 위해 가능한 한 더 빠른 메모리 세트에 유지될 수 있다. 예를 들어, 거대한 페이지는 거대한 페이지의 일부인 페이지가 액세스되고 있을 때 더 빠른 메모리 세트에 로딩될 수 있다. 예를 들어, 예측들은 페이지들이 순차적으로 또는 랜덤으로 액세스되는지 여부, 데이터 액세스가 안정적인 상태 모드인지 또는 버스트 모드인지 여부, 및/또는 페이지들(및 크기가 다른 페이지들) 간의 논리적 관계와 같은 표시들에 기초하는, 휴리스틱 규칙들을 적어도 부분적으로 사용하여 이루어질 수 있다.
예측 기술들에 대한 일부 세부사항들 및 예들은 2018년 7월 11일자로 출원된, "Predictive Paging to Accelerate Memory Access" 명칭의 미국 특허 출원 일련 번호 제16/032,331호에서 찾아볼 수 있다.
도 2는 본원에 개시된 적어도 일부 실시예들에 따른 데이터 액세스를 가속화하기 위해 상이한 계층의 메모리에 임베디드 컨트롤러들(104) 및 데이터 스트림 분리기(113)를 갖는 컴퓨팅 시스템을 도시한다.
도 2의 컴퓨팅 시스템은 호스트 시스템(120), 메모리 버스(203)를 통해 호스트 시스템(120)에 연결된 메모리 모듈(205) 및 인터커넥트(207)를 통해 메모리 모듈(205)에 연결된 저장 장치(209)를 포함한다. 선택적으로, 메모리 모듈(205)은 메모리 모듈(205)을 통해 원격 장치(114) 상의 데이터를 서비스하도록 원격 다이렉트 데이터 액세스(RDMA) 동작들을 수행하기 위해 컴퓨터 네트워크(219)에 대한 연결을 갖는다. 메모리 모듈(205)은 도 1에 예시된 메모리 서브 시스템(110)의 예이다. 원격 장치(114)는 로컬 저장 장치(209)와 유사한 저장 장치 및/또는 로컬 메모리 모듈(205)와 유사한 메모리 모듈을 가질 수 있다. 원격 다이렉트 메모리 액세스(RDMA)에 대한 일부 세부사항들 및 예들은 2018년 8월 21일자로 출원된, "Remote Direct Memory Access in Multi-Tier Memory Systems" 이라는 명칭의 미국 특허 출원 일련 번호 제16/107,624호에서 찾아볼 수 있다.
호스트 시스템(120)은 하나 이상의 프로세싱 코어들을 갖는 중앙 처리 유닛 또는 마이크로프로세서일 수 있는 프로세싱 장치(118)를 갖는다. 호스트 시스템(120)은 메모리 관리 유닛(213) 및 캐시 메모리(211)를 가질 수 있다. 메모리 관리 유닛(213) 및/또는 캐시 메모리(211)의 적어도 일부는 프로세싱 장치(118)의 동일한 집적 회로 패키지 내에 선택적으로 통합될 수 있다.
도 2에 예시된 메모리 모듈(205)은 여러 유형의 메모리(예를 들어, 221 및 223)를 가질 수 있다. 예를 들어, 타입 A 메모리(221)는 타입 B 메모리(223)보다 더 빠르다.
예를 들어, 메모리 버스(203)는 이중 데이터 레이트 버스일 수 있으며; 인터커넥트(207)는 PCIe(peripheral component interconnect express) 버스, SATA(serial advanced technology attachment) 버스, USB(universal serial bus) 버스 및/또는 저장 영역 네트워크일 수 있다. 메모리 모듈(205)의 타입 B 메모리(223)는 저장 장치(209)의 타입 B 메모리(223)에 액세스하는 것보다 빠른 속도로 액세스될 수 있다.
도 2에 예시된 저장 장치(209)는 여러 유형의 메모리(예를 들어, 223 및 225)를 갖는다. 예를 들어, 메모리 타입 B(223)는 메모리 타입 C(225)보다 빠르다.
도 2에서, 메모리 컴포넌트들(예를 들어, 221, ..., 223, ..., 225)은 집적 회로 메모리의 패키지들 내에 내장된 매체 컨트롤러들(104)을 갖는다. 매체 컨트롤러들(104)의 통신 능력 및/또는 각각의 패키지들 내의 집적 회로(IC) 다이들 상의 메모리를 관리하는 능력은 메모리 서브 시스템(110)의 성능을 향상시키기 위해 컨트롤러(227)에 의해 사용될 수 있다.
예를 들어, 컨트롤러(227)는 개별 직렬 연결들을 통해 메모리 모듈(205) 상의 메모리 컴포넌트들(221, ..., 223)의 임베디드 컨트롤러들(104)과 통신할 수 있다. 직렬 연결들을 병행하여 사용하는 것은 메모리 모듈(205)의 메모리 용량을 증가시키면서 액세스 대역폭을 증가시킬 수 있다.
또한, 메모리 모듈(205)의 컨트롤러(227)는 직렬 연결을 통해 저장 장치(209)의 컨트롤러(229)와 통신할 수 있다. 다수의 저장 장치들(예를 들어, 209)이 사용되는 경우, 메모리 모듈(205)의 컨트롤러(227)는 다수의 직렬 연결들을 통해 저장 장치(예를 들어, 209)의 컨트롤러(예를 들어, 229)와 통신할 수 있다. 직렬 연결들이 병행하여 사용되는 경우, 액세스 대역폭 및 저장 용량 둘 다 증가될 수 있다.
게다가, 저장 장치(209)의 컨트롤러(229)는 개별 직렬 연결들을 통해 메모리 컴포넌트들(223, ..., 225)의 임베디드 컨트롤러들(104)와 통신할 수 있다. 직렬 연결들을 병행하여 사용하는 것은 저장 장치(209)의 저장 용량을 증가시키면서 액세스 대역폭을 증가시킬 수 있다.
선택적으로, 저장 장치(209)의 컨트롤러(229)는 메모리 모듈(205) 상에 구성되며, 직렬 연결 세트를 통해 메모리 컴포넌트들(223, ..., 225)의 임베디드 컨트롤러들(104)에 연결된다. 컨트롤러(229) 및 컨트롤러(227)는 메모리 모듈(205) 상에 배치된 컨트롤러 패브릭/계층의 일부일 수 있다.
선택적으로 또는 조합하여, 메모리 모델(205)의 컨트롤러(227)는 컨트롤러(229)를 거치지 않고 더 많은 직렬 연결들 중 하나를 통해 직접 메모리 컴포넌트들(예를 들어, 223)의 임베디드 컨트롤러들(104)의 일부에 연결될 수 있다. 예를 들어, 저장 장치(209)의 타입 B 메모리(223)는 메모리 모듈(205)의 타입 B 메모리(223)과 동일한 방식으로 컨트롤러(227)에 연결될 수 있으며; 이러한 연결은 추가된 메모리 컴포넌트가 메모리 모듈(205)에 배치/장착된 것처럼 타입 B 메모리(223)의 용량을 증가시키고/시키거나 타입 B 메모리(223)의 액세스 대역폭을 증가시킬 수 있다.
일반적으로, 다수의 메모리 모듈들(예: 205)은 메모리 버스(203)에 결합될 수 있으며; 다수의 저장 장치들(예: 209)은 주변 장치 인터커넥트(207)에 결합될 수 있다. 일부 경우, 주변 장치 인터커넥트(207) 및 저장 장치들(예: 209)은 선택적이며 컴퓨팅 시스템에는 없을 수 있다. 다른 경우, 메모리 버스(203) 및 메모리 모듈들(예: 205)은 선택적이며 컴퓨팅 시스템에는 없을 수 있다.
다수의 메모리 모듈들(예: 205)이 메모리 버스(203)에 결합 시 가능한 구성에서, 메모리 모듈들(예: 205) 중 하나는 타입 A 메모리(221)를 가지며; 다른 메모리 모듈들은 별도의 메모리 모듈(예: 205)의 타입 A 메모리(221)보다 낮은 속도로 액세스 가능한 타입 B 메모리(223)를 갖는다.
마찬가지로, 인터커넥트(207)에 다수의 저장 장치들(예: 205)이 결합되었을 시 가능한 구성에서, 저장 장치(예: 209) 중 하나는 타입 B 메모리(223)를 가지며, 저장 장치들 중 다른 하나는 개별 저장 장치(예: 209)의 타입 B 메모리(221)보다 낮은 속도로 액세스할 수 있는 타입 C 메모리(225)를 갖는다.
프로세싱 장치(118) 및/또는 MMU(213)는 페이징 기술 및/또는 메모리 맵 인터페이스를 사용하여 컴퓨터 시스템의 메모리의 다른 일부를 통해 컴퓨터 시스템의 메모리의 일부에 액세스하기 위한 인스트럭션들(예를 들어, 운영 체제 및/또는 하나 이상의 장치 드라이버들)을 통해 구성된다.
일 실시예에서, 메모리 모듈(205)의 컨트롤러(227)는 메모리 모듈(205)의 메모리의 일부로서 저장 장치(209)의 메모리 성능을 나타내도록 구성될 수 있다. 따라서, 호스트 시스템(120)은 메모리 모듈(205)의 일부로서 저장 장치(209) 및/또는 제거 저장 장치(114)에 액세스할 수 있다.
예를 들어, 메모리 모듈(205)의 타입 B 메모리(223)는 메모리 모듈(205)(또는 다른 메모리 모듈)의 타입 A 메모리(221)에 액세스될 수 있다.
예를 들어, 저장 장치(예: 209)의 타입 B 메모리(223)는 메모리 모듈(205)의 타입 A 메모리(221) 및/또는 메모리 모듈(205)의 타입 B 메모리(223)를 통해 액세스될 수 있다.
예를 들어, 저장 장치(209)의 타입 C 메모리(225)는 메모리 모듈(205)의 타입 A 메모리(221)를 통해, 메모리 모듈(205)의 타입 B 메모리(223)를 통해 및/또는 저장 장치(209)(또는 다른 저장 장치)의 타입 B 메모리(223)를 통해 액세스될 수 있다.
예를 들어, 일부 경우, 동일한 메모리 모듈(205)(또는 다른 메모리 모듈들)의 타입 A 메모리(221) 및 타입 B 메모리(223)는 프로세싱 장치(118)의 메모리 관리 유닛(213)에 의해 메모리 버스(203)를 통해 직접적으로 그리고 개별적으로 어드레스 가능할 수 있다. 그러나, 타입 B 메모리(223)는 타입 A 메모리(221)보다 느리기 때문에, 타입 A 메모리(221)를 통해 타입 B 메모리(223)에 액세스하는 것이 바람직하다.
다른 경우, 메모리 모듈(205)의 타입 B 메모리(223)는 (예를 들어, 메모리 버스(203)의 어드레스 부분에서의 크기 제한으로 인해) 메모리 모듈(205)의 타입 A 메모리(221)를 어드레싱하는 것을 통해서만 액세스 가능하다.
데이터 스트림 분리기(113)는 데이터 스트림을 식별하고, 데이터 스트림의 특성들에 따라 데이터 스트림에 대한 데이터 배치를 조정하도록 메모리 모듈(205)의 컨트롤러 X(227)에 지시할 수 있다.
예를 들어, 컨트롤러 X(227)는 데이터 스트림에 대해 메모리 모듈(205) 내의 타입 A 메모리(221)와 타입 B 메모리(223) 사이의 데이터 전송/이동을 수행할 수 있다.
또한, 메모리 모듈(205)의 컨트롤러 X(227)는 저장 장치(209)의 메모리들(223 내지 225) 사이 및/또는 저장 장치(209)와 메모리 모듈(205) 사이의 데이터 전송/이동을 수행하도록 저장 장치(209)의 컨트롤러 Y(229)와 통신할 수 있다.
또한, 메모리 모듈(205)의 컨트롤러 X(227)는 제거 장치(114)와 메모리 모듈 (205) 사이의 데이터 전송/이동을 수행하도록 원격 장치(114)의 컨트롤러와 통신할 수 있다.
일반적으로, 메모리 서브 시스템들(예: 205 및 209)은 메모리(예를 들어, 221, ..., 223, ..., 225)와 같은 매체를 포함할 수 있다. 메모리(예를 들어, 221, ..., 223, ..., 225)는 휘발성 메모리, 비휘발성 메모리(NVM) 및/또는 이들의 조합을 포함할 수 있다. 일부 실시예들에서, 컴퓨터 시스템은 저장 장치(209)인 적어도 하나의 메모리 서브 시스템을 포함한다. 저장 장치(209)의 예는 솔리드 스테이트 드라이브(SSD)이다. 일부 실시예들에서, 컴퓨터 시스템은 메모리 모듈(205)로서 구성된 하이브리드 메모리/저장 시스템인 적어도 하나의 메모리 서브 시스템을 포함한다. 프로세싱 장치(118)는 메모리 서브 시스템들(예: 205 및 209) 각각에 데이터를 기록하고, 메모리 서브 시스템들(예: 205 및 209)로부터 직접 또는 간접적으로 데이터를 판독할 수 있다.
도 2의 컴퓨팅 시스템은 데스크탑 컴퓨터, 랩탑 컴퓨터, 네트워크 서버, 모바일 장치 또는 메모리와 프로세싱 장치를 포함하는 이러한 컴퓨팅 장치를 구현하는 데 사용될 수 있다. 프로세싱 장치(118)는 메모리 서브 시스템들(예: 205 및 209)로부터 데이터를 판독하고 이에 데이터를 기록할 수 있다.
프로세싱 장치(118)는 하나 이상의 물리적 인터페이스(예: 203, 207)를 통해 메모리 서브 시스템(예: 205, 209)에 결합될 수 있다.
본원에 사용된 바와 같이, "~에 결합된(coupled to)"은 일반적으로 전기적, 광학적, 자기적 등과 같은 연결들을 포함하여 유선이든 또는 무선이든, 간접 통신 연결 또는 (예를 들어, 중간 컴포넌트들이 없는) 직접 통신 연결일 수 있는, 컴포넌트들 사이의 연결을 지칭한다.
물리적 호스트 인터페이스의 예들은, 이에 제한되는 것은 아니나, SATA(serial advanced technology attachment) 인터페이스, PCIe(peripheral component interconnect express) 인터페이스, USB(universal serial bus) 인터페이스, 광섬유 채널, SCSI(Fibre Channel, Small Computer System Interface), SAS(Serial Attached SCSI) 등을 포함한다.
물리적 호스트 인터페이스는 프로세싱 장치(118)와 메모리 서브 시스템(예: 209) 사이에서 데이터를 전송하는 데 사용될 수 있다. 컴퓨터 시스템은 메모리 서브 시스템(209)이 PCIe 인터페이스를 통해 주변 장치 인터커넥트(207)와 결합될 때 메모리(예를 들어, 223, ..., 225)에 액세스하기 위해 NVMe(NVM Express) 인터페이스를 추가로 이용할 수 있다. 물리적 호스트 인터페이스는 메모리 서브 시스템(예: 209)과 프로세싱 장치(118) 사이에서 제어, 어드레스, 데이터 및 다른 신호들을 전달하기 위한 인터페이스를 제공할 수 있다.
일반적으로, 메모리 서브 시스템(예를 들어, 205 및 209)은 메모리(예를 들어, 221, ..., 223, ..., 225)를 제공하는 메모리 집적 회로들과 같은, 메모리 장치 세트를 연결하는 인쇄 회로 기판을 포함한다. 메모리 서브 시스템(예를 들어, 205 및 209) 상의 메모리(예를 들어, 221, ..., 223, ..., 225)는 상이한 유형의 비휘발성 메모리 장치들 및/또는 휘발성 메모리 장치들의 임의의 조합을 포함할 수 있다.
비휘발성 메모리 장치들의 예는 NAND(negative-and)형 플래시 메모리 또는 NOR(negative-or)형 플래시 메모리를 포함한다. 메모리 집적 회로는 단일 레벨 셀(SLC)들, 다중 레벨 셀(MLC)들, 트리플 레벨 셀(TLC)들, 쿼드 레벨 셀(QLC)들과 같은 하나 이상의 메모리 셀 어레이들을 포함할 수 있다. 일부 구현예들에서, 특정 메모리 장치는 메모리 셀들의 SLC 부분 및 MLC(또는 TLC 또는 QLC) 부분을 포함할 수 있다. 메모리 셀 각각은 호스트 시스템(120)에 의해 사용된 하나 이상의 데이터 비트들을 저장할 수 있다. NAND형 플래시 메모리와 같은 비휘발성 메모리 장치들이 설명되어 있지만, 메모리 집적 회로들은 휘발성 메모리와 같은 임의의 다른 유형의 메모리에 기초할 수 있다. 일부 구현예들에서, 메모리(예를 들어, 221, ..., 223, ..., 225)는 이에 제한되는 것은 아니나, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 동적 랜덤 액세스 메모리(DRAM), 정적 랜덤 액세스 메모리(SRAM), 동기식 동적 랜덤 액세스 메모리(SDRAM), 위상 변화 메모리(PCM), 자기 랜덤 액세스 메모리(MRAM), NOR(negative-or) 플래시 메모리, 전기적으로 소거 가능한 프로그램 가능 읽기 전용 메모리(EEPROM) 및/또는 비휘발성 메모리 셀들의 교차점 어레이를 포함한다. 비휘발성 메모리의 교차점 어레이는 스택 가능한 크로스 그리드 데이터 액세스 어레이(stackable cross-gridded data access array)와 함께 벌크 저항의 변화에 기초하여 비트 저장(bit storage)을 수행할 수 있다. 추가로, 많은 플래시 기반 메모리들과 달리, 교차점 비휘발성 메모리는 제자리에 기록 동작을 수행할 수 있으며, 여기서 비휘발성 메모리 셀은 비휘발성 메모리 셀이 미리 소거되지 않고 프로그래밍될 수 있다. 게다가, 메모리 장치들의 메모리 셀들은 데이터를 저장하는데 사용되는 메모리 장치의 단위를 지칭할 수 있는 메모리 페이지들 또는 데이터 블록들로서 그룹화될 수 있다.
메모리 서브 시스템(예를 들어, 205 또는 209)은 프로세싱 장치(118) 및/또는 메모리 관리 유닛(MMU)(213)으로부터의 요청들, 명령들 또는 인스트럭션들에 응답하여, 메모리(예를 들어, 221, ..., 223, ..., 225)와 통신하여 메모리(예를 들어, 221, ..., 223, ..., 225)에서의 데이터 판독, 데이터 기록 또는 데이터 소거와 같은 동작들 및 다른 이러한 동작들을 수행하는 컨트롤러(예를 들어, 227 또는 229)를 가질 수 있다.
컨트롤러(227)는 인터커넥트(207) 및/또는 네트워크(219)를 통해 저장 장치들(예를 들어, 209 및/또는 114)의 컨트롤러들 및/또는 임베디드 컨트롤러들(104)과 통신하여 저장 장치들의 컨트롤러들이 각각의 저장 장치들의 메모리(예를 들어, 223, ..., 225)에서의 데이터 판독, 데이터 기록 또는 데이터 소거와 같은 동작들 및 기타 동작들을 수행하게 할 수 있다.
컨트롤러들(예를 들어, 227, 229 및/또는 104)은 하나 이상의 집적 회로들 및/또는 개별 컴포넌트들, 버퍼 메모리 또는 이들의 조합과 같은 하드웨어를 포함할 수 있다. 컨트롤러(예를 들어, 227 또는 229)는, 마이크로컨트롤러, 특수 목적 논리 회로부(예를 들어, 필드 프로그램 가능 게이트 어레이(FPGA), 어플리케이션별 집적 회로(ASIC) 등), 또는 다른 적절한 프로세서일 수 있다. 컨트롤러들(예를 들어, 227, 229 및/또는 104)은 로컬 메모리에 저장된 인스트럭션들을 실행하도록 구성된 하나 이상의 프로세서들(프로세싱 장치들)을 포함할 수 있다.
컨트롤러(예를 들어, 227 또는 229)의 로컬 메모리는 메모리 서브 시스템(예를 들어, 205 또는 209)과 프로세싱 장치(118)/MMU(213) 사이의 통신 및 아래에서 더 상세히 설명되는 다른 기능들의 처리를 포함하여, 메모리 서브 시스템(예를 들어, 205 또는 209)의 동작을 제어하는 다양한 프로세스들, 동작들, 논리 흐름들 및 루틴들을 수행하기 위한 인스트럭션들을 저장하도록 구성된 임베디드된 메모리를 포함할 수 있다. 컨트롤러(예를 들어, 227 또는 229)의 로컬 메모리(219)는 마이크로-코드를 저장하기 위한 읽기 전용 메모리(ROM) 및/또는 메모리 포인터들, 페치된 데이터 등을 저장하는 메모리 레지스터들을 포함할 수 있다.
도 2의 예시적인 메모리 서브 시스템들(예를 들어, 205 및 209)은 컨트롤러들(예를 들어, 227 및 229)을 포함하는 것으로 예시되어 있지만, 본 개시의 다른 실시예에서, 메모리 서브 시스템(예를 들어, 205 또는 209)은 컨트롤러(예를 들어, 227 또는 229)를 포함하지 않을 수 있으며, 대신 외부 제어(예를 들어, MMU(213)에 의해 제공되거나, 또는 메모리 서브 시스템(예를 들어, 205 또는 209)으로부터 분리된 프로세서나 컨트롤러에 의해 제공됨)에 의존할 수 있다.
일반적으로, 컨트롤러들(예를 들어, 227, 229 및/또는 104)은 통신 채널(예를 들어, 203 또는 207)에 대한 표준 통신 프로토콜에 따라 프로세싱 장치(118) 또는 MMU(213)로부터 명령들, 요청들 또는 인스트럭션들을 수신할 수 있고, 표준 프로토콜에 따른 명령들, 요청들 또는 인스트럭션들을 메모리 서브 시스템(예를 들어, 205 또는 209) 내의 상세한 인스트럭션들 또는 적절한 명령들로 변환하여 메모리(예를 들어, 221, ..., 223, ..., 225)에 대한 원하는 액세스를 달성할 수 있다. 예를 들어, 컨트롤러(예를 들어, 227, 229 및/또는 104)는 웨어 레벨링 동작들, 가비지 수집 동작들, 에러 검출 및 에러 정정 코드(ECC) 동작들, 암호화 동작들, 캐싱 동작들 및 메모리(예를 들어, 221, ..., 223, ..., 225)와 관련되는 논리 블록 어드레스와 물리 블록 어드레스 간의 어드레스 변환들과 같은 동작들을 담당할 수 있다. 컨트롤러들(예를 들어, 227, 229 및/또는 104)은 직렬 상호연결을 위한 직렬화기/역직렬화기(SerDes)를 더 포함할 수 있다. 컨트롤러들(예를 들어, 227, 229 및/또는 104)은 물리적 호스트 인터페이스를 통해 프로세싱 장치(118)와 통신하기 위한 호스트 인터페이스 회로부를 더 포함할 수 있다. 호스트 인터페이스 회로부는 메모리 장치들(예를 들어, 221, ..., 223, ..., 225)과 연관된 응답들을 프로세싱 장치(118)에 대한 정보로 변환할 뿐만 아니라 프로세싱 장치(118)로부터 수신된 명령들을 메모리 장치들(예를 들어, 221, ..., 223, ..., 225)에 액세스하기 위한 명령 인스트럭션들로 변환할 수 있다.
메모리 서브 시스템(예를 들어, 205 또는 209)은 또한 예시되지 않은 추가 회로부 또는 컴포넌트들을 포함할 수 있다. 일부 구현예들에서, 메모리 서브 시스템(예를 들어, 205 또는 209)은 컨트롤러(예를 들어, 227 또는 229) 또는 MMU(213)로부터 어드레스를 수신하고 어드레스를 디코딩하여 메모리(예를 들어, 221, ..., 223, ..., 225)에 액세스할 수 있는 캐시 또는 버퍼(예를 들어, DRAM) 및 어드레스 회로부(예를 들어, 행 디코더 및 열 디코더)를 포함할 수 있다.
일 예에서, 인터커넥트(207) 또는 메모리 버스(203)는 메모리 서브 시스템(예를 들어, 209 또는 205)에 전력을 제공하고/하거나 미리 결정된 프로토콜을 통해 메모리 서브 시스템(예를 들어, 209 또는 205)과 통신하기 위한 하나 이상의 커넥터들을 가지며; 메모리 서브 시스템(예를 들어, 209 또는 205)은 프로세싱 장치(118)로부터 전력, 데이터 및 명령들을 수신하기 위한 하나 이상의 커넥터들을 갖는다. 예를 들어, 인터커넥트(207) 상의 커넥터와 메모리 서브 시스템(예를 들어, 209) 상의 커넥터 사이의 연결은 PCIe 버스 또는 SATA 버스를 이용할 수 있다.
일부 경우, 데이터 스트림 분리기(113)는 호스트 시스템(120)에 적어도 부분적으로 구현될 수 있다.
도 3은 일 실시예에 따른 임베디드 컨트롤러(104)를 갖는 메모리 컴포넌트를 예시한다.
도 3에서, 메모리 컴포넌트는 메모리 집적 회로 다이들(403, ..., 405) 및 임베디드 컨트롤러(104)의 집적 회로를 갖는 다이와 같은, 집적 회로 다이들을 캡슐화하는 지지 케이스인 패키지(401)를 갖는다. 메모리 컴포넌트는 동작들을 위한 전력을 수신하는 핀(pin) 세트 및/또는 직렬 통신 인터페이스(411)에 연결된 핀 세트를 가질 수 있다.
예를 들어, 직렬 통신 인터페이스(411)는 PCIe, STA, USB, 또는 인터라켄 등의 프로토콜에 따른 통신을 지원할 수 있다.
선택적으로, 임베디드 컨트롤러(104)는 컨트롤러(104)의 마이크로프로그램을 통해 통과하는 데 사용되는 어드레스들을 생성할 수 있는 시퀀서(sequencer)(407)를 가질 수 있다. 예를 들어, 임베디드 컨트롤러(104)는 매체 규칙들(409)을 적용, 구현 및/또는 시행하고/하거나 메모리 집적 회로 다이들(403, ..., 405)에 형성된 메모리의 상태 정보(409)를 수집 및/또는 유지하도록 구성된 마이크로프로그램을 가질 수 있다.
임베디드 컨트롤러(104)는 직렬 통신 연결을 통해 직렬 연결 인터페이스(411)에 전달되는 데이터 패킷들을 역직렬화하도록 구성되고, 미리 결정된 직렬 통신 프로토콜에 따라 명령들, 어드레스들 및/또는 데이터를 분리하도록 구성되며, 어드레스들 및/또는 데이터에 따라 명령들을 실행/구현하도록 구성된다. 예를 들어, 판독 명령은 메모리 ID 다이들(403, ..., 405) 중 하나 이상으로 데이터를 저장하는 것을 필요로 하며; 기록 명령은 메모리 ID 다이들(403, ..., 405) 중 하나 이상으로부터 데이터를 검색하는 것을 필요로 한다. 직렬 통신 인터페이스(411)의 직렬화기(serializer)는 명령을 실행한 결과를 미리 결정된 직렬 통신 프로토콜에 따라 직렬 통신 연결을 통한 통신을 위한 데이터 패킷들로 변환시킬 수 있다. 일부 경우에, 매체 규칙들(409)은 패키지(401) 내에 캡슐화되는 메모리 컴포넌트의 초기화 단계 동안 구성되거나 프로그래밍될 수 있다.
도 4는 일 실시예에 따른 외부 컨트롤러(115)에 개별적으로 연결되는 임베디드 컨트롤러들(104)을 갖는 메모리 컴포넌트들(421, ..., 423)을 예시한다. 예를 들어, 도 4의 구성은 도 3에 예시된 임베디드 컨트롤러들(104)를 사용하여, 도 1 또는 2의 컴퓨터 시스템에 구현될 수 있다. 예를 들어, 도 4의 컨트롤러(115)는 도 2의 컨트롤러들(227, 229)의 조합을 통해 구현될 수 있다.
도 4에서, 컨트롤러(115)는 개별 직렬 연결들(441, ..., 443)을 통해 메모리 컴포넌트들(421, ..., 423)의 각각의 직렬 통신 인터페이스들(411)에 연결되는 직렬 통신 인터페이스(411) 세트를 갖는다. 직렬 연결들(441, ..., 443)은 메모리 컴포넌트들(421, ..., 423) 전체와 컨트롤러(115) 사이의 데이터 액세스 대역폭을 증가시키기 위해 동시에 병행하여 사용될 수 있다.
일반적으로, 메모리 컴포넌트들(421, ..., 423)은 상이한 성능 계층들의 메모리를 포함할 수 있으며; 각 메모리 성능 계층은 유사하거나 상이한 메모리 능력들의 메모리 컴포넌트들(421, ..., 423)을 가질 수 있다.
컨트롤러(115)는 메모리 컴포넌트들(421, ..., 423)에 데이터를 동적으로 분배하기 위해 논리 대 물리 어드레스 맵핑(433)을 유지할 수 있다. 어드레스 맵핑(433)은 메모리 위치를 지정하기 위해 호스트(120)에 의해 사용되는 논리 블록 어드레스를 메모리 컴포넌트(421, ..., 또는 423)의 물리적 어드레스로 변환할 수 있다. 논리 대 물리 어드레스 맵핑(433)의 조정을 통해, 컨트롤러(115)는 메모리 컴포넌트들(421, ..., 423)를 사용하여 구현된 메모리 서브 시스템(110) 내의 데이터 배치를 동적으로 조정할 수 있다.
동적 데이터 배치는 웨어 레벨링(431)을 수행하는 데 사용될 수 있다. 예를 들어, 특정 유형의 메모리(예를 들어, 플래시 메모리)는 반복적인 기록/소거 동작들에 대해 제한된 내구성을 갖는다. 컨트롤러(115)는 논리 대 물리 어드레스 맵핑(433)을 사용하여 기록/소거 동작들이 IC 패키지(401)의 ID 다이들(403, ..., 405)에 걸쳐서 뿐만 아니라, 개별 IC 패키지들(401)의 메모리 컴포넌트들(421, ..., 423)에 걸쳐, (예를 들어, SSD들로 구성된) 개별 저장 장치(209)에 걸쳐서, 및/또는 개별 메모리 모듈들(205)에 걸쳐서 실질적으로 균등하게 분배되도록 웨어 레벨링(431)을 수행할 수 있다.
다수의 메모리 컴포넌트들(421, ..., 423)에 대한 병렬 연결들(441, ..., 443)을 활용함으로써 성능을 향상시키기 위해 컨트롤러에 의해 동적 데이터 배치가 사용될 수 있다. 예를 들어, 저장될 데이터 세트는 다수의 메모리 컴포넌트들(421, ..., 423)에 분배될 수 있으며; 데이터 세트를 위한 기록 명령은 병렬 동작들을 위한 개별 연결들(441, ..., 443)을 통해 병행하여 통신될 수 있다. 마찬가지로, 데이터 세트가 병렬 동작들을 통해 다수의 메모리 컴포넌트들(421, ..., 423)로부터 검색될 수 있다. 따라서, 개별 연결들에 의해 제공되는 고 대역폭은 데이터 액세스 성능을 향상시키기 위해 컨트롤러(115)에 의해 이용될 수 있다.
동적 데이터 배치는 성능을 향상시키기 위해 데이터 스트림 분리기(113)에 의해 사용될 수 있다. 예를 들어, 컨트롤러(115)는 핫 데이터를 더 높은 성능의 메모리 계층에 매핑시키고, 콜드 데이터를 더 낮은 성능의 메모리 계층에 매핑시킬 수 있다. 예를 들어, 컨트롤러(115)는 성능이 낮은 메모리 계층으로 향하는 기록 동작들을 통합하고 직렬화하기 위해 성능이 더 높은 메모리 계층의 일부를 성능이 더 낮은 메모리 계층에 대한 버퍼로 동적으로 사용할 수 있다.
종래 시스템은 더 빠른 메모리들을 통해 더 느린 메모리들이 액세스되는 캐시 구조를 가질 수 있다. 프로세서가 현재 더 느린 메모리에 있는 데이터에 액세스하는 경우, 데이터는 더 느린 메모리에 있는 데이터의 프록시로서 더 빠른 메모리로 로딩된다. 이후, 프로세서는 성능 향상을 위해 더 빠른 메모리에 있는 데이터의 프록시/캐시에서 동작한다. 더 빠른 메모리는 일반적으로 더 느린 메모리보다 더 작은 용량을 갖는다. 따라서, 더 느린 메모리에 있는 데이터의 일부만이 더 빠른 메모리에 동시에 캐싱될 수 있다. 프로세서에 의해 액세스된 아이템이 현재 더 빠른 메모리에 없을 때 캐시 미스(cache miss)가 발생된다. 프로세서에 의해 액세스된 아이템이 현재 더 빠른 메모리에 있을 때 캐시 히트(cache hit)가 발생된다. 캐시 히트를 초래하는 액세스 백분율이 캐시 히트율이다. 캐시 히트율을 개선하면 컴퓨팅 시스템의 운영 성능을 향상시킬 수 있다. 그러나, 캐시 히트율을 향상시키기 위해 캐시 정책을 설계하는 것은 어려운 일이다.
본 개시의 적어도 일부 측면들은 상이한 계층들의 메모리들에 대한 데이터 스트림 분리에 의해 상기 및 다른 결함들을 해결한다.
다른 계층들의 메모리들은 상이한 데이터 액세스 속도들을 가질 수 있다. 전체 시스템 성능은 메모리들의 데이터 액세스 속도들과 데이터 액세스 빈도들 및 패턴들과 관련하여 데이터 배치를 최적화함으로써 향상될 수 있다. 예를 들어, 컴퓨팅 시스템의 운영 성능을 향상시키기 위해, 자주 사용되는 데이터는 더 빠른 메모리에 배치될 수 있으며; 덜 자주 사용되는 데이터는 더 느린 메모리에 배치될 수 있다. 더 빠른 메모리는 더 느린 메모리를 위한 캐시 메모리로서 선택적으로 구성될 수 있다. 일부 경우에, 더 느린 메모리의 적어도 일부는 더 느린 메모리에 대한 액세스가 드문 경우, 캐시로서 더 빠른 메모리를 거치지 않고 직접 액세스될 수 있다.
다른 계층들의 메모리들은 상이한 운영 특성들을 가질 수 있다. 예를 들어, 특정 유형의 메모리는 순차적 기록들보다 랜덤 기록들을 처리하는 데 더 느릴 수 있다. 예를 들어, 특정 유형의 메모리 상에서의 기록 동작들은 판독 동작들에 대한 성능 레벨들을 감소시킬 수 있다. 예를 들어, 특정 유형의 메모리는 반복적인 기록/소거 동작들에 대해 제한된 내구성을 가질 수 있다. 운영 특성들을 고려하여 시스템 성능을 최적화하기 위해 상이한 메모리 계층들을 대상으로 하는 별도의 데이터 스트림들이 생성될 수 있다.
예를 들어, 특정 유형의 메모리 영역에서 혼합된 판독 동작들 및 기록 동작들의 스트림이 캐싱되어 판독 동작들 및 기록 동작들을 분리하여 기록 동작들이 메모리 영역에서 판독 동작들을 방해 및/또는 차단하는 것을 방지할 수 있다. 예를 들어, 랜덤 기록 액세스의 스트림은 순차적 기록 액세스의 스트림으로 캐싱되고 재구성될 수 있다.
또한, 데이터 사용 정보는 워크로드 계획 및 이에 따른 상이한 계층들의 메모리들에 걸친 데이터 이동을 예측하여 데이터 액세스 스트림들을 분리 및/또는 구성하기 위해, 기계 학습 기술을 사용하여 트레이닝된 예측 모델에 선택적으로 적용될 수 있다. 따라서, 데이터 배치는 또한 후속 기간에 대한 데이터 사용의 예측들에 적어도 부분적으로 기초할 수 있다.
예를 들어, 데이터 사용 정보는 데이터를 사용하는 어플리케이션들 또는 프로그램들, 데이터 평가들이 이루어지는 사용자 계정들, 데이터에 액세스하는 가상 머신들, 데이터가 속하는 오브젝트들, 어플리케이션들에 구성된 데이터 블록들 대 오브젝트들 간 맵핑, 오브젝트들 간의 관계들 등과 같은, 데이터 액세스들 및 데이터 액세스들과 관련된 속성들의 이력을 포함할 수 있다. 데이터 사용 정보에 따라 예측된 데이터 이동은 컴퓨팅 시스템의 운영 성능을 향상시키기 위해 선제적으로 수행될 수 있다. 예측 모델은 데이터 사용 정보와 연관된 데이터 액세스들에 의해 발생된 이력 데이터 사용 정보 및 이력 데이터 이동을 사용하여 초기에 오프라인으로 학습될 수 있다. 트레이닝은 이력 데이터 사용 정보를 예측 모델에 적용함으로써 생성된 이력 데이터 이동과 예측 사이의 차이를 최소화한다. 이후, 예측 모델은 실시간 데이터 사용 정보를 사용하여 실시간 예측에 사용될 수 있다. 예측된 데이터 이동을 수행하는 것은 데이터 액세스 요청들에 응답하여 데이터를 이동할 필요성을 감소시킬 수 있다. 실시간 데이터 액세스 요청들에 의해 야기되는 데이터 이동, 및/또는 예측된 데이터 이동이 계층들에 걸쳐 데이터를 이동할 필요성을 감소시키는지 여부의 표시들은 원하는 실시간 예측 결과들을 식별하는 데 사용될 수 있다. 원하는 결과들은 예측 모델의 지속적인 개선 및 적응을 위해 강화 기계 학습 기술을 사용하여 예측 모델을 더 트레이닝시킬 수 있다. 예측 모델은 컴퓨팅 시스템의 실시간 사용 시 현재 워크로드에 동적으로 적응될 수 있다.
도 5는 데이터 스트림 분리의 예를 예시한다. 예를 들어, 데이터 스트림 분리는 도 3 및/또는 도 4의 컨트롤러 구성들을 사용하여 도 1 또는 도 2의 컴퓨터 시스템에 구현될 수 있다.
도 5에서, 호스트 시스템(120)과 메모리 모듈(205)의 데이터 스트림 분리기(113) 사이의 통신들은 상이한 특성들의 데이터 액세스(231)를 위한 메시지들을 포함한다. 데이터 스트림 분리기(113)는 상이한 계층들의 메모리들(예를 들어, 221, 223, 225)(예를 들어, 도 4의 컨트롤러(115)를 통해)에 대한 액세스를 갖는다.
예를 들어, 데이터 스트림 분리기(113)는 데이터 요청(231)에 포함된 데이터를 메모리 모듈(205)의 타입 A 메모리(221), 메모리 모듈(205)의 타입 B 메모리(223), 인터커넥트(207)를 통해 메모리 모듈(205)에 연결된 저장 장치(209)의 메모리, 및/또는 네트워크(219)를 통해 메모리 모듈(205)에 연결된 원격 장치(114)의 메모리에 선택적으로 배치될 수 있다.
예를 들어, 타입 A 메모리(221)는 타입 B 메모리(223)보다 높은 성능 레벨을 갖는 메모리 계층일 수 있으며; 타입 B 메모리(223)는 타입 C 메모리(225)보다 높은 성능 레벨을 갖는 메모리 계층일 수 있다.
예를 들어, 타입 A 메모리(221)는 DRAM 및/또는 교차점 메모리를 사용하여 메모리 모듈(205)에 구현될 수 있고; 타입 B 메모리(223)는 메모리 모듈(205) 또는 SLC 플래시 메모리를 사용하여 메모리 모듈(205)에 의해 제어되는 저장 장치(209)에 구현될 수 있으며; 타입 C 메모리는 저장 장치(209) 및/또는 TLC 또는 QLC 플래시 메모리를 사용하는 원격 장치(114)에 구현될 수 있다.
데이터 스트림 분리기(113)는 데이터를 그 사용 빈도에 기초한 그룹들로 분리할 수 있다. 예를 들어, 가장 자주 사용되는 데이터 그룹은 타입 A 메모리(221)에 배치될 수 있고; 덜 자주 사용되는 데이터 그룹은 타입 B 메모리(223)에 배치될 수 있으며; 자주 사용되지 않는 데이터 그룹은 타입 C 메모리(225)에 배치될 수 있다. 데이터 사용 빈도는 과거 기간의 데이터 액세스(231)에 기초하여 측정되고/되거나 후속 기간에 대한 데이터 액세스의 예측에 기초하여 측정될 수 있다. 가장 자주 사용되는 데이터 그룹은 핫 데이터로 분류될 수 있고; 덜 자주 사용되는 데이터 그룹은 웜 데이터로 분류될 수 있으며; 자주 사용되지 않는 데이터 그룹은 콜드 데이터로 분류될 수 있다. 일반적으로, 대응되는 메모리 계층들에 데이터를 배치하기 위해 사용 빈도에 기초하여 세 개보다 많거나 적은 데이터 그룹들이 분류될 수 있다.
데이터 사용 빈도가 변경되는 경우, 데이터 스트림 분리기(113)는 그에 따라 데이터 배치들을 조정할 수 있다. 예를 들어, 핫 데이터가 냉각되어 웜해지는 경우, 데이터는 순차적 기록 동작들을 통해 타입 A 메모리(221)로부터 타입 B 메모리(223)로 이동될 수 있으며; 덜 자주 액세스되는 웝 데이터는 콜드 데이터로 냉각되거나 핫 데이터로 다시 가열될 때까지 타입 B 메모리(223)로부터 직접 서비스될 수 있다. 마찬가지로, 데이터는 데이터가 콜드해지는 경우 타입 B 메모리(223)로부터 타입 C 메모리(225)로, 또는 데이터가 웜해지는 경우 타입 C 메모리(225)로부터 타입 B 메모리(223)로 이동될 수 있다.
일부 경우, 타입 B 메모리(223)는 타입 C 메모리(225)의 캐시 또는 버퍼로 구성되며; 타입 A 메모리(221)는 타입 B 메모리(223)의 캐시 또는 버퍼로 구성된다.
데이터 스트림 분리기(113)는 사용 빈도에 기초하여 데이터 배치를 관리할 뿐만 아니라, 데이터 액세스들(231)의 특정 스트림들을 하위 계층 메모리들(예를 들어, 223 또는 225)로 직접 보낸다.
예를 들어, 호스트(120)가 논리 어드레스 세트에 순차적으로 데이터를 기록하는 경우, 순차적 기록들은 호스트 시스템(120)의 성은을 저하시키기 않고 메모리 타입 C(225)에 대한 스트림으로서 보내질 수 있다. 일부 경우에, 데이터 스트림 분리기(113)는 호스트(120)가 직접 완료될 수 있는 메모리 타입 C(225)보다 높은 속도로 기록 요청들을 전송할 경우, 타입 A 메모리(221)의 일부를 타입 C 메모리(225)에 대한 기록들의 스트림을 위한 버퍼로 사용할 수 있으며; 이러한 기록 동작들은 타입 C 메모리(225)에 대한 순차적 스트림을 기록하는 기간 동안 각각의 데이터의 사용 빈도를 증가시키기 위한 사용 활동들로 카운팅되지 않을 수 있다.
예를 들어, 호스트(120)가 어드레스 세트에 랜덤으로 데이터를 기록할 경우, 랜덤 기록들은 호스트 시스템(120)의 성능을 저하시키지 않고 타입 B 메모리(223)에 대한 스트림으로서 보내질 수 있다. 필요한 경우, 데이터 스트림 분리기(113)는 또한 타입 A 메모리(221)의 일부를 타입 B 메모리(223)에 대한 랜덤 기록들의 스트림을 위한 버퍼로 사용할 수 있다. 일부 경우에, 특히 타입 A 메모리(221)를 사용하여 스트림이 버퍼링되는 경우, 타입 C 메모리(225)로 랜덤 기록들을 보내는 것이 가능할 수 있다. 그러나, 랜덤 기록들은 판독 및/또는 순차적 기록들과 같은 다른 동작들을 처리 시 타입 C 메모리(225)의 성능을 저하시킬 수 있으며, 랜덤 기록들로 인한 기록 증폭, 반복되는 기록들로 인한 수명 감소, 기록/소거 동작들에 의한 판독 동작들의 지연/차단 등과 같은 바람직하지 않은 효과들을 가질 수 있다. 랜덤 기록들의 스트림을 (기록 빈도에 따라) 타입 B 메모리(223) 또는 타입 A 메모리(221)로 보내는 것은 바람직하기 않은 효과들 중 적어도 일부를 감소시키거나 제거할 수 있다. 랜덤 기록들이 타입 B 메모리(223) 또는 타입 A 메모리(221)으로 커밋(committed)된 후, 데이터는 순차적 기록들을 통해(예를 들어, 데이터가 콜드해질 경우) 타입 C 메모리(225)로 복사될 수 있다. 따라서, 데이터 스트림 분리기(223)는 초기에 타입 B 메모리(223)(또는 타입 A 메모리(221))에 커밋된 랜덤 기록들을 타입 C 메모리(225)로 향하는 순차적 기록들의 스트림으로 전환 및/또는 감소시킬 수 있다.
일반적으로, 프로세싱 장치(118)는 아래에서 더 논의되는 바와 같이, 페이징 기술 및/또는 메모리 맵 인터페이스를 사용하여 컴퓨터 시스템의 메모리의 일부가 컴퓨터 시스템의 메모리의 다른 일부를 통해 액세스되는 메모리 액세스의 가속을 포함하는, 서비스들을 제공하기 위해 하나 이상의 운영 체제들을 실행할 수 있다.
도 6은 데이터 스트림 분리기(113)를 갖는 시스템을 도시한다. 예를 들어, 도 6의 시스템은 도 1 또는 2의 컴퓨터 시스템에 구현될 수 있다.
도 6의 시스템은 도 1 또는 2의 컴퓨터 시스템의 프로세싱 장치(118)에서 실행될 수 있는 호스트 운영 체제(241)를 포함한다. 호스트 운영 체제(241)는 메모리 모듈(205), 저장 장치(209) 및/또는 원격 장치(114)와 같은 메모리 서브 시스템들의 메모리(예를 들어, 221, ..., 223, ..., 225)를 사용하여 메모리 서비스들을 제공하는 하나 이상의 장치 드라이브들을 포함한다.
호스트 운영 체제(241)는 가상 머신(249)를 프로비저닝하는 하이퍼바이저(245)를 포함한다. 가상 머신(249)는 도 1 또는 2의 컴퓨팅 시스템의 하드웨어를 사용하여 호스트 운영 체제(241)에 의해 제공되는 리소스들 및 서비스들을 통해 구현되는 가상 하드웨어를 갖는다. 예를 들어, 하이퍼바이저(245)는 메모리 모듈(205) 및/또는 저장 장치(209)와 같은, 메모리 서브 시스템들의 메모리(예를 들어, 221, ..., 223, ..., 225)의 일부를 사용하여 가상 머신(249)의 일부로서 가상 메모리를 프로비저닝할 수 있다.
가상 머신(249)은 게스트 운영 체제(243)가 가상 머신에서의 프로비저닝과 동일하거나 유사한 하드웨어 세트를 갖는 물리적 컴퓨팅 시스템에서 실행되는 운영 체제(243)와 같은 방식으로, 게스트 운영 체제(243)에서 실행되는 어플리케이션들(예를 들어, 251, ..., 253)에 리소스들 및/또는 서비스들을 제공하도록 한다. 하이퍼바이저(245)는 가상 머신에서 프로비저닝된 가상 하드웨어와 호스트 운영 체제(241)에 의해 관리되는 컴퓨팅 시스템의 하드웨어의 서비스들 사이의 맵핑을 관리한다.
도 6은 가상 머신(249)이 하이퍼바이저(245)에 의해 프로비저닝되는 경우를 예시한다. 일반적으로, 하이퍼바이저(245)는 동일한 게스트 운영 체제(243) 또는 다른 게스트 운영 체제(예: 243)를 실행할 수 있는 복수의 가상 머신들(예: 249)을 프로비저닝할 수 있다. 다른 사용자 세트들 및/또는 어플리케이션 프로그램들은 다른 가상 머신들을 사용하도록 할당될 수 있다.
일부 경우, 호스트 운영 체제(241)는 가상 머신들을 프로비저닝하기 위한 서비스들을 제공하도록 특화되며, 다른 어플리케이션 프로그램들을 실행하지 않는다. 대안으로, 호스트 운영 체제(241)는 어플리케이션들(예를 들어, 251, ..., 253)과 같은 다른 어플리케이션 프로그램들을 지원하기 위한 추가 서비스들을 제공할 수 있다.
도 6에서, 하이퍼바이저(245)는 단일 루트 I/O 가상화를 사용하여 서로 다른 특성들/속성들의 데이터 스트림을 구성하도록 구성된다. 예를 들어, 메모리 모듈(205)은 다수의 가상 기능들(예: 247)을 구현할 수 있는 물리적 기능(246)을 갖는다. 가상 기능(247)은 물리적 기능(246)을 통해 메모리 모듈(205)의 서비스를 제공한다. 하이퍼바이저(245)는 특정 가상 머신(249), 특정 어플리케이션(예를 들어, 251 또는 253), 특정 사용자 계정 등에 의한 메모리 액세스를 위해 가상 기능(246)을 할당하고 예약한다. 따라서, 메모리 모듈(205)에 액세스하는 데 사용되는 가상 기능(247)의 식별정보는 가상 머신(249), 어플리케이션(251) 및/또는 가상 기능(247)을 사용하여 이루어진 데이터 액세스와 관련되거나 담당하는 사용자 계정의 식별정보들과 같은, 데이터 액세스에 대한 데이터 사용 정보를 추론하는 데 사용될 수 있다. 이러한 정보는 기계 학습의 데이터 스트림 분리기(113)에서 사용되어 데이터 워크로드 및/또는 이동을 예측하고 실시간 예측을 할 수 있다.
예를 들어, 데이터 스트림 분리기(113)는 데이터 아이템이 가상 머신(249), 가상 시스템에서 실행되는 어플리케이션(251) 및/또는 어플리케이션(251)을 운영하는 사용자 계정에 의한 사용을 위해 실제로 요청되기 전에 더 느린 메모리에서 데이터 아이템의 사용을 예측하고 데이터 아이템을 더 빠른 메모리로 로드하도록 트레이닝될 수 있다. 예측은 아이템을 사용하려는 요청이 메모리 모듈(205)에 도달하기 전에 데이터 아이템을 사용하기 위한 요청과 아이템을 더 빠른 메모리로 로딩, 전송 및/또는 캐싱함으로써 더 빠른 메모리에 있는 아이템의 이용 가능성 사이의 시간을 줄이며, 이는 페이지의 데이터 액세스를 가속화한다.
바람직하게는, 예측 데이터 이동은 메모리 모듈(205), 토우(toe) 메모리 모듈(205)에 연결된 저장 장치(209) 및/또는 메모리 모듈(205)에 연결된 제거 장치(114)의 조합과 같은, 데이터 스트림 분리기(113)에 의해 제어되는 동일한 메모리 서브 시스템 내에서 수행된다. 예를 들어, 예측 데이터 이동은 데이터 스트림 분리기(113)로부터의 하나 이상의 명령, 요청 또는 인스트럭션에 응답하여 메모리 모듈(205)의 컨트롤러(227)의 제어 하에서, 메모리 모듈(205)의 더 느린 메모리(223)와 메모리 모듈(205)의 더 빠른 메모리(221) 사이에서 데이터를 복사하도록 수행될 수 있다. 예를 들어, 예측 데이터 이동은 메모리 모듈(205)과 저장 장치(209) 사이 또는 메모리 모듈(205)과 원격 장치(114) 사이에서 데이터를 복사하도록 수행될 수 있다.
일 예에서, 컨트롤러(227)는 메시지 전달 인터페이스(MPI)를 구현하고 가변 길이 메시징 성능을 갖도록 구성된다. 메시징 성능은 컨트롤러(227)가 저장 장치(209) 및/또는 제거 장치(114)와 통신하여 호스트 시스템(120)으로부터의 개입없이 데이터 스트림을 보내도록 한다. 메시징 성능에 대한 일부 세부사항들 및 예들은 2018년 8월 3일자로 출원된, "Memory Access Communications through Message Passing Interface Implemented in Memory Systems"이라는 명칭의 미국 특허 출원 일련 번호 제16/054,890호에서 찾아볼 수 있다.
일 실시예에서, 하이퍼바이저(245)는 장치 드라이버에게 메모리 서브 시스템(예: 메모리 모듈(205) 또는 저장 장치(209))의 메모리(예: 221, ..., 223, ... 또는 225)에 액세스할 것을 요청할 뿐만 아니라, 장치 드라이버에게 메모리(예: 221, ..., 223 또는 225) 내의 어느 데이터 아이템들이 후속 기간에 사용될 가능성이 높은 지 그리고 메모리(예: 메모리(예를 들어, 221, ..., 223, ... 또는 225)) 내의 어느 데이터 아이템들이 후속 시간 기간에 사용되지 않을 가능성이 높은 지의 예측들을 수행하는 데 사용될 수 있는 정보를 제공한다. 정보는 가상 머신(249), 어플리케이션(251), 사용자 계정 등과 같은 특정 데이터 사용 속성들과 사전 연관된 가상 기능들(예: 247)의 사용을 통해 적어도 부분적으로 제공될 수 있다.
예를 들어, 사용될 가능성이 높은 페이지는 핫(hot) 페이지로 지칭될 수 있으며; 사용되지 않을 가능성이 높은 페이지는 콜드(cold) 페이지로 지칭될 수 있다. 후속 시간 기간에 페이지가 사용될 가능성은 페이지의 온도로 지칭될 수 있다. 데이터 스트림 분리기(113)는 하이퍼바이저(245)에 의해 제공/식별된 정보를 사용하여 페이지들의 온도들을 예측하고, 콜드 페이지들을 더 빠른 메모리에서 더 느린 메모리로 이동시키고, 핫(hot) 페이지들을 더 느린 메모리에서 더 빠른 메모리로 이동시켜 메모리(예를 들어, 221, ..., 223, ..., 또는 225)의 페이지들의 분배를 최적화하고 데이터 액세스를 가속화시킨다.
예측들을 하기 위해 하이퍼바이저(245)에 의해 제공되고 데이터 스트림 분리기(113)에 의해 사용된 정보의 예들은, 이전 기간에 사용되는 페이지들의 시퀀스들, 더 느린 메모리에서 더 빠른 메모리로 페이지들을 로드하기 위한 요청들의 인스턴스들, 페이지들의 콘텐트 속성들, 페이지들의 소유권 속성들, 페이지들의 사용자들 또는 어플리케이션들의 식별정보들, 페이지들이 가상 머신 및/또는 사용자 계정에서 순차적 모드로 액세스되는지 여부의 표시, 페이지 액세스들이 안정 상태에 있는지 여부의 표시, 사용된 페이지가 거대한 페이지와 연관되는지 여부의 표시, 데이터 블록들과 오브젝트들 사이의 맵핑 등을 포함한다.
도 7은 예측 모델(265)을 갖는 데이터 스트림 분리기(113)의 구현예를 예시한다.
도 7에서, 데이터 스트림 분리기(113)는 캐시 컨트롤러(273) 및 워크로드 인식기(263)를 포함한다. 워크로드 인식기(263)는 인공 신경망을 사용하여 구현될 수 있는 예측 모델(265)을 포함한다.
캐시 컨트롤러(273)는 호스트 시스템(120)으로부터의 데이터 액세스 요청들(271)을 처리한다. 캐시 컨트롤러(273)는 낮은 성능의 메모리에 대해 캐시로 사용되는 고성능 메모리를 모니터링하고, 캐시의 사용량을 분석하고, 캐시 사용량을 최적화하고, 캐시의 사용을 관리한다. 종래 캐시 기술들은 캐시 컨트롤러(273)에서 구현될 수 있다.
데이터 액세스 요청들(271)에 응답하여, 캐시 컨트롤러(273)는 요청들(271)에 의해 대상이 되는 데이터가 요청들(271)의 시점에 고성능 메모리에 있는지를 결정한다. 그렇다면, 캐시 컨트롤러(273)는 대응되는 데이터 액세스 요청들(271)을 캐시 히트로 카운팅하며; 그렇지 않은 경우, 캐시 컨트롤러(273)는 대응되는 데이터 액세스 요청들(271)을 캐시 미스로 카운팅한다. 따라서, 캐시 컨트롤러(273)는 데이터 액세스 요청들(271)의 시점에 데이터 분배에 대한 캐시 히트율(275)의 측정을 생성할 수 있다.
선택적으로, 캐시 컨트롤러(273)은 대응되는 데이터를 더 높은 성능의 메모리에 캐싱/로딩하지 않고 더 낮은 성능의 메모리로부터 직접 데이터 액세스 요청들(271)의 일부를 서비스할 수 있다.
캐시 컨트롤러(273)에 사용된 캐시 정책은 캐시 컨트롤러(273)에 의해 구현되는 데이터 이동(data movements)(277)을 식별하는 데 사용될 수 있다.
데이터 액세스 요청들(271)에 대응되는 데이터 사용 정보(261)는 예측 모델(265)의 트레이닝을 위한 컴퓨팅 시스템 운용의 초기 기간 동안 수집된다. 예를 들어, 감독된 기계 학습 기술은 데이터 액세스 요청들(271)에 응답하여 캐시 컨트롤러(273)에 의해 구현되는 데이터 이동(272)과 데이터 액세스 요청들(271)에 대응되는 데이터 사용 정보(261)를 사용한 예측 모델(265)을 사용하여 예측된 데이터 이동(269) 사이의 차이를 최소화하기 위해 예측 모델(265)의 인공 신경망을 트레이닝시키는 데 사용될 수 있다. 기계 학습은 초기 예측 모델(265)을 확립하기 위해 다른 컴퓨팅 장치 상에서 오프라인으로 수행될 수 있다.
이후, 예측 모듈(265)은 실시간 데이터 사용 정보(261) 및 실시간 데이터 액세스 요청들(271)에 기초하여 데이터 이동(269)의 실시간 예측을 하기 위한 워크로드 인식기(263)에 사용될 수 있다. 워크로드 인식기(263)는 캐쉬 히트율(275)에 변화를 일으킬 수 있는 예측 데이터 측정을 수행하도록 캐시 컨트롤러(273)에 지시한다. 예측 모델(265)는 캐시 히트율(275)을 지속적으로 상승시키기 위해 하이브리드 강화 기계 학습 기술을 사용하여 실시간으로 조정 및/또는 트레이닝된다. 따라서, 예측 모델(265)은 캐시 컨트롤러(273)만을 통해 달성될 수 있는 것보다 더 높은 캐시 히트율(275)을 달성하기 위해 컴퓨팅 시스템의 현재 워크로드에 자동으로 적응하고 예측 데이터 이동(269)을 구현할 수 있다.
바람직하게는, 워크로드 인식기(263)에 의해 이루어진 예측들은 블록 대 오브젝트 맵(267)에 적어도 부분적으로 기초한다. 데이터 사용 정보(261)의 통계적 분석을 위해, 데이터 스트림 분리기(113)는 데이터 블록들 간의 기본 관계들을 식별할 수 있다. 예를 들어, 일부 데이터 블록들은 어플리케이션에서 동일한 데이터 오브젝트의 부분들을 나타내고; 데이터 객체들의 부분들이 함께 액세스되고; 일부 데이터 오브젝트들은 특정 순서로 액세스되는 패턴을 가지며; 가상 머신에서 어플리케이션을 실행하는 사용자 계정에서의 하나의 데이터 오브젝트에 대한 액세스는 다른 데이터 오브젝트에 대한 액세스로 이어질 가능성이 높을 수 있다. 블록 대 오브젝트 맵(267)은 워크로드 인식기(263)의 예측 정확도를 향상시키는 관계들을 식별한다.
일 예에서, 데이터 스트림 분리기(113)는, 프로세싱 장치(118)로부터, 다중 계층의 메모리 컴포넌트들(예를 들어, 도 1의 109A, ..., 109N; 또는 도 2의 221, ..., 223, ..., 225)을 갖는 메모리 서브 시스템(110)에 대한 데이터 액세스 요청들(231)을 수신할 수 있다.
예를 들어, 상이한 계층들의 메모리는 상위 계층(예: 221), 중간 계층(예: 223) 및 하위 계층(예: 225)을 포함할 수 있다. 상위 계층(예: 221)은 동적 랜덤 액세스 메모리(DRAM) 및/또는 교차점 메모리를 사용하여 구현될 수 있다. 일부 경우에, DRAM과 에너지 저장 유닛(예를 들어, 커패시터 및/또는 배터리)가 있는 교차점 메모리의 조합은 전원 안전 루틴의 구현을 지원할 수 있으며, 여기서 시스템 전원의 예기치 않은 상실에 응답하여, 에너지 저장 유닛에서 이용할 수 있는 전원은 긴급 셧다운 프로세스에서 DRAM 내의 데이터를 교차점 메모리로 저장하는 데 사용될 수 있어, 예기치 않은 시스템 전원의 상실로 인해 DRAM 내의 데이터가 손상되거나 상실되지 않도록 한다. 따라서, 상기 조합은 DRAM의 액세스 속도와 교차점 메모리의 비휘발성 특성들의 이점을 갖는다.
예를 들어, 중간 계층(예: 223)은 단일 레벨 셀(SLC) 플래시 메모리를 사용하여 구현될 수 있으며; 하위 계층(예: 225)은 트리플 레벨 셀(TLC) 플래시 메모리 또는 쿼드 레벨 셀(QLC) 플래시 메모리를 사용하여 구현될 수 있다.
다른 예에서, 상위 계층(예: 221)은 휘발성 랜덤 액세스 메모리(예를 들어, DRAM 또는 SRAM)을 사용하여 구현될 수 있고; 중간 계층(예: 223)은 교차점 메모리를 사용하여 구현되며; 하위 계층(예: 225)은 플래시 메모리를 사용하여 구현된다.
예를 들어, 상부 계층 메모리(예: 221)는 컨트롤러(227)를 갖는 메모리 모듈(205)에 구성될 수 있고; 중간 계층 메모리(예: 223)는 호스트 시스템(120)을 거치지 않고 메모리 모듈(205)의 컨트롤러(227)에 연결되는 개별 컨트롤러들(229)을 갖는 하나 이상의 저장 장치(209)에 구성될 수 있으며; 하위 계층 메모리(예: 225)는 호스트 시스템(120)을 거치지 않고 메모리 모듈(205)의 컨트롤러(227)에 또한 연결된 개별 컨트롤러들(229)을 갖는 하나 이상의 추가 저장 장치(209)에 구성될 수 있다.
예를 들어, 상부 계층 메모리(예: 221)는 컨트롤러(227)를 갖는 메모리 모듈(205)에 구성될 수 있고; 중간 계층 메모리(예: 223)는 호스트 시스템(120)을 거치지 않고 메모리 모듈(205)의 컨트롤러(227)에 연결되는 개별 컨트롤러들(229)을 갖는 하나 이상의 저장 장치(209)에 구성될 수 있으며; 하위 계층 메모리(예: 225)는 컴퓨터 네트워크(219)를 통해 메모리 모듈(205)의 컨트롤러(227)에 연결되는 개별 컨트롤러들을 갖는 하나 이상의 원격 장치들(114)에 구성될 수 있다.
데이터 스트림 분리기(113)는 데이터 액세스 요청들(231) 및 요청들의 액세스 특성들에 따라 다수의 데이터 액세스 스트림들(예를 들어, 233 내지 238)을 생성할 수 있다.
예를 들어, 데이터 액세스 스트림들의 특성들은 데이터 액세스 스트림들 내의 데이터의 액세스 빈도 레벨들에 기초하고 데이터 액세스 스트림들 내의 어드레스들의 랜덤성(randomness) 레벨들에 기초할 수 있다. 데이터 스트림 분리기(113)는 각각의 계층들에 적합한 데이터 액세스 스트림들의 식별정보에 기초하여 서로 다른 계층들 사이의 데이터 배치를 결정하도록 구성될 수 있다.
예를 들어, 제1 스트림(예: 235)은 임계값을 초과하는(예를 들어, 최근 기간에 또는 후속 기간에 대해 예측되는) 사용 빈도 레벨을 갖는 것으로 식별될 수 있으며; 제1 스트림 내의 어드레스들은 랜덤 또는 비순차적 시퀀스를 갖는다. 이러한 제1 스트림의 데이터는 상위 계층(예: 221)에 배치하기에 적합하다.
예를 들어, 제2 스트림(예: 223)은 기록 동작들을 위해 순차적 어드레스들을 갖는 것으로 식별될 수 있으며; 이러한 제2 스트림의 데이터는 하위 계층(예: 225)에 배치하기에 적합하다.
예를 들어, 제3 스트림(예: 234)은 임계값 미만인(예를 들어, 최근 기간에 또는 후속 기간에 대해 예측되는) 사용 빈도 레벨을 갖는 것으로 식별될 수 있으며; 제3 스트림 내의 어드레스들은 랜덤 또는 비순차적 시퀀스를 갖는 것으로 보인다. 이러한 제3 스트림의 데이터는 중간 계층(예: 223)에 배치하기에 적합하다.
데이터 스트림 분리기(113)는 데이터 액세스 스트림들(예를 들어, 233 내지 238)의 특성들을 메모리 컴포넌트들의 상이한 계층들의 특성들과 매칭시킬 수 있다. 데이터 스트림 분리기(113)는 데이터 액세스 스트림들의 특성들과 상이한 계층들의 메모리 컴포넌트들의 특성들의 매칭에 기초하여 데이터 액세스 스트림들(예를 들어, 233 내지 238)을 상이한 계층들의 메모리 컴포넌트들로 보낼 수 있다.
예를 들어, 데이터 스트림 분리기(113)는 높은 사용 빈도들 및 비순차적 기록들을 갖는 데이터의 스트림(235)을 상위 계층(예: 221)으로 보내고, 순차적 기록들의 스트림(233)을 하위 계층(예: 225)으로 보내며, 비순차적이고 높지 않은 빈도 기록들을 갖는 데이터의 스트림(234)을 중간 계층(예: 223)으로 보내도록 구성될 수 있다.
선택적으로, 데이터 스트림 분리기(113)는 중간 또는 하위 계층으로 향하는 스트림들(예: 234 또는 223)을 상위 계층(예: 221)에서 버퍼링하도록 메모리 모듈(205)의 컨트롤러(227)에 지시할 수 있다.
선택적으로, 스트림에 사용된 데이터의 빈도 레벨은 도 7과 관련하여 설명된 바와 같이, 인공 신경망을 갖는 예측 모델(265)에 적어도 부분적으로 기초하여 예측될 수 있다.
선택적으로, 데이터 스트림 분리기(113)는, 하나의 계층에서, 스트림을 버퍼링하는 데 사용된 계층보다 낮은 성능 레벨을 갖는 다른 계층으로 향하는 스트림을 버퍼링할 수 있다.
선택적으로, 데이터 스트림 분리기(113)는 타겟 계층(예: 223 또는 225)보다 높은 성능 레벨을 갖는 계층(예: 221)에서 다른 스트림(예: 235)의 기록 동작들을 병합 및 직렬화함으로써 타겟 계층(예: 223 또는 225)에 대한 타겟 스트림(예: 236, 237 또는 238)을 생성할 수 있다. 성능 레벨은 반복적인 기록/소거 동작들에서의 액세스 속도 및/또는 내구성일 수 있다.
도 8은 임베디드 매체 컨트롤러를 갖는 메모리 서브 시스템의 방법을 도시한다. 도 8의 방법은 하드웨어(예: 프로세싱 장치, 회로부, 전용 로직, 프로그램 가능 로직, 마이크로코드, 장치의 하드웨어, 집적 회로 등), 소프트웨어(예: 프로세싱 장치에서 실행되거나 수행된 인스트럭션들) 또는 이들의 조합을 포함할 수 있는 프로세싱 로직에 의해 수행될 수 있다. 일부 실시예들에서, 도 8의 방법은 도 1, 2, 3 또는 4의 임베디드 컨트롤러(104)에 의해 적어도 부분적으로 수행된다. 특정 시퀀스 또는 순서로 도시되어 있지만, 달리 명시되지 않는 한, 프로세스들의 순서는 수정될 수 있다. 따라서, 예시된 실시예들은 단지 예들로서 이해되어야 하고, 예시된 프로세스들은 상이한 순서로 수행될 수 있으며, 일부 프로세스들은 병행하여 수행될 수 있다. 추가로, 하나 이상의 프로세스들은 다양한 실시예들에서 생략될 수 있다. 따라서, 모든 프로세스들이 모든 실시예에서 필요한 것은 아니다. 다른 프로세스 흐름들이 가능하다.
예를 들어, 도 8의 방법은 도 6의 호스트 운영 체제(241), 도 3 및/또는 4의 임베디드 컨트롤러(104), 및 도 7의 예측 모델(265)과 함께 도 1 또는 2의 컴퓨팅 시스템에서 구현될 수 있다. 예를 들어, 상기 방법은 도 7의 캐시 컨트롤러(273) 및 워크로드 인식기(263) 및/또는 도 6의 가상 기능(247)을 통해 적어도 부분적으로 구현되는 도 4의 데이터 스트림 분리기(113)와 조합하여 구현될 수 있다.
블록(301)에서, 집적 회로 패킷(401)에 내장된 컨트롤러(104)는 집적 회로 패키지(401) 오부의 직렬 연결(441, ..., 또는 443)로부터 제1 패킷들을 수신한다.
블록(303)에서, 컨트롤러(104)는 미리 결정된 직렬 통신 프로토콜에 따라 제1 패킷들을 명령들 및 어드레스들로 변환시킨다.
블록(305)에서, 컨트롤러(104)는 명령들 및 어드레스들에 따라, 집적 회로 패키지(401) 내의 메모리 유닛들(예를 들어, 메모리 IC 다이들(403, ..., 405)에 형성됨)에서 동작한다.
예를 들어, 집적 회로 패키지(401)는 하나 이상의 집적 회로 메모리 다이들을 캡슐화할 수 있다. 일부 경우에, 다수의 집적 회로 메모리 다이들(403, ..., 405)은 동일한 집적 회로 패키지(401) 내에서 캡슐화되며, 임베디드 컨트롤러(104)에 병렬로 연결된다.
예를 들어, 집적 회로 패키지(401) 내에 캡슐화된 메모리 유닛들은 동적 랜덤 액세스 메모리(DRAM), 교차점 메모리 및/또는 플래시 메모리를 포함할 수 있다.
블록(307)에서, 컨트롤러(104)는 명령들의 적어도 일부의 결과들을 제2 패킷들로 변환시킬 수 있다.
블록(309)에서, 컨트롤러(104)는 제2 패킷들을 집적 회로 패키지(401) 외부의 직렬 연결(441, ..., 또는 443)로 전송한다.
예를 들어, 명령들은 메모리 유닛들 중 하나 이상으로부터 데이터를 검색하기 위한 판독 명령을 포함할 수 있으며; 임베디드 컨트롤러(104)는 제2 패킷들을 통해 판독 명령에 따라 검색된 데이터를 전송하도록 구성된다.
예를 들어, 임베디드 컨트롤러(104)는 집적 회로 다이들(403, ..., 405)의 상태 정보를 저장하도록 구성될 수 있다. 명령들이 집적 회로 다이(403, ..., 또는 405)의 상태를 수신하기 위한 명령을 포함하는 경우; 임베디드 컨트롤러(104)는 제2 패킷들을 사용하여 상태 정보를 전송하도록 구성된다.
임베디드 컨트롤러(104)는 집적 회로 패키지(401)에 캡슐화된 메모리 컴포넌트의 초기화 동안 구성 가능한 매체 규칙 세트를 저장할 수 있다. 임베디드 컨트롤러(104)는 마이크로프로그램을 실행함으로써 매체 규칙들을 구현하도록 구성된 시퀀서(407)를 포함할 수 있다. 예를 들어, 임베디드 컨트롤러(104)는 마이크로 프로그램 및 매체 규치들을 저장하고, 명령들의 실행 동안 매체 규칙들을 구현하기 위한 마이크로프로그램을 실행할 수 있다.
예를 들어, 다수의 메모리 컴포넌트들(421, ..., 423)은 각각의 집적 회로 패키지(401)에서 각각 캡슐화될 수 있으며, 임베디드 컨트롤러(104)를 각각 가질 수 있다. 각 임베디드 컨트롤러(104)는 제2 컨트롤러(115)에 직렬 연결을 연결하기 위한 직렬 연결 인터페이스(411)를 가질 수 있다. 제2 컨트롤러는 병행하여 사용될 수 있는 개별 직렬 연결들(441, ..., 443)을 통해 메모리 컴포넌트들(421, ..., 423)의 직렬 통신 인터페이스들(411)에 각각 연결되는 다수의 직렬 통신 인터페이스들(411)을 가질 수 있다.
또한, 상이한 성능 계층들의 메모리는 다수의 메모리 컴포넌트들(421, ..., 423)에 포함될 수 있다. 예를 들어, 상위 계층은 동적 랜덤 액세스 메모리(DRAM) 및/또는 교차점 메모리를 가질 수 있고; 중간 계층은 단일 레벨 셀(SLC) 플래시 메모리를 가질 수 있으며; 하위 계층은 트리플 레벨 셀(TLC) 플래시 메모리 및/또는 쿼드 레벨 셀(QLC) 플래시 메모리를 가질 수 있다.
선택적으로, 제2 컨트롤러(115)는 논리 대 물리 어드레스 맵핑(433)을 유지할 수 있다. 예를 들어, 제2 컨트롤러(115)는 논리 대 물리 어드레스 맵팽(433)을 사용하여 다수의 메모리 컴포넌트들(421, ..., 423) 또는 그 서브셋에 걸쳐 웨어 레벨링(431)을 수행하도록 구성될 수 있다.
선택적으로, 제2 컨트롤러(115)는 데이터 액세스 성능을 향상시키기 위해 제2 컨트롤러(115)와 복수의 메모리 컴포넌트들(421, ..., 423) 사이에서 동시에 다수의 직렬 통신 연결들(441, ..., 443)을 병행하여 사용할 수 있다. 논리 대 물리 어드레스 맵핑(433)은 병렬 동작들을 용이하게 하기 위해 동적으로 조정될 수 있다.
선택적으로, 제2 컨트롤러(115)는 직렬 통신 연결들을 통해 연결되는 컨트롤러들(예를 들어, 227, 229)의 계층을 포함할 수 있다.
일부 구현예들에서, 프로세싱 장치(118) 및 메모리 서브 시스템 사이의 통신 채널은 근거리 통신망, 무선 근거리 무선 통신망, 무선 사설 통신망, 이동 통신망, 광대역 고속 상시 연결 무선 통신 연결(예를 들어, 현재 또는 차세대 모바일 통신 링크)과 같은, 컴퓨터 네트워크를 포함하며; 프로세싱 장치(118) 및 메모리 서브 시스템은 NVMe 프로토콜과 유사한 데이터 저장 관리 및 사용 명령들을 사용하여 서로 통신하도록 구성될 수 있다.
일반적으로 메모리 서브 시스템은 비휘발성 저장 매체를 가질 수 있다. 비휘발성 저장 매체의 예들은 집적 회로에서 형성된 메모리 셀들 및 강체 디스크들에 코팅된 자성 물질을 포함한다. 비휘발성 저장 매체는 전력을 소모하지 않고 이에 저장된 데이터/정보를 유지할 수 있다. 메모리 셀은 NAND 로직 게이트, NOR 로직 게이트, 위상 변화 메모리(PCM), 자기 메모리(MRAM), 저항성 랜덤 액세스 메모리, 교차점 저장 장치 및 메모리 장치들(예를 들어, 3D X점 메모리) 과 같은, 다양한 메모리/저장 기술들을 사용하여 구현될 수 있다. 교차점 메모리 장치는 트랜지스터가 없는 메모리 소자들을 사용하며, 그 각각은 열(column)로 함께 적층되는 메모리 셀 및 선택기를 갖는다. 메모리 소자 열(column)은 두 개의 수직으로 배치된 와이어들을 통해 연결되며, 여기서 하나는 메모리 소자 열 위에 있고 다른 하나는 메모리 소자 열 아래에 있다. 각 메모리 소자는 두 레이어들 각각에 하나의 와이어의 교차점에서 개별적으로 선택될 수 있다. 교차점 메모리 장치들은 빠르고 비휘발성이며, 처리 및 저장을 위한 통합 메모리 풀(pool)로 사용될 수 있다.
메모리 서브 시스템(예: 205 또는 209)의 컨트롤러(예: 227 또는 229)는 펌웨어를 실행하여 프로세싱 장치(118)로부터의 통신에 응답하여 동작들을 수행할 수 있다. 일반적으로 펌웨어는 공학적 컴퓨팅 장치들의 제어, 모니터링 및 데이터 조작을 제공하는 컴퓨터 프로그램의 일종이다.
컨트롤러(227)의 동작을 포함하는 일부 실시예들은 컨트롤러(227)의 펌웨어와 같은, 컨트롤러(227)에 의해 실행된 컴퓨터 인스트럭션들을 사용하여 구현될 수 있다. 일부 경우, 하드웨어 회로들은 기능들 중 적어도 일부를 구현하는 데 사용될 수 있다. 펌웨어는 초기에 비휘발성 저장 매체 또는 다른 비휘발성 장치에 저장될 수 있으며, 컨트롤러(227)에 의한 실행을 위해 휘발성 DRAM 및/또는 프로세서 내 캐시 메모리에 로딩될 수 있다.
비일시적(non-transitory) 컴퓨터 저장 매체는 일반적으로 메모리 서브 시스템(예: 209 또는 205)의 펌웨어의 인스트럭션들 및/또는 운영 체제(예: 241, 243)의 인스트럭션들, 특히 장치 드라이버 및 하이퍼바이저(245)를 저장하는 데 사용될 수 있다. 인스트럭션들이 컨트롤러(227) 및/또는 프로세싱 장치(118)에 의해 실행될 때, 인스트럭션들은 컨트롤러(227) 및/또는 프로세싱 장치(118)가 위에서 논의된 방법을 수행하게 한다.
도 9는 기계가 본원에 논의된 방법론들 중 임의의 하나 이상을 수행하게 하는 인스트럭션 세트가 실행될 수 있는 컴퓨터 시스템(600)의 예시적인 상기 기계를 예시한다. 일부 실시예들에서, 컴퓨터 시스템(600)은 메모리 서브 시스템(예를 들어, 도 1의 메모리 서브 시스템(110))을 포함하거나, 이에 결합되거나 이를 이용하는 호스트 시스템(예를 들어, 도 1의 호스트 시스템(120))에 대응되거나, 데이터 스트림 분리기(113)의 동작들을 수행(예를 들어, 도 1 내지 8을 참조하여 설명된 데이터 스트림 분리기(113)에 대응되는 동작들을 수행하기 위한 인스트럭션들을 실행)하는 데 사용될 수 있다. 대안적인 실시예들에서, 기계는 LAN, 인트라넷, 엑스트라넷 및/또는 인터넷의 다른 기계들에 연결(예를 들어, 네트워킹)될 수 있다. 기계는 클라이언트-서버 네트워크 환경에서 서버 또는 클라이언트 기계의 용량으로, 피어 투 피어(또는 분배) 네트워크 환경에서의 피어 기계로, 또는 클라우드 컴퓨팅 인프라스트럭처 또는 환경에서의 서버 또는 클라이언트 기계로 동작할 수 있다.
기계는 개인용 컴퓨터(PC), 태블릿 PC, 셋톱박스(STB), 개인용 디지털 보조 장치(PDA), 셀룰러 텔레폰, 웹 기기, 서버, 네트워크 라우터, 스위치 또는 브릿지, 또는 해당 기계에 의해 수행될 조치들을 명시하는 인스트럭션 세트(순차적 또는 다른 방식)을 실행할 수 있는 임의의 기계일 수 있다. 또한, 단일 기계가 예시되어 있지만, "기계"라는 용어는 또한 본원에서 논의된 방법론들 중 임의의 하나 이상을 수행하기 위해 인스트럭션 세트(또는 복수 세트)를 개별적으로 또는 공통으로 실행하는 임의의 기계 컬렉션을 포함하는 것으로 간주해야 한다.
예시적인 컴퓨터 시스템(600)은 버스(630)(다수의 버스들을 포함할 수 있음)를 통해 서로 통신하는, 프로세싱 장치(602), 메인 메모리(604)(예: 읽기 전용 메모리(ROM), 플래시 메모리, 동기식 DRAM(SDRAM) 또는 램버스 DRAM(RDRAM)과 같은 동적 랜덤 액세스 메모리(DRAM), 정적 랜덤 액세스 메모리(SRAM) 등), 및 데이터 저장 시스템(618)를 포함한다.
프로세싱 장치(602)는 마이크로프로세서, 중앙 처리 유닛 등과 같은 하나 이상의 범용 프로세싱 장치들을 나타낸다. 보다 구체적으로, 프로세싱 장치는 CISC(complex instruction set computing) 마이크로프로세서, RISC(reduced instruction set computing) 마이크로프로세서, VLIW(very long instruction word) 마이크로프로세서, 또는 인스트럭션 세트들을 구현하는 프로세서, 또는 인스트럭션 세트들의 조합을 구현하는 프로세서들일 수 있다. 프로세싱 장치(602)는 또한 ASIC(application specific integrated circuit), FPGA(field programmable gate array), DSP(digital signal processor), 네트워크 프로세서 등과 같은 하나 이상의 특수 목적 프로세싱 장치들일 수 있다. 프로세싱 장치(602)는 본원에 논의된 동작들 및 단계들을 수행하기 위한 인스트럭션들(626)을 수행하도록 구성된다. 컴퓨터 시스템(600)은 네트워크(620)를 통해 통신하기 위한 네트워크 인터페이스 장치(608)를 더 포함할 수 있다.
데이터 저장 시스템(618)는 본원에 설명된 방법들 또는 기능들 중 임의의 하나 이상을 구현하는 하나 이상의 인스트력션 세트 또는 소프트웨어(626)가 저장되는 기계 판독 가능 저장 매체(624)(컴퓨터 판독 가능 매체라고도 함)를 포함할 수 있다. 인스트럭션들(626)은 또한 기계 판독 가능 저장 매체를 구성하는 컴퓨터 시스템(600), 메인 메모리(604) 및 프로세싱 장치(602)에 의한 실행 동안 메인 메모리(604) 내에 및/또는 프로세싱 장치(602) 내에 완전히 또는 적어도 부분적으로 상주할 수 있다. 기계 판독 가능 저장 매체(624), 데이터 저장 시스템(618) 및/또는 메인 메모리(604)는 도 1의 메모리 서브 시스템(110)에 대응될 수 있다.
일 실시예에서, 인스트럭션들(626)은 데이터 스트림 분리기(113)(예를 들어, 도 1 내지 8을 참조하여 설명된 데이터 스트림 분리기(113))에 대응되는 기능을 구현하기 위한 인스트럭션들을 포함한다. 기계 판독 가능 저장 매체(624)가 예시적인 실시에서 단일 매체인 것으로 도시되어 있지만, "기계 판독 가능 저장 매체"라는 용어는 하나 이상의 인스트럭션 세트들을 저장하는 단일 매체 또는 다중 매체를 포함하는 것으로 간주되어야 한다. "기계 판독 가능 저장 매체"라는 용어는 또한 기계에 의해 실행되는 인스트럭션 세트를 저장 또는 인코딩할 수 있고 기계가 본 개시의 방법들 중 임의의 하나 이상을 수행하게 하는 임의의 매체를 포함하는 것으로 간주되어야 한다. 따라서, "기계 판독 가능 저장 매체"라는 용어는, 이에 제한되는 것은 아니나, 솔리드 스테이트 메모리들, 광학 매체 및 자기 매체를 포함하는 것으로 간주되어야 한다.
전술한 상세한 설명의 일부 부분들은 컴퓨터 메모리 내의 데이터 비트들에 대한 연산의 알고리즘 및 상징적 표현들과 관련하여 제시되었다. 이러한 알고리즘적 설명들 및 표현들은 데이터 처리 분야의 당업자가 그들 작업의 실체를 다른 당업자에게 가장 효과적으로 전달하기 위해 사용되는 방식들이다. 여기서, 알고리즘은 일반적으로 원하는 결과를 도출하는 자기 모순 없는(self-consistent) 동작 시퀀스인 것으로 생각된다. 동작들은 이러한 물리적 수량의 물리적 조작을 필요로 한다. 일반적으로, 반드시 그런 것은 아니지만, 이러한 양은 저장되고, 결합되고, 비교되고 아니면 조작될 수 있는 전기 또는 자기 신호들의 형태를 취한다. 이러한 신호들을 비트, 값, 요소, 심볼, 문자, 용어, 숫자 등으로 지칭하는 것이, 주로 일반적인 사용의 이유로, 때때로 편리한 것으로 입증되었다.
그러나, 이러한 및 유사한 용어들 모두는 적절한 물리적 양과 관련이 있으며 이러한 양에 적용되는 편리한 라벨들일 뿐이라는 점을 명심해야 한다. 본 개시는 컴퓨터 시스템의 레지스터들과 메모리들 내에서 물리적(전자적) 양으로 표현되는 데이터를 컴퓨터 시스템 메모리들 또는 레지스터들 또는 다른 이러한 정보 저장 시스템들 내의 물리적 양으로 표현되는 다른 데이터로 조작하고 변환하는 컴퓨터 시스템 또는 이와 유사한 전자 컴퓨팅 장치의 동작 및 프로세스들을 인용할 수 있다.
본 개시는 또한 본원에서 동작들을 수행하기 위한 장치에 관한 것이다. 이 장치는 의도된 목적들을 위해 특별히 구성될 수 있거나, 이는 컴퓨터에 저장된 컴퓨터 프로그램에 의해 선택적으로 활성화되거나 재구성된 범용 컴퓨터를 포함할 수 있다. 이러한 컴퓨터 프로그램은, 이에 제한되는 것은 아니나, 플로피 디스크, 광 디스크, CD-ROM, 및 자기-광학 디스크, 읽기 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), EPROM, EEPROM, 자기 또는 광학 카드, 또는 각각 컴퓨터 시스템 버스에 연결된 전자 인스트럭션들을 저장하기에 적합한 임의의 유형의 매체를 포함하는 임의 유형의 디스크와 같은 컴퓨터 판독 가능 저장 매체에 저장될 수 있다.
본원에 제시된 알고리즘들 및 디스플레이들은 본질적으로 임의의 특정 컴퓨터 또는 다른 장치와 관련되지 않는다. 다양한 범용 시스템들은 본원의 교시에 따른 프로그램들과 함께 사용될 수 있거나, 방법을 수행하기 위해 다 특화된 장치를 구성하는 것이 편리하다는 것을 입증할 수 있다. 다양한 이들 시스템들의 구조는 아래의 설명에서 제시되는 것으로 나타날 것이다. 또한, 본 개시는 임의의 특정 프로그래밍 언어를 참조하여 설명되지 않는다. 다양한 프로그래밍 언어들이 본원에 기술된 바와 같이 본 개시의 교시를 구현하는 데 사용될 수 있음이 이해될 것이다.
본 개시는 본 개시에 따른 프로세스를 수행하기 위해 컴퓨터 시스템(또는 다른 전자 장치)를 프로그래밍하는 데 사용될 수는, 인스트럭션들을 저장한 기계 판독 가능 매체를 포함할 수 있는 컴퓨터 프로그램 제품 또는 소프트웨어로서 제공될 수 있다. 기계 판독 가능 매체는 기계(예: 컴퓨터)에 의해 판독 가능한 형태로 정보를 저장하기 위한 임의의 메커니즘을 포함한다. 일부 실시예들에서, 기계 판독 가능(예: 컴퓨터 판독 가능) 매체는 읽기 전용 메모리( "ROM"), 랜덤 액세스 메모리( "RAM"), 자기 디스크 저장 매체, 광 저장 매체, 플래시 메모리 컴포넌트들 등과 같은 기계(예: 컴퓨터) 판독 가능 저장 매체를 포함한다.
이 설명에서, 다양한 기능들 및 동작들은 설명을 단순화하기 위해 컴퓨터 명령에 의해 수행되거나 컴퓨터 명령에 의해 야기되는 것으로 설명된다. 그러나, 당업자는 이러한 표현이 의미하는 것이 마이크로프로세서와 같은 하나 이상의 컨트롤러들 또는 프로세서들에 의한 컴퓨터 인스트럭션들의 실행으로 인한 기능들이라는 것을 인식할 것이다. 대안으로, 또는 조합하여, 기능들 및 동작들은 어플리케이션별 집적 회로(ASIC) 또는 필드 프로그램 가능 게이트 어레이(FPGA)를 사용하는 것과 같은, 소프트웨어 인스트력션들이 있든 없든 특수 목적 회로부를 사용하여 구현될 수 있다. 실시예들은 소프트웨어 인스트럭션들 없이 하드와이어링된 회로부를 사용하거나, 소프트웨어 인스트럭션들과 조합하여 구현될 수 있다. 따라서, 기술들은 하드웨어 회로부와 소프트웨어의 임의의 특정 조합이나, 데이터 프로세싱 시스템에 의해 실행된 인스트럭션들에 대한 임의의 특정 출처에 제한되지 않는다.
전술한 명세서에서, 본 개시의 실시예들은 그 특정 예시적인 실시예들을 참조하여 설명되었다. 다음의 청구 범위에 명시된 본 개시의 실시예들의 넓은 사상 및 범위를 벗어나지 않고 다양한 변형들이 이루어질 수 있음이 명백할 것이다. 따라서, 명세서 및 도면들은 제한적인 의미보다는 예시적인 의미로 간주되어야 한다.

Claims (14)

  1. 메모리 컴포넌트에 있어서,
    복수의 메모리 유닛들을 갖는 집적 회로 메모리 다이들 - 상기 집적 회로 메모리 다이들은 제1 액세스 속도를 갖는 제1 메모리 계층 및 상기 제1 액세스 속도보다 느린 제2 액세스 속도를 갖는 제2 메모리 계층을 포함함 -;
    직렬 통신 인터페이스를 포함하는 임베디드 컨트롤러 - 상기 임베디드 컨트롤러는 상기 직렬 통신 인터페이스를 통해 컨트롤러의 데이터 스트림 분리기로부터 패킷들을 수신하도록 구성됨 -; 및
    상기 임베디드 컨트롤러 및 상기 집적 회로 메모리 다이들을 캡슐화하는 집적 회로 패키지를 포함하며,
    상기 집적 회로 메모리 다이들의 상기 메모리 유닛들에 동작 가능하게 결합된, 상기 임베디드 컨트롤러는 적어도,
    상기 직렬 통신 인터페이스를 통해, 상기 집적 회로 패키지 외부의 직렬 연결로부터 제1 패킷들을 수신하고;
    상기 제1 패킷들을 명령들 및 어드레스들로 변환시키고 - 상기 제1 패킷들은 기록 명령 및 상기 기록 명령과 연관된 데이터의 분류를 표시하는 상기 데이터 스트림 분리기로부터의 데이터를 포함함 -;
    상기 명령들 및 상기 어드레스들에 따라 상기 메모리 유닛들을 동작시키고 - 상기 메모리 유닛들을 동작시키는 것은, 상기 데이터 스트림 분리기로부터의 데이터에 기초하여 상기 제2 메모리 계층에 상기 기록 명령과 연관된 데이터를 저장하는 것을 포함함 -;
    상기 명령들의 적어도 일부의 결과들을 제2 패킷들로 변환시키고;
    상기 직렬 통신 인터페이스를 통해 상기 제2 패킷들을 상기 집적 회로 패키지 외부의 상기 직렬 연결로 전송하도록 구성되는, 메모리 컴포넌트.
  2. 제1항에 있어서, 상기 집적 회로 메모리 다이들은 상기 임베디드 컨트롤러에 병렬로 연결된 다수의 다이들을 포함하는, 메모리 컴포넌트.
  3. 제2항에 있어서, 상기 메모리 유닛들은 동적 랜덤 액세스 메모리(DRAM), 교차점 메모리 또는 플래시 메모리, 또는 이들의 임의의 조합을 포함하고, 상기 DRAM은 상기 제1 메모리 계층에 포함되고, 상기 플래시 메모리는 상기 제2 메모리 계층에 포함되는, 메모리 컴포넌트.
  4. 제1항에 있어서, 상기 명령들은 상기 메모리 유닛들 중 하나 이상으로부터 데이터를 검색하기 위한 판독 명령을 포함하고; 상기 임베디드 컨트롤러는 상기 판독 명령에 따라 검색된 상기 데이터를 상기 제2 패킷들을 통해 전송하도록 구성되는, 메모리 컴포넌트.
  5. 제1항에 있어서, 상기 임베디드 컨트롤러는 상기 집적 회로 메모리 다이들의 상태 정보를 저장하도록 구성되고; 상기 명령들은 상기 집적 회로 메모리 다이들의 상태를 검색하기 위한 명령을 포함하며; 상기 임베디드 컨트롤러는 상기 제2 패킷들을 사용하여 상기 상태 정보를 전송하도록 구성되는, 메모리 컴포넌트.
  6. 제1항에 있어서, 상기 임베디드 컨트롤러는 매체 규칙 세트를 저장하고; 상기 임베디드 컨트롤러는 마이크로프로그램을 사용하여 상기 매체 규칙들을 구현하도록 구성된 시퀀서를 더 포함하며; 상기 매체 규칙들은 상기 메모리 컴포넌트의 초기화 동안 구성 가능한, 메모리 컴포넌트.
  7. 컴퓨팅 시스템에 있어서,
    프로세싱 장치;
    복수의 메모리 컴포넌트들로서, 상기 복수의 메모리 컴포넌트들의 각각의 메모리 컴포넌트 각각은,
    복수의 메모리 유닛들을 갖는 집적 회로 메모리 다이들 - 상기 집적 회로 메모리 다이들은 제1 액세스 속도를 갖는 제1 메모리 계층 및 상기 제1 액세스 속도보다 느린 제2 액세스 속도를 갖는 제2 메모리 계층을 포함함 -; 및
    직렬 통신 인터페이스를 포함하는 제1 컨트롤러를 갖는, 상기 복수의 메모리 컴포넌트들; 및
    데이터 스트림 분리기 및 복수의 직렬 통신 인터페이스들을 갖는 제2 컨트롤러로서, 상기 복수의 직렬 통신 인터페이스들 각각은 개별 직렬 통신 연결을 통해 상기 복수의 메모리 컴포넌트들의 각각의 메모리 컴포넌트의 상기 직렬 통신 인터페이스에 연결되는, 상기 제2 컨트롤러를 포함하고,
    상기 제1 컨트롤러는,
    상기 개별 직렬 통신 연결로부터 제1 패킷들을 수신하고;
    상기 제1 패킷들을 명령들 및 어드레스들로 변환시키고 - 상기 제1 패킷들은 기록 명령 및 상기 기록 명령과 연관된 데이터의 분류를 표시하는 상기 데이터 스트림 분리기로부터의 데이터를 포함함 -;
    상기 명령들 및 상기 어드레스들에 따라 상기 메모리 유닛들을 동작시키도록 구성되고, 상기 메모리 유닛들을 동작시키는 것은, 상기 데이터 스트림 분리기로부터의 데이터에 기초하여 상기 제2 메모리 계층에 상기 기록 명령과 연관된 데이터를 저장하는 것을 포함하는, 컴퓨팅 시스템.
  8. 제7항에 있어서, 상기 제1 컨트롤러를 포함하는 상기 각각의 메모리 컴포넌트는 집적 회로 패키지 내에서 캡슐화되며; 상기 복수의 메모리 컴포넌트들은 상이한 성능 계층들의 메모리를 포함하는, 컴퓨팅 시스템.
  9. 제8항에 있어서, 상기 상이한 성능 계층들은 동적 랜덤 액세스 메모리(DRAM) 또는 교차점 메모리를 갖는 상위 계층, 단일 레벨 셀(SLC) 플래시 메모리를 갖는 중간 계층, 및 트리플 레벨 셀(TLC) 플래시 메모리 또는 쿼드 레벨 셀(QLC) 플래시 메모리를 갖는 하위 계층을 포함하는, 컴퓨팅 시스템.
  10. 제8항에 있어서, 상기 제2 컨트롤러는 직렬 통신 연결들을 통해 연결된 컨트롤러들의 계층을 포함하는, 컴퓨팅 시스템.
  11. 제10항에 있어서, 상기 제2 컨트롤러는 논리 대 물리 어드레스 맵핑을 유지하거나, 상기 논리 대 물리 어드레스 맵핑을 사용하여 상기 복수의 메모리 컴포넌트들에 걸쳐 웨어 레벨링을 수행하거나, 또는 상기 제2 컨트롤러와 상기 복수의 메모리 컴포넌트들 사이에서 병렬로 다수의 직렬 통신 연결들을 동시에 사용하도록 구성되거나, 또는 이들의 임의의 조합인, 컴퓨팅 시스템.
  12. 방법에 있어서,
    집적 회로 패키지에 내장된 컨트롤러에서, 상기 집적 회로 패키지 외부의 직렬 연결로부터 제1 패킷들을 수신하는 단계;
    상기 컨트롤러에 의해, 상기 제1 패킷들을 명령들 및 어드레스들로 변환시키는 단계 - 상기 제1 패킷들은 기록 명령 및 상기 기록 명령과 연관된 분류를 표시하는 데이터를 포함함 -;
    상기 컨트롤러에 의해 상기 집적 회로 패키지 내의 메모리 유닛들 상에서, 상기 명령들 및 상기 어드레스들에 따라 동작시키는 단계 - 상기 메모리 유닛들은 제1 액세스 속도를 갖는 제1 메모리 계층 및 상기 제1 액세스 속도보다 느린 제2 액세스 속도를 갖는 제2 메모리 계층을 포함하고, 상기 동작시키는 것은, 상기 분류에 기초하여 상기 제2 메모리 계층에 상기 기록 명령과 연관된 데이터를 저장하는 것을 포함함 -;
    상기 명령들의 적어도 일부의 결과들을 제2 패킷들로 변환시키는 단계; 및
    상기 컨트롤러에 의해, 상기 제2 패킷들을 상기 집적 회로 패키지 외부의 상기 직렬 연결로 전송하는 단계를 포함하는, 방법.
  13. 삭제
  14. 제12항에 있어서,
    상기 컨트롤러에서, 상기 집적 회로 패키지 내에 캡슐화된 집적 회로 다이들의 상태 정보를 유지하는 단계; 및
    상기 제1 패킷들로부터 변환된 명령에 응답하여 상기 상태 정보를 제공하는 단계를 더 포함하는, 방법.
KR1020207025384A 2018-02-05 2019-01-16 집적 회로 메모리의 패키지에 내장된 컨트롤러를 갖는 메모리 시스템 KR102428791B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862626527P 2018-02-05 2018-02-05
US62/626,527 2018-02-05
US16/162,905 2018-10-17
US16/162,905 US20190243787A1 (en) 2018-02-05 2018-10-17 Memory Systems having Controllers Embedded in Packages of Integrated Circuit Memory
PCT/US2019/013841 WO2019152192A1 (en) 2018-02-05 2019-01-16 Memory systems having controllers embedded in packages of integrated circuit memory

Publications (2)

Publication Number Publication Date
KR20200108363A KR20200108363A (ko) 2020-09-17
KR102428791B1 true KR102428791B1 (ko) 2022-08-04

Family

ID=67476065

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207025384A KR102428791B1 (ko) 2018-02-05 2019-01-16 집적 회로 메모리의 패키지에 내장된 컨트롤러를 갖는 메모리 시스템

Country Status (6)

Country Link
US (1) US20190243787A1 (ko)
EP (1) EP3750046A4 (ko)
KR (1) KR102428791B1 (ko)
CN (1) CN111684406A (ko)
TW (1) TWI711930B (ko)
WO (1) WO2019152192A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11099789B2 (en) 2018-02-05 2021-08-24 Micron Technology, Inc. Remote direct memory access in multi-tier memory systems
US11416395B2 (en) 2018-02-05 2022-08-16 Micron Technology, Inc. Memory virtualization for accessing heterogeneous memory components
US10782908B2 (en) 2018-02-05 2020-09-22 Micron Technology, Inc. Predictive data orchestration in multi-tier memory systems
US10880401B2 (en) 2018-02-12 2020-12-29 Micron Technology, Inc. Optimization of data access and communication in memory systems
US10877892B2 (en) 2018-07-11 2020-12-29 Micron Technology, Inc. Predictive paging to accelerate memory access
US11133059B2 (en) * 2018-12-06 2021-09-28 Western Digital Technologies, Inc. Non-volatile memory die with deep learning neural network
US10916306B2 (en) 2019-03-07 2021-02-09 Western Digital Technologies, Inc. Burst mode operation conditioning for a memory device
US10852949B2 (en) 2019-04-15 2020-12-01 Micron Technology, Inc. Predictive data pre-fetching in a data storage device
US11520521B2 (en) 2019-06-20 2022-12-06 Western Digital Technologies, Inc. Storage controller having data augmentation components for use with non-volatile memory die
US11501109B2 (en) 2019-06-20 2022-11-15 Western Digital Technologies, Inc. Non-volatile memory die with on-chip data augmentation components for use with machine learning
CN111758160B (zh) * 2020-05-20 2021-10-01 长江存储科技有限责任公司 3d nand闪速存储器件及其集成方法
US11507835B2 (en) 2020-06-08 2022-11-22 Western Digital Technologies, Inc. Neural network data updates using in-place bit-addressable writes within storage class memory
CN112130057B (zh) * 2020-09-14 2024-04-16 哈尔滨工业大学(威海) 基于忆阻器神经网络的辐射效应诊断系统
KR102480944B1 (ko) * 2020-09-23 2022-12-22 재단법인대구경북과학기술원 하이브리드 메모리 제어 장치 및 방법
US11972137B2 (en) 2020-11-02 2024-04-30 Deepx Co., Ltd. System and memory for artificial neural network (ANN) optimization using ANN data locality
US20220138586A1 (en) * 2020-11-02 2022-05-05 Deepx Co., Ltd. Memory system of an artificial neural network based on a data locality of an artificial neural network
US11922051B2 (en) 2020-11-02 2024-03-05 Deepx Co., Ltd. Memory controller, processor and system for artificial neural network
US20220171700A1 (en) * 2020-12-02 2022-06-02 Unifabrix Ltd. System and method for multimodal computer address space provisioning
US11640308B2 (en) * 2021-02-19 2023-05-02 Macronix International Co., Ltd. Serial NAND flash with XiP capability
TWI826216B (zh) * 2022-12-29 2023-12-11 瑞昱半導體股份有限公司 記憶體控制系統與記憶體控制方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7631245B2 (en) * 2005-09-26 2009-12-08 Sandisk Il Ltd. NAND flash memory controller exporting a NAND interface
US8291295B2 (en) * 2005-09-26 2012-10-16 Sandisk Il Ltd. NAND flash memory controller exporting a NAND interface
US8560761B2 (en) * 2008-03-31 2013-10-15 Spansion Llc Memory resource management for a flash aware kernel
US8289760B2 (en) * 2008-07-02 2012-10-16 Micron Technology, Inc. Multi-mode memory device and method having stacked memory dice, a logic die and a command processing circuit and operating in direct and indirect modes
US20100017650A1 (en) * 2008-07-19 2010-01-21 Nanostar Corporation, U.S.A Non-volatile memory data storage system with reliability management
JP5221332B2 (ja) * 2008-12-27 2013-06-26 株式会社東芝 メモリシステム
US8412880B2 (en) * 2009-01-08 2013-04-02 Micron Technology, Inc. Memory system controller to manage wear leveling across a plurality of storage nodes
WO2010148359A1 (en) * 2009-06-18 2010-12-23 Cypress Semiconductor Corporation Memory devices and systems including multi-speed access of memory modules
US8595411B2 (en) * 2009-12-30 2013-11-26 Sandisk Technologies Inc. Method and controller for performing a sequence of commands
KR101336335B1 (ko) * 2012-03-31 2013-12-06 송승근 플러그 유도형 안전 콘센트
US9431064B2 (en) * 2012-11-02 2016-08-30 Taiwan Semiconductor Manufacturing Company, Ltd. Memory circuit and cache circuit configuration
US9164888B2 (en) * 2012-12-10 2015-10-20 Google Inc. Using a logical to physical map for direct user space communication with a data storage device
US20150026509A1 (en) * 2013-07-22 2015-01-22 Kabushiki Kaisha Toshiba Storage device having a data stream converter
US9086807B2 (en) * 2013-08-26 2015-07-21 Hitachi, Ltd. Storage apparatus and tier control method
EP3140743B1 (en) * 2014-05-08 2021-11-24 Micron Technology, INC. Hybrid memory cube system interconnect directory-based cache coherence methodology
US10437731B2 (en) * 2015-12-24 2019-10-08 Intel Corporation Multi-level non-volatile cache with selective store
US10719237B2 (en) * 2016-01-11 2020-07-21 Micron Technology, Inc. Apparatuses and methods for concurrently accessing multiple partitions of a non-volatile memory
US10592114B2 (en) * 2016-03-03 2020-03-17 Samsung Electronics Co., Ltd. Coordinated in-module RAS features for synchronous DDR compatible memory
US20170285967A1 (en) * 2016-03-29 2017-10-05 Samsung Electronics Co., Ltd. Multi-ware smart ssd
US20170285992A1 (en) * 2016-04-01 2017-10-05 Intel Corporation Memory subsystem with narrow bandwidth repeater channel
US10866912B2 (en) * 2017-03-10 2020-12-15 Toshiba Memory Corporation Integrated heterogeneous solid state storage drive
US10778552B2 (en) * 2018-04-30 2020-09-15 Hewlett Packard Enterprise Development Lp Storage system latency evaluation based on I/O patterns

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
미국공개특허 제2013-0111113호(2013.05.02.) 1부.*
미국공개특허 제2017-0199666호(2017.07.13.) 1부.*
한국공개특허 제10-2011-0095935호(2011.08.25.) 1부.*
한국공개특허 제10-2017-0002586호(2017.01.06.) 1부.*
한국공개특허 제10-2017-0113013호(2017.10.12.) 1부.*

Also Published As

Publication number Publication date
TWI711930B (zh) 2020-12-01
CN111684406A (zh) 2020-09-18
EP3750046A1 (en) 2020-12-16
EP3750046A4 (en) 2021-06-02
WO2019152192A1 (en) 2019-08-08
TW201945947A (zh) 2019-12-01
US20190243787A1 (en) 2019-08-08
KR20200108363A (ko) 2020-09-17

Similar Documents

Publication Publication Date Title
KR102428791B1 (ko) 집적 회로 메모리의 패키지에 내장된 컨트롤러를 갖는 메모리 시스템
US11706317B2 (en) Optimization of data access and communication in memory systems
KR102457071B1 (ko) 다중 계층 메모리 시스템에서의 예측 데이터 오케스트레이션
US20190243771A1 (en) Accelerate Data Access in Memory Systems via Data Stream Segregation
US11977787B2 (en) Remote direct memory access in multi-tier memory systems
US11561845B2 (en) Memory access communications through message passing interface implemented in memory systems
US11416395B2 (en) Memory virtualization for accessing heterogeneous memory components

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right