KR20220080915A - 스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치 - Google Patents
스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치 Download PDFInfo
- Publication number
- KR20220080915A KR20220080915A KR1020200170198A KR20200170198A KR20220080915A KR 20220080915 A KR20220080915 A KR 20220080915A KR 1020200170198 A KR1020200170198 A KR 1020200170198A KR 20200170198 A KR20200170198 A KR 20200170198A KR 20220080915 A KR20220080915 A KR 20220080915A
- Authority
- KR
- South Korea
- Prior art keywords
- storage device
- failure
- probability
- data
- occurrence
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0653—Monitoring storage devices or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1004—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1012—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices using codes or arrangements adapted for a specific type of error
- G06F11/1024—Identification of the type of error
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1068—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices in sector programmable memories, e.g. flash disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1092—Rebuilding, e.g. when physically replacing a failing disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3034—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
- G06F13/1673—Details of memory controller using buffers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0656—Data buffering arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/008—Reliability or availability analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Debugging And Monitoring (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치가 제공된다. 스토리지 장치의 구동 방법은, 제1 컴포넌트와 제2 컴포넌트를 포함하는 스토리지 장치를 제공하고, 외부로부터 스토리지 장치의 불량 발생 확률(failure possibility) 정보를 요청하는 커맨드를 제공받고, 커맨드에 대한 응답으로, 스토리지 장치의 불량 발생 확률 정보를 제공하는 것을 포함한다.
Description
본 발명은 스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치에 관한 것이다.
스토리지 장치의 동작이 지속됨에 따라 스토리지 장치에 불량이 발생할 수 있다. 이러한 스토리지 장치의 불량은 메모리 시스템의 신뢰성에 악영향을 주므로 최소화하는 것이 바람직하다.
한편, 스토리지 장치에 발생된 불량을 해결하여 메모리 시스템의 신뢰성을 유지하기 위한 여러 기법들이 제안되어 있다. 그런데, 상당 수의 프로세스가 스토리지 장치에 실제 불량이 발생된 이후에 이러한 기법들을 적용하게 되어 있어, 메모리 시스템의 신뢰성 향상에 도움을 주지 못하고 있는 실정이다. 이에 메모리 시스템의 신뢰성을 보다 향상시킬 수 있는 방법에 대한 연구가 필요하다.
본 발명이 해결하고자 하는 기술적 과제는 메모리 시스템의 신뢰성을 향상시킬 수 있는 스토리지 장치의 구동 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는 메모리 시스템의 신뢰성을 향상시킬 수 있는 호스트 장치의 구동 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는 메모리 시스템의 신뢰성을 향상시킬 수 있는 스토리지 장치를 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 달성하기 위한 몇몇 실시예에 따른 스토리지 장치의 구동 방법은, 제1 컴포넌트와 제2 컴포넌트를 포함하는 스토리지 장치를 제공하고, 외부로부터 스토리지 장치의 불량 발생 확률(failure possibility) 정보를 요청하는 커맨드를 제공받고, 커맨드에 대한 응답으로, 스토리지 장치의 불량 발생 확률 정보를 제공하는 것을 포함한다.
상기 다른 기술적 과제를 달성하기 위한 몇몇 실시예에 따른 호스트 장치의 구동 방법은, 제1 컴포넌트와 제2 컴포넌트를 포함하는 스토리지 장치에, 스토리지 장치의 불량 발생 확률 정보를 요청하는 커맨드를 전송하고, 커맨드에 대한 응답으로, 스토리지 장치의 불량 발생 확률 정보를 수신하는 것을 포함한다.
상기 또 다른 기술적 과제를 달성하기 위한 몇몇 실시예에 따른 스토리지 장치는, 호스트 장치로부터 제공받은 데이터가 임시로 저장되는 버퍼 메모리, 호스트 장치로부터 제공받은 데이터가 저장되는 비휘발성 메모리, 버퍼 메모리와 비휘발성 메모리로부터 로그 데이터를 수집하는 로그 모니터, 수집된 로그 데이터로부터 불량 발생 확률을 예측하는 머신 러닝 모듈을 포함한다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
도 1은 몇몇 실시예에 따른 메모리 시스템을 도시한 블록도이다.
도 2는 도 1의 스토리지 장치의 스토리지 컨트롤러와 비휘발성 메모리를 재구성한 도면이다.
도 3는 도 1의 스토리지 컨트롤러, 메모리 인터페이스 및 비휘발성 메모리를 재구성하여 도시한 도면이다.
도 4는 몇몇 실시예에 따른 메모리 시스템의 동작을 도시한 순서도이다.
도 5는 몇몇 실시예에 따른 스토리지 장치에서 수행되는 머신 러닝 동작을 설명하기 위한 순서도이다.
도 6 내지 도 10은 스토리지 장치에서 수행되는 머신 러닝 동작을 설명하기 위한 도면들이다.
도 11 및 도 12는 몇몇 실시예에 따른 메모리 시스템의 동작을 설명하기 위한 도면들이다.
도 13은 다른 몇몇 실시예에 따른 메모리 시스템의 동작을 설명하기 위한 도면이다.
도 14는 몇몇 실시예에 따른 스토리지 장치가 적용된 데이터 센터를 도시한 도면이다.
도 2는 도 1의 스토리지 장치의 스토리지 컨트롤러와 비휘발성 메모리를 재구성한 도면이다.
도 3는 도 1의 스토리지 컨트롤러, 메모리 인터페이스 및 비휘발성 메모리를 재구성하여 도시한 도면이다.
도 4는 몇몇 실시예에 따른 메모리 시스템의 동작을 도시한 순서도이다.
도 5는 몇몇 실시예에 따른 스토리지 장치에서 수행되는 머신 러닝 동작을 설명하기 위한 순서도이다.
도 6 내지 도 10은 스토리지 장치에서 수행되는 머신 러닝 동작을 설명하기 위한 도면들이다.
도 11 및 도 12는 몇몇 실시예에 따른 메모리 시스템의 동작을 설명하기 위한 도면들이다.
도 13은 다른 몇몇 실시예에 따른 메모리 시스템의 동작을 설명하기 위한 도면이다.
도 14는 몇몇 실시예에 따른 스토리지 장치가 적용된 데이터 센터를 도시한 도면이다.
이하, 첨부된 도면을 참조하여 본 발명의 기술적 사상에 따른 실시예들에 대해 설명한다.
도 1은 몇몇 실시예에 따른 메모리 시스템을 도시한 블록도이다.
메모리 시스템(10)은 호스트 장치(100) 및 스토리지 장치(200)를 포함할 수 있다. 또한, 스토리지 장치(200)는 스토리지 컨트롤러(210) 및 비휘발성 메모리(NVM, 220)를 포함할 수 있다. 또한, 몇몇 실시예에서, 호스트 장치(100)는 호스트 컨트롤러(110) 및 호스트 메모리(120)를 포함할 수 있다. 호스트 메모리(120)는 스토리지 장치(200)로 전송될 데이터, 혹은 스토리지 장치(200)로부터 전송된 데이터를 임시로 저장하기 위한 버퍼 메모리로서 기능할 수 있다.
스토리지 장치(200)는 호스트 장치(100)로부터의 요청에 따라 데이터를 저장하기 위한 저장 매체들을 포함할 수 있다. 예를 들어, 스토리지 장치(200)는 SSD(Solid State Drive), 임베디드(embedded) 메모리 및 착탈 가능한 외장(external) 메모리 중 적어도 하나를 포함할 수 있다. 스토리지 장치(200)가 SSD인 경우, 스토리지 장치(200)는 NVMe(non-volatile memory express) 표준을 따르는 장치일 수 있다.
스토리지 장치(200)가 임베디드 메모리 혹은 외장(external) 메모리인 경우, 스토리지 장치(200)는 UFS(universal flash storage) 혹은 eMMC(embedded multi-media card) 표준을 따르는 장치일 수 있다. 호스트 장치(100)와 스토리지 장치(200)는 각각 채용된 표준 프로토콜에 따른 패킷을 생성하고 이를 전송할 수 있다.
스토리지 장치(200)의 비휘발성 메모리(220)가 플래시 메모리를 포함할 때, 이러한 플래시 메모리는 2D NAND 메모리 어레이나 3D(또는 수직형, Vertical) NAND(VNAND) 메모리 어레이를 포함할 수 있다. 다른 예로서, 스토리지 장치(200)는 다른 다양한 종류의 비휘발성 메모리들을 포함할 수도 있다. 예를 들어, 스토리지 장치(200)는 MRAM(Magnetic RAM), 스핀전달토크 MRAM(Spin-Transfer Torque MRAM), Conductive bridging RAM(CBRAM), FeRAM(Ferroelectric RAM), PRAM(Phase RAM), 저항 메모리(Resistive RAM) 및 다른 다양한 종류의 메모리가 적용될 수 있다.
몇몇 실시예에서, 호스트 컨트롤러(110)와 호스트 메모리(120)는 별도의 반도체 칩으로 구현될 수 있다. 또는, 몇몇 실시예에서, 호스트 컨트롤러(110)와 호스트 메모리(120)는 동일한 반도체 칩에 집적될 수 있다. 일 예로서, 호스트 컨트롤러(110)는 어플리케이션 프로세서(Application Processor)에 구비되는 다수의 모듈들 중 어느 하나일 수 있으며, 이러한 어플리케이션 프로세서는 시스템 온 칩(System on Chip, SoC)으로 구현될 수 있다. 또한, 호스트 메모리(120)는 어플리케이션 프로세서 내에 구비되는 임베디드 메모리이거나, 또는 어플리케이션 프로세서의 외부에 배치되는 비휘발성 메모리 또는 메모리 모듈일 수 있다.
호스트 컨트롤러(110)는 버퍼 영역의 데이터(예컨대, 라이트 데이터)를 비휘발성 메모리(220)에 저장하거나, 비휘발성 메모리(220)의 데이터(예컨대, 리드 데이터)를 버퍼 영역에 저장하는 동작을 관리할 수 있다.
스토리지 컨트롤러(210)는 호스트 인터페이스(211), 메모리 인터페이스(212) 및 CPU(central processing unit, 213)를 포함할 수 있다. 또한, 스토리지 컨트롤러(210)는 플래시 변환 레이어(Flash Translation Layer(FTL), 214), 패킷 매니저(215), 버퍼 메모리(216), ECC(error correction code, 217) 엔진 및 AES(advanced encryption standard, 218) 엔진을 더 포함할 수 있다.
스토리지 컨트롤러(210)는 플래시 변환 레이어(FTL, 214)가 로딩되는 워킹 메모리(미도시)를 더 포함할 수 있으며, CPU(213)가 플래시 변환 레이어(214)를 실행하는 것에 의해 비휘발성 메모리에 대한 데이터 라이트 및 리드 동작이 제어될 수 있다.
호스트 인터페이스(211)는 호스트 장치(100)와 패킷(packet)을 송수신할 수 있다. 호스트 장치(100)로부터 호스트 인터페이스(211)로 전송되는 패킷은 커맨드(command) 혹은 비휘발성 메모리(220)에 라이트될 데이터 등을 포함할 수 있으며, 호스트 인터페이스(211)로부터 호스트 장치(100)로 전송되는 패킷은 커맨드에 대한 응답(response) 혹은 비휘발성 메모리(220)로부터 리드된 데이터 등을 포함할 수 있다.
메모리 인터페이스(212)는 비휘발성 메모리(220)에 라이트될 데이터를 비휘발성 메모리(220)로 송신하거나, 비휘발성 메모리(220)로부터 리드된 데이터를 수신할 수 있다. 이러한 메모리 인터페이스(212)는 토글(Toggle) 혹은 온파이(ONFI)와 같은 표준 규약을 준수하도록 구현될 수 있다.
플래시 변환 레이어(214)는 어드레스 매핑(address mapping), 웨어-레벨링(wear-leveling), 가비지 콜렉션(garbage collection)과 같은 여러 기능을 수행할 수 있다. 어드레스 매핑 동작은 호스트로부터 수신한 논리 어드레스(logical address)를, 비휘발성 메모리(220) 내에 데이터를 실제로 저장하는 데 사용되는 물리 어드레스(physical address)로 바꾸는 동작이다. 웨어-레벨링은 비휘발성 메모리(220) 내의 블록(block)들이 균일하게 사용되도록 하여 특정 블록의 과도한 열화를 방지하기 위한 기술로, 예시적으로 물리 블록(physical block)들의 소거 카운트들을 밸런싱하는 펌웨어 기술을 통해 구현될 수 있다. 가비지 콜렉션은, 블록의 유효 데이터를 새 블록에 복사한 후 기존 블록을 소거(erase)하는 방식을 통해 비휘발성 메모리(220) 내에서 사용 가능한 용량을 확보하기 위한 기술이다.
패킷 매니저(215)는 호스트 장치(100)와 협의된 인터페이스의 프로토콜에 따른 패킷(Packet)을 생성하거나, 호스트 장치(100)로부터 수신된 패킷(Packet)으로부터 각종 정보를 파싱할 수 있다. 또한, 버퍼 메모리(216)는 비휘발성 메모리(220)에 라이트될 데이터 혹은 비휘발성 메모리(220)로부터 리드될 데이터를 임시로 저장할 수 있다. 버퍼 메모리(216)는 스토리지 컨트롤러(210) 내에 구비되는 구성일 수 있으나, 스토리지 컨트롤러(210)의 외부에 배치되어도 무방하다.
ECC 엔진(217)은 비휘발성 메모리(220)로부터 리드되는 리드 데이터에 대한 오류 검출 및 정정 기능을 수행할 수 있다. 보다 구체적으로, ECC 엔진(217)은 비휘발성 메모리(220)에 기입될 기입 데이터에 대하여 패리티 비트(parity bit)들을 생성할 수 있으며, 이와 같이 생성된 패리티 비트들은 라이트 데이터와 함께 비휘발성 메모리(220) 내에 저장될 수 있다. 비휘발성 메모리(220)로부터의 데이터 리드 시, ECC 엔진(217)은 리드 데이터와 함께 비휘발성 메모리(220)로부터 리드되는 패리티 비트들을 이용하여 리드 데이터의 에러를 정정하고, 에러가 정정된 리드 데이터를 출력할 수 있다.
AES 엔진(218)은, 스토리지 컨트롤러(210)로 입력되는 데이터에 대한 암호화(encryption) 동작과 복호화(decryption) 동작 중 적어도 하나를, 대칭 키 알고리즘(symmetric-key algorithm)을 이용하여 수행할 수 있다.
머신 러닝 모듈(219)은, 스토리지 장치(200)로부터 생성되는 데이터에 대한 머신 러닝 동작을 수행할 수 있다.
몇몇 실시예에서, 머신 러닝 모듈(219)은 입력 레이어, 히든 레이어, 출력 레이어를 포함할 수 있다.
입력 레이어로는 과거 시점으로부터 현재 시점까지의 각 시점별 학습 데이터가 제공될 수 있다. 각 시점의 학습 데이터는, 예를 들어, 스토리지 장치(200)에 포함된 각종 컴포넌트들(예를 들어, 비휘발성 메모리(200), 버퍼 메모리(216), 온도 센서(230)를 포함하는 각종 하드웨어, 펌웨어 등)로부터 수집된 로그 데이터들을 포함할 수 있다.
이러한 입력 레이어는 히든 레이어에 제공되어 학습될 수 있다. 몇몇 실시예에서, 히든 레이어로는 시계열적인 특징을 입력 받아 정교한 예측이 가능한 RNN(Recurrent Neural Network) 모델이 적용될 수 있으나, 실시예들이 이에 제한되는 것은 아니다.
이러한 학습이 완료되면 현재 시점 보다 미래 시점에서의 예측 정보(예를 들어, 불량 발생 확률)가 출력 레이어로 산출될 수 있다. 몇몇 실시예에서, 출력 레이어는 MLP(Multi-Layer Perceptron)을 사용할 수 있으나, 실시예들이 이에 제한되는 것은 아니다.
몇몇 실시예에서, 머신 러닝 모듈(219)은, 펌웨어 또는 소프트웨어로 구현되어 스토리지 장치(200)에서 구동될 수 있다. 이 경우, 머신 러닝 모듈(219)은 스토리지 컨트롤러(210)의 동작을 제어할 수 있다. 또한 몇몇 실시예에서, 머신 러닝 모듈(219)은, 하드웨어로 구현되어 스토리지 장치(200)에서 구동될 수 있다. 이 경우, 머신 러닝 모듈(219)은 별도의 머신 러닝 프로세서 형태로 구현되어 스토리지 장치(200)에 포함될 수 있다.
온도 센서(230)는, 스토리지 장치(200)의 온도를 센싱하고, 센싱된 온도 정보를 스토리지 컨트롤러(210)에 제공할 수 있다. 구체적으로, 온도 센서(230)는 스토리지 장치(200)의 동작 온도 및/또는 스토리지 장치(200)의 주변 환경 온도 및/또는 스토리지 장치(200)에 포함된 컴포넌트들의 온도 등을 센싱하고, 센싱된 온도 정보를 스토리지 컨트롤러(210)에 제공할 수 있다.
도 2는 도 1의 스토리지 장치의 스토리지 컨트롤러와 비휘발성 메모리를 재구성한 도면이다.
도 2를 참조하면, 스토리지 장치(200)는 비휘발성 스토리지(220) 및 스토리지 컨트롤러(210)를 포함할 수 있다. 스토리지 장치(200)는 복수의 채널들(CH1~CHm)을 지원할 수 있고, 비휘발성 스토리지(220)와 스토리지 컨트롤러(210)는 복수의 채널들(CH1~CHm)을 통해 연결될 수 있다. 예를 들어, 스토리지 장치(200)는 SSD(Solid State Drive)와 같은 스토리지 장치로 구현될 수 있다.
비휘발성 스토리지(220)는 복수의 비휘발성 메모리 장치들(NVM11~NVMmn)을 포함할 수 있다. 비휘발성 메모리 장치들(NVM11~NVMmn) 각각은 대응하는 웨이(way)를 통해 복수의 채널들(CH1~CHm) 중 하나에 연결될 수 있다. 예를 들어, 비휘발성 메모리 장치들(NVM11~NVM1n)은 웨이들(W11~W1n)을 통해 제1 채널(CH1)에 연결되고, 비휘발성 메모리 장치들(NVM21~NVM2n)은 웨이들(W21~W2n)을 통해 제2 채널(CH2)에 연결될 수 있다. 예시적인 실시 예에서, 비휘발성 메모리 장치들(NVM11~NVMmn) 각각은 스토리지 컨트롤러(210)로부터의 개별적인 명령에 따라 동작할 수 있는 임의의 메모리 단위로 구현될 수 있다. 예를 들어, 비휘발성 메모리 장치들(NVM11~NVMmn) 각각은 칩(chip) 또는 다이(die)로 구현될 수 있으나, 본 발명이 이에 한정되는 것은 아니다.
스토리지 컨트롤러(210)는 복수의 채널들(CH1~CHm)을 통해 비휘발성 스토리지(220)와 신호들을 송수신할 수 있다. 예를 들어, 스토리지 컨트롤러(210)는 채널들(CH1~CHm)을 통해 비휘발성 스토리지(220)로 커맨드들(CMDa~CMDm), 어드레스들(ADDRa~ADDRm), 및 데이터(DATAa~DATAm)를 비휘발성 스토리지(220)로 전송하거나, 비휘발성 스토리지(220)로부터 데이터(DATAa~DATAm)를 수신할 수 있다.
스토리지 컨트롤러(210)는 각각의 채널을 통해 해당 채널에 연결된 비휘발성 메모리 장치들 중 하나를 선택하고, 선택된 비휘발성 메모리 장치와 신호들을 송수신할 수 있다. 예를 들어, 스토리지 컨트롤러(210)는 제1 채널(CH1)에 연결된 비휘발성 메모리 장치들(NVM11~NVM1n) 중 비휘발성 메모리 장치(NVM11)를 선택할 수 있다. 스토리지 컨트롤러(210)는 선택된 비휘발성 메모리 장치(NVM11)로 제1 채널(CH1)을 통해 커맨드(CMDa), 어드레스(ADDRa), 및 데이터(DATAa)를 전송하거나, 선택된 비휘발성 메모리 장치(NVM11)로부터 데이터(DATAa)를 수신할 수 있다.
스토리지 컨트롤러(210)는 서로 다른 채널들을 통해 비휘발성 스토리지(220)와 신호들을 병렬적으로 송수신할 수 있다. 예를 들어, 스토리지 컨트롤러(210)는 제1 채널(CH1)을 통해 비휘발성 스토리지(220)로 커맨드(CMDa)를 전송하는 동안 제2 채널(CH2)을 통해 비휘발성 스토리지(220)로 커맨드(CMDb)를 전송할 수 있다. 예를 들어, 스토리지 컨트롤러(210)는 제1 채널(CH1)을 통해 비휘발성 스토리지(220)로부터 데이터(DATAa)를 수신하는 동안 제2 채널(CH2)을 통해 비휘발성 스토리지(220)로부터 데이터(DATAb)를 수신할 수 있다.
스토리지 컨트롤러(210)는 비휘발성 스토리지(220)의 전반적인 동작을 제어할 수 있다. 스토리지 컨트롤러(210)는 채널들(CH1~CHm)로 신호를 전송하여 채널들(CH1~CHm)에 연결된 비휘발성 메모리 장치들(NVM11~NVMmn) 각각을 제어할 수 있다. 예를 들어, 스토리지 컨트롤러(210)는 제1 채널(CH1)로 커맨드(CMDa) 및 어드레스(ADDRa)를 전송하여 비휘발성 메모리 장치들(NVM11~NVM1n) 중 선택된 하나를 제어할 수 있다.
비휘발성 메모리 장치들(NVM11~NVMmn) 각각은 스토리지 컨트롤러(210)의 제어에 따라 동작할 수 있다. 예를 들어, 비휘발성 메모리 장치(NVM11)는 제1 채널(CH1)로 제공되는 커맨드(CMDa), 어드레스(ADDRa), 및 데이터(DATAa)에 따라 데이터(DATAa)를 프로그램할 수 있다. 예를 들어, 비휘발성 메모리 장치(NVM21)는 제2 채널(CH2)로 제공되는 커맨드(CMDb) 및 어드레스(ADDRb)에 따라 데이터(DATAb)를 독출하고, 독출된 데이터(DATAb)를 스토리지 컨트롤러(210)로 전송할 수 있다.
도 2에는 비휘발성 스토리지(220)가 m개의 채널을 통해 스토리지 컨트롤러(210)와 통신하고, 비휘발성 스토리지(220)가 각각의 채널에 대응하여 n개의 비휘발성 메모리 장치를 포함하는 것으로 도시되나, 채널들의 개수와 하나의 채널에 연결된 비휘발성 메모리 장치의 개수는 다양하게 변경될 수 있다.
도 3는 도 1의 스토리지 컨트롤러, 메모리 인터페이스 및 비휘발성 메모리를 재구성하여 도시한 도면이다. 도 1의 메모리 인터페이스(212)는 도 3의 컨트롤러 인터페이스 회로(212a)를 포함할 수 있다.
비휘발성 메모리(220)는 제1 내지 제8 핀들(P11~P18), 메모리 인터페이스 회로(212b), 제어 로직 회로(510), 및 메모리 셀 어레이(520)를 포함할 수 있다.
메모리 인터페이스 회로(212b)는 제1 핀(P11)을 통해 스토리지 컨트롤러(210)로부터 칩 인에이블 신호(nCE)를 수신할 수 있다. 메모리 인터페이스 회로(212b)는 칩 인에이블 신호(nCE)에 따라 제2 내지 제8 핀들(P12~P18)을 통해 스토리지 컨트롤러(210)와 신호들을 송수신할 수 있다. 예를 들어, 칩 인에이블 신호(nCE)가 인에이블 상태(예를 들어, 로우 레벨)인 경우, 메모리 인터페이스 회로(212b)는 제2 내지 제8 핀들(P12~P18)을 통해 스토리지 컨트롤러(210)와 신호들을 송수신할 수 있다.
메모리 인터페이스 회로(212b)는 제2 내지 제4 핀들(P12~P14)을 통해 스토리지 컨트롤러(210)로부터 커맨드 래치 인에이블 신호(CLE), 어드레스 래치 인에이블 신호(ALE), 및 쓰기 인에이블 신호(nWE)를 수신할 수 있다. 메모리 인터페이스 회로(212b)는 제7 핀(P17)을 통해 스토리지 컨트롤러(210)로부터 데이터 신호(DQ)를 수신하거나, 스토리지 컨트롤러(210)로 데이터 신호(DQ)를 전송할 수 있다. 데이터 신호(DQ)를 통해 커맨드(CMD), 어드레스(ADDR), 및 데이터(DATA)가 전달될 수 있다. 예를 들어, 데이터 신호(DQ)는 복수의 데이터 신호 라인들을 통해 전달될 수 있다. 이 경우, 제7 핀(P17)은 복수의 데이터 신호들에 대응하는 복수 개의 핀들을 포함할 수 있다.
메모리 인터페이스 회로(212b)는 쓰기 인에이블 신호(nWE)의 토글 타이밍들에 기초하여 커맨드 래치 인에이블 신호(CLE)의 인에이블 구간(예를 들어, 하이 레벨 상태)에서 수신되는 데이터 신호(DQ)로부터 커맨드(CMD)를 획득할 수 있다. 메모리 인터페이스 회로(212b)는 쓰기 인에이블 신호(nWE)의 토글 타이밍들에 기초하여 어드레스 래치 인에이블 신호(ALE)의 인에이블 구간(예를 들어, 하이 레벨 상태)에서 수신되는 데이터 신호(DQ)로부터 어드레스(ADDR)를 획득할 수 있다.
몇몇 실시 예에서, 쓰기 인에이블 신호(nWE)는 고정된(static) 상태(예를 들어, 하이(high) 레벨 또는 로우(low) 레벨)를 유지하다가 하이 레벨과 로우 레벨 사이에서 토글할 수 있다. 예를 들어, 쓰기 인에이블 신호(nWE)는 커맨드(CMD) 또는 어드레스(ADDR)가 전송되는 구간에서 토글할 수 있다. 이에 따라, 메모리 인터페이스 회로(212b)는 쓰기 인에이블 신호(nWE)의 토글 타이밍들에 기초하여 커맨드(CMD) 또는 어드레스(ADDR)를 획득할 수 있다.
메모리 인터페이스 회로(212b)는 제5 핀(P15)을 통해 스토리지 컨트롤러(210)로부터 읽기 인에이블 신호(nRE)를 수신할 수 있다. 메모리 인터페이스 회로(212b)는 제6 핀(P16)을 통해 스토리지 컨트롤러(210)로부터 데이터 스트로브 신호(DQS)를 수신하거나, 스토리지 컨트롤러(210)로 데이터 스트로브 신호(DQS)를 전송할 수 있다.
비휘발성 메모리(220)의 데이터(DATA) 출력 동작에서, 메모리 인터페이스 회로(212b)는 데이터(DATA)를 출력하기 전에 제5 핀(P15)을 통해 토글하는 읽기 인에이블 신호(nRE)를 수신할 수 있다. 메모리 인터페이스 회로(212b)는 읽기 인에이블 신호(nRE)의 토글링에 기초하여 토글하는 데이터 스트로브 신호(DQS)를 생성할 수 있다. 예를 들어, 메모리 인터페이스 회로(212b)는 읽기 인에이블 신호(nRE)의 토글링 시작 시간을 기준으로 미리 정해진 딜레이(예를 들어, tDQSRE) 이후에 토글하기 시작하는 데이터 스트로브 신호(DQS)를 생성할 수 있다. 메모리 인터페이스 회로(212b)는 데이터 스트로브 신호(DQS)의 토글 타이밍에 기초하여 데이터(DATA)를 포함하는 데이터 신호(DQ)를 전송할 수 있다. 이에 따라, 데이터(DATA)는 데이터 스트로브 신호(DQS)의 토글 타이밍에 정렬되어 스토리지 컨트롤러(210)로 전송될 수 있다.
비휘발성 메모리(220)의 데이터(DATA) 입력 동작에서, 스토리지 컨트롤러(210)로부터 데이터(DATA)를 포함하는 데이터 신호(DQ)이 수신되는 경우, 메모리 인터페이스 회로(212b)는 스토리지 컨트롤러(210)로부터 데이터(DATA)와 함께 토글하는 데이터 스트로브 신호(DQS)를 수신할 수 있다. 메모리 인터페이스 회로(212b)는 데이터 스트로브 신호(DQS)의 토글 타이밍에 기초하여 데이터 신호(DQ)로부터 데이터(DATA)를 획득할 수 있다. 예를 들어, 메모리 인터페이스 회로(212b)는 데이터 스트로브 신호(DQS)의 상승 에지 및 하강 에지에서 데이터 신호(DQ)를 샘플링함으로써 데이터(DATA)를 획득할 수 있다.
메모리 인터페이스 회로(212b)는 제8 핀(P18)을 통해 레디/비지 출력 신호(nR/B)를 스토리지 컨트롤러(210)로 전송할 수 있다. 메모리 인터페이스 회로(212b)는 레디/비지 출력 신호(nR/B)를 통해 비휘발성 메모리(220)의 상태 정보를 스토리지 컨트롤러(210)로 전송할 수 있다. 비휘발성 메모리(220)가 비지 상태인 경우(즉, 비휘발성 메모리(220) 내부 동작들이 수행 중인 경우), 메모리 인터페이스 회로(212b)는 비지 상태를 나타내는 레디/비지 출력 신호(nR/B)를 스토리지 컨트롤러(210)로 전송할 수 있다. 비휘발성 메모리(220)가 레디 상태인 경우(즉, 비휘발성 메모리(220) 내부 동작들이 수행되지 않거나 완료된 경우), 메모리 인터페이스 회로(212b)는 레디 상태를 나타내는 레디/비지 출력 신호(nR/B)를 스토리지 컨트롤러(210)로 전송할 수 있다.
예를 들어, 비휘발성 메모리(220)가 페이지 리드 명령에 응답하여 메모리 셀 어레이(520)로부터 데이터(DATA)를 리드하는 동안, 메모리 인터페이스 회로(212b)는 비지 상태(예를 들어, 로우 레벨)를 나타내는 레디/비지 출력 신호(nR/B)를 스토리지 컨트롤러(210)로 전송할 수 있다. 예를 들어, 비휘발성 메모리(220)가 프로그램 명령에 응답하여 메모리 셀 어레이(520)로 데이터(DATA)를 프로그램하는 동안, 메모리 인터페이스 회로(212b)는 비지 상태를 나타내는 레디/비지 출력 신호(nR/B)를 스토리지 컨트롤러(210)로 전송할 수 있다.
제어 로직 회로(510)는 비휘발성 메모리(220)의 각종 동작을 전반적으로 제어할 수 있다. 제어 로직 회로(510)는 메모리 인터페이스 회로(212b)로부터 획득된 커맨드/어드레스(CMD/ADDR)를 수신할 수 있다. 제어 로직 회로(510)는 수신된 커맨드/어드레스(CMD/ADDR)에 따라 비휘발성 메모리(220)의 다른 구성 요소들을 제어하기 위한 제어 신호들을 생성할 수 있다. 예를 들어, 제어 로직 회로(510)는 메모리 셀 어레이(520)에 데이터(DATA)를 프로그램하거나, 또는 메모리 셀 어레이(520)로부터 데이터(DATA)를 리드하기 위한 각종 제어 신호들을 생성할 수 있다.
메모리 셀 어레이(520)는 제어 로직 회로(510)의 제어에 따라 메모리 인터페이스 회로(212b)로부터 획득된 데이터(DATA)를 저장할 수 있다. 메모리 셀 어레이(520)는 제어 로직 회로(510)의 제어에 따라 저장된 데이터(DATA)를 메모리 인터페이스 회로(212b)로 출력할 수 있다.
메모리 셀 어레이(520)는 복수의 메모리 셀들을 포함할 수 있다. 예를 들어, 복수의 메모리 셀들은 플래시 메모리 셀들일 수 있다. 그러나, 본 발명은 이에 한정되지 않으며, 메모리 셀들은 RRAM(Resistive Random Access Memory) 셀, FRAM(Ferroelectric Random Access Memory) 셀, PRAM(Phase Change Random Access Memory) 셀, TRAM(Thyristor Random Access Memory) 셀, MRAM(Magnetic Random Access Memory) 셀들일 수 있다. 이하에서는, 메모리 셀들이 낸드(NAND) 플래시 메모리 셀들인 실시 예를 중심으로 본 발명의 실시 예들이 설명될 것이다.
스토리지 컨트롤러(210)는 제1 내지 제8 핀들(P21~P28), 및 컨트롤러 인터페이스 회로(212a)를 포함할 수 있다. 제1 내지 제8 핀들(P21~P28)은 비휘발성 메모리(220)의 제1 내지 제8 핀들(P11~P18)에 대응할 수 있다.
컨트롤러 인터페이스 회로(212a)는 제1 핀(P21)을 통해 비휘발성 메모리(220)로 칩 인에이블 신호(nCE)를 전송할 수 있다. 컨트롤러 인터페이스 회로(212a)는 칩 인에이블 신호(nCE)를 통해 선택한 비휘발성 메모리(220)와 제2 내지 제8 핀들(P22~P28)을 통해 신호들을 송수신할 수 있다.
컨트롤러 인터페이스 회로(212a)는 제2 내지 제4 핀들(P22~P24)을 통해 커맨드 래치 인에이블 신호(CLE), 어드레스 래치 인에이블 신호(ALE), 및 쓰기 인에이블 신호(nWE)를 비휘발성 메모리(220)로 전송할 수 있다. 컨트롤러 인터페이스 회로(212a)는 제7 핀(P27)을 통해 비휘발성 메모리(220)로 데이터 신호(DQ)를 전송하거나, 비휘발성 메모리(220)로부터 데이터 신호(DQ)를 수신할 수 있다.
컨트롤러 인터페이스 회로(212a)는 토글하는 쓰기 인에이블 신호(nWE)와 함께 커맨드(CMD) 또는 어드레스(ADDR)를 포함하는 데이터 신호(DQ)를 비휘발성 메모리(220)로 전송할 수 있다. 컨트롤러 인터페이스 회로(212a)는 인에이블 상태를 가지는 커맨드 래치 인에이블 신호(CLE)를 전송함에 따라 커맨드(CMD)를 포함하는 데이터 신호(DQ)를 비휘발성 메모리(220)로 전송하고, 인에이블 상태를 가지는 어드레스 래치 인에이블 신호(ALE)를 전송함에 따라 어드레스(ADDR)를 포함하는 데이터 신호(DQ)를 비휘발성 메모리(220)로 전송할 수 있다.
컨트롤러 인터페이스 회로(212a)는 제5 핀(P25)을 통해 비휘발성 메모리(220)로 읽기 인에이블 신호(nRE)를 전송할 수 있다. 컨트롤러 인터페이스 회로(212a)는 제6 핀(P26)을 통해 비휘발성 메모리(220)로부터 데이터 스트로브 신호(DQS)를 수신하거나, 비휘발성 메모리(220)로 데이터 스트로브 신호(DQS)를 전송할 수 있다.
비휘발성 메모리(220)의 데이터(DATA) 출력 동작에서, 컨트롤러 인터페이스 회로(212a)는 토글하는 읽기 인에이블 신호(nRE)를 생성하고, 읽기 인에이블 신호(nRE)를 비휘발성 메모리(220)로 전송할 수 있다. 예를 들어, 컨트롤러 인터페이스 회로(212a)는 데이터(DATA)가 출력되기 전에 고정된 상태(예를 들어, 하이 레벨 또는 로우 레벨)에서 토글 상태로 변경되는 읽기 인에이블 신호(nRE)를 생성할 수 있다. 이에 따라, 비휘발성 메모리(220)에서 읽기 인에이블 신호(nRE)에 기초하여 토글하는 데이터 스트로브 신호(DQS)가 생성될 수 있다. 컨트롤러 인터페이스 회로(212a)는 비휘발성 메모리(220)로부터 토글하는 데이터 스트로브 신호(DQS)와 함께 데이터(DATA)를 포함하는 데이터 신호(DQ)를 수신할 수 있다. 컨트롤러 인터페이스 회로(212a)는 데이터 스트로브 신호(DQS)의 토글 타이밍에 기초하여 데이터 신호(DQ)로부터 데이터(DATA)를 획득할 수 있다.
비휘발성 메모리(220)의 데이터(DATA) 입력 동작에서, 컨트롤러 인터페이스 회로(212a)는 토글하는 데이터 스트로브 신호(DQS)를 생성할 수 있다. 예를 들어, 컨트롤러 인터페이스 회로(212a)는 데이터(DATA)를 전송하기 전에 고정된 상태(예를 들어, 하이 레벨 또는 로우 레벨)에서 토글 상태로 변경되는 데이터 스트로브 신호(DQS)를 생성할 수 있다. 컨트롤러 인터페이스 회로(212a)는 데이터 스트로브 신호(DQS)의 토글 타이밍들에 기초하여 데이터(DATA)를 포함하는 데이터 신호(DQ)를 비휘발성 메모리(220)로 전송할 수 있다.
컨트롤러 인터페이스 회로(212a)는 제8 핀(P28)을 통해 비휘발성 메모리(220)로부터 레디/비지 출력 신호(nR/B)를 수신할 수 있다. 컨트롤러 인터페이스 회로(212a)는 레디/비지 출력 신호(nR/B)에 기초하여 비휘발성 메모리(220)의 상태 정보를 판별할 수 있다.
이하, 도 4 내지 도 12를 참조하여, 몇몇 실시예에 따른 메모리 시스템의 동작에 대해 설명한다.
도 4는 몇몇 실시예에 따른 메모리 시스템의 동작을 도시한 순서도이다. 도 5는 몇몇 실시예에 따른 스토리지 장치에서 수행되는 머신 러닝 동작을 설명하기 위한 순서도이다. 도 6 내지 도 10은 스토리지 장치에서 수행되는 머신 러닝 동작을 설명하기 위한 도면들이다. 도 11 및 도 12는 몇몇 실시예에 따른 메모리 시스템의 동작을 설명하기 위한 도면들이다.
먼저 도 4를 참조하면, 스토리지 장치(200)에서 머신 러닝 동작이 수행된다(S100).
비록 도 4에서는 설명의 편의상 스토리지 장치(200)에서 머신 러닝 동작(S100)이 수행된 후, 호스트 장치(100)로부터 스토리지 장치(200)의 불량 발생 확률(failure possibility) 정보를 요청하는 커맨드가 수신(S200)되는 순서를 도시하였으나, 실시예들이 도시된 동작 순서에 제한되는 것은 아니다.
스토리지 장치(200)에서 수행되는 머신 러닝 동작(S100)의 수행 시점은 도시된 예와 다르게 얼마든지 변형되어 실시될 수 있다. 또한, 몇몇 실시예에서, 스토리지 장치(200)는 도시되지 않은 머신 러닝 동작 수행을 지시하는 커맨드를 호스트 장치(100)로부터 수신하는 것에 응답하여 머신 러닝 동작(S100)을 수행할 수도 있다.
스토리지 장치(200)에서 수행되는 머신 러닝 동작은 예를 들어, 도 5에 도시된 로그 데이터 수집 동작(S110, S120), 로그 데이터를 이용한 머신 러닝 수행 동작(S130)을 포함할 수 있다.
이하, 도 5를 참조하여, 보다 구체적으로 설명한다.
도 5를 참조하면, 로그 데이터를 수집한다(S110).
도 6을 참조하면, 스토리지 장치(200)의 로그 모니터(240)는 스토리지 장치(200)에 포함되어 스토리지 장치(200)를 구성하는 각종 컴포넌트들(216, 220, 233, 250)으로부터 로그 데이터를 수집할 수 있다.
도 6에서는, 스토리지 장치(200)에 포함된 컴포넌트들의 예로, DRAM(216a)을 포함하는 버퍼 메모리(216), NAND(226)와 PRAM(227)을 포함하는 비휘발성 메모리(220), 온도 센서(230), 캐패시터(231) 및 CRC 모듈(232) 등 스토리지 장치(200)를 구성하는 각종 하드웨어(233) 및 스토리지 장치(200)에 설치된 펌웨어(250)를 도시하였으나, 실시예들이 이에 제한되는 것은 아니다.
몇몇 실시예에서, 로그 모니터(240)는 머신 러닝 모듈(도 1의 219)의 일부로 구현될 수 있다. 또한 다른 몇몇 실시예에서, 로그 모니터(240)는 머신 러닝 모듈(도 1의 219)과 다른 별도의 모듈로 구현될 수도 있다.
몇몇 실시예에서, 로그 모니터(240)는 소프트웨어로 구현되어 스토리지 장치(200)에서 동작할 수도 있고, 로그 모니터(240)는 하드웨어로 구현되어 스토리지 장치(200)에서 동작할 수도 있다.
로그 모니터(240)는 스토리지 장치(200)에 포함된 버퍼 메모리(216), 비휘발성 메모리(220), 하드웨어(233) 및 펌웨어(250)의 동작으로부터, 로그 데이터를 수집할 수 있다. 구체적으로, 로그 모니터(240)는 스토리지 장치(200)에 포함된 버퍼 메모리(216), 비휘발성 메모리(220), 하드웨어(233) 및 펌웨어(250)의 동작으로부터, 버퍼 메모리(216), 비휘발성 메모리(220), 하드웨어(233) 및 펌웨어(250)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
이러한 로그 데이터의 예는 도 7에 도시되어 있다.
도 6 및 도 7을 참조하면, 로그 모니터(240)는 NAND(226)의 동작으로부터, NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터는, NAND(226)의 리클레임 횟수(Reclaim Count), NAND(226)의 리드 레이턴시 히스토그램(Read Latency Histogram), NAND(226)의 리드 리트라이 횟수(Read Retry Count), NAND(226)의 다이(die) 당 RTBB(Run Time Bad Block) 수, NAND(226)의 사용 가능 다이(available die) 수, NAND(226)의 UECC(Uncorrectable Error CorreCtion) 횟수 등을 포함할 수 있다.
NAND(226)의 리클레임 동작은, 리드 리트라이(read retry) 동작을 통해 NAND(226)에 저장된 데이터를 성공적으로 리드하였으나, 리드된 데이터에 에러 비트가 많이 포함된 것을 발견하여, NAND(226)의 새로운 페이지로 리드된 페이지에 저장된 데이터를 옮기는 동작이다.
NAND(226)의 리클레임 동작의 발생 횟수가 높다는 것은 NAND(226)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 NAND(226)의 리클레임 횟수(Reclaim Count)를 NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
NAND(226)의 리드 레이턴시(read latency)가 증가한다는 것은 NAND(226)에서 리드 리트라이 또는 리클레임 동작이 수행되어 리드 레이턴시가 증가되는 것으로 볼 수 있어, NAND(226)의 리드 레이턴시가 증가한다는 것은 NAND(226)의 불량 발생 확률이 높아졌다는 것을 의미할 수 있다. 따라서, 로그 모니터(240)는 NAND(226)의 리드 레이턴시 히스토그램(Read Latency Histogram)을 NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
NAND(226)의 리드 리트라이 동작은, 리드 과정에서 에러가 발생하여 동일한 데이터를 리드하기 위해 다시 리드 동작을 수행하는 동작이다.
NAND(226)의 리드 리트라이 동작의 발생 횟수가 높다는 것은 NAND(226)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 NAND(226)의 리드 리트라이 횟수(Read Retry Count)를 NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
NAND(226)의 RTBB(Run Time Bad Block)는 NAND(226) 동작 중에 불량이 발생한 블록을 의미한다.
NAND(226)의 RTBB가 증가한다는 것은 NAND(226)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 NAND(226)의 다이 당 RTBB(Run Time Bad Block) 수를 NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
NAND(226)의 사용 가능 다이 수는 NAND(226)내에서 실제 사용 중인 NAND 칩의 개수를 의미하며, 불량 NAND 칩의 개수가 증가할수록 NAND(226)의 사용 가능 다이 수는 감소한다.
NAND(226)의 사용 가능 다이 수가 감소한다는 것은 NAND(226)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 NAND(226)의 사용 가능 다이 수를 NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
NAND(226)의 UECC(Uncorrectable Error CorreCtion) 횟수는 NAND(226)에서 발생한 정정 불가능한 에러 발생 횟수를 의미한다.
NAND(226)의 UECC 횟수가 증가한다는 것은 NAND(226)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 NAND(226)의 UECC 횟수를 NAND(226)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
또한, 로그 모니터(240)는 DRAM(216a)의 동작으로부터, DRAM(216a)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
DRAM(216a)의 불량 발생 확률을 예측하기 위한 로그 데이터는, DRAM(216a)의 CECC(Correctable Error CorreCtion) 횟수, DRAM(216a)의 온도 히스토리 등을 포함할 수 있다.
DRAM(216a)의 CECC 횟수는 DRAM(216a) 동작 중에 1비트 플립(1 bit flip)이 발생한 횟수이다.
DRAM(216a)의 CECC 횟수가 증가한다는 것은 DRAM(216a)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 DRAM(216a)의 CECC 횟수를 DRAM(216a)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
DRAM(216a)의 온도 히스토리는 DRAM(216a)이 동작하는 동작 온도를 시간 순서에 따라 저장한 데이터이다.
DRAM(216a)의 동작 온도는 DRAM(216a)의 불량 발생 확률에 영향을 줄 수 있으므로, 로그 모니터(240)는 DRAM(216a)의 온도 히스토리를 DRAM(216a)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
또한, 로그 모니터(240)는 캐패시터(231)의 동작으로부터, 캐패시터(231)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
캐패시터(231)의 불량 발생 확률을 예측하기 위한 로그 데이터는, 캐패시터(231)의 상태(Capacitor Health) 등을 포함할 수 있다.
캐패시터(231)의 상태(Capacitor Health)는 스토리지 장치(200) 내에 존재하는 캐패시터(231)의 차징(charing) 상태를 숫자로 표기하여, 캐패시터(231)의 상태를 지시하는 정보이다. 예를 들어, 캐패시터(231)가 사용되지 않은 상태의 초기 값이 100이라면, 캐패시터(231)가 사용될수록 차징 용량이 줄어들게되므로 캐패시터(231)의 상태(Capacitor Health) 값은 점차 줄어들게 된다.
이처럼 캐패시터(231)의 상태(Capacitor Health)는 캐패시터(231)의 불량 발생 확률에 영향을 줄 수 있으므로, 로그 모니터(240)는 캐패시터(231)의 상태(Capacitor Health)를 캐패시터(231)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
또한, 로그 모니터(240)는 온도 센서(230)의 동작으로부터, 온도 센서(230)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
온도 센서(230)의 불량 발생 확률을 예측하기 위한 로그 데이터는, 온도 센서(230)의 리트라이 횟수 등을 포함할 수 있다.
온도 센서(230)의 리트라이 횟수는 온도 센서(230)로부터 센싱된 값을 리드할 때 리트라이를 시도한 횟수이다.
온도 센서(230)의 리트라이 횟수가 증가한다는 것은 온도 센서(230)의 불량 발생 확률이 높아졌다는 것을 의미하므로, 로그 모니터(240)는 온도 센서(230)의 리트라이 횟수를 온도 센서(230)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
또한, 로그 모니터(240)는 CRC 모듈(232)의 동작으로부터, CRC 모듈(232)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
CRC 모듈(232)의 불량 발생 확률을 예측하기 위한 로그 데이터는, CRC 모듈(232)의 에러 히스토리 등을 포함할 수 있다.
CRC 모듈(232)의 에러 히스토리는 스토리지 장치(200) 내부의 데이터 패스의 신호 정합(signal integrity) 상태를 나타낼 수 있다.
CRC 에러 횟수가 높다는 것은 CRC 모듈(232)의 동작 횟수가 많아졌다는 것과 스토리지 장치(200) 내부의 데이터 패스의 신호 정합(signal integrity) 상태가 좋지 못함을 의미하므로, 로그 모니터(240)는 CRC 모듈(232)의 에러 히스토리를 CRC 모듈(232) 또는 스토리지 장치(200)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
또한, 로그 모니터(240)는 펌웨어(250)의 동작으로부터, 펌웨어(250)의 불량 발생 확률을 예측하기 위한 로그 데이터를 수집할 수 있다.
펌웨어(250)의 불량 발생 확률을 예측하기 위한 로그 데이터는, 펌웨어(250)에서 발생한 예외 발생 횟수(Exception count)와 리셋 횟수(Reset count) 등을 포함할 수 있다.
펌웨어(250)의 예외 발생 횟수(Exception count)와 리셋 횟수(Reset count)가 증가한다는 것은 빈번한 버그(bug) 발생으로 인해 펌웨어(250)의 변경이 필요하거나 스토리지 장치(200)의 제어 동작이 원할하게 이루어지지 못함을 의미할 수 있다. 따라서, 로그 모니터(240)는 펌웨어(250)의 예외 발생 횟수(Exception count)와 리셋 횟수(Reset count)를 펌웨어(250) 또는 스토리지 장치(200)의 불량 발생 확률을 예측하기 위한 로그 데이터로 수집한다.
다시 도 5를 참조하면, 수집된 로그 데이터의 개수가 미리 정한 개수보다 많은지 판단한다(S120). 만약, 수집된 로그 데이터의 개수가 미리 정한 개수보다 작다면(S120-N), 로그 데이터 수집을 지속한다(S110).
몇몇 실시예에서, 로그 데이터 수집 동작(S110)은 후술할 시간 윈도우(time window)를 만족하는 개수의 로그 데이터가 수집될 때까지 지속될 수 있다.
도 6을 참조하면, 몇몇 실시예에서, 로그 모니터(240)는 수집된 로그 데이터를 비휘발성 메모리(220)에 DB(228)형태로 저장할 수 있다. 즉, 비휘발성 메모리(220)에 포함된 복수의 NAND 칩 중 어느 하나는 로그 모니터(240)에 의해 수집된 로그 데이터를 저장할 수 있다.
하지만, 실시예들이 이에 제한되는 것은 아니며, 로그 모니터(240)는 수집된 로그 데이터를 비휘발성 메모리(220)가 아닌 다른 영역에 저장할 수도 있다. 예를 들어, 로그 모니터(240)는 스토리지 장치(200)와 네트워크를 통해 연결된 다른 저장 영역에 수집된 로그 데이터를 저장할 수도 있다.
도 6 및 도 8을 참조하면, 예를 들어, 로그 모니터(240)가 10초 단위로 NAND(226)의 동작으로부터 로그 데이터를 수집하고, NAND(226)의 불량 발생 확률을 예측하는데 필요한 로그 데이터의 개수가 5개라고 하면(즉, 도 8의 p=5), 로그 모니터(240)는 최소 50초 동안 NAND(226)의 동작으로부터 앞서 설명한 로그 데이터들을 수집할 수 있다. 다시 말해, 최소 50초의 시간이 지난 후에 머신 러닝 모듈(219)의 NAND(226)에 대한 불량 발생 확률 예측 동작이 수행될 수 있다.
다시 도 5를 참조하면, 수집된 로그 데이터의 개수가 미리 정한 개수보다 많다면(S120-Y), 머신 러닝 동작을 수행한다(S130).
도 1 및 도 8을 참조하면, 머신 러닝 모듈(219)은 시간의 흐름에 따라 수집된 각 컴포넌트별 k(k는 자연수)개의 로그 데이터들 중 미리 정한 시간 윈도우 내에 포함된 p(p는 k보다 작은 자연수)개의 로그 데이터들을 이용하여 각 컴포넌트에 대한 불량 발생 확률을 예측할 수 있다.
즉, 도 8에서, 현재 시점을 t라고 하면, 머신 러닝 모듈(219)은 제1 컴포넌트(component 1)의 동작으로부터 과거부터 현재 시점까지 수집된 k개의 로그 데이터들 중에서 시간 윈도우 내에 포함된 p개의 로그 데이터들을 이용하여 제1 컴포넌트(component 1)에 대한 미래 n(n은 자연수)시점까지의 불량 발생 확률(FP(t+1), FP(t+2), FP(t+n))을 예측할 수 있다.
또한, 머신 러닝 모듈(219)은 제2 컴포넌트(component 2)의 동작으로부터 과거부터 현재 시점까지 수집된 k개의 로그 데이터들 중에서 시간 윈도우 내에 포함된 p개의 로그 데이터들을 이용하여 제2 컴포넌트(component 2)에 대한 미래 n시점까지의 불량 발생 확률(FP(t+1), FP(t+2), FP(t+n))을 예측할 수 있다.
머신 러닝 모듈(219)의 이러한 동작은 스토리지 장치(200)에 포함된 m(m은 자연수)개의 컴포넌트에 대해 수행될 수 있다.
다음, 도 1 및 도 9를 참조하면, 머신 러닝 모듈(219)은 미래 n시점까지 예측된 각 컴포넌트별 불량 발생 확률(FP(t+1), FP(t+2), FP(t+n))을 기초로 스토리지 장치(200)에 대한 미래 n시점까지의 불량 발생 확률(SSD Status(t+1), SSD Status(t+2), SSD Status(t+n))을 예측할 수 있다.
구체적으로 도 10을 참조하면, 머신 러닝 모듈(219)은 미래 n시점까지 예측된 각 컴포넌트별 불량 발생 확률(FP(t+1), FP(t+2), FP(t+n))을 기초로 매트릭스를 구성하고, 구성된 매트릭스에 각 컴포넌트별 가중치(Weighted vector)를 곱하여, 스토리지 장치(200)에 대한 미래 n시점까지의 불량 발생 확률(SSD Status(t+1), SSD Status(t+2), SSD Status(t+n))을 예측할 수 있다.
여기서, 각 컴포넌트별 가중치(Weighted vector)는 다양한 방법으로 결정될 수 있다. 몇몇 실시예에서, 각 컴포넌트별 과거 불량 비율이 각 컴포넌트별 가중치(Weighted vector)로 고려될 수 있으나, 실시예들이 이에 제한되는 것은 아니다.
다시 도 4를 참조하면, 호스트 장치(100)가 스토리지 장치(200)에 스토리지 장치(200)의 불량 발생 확률(failure possibility) 정보를 요청하는 커맨드를 송신한다(S200).
몇몇 실시예에서, 이러한 스토리지 장치(200)의 불량 발생 확률 정보를 요청하는 커맨드는 Get Log Page 커맨드를 포함할 수 있다.
이 때, Get Log Page 커맨드의 로그 지시자(Log Identifier)는 도 11에 도시된 것과 같이 C0 내지 FF 중 어느 하나일 수 있다. 즉, 호스트 장치(100)가 로그 지시자를 C0 내지 FF 중 어느 하나로 지정하여 스토리지 장치(200) Get Log Page 커맨드를 송신함으로써, 호스트 장치(100)가 스토리지 장치(200)에 스토리지 장치(200)의 불량 발생 확률 정보를 요청할 수 있다.
도 4를 참조하면, 이를 수신한 스토리지 장치(200)는 이에 응답하여 호스트 장치(100)에 스토리지 장치(200)의 불량 발생 확률 정보를 응답한다(S300).
몇몇 실시예에서, 스토리지 장치(200)의 응답은 도 12에 도시된 것과 같이 예측 시점별 상태 정보를 포함할 수 있다.
구체적으로 도 12를 참조하면, 스토리지 장치(200)는 각 예측 시점에서, 스토리지 장치(200)의 고장 확률을 점수화한 점수(Score)와 스토리지 장치(200)의 고장 확률을 상태로 표현한 상태 정보(Status)를 호스트 장치(100)에 응답할 수 있다.
몇몇 실시예에서, 상태 정보(Status)는 당장 조치가 필요한 긴급(Urgent) 상태와, 비긴급(non-Urgent) 상태이고 불량 발생 확률이 비교적 낮은 로우(Low) 상태와, 비긴급(non-Urgent) 상태이고 불량 발생 확률이 로우(Low) 상태보다 높은 미디엄(Medium) 상태와, 비긴급(non-Urgent) 상태이고 불량 발생 확률이 미디엄(Medium) 상태보다 높은 하이(High) 상태를 포함할 수 있다. 하지만, 실시예들이 이에 제한되는 것은 아니며, 필요에 따라 상태 정보는 얼마든지 다르게 분류되어 표현될 수 있다.
한편, 다른 몇몇 실시예에서, 호스트 장치(100)가 스토리지 장치(200)의 불량 발생 확률 정보를 요청하는 커맨드는 앞서 예시한 Get Log Page 커맨드 외에 NVMe 표준에 포함된 Get Feature 커맨드와 같은, 관리자 커맨드 세트(admin command set)의 커맨드를 포함할 수도 있다.
이 경우, 호스트 장치(100)가 Get Feature 커맨드를 통해 스토리지 장치(200)의 특정 피처(Feature) ID에 대한 데이터를 요청하면, 스토리지 장치(200)는 피처 식별자(FID; Feature IDentifer)에 불량 확률 정보를 정의하여 호스트 장치(100)에 불량 확률 정보를 제공할 수 있다.
또한, 또 다른 몇몇 실시예에서, 호스트 장치(100)가 스토리지 장치(200)의 불량 발생 확률 정보를 요청하는 커맨드는 NVMe 표준에 포함된 Security Send 커맨드를 포함할 수도 있다.
이 경우, 호스트 장치(100)가 Security Send 커맨드를 통해 스토리지 장치(200)에 불량 확률 정보를 요청하면, 스토리지 장치(200)는 보안 프로토콜(Security Protocol)로 불량 확률 정보를 암호화하여, Security Receive 커맨드를 통해 호스트 장치(100)에 불량 확률 정보를 제공할 수 있다.
도 4를 참조하면, 스토리지 장치(200)로부터 스토리지 장치(200)의 불량 발생 확률 정보를 수신한 호스트 장치(100)는 이를 기초로 스토리지 장치(200)의 RAID 리빌딩 타이밍을 결정한다(S400).
예를 들어, 멀지 않은 미래 시점에서의 스토리지 장치(200)의 불량 발생 확률이 긴급(Urgent) 상태에 해당하는 경우, 호스트 장치(100)는 즉시 스토리지 장치(200)의 RAID 리빌딩을 수행할 수 있다. 반대로, 멀지 않은 미래 시점에서의 스토리지 장치(200)의 불량 발생 확률이 로우(Low) 상태에 해당하는 경우, 호스트 장치(100)는 스토리지 장치(200)와 I/O 동작을 충분히 수행한 이후의 시점에 RAID 리빌딩을 수행할 수 있다.
이처럼 본 실시예에 따른 메모리 시스템에서는, 스토리지 장치의 예측된 불량 발생 확률 정보가 호스트 장치에 제공되어, 호스트 장치가 스토리지 장치에 실제 불량이 발생되기 전에 미리 필요한 조치를 취할 수 있다. 이에 따라 메모리 시스템의 신뢰성이 향상될 수 있다.
이하, 도 13을 참조하여, 다른 몇몇 실시예에 따른 메모리 시스템의 동작에 대해 설명한다.
도 13은 다른 몇몇 실시예에 따른 메모리 시스템의 동작을 설명하기 위한 도면이다. 이하에서는 앞서 설명한 실시예와 중복된 설명은 생략하고 차이점만을 설명한다.
도 13을 참조하면, 본 실시예에서는, 스토리지 장치(200)가 호스트 장치(100)에 스토리지 장치(200)의 불량 발생 확률 정보를 응답할 때(도 4의 S300), 스토리지 장치(200)가 스토리지 장치(200)의 불량 발생 확률 정보 뿐만 아니라 스토리지 장치(200) 내에 포함된 각 컴포넌트별 불량 발생 확률 정보도 호스트 장치(100)에 응답한다.
구체적으로, 도 13을 참조하면, 스토리지 장치(200)는, 각 예측 시점에서, 스토리지 장치(200)의 고장 확률을 상태로 표현한 상태 정보(Status)와 스토리지 장치(200) 내에 포함된 각 컴포넌트들의 고장 확률을 상태로 표현한 상태 정보(Status)를 호스트 장치(100)에 응답할 수 있다.
이 때, 상태 정보(Status)는 앞서 설명한 실시예와 동일한 분류법을 사용할 수 있으나, 실시예가 이에 제한되는 것은 아니다.
본 실시예의 경우, 호스트 장치(100)는 스토리지 장치(200) 내의 각 컴포넌트별 고장 확률 정보도 제공받을 수 있으므로, 스토리지 장치(200)를 보다 정교하게 관리할 수 있다.
도 14는 몇몇 실시예에 따른 스토리지 장치가 적용된 데이터 센터를 도시한 도면이다.
도 14을 참조하면, 데이터 센터(3000)는 각종 데이터를 모아두고 서비스를 제공하는 시설로서, 데이터 스토리지 센터라고 지칭될 수도 있다. 데이터 센터(3000)는 검색 엔진 및 데이터 베이스 운용을 위한 시스템일 수 있으며, 은행 등의 기업 또는 정부기관에서 사용되는 컴퓨팅 시스템일 수 있다. 데이터 센터(3000)는 어플리케이션 서버들(3100 내지 3100n) 및 스토리지 서버들(3200 내지 3200m)을 포함할 수 있다. 어플리케이션 서버들(3100 내지 3100n)의 개수 및 스토리지 서버들(3200 내지 3200m)의 개수는 실시예에 따라 다양하게 선택될 수 있고, 어플리케이션 서버들(3100 내지 3100n)의 개수 및 스토리지 서버들(3200 내지 3200m)의 개수는 서로 다를 수 있다.
어플리케이션 서버(3100) 또는 스토리지 서버(3200)는 프로세서(3110, 3210) 및 메모리(3120, 3220) 중 적어도 하나를 포함할 수 있다. 스토리지 서버(3200)를 예시로 설명하면, 프로세서(3210)는 스토리지 서버(3200)의 전반적인 동작을 제어할 수 있고, 메모리(3220)에 액세스하여 메모리(3220)에 로딩된 명령어 및/또는 데이터를 실행할 수 있다. 메모리(3220)는 DDR SDRAM(Double Data Rate Synchronous DRAM), HBM(High Bandwidth Memory), HMC(Hybrid Memory Cube), DIMM(Dual In-line Memory Module), Optane DIMM 또는 NVMDIMM(Non-Volatile DIMM)일 수 있다. 실시예에 따라, 스토리지 서버(3200)에 포함되는 프로세서(3210)의 개수 및 메모리(3220)의 개수는 다양하게 선택될 수 있다.
일 실시예에서, 프로세서(3210)와 메모리(3220)는 프로세서-메모리 페어를 제공할 수 있다. 일 실시예에서, 프로세서(3210)와 메모리(3220)의 개수는 서로 다를 수도 있다. 프로세서(3210)는 단일 코어 프로세서 또는 다중 코어 프로세서를 포함할 수 있다. 스토리지 서버(3200)에 대한 상기 설명은, 어플리케이션 서버(3100)에도 유사하게 적용될 수 있다. 실시예에 따라, 어플리케이션 서버(3100)는 스토리지 장치(3150)를 포함하지 않을 수도 있다. 스토리지 서버(3200)는 적어도 하나 이상의 스토리지 장치(3250)를 포함할 수 있다. 스토리지 서버(3200)에 포함되는 스토리지 장치(3250)의 개수는 실시예에 따라 다양하게 선택될 수 있다.
어플리케이션 서버들(3100 내지 3100n) 및 스토리지 서버들(3200 내지 3200m)은 네트워크(3300)를 통해 서로 통신할 수 있다. 네트워크(3300)는 FC(Fibre Channel) 또는 이더넷(Ethernet) 등을 이용하여 구현될 수 있다. 이 때, FC는 상대적으로 고속의 데이터 전송에 사용되는 매체이며, 고성능/고가용성을 제공하는 광 스위치를 사용할 수 있다. 네트워크(3300)의 액세스 방식에 따라 스토리지 서버들(3200 내지 3200m)은 파일 스토리지, 블록 스토리지, 또는 오브젝트 스토리지로서 제공될 수 있다.
일 실시예에서, 네트워크(3300)는 SAN(Storage Area Network)와 같은 스토리지 전용 네트워크일 수 있다. 예를 들어, SAN은 FC 네트워크를 이용하고 FCP(FC Protocol)에 따라 구현된 FC-SAN일 수 있다. 다른 예를 들어, SAN은 TCP/IP 네트워크를 이용하고 iSCSI(SCSI over TCP/IP 또는 Internet SCSI) 프로토콜에 따라 구현된 IP-SAN일 수 있다. 다른 실시예에서, 네트워크(1300)는 TCP/IP 네트워크와 같은 일반 네트워크일 수 있다. 예를 들어, 네트워크(1300)는 FCoE(FC over Ethernet), NAS(Network Attached Storage), NVMe-oF(NVMe over Fabrics) 등의 프로토콜에 따라 구현될 수 있다.
이하에서는, 어플리케이션 서버(3100) 및 스토리지 서버(3200)를 중심으로 설명하기로 한다. 어플리케이션 서버(3100)에 대한 설명은 다른 어플리케이션 서버(3100n)에도 적용될 수 있고, 스토리지 서버(3200)에 대한 설명은 다른 스토리지 서버(3200m)에도 적용될 수 있다.
어플리케이션 서버(3100)는 사용자 또는 클라이언트가 저장 요청한 데이터를 네트워크(3300)를 통해 스토리지 서버들(3200 내지 3200m) 중 하나에 저장할 수 있다. 또한, 어플리케이션 서버(3100)는 사용자 또는 클라이언트가 독출 요청한 데이터를 스토리지 서버들(3200 내지 3200m) 중 하나로부터 네트워크(3300)를 통해 획득할 수 있다. 예를 들어, 어플리케이션 서버(3100)는 웹 서버 또는 DBMS(Database Management System) 등으로 구현될 수 있다.
어플리케이션 서버(3100)는 네트워크(3300)를 통해 다른 어플리케이션 서버(3100n)에 포함된 메모리(3120n) 또는 스토리지 장치(3150n)에 액세스할 수 있고, 또는 네트워크(3300)를 통해 스토리지 서버(3200-3200m)에 포함된 메모리(3220-3220m) 또는 스토리지 장치(3250-3250m)에 액세스할 수 있다. 이로써, 어플리케이션 서버(3100)는 어플리케이션 서버들(3100-3100n) 및/또는 스토리지 서버들(3200-3200m)에 저장된 데이터에 대해 다양한 동작들을 수행할 수 있다. 예를 들어, 어플리케이션 서버(3100)는 어플리케이션 서버들(3100-3100n) 및/또는 스토리지 서버들(3200-3200m) 사이에서 데이터를 이동 또는 카피(copy)하기 위한 명령어를 실행할 수 있다. 이 때 데이터는 스토리지 서버들(3200-3200m)의 스토리지 장치로(3250-3250m)부터 스토리지 서버들(3200-3200m)의 메모리들(3220-3220m)을 거쳐서, 또는 바로 어플리케이션 서버들(3100-3100n)의 메모리(3120-3120n)로 이동될 수 있다. 네트워크(3300)를 통해 이동하는 데이터는 보안 또는 프라이버시를 위해 암호화된 데이터일 수 있다.
스토리지 서버(3200)를 예시로 설명하면, 인터페이스(3254)는 프로세서(3210)와 컨트롤러(3251)의 물리적 연결 및 NIC(3240)와 컨트롤러(3251)의 물리적 연결을 제공할 수 있다. 예를 들어, 인터페이스(3254)는 스토리지 장치(3250)를 전용 케이블로 직접 접속하는 DAS(Direct Attached Storage) 방식으로 구현될 수 있다. 또한, 예를 들어, 인터페이스(3254)는 ATA(Advanced Technology Attachment), SATA(Serial ATA), e-SATA(external SATA), SCSI(Small Computer Small Interface), SAS(Serial Attached SCSI), PCI(Peripheral Component Interconnection), PCIe(PCI express), NVMe(NVM express), IEEE 1394, USB(universal serial bus), SD(secure digital) 카드, MMC(multi-media card), eMMC(embedded multi-media card), UFS(Universal Flash Storage), eUFS(embedded Universal Flash Storage), CF(compact flash) 카드 인터페이스 등과 같은 다양한 인터페이스 방식으로 구현될 수 있다.
스토리지 서버(3200)는 스위치(3230) 및 NIC(3240)을 더 포함할 수 있다. 스위치(3230)는 프로세서(3210)의 제어에 따라 프로세서(3210)와 스토리지 장치(3250)를 선택적으로 연결시키거나, NIC(3240)과 스토리지 장치(3250)를 선택적으로 연결시킬 수 있다.
일 실시예에서 NIC(3240)는 네트워크 인터페이스 카드, 네트워크 어댑터 등을 포함할 수 있다. NIC(3240)는 유선 인터페이스, 무선 인터페이스, 블루투스 인터페이스, 광학 인터페이스 등에 의해 네트워크(3300)에 연결될 수 있다. NIC(3240)는 내부 메모리, DSP, 호스트 버스 인터페이스 등을 포함할 수 있으며, 호스트 버스 인터페이스를 통해 프로세서(3210) 및/또는 스위치(3230) 등과 연결될 수 있다. 호스트 버스 인터페이스는, 앞서 설명한 인터페이스(3254)의 예시들 중 하나로 구현될 수도 있다. 일 실시예에서, NIC(3240)는 프로세서(3210), 스위치(3230), 스토리지 장치(3250) 중 적어도 하나와 통합될 수도 있다.
스토리지 서버(3200-3200m) 또는 어플리케이션 서버(3100-3100n)에서 프로세서는 스토리지 장치(3130-3130n, 3250-3250m) 또는 메모리(3120-3120n, 3220-3220m)로 커맨드를 전송하여 데이터를 프로그램하거나 리드할 수 있다. 이 때 데이터는 ECC(Error Correction Code) 엔진을 통해 에러 정정된 데이터일 수 있다. 데이터는 데이터 버스 변환(Data Bus Inversion: DBI) 또는 데이터 마스킹(Data Masking: DM) 처리된 데이터로서, CRC(Cyclic Redundancy Code) 정보를 포함할 수 있다. 데이터는 보안 또는 프라이버시를 위해 암호화된 데이터일 수 있다.
스토리지 장치(3150-3150m, 3250-3250m)는 프로세서로부터 수신된 리드 커맨드에 응답하여, 제어 신호 및 커맨드/어드레스 신호를 NAND 플래시 메모리 장치(3252-3252m)로 전송할 수 있다. 이에 따라 NAND 플래시 메모리 장치(3252-3252m)로부터 데이터를 독출하는 경우, RE(Read Enable) 신호는 데이터 출력 제어 신호로 입력되어, 데이터를 DQ 버스로 출력하는 역할을 할 수 있다. RE 신호를 이용하여 DQS(Data Strobe)를 생성할 수 있다. 커맨드와 어드레스 신호는 WE(Write Enable) 신호의 상승 엣지 또는 하강 엣지에 따라 페이지 버퍼에 래치될 수 있다.
컨트롤러(3251)는 스토리지 장치(3250)의 동작을 전반적으로 제어할 수 있다. 일 실시예에서, 컨트롤러(3251)는 SRAM(Static Random Access Memory)을 포함할 수 있다. 컨트롤러(3251)는 기입 커맨드에 응답하여 낸드 플래시(3252)에 데이터를 기입할 수 있고, 또는 독출 커맨드에 응답하여 낸드 플래시(3252)로부터 데이터를 독출할 수 있다. 예를 들어, 기입 커맨드 및/또는 독출 커맨드는 스토리지 서버(3200) 내의 프로세서(3210), 다른 스토리지 서버(3200m) 내의 프로세서(3210m) 또는 어플리케이션 서버(3100, 3100n) 내의 프로세서(3110, 3110n)로부터 제공될 수 있다. DRAM(3253)은 낸드 플래시(3252)에 기입될 데이터 또는 낸드 플래시(3252)로부터 독출된 데이터를 임시 저장(버퍼링)할 수 있다. 또한, DRAM(3253)은 메타 데이터를 저장할 수 있다. 여기서, 메타 데이터는 사용자 데이터 또는 낸드 플래시(3252)를 관리하기 위해 컨트롤러(3251)에서 생성된 데이터이다. 스토리지 장치(3250)는 보안 또는 프라이버시를 위해 SE(Secure Element)를 포함할 수 있다.
몇몇 실시예에서, 스토리지 장치(3150, 3250)는 앞서 설명한 동작을 수행할 수 있다. 즉, 스토리지 장치(3150, 3250)는 스토리지 장치(3150, 3250) 내에 포함된 각 컴포넌트별로 로그 데이터 수집하고, 수집된 로그 데이터를 기초로 각 컴포넌트별 불량 발생 확률을 예측할 수 있다.
각 스토리지 장치(3150, 3250)에서 수집된 로그 데이터는 각 스토리지 장치(3150, 3250) 내부에 각각 저장될 수도 있고, 네트워크(3300)를 통해 연결되는 하나의 전용 스토리지 장치에 로그 데이터가 저장될 수도 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였으나, 본 발명은 상기 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 제조될 수 있으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
100: 호스트
200: 스토리지 장치
210: 스토리지 컨트롤러
219: 머신 러닝 모듈
200: 스토리지 장치
210: 스토리지 컨트롤러
219: 머신 러닝 모듈
Claims (20)
- 제1 컴포넌트와 제2 컴포넌트를 포함하는 스토리지 장치를 제공하고,
외부로부터 상기 스토리지 장치의 불량 발생 확률(failure possibility) 정보를 요청하는 커맨드를 제공받고,
상기 커맨드에 대한 응답으로, 상기 스토리지 장치의 불량 발생 확률 정보를 제공하는 것을 포함하는 스토리지 장치의 구동 방법. - 제1항에 있어서,
상기 스토리지 장치의 불량 발생 확률 정보를 요청하는 커맨드는 호스트 장치로부터 제공된 Get Log Page 커맨드를 포함하는 스토리지 장치의 구동 방법. - 제2항에 있어서,
상기 Get Log Page 커맨드의 로그 지시자(Log Identifier)는 C0 내지 FF 중 어느 하나인 스토리지 장치의 구동 방법. - 제1항에 있어서,
상기 불량 확률 정보는, 제1 상태와 제2 상태 중 어느 하나의 상태로 제공되는 스토리지 장치의 구동 방법. - 제4항에 있어서,
상기 제1 상태는 긴급(Urgent) 상태를 포함하고, 상기 제2 상태는 비긴급(non-Urgent) 상태를 포함하는 스토리지 장치의 구동 방법. - 제5항에 있어서,
상기 제2 상태는 제3 내지 제5 상태를 포함하고,
상기 제3 상태는 불량 발생 확률이 낮은 로우(Low) 상태를 포함하고,
상기 제4 상태는 불량 발생 확률이 상기 제3 상태보다 높은 미디엄(Medium) 상태를 포함하고,
상기 제5 상태는 불량 발생 확률이 상기 제4 상태보다 높은 하이(High) 상태를 포함하는 스토리지 장치의 구동 방법. - 제1항에 있어서,
상기 스토리지 장치의 불량 발생 확률 정보를 제공하는 것은,
상기 제1 컴포넌트의 불량 발생 확률 정보를 생성하고,
상기 제2 컴포넌트의 불량 발생 확률 정보를 생성하고,
상기 생성된 제1 컴포넌트의 불량 발생 확률 정보와, 상기 생성된 제2 컴포넌트의 불량 발생 확률 정보를 기초로 생성된 상기 스토리지 장치의 불량 발생 확률 정보를 제공하는 것을 포함하는 스토리지 장치의 구동 방법. - 제7항에 있어서,
상기 제1 컴포넌트의 불량 발생 확률 정보를 생성하는 것은,
상기 제1 컴포넌트에 대한 k(k는 자연수) 개의 로그 데이터 중 미리 정한 시간 윈도우 내에 포함된 p(p는 k보다 작은 자연수)개의 로그 데이터를 이용하여 미래 n(n은 자연수) 시점까지의 상기 제1 컴포넌트의 불량 발생 확률을 예측하는 것을 포함하고,
상기 제2 컴포넌트의 불량 발생 확률 정보를 생성하는 것은,
상기 제2 컴포넌트에 대한 r(r은 자연수) 개의 로그 데이터 중 상기 미리 정한 시간 윈도우 내에 포함된 p개의 로그 데이터를 이용하여 상기 미래 n 시점까지의 상기 제2 컴포넌트의 불량 발생 확률을 예측하는 것을 포함하고,
상기 스토리지 장치의 불량 발생 확률 정보는, 상기 미래 n 시점까지의 상기 제1 컴포넌트의 불량 발생 확률과 상기 미래 n 시점까지의 상기 제2 컴포넌트의 불량 발생 확률에 상기 제1 및 제2 컴포넌트 별 가중치를 연산하여 생성되는 스토리지 장치의 구동 방법. - 제1 컴포넌트와 제2 컴포넌트를 포함하는 스토리지 장치에, 상기 스토리지 장치의 불량 발생 확률 정보를 요청하는 커맨드를 전송하고,
상기 커맨드에 대한 응답으로, 상기 스토리지 장치의 불량 발생 확률 정보를 수신하는 것을 포함하는 호스트 장치의 구동 방법. - 제9항에 있어서,
상기 스토리지 장치의 불량 발생 확률 정보를 요청하는 커맨드는 Get Log Page 커맨드를 포함하는 호스트 장치의 구동 방법. - 제10항에 있어서,
상기 Get Log Page 커맨드의 로그 지시자는 C0 내지 FF 중 어느 하나인 호스트 장치의 구동 방법. - 제9항에 있어서,
상기 불량 확률 정보는, 제1 상태 내지 제4 상태 중 어느 하나의 상태로 수신되는 호스트 장치의 구동 방법. - 제9항에 있어서,
상기 스토리지 장치의 불량 발생 확률 정보를 수신하는 것은,
상기 스토리지 장치의 상기 제1 컴포넌트의 불량 발생 확률 정보를 수신하고,
상기 스토리지 장치의 상기 제2 컴포넌트의 불량 발생 확률 정보를 수신하고,
상기 스토리지 장치의 불량 발생 확률 정보를 수신하는 것을 포함하는 호스트 장치의 구동 방법. - 제9항에 있어서,
상기 스토리지 장치의 불량 발생 확률 정보를 기초로 상기 스토리지 장치의 RAID 리빌딩 타이밍을 결정하는 것을 더 포함하는 호스트 장치의 구동 방법. - 호스트 장치로부터 제공받은 데이터가 임시로 저장되는 버퍼 메모리;
상기 호스트 장치로부터 제공받은 데이터가 저장되는 비휘발성 메모리;
상기 버퍼 메모리와 상기 비휘발성 메모리로부터 로그 데이터를 수집하는 로그 모니터; 및
상기 수집된 로그 데이터로부터 불량 발생 확률을 예측하는 머신 러닝 모듈을 포함하는 스토리지 장치. - 제15항에 있어서,
상기 머신 러닝 모듈은,
상기 수집된 로그 데이터로부터 상기 버퍼 메모리의 불량 발생 확률을 생성하고,
상기 수집된 로그 데이터로부터 상기 비휘발성 메모리의 불량 발생 확률을 생성하고,
상기 생성된 버퍼 메모리의 불량 발생 확률과, 상기 생성된 비휘발성 메모리의 불량 발생 확률을 기초로 상기 스토리지 장치의 불량 발생 확률을 예측하는 스토리지 장치. - 제16항에 있어서,
상기 머신 러닝 모듈은,
상기 비휘발성 메모리로부터 수집된 k(k는 자연수)개의 로그 데이터 중 미리 정한 시간 윈도우 내에 포함된 p(p는 k보다 작은 자연수) 개의 로그 데이터를 기초로 상기 비휘발성 메모리의 불량 발생 확률을 생성하는 스토리지 장치. - 제15항에 있어서,
상기 비휘발성 메모리로부터 수집된 로그 데이터는, 상기 비휘발성 메모리에서 수행한 리클레임 횟수(Reclaim Count)를 포함하는 스토리지 장치. - 제15항에 있어서,
상기 비휘발성 메모리로부터 수집된 로그 데이터는, 상기 비휘발성 메모리에서 수행한 리드 리트라이 횟수(Read Retry Count)를 포함하는 스토리지 장치. - 제15항에 있어서,
상기 버퍼 메모리로부터 수집한 로그 데이터와, 상기 비휘발성 메모리로부터 수집한 로그 데이터는 상기 비휘발성 메모리에 저장되는 스토리지 장치.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200170198A KR20220080915A (ko) | 2020-12-08 | 2020-12-08 | 스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치 |
US17/376,441 US20220179724A1 (en) | 2020-12-08 | 2021-07-15 | Method for operating storage device and host device, and storage device |
DE102021119267.6A DE102021119267A1 (de) | 2020-12-08 | 2021-07-26 | Verfahren zum Betreiben einer Speichervorrichtung und einer Host-Vorrichtung sowie Speichervorrichtung |
CN202111203531.7A CN114610522A (zh) | 2020-12-08 | 2021-10-15 | 操作存储设备和主机设备的方法以及存储设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200170198A KR20220080915A (ko) | 2020-12-08 | 2020-12-08 | 스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220080915A true KR20220080915A (ko) | 2022-06-15 |
Family
ID=81655179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200170198A KR20220080915A (ko) | 2020-12-08 | 2020-12-08 | 스토리지 장치와 호스트 장치의 구동 방법 및 스토리지 장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220179724A1 (ko) |
KR (1) | KR20220080915A (ko) |
CN (1) | CN114610522A (ko) |
DE (1) | DE102021119267A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11733892B2 (en) * | 2021-06-29 | 2023-08-22 | Micron Technology, Inc. | Partial superblock memory management |
US20230359364A1 (en) * | 2023-07-18 | 2023-11-09 | Lemon Inc. | Guaranteeing online services based on predicting failures of storage devices |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6934673B2 (en) * | 2001-05-25 | 2005-08-23 | Hewlett-Packard Development Company, L.P. | Method and apparatus for predicting multi-part performability |
US7155641B2 (en) * | 2003-05-15 | 2006-12-26 | Microsoft Corporation | System and method for monitoring the performance of a server |
US7539907B1 (en) * | 2006-05-05 | 2009-05-26 | Sun Microsystems, Inc. | Method and apparatus for determining a predicted failure rate |
US7730364B2 (en) * | 2007-04-05 | 2010-06-01 | International Business Machines Corporation | Systems and methods for predictive failure management |
US9002775B1 (en) * | 2011-09-02 | 2015-04-07 | Lockheed Martin Corporation | Systems and methods for estimating a remaining useful life of an item |
US10726930B2 (en) * | 2017-10-06 | 2020-07-28 | Western Digital Technologies, Inc. | Method and system for a storage (SSD) drive-level failure and health prediction leveraging machine learning on internal parametric data |
KR20190067370A (ko) * | 2017-12-07 | 2019-06-17 | 에스케이하이닉스 주식회사 | 데이터 저장 장치 및 동작 방법, 이를 포함하는 스토리지 시스템 |
EP4106298B1 (en) * | 2018-01-22 | 2023-11-29 | Panasonic Intellectual Property Corporation of America | Vehicle anomaly detection server, vehicle anomaly detection system, and vehicle anomaly detection method |
US10719267B2 (en) * | 2018-05-30 | 2020-07-21 | Western Digital Technologies, Inc. | Partial reset of memory controller |
CN112955928A (zh) * | 2019-04-04 | 2021-06-11 | 松下知识产权经营株式会社 | 信息处理方法以及信息处理系统 |
EP3959909A4 (en) * | 2019-04-25 | 2022-06-15 | Telefonaktiebolaget LM Ericsson (publ.) | PROCEDURES AND NETWORK NODES FOR TRACKING USER DEVICES |
CN112148204B (zh) * | 2019-06-27 | 2024-02-02 | 伊姆西Ip控股有限责任公司 | 用于管理独立冗余盘阵列的方法、设备和介质 |
WO2021168174A1 (en) * | 2020-02-20 | 2021-08-26 | Nordson Corporation | Improved fluid dispensing process control using machine learning and system implementing the same |
US11669423B2 (en) * | 2020-07-10 | 2023-06-06 | The Toronto-Dominion Bank | Systems and methods for monitoring application health in a distributed architecture |
US11533217B2 (en) * | 2020-07-31 | 2022-12-20 | Hewlett Packard Enterprise Development Lp | Systems and methods for predictive assurance |
US11493548B2 (en) * | 2020-08-31 | 2022-11-08 | Uchicago Argonne, Llc | Predicting failure parameters of semiconductor devices subjected to stress conditions |
US11678018B2 (en) * | 2020-09-15 | 2023-06-13 | Arris Enterprises Llc | Method and system for log based issue prediction using SVM+RNN artificial intelligence model on customer-premises equipment |
US11734223B2 (en) * | 2020-09-17 | 2023-08-22 | Dell Products L.P. | NVMe-over-fabrics gateway system |
KR20220058127A (ko) * | 2020-10-30 | 2022-05-09 | 에스케이하이닉스 주식회사 | 컴퓨팅 시스템 및 그 동작 방법 |
US20220139541A1 (en) * | 2020-11-03 | 2022-05-05 | Koninklijke Philips N.V. | Part replacement registration tool |
US11556409B2 (en) * | 2021-01-20 | 2023-01-17 | Dell Products L.P. | Firmware failure reason prediction using machine learning techniques |
CN112948157B (zh) * | 2021-01-29 | 2022-12-23 | 苏州浪潮智能科技有限公司 | 服务器故障定位方法、装置、系统及计算机可读存储介质 |
US20230083443A1 (en) * | 2021-09-16 | 2023-03-16 | Evgeny Saveliev | Detecting anomalies in physical access event streams by computing probability density functions and cumulative probability density functions for current and future events using plurality of small scale machine learning models and historical context of events obtained from stored event stream history via transformations of the history into a time series of event counts or via augmenting the event stream records with delay/lag information |
US20230104543A1 (en) * | 2021-10-01 | 2023-04-06 | Halliburton Energy Services, Inc. | Machine learning based electric submersible pump failure prediction based on data capture at multiple window lengths to detect slow and fast changing behavior |
KR20230134288A (ko) * | 2022-03-14 | 2023-09-21 | 에스케이하이닉스 주식회사 | 메모리 시스템 및 그것의 동작 방법 |
-
2020
- 2020-12-08 KR KR1020200170198A patent/KR20220080915A/ko active Search and Examination
-
2021
- 2021-07-15 US US17/376,441 patent/US20220179724A1/en active Pending
- 2021-07-26 DE DE102021119267.6A patent/DE102021119267A1/de active Pending
- 2021-10-15 CN CN202111203531.7A patent/CN114610522A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220179724A1 (en) | 2022-06-09 |
CN114610522A (zh) | 2022-06-10 |
DE102021119267A1 (de) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220179724A1 (en) | Method for operating storage device and host device, and storage device | |
US11797219B2 (en) | Storage device, server device including the storage device and method of operating the storage device | |
US20230393959A1 (en) | Out-of-band management method for storage apparatus, baseboard management controller and storage apparatus | |
US20240045597A1 (en) | Storage device and operation method thereof | |
EP4148572B1 (en) | Computational storage device and storage system including the computational storage device | |
US12056381B2 (en) | Data processing method and data processing device | |
EP4325367A1 (en) | Method and device for data caching | |
CN115291796A (zh) | 存储数据的方法和装置 | |
KR20230068935A (ko) | 스토리지 장치 및 그 구동 방법 | |
US20240160511A1 (en) | Failure prediction apparatus and method for storage devices | |
KR102435910B1 (ko) | 스토리지 장치 및 그것의 동작 방법 | |
EP4246330A1 (en) | Storage device and operating method thereof | |
EP4332773A1 (en) | Storage server and operation method of storage server | |
US20240069814A1 (en) | Storage server and operation method of storage server | |
US20230393749A1 (en) | Method and device of storage data | |
EP4386556A1 (en) | Operation method of memory controller configured to control memory device | |
KR102403477B1 (ko) | 스토리지 장치와 이를 포함하는 호스트-스토리지 시스템 | |
US20240231687A9 (en) | Computational storage device, method for operating the computational storage device and method for operating host device | |
US12045468B2 (en) | Storage devices configured to obtain data of external devices for debugging | |
US20240193041A1 (en) | Operation method of memory controller configured to control memory device | |
EP4258097A1 (en) | Operation method of host device and operation method of storage device | |
US20230325110A1 (en) | Operation method of host device and operation method of storage device | |
US20230138032A1 (en) | Storage device and operating method thereof | |
KR20230029323A (ko) | 스토리지 패키지, 스토리지 장치 및 스토리지 장치의 구동 방법 | |
KR20230144434A (ko) | 호스트 장치의 동작 방법 및 스토리지 장치의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |