WO2022114900A1

WO2022114900A1 - 다중 명령어 큐 스토리지에서 순서 보장 단위를 정하는 방법 및 장치

Info

Publication number: WO2022114900A1
Application number: PCT/KR2021/017786
Authority: WO
Inventors: 원유집; 김지은
Original assignee: 한국과학기술원
Priority date: 2020-11-27
Filing date: 2021-11-29
Publication date: 2022-06-02
Also published as: US20240094954A1; KR20220074805A

Abstract

저장장치가, 수신된 제1쓰기명령과 제2쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령과 상기 제2쓰기명령을 실행하는 단계를 포함하는 쓰기 방법을 공개한다. 상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보를 포함하고, 상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하며, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하지 않고 결정하도록 되어 있다.

Description

다중 명령어 큐 스토리지에서 순서 보장 단위를 정하는 방법 및 장치

본 발명은 컴퓨팅 기술에 관한 것으로서 호스트와 저장장치 간에 복수 개의 전송채널들이 존재하는 경우 상기 전송채널들을 통해 전송되는 명령어의 실행순서를 보장하는 기술에 관한 것이다.

종래기술에 따르면, 호스트에서 저장장치에게 쓰기명령들을 전송할 때에, 각 쓰기명령에 에포크 아이디라는 값을 포함시킬 수 있다. 저장장치는 각 쓰기명령에 포함된 에포크 아이디들 간의 우선순위에 따라 각 쓰기명령의 실행순서를 결정할 수 있다. 호스트에서 복수 개의 스레드를 생성하는 경우, 제1스레드에 의해 생성되는 제1그룹의 쓰기명령들과 제2스레드에 의해 생성되는 제2그룹의 쓰기명령들 간에는 우선순위가 존재하지 않는다. 그러나 호스트가 상기 제1그룹의 쓰기명령들과 상기 제2그룹의 쓰기명령들에 각각 포함된 에포크 아이디들을 단 한 개의 전역변수, 즉 한 개의 에포크 카운터만을 이용하여 결정하는 경우, 저장장치가 상기 제1그룹의 쓰기명령들과 상기 제2그룹의 쓰기명령들 간에 우선순위가 존재하지 않는 경우에도 불필요하게 실행 우선순위를 판단한다는 문제가 있다.

또한, 호스트와 저장장치 간에 복수 개의 명령어 전송채널들이 제공된 환경에서는, 쓰기명령들 간의 실행우선순위를 결정하는 과정에서 비효율이 발생할 수 있다는 문제가 있다.

본 발명은 상술한 문제를 해결하기 위하여 다중 명령어 큐 스토리지에서 순서 보장 단위를 정하는 기술을 제공하고자 한다.

<스트림(Stream)의 정의와 새로운 에포크 아이디(epoch id) 할당 알고리즘>

도 1은 스레드 2개가 서로 다른 파일에 대해 fdatasync()를 동시에 호출한 경우 시간에 따라 NVMe 디바이스에 도착하는 입출력 요청과 각 입출력 요청의 에포크 아이디를 표시한 것이다. 여기서 A1, A2는 파일 A의 쓰기명령을 나타내고, B1, B2는 파일 B의 쓰기명령을 나타낸다. 도 1에서, 스토리지가 수신한 5개의 쓰기명령들 중 좌측에서 첫 번째 명령(A1), 두 번째 명령(B1) 및 우측에서 두 번째 명령(A2)은 쓰기 순서를 보장해야 하는 쓰기명령을 나타내며, 우측에서 첫 번째 명령(A3) 및 우측에서 세 번째 명령(B2)은 배리어 쓰기(barrier write) 명령을 나타낸다.

상기 fdatasync()는 fsync()와 다르게, 파일의 크기가 변경되는 얼로케이팅(allocationg) 쓰기가 아닌 경우에는 저널링을 수행하지 않는다. 따라서 fdatasync()는 입력 인자로 전달받은 파일의 데이터 블록에 대한 쓰기요청을 디스패치하고, 한 스레드에서 fdatasync() 간의 순서를 보장하기 위해 마지막으로 디스패치되는 데이터 블록에 대한 쓰기요청에 배리어 플래그를 포함 시켜 배리어-쓰기(barrier-write)로 보낸다. 파일 시스템에서 동작하는 여러 스레드가 동일한 에포크 카운터를 공유하고, 각 스레드에서 생성하는 입출력 요청에 해당 에포크 카운터로 아이디를 부여하는 방식은 멀티 스레드 환경에서 두 가지 문제점이 있다.

첫 번째 문제점은, 서로 다른 프로세스 간 불필요한 쓰기 순서가 발생하는 것이다. 도 1에서, 제1스레드(T1)와 제2스레드(T2)는 서로 다른 파일에 대해 fdatasync()를 호출하였다. 제1파일(A)에 속한 데이터 블록(A1, A2, A3)과 제2파일(B)에 속한 데이터 블록(B1, B2) 사이의 영속성 쓰기 순서는 보장할 필요가 없다. 제1스레드(T1)과 제2 스레드(T2)가 동일한 에포크 카운터를 공유하기 때문에 도 1에서 B1, B2는 에포크 아이디 '0'을 부여받고 A2, A3은 에포크 아이디 '1'을 부여 받는다. 이로 인해 독립된 에포크에 속하는 데이터 블록(B1, B2), 데이터 블록(A2, A3)사이에 불필요한 쓰기 순서 제약이 발생한다.

두 번째 문제점은, 동일한 스레드 내에서 불필요한 쓰기 순서를 보장해야 한다는 것이다. 제1스레드(T1)이 생성하는 데이터 블록(A1, A2, A3)에 대한 쓰기요청들은 상호 간에 쓰기 순서가 변경되어도 된다. 하지만, 제1스레드(T1)와 제2스레드(T2)가 동일한 에포크 카운터를 공유하기 때문에 같은 에포크에 속한 쓰기명령어들이 서로 다른 에포크 값을 가지는 경우가 발생할 수 있다. 이 경우 동일한 에포크에 속한 쓰기명령들 간에 불필요한 쓰기 순서의 보장이 발생한다. 도 1에서 데이터 블록 A1, A2, A3의 쓰기요청은 본래 같은 에포크에 속해야 하지만 제2스레드가 호출한 fdatasync()로 인한 배리어 쓰기(B2)에 의해 에포크 카운터가 증가해 A1은 A2, A3와 다른 에포크 아이디 값을 가진다. 이로 인해 같은 에포크에 속하는 데이터 블록 A1, A2, 및 A3들에 대한 쓰기요청 사이에 불필요한 순서 보장이 발생한다.

상술한 문제들을 해결하기 위해 본 발명에서는, '스트림'을 정의한다. 스트림이란 블록 입출력 계층에서 생성되는 에포크들의 흐름이다. 동일한 스트림에 속하는 에포크들은 에포크가 생성되는 순서대로 쓰기 순서가 보장되어야 한다. 이에 비하여, 서로 다른 스트림에 속하는 에포크들 간에는 쓰기 순서를 보장할 필요가 없다.

동일한 스레드에서 생성된 에포크들은 같은 스트림에 속한다. 스토리지는 같은 스트림에 속한 에포크들에 있어서 에포크들 간의 쓰기 순서를 보장한다.

본 발명에서는, 모든 쓰기명령에 스트림 아이디를 부여한다. 해당 스트림 아이디는 쓰기명령을 스토리지에 전달할 때 함께 전달된다. 쓰기명령의 스트림 아이디는 블록 입출력 계층에서 부여된다.

각 스레드는 자신의 고유 스트림을 갖는다. 따라서, 해당 스레드가 생성하는 스트림 아이디에는 해당 스레드의 pid (프로세스 아이디)를 사용할 수 있다. 본 발명의 일 실시예에서, NVMe 커맨드 구조체의 일부분에 스트림 아이디를 명시할 수 있다. 그리고 각 스트림은 고유의 에포크 카운터를 갖는다.

본 발명의 일 실시예에서 스레드를 나타내는 태스크 구조체(task struct)에 에포크 카운터를 추가한다.

스레드 생성시 에포크 카운터는 0으로 초기화된다. 쓰기명령어가 생성될 때 해당 쓰기명령어의 에포크 아이디는 현재 커널에 존재하는 에포크 카운터 값으로 부여한다. 스레드가 배리어-쓰기가 생성될 때마다 에포크 카운터를 1만큼 증가시킨다. 배리어-쓰기의 에포크 아이디는 에포크 카운터를 1 만큼 증가시키기 전의 값으로 부여한다. 배리어-쓰기는 에포크의 마지막에 위치하는 쓰기요청이며 같은 에포크에 속하는 쓰기요청들과 동일한 에포크 아이디 값을 가진다.

배리어 쓰기 이후에 생성된 order-preserving 쓰기요청은 새로운 에포크에 속한다. 해당 쓰기요청은 이전 에포크의 배리어-쓰기요청 생성 시에 1 증가된 에포크 카운터 값을 에포크 아이디로 부여받는다. 연속된 에포크들은 연속된 에포크 아이디를 가진다.

도 2는 본 발명의 일 관점에 따라 제공되는 스트림 아이디 할당 알고리즘 및 에포크 아이디 할당 알고리즘을 적용했을 때에, 스토리지 디바이스에 도착하는 입출력을 시간에 따라 나타낸 것이다. 입출력 요청의 스트림 아이디와 에포크 아이디를 함께 표시하였다.

데이터 블록(A1, A2, A3)과 데이터 블록(B1, B2)에 대한 쓰기요청은 서로 다른 스트림 아이디를 가지므로, 데이터 블록(B1, B2)과 데이터 블록(A2, A3) 사이 불필요한 영속성 순서 제약이 사라진 것을 확인할 수 있다. 그리고 에포크 아이디 역시 제1스레드(T1) 및 제2스레드(T2)에서 독립적으로 할당이 되는 것을 확인할 수 있다.

<이중 스트림 쓰기>

일반적으로 서로 다른 스트림에 속한 쓰기들 간에는 순서를 보장해 줄 필요가 없다. 그러나 파일시스템의 설계특성으로 인하여, 두 개의 스트림 간에 순서를 보장해 줄 필요가 있을 경우에, 이를 지원하는 기술을 개발하였다. 이를 위하여 우리는 두 개의 스트림에 속한 쓰기들 간에 순서를 보장하는 방법을 개발하였다. 이를 이중 스트림 쓰기라 칭한다. 이중 스트림 쓰기는 두 개의 스트림 아이디와 두 개의 에포크 아이디를 갖는다. 즉, 이중 스트림 쓰기는 제1스트림에 대한 스트림 아이디와 에포크 아이디의 쌍인 {제1스트림 아이디, 제1에포크 아이디}, 그리고 제2스트림에 대한 스트림 아이디와 에포크 아이디 {제2스트림 아이디, 제2에포크 아이디}를 갖는다.

예컨대, 다음과 같은 상황을 가정할 수 있다. 첫째, 두 개의 스트림 S1, S2가 존재한다. 둘째, S1은 w11, w12, w13의 쓰기를 갖는다. 셋째, S2는 w21, w22, w23의 쓰기들로 구성되어 있다. 넷째, 여기서 각 스트림에 속한 쓰기들은 순서가 보장되어야 한다. 즉 S1에 대해서 w11 → w12, w12 → w13의 쓰기 순서가 보장되어야 하고, S2에 대해서도 동일하게 w21 → w22, w22 → w23의 쓰기순서가 보장되어야 한다. 다섯째, 이런 상황에서 w13 → w22의 쓰기 순서보장이 필요한 경우가 있다. 즉, 상기 제1스트림의 쓰기 w13와 상기 제2스트림의 쓰기 w22 간에 쓰기 순서가 보장되어야 한다. 즉, w13 쓰기가 완료된 이후에 w22 쓰기가 완료되어야 한다.

이렇게 서로 다른 두 개의 스트림에 속한 쓰기 명령어 간에 순서를 보장하기 위해 본 발명에서는 '이중 스트림 쓰기'라는 개념을 제안한다.

이중 스트림 쓰기는 '쓰기'의 특수한 형태이다. 일반적인 '쓰기'는 자신의 스트림 아이디와 에포크 아이디를 갖는다. 이중 스트림 쓰기는 동시에 두 개의 스트림에 속한다. 따라서 두 개의 스트림 아이디와 두 개의 에포크 아이디를 갖는다.

이중 스트림 쓰기는 자신이 속한 두 개의 스트림에서 모두 '쓰기' 순서를 보장해야 한다.

이중 스트림 쓰기는 하나의 스레드가, 다른 스레드에서 발생한 쓰기를 대기한 후에 진행해야 하는 경우에 사용된다. EXT4의 저널링이 그 예이다. EXT4 파일 시스템의 순차 저널링 모드에서 fsync 호출 시, 서로 다른 두 개의 스트림에 속한 쓰기 명령어 간에 순서를 보장해야 하는 상황이 발생한다. 이 경우에 이중 스트림 쓰기로 해당 쓰기 순서를 보장할 수 있다. EXT4 파일 시스템은 fsync() 호출 시, 응용 스레드는 파일의 변경된 페이지(더티 페이지)를 디스크의 쓰기 버퍼에 기록하고 저널링 스레드를 깨운다. EXT4는 변경된 메타데이타를 기록하는 스레드, 즉 저널링 스레드를 별도로 할당하고 있다. 저널링 스레드는 변경된 메타데이타 그리고 저널 커밋 블럭들을 디스크의 저널영역에 기록한다. 저널 커밋 블럭은 변경된 파일 페이지(더티 페이지)들과 변경된 메타데이타들이 모두 디스크에 기록된 후에, 디스크에 기록되어야 한다. 변경된 파일 블럭의 쓰기, 변경된 메타데이타의 쓰기가 종료된 후에 커밋 블럭의 쓰기가 종료되어야 한다.

변경된 파일 블럭의 쓰기, 변경된 메타데이타 블럭의 쓰기, 커밋 블럭의 쓰기를 각각 W(D), W(M), W(C) 이라고 가정할 수 있다. 이때, W(D) → W(C), 그리고 W(M) → W(C)의 순서가 보장되어야 한다. 저널링 스레드가 변경된 메타데이타의 쓰기, 커밋 블럭의 쓰기를 담당한다. 따라서, W(M) → W(C)의 순서보장은 두 개의 쓰기가 같은 스레드에서 생성되었기 때문에 동일 스트림에 속하므로, 에포크 아이디와 스트림 아이디를 이용하여 가능하다. 그러나 W(D) → W(C)에 대한 순서보장은 상황이 다르다. EXT4 파일 시스템에서 fsync() 호출 시 W(D)는 응용 스레드가 생성하고 W(C)는 저널링 스레드가 생성한다. 이 두 개의 쓰기는 각각 다른 스레드에 의해서 생성되므로 다른 스트림 아이디를 갖는다. 각 쓰기 요청을 생성하는 스트림이 서로 다르기 때문에 둘 사이의 쓰기 순서를 강제할 수 있는 방안이 없다는 문제점이 있다.

상술한 문제는 본 발명에서 제안하는 이중 스트림 쓰기로 해결할 수 있다.

EXT4 파일 시스템에서 fsync() 호출 시 {W(D), W(M)} → {W(C)}의 순서 제약이 있다. {W(M)} → {W(C)}는 동일한 저널링 스레드 스트림에 속하기 때문에 저널링 스레드의 스트림 아이디와 에포크 아이디로 순서 보장이 가능하다. {W(D)} → {W(C)}의 순서 제약은 W(D)를 이중 스트림 쓰기로 설정하면 순서 보장이 가능하다. 본 발명은 EXT4 파일 시스템에서 fsync() 호출 시, 응용 스레드가 생성하는 더티 페이지 쓰기 요청 (이하 W(D))를 응용 스레드의 스트림에도 속하고 동시에 저널링 스레드 스트림에도 속하는 이중 스트림 쓰기로 설정한다. 이중 스트림 쓰기는 두개의 스트림 아이디 (이하, 제1스트림 아이디, 제2스트림 아이디)와 두 개의 에포크 아이디(이하, 제1에포크 아이디, 제2에포크 아이디)를 갖는다. 본 발명의 일 실시예에서, 파일 시스템은 fsync 호출 시 더티 페이지에 대한 bio를 생성할 때 응용 스레드의 스트림 아이디를 제1스트림 아이디로 부여하고 응용 스레드의 에포크 카운터 값을 제1에포크 아이디로 부여한다. 또한 본 발명의 일 실시예에서, 파일 시스템은 해당 더티 페이지에 현재 동작 중인 저널 스레드의 스트림 아이디를 제2스트림 아이디로 부여하고 저널 스레드의 에포크 카운터 값을 제2에포크 아이디로 부여한다. 파일 시스템은 W(D)의 제1스트림 아이디와 제1에포크 아이디를 통해 W(D)를 생성한 응용 스레드 스트림 내에서 순서 정보를 명시할 수 있다. 동시에 파일 시스템은 W(D)의 제2스트림 아이디와 제2에포크 아이디를 통해 W(D)의 저널링 스레드 스트림 내에서 순서 정보 ({W(D), W(M)} → {W(C)})를 명시할 수 있다.

본 발명의 일 실시예에서, 스토리지로 전달되는 콤맨드 구조체의 일부분에 쓰기의 제1스트림 아이디, 제2스트림 아이디, 제1에포크 아이디, 제2에포크 아이디를 명시할 수 있다.

도 3은 EXT4 순차 저널링 모드에서 응용 스레드(T1)가 파일 A에 대해 fsync()를 호출한 일례를 보여준다. 도 3은 스토리지에 도착하는 쓰기 커맨드에 포함된 제1스트림 아이디 및 제2스트림 아이디와 제1에포크 아이디 및 제2에포크 아이디를 시간 순서대로 보여준다. 응용 스레드(T1)가 fsync()를 호출하면 응용 스레드는 더티 페이지 쓰기(W(D))를 구성하여 디스패치 한다. 파일 시스템은 W(D)의 제1스트림 아이디에 응용 스레드의 프로세스 아이디 '2062'를, 제1에포크 아이디에 응용 스레드의 에포크 카운터 값 '51'을 부여한다. 또한 파일 시스템은 W(D)가 fsync() 호출로 인해 생성된 더티 페이지 쓰기 요청이기 때문에 W(D)의 제2스트림 아이디에 현재 동작 중인 저널 스레드의 프로세스 아이디 '1995'를, 제2에포크 아이디에 저널 스레드의 에포크 카운터 값 '10'을 부여한다. 응용 스레드가 W(D)를 디스패치 한 뒤에 저널링 스레드(JBD)를 깨우면 저널링 스레드는 저널 메타데이터 블록(W(M))을 쓰기로 구성한다. 저널 메타데이터 블록은 추후에 생성될 저널 커밋 블록보다 먼저 디스크에 기록되어야 하기 때문에 베리어-쓰기로 구성된다. 파일 시스템은 W(M)에 저널 스레드의 스트림 아이디 '1995'와 에포크 카운터 값 '10'을 각각 제1스트림 아이디와 제1에포크 아이디로 부여한다. W(M)은 단일 스트림 쓰기이므로 제2스트림 아이디와 제2에포크 아이디는 부여되지 않아 값이 0이다. 저널링 스레드는 저널 커밋 블록(W(C))을 쓰기로 구성하여 디스패치한다. W(M)에 의해 저널링 스레드의 에포크 카운터 값이 '1' 증가하므로, W(C)의 제1에포크 아이디는 W(M)보다 '1' 큰 값 '11'이다. 순서 제약 {W(M)} → {W(C)}는 각 쓰기의 제1스트림 아이디와 제1에포크 아이디로 순서 보장이 가능하다. {W(D), W(M)} → {W(C)} 순서 제약은 W(D)의 제2스트림 아이디, 제2에포크 아이디와 W(M), W(C)의 제1스트림 아이디, 제1에포크 아이디를 통해 순서 보장이 가능하다. W(D)의 제2에포크 아이디는 W(M)의 제1에포크 아이디와 항상 동일한 값으로 부여되므로 W(D)와 W(M) 사이에는 순서 제약이 발생하지 않는다. 반면 W(D)의 제2에포크 아이디와 W(M)의 제1에포크 아이디는 W(C)의 제1에포크 아이디보다 항상 1만큼 작은 값이 부여되므로 {W(D), W(M)} → {W(C)}의 순서가 보장된다.

본 발명의 일 실시예에서, 여러 파일의 변경 사항이 컴파운드 트랜잭션으로 구성되어 있는 상황에서 응용 스레드의 fsync() 호출로 인해 저널 커밋이 발생하는 경우에도 이중 스트림 쓰기로 쓰기 순서를 보장할 수 있다.

도 4는 파일 A 및 파일 B의 메타데이터 변경 사항이 동일한 트랜잭션으로 구성돼 있을 때 제1스레드(T1)와 제2스레드(T2)가 각각 파일 A와 파일 B에 대해 fsync()를 호출한 일례를 보여준다. 도 4는 제1스레드(T1)가 제2스레드(T2) 보다 먼저 파일 A에 대해 fsync()를 호출한 상황을 가정하고 있다. 제1스레드가 생성한 파일 A의 더티 페이지 쓰기 요청(A1)은 이중 스트림 쓰기로 구성되어 디스패치 된다. 제1스레드는 저널 스레드를 깨운다. EXT4 파일 시스템의 순차 저널링 모드에서 저널링 스레드는 저널 트랜잭션에 대한 쓰기를 수행하기 전에, 컴파운드 트랜잭션에 포함된 파일의 더티 페이지를 쓰기 요청으로 구성하여 디스패치 한다. 파일 B의 메타데이터가 트랜잭션에 포함되어 있으므로, JBD 스레드는 파일 B의 더티 페이지(B1)를 쓰기 요청으로 구성된다. 파일 B의 더티 페이지 쓰기 요청 (B1)은 저널 스레드가 생성하기 때문에 이중 스트림 쓰기가 아닌 저널 스레드 스트림에 속하는 단일 쓰기이다. 저널 스레드는 해당 쓰기 요청을 디스패치 한 뒤 저널 트랜잭션을 쓰기 요청으로 구성하여 디스패치 한다. 파일 B에 대해 fsync()를 호출한 제2스레드는 파일 B의 더티 페이지(B1)가 저널 스레드에 의해 이미 쓰기 요청으로 구성되어 디스패치 되었기 때문에 쓰기 요청을 생성하지 않는다. 컴파운드 트랜잭션에 포함된 파일들의 더티 페이지 쓰기 요청들은 모두 저널 스레드의 스트림에 속하는 단일 쓰기이다. 호출 스레드에 의해 생성되는 더티 페이지 쓰기 요청만 저널 스레드와 순서 제약을 가지는 이중 스트림 쓰기로 구성된다.

EXT4 저널링에서 동시에 두 개 이상의 이중 스트림 쓰기 순서 제약이 발생할 수 있다. 두 개의 스레드가 fsync()를 동시에 호출하는 경우를 예로 들겠다. fsync()를 호출하면, 수정된 파일(D), 수정된 메타데이타(M), 저널 커밋 블럭(C)이 순서대로 저장되어야 한다. 제1스레드가 발생시키는 쓰기들을 W(D1), W(M), W(C)라 지칭하겠다. 제2스레드가 fsync호출로 인해 발생시키는 쓰기들을 W(D2), W(M), W(C)라 지칭하겠다. 제1스레드와 제2스레드는 거의 동시에 fsync()를 호출한다고 가정할 수 있다. 이때 다음과 같은 시나리오를 고려할 수 있다. 제1스레드(T1)가 W(D1)를 디스패치한 후에 제2스레드(T2)로 문맥이 전환되었다. 제2스레드(T2)가 W(D2) 명령어를 디스패치 한 후에 JBD 스레드를 깨운다. 깨어난 JBD 스레드는 제2스레드(T2)와 JBD 스레드 두 개의 스트림에 속하게 된다. JBD 스레드는 수정된 메타데이타와 커밋 블럭에 대한 쓰기 명령어를 순서대로 실행한다. 이 경우, {W(D2), W(M)} → W(C)의 순서보장조건이 생성된다. 그러나, 제1스레드가 생성한 W(D1)은 이들과는 독립적인 쓰기가 되어, W(C)가 처리된 이후에, 처리될 수 있다. 순서 보장조건이 성립하지 않게 된다. 이를 해결할 수 있는 가장 원시적인 방법은 '다중' 쓰기의 도입이다. 하나의 쓰기가 세 개 이상의 스트림에 중복해서 속할 수 있도록 하는 것이다. 그러나 이 기법은 실질적 구현하는 것이 쉽지 않다. 스토리지로 전달되는 커멘트 구조체는 영역의 크기가 제한되어 있어, 제한된 영역에 기록할 수 있는 스트림의 개수 역시 제한된다. 예를 들어, NVMe 표준의 커멘드 구조체에는 현재 사용되지 않는 16바이트의 여유공간이 있다. 이 여유공간을 스트림 아이디, 에포크 아이디를 저장하는데 사용할 수 있다.

도 5는 위의 예시이다. 도 5는 제1스레드(T1)와 제2스레드(T2)가 동시에 fsync()를 호출하여 다중쓰기가 발생한 상황을 나타낸다. 제1스레드가 더티 페이지 쓰기 요청(W(D1))을 생성하고 디스패치 한다. 파일 시스템은 W(D1)를 T1(프로세스 아이디 '2062')과 저널링 스레드(프로세스 아이디 '1995')에 모두 속한 이중 스트림 쓰기로 구성한다. 컨텍스트 스위칭이 발생하여 제2스레드가 파일 B에 대한 더티 페이지를 쓰기 요청(W(D2))으로 구성하여 디스패치 한다. 파일 시스템은 W(D2)를 T2(프로세스 아이디 '2063')과 저널링 스레드(프로세스 아이디 '1995')에 모두 속한 이중 스트림 쓰기로 구성한다. 이후, 스레드 T2가 저널링 스레드를 깨워 저널링 스레드가 저널 메타데이터 블록 (W(M))과 저널 커밋 블록 (W(C))을 쓰기로 구성하여 디스패치 한다. 저널링 스레드가 생성하는 W(M)과 W(C)는 모두 저널링 스레드 스트림에만 속한다. fsync() 호출 시 응용 스레드가 발생시키는 모든 파일의 쓰기를 응용 스레드와 저널 스레드에 속한 이중쓰기로 표현하여 {W(D1), W(D2), W(M)} → {W(C)}의 순서 보장이 가능하다.

본 명세서에서 이중 스트림 쓰기 또는 이중 쓰기는 한 개의 쓰기요청에 두 개의 스레드 아이디들이 포함된 경우를 의미하고, 단일 스트림 쓰기 또는 단일 쓰기는 한 개의 쓰기요청에 한 개의 스레드 아이디만이 포함된 경우를 의미할 수 있다.

본 발명의 일 관점에 따라, 저장장치가, 수신한 제1쓰기명령(701)과 제2쓰기명령(702) 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령과 상기 제2쓰기명령을 실행하는 단계;를 포함하는 쓰기 방법이 제공될 수 있다. 이때, 상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제11스트림 식별정보(711)를 포함한다.

이때, 상기 저장장치는, 상기 제2쓰기명령에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 스트림 식별정보(722)가 포함되어 있는 경우에, 상기 실행순서를 상기 제1에포크 아이디와 상기 제2에포크 아이디의 값을 서로 비교한 결과를 이용하지 않는 규칙에 따라 결정하도록 되어 있다.

이때, 상기 저장장치는, 상기 제2쓰기명령에 {제1스트림 아이디, 제3에포크 아이디}를 갖는 스트림 식별정보(713)가 포함되어 있다면, 상기 실행순서를 상기 제1에포크 아이디와 상기 제3에포크 아이디의 값을 서로 비교하는 규칙에 따라 결정하도록 되어 있을 수 있다.

이때, 상기 제1쓰기명령은 {제2스트림 아이디, 제4에포크 아이디}를 갖는 제24스트림 식별정보(724)를 더 포함할 수 있다. 그리고 상기 저장장치는, 상기 제2쓰기명령에 {제1스트림 아이디, 제5에포크 아이디}를 갖는 제15스트림 식별정보(715)가 포함되어 있다면, 상기 제5에포크 아이디가 상기 제1에포크 아이디보다 우선순위가 높으면, 상기 제1쓰기명령을 상기 제2쓰기명령보다 나중에 실행하도록 되어 있을 수 있다.

이때, 상기 제1쓰기명령은 {제2스트림 아이디, 제4에포크 아이디}를 갖는 제24스트림 식별정보(724)를 더 포함할 수 있다. 그리고 상기 저장장치는, 상기 제2쓰기명령에 {제1스트림 아이디, 제5에포크 아이디}를 갖는 제15스트림 식별정보(715)가 포함되어 있다면, 상기 제5에포크 아이디가 상기 제1에포크 아이디보다 우선순위가 낮으면, 상기 제1쓰기명령을 상기 제2쓰기명령보다 먼저 실행하도록 되어 있을 수 있다.

이때, 상기 제2쓰기명령에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제22스트림 식별정보(722)가 포함되어 있다면, 상기 제11스트림 식별정보와 상기 제2스트림 식별정보는, 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트가 생성한 서로 다른 스레드들에 의해 생성된 것일 수 있다.

이때, 상기 제2쓰기명령에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 스트림 식별정보(722)가 포함되어 있다면, 상기 제1에포크 아이디와 상기 제2에포크 아이디는, 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트가 생성한 서로 다른 스레드들이 사용하는 서로 다른 변수들에 의해 각각 생성된 것일 수 있다.

이때, 상기 제2쓰기명령에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제22스트림 식별정보(722)가 포함되어 있다면, 상기 쓰기 방법은, 상기 실행하는 단계 이전에, 상기 호스트가, 상기 제1스트림 아이디를 갖는 제1스레드 및 상기 제2스트림 아이디를 갖는 제2스레드를 생성하는 단계; 상기 제1스레드가, 상기 제1스트림 아이디와 상기 제1에포크 아이디를 갖는 제1쓰기요청을 생성하여 상기 호스트의 블록계층에 전달하는 단계; 상기 제2스레드가, 상기 제2스트림 아이디와 상기 제2에포크 아이디를 갖는 제2쓰기요청을 생성하여 상기 호스트의 블록계층에 전달하는 단계; 및 상기 블록계층이, 상기 제1쓰기요청 및 상기 제2쓰기요청을 기초로 상기 제1쓰기명령 또는 상기 제2쓰기명령을 생성하여 상기 저장장치에 전송하는 단계;를 더 포함할 수 있다. 이때, 상기 제1스레드가 상기 제1에포크 아이디를 생성하기 위해 이용하는 변수(=제1에포크 카운터)와 상기 제2스레드가 상기 제2에포크 아이디를 생성하기 위해 이용하는 변수(=제2에포크 카운터)는 서로 다를 수 있다.

이때, 상기 제1쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있을 수 있다. 그리고 상기 제1쓰기명령 및 상기 제2쓰기명령은 각각 상기 복수 개의 전송채널 중 서로 다른 전송채널을 통해 전송되거나, 또는 동일한 한 개의 전송채널을 통해 전송될 수 있다.

이때, 상기 제1쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있을 수 있다. 그리고 특정 {스트림 아이디, 에포크 아이디}를 갖는 모든 쓰기명령들은 상기 복수 개의 전송채널들 중 어느 하나의 전송채널만을 통해 전송될 수 있다.

이때, 쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있을 수 있다. 이때, 상기 저장장치가, 특정 전송채널을 통해 {제1스트림 아이디, 제7에포크 아이디}를 제6쓰기명령(706)을 수신한 경우, 상기 저장장치는, 상기 제6쓰기명령(706)을 수신한 제1시점으로부터 미리 결정된 타임아웃 시간 이전의 시각인 제2시점 사이에, 다른 전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령(703, 704, or 705)을 수신하지 않은 경우에만 상기 제6쓰기명령을 실행하도록 되어 있을 수 있다. 그리고 상기 제6에포크 아이디는 상기 제7에포크 아이디보다 쓰기 우선순위가 높은 값을 가질 수 있다.

이때, 쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있을 수 있다. 그리고 상기 저장장치는 타이머를 이용하여 타임 카운트를 실행하는 타임아웃 제어부를 포함할 수 있다. 그리고 상기 쓰기 방법은, 상기 저장장치가, 제1전송채널(31)을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령을 수신하면, 타이머의 타임 카운트를 미리 결정된 값으로 리셋하여 타이머를 구동하는 단계; 및 상기 저장장치가, 제2전송채널(32)을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제6쓰기명령(706)을 수신하였을 때에, 상기 타임 카운트가 상기 기준값에 도달한 것이 확인된 경우에만 상기 제6쓰기명령을 실행하는 단계;를 포함할 수 있다.

이때, 상기 저장장치는, 상기 타이머를 구동하는 단계 이후에 제1전송채널(31)을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 다른 쓰기명령을 수신하면, 상기 타이머의 타임 카운트를 상기 미리 결정된 값으로 리셋하여 타이머를 재구동하도록 되어 있을 수 있다.

본 발명의 다른 관점에 따라 저장장치가, 수신된 제1쓰기명령과 제2쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령과 상기 제2쓰기명령을 실행하는 단계를 포함하는 쓰기방법이 제공될 수 있다. 이때, 상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보를 포함하고, 상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하고, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하지 않고 결정하도록 되어 있을 수 있다.

이때, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 동일한 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하여 결정되도록 되어 있을 수 있다.

이때, 상기 제1쓰기명령은 {제2스트림 아이디, 제3에포크 아이디}를 갖는 제3스트림 식별정보를 더 포함하고, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에, 상기 제1쓰기명령과 상기 제2쓰기명령 간의 실행순서는, 상기 제3에포크 아이디와 상기 제2에포크 아이디 간의 우선순위에 종속되는 것을 특징으로 할 수 있다.

이때, 상기 저장장치가 제3쓰기명령을 더 수신하는 경우에, 상기 실행하는 단계는, 상기 제1쓰기명령, 상기 제2쓰기명령, 및 상기 제3쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령, 상기 제2쓰기명령, 및 상기 제3쓰기명령을 실행하도록 되어 있고, 상기 제3쓰기명령은 {제1스트림 아이디, 제4에포크 아이디}를 갖는 제4스트림 식별정보를 포함하고, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에, 상기 제1쓰기명령과 상기 제3쓰기명령 간의 실행순서는, 상기 제4에포크 아이디와 상기 제1에포크 아이디 간의 우선순위에 종속되는 것을 특징으로 할 수 있다.

이때, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에, 상기 제1스트림 식별정보는, 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트에서 실행되는 제1스레드에 의해 생성된 것이고, 상기 제2스트림 식별정보는, 상기 호스트에서 실행되는 제2스레드에 의해 생성된 것일 수 있다.

이때, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에, 상기 제1에포크 아이디는 상기 제1스레드가 참조하는 제1에포크 카운터에 의해 생성된 것이고, 상기 제2에포크 아이디는 상기 제2스레드가 참조하는 제2에포크 카운터에 의해 생성된 것일 수 있다.

이때, 상기 쓰기 방법은, 상기 실행하는 단계 이전에, 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트가, 제1스레드 및 제2스레드를 실행하는 단계; 상기 제1스레드가 상기 제1스트림 아이디와 상기 제1에포크 아이디를 갖는 제1쓰기요청을 생성하여 상기 호스트의 블록계층에 전달하고, 상기 제2스레드가 상기 제2스트림 아이디와 상기 제2에포크 아이디를 갖는 제2쓰기요청을 생성하여 상기 호스트의 블록계층에 전달하는 단계; 및 상기 블록계층이, 상기 제1쓰기요청을 기초로 상기 제1쓰기명령을 생성하여 상기 저장장치에 전송하고, 상기 제2쓰기요청을 기초로 상기 제2쓰기명령을 생성하여 상기 저장장치에 전송하는 단계를 더 포함할 수 있다.

이때, 상기 제1쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고, 특정 {스트림 아이디, 에포크 아이디}를 갖는 모든 쓰기명령들은 상기 복수 개의 전송채널들 중 어느 하나의 전송채널만을 통해 전송되는 것을 특징으로 할 수 있다.

이때, 쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고, 상기 저장장치는, 타이머를 이용하여 타임아웃 제어부를 포함하며, 상기 저장장치가, 제1전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 제3쓰기명령을 수신하면, 상기 타이머의 타임카운트를 미리 결정된 값으로 리셋하여 상기 타이머를 구동하는 단계; 상기 저장장치가, 제2전송채널을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제4쓰기명령을 수신하였을 때에, 상기 타임카운트가 소정의 기준값에 도달한 것이 확인된 경우에만 상기 제4쓰기명령을 실행하는 단계를 포함할 수 있다.

이때, 상기 저장장치는, 상기 타이머를 구동하는 단계 이후에 제1전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 다른 쓰기명령을 수신하면, 상기 타이머의 타임 카운트를 상기 미리 결정된 값으로 리셋하여 타이머를 재구동하도록 되어 있을 수 있다.

이때, 쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고, 상기 저장장치가, 제1전송채널을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제4쓰기명령을 수신한 경우, 상기 저장장치는, 상기 제4쓰기명령을 수신한 제1시점으로부터 미리 결정된 타임아웃 시간 이전의 시각인 제2시점 사이에, 제2전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 제3쓰기명령을 수신하지 않은 경우에만 상기 제3쓰기명령을 실행하도록 되어 있고, 상기 제6에포크 아이디는 상기 제7에포크 아이디보다 쓰기 우선순위가 높은 값을 가질 수 있다.

이때, 상기 {제1스트림 아이디, 제1에포크 아이디}를 갖는 한 세트의 쓰기명령들 중에서 가장 마지막에 발생한 쓰기명령은 배리어-명령인 것을 특징으로 할 수 있다.

본 발명의 다른 관점에 따라 콘트롤러; 및 메모리를 포함하는 저장장치가 제공될 수 있다. 이때, 상기 콘트롤러는, 상기 저장장치가 수신한 제1쓰기명령과 제2쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령과 상기 제2쓰기명령을 실행하도록 되어 있고, 상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보를 포함하고, 상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하고, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하지 않고 결정하도록 되어 있을 수 있다.

이때, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에, 상기 제1에포크 아이디는 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트에서 실행되는 제1스레드가 참조하는 제1에포크 카운터에 의해 생성된 것이고, 상기 제2에포크 아이디는 상기 호스트에서 실행되는 제2스레드가 참조하는 제2에포크 카운터에 의해 생성된 것일 수 있다.

이때, 쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고, 상기 저장장치는, 타이머를 이용하여 타임아웃 제어부를 포함하며, 상기 저장장치가, 제1전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 제3쓰기명령을 수신하면, 상기 타이머의 타임카운트를 미리 결정된 값으로 리셋하여 상기 타이머를 구동하는 단계를 실행하도록 되어 있고, 그리고 상기 저장장치가, 제2전송채널을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제4쓰기명령을 수신하였을 때에, 상기 타임카운트가 소정의 기준값에 도달한 것이 확인된 경우에만 상기 제4쓰기명령을 실행하는 단계를 실행하도록 되어 있을 수 있다.

본 발명의 또 다른 관점에 따라 콘트롤러; 및 메모리를 포함하는 저장장치가 제공될 수 있다. 이때, 상기 콘트롤러는, 수신된 제1쓰기명령, 제2쓰기명령, 및 제3쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령, 상기 제2쓰기명령, 및 상기 제3쓰기명령을 실행하는 단계를 실행하도록 되어 있으며, 상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보 및 {제2스트림 아이디, 제3에포크 아이디}를 갖는 제3스트림 식별정보를 포함하고, 상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하고, 상기 제3쓰기명령은 {제1스트림 아이디, 제4에포크 아이디}를 갖는 제4스트림 식별정보를 포함하며, 상기 제3쓰기명령과 상기 제2쓰기명령간의 실행순서는, 상기 제3에포크 아이디와 상기 제2에포크 아이디 간의 우선순위, 그리고 상기 제1에포크 아이디와 상기 제4에포크 아이디 간의 우선순위에 의해 결정될 수 있다.

이때, 상기 제1에포크 아이디와 상기 제3에포크 아이디의 우선순위는 서로 동일할 수 있다.

본 발명에 따르면 다중 명령어 큐 스토리지에서 순서 보장 단위를 정하는 기술을 제공할 수 있다.

도 1은 스레드 2개가 서로 다른 파일에 대해 fdatasync()를 동시에 호출한 경우 시간에 따라 NVMe 디바이스에 도착하는 입출력 요청과 각 입출력 요청의 에포크 아이디를 표시한 것이다.

도 2는 본 발명의 일 관점에 따라 제공되는 스트림 아이디 할당 알고리즘 및 에포크 아이디 할당 알고리즘을 적용했을 때에, 스토리지 디바이스에 도착하는 입출력을 시간에 따라 나타낸 것이다.

도 3은 본 발명의 일 관점에 따라 제공되는 이중 스트림 쓰기의 스트림 아이디와 에포크 아이디 할당 알고리즘을 적용했을 때, 응용 쓰레드가 fsync()를 호출한 경우 스토리지 디바이스에 도착하는 입출력을 시간에 따라 나타낸 것이다.

도 4는 본 발명이 제공하는 이중 스트림 쓰기명령을 적용했을 때, 여러 파일의 수정 사항이 컴파운드 트랜잭션에 포함된 경우, 스토리지 디바이스에 도착하는 입출력을 시간에 따라 나타낸 것이다.

도 5는 본 발명의 일 관점에 따라 제공되는 이중 스트림 쓰기의 스트림 아이디와 에포크 아이디 할당 알고리즘을 적용했을 때, 여러 응용 쓰레드가 동시에 fsync()를 호출한 경우 스토리지 디바이스로 도착하는 입출력 명령을 시간에 따라 나타낸 것이다.

도 6은 본 발명의 일 실시예에 따라 제공되는 저장장치에서 호스트로부터 수신한 쓰기명령을 수행하는 방법을 나타낸 다이어그램이다.

도 7 및 도 8은 제2쓰기명령에 {제1스트림 아이디, 제3에포크 아이디}를 갖는 스트림 식별정보가 포함되어 있는 예를 나타낸 것이다.

도 9는 본 발명의 일 실시예에 따라 전송채널을 통해 전달되는 쓰기명령이 2개의 스트림 식별정보들을 포함하는 경우의 쓰기 방법을 설명하기 위한 것이다.

도 10은 본 발명의 다른 실시예에 따라 전송채널을 통해 전달되는 쓰기명령이 2개의 스트림 식별정보들을 포함하는 경우의 쓰기 방법을 설명하기 위한 것이다.

도 11은 본 발명의 또 다른 실시예에 따라 전송채널을 통해 전달되는 쓰기명령이 2개의 스트림 식별정보들을 포함하는 경우의 쓰기 방법을 설명하기 위한 것이다.

도 12는 본 발명의 또 다른 실시예에 따라 전송채널을 통해 전달되는 쓰기명령이 2개의 스트림 식별정보들을 포함하는 경우의 쓰기 방법을 설명하기 위한 것이다.

도 13은 발명의 일 실시예에 따라, 한 개의 전송채널을 통해 서로 다른 스트림에 속한 쓰기명령들이 전달되는 예를 나타낸 것이다.

도 14는 본 발명의 일 실시예에 따라 한 개의 스트림 내에서 동일한 에포크 아이디를 갖는 복수 개의 쓰기명령들을 전송하는 방법을 나타낸 것이다.

도 15는 도 14에 제시한 방법과 비교되는 비교 실시예를 나타낸 것이다.

도 16은 본 발명의 일 실시예에 따라, 하나의 스트림에 속한 쓰기명령들을 실행하는 순서를 결정하는 방법을 설명하기 위한 것이다.

도 17은 도 16에서 설명하는 본 발명의 일 실시예에서 발생할 수 있는 하나의 상황을 나타낸 것이다.

도 18은 도 16에서 설명하는 본 발명의 일 실시예에서 발생할 수 있는 다른 하나의 상황을 나타낸 것이다.

도 19는 본 발명의 일 실시예에 따라 제공되는 호스트와 저장장치를 포함하는 컴퓨팅 장치의 구성을 나타낸 블록도이다.

도 20 및 도 21은 본 발명의 일 실시예에 의해 제공되는 호스트가 쓰기명령을 생성하는 과정을 나타낸 것이다.

이하, 본 발명의 실시예를 첨부한 도면을 참고하여 설명한다. 그러나 본 발명은 본 명세서에서 설명하는 실시예에 한정되지 않으며 여러 가지 다른 형태로 구현될 수 있다. 본 명세서에서 사용되는 용어는 실시예의 이해를 돕기 위한 것이며, 본 발명의 범위를 한정하고자 의도된 것이 아니다. 또한, 이하에서 사용되는 단수 형태들은 문구들이 이와 명백히 반대의 의미를 나타내지 않는 한 복수 형태들도 포함한다.

저장장치(20)는 예컨대 레이드 저장장치일 수 있다. 상기 저장장치(20)는 레이드 콘트롤러 및 복수 개의 디스크들을 포함할 수 있다.

상기 레이드 콘트롤러는 간단히 콘트롤러라고 지칭될 수 있다. 그리고 상기 복수 개의 디스크들은 비휘발성 메모리로 지칭될 수 있다. 그리고 상기 저장장치(20)는 휘발성 메모리를 더 포함할 수 있다. 상기 휘발성 메모리와 상기 비휘발성 메모리를 통칭하여 메모리라고 지칭할 수 있다.

호스트(10)는 상기 저장장치(20)에 쓰기명령을 포함하는 각종 명령 및 데이터를 전송하는 장치일 수 있다.

상기 호스트(10)와 상기 저장장치(20)는 제1전송채널(31) 및 제2전송채널(32)을 포함하는 복수 개의 전송채널들에 의해 연결되어 있을 수 있다.

일 실시예에서, 상기 호스트(10)와 상기 저장장치(20)는 한 개의 컴퓨팅 장치 내에 포함되어 있는 기능 모듈들일 수 있다. 다른 실시예에서, 상기 호스트(10)와 상기 저장장치(20)는 각각 독립적인 전원을 갖는 별개의 컴퓨팅 장치로 제공될 수 있다.

상기 저장장치(10)는, 상기 호스트(10)로부터 수신한 제1쓰기명령(701)과 제2쓰기명령(702) 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702)을 실행하는 단계를 실행하도록 되어 있을 수 있다.

상기 호스트(10)는 서로 다른 스레드를 생성하여 관리할 수 있다. 각 스레드는 한 개의 스트림을 생성할 수 있다. '스트림'은, 이에 대응하는 스레드에 의해 생성된 명령어들의 시간의 흐름에 따른 집합을 의미하는 것일 수 있다. 서로 다른 스트림은 상기 호스트(10)에서 관리하는 서로 다른 스레드에 의해 생성된 것일 수 있다. 서로 다른 스트림은 스트림 아이디라고 하는 파라미터에 의해 구분될 수 있다.

본 발명의 일 실시예에서, 쓰기명령은 단일 스트림 쓰기명령이거나 또는 이중 스트림 쓰기명령일 수 있다. 상기 쓰기명령에는 2개의 스트림 식별정보가 저장될 두 개의 공간이 제공되어 있을 수 있다. 상기 단일 스트림 쓰기명령의 경우, 상기 두 개의 공간 중 제1공간에는 특정 스트림에 관한 스트림 식별정보가 포함되어 있고, 상기 두 개의 공간 중 제2공간에는 무효인 정보 또는 널 정보가 포함되어 있을 수 있다. 상기 이중 스트림 쓰기명령의 경우, 상기 두 개의 공간 중 제1공간에는 특정 스트림에 관한 스트림 식별정보가 포함되어 있고, 상기 두 개의 공간 중 제2공간에는 상기 특정 스트림과는 다른 스트림에 관한 스트림 식별정보가 포함되어 있을 수 있다.

상기 제1쓰기명령(701)은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제11스트림 식별정보(711)를 포함할 수 있다. 본 명세서에서 '{ }' 안에 포함된 스트림 아이디 및 에포크 아이디는 서로 결합되어 있는 쌍 정보이다.

본 명세서 및 도면에서 '제k에포크 아이디'는 'E-ID[#k]'로 표기될 수 있다.

한 개의 스트림 식별정보는 저장장치(20)가 수신한 한 개의 명령의 실행순서를 결정하는 데에 이용되는 정보일 수 있다.

한 개의 쓰기명령에는 상술한 스트림 식별정보가 1개 또는 2개 이상 포함되어 있을 수 있다. 상기 쓰기명령은 상기 호스트(10)로부터 상기 저장장치(20)에게 상기 전송채널을 통해 전달되는 명령을 의미할 수 있다.

한 개의 쓰기명령은 한 개의 스트림에만 연관되어 있거나, 또는 2개의 스트림들에 연관되어 있을 수 있다. 한 개의 스트림에만 연관되어 있는 쓰기명령은 단일 스트림 쓰기명령이고, 두 개의 스트림들에 연관되어 있는 쓰기명령은 이중 스트림 쓰기명령이다.

예컨대, 한 개의 쓰기명령에는 제1스트림 아이디를 갖는 스트림 식별정보가 1개 포함되어 있을 수 있다. 이러한 쓰기명령을 단일 스트림 쓰기명령 또는 단일 스트림 쓰기라고 지칭할 수도 있다.

또는, 한 개의 쓰기명령에는 제1스트림 아이디를 갖는 스트림 식별정보와 제2스트림 아이디를 갖는 스트림 식별정보가 각각 1개씩 포함되어 있을 수 있다. 이러한 쓰기명령을 이중 스트림 쓰기명령 또는 이중 스트림 쓰기라고 지칭할 수도 있다.

한 개의 스트림에 속한 각각의 스트림 식별정보는 한 개의 에포크 아이디를 포함할 수 있다.

상기 저장장치(20)가 동일한 스트림 아이디와 동일한 에포크 아이디를 갖는 스트림 식별정보를 포함하는 서로 다른 쓰기명령들을 실행할 때에, 그 실행순서는 상기 저장장치(20)가 임의의 결정할 수 있다.

한 개의 스트림 내에서, 서로 다른 에포크 아이디들 간에는 우선순위가 존재할 수 있다. 상기 저장장치(20)가 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1쓰기명령과, {제1스트림 아이디, 제2에포크 아이디}를 갖는 제2쓰기명령을 실행할 때에, 상기 저장장치(20)는 상기 제1에포크 아이디와 상기 제2에포크 아이디 간의 우선순위를 기초로 상기 제1쓰기명령과 상기 제2쓰기명령 간의 실행순서를 결정할 수 있다.

본 발명의 일 실시예에서, 서로 다른 스트림에 속한 에포크 아이디들 간에는 우선순위가 존재하지 않을 수 있다. 상기 저장장치(20)가 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1쓰기명령과, {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2쓰기명령을 실행할 때에, 상기 저장장치(20)는 상기 제1쓰기명령과 상기 제2쓰기명령 간의 실행순서를 임의로 결정할 수 있다.

본 발명의 일 실시예에서, 상기 저장장치는, 제1스트림에만 연관된 제1단일 스트림 쓰기명령과 상기 제1스트림에만 연관된 제2단일 스트림 쓰기명령 간의 실행순서를 상기 제1단일 스트림 쓰기명령에 포함된 에포크 아이디와 상기 제2단일 스트림 쓰기명령에 포함된 에포크 아이디를 비교한 결과를 기초로 결정할 수 있다.

그리고 본 발명의 일 실시예에서, 상기 저장장치는, 제1스트림에만 연관된 제1단일 스트림 쓰기명령과 제2스트림에만 연관된 제2단일 스트림 쓰기명령 간의 실행순서를 임의로 결정할 수 있다. 즉, 상기 제1단일 스트림 쓰기명령과 상기 제2단일 스트림 쓰기명령 간의 실행순서에는 제약이 없다.

그리고 본 발명의 일 실시예에서, 상기 저장장치는, 제1스트림에만 연관된 제1단일 스트림 쓰기명령과 상기 제1스트림 및 제2스트림에 모두 연관된 제2이중 스트림 쓰기명령 간의 실행순서를, 상기 제1단일 스트림 쓰기명령에 포함된 상기 제1스트림에 연관된 에포크 아이디와 상기 제2이중 스트림 쓰기명령에 포함된 상기 제1스트림에 연관된 에포크 아이디를 서로 비교한 결과를 기초로 결정할 수 있다. 이때, 상기 저장장치는, 제2스트림에만 연관된 제3단일 스트림 쓰기명령과 상기 제1스트림 및 제2스트림에 모두 연관된 상기 제2이중 스트림 쓰기명령 간의 실행순서를, 상기 제3단일 스트림 쓰기명령에 포함된 상기 제2스트림에 연관된 에포크 아이디와 상기 제2이중 스트림 쓰기명령에 포함된 상기 제2스트림에 연관된 에포크 아이디를 서로 비교한 결과를 기초로 결정할 수 있다. 이렇게 함으로써, 결국 제1스트림에 연관된 쓰기명령과 제2스트림에 연관된 쓰기명령 사이에도 그 실행순서의 우선순위가 발생할 수 있다.

도 6은 제1쓰기명령(701)에 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제11스트림 식별정보(711)가 포함되어 있고, 제2쓰기명령(702)에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제22스트림 식별정보(722)가 포함되어 있는 예를 나타낸 것이다.

만일, 상기 제2쓰기명령(702)에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제22스트림 식별정보(722)가 포함되어 있다면, 상기 저장장치(20)는, 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702) 간의 실행 우선순위를 상기 제1에포크 아이디와 상기 제2에포크 아이디의 값을 서로 비교한 결과를 이용하지 않는 규칙에 따라 결정하도록 되어 있을 수 있다. 여기서 상기 제2스트림 아이디는 상기 제1스트림 아이디와는 다른 값이다. 도 6은 상기 제1스트림 아이디(S-ID)는 1이고, 상기 제2스트림 아이디(S-ID)는 2인 예를 나타낸 것이다.

예컨대, 제2쓰기명령(702)에 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제22스트림 식별정보(722)가 포함되어 있고, 상기 제1에포크 아이디(E-ID[#1])가 '3'의 값을 갖고 상기 제2에포크 아이디(E-ID[#2])가 상기 '3'과 다른 값을 갖는다고 하더라도, 상상기 제1쓰기명령(701)과 상기 제2쓰기명령(702) 간의 실행 순서는 상기 제1에포크 아이디(E-ID[#1])의 값과 상기 제2에포크 아이디(E-ID[#2])의 값에 의해 결정되지는 않는다.

이와 달리, 즉, 도 6에 예시한 것과 달리, 상기 제2쓰기명령(702)에 {제1스트림 아이디, 제3에포크 아이디}를 갖는 스트림 식별정보(713)가 포함되어 있다면, 상기 저장장치(20)는, 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702) 간의 실행 우선순위를 상기 제1에포크 아이디와 상기 제3에포크 아이디의 값을 서로 비교하는 규칙에 따라 결정하도록 되어 있을 수 있다. 즉, 상기 제11스트림 식별정보(711)와 상기 제22스트림 식별정보(722) 모두가 동일한 스트림을 나타내는 것이므로, 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702) 간의 실행 우선순위가 에포크 아이디에 의해 결정될 수 있다. 이를 도 7 및 도 8을 참조하여 설명한다.

도 7 및 도 8은 각각, 제2쓰기명령(702)에 {제1스트림 아이디, 제3에포크 아이디}를 갖는 스트림 식별정보(713)가 포함되어 있는 예를 나타낸 것이다.

예컨대, 제2쓰기명령(702)에 {제1스트림 아이디, 제3에포크 아이디}를 갖는 제13스트림 식별정보(713)가 포함되어 있고, 상기 제1에포크 아이디(E-ID[#1])가 '3'의 값을 갖고 상기 제3에포크 아이디(E-ID[#3])가 상기 '3'과 같다면 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702) 간의 실행 우선순위는 상기 저장장치(20)가 자유롭게 결정할 수 있다.

이와 달리, 제2쓰기명령(702)에 {제1스트림 아이디, 제3에포크 아이디}를 갖는 제13스트림 식별정보(713)가 포함되어 있고, 상기 제1에포크 아이디(E-ID[#1])가 '3'의 값을 갖고 상기 제3에포크 아이디(E-ID[#3])가 '5'의 값을 갖는다면, 상기 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702) 간의 실행 우선순위는 상기 제1에포크 아이디와 상기 제3에포크 아이디의 값 간의 우선순위에 따라 결정될 수 있다.

도 6 및 도 7은 제1쓰기명령(701)과 제2쓰기명령(702)이 서로 다른 전송채널들을 통해 전송되는 예를 나타낸 것이다.

도 8은 제1쓰기명령(701)과 제2쓰기명령(702)이 동일한 전송채널을 통해 전송되는 예를 나타낸 것이다.

도 9는 본 발명의 일 실시예에 따라 전송채널을 통해 전달되는 한 개의 쓰기명령이 2개의 스트림 식별정보들을 포함하는 경우의 쓰기 방법을 설명하기 위한 것이다.

상기 저장장치(10)는, 상기 호스트(10)로부터 수신한 제1쓰기명령(701)과 제2쓰기명령(702) 간의 실행 우선순위를 결정하여, 상기 결정된 실행 우선순위에 따라 상기 제1쓰기명령(701)과 상기 제2쓰기명령(702)을 실행하도록 되어 있다.

상기 제1쓰기명령(701)은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제11스트림 식별정보(711)를 포함할 수 있다.

또한, 상기 제1쓰기명령(701)은 {제2스트림 아이디, 제4에포크 아이디}를 갖는 제24스트림 식별정보(724)를 더 포함할 수 있다.

이때, 상기 {제1스트림 아이디, 제1에포크 아이디} 및 상기 {제2스트림 아이디, 제4에포크 아이디}는 NVMe 콤멘드 구조체의 일부분에 기록될 수 있다. 즉, 본 발명의 일 실시예에서 한 개의 쓰기명령에 포함되는 두 개의 스트림 식별정보들은 NVMe 콤멘드 구조체의 일부분에 기록될 수 있다.

상기 제1쓰기명령(701)과 같이, 서로 다른 두 개의 스트림에 속한 두 개의 스트림 식별정보들을 포함하는 쓰기명령을 이중 스트림 쓰기명령이라고 지칭할 수 있다. 상기 저장장치(20)는, 상기 제2쓰기명령(702)에 {제1스트림 아이디, 제5에포크 아이디}를 갖는 제15스트림 식별정보(715)가 포함되어 있다면, 상기 제5에포크 아이디(E-ID[#5])가 상기 제1에포크 아이디(E-ID[#1])보다 우선순위가 높으면, 상기 제1쓰기명령(701)을 상기 제2쓰기명령(702)보다 나중에 실행하도록 되어 있을 수 있다.

예컨대, 상기 제5에포크 아이디 E-ID[#5]가 '1'라는 값을 갖고, 상기 제1에포크 아이디 E-ID[#1]이 '2'이라는 값을 갖는 경우를 가정할 수 있다. 그리고 이때 '1'이 '2'보다 더 높은 우선순위를 갖는다고 가정할 수 있다. 이 경우, 상기 제1쓰기명령(701)을 상기 제2쓰기명령(702)보다 나중에 실행하도록 되어 있을 수 있다.

도 10은 제1쓰기명령(701)과 제2쓰기명령(702)이 동일한 제1전송채널(31)을 통해 전송되는 예를 나타낸 것이다. 이와 비교하여, 도 9는 제1쓰기명령(701)과 제2쓰기명령(702)이 서로 다른 전송채널들(31, 32)을 통해 전송되는 예를 나타낸 것이다. 이 점을 제외하고, 도 10에 나타낸 실시예는 도 9에 나타낸 실시예와 동일하다.

도 11에 제시한 실시예는 도 9에 제시한 실시예와 일부 차이점만을 제외하고는 동일하다. 이하 상기 일부 차이점만을 설명한다.

상기 저장장치(20)는, 상기 제2쓰기명령(702)에 {제1스트림 아이디, 제5에포크 아이디}를 갖는 제15스트림 식별정보(715)가 포함되어 있는 것을 확인할 수 있다. 이때, 상기 제5에포크 아이디가 상기 제1에포크 아이디보다 우선순위가 낮으면, 상기 저장장치(20)는 상기 제1쓰기명령(701)을 상기 제2쓰기명령(702)보다 먼저 실행하도록 되어 있을 수 있다.

도 12는 제1쓰기명령(701)과 제2쓰기명령(702)이 동일한 제1전송채널(31)을 통해 전송되는 예를 나타낸 것이다. 이와 비교하여, 도 11은 제1쓰기명령(701)과 제2쓰기명령(702)이 서로 다른 전송채널들(31, 32)을 통해 전송되는 예를 나타낸 것이다. 이 점을 제외하고, 도 12에 나타낸 실시예는 도 11에 나타낸 실시예와 동일하다.

도 13은 제1쓰기명령(701)과 제2쓰기명령(702)이 동일한 제1전송채널(31)을 통해 전송되는 예를 나타낸 것이다. 이와 비교하여, 도 6은 제1쓰기명령(701)과 제2쓰기명령(702)이 서로 다른 전송채널들(31, 32)을 통해 전송되는 예를 나타낸 것이다. 이 점을 제외하고, 도 13에 나타낸 실시예는 도 6에 나타낸 실시예와 동일하다.

도 14는 본 발명의 일 실시예에 따라 동일 스트림 아이디 및 동일 에포크 아이디를 갖는 복수 개의 단일 스트림 쓰기명령들을 전송하는 방법을 나타낸 것이다.

도 14에 나타낸 실시예는 쓰기명령들을 상기 저장장치(20)에게 전송하는 호스트(10)와 상기 저장장치(20)가 서로 복수 개의 전송채널들(31, 32)로 연결되어 있는 경우에 이용될 수 있다.

상기 저장장치(20)는 상기 전송채널들의 개수에 대응하는 복수 개의 큐(queue)들을 제공할 수 있다. 특정 전송채널을 통해 수신된 명령(쓰기명령)들은 이에 대응하는 특정 큐에 저장되었다가 상기 저장장치(20)에 의해 처리될 수 있다.

상기 저장장치(20)은 제1전송채널(31)을 통해 수신한 명령들로 이루어지는 제1큐를 생성하고, 제2전송채널(32)을 통해 수신한 명령들로 이루어지는 제2큐를 생성할 수 있다.

본 발명의 일 실시예에서, 특정 {스트림 아이디, 에포크 아이디}를 갖는 모든 쓰기명령들은 상기 복수 개의 전송채널들 중 어느 하나의 전송채널만을 통해서만 전송될 수 있다. 이와 같은 개념은, 본 발명에서는 큐-피닝(queue-pinning)이라고 지칭할 수 있다.

예컨대, 도 14에서 {스트림 아이디(S-ID=1), 에포크 아이디(E-ID[#6])}라는 스트림 식별정보를 갖는 모든 쓰기명령들(703~705)은 한 개의 특정 전송채널(32)을 통해서만 전달될 수 있다.

도 15에 나타낸 비교 실시예에서, 특정 {스트림 아이디, 에포크 아이디}를 갖는 쓰기명령들이 상기 복수 개의 전송채널들 중 2개 이상의 전송채널 상에 분산되어 전송된다.

예컨대, 도 15에서 스트림 아이디 S-ID가 1인 쓰기명령들 중 에포크 아이디 E-ID[#6]를 갖는 쓰기명령들(703~705) 중 일부 쓰기명령(704)은 제1전송채널(31)을 통해 전송되고, 다른 쓰기명령들(703, 705)은 제2전송채널(32)을 통해서 전달된다. 이때, 에포크 아이디 E-ID[#6]을 갖는 제4쓰기명령(704)이, 에포크 아이디 E-ID[#7]을 갖는 제6쓰기명령(706)보다 상기 저장장치(20)에 늦게 도달한 상태이다. 여기서, 에포크 아이디 E-ID[#6]가 에포크 아이디 E-ID[#7]보다 더 높은 우선순위를 갖는다고 가정할 수 있다.

만일 도 15와 같은 비교 실시예를 이용한다면, 상기 저장장치(20)는 상기 제2전송채널(32)을 통해 수신한 명령들로 이루어지는 제2큐에서 에포크 아이디 E-ID[#6]를 갖는 제5쓰기명령(705)에 뒤이어 에포크 아이디 E-ID[#7]을 갖는 제6쓰기명령(706)이 존재하는 것을 확인할 수 있다. 그리고 상기 저장장치(20)는 상기 제5쓰기명령(705)이 상기 에포크 아이디 E-ID[#6]를 갖는 쓰기명령들 중 마지막 명령이라고 판단할 수 있다. 그리고 상기 저장장치(20)는 에포크 아이디 E-ID[#7]을 갖는 제6쓰기명령(706)을, 상기 제6쓰기명령(706)보다 상기 저장장치(20)에 더 늦게 도달한 제4쓰기명령(704)보다 먼저 실행할 수 있다. 따라서 오류가 발생한다. 제4쓰기명령(704)의 에포크 아이디 E-ID[#6]가 제6쓰기명령(706)의 에포크 아이디 E-ID[#7]보다 우선순위가 높기 때문이다.

이와 비교하여, 도 14에 제시한 본 발명의 일 실시예에 따른 큐-피닝을 이용하면, 상기 저장장치(20)는 에포크 아이디 E-ID[#7]을 갖는 첫 번째 쓰기명령인 제6쓰기명령(706)을 확인하면, 에포크 아이디 E-ID[#6]을 갖는 마지막 명령이 이미 전달되었다고 확정할 수 있다. 이는, 에포크 아이디 E-ID[#6]을 갖는 쓰기명령들이 이미 제2전송채널(32)을 통해 전송되고 있었기 때문에, 에포크 아이디 E-ID[#6]을 갖는 다른 쓰기명령이 다른 전송채널(31)을 전송되지 않을 것이라는 것을 상기 저장장치(20)가 알 수 있기 때문이다. 따라서 상기 저장장치(20)가 상기 제6쓰기명령(706)을 확인한 순간 상기 제6쓰기명령(706)을 실행하더라도 도 15와 같은 오류가 발생하지 않는다는 효과가 있다.

일 실시예에서, 도 14 및 도 15와 관련된 위의 설명에서 제시한 '쓰기명령'은 상술한 '단일 스트림 쓰기명령'을 의미하는 것일 수 있다.

한편, 본 발명의 일 실시예에서, 특정 {스트림 아이디, 에포크 아이디}를 갖는 한 세트의 쓰기명령들이 특정 채널을 통해 호스트로부터 저장장치에게 전송될 때에, 상기 한 세트의 쓰기명령들 중 마지막에 발생한 쓰기명령은 상기 에포크 아이디를 갖는 베리어-명령일 수 있다. 즉, 저장장치(20)는, 특정 스트림 아이디와 특정 에포크 아이디를 갖는 베리어-명령을 수신하면, 특정 스트림 아이디와 특정 에포크 아이디를 갖는 한 세트의 쓰기명령들의 전송이 종료되었다고 판단할 수 있다.

도 16에 제시한 실시예는, 쓰기명령을 상기 저장장치(20)에게 전송하는 호스트(10)와 상기 저장장치(20)가 복수 개의 전송채널로 연결된 경우에 유용하게 사용될 수 있다.

도 16에 제시한 실시예에 따르면, 상기 저장장치(20)가, 특정 전송채널(ex: 32)을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 첫 번째(최초의) 쓰기명령(706)을 최초로 수신한 경우에, 상기 첫 번째 쓰기명령(706)을 곧 바로 실행할지 아니면 소정 시간 기다린 이후에 실행할지를 결정할 수 있다.

이때, {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령을 다른 전송채널(ex: 31)을 통해 이미 수신하고 있는 상황을 전제로 한다. 이때, 상기 제6에포크 아이디는 상기 제7에포크 아이디보다 쓰기 우선순위가 1만큼 높은 값을 갖는다.

도 16의 예에서, {제1스트림 아이디, 제7에포크 아이디}를 갖는 첫 번째 쓰기명령은 제6쓰기명령(706)으로 제시되어 있다.

본 발명의 바람직한 일 실시예에서, 상기 저장장치(20)는, 상기 제6쓰기명령(706)을 수신한 제1시점으로부터 미리 결정된 타임아웃 시간 이전의 시각인 제2시점 사이에, 다른 전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령(703, 704, or 705)을 수신하지 않은 경우에만 상기 제6쓰기명령을 실행하도록 되어 있을 수 있다.

도 17 및 도 18에서 가로축은 시간을 나타내며, 오른쪽으로 갈수록 먼저 발생한 시간을 나타낸다.

도 17에 나타낸 예에서, 상기 저장장치(20)는, 상기 제6쓰기명령(706)을 수신한 제1시점(T1)으로부터 미리 결정된 타임아웃 시간(DT) 이전의 시각인 제2시점(T2) 사이에, 다른 전송채널(31)을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령(704)을 수신하였다. 따라서, 상기 저장장치(20)는 상기 제6쓰기명령(706)을 확인하더라도 곧 바로 상기 제6쓰기명령(706)을 실행하지 않고 기다린다.

상기 저장장치(20)는, {제1스트림 아이디, 제6에포크 아이디}를 갖는 제4쓰기명령(704)이, 상기 제6에포크 아이디를 갖는 마지막 쓰기명령이라는 사실을 알 수 없다면, 상기 제4쓰기명령(704)을 수신한 제3시점(T3)에 타이머를 리셋하고 타이머를 구동한다. 그리고 상기 타이머의 타임아웃은 상기 미리 결정된 타임아웃 시간(DT)이 경과한 제4시점(T4)에 이루어진다. 상기 제1시점(T1)에서는 아직 타임아웃이 이루어지지 않았으므로, 상기 제1시점(T1)에서는 상기 제6쓰기명령(706)을 실행하지 않는다. 그리고 상기 제4시점(T4)에 타임아웃이 이루어지면 비로소 상기 제6쓰기명령(706)을 실행할 수 있다.

도 18에 나타낸 예에서, 상기 저장장치(20)는, 상기 제6쓰기명령(706)을 수신한 제1시점(T1)으로부터 미리 결정된 타임아웃 시간(DT) 이전의 시각인 제2시점(T2) 사이에, {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령을 아무것도 수신하지 않았다. 따라서, 상기 저장장치(20)는 상기 제6쓰기명령(706)을 확인한 제1시점(T1)에, 타임아웃이 이루어진 것을 확인하고 곧 바로 상기 제6쓰기명령(706)을 실행할 수 있다.

도 18의 예에서, 상기 저장장치(20)는, {제1스트림 아이디, 제6에포크 아이디}를 갖는 제5쓰기명령(705)을, 상기 제2시점(T2)보다 앞선 제3시점(T3)에 수신하였다. 상기 저장장치(20)이 상기 제5쓰기명령(705)이, 상기 제6에포크 아이디를 갖는 마지막 쓰기명령이라는 사실을 알 수 없다면, 상기 제5쓰기명령(705)을 수신한 제3시점(T3)에 타이머를 리셋하고 타이머를 구동한다. 그리고 타임아웃은 상기 미리 결정된 타임아웃 시간(DT)이 경과한 제4시점(T4)에 이루어진다. 상기 제1시점(T1)에서는 타임아웃이 이루어 졌다. 따라서 상기 제4시점(T4)에 상기 저장장치(20)는 상기 제6쓰기명령(706)을 실행할 수 있다.

도 16 내지 도 18을 통해 설명한 본 발명의 개념을 큐-피닝 타임아웃이라고 지칭할 수 있다. 상기 큐-피닝 타임아웃은 도 14에 설명한 큐-피닝의 개념을 전제로 한 것이다.

도 16 내지 도 18을 통해 설명한 본 발명의 개념은, {특정 스트림 아이디, 특정 에포크 아이디}를 포함하여 연속적으로 발생한 쓰기명령들에 대하여, 시간축에서 서로 인접한 두 개의 쓰기명령들 간의 시간 간격이 상기 미리 결정된 타임아웃 시간(DT)보다 작을 것이라는 기대를 이용한 것이다.

상술한 큐-피닝 타임아웃 개념을 구현하기 위하여, 상기 저장장치(20)는 타이머를 포함할 수 있다.

그리고 상기 저장장치(20)는 다음 단계들을 수행할 수 있다.

단계(S510)에서, 상기 저장장치(20)는 제1전송채널(31)을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 쓰기명령을 수신하면, 타이머를 리셋하여 상기 타이머를 구동할 수 있다.

단계(S520)에서, 상기 저장장치(20)는, 제2전송채널(32)을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제6쓰기명령(706)을 수신하였을 때에, 상기 타이머가 타임 아웃된 것이 확인된 경우에만 상기 제6쓰기명령을 실행할 수 있다.

이때, 상기 저장장치(20)는, 상기 타이머를 구동하는 단계 이후에 제1전송채널(31)을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 다른 쓰기명령을 수신하면, 상기 타이머를 다시 리셋하여 상기 타이머를 재구동할 수 있다.

여기서 상기 제7에포크 아이디는 상기 제6에포크 아이디보다 낮은 우선순위를 갖는다.

도 17 및 도 18에 제시한 방법은, 상기 저장장치(20)가 {특정 스트림 아이디, 특정 에포크 아이디}를 갖는 특정 쓰기명령이, 상기 {특정 스트림 아이디, 특정 에포크 아이디}를 갖는 일련의 쓰기명령들 중에서 마지막으로 발생한 쓰기명령인지 여부를 알 수 없을 때에 유용하게 사용될 수 있다.

이와 달리, 상술한 바와 같이, 상기 {특정 스트림 아이디, 특정 에포크 아이디}를 갖는 일련의 쓰기명령들 중에서 마지막에 발생한 쓰기명령을 상기 특정 에포크 아이디를 갖는 베리어-명령으로 정의한다면, 도 17 및 도 18에 서술한 큐-피닝 타임아웃의 구성을 이용하지 않더라도 도 17 및 도 18에 설명한 것과 동일한 효과를 얻을 수 있다.

컴퓨팅 장치(1)는 호스트(10) 및 저장장치(20)를 포함할 수 있다.

상기 저장장치(20)는 콘트롤러(210) 및 한 개 또는 복수 개의 디스크들(221~224)를 포함할 수 있다. 상기 콘트롤러(210)는 상기 타이머(211)를 포함할 수 있다.

상기 저장장치(20)는 레이드 저장장치일 수 있다. 이때 상기 콘트롤러(210)는 레이드 콘트롤러일 수 있다.

상기 호스트(10)와 상기 저장장치(20)는 복수 개의 전송채널들(ex: 31~33)로 연결될 수 있다.

상기 호스트(10)는 제1스레드 및 제2스레드를 생성할 수 있다.

서로 다른 스트림 아이디를 갖는 제1스트림 식별정보 및 제2스트림 식별정보는, 상기 호스트(10)가 생성한 서로 다른 스레드들에 의해 생성된 것일 수 있다. 예컨대 제1스트림 아이디를 갖는 제11스트림 식별정보(711)는 상기 호스트(10)가 생성한 제1스레드에 의해 생성된 것이고, 제2스트림 아이디를 갖는 제24스트림 식별정보(724)는 상기 호스트(10)가 생성한 제2스레드에 의해 생성된 것일 수 있다.

이때, 제11스트림 식별정보(711)에 포함된 제1에포크 아이디는 상기 제1스레드가 사용하는 제1변수에 의해 생성된 것이고, 제24스트림 식별정보(724)에 포함된 제4에포크 아이디는 상기 제2스레드가 사용하는 제2변수에 의해 생성된 것일 수 있다. 상기 제1변수와 상기 제2변수는 서로 다른 변수이며, 각각 상기 제1스레드 및 상기 제2스레드에 의해 독립적으로 관리될 수 있다. 본 명세서에서 상기 제1변수 및 상기 제2변수는 각각 제1에포크 카운터 및 제2에포크 카운터라고 지칭될 수도 있다.

상기 제1스레드는 제1스트림 아이디를 갖는 스트림 식별정보들을 포함하는 제1쓰기요청을 블록계층(11)에 전달할 수 있다. 이때 각 스트림 식별정보에 포함된 에포크 아이디는 상기 제1스레드가 상기 제1변수를 이용하여 생성한 것이며, 예컨대 제1에포크 아이디일 수 있다.

상기 제2스레드는 제2스트림 아이디를 갖는 스트림 식별정보들을 포함하는 제2쓰기요청을 블록계층(11)에 전달할 수 있다. 이때 각 스트림 식별정보에 포함된 에포크 아이디는 상기 제2스레드가 상기 제2변수를 이용하여 생성한 것이며, 예컨대 제4에포크 아이디일 수 있다.

도 20에 제시한 것과 같이, 상기 블록계층(11)은, 상기 제1쓰기요청을 기초로 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제11스트림 식별정보(711)를 생성하고, 상기 제11스트림 식별정보를 포함하는 제1쓰기명령(701)을 생성하여 상기 저장장치(20)에게 전송할 수 있다. 그리고 상기 블록계층(11)은, 상기 제2쓰기요청을 기초로 {제2스트림 아이디, 제4에포크 아이디}를 갖는 제24스트림 식별정보(724)를 생성하고, 상기 제24스트림 식별정보를 포함하는 제2쓰기명령(702)을 생성하여 상기 저장장치(20)에게 전송할 수 있다. 도 20의 예에서 제1쓰기명령(701)과 제2쓰기명령(702)는 각각 단일 스트림 쓰기명령이다.

이와 달리 도 21에 제시한 것과 같이, 블록계층(11)은, 상기 제1쓰기요청 및 제2쓰기요청을 기초로 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제11스트림 식별정보와 {제2스트림 아이디, 제4에포크 아이디}를 갖는 제24스트림 식별정보를 포함하는 제1쓰기명령(701)을 생성하여 상기 저장장치(20)에게 전송할 수 있다. 도 21의 예에서, 상기 제1쓰기명령(701)은 이중 스트림 쓰기명령이다.

본 명세서에서, 도 20의 제2쓰기명령(702)과 같이 한 개의 스트림 식별정보만을 포함하는 쓰기명령은 단일 스트림 쓰기명령이라고 지칭할 수 있다. 그리고 도 21의 제1쓰기명령(701)과 같이 서로 다른 두 개의 스트림에 속한 두 개의 스트림 식별정보들을 포함하는 쓰기명령은 이중 스트림 쓰기명령이라고 지칭할 수 있다.

상술한 본 발명의 실시예들을 이용하여, 본 발명의 기술 분야에 속하는 자들은 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에 다양한 변경 및 수정을 용이하게 실시할 수 있을 것이다. 특허청구범위의 각 청구항의 내용은 본 명세서를 통해 이해할 수 있는 범위 내에서 인용관계가 없는 다른 청구항에 결합될 수 있다.

[사사]

본 발명은 다음 연구과제의 지원을 받아 창작된 것이다.

*과제고유번호: 2018900054

*과제번호: 20180005490031001

*부처명: 과학기술정보통신부

*연구관리전문기관: 정보통신기획평가원

*연구사업명: SW컴퓨팅산업원천기술개발사업

*연구과제명: 매니코어 초대용량 메모리를 위한 확장형 순서보장운영체제 개발

*과제수행기관명: 한국과학기술원

*연구기간: 2018.04.01.~2022.12.31

Claims

저장장치가, 수신된 제1쓰기명령과 제2쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령과 상기 제2쓰기명령을 실행하는 단계;

를 포함하며,

상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보를 포함하고,

상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하고,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하지 않고 결정하도록 되어 있는,

쓰기 방법.
제1항에 있어서,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 동일한 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하여 결정되도록 되어 있는,

쓰기 방법.
제1항에 있어서,

상기 제1쓰기명령은 {제2스트림 아이디, 제3에포크 아이디}를 갖는 제3스트림 식별정보를 더 포함하고,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에, 상기 제1쓰기명령과 상기 제2쓰기명령 간의 실행순서는, 상기 제3에포크 아이디와 상기 제2에포크 아이디 간의 우선순위에 종속되는 것을 특징으로 하는,

쓰기 방법.
제3항에 있어서,

상기 저장장치가 제3쓰기명령을 더 수신하는 경우에, 상기 실행하는 단계는, 상기 제1쓰기명령, 상기 제2쓰기명령, 및 상기 제3쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령, 상기 제2쓰기명령, 및 상기 제3쓰기명령을 실행하도록 되어 있고,

상기 제3쓰기명령은 {제1스트림 아이디, 제4에포크 아이디}를 갖는 제4스트림 식별정보를 포함하고,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에,

상기 제1쓰기명령과 상기 제3쓰기명령 간의 실행순서는, 상기 제4에포크 아이디와 상기 제1에포크 아이디 간의 우선순위에 종속되는 것을 특징으로 하는,

쓰기 방법.
제1항에 있어서,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에,

상기 제1스트림 식별정보는, 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트에서 실행되는 제1스레드에 의해 생성된 것이고,

상기 제2스트림 식별정보는, 상기 호스트에서 실행되는 제2스레드에 의해 생성된 것인,

쓰기 방법.
제1항에 있어서,

상기 실행하는 단계 이전에,

상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트가, 제1스레드 및 제2스레드를 실행하는 단계;

상기 제1스레드가 상기 제1스트림 아이디와 상기 제1에포크 아이디를 갖는 제1쓰기요청을 생성하여 상기 호스트의 블록계층에 전달하고, 상기 제2스레드가 상기 제2스트림 아이디와 상기 제2에포크 아이디를 갖는 제2쓰기요청을 생성하여 상기 호스트의 블록계층에 전달하는 단계; 및

상기 블록계층이, 상기 제1쓰기요청을 기초로 상기 제1쓰기명령을 생성하여 상기 저장장치에 전송하고, 상기 제2쓰기요청을 기초로 상기 제2쓰기명령을 생성하여 상기 저장장치에 전송하는 단계;

를 더 포함하는,

쓰기 방법.
제1항에 있어서,

상기 제1쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고,

특정 {스트림 아이디, 에포크 아이디}를 갖는 모든 쓰기명령들은 상기 복수 개의 전송채널들 중 어느 하나의 전송채널만을 통해 전송되는 것을 특징으로 하는,

쓰기 방법.
제1항에 있어서,

쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고,

상기 저장장치는, 타이머를 이용하여 타임아웃 제어부를 포함하며,

상기 저장장치가, 제1전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 제3쓰기명령을 수신하면, 상기 타이머의 타임카운트를 미리 결정된 값으로 리셋하여 상기 타이머를 구동하는 단계;

상기 저장장치가, 제2전송채널을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제4쓰기명령을 수신하였을 때에, 상기 타임카운트가 소정의 기준값에 도달한 것이 확인된 경우에만 상기 제4쓰기명령을 실행하는 단계;

를 포함하는,

쓰기 방법.
제8항에 있어서, 상기 저장장치는, 상기 타이머를 구동하는 단계 이후에 제1전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 다른 쓰기명령을 수신하면, 상기 타이머의 타임 카운트를 상기 미리 결정된 값으로 리셋하여 타이머를 재구동하도록 되어 있는, 쓰기 방법.
제1항에 있어서,

쓰기명령을 상기 저장장치에게 전송하는 호스트와 상기 저장장치는 복수 개의 전송채널로 연결되어 있고,

상기 저장장치가, 제1전송채널을 통해 {제1스트림 아이디, 제7에포크 아이디}를 갖는 제4쓰기명령을 수신한 경우,

상기 저장장치는, 상기 제4쓰기명령을 수신한 제1시점으로부터 미리 결정된 타임아웃 시간 이전의 시각인 제2시점 사이에, 제2전송채널을 통해 {제1스트림 아이디, 제6에포크 아이디}를 갖는 제3쓰기명령을 수신하지 않은 경우에만 상기 제3쓰기명령을 실행하도록 되어 있고,

상기 제6에포크 아이디는 상기 제7에포크 아이디보다 쓰기 우선순위가 높은 값을 갖는,

쓰기 방법.
제1항에 있어서, 상기 {제1스트림 아이디, 제1에포크 아이디}를 갖는 한 세트의 쓰기명령들 중에서 가장 마지막에 발생한 쓰기명령은 배리어-명령인 것을 특징으로 하는, 쓰기 방법.
콘트롤러; 및 메모리를 포함하는 저장장치로서,

상기 콘트롤러는, 상기 저장장치가 수신한 제1쓰기명령과 제2쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령과 상기 제2쓰기명령을 실행하도록 되어 있고,

상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보를 포함하고,

상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하고,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하지 않고 결정하도록 되어 있는,

저장장치.
제12항에 있어서, 상기 제1스트림 아이디와 상기 제2스트림 아이디가 동일한 경우에는, 상기 실행순서는 상기 제1에포크 아이디와 상기 제2에포크 아이디를 서로 비교한 결과를 이용하여 결정되도록 되어 있는, 저장장치.
제12항에 있어서,

상기 제1스트림 아이디와 상기 제2스트림 아이디가 서로 다른 경우에,

상기 제1에포크 아이디는 상기 제1쓰기명령과 상기 제2쓰기명령을 상기 저장장치에게 전송한 호스트에서 실행되는 제1스레드가 참조하는 제1에포크 카운터에 의해 생성된 것이고,

상기 제2에포크 아이디는 상기 호스트에서 실행되는 제2스레드가 참조하는 제2에포크 카운터에 의해 생성된 것인,

저장장치.
콘트롤러; 및 메모리를 포함하며,

상기 콘트롤러는, 수신된 제1쓰기명령, 제2쓰기명령, 및 제3쓰기명령 간의 실행순서를 결정하여, 상기 결정된 실행순서에 따라 상기 제1쓰기명령, 상기 제2쓰기명령, 및 상기 제3쓰기명령을 실행하는 단계를 실행하도록 되어 있으며,

상기 제1쓰기명령은 {제1스트림 아이디, 제1에포크 아이디}를 갖는 제1스트림 식별정보 및 {제2스트림 아이디, 제3에포크 아이디}를 갖는 제3스트림 식별정보를 포함하고,

상기 제2쓰기명령은 {제2스트림 아이디, 제2에포크 아이디}를 갖는 제2스트림 식별정보를 포함하고,

상기 제3쓰기명령은 {제1스트림 아이디, 제4에포크 아이디}를 갖는 제4스트림 식별정보를 포함하며,

상기 제3쓰기명령과 상기 제2쓰기명령간의 실행순서는, 상기 제3에포크 아이디와 상기 제2에포크 아이디 간의 우선순위, 그리고 상기 제1에포크 아이디와 상기 제4에포크 아이디 간의 우선순위에 의해 결정되는,

저장장치.