KR20140044558A - 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법 - Google Patents

세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법 Download PDF

Info

Publication number
KR20140044558A
KR20140044558A KR1020120110673A KR20120110673A KR20140044558A KR 20140044558 A KR20140044558 A KR 20140044558A KR 1020120110673 A KR1020120110673 A KR 1020120110673A KR 20120110673 A KR20120110673 A KR 20120110673A KR 20140044558 A KR20140044558 A KR 20140044558A
Authority
KR
South Korea
Prior art keywords
segment
segments
victim
data
block
Prior art date
Application number
KR1020120110673A
Other languages
English (en)
Other versions
KR102007650B1 (ko
Inventor
고석영
김재극
황주영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020120110673A priority Critical patent/KR102007650B1/ko
Priority to US14/046,515 priority patent/US9323772B2/en
Publication of KR20140044558A publication Critical patent/KR20140044558A/ko
Application granted granted Critical
Publication of KR102007650B1 publication Critical patent/KR102007650B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1727Details of free space management performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems

Abstract

세그먼트 그룹에 대응되는 방식으로 빅팀 세그먼트 선정을 위한 세그먼트 평가를 수행하는 호스트 장치 및 그 세그먼트 클리닝 방법이 제공된다. 본 발명에 따른 호스트 장치는 스토리지 장치와의 데이터 송수신을 중계하는 인터페이스 및 상기 스토리지 장치에 저장 된 복수의 세그먼트(segment) 중 빅팀(victim) 세그먼트를 선정하고, 상기 빅팀 세그먼트 내의 라이브 블록을 식별하며, 상기 식별된 라이브 블록을 상기 인터페이스를 통하여 상기 스토리지 장치에 라이트-백 하고 상기 빅팀 세그먼트를 프리 영역으로 환원하는 세그먼트 클리닝을 수행하는 파일 시스템 모듈을 포함한다. 이 때, 상기 파일 시스템 모듈은, 상기 복수의 세그먼트 중 일부로 구성된 제1 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제1 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 복수의 세그먼트 중 적어도 다른 일부로 구성된 제2 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하며, 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정한다.

Description

세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법{Segment group considering segment cleaning apparatus and method thereof}
본 발명은 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법에 대한 것이다. 더 구체적으로 로그 구조화된 파일 시스템(log structured filesystem)을 지원하는 파일 시스템에 적용될 수 있는 세그먼트 클리닝이 수행 되는 호스트 장치 및 그 방법에 있어서, 프리 영역으로 환원되어야 할 빅팀 세그먼트(victim segment)를 선정하되, 복수의 세그먼트를 포함하는 세그먼트 그룹을 고려하여 빅팀 세그먼트를 선정하는 호스트 장치 및 그 방법에 관한 것이다.
로그 구조화된 파일 시스템은 하드 디스크 드라이브(Hard Disk Drive)를 사용하는 서버 스토리지 시스템에서 제안되었다. 하드 디스크 드라이브는 회전 모터를 사용하는 장치이므로, 검색 레이턴시(seek latency)와 회전 레이턴시(rotational latency)를 갖는다. 따라서, 로그 구조화된 파일 시스템은 디스크 전체를 하나의 로그(log)로 구성하여, 순차적인 라이트(sequential write)만을 한다. 즉, 로그 구조화된 파일 시스템은, 파일을 수정할 때, 원래 위치의 데이터를 수정하지 않고, 로그의 마지막 부분에 수정된 데이터를 부가한다.
따라서, 로그는 지속적으로 한방향으로 확장되며 데이터의 수정 및 부가에 따라 로그가 더 이상 확장될 수 없는 상황이 발생한다. 이 때, 로그 내에 포함 된 일부 세그먼트(빅팀 세그먼트)를 데이터가 저장될 수 있는 프리 영역으로 환원하는 세그먼트 클리닝(segment cleaning)이 요구된다. 상기 빅팀 세그먼트 내에 포함된 블록 중, 유효 데이터를 포함하는 라이브 블록은 로그의 끝에 라이트-백(write-back)되므로, 세그먼트 클리닝되더라도 데이터가 유실되지는 않는다.
세그먼트 클리닝에서 필수적인 동작 중 하나는 빅팀 세그먼트를 선정하는 것이다. 전술한 바와 같이 빅팀 세그먼트 내부에 포함된 라이브 블록은 로그의 끝에 라이트-백되어야 하므로, 빅팀 세그먼트 내부에 많은 라이브 블록이 존재할수록 라이트-백의 I/O 부하가 늘어날 것이다. 따라서, 빅팀 세그먼트 내부에 포함된 전체 블록 중 라이브 블록의 비율이 낮은 세그먼트를 빅팀 세그먼트로 선정하는 것이 상기 빅팀 세그먼트 선정의 한 방법이 될 수 있을 것이다. 그러나, 라이브 블록의 비율을 고려하는 일률적인 방식으로 빅팀 세그먼트를 선정하는 것은, 데이터의 속성을 제대로 반영하지 못하고 빅팀 세그먼트를 선정하게 되는 문제점이 있다.
본 발명이 해결하려는 과제는, 세그먼트 클리닝을 수행하는 과정에서 프리 영역으로 환원되어야 하는 빅팀 세그먼트를 선정하되, 각 세그먼트 그룹에 포함된 세그먼트들에 대하여는 상기 세그먼트 그룹에 대응된 방식으로 빅팀 세그먼트를 선정하는 호스트 장치를 제공하는 것이다.
본 발명이 해결하려는 세부 과제는, 세그먼트 클리닝을 수행하는 과정에서 프리 영역으로 환원되어야 하는 빅팀 세그먼트를 선정하되, 각각의 세그먼트 그룹 내에 신규 라이트/갱신/라이트-백 여부를 달리하는 데이터가 저장되어 있는 경우, 각 세그먼트 그룹에 포함된 세그먼트들에 대하여는 상기 세그먼트 그룹에 대응된 방식으로 빅팀 세그먼트를 선정하는 호스트 장치를 제공하는 것이다.
본 발명이 해결하려는 다른 과제는, 세그먼트 클리닝을 수행하는 과정에서 프리 영역으로 환원되어야 하는 빅팀 세그먼트를 선정하되, 각 세그먼트 그룹에 포함된 세그먼트들에 대하여는 상기 세그먼트 그룹에 대응된 방식으로 빅팀 세그먼트를 선정하는 방법을 제공하는 것이다.
본 발명이 해결하려는 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 문제점을 해결하기 위한 본 발명의 일 면(aspect)에 따른 호스트 장치는 스토리지 장치와의 데이터 송수신을 중계하는 인터페이스; 및 상기 스토리지 장치에 저장 된 복수의 세그먼트(segment) 중 빅팀(victim) 세그먼트를 선정하고, 상기 빅팀 세그먼트 내의 라이브 블록을 식별하며, 상기 식별된 라이브 블록을 상기 인터페이스를 통하여 상기 스토리지 장치에 라이트-백 하고 상기 빅팀 세그먼트를 프리 영역으로 환원하는 세그먼트 클리닝을 수행하는 파일 시스템 모듈을 포함한다. 이 때, 상기 파일 시스템 모듈은, 상기 복수의 세그먼트 중 일부로 구성된 제1 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제1 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 복수의 세그먼트 중 적어도 다른 일부로 구성된 제2 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하며, 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정한다.
일 실시예에 따르면, 상기 제1 세그먼트 그룹은 신규로 라이트된 데이터를 포함하는 세그먼트들로 구성되는 것이고, 상기 제2 세그먼트 그룹은 상기 제1 세그먼트 그룹 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성되는 것일 수 있다. 또한, 상기 파일 시스템 모듈은, 상기 복수의 세그먼트 중 또 다른 일부로 구성된 제3 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 상기 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 제3 세그먼트 그룹은 상기 라이트-백 된 데이터를 포함할 수 있다.
일 실시예에 따르면, 상기 제1 세그먼트 그룹은 신규로 라이트된 데이터를 포함하는 세그먼트들로 구성되는 것이고, 상기 제2 세그먼트 그룹은 상기 라이트-백 된 데이터를 포함하는 것일 수 있다.
일 실시예에 따르면, 상기 제1 세그먼트 그룹은 제1 어드레스 영역 내에 위치하는 세그먼트들로 구성되고, 상기 제2 세그먼트 그룹은 제1 어드레스 영역과 다른 제2 어드레스 영역 내에 위치하는 세그먼트들로 구성될 수 있다.
일 실시예에 따르면, 상기 제1 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율(u)과, 상기 세그먼트에 포함된 블록 중 가장 최근에 수정된 블록의 수정 시각을 이용하여 산출된 에이지(age)를 이용하는 것일 수 있다. 상기 제1 빅팀 포인트 연산 수식은 u가 클수록 상기 빅팀 포인트가 작아지고, age가 클수록 상기 빅팀 포인트가 커지는 것이며, 상기 파일 시스템 모듈은 상기 빅팀 포인트가 가장 큰 소정 개수의 빅팀 포인트를 선정할 수 있다. 상기 제1 빅팀 포인트 연산 수식은 아래의 식일 수 있다.
Figure pat00001
상기 제2 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록(block) 중 라이브 블록의 수를 상기 세그먼트에 포함된 전체 블록의 수로 나눈 값을 이용한 것일 수 있다. 상기 파일 시스템 모듈은, 상기 세그먼트에 포함된 블록 중 라이브 블록을 상기 스토리지 장치에 저장된 비트맵(bitmap)을 참조하여 식별하되, 상기 비트맵은 대응 블록의 라이브 여부를 가리키는 비트로 구성될 수 있다.
일 실시예에 따르면, 상기 제1 세그먼트 그룹은 신규 라이트 되는 데이터를 포함하는 세그먼트들로 구성되고, 상기 제2 세그먼트 그룹은 상기 제1 세그먼트 그룹 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성되며, 상기 파일 시스템 모듈은, 상기 복수의 세그먼트 중 또 다른 일부로 구성된 제3 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 상기 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 제3 세그먼트 그룹은 상기 라이트-백 된 데이터를 포함하는 것이고, 상기 제1 빅팀 포인트 연산 수식은
Figure pat00002
이고, 상기 제2 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록(block) 중 라이브 블록의 수를 상기 세그먼트에 포함된 전체 블록의 수로 나눈 값을 이용한 것일 수 있다.
일 실시예에 따르면, 상기 파일 시스템 모듈은, 상기 빅팀 포인트를 기준으로, 하나의 섹션 당 소정 개수의 빅팀 세그먼트를 선정하되, 상기 섹션은 소정 개수의 세그먼트로 구성되는 것일 수 있다.
상기 파일 시스템 모듈은, 상기 스토리지 장치를 랜덤 접근(random access) 방식으로 라이트(write)되는 제1 영역 및 순차적 접근(sequential access) 방식으로 상기 복수의 세그먼트가 라이트 되는 제2 영역으로 나누어 관리하되, 상기 라이브 블록이 상기 로그 영역의 끝에 위치한 프리 영역에 라이트-백(write-back) 되도록 상기 세그먼트 클리닝을 수행할 수 있다.
상기 문제점을 해결하기 위한 본 발명의 다른 면(aspect)에 따른 세그먼트 클리닝 방법은 스토리지 장치에 저장 된 복수의 세그먼트(segment) 중 빅팀(victim) 세그먼트를 선정하고, 상기 빅팀 세그먼트 내의 라이브 블록을 식별하고; 상기 식별된 라이브 블록을 상기 스토리지 장치에 라이트-백 하고, 상기 빅팀 세그먼트를 프리 영역으로 환원하는 것을 포함할 수 있다. 이 때, 상기 빅팀 세그먼트를 선정하는 것은, 상기 복수의 세그먼트 중 일부로 구성된 제1 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제1 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 복수의 세그먼트 중 다른 일부로 구성된 제2 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하며, 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정하는 것을 포함할 수 있다.
일 실시예에 따르면, 상기 복수의 세그먼트 중 또 다른 일부로 구성된 제3 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 상기 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하는 것을 더 포함하고, 상기 제1 세그먼트 그룹은 신규로 라이트 된 데이터를 포함하는 세그먼트들로 구성된 것이고, 상기 제2 세그먼트 그룹은 상기 제1 세그먼트 그룹 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성되는 것이며, 상기 제3 세그먼트 그룹은 상기 라이트-백된 데이터를 포함하는 것이고, 상기 제1 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율과, 상기 세그먼트에 포함된 블록 중 가장 최근에 수정된 블록의 수정 시각을 이용하여 산출된 에이지를 이용하는 것이고, 상기 제2 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율을 이용하는 것일 수 있다.
일 실시예에 따르면, 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정하는 것은, 상기 제1 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트를 선정하고, 상기 제2 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트를 선정하고, 상기 제3 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트를 선정하는 것을 포함할 수 있다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
도 1은 본 발명의 일 실시예에 따른 컴퓨팅 시스템을 설명하기 위한 블록도이다.
도 2는 도 1의 호스트 장치를 설명하기 위한 블록도이다.
도 3은 도 1의 호스트 장치를 설명하기 위한 논리적 모듈 계층도이다.
도 4는 도 1의 스토리지 장치의 저장 영역 구성을 설명하기 위한 도면이다.
도 5는 도 1의 스토리지 장치에 저장 되는 데이터의 구성 단위를 설명하기 위한 도면이다.
도 6 내지 8은 도 1의 스토리지 장치에 저장 되는 데이터의 세그먼트 그룹 구성 예시를 설명하기 위한 도면이다.
도 9는 도 1의 스토리지 장치에 저장되는 파일의 구조를 설명하기 위한 도면이다.
도 10a 내지 10d는 도 1의 스토리지 장치에 저장되는 블록의 배치를 설명하기 위한 도면이다.
도 11은 노드 어드레스 테이블을 설명하기 위한 도면이다.
도 12a 내지 12b는 도 1의 스토리지 장치에 저장되는 데이터가 갱신 되고 그에 따라 비트맵이 갱신되는 과정을 설명하기 위한 개념도이다.
도 13a 내지 13e는 도 1의 스토리지 장치에 저장된 데이터에 대하여 세그먼트 클리닝이 수행되는 과정을 설명하기 위한 개념도이다.
도 14 내지 도 16은 본 발명의 몇몇 실시예에 따른 컴퓨팅 시스템의 구체적인 다른 예를 설명하기 위한 블록도이다.
도 17은 본 발명의 일 실시예에 따른 세그먼트 클리닝 방법의 순서도이다.
도 18 내지 20은 도 17의 세그먼트 클리닝 방법 중 일부 동작의 세부 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
하나의 소자(elements)가 다른 소자와 "연결된(connected to)" 또는 "커플링된(coupled to)" 이라고 지칭되는 것은, 다른 소자와 직접 연결 또는 커플링된 경우 또는 중간에 다른 소자를 개재한 경우를 모두 포함한다. 반면, 하나의 소자가 다른 소자와 "직접 연결된(directly connected to)" 또는 "직접 커플링된(directly coupled to)"으로 지칭되는 것은 중간에 다른 소자를 개재하지 않은 것을 나타낸다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
예컨대, 어느 하나의 구성요소가 다른 구성요소로 데이터 또는 신호를 "전송, 제공, 송신 또는 출력"하는 경우에는 상기 구성요소는 상기 다른 구성요소로 직접 상기 데이터 또는 신호를 "전송, 제공, 송신 또는 출력"할 수 있고, 적어도 하나의 또 다른 구성요소를 통하여 상기 데이터 또는 신호를 상기 다른 구성요소로 "전송, 제공, 송신 또는 출력"할 수 있음을 의미한다.
"및/또는"은 언급된 아이템들의 각각 및 하나 이상의 모든 조합을 포함한다.
비록 제1, 제2 등이 다양한 소자, 구성요소들을 서술하기 위해서 사용되나, 이들 소자, 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 소자, 구성요소 또는 섹션들을 다른 소자, 구성요소들과 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 소자, 제1 구성요소 또는 제1 섹션은 본 발명의 기술적 사상 내에서 제2 소자, 제2 구성요소 또는 제2 섹션일 수도 있음은 물론이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 컴퓨팅 시스템(1)은 호스트 장치(10)와 스토리지 장치(20)를 포함한다.
호스트 장치(10)는 컴퓨터, UMPC (Ultra Mobile PC), 워크스테이션, 넷북(net-book), PDA (Personal Digital Assistants), 포터블(portable) 컴퓨터, 웹 타블렛(web tablet), 무선 전화기(wireless phone), 모바일 폰(mobile phone), 스마트폰(smart phone), e-북(e-book), PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 블랙박스(black box), 디지털 카메라(digital camera), 3차원 수상기(3-dimensional television), 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 영상 녹화기(digital picture recorder), 디지털 영상 재생기(digital picture player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), 정보를 무선 환경에서 송수신할 수 있는 장치, 홈 네트워크를 구성하는 다양한 전자 장치들 중 하나, 컴퓨터 네트워크를 구성하는 다양한 전자 장치들 중 하나, 텔레매틱스 네트워크를 구성하는 다양한 전자 장치들 중 하나, RFID 장치, 또는 컴퓨팅 시스템을 구성하는 다양한 구성 요소들 중 하나 등과 같은 전자 장치의 다양한 구성 요소들 중 하나로 제공된다.
호스트 장치(10)와 스토리지 장치(20)는 특정한 프로토콜(protocol)을 이용하여 서로 데이터를 송수신한다. 예를 들어, 호스트 장치(10)와 스토리지 장치(20)는 USB(Universal Serial Bus) 프로토콜, MMC(multimedia card) 프로토콜, PCI(peripheral component interconnection) 프로토콜, PCI-E(PCI-express) 프로토콜, ATA(Advanced Technology Attachment) 프로토콜, Serial-ATA 프로토콜, Parallel-ATA 프로토콜, SCSI (small computer small interface) 프로토콜, ESDI(enhanced small disk interface) 프로토콜, 그리고 IDE(Integrated Drive Electronics) 프로토콜 등과 같은 다양한 인터페이스 프로토콜 중 적어도 하나에 따라 통신할 수 있으나, 이에 한정되는 것은 아니다.
호스트 장치(10)는 스토리지 장치(20)를 컨트롤한다. 예를 들어, 호스트 장치(10)는 스토리지 장치(20)에 데이터를 라이트(write)하거나, 스토리지 장치(20)로부터 데이터를 리드(read)할 수 있다.
스토리지 장치(20)는 SSD(Static Solid Disk), HDD(Hard Disk Drive), eMMC와 같은 각종 카드 스토리지, 데이터 서버 등일 수 있으나, 이에 한정되지 않는다.
도 2는 도 1에 도시된 호스트 장치(10)의 블록구성도이다.
도 2에 도시된 바와 같이 호스트 장치(10)는 스토리지 장치(20)에 대한 데이터 라이트(write)에 이용되는 후기입 캐쉬(write-back cache; WB CACHE)(104), 후기입 캐쉬(104)를 관리하는 캐쉬 관리 모듈(102), 파일 시스템 모듈(103) 및 스토리지 장치(20)와의 데이터 송수신을 중계하는 인터페이스(105)를 포함할 수 있다.
도 2에 도시된 각 구성요소는 소프트웨어(software) 또는, FPGA(field-programmable gate array)나 ASIC(application-specific integrated circuit)과 같은 하드웨어(hardware)를 의미할 수 있다. 그렇지만 상기 구성요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성요소들 안에서 제공되는 기능은 더 세분화된 구성요소에 의하여 구현될 수 있으며, 복수의 구성요소들을 합하여 특정한 기능을 수행하는 하나의 구성요소로 구현할 수도 있다.
인터페이스(105)는 호스트 장치(10)와 스토리지 장치(20) 간의 데이터 송수신에 사용되는 상기 프로토콜을 지원하는 것일 수 있으며, 데이터 케이블 연결을 위한 커넥터 및 데이터 송수신을 처리하는 로직(logic) 등을 포함할 수 있다.
파일 시스템 모듈(103)은 스토리지 장치(20)에 저장 된 복수의 세그먼트(segment) 중 빅팀(victim) 세그먼트를 선정하고, 상기 빅팀 세그먼트 내의 라이브 블록을 식별하며, 상기 식별된 라이브 블록을 인터페이스(105)를 통하여 상기 스토리지 장치에 라이트-백 하고 상기 빅팀 세그먼트를 프리 영역으로 환원하는 세그먼트 클리닝을 수행한다. 이하, 파일 시스템 모듈(103)의 동작에 대하여 보다 자세히 설명한다.
파일 시스템 모듈(103)은 각 세그먼트 그룹에 매칭된 빅팀 포인트 연산 수식에 따라 각 세그먼트 그룹에 속한 세그먼트들의 빅팀 포인트를 연산하고, 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정한다. 예를 들어, 파일 시스템 모듈(103)은, 상기 복수의 세그먼트 중 일부로 구성된 제1 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제1 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 복수의 세그먼트 중 적어도 다른 일부로 구성된 제2 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산할 수 있다.
상기 세그먼트 그룹은 복수의 세그먼트로 구성된다. 하나의 세그먼트 그룹에 포함되는 세그먼트의 수는 각 세그먼트 그룹마다 모두 동일할 수도 있고, 각 세그먼트 그룹의 특성에 따라 다를 수도 있으며, 데이터 라이트 또는 세그먼트 클리닝 상황에 따라 증감할 수도 있다.
일 실시예에 따르면, 상기 세그먼트 그룹은 특정 어드레스 영역 내에 위치한 세그먼트들로 구성될 수 있다. 다른 실시예에 따르면, 상기 세그먼트 그룹에 포함된 세그먼트들은 동일한 이유로 라이트된 블록으로 구성될 수 있다. 예를 들어, 스토리지 장치(20)는 신규로 라이트된 데이터를 포함하는 세그먼트들로 구성된 제1 세그먼트 그룹, 상기 제1 세그먼트 그룹 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성된 제2 세그먼트 그룹, 상기 제1, 2 세그먼트 그룹 소속의 세그먼트에 포함된 유효 데이터로써, 세그먼트 클리닝의 결과 라이트-백 된 데이터를 포함하는 세그먼트들로 구성된 제3 세그먼트 그룹을 포함할 수 있다.
각각의 세그먼트 그룹에는 빅팀 포인트 연산 수식이 대응될 수 있다. 파일 시스템 모듈(103)은 세그먼트 클리닝을 위하여 로그 영역에 포함된 세그먼트들 중 빅팀 세그먼트를 선정할 때, 각 세그먼트가 어떤 세그먼트 그룹에 속한 것인지 확인하고, 상기 세그먼트 그룹에 대응된 빅팀 포인트 연산 수식을 상기 세그먼트에 적용하여 빅팀 포인트를 연산한다. 로그 영역에 포함된 모든 세그먼트에 대하여 상기 빅팀 포인트가 연산되면, 파일 시스템 모듈(103)은 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정한다. 이 때, 파일 시스템 모듈(103)은 각 세그먼트 그룹에 포함된 세그먼트끼리 상기 빅팀 포인트를 비교하여 각 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트를 선정할 수도 있고, 로그 영역 내 전체 세그먼트끼리 상기 빅팀 포인트를 비교하여 전체 로그 영역 내에서 소정 개수의 빅팀 세그먼트를 선정할 수도 있다. 전체 로그 영역 내에서 소정 개수의 빅팀 세그먼트를 선정하는 경우에는, 서로 다른 세그먼트 그룹에 대응되는 서로 다른 빅팀 포인트 연산 수식은 서로 균형이 맞도록 설정되는 것이 바람직하다.
일 실시예에 따르면, 파일 시스템 모듈(103)은 상기 빅팀 포인트를 기준으로, 하나의 섹션 당 소정 개수의 빅팀 세그먼트를 선정할 수도 있다. 섹션은 기 지정된 개수의 세그먼트로 구성되는 것으로, 상기 섹션은, 도 5 내지 8을 참조하여 다시 설명된다.
상기 세그먼트 그룹에 대하여 도 6 내지 8을 참조하여 추후 자세히 설명한다.
상기 선정된 빅팀 세그먼트 내에는 유효한 데이터인 라이브 블록(live-block) 뿐만 아니라, 삭제, 갱신 등으로 더 이상 유효하지 않은 데이터인 무효 블록도 포함 되어 있다. 상기 빅팀 세그먼트 내에 포함 된 라이브 블록들은 새로운 클린 세그먼트로 재구성 되어, 스토리지 장치(20)에 라이트-백 될 수 있다. 파일 시스템 모듈(103)은 상기 빅팀 세그먼트 내에 포함된 블록들 중, 라이브 블록을 스토리지 장치(20)에 저장된 비트맵을 참조하여 각 세그먼트 내의 라이브 블록을 식별할 수 있다. 상기 비트맵은 스토리지 장치(20) 내의 각 블록에 대응하는 비트들로 구성된 것으로, 각각의 비트는 대응 블록이 라이브 블록인지 여부를 가리킨다.
일 실시예에 따르면, 파일 시스템 모듈(103)은 상기 클린 세그먼트를 직접 라이트-백 하지 않고, 후기입 캐쉬(104)에 상기 라이브 블록을 적재함으로써 후기입 캐쉬(104)의 플러쉬(flush)에 의하여 상기 라이브 블록으로 구성된 상기 클린 세그먼트가 스토리지 장치(20)에 라이트-백 되도록 할 수 있다.
후기입 캐쉬(104)를 통한 라이트-백에 대하여 보다 자세히 설명한다. 먼저, 파일 시스템 모듈(103)은 상기 식별된 라이브 블록이 소속된 파일의 파일 식별자(FILE ID) 및 상기 파일 내에서의 상기 라이브 블록의 위치를 나타내는 블록 오프셋을 스토리지 장치(20)에 저장된 상기 메타 데이터를 조회하여 얻는다.
다음으로, 파일 시스템 모듈(103)은 상기 라이브 블록의 파일 식별자 및 상기 블록 오프셋을 이용하여 상기 라이브 블록이 후기입 캐쉬(104)에 기 적재 되어 있는지 여부를 조회한다.
다음으로, 파일 시스템 모듈(103)은, 상기 조회 후, 상기 라이브 블록이 상기 후기입 캐쉬 내에 기 적재 되지 않은 경우에 한하여 상기 라이브 블록을 스토리지 장치(20)로부터 리드(read)하여 후기입 캐쉬(104)에 적재한다.
다음으로, 파일 시스템 모듈(103)은, 캐쉬 관리 모듈(102)에 상기 라이브 블록에 대한 더티 플래그(dirty flag)의 세팅을 요청하여, 캐쉬 관리 모듈(102)이 캐쉬에 적재되어 있는 상기 라이브 블록을 플러쉬(flush)하여 파일 시스템 모듈(103)을 통하여 스토리지 장치(20)에 라이트-백하도록 한다.
즉, 캐쉬 관리 모듈(102)은, 후기입 캐쉬(104)에 적재 된 하나 이상의 라이브 블록을 포함하는 클린 세그먼트(clean segment)가 상기 스토리지 장치에 라이트-백(write-back) 되도록 파일 시스템 모듈(103)을 제어할 수 있다.
본 실시예에 따르면, 세그먼트 클리닝 과정에서, 파일 시스템 모듈(103)이 항상 상기 라이브 블록을 리드하는 것이 아니라, 상기 라이브 블록이 후기입 캐쉬(104) 내에 적재되어 있지 않은 경우에 한하여, 상기 라이브 블록을 후기입 캐쉬(104) 내에 적재하기 위한 리드(read)를 할 수 있다. 즉, 본 발명에 따르면 세그먼트 클리닝 과정에서 리드 오버헤드가 감소되어, I/O 대역폭을 절약할 수 있는 효과가 있다.
상기 라이트-백은 후기입 캐쉬(104)가 더티 플래그가 세팅된 데이터를 스토리지 장치(20)에 플러쉬(flush)하는 시점에 일어난다. 따라서, 상기 라이브 블록을 포함하는 클린 세그먼트가 스토리지 장치(20)에 다시 저장되는 시점은 상기 라이브 블록이 후기입 캐쉬(104)에 적재되는 시점과 시간 차이가 존재할 수 있다. 세그먼트 클리닝의 타입이 주기적으로 이뤄지는 백그라운드 타입인 경우, 상기 라이브 블록이 바로 리드 될 확률은 높지 않으므로, 상기 시간 차이가 용인될 수 있다.
언급한 바와 같이, 상기 빅팀 세그먼트는 프리 영역으로 환원 되어야 하므로, 파일 시스템 모듈(103)은 상기 라이트-백이 이뤄진 후에 상기 빅팀 세금먼트를 프리 영역으로 지정할 수 있다.
도 3을 더 참조하여, 호스트 장치(10)를 보다 자세히 설명한다. 도 3은 호스트 장치(10)를 설명하기 위한 논리적 모듈 계층도이다.
도 3을 참조하면, 호스트 장치(10)는 사용자 스페이스(user space)(11)와 커널 스페이스(kernel space)(13)를 포함한다.
사용자 스페이스(11)는 사용자 어플리케이션(user application)(12)이 실행되는 영역이고, 커널 스페이스(13)는 커널 실행 전용 영역이다. 사용자 스페이스(11)에서 커널 스페이스(13)를 접근하기 위해서, 커널이 제공하는 시스템 콜(system call)이 이용될 수 있다.
커널 스페이스(13)는 사용자 스페이스(11)의 I/O 콜 호출을 적절한 파일 시스템(16)으로 연결해주는 가상 파일 시스템(14), 호스트 장치(10)의 메모리를 관리하는 메모리 관리 모듈(15), 하나 이상의 파일 시스템(16), 스토리지 장치(20)를 제어하기 위한 하드웨어 제어 콜을 제공하는 장치 드라이버(18) 등을 포함할 수 있다. 예를 들어, 파일 시스템(16)은 ext2, ntfs, smbfs, proc 등일 수 있다. 또한, 본 발명에 따르면 파일 시스템(16) 중 하나는 본 발명에 따른 로그 구조화된 파일 시스템 기반의 F2FS 파일 시스템일 수 있다.
가상 파일 시스템(14)은 하나 이상의 파일 시스템(16)이 서로 상호 동작할 수 있도록 한다. 서로 다른 미디어의 서로 다른 파일 시스템(16)에 대해 리드/라이트 작업을 하기 위해서, 표준화된 시스템 콜을 사용할 수 있도록 한다. 예를 들어, open(), read(), write()와 같은 시스템 콜은, 파일 시스템(16)의 종류에 관계없이 사용될 수 있다. 즉, 가상 파일 시스템(14)은 사용자 스페이스(11)와 파일 시스템(16) 사이에 존재하는 추상화 계층이다.
장치 드라이버(18)는 하드웨어와 사용자 어플리케이션(또는 운영체제) 사이의 인터페이스를 담당한다. 장치 드라이버(18)는 하드웨어가 특정 운영체제 하에서 정상적으로 동작하기 위해 필요한 프로그램이다. 장치 드라이버(18)는 인터페이스(105)를 제어할 수 있다.
도 2에 도시된 파일 시스템 모듈(103)은 상기 F2FS 파일 시스템으로 동작하는 것일 수 있다. 또한, 도 2에 도시된 캐쉬 관리 모듈(102)은 도 3에 도시된 가상 파일 시스템(14) 또는 메모리 관리 모듈(15)에 포함 된 서브-모듈일 수 있다.
이하에서, 상기 F2FS 파일 시스템이 스토리지 장치(20)를 어떻게 제어하는지를 도 4 내지 도 13e를 이용하여 설명한다.
스토리지 장치(20)는 저장 수단을 구비한다. 상기 저장 수단의 저장 영역은 도 4에 도시된 것과 같이 제1 영역(30) 및 제2 영역(40)을 포함하여 구성될 수 있다. 제1 영역(30)은 랜덤 접근(random access) 방식으로 라이트 되는 영역이고, 제2 영역(40)은 순차적 접근(sequential access) 방식으로 라이트 되는 영역이다. 순차적 접근 방식의 라이트는 쓰여질 데이터를 점증하는 어드레스에 인접하여 라이트하는 것이고, 랜덤 접근 방식의 라이트는 쓰여질 데이터를 인접 여부와 무관하게 지정된 어드레스에 라이트하는 것이다.
세그먼트 클리닝이 진행됨에 따라, 로그 영역이 여러 개의 조각으로 분리될 수도 있으므로, 상기 순차적 접근 방식의 라이트는, 하나의 세그먼트 내에서 순차적 접근 방식의 라이트로 한정될 수 있다. 즉, 하나의 세그먼트 내에서는 블록이 순차적으로 라이트될 수 있다.
F2FS 파일 시스템은 포맷(format)할 때, 스토리지 장치(20)를 제1 영역(30)과 제2 영역(40)으로 나눌 수 있으나, 이에 한정되는 것은 아니다. 즉, F2FS 파일 시스템은 최초 포맷 이후에도 스토리지 장치(20)를 제1 영역(30)과 제2 영역(40)으로 나눌 수 있다. 제1 영역(30)은 시스템 전체로 관리되는 각종 정보가 저장되는 영역으로, 예를 들어, 현재 할당된 파일 수, 유효한 페이지 수, 위치, 상기 비트맵 등의 정보를 포함할 수 있다. 제2 영역(40)은 실제 사용자가 사용하고 있는 각종 디렉토리 정보, 데이터, 파일 정보 등을 저장하는 공간이다.
스토리지 장치(20)는 상기 랜덤 접근에 활용되는 버퍼를 구비할 수 있다. 상기 버퍼가 최적으로 활용되도록, 제1 영역(30)은 스토리지 장치(20)의 앞부분에 저장되고, 제2 영역(40)은 스토리지 장치(20)의 뒷부분에 저장될 수 있다. 여기서, 앞부분은 뒷부분보다 물리 어드레스(physical address)를 기준으로 앞에 있음을 의미한다.
스토리지 장치(20)가 예를 들어, SSD인 경우, SSD 내부에 버퍼(buffer)가 있을 수 있다. 버퍼는 예를 들어, 리드/라이트 속도가 빠른 SLC(Single Layer Cell) 메모리일 수 있다. 따라서, 이러한 버퍼는 한정된 공간의 랜덤 접근 방식의 라이트 속도를 빠르게 할 수 있다. 따라서, 이러한 버퍼를 활용해서, 제1 영역(30)을 스토리지 장치(20)의 앞부분에 위치시킴으로써 랜덤 억세스에 따른 스토리지 장치(20)의 I/O 속도 저하를 막을 수 있다.
제2 영역(40)은 로그 영역(41) 및 프리 영역(42)으로 구성될 수 있다. 도 4에 도시된 것과 같이, 로그 영역(41)은 하나의 연결된 영역일 수도 있으나, 세그먼트 클리닝 과정에서 로그 영역(41)에 포함 된 빅팀 세그먼트들이 프리 영역(42)으로 전환됨에 따라, 둘 이상의 조각으로 나뉠 수도 있다.
로그 영역(41)은 데이터가 쓰여진 영역이고, 프리 영역(42)은 데이터가 쓰여질 수 있는 영역이다. 제2 영역(40)은 순차적 접근 방식으로 라이트되므로, 데이터는 "로그 영역의 끝(end of log)"에 위치한 프리 영역에만 라이트 될 수 있다. 즉, "로그 영역의 끝"은 데이터가 라이트되는 지점을 가리킨다. 상기 설명한 바와 같이, 로그 영역(41)은 둘 이상의 조각으로 나뉠 수도 있으므로, "로그 영역의 끝"은 로그 영역(41) 사이에 위치하는 프리 영역(42)을 가리킬 수도 있다.
로그 영역(41)에 기 저장된 데이터가 수정될 때에도, 수정 후 데이터는 기 저장된 로그 영역(41) 내의 위치가 아니라 "로그 영역의 끝"에 위치한 프리 영역에 라이트 된다. 이 때, 기 저장 되었던 데이터는 무효 데이터가 된다.
데이터가 새로 라이트 되거나, 기 저장된 데이터가 수정됨에 따라, 로그 영역의 끝 지점은 점점 제2 영역(40)의 뒷부분으로 이동하여 프리 영역(42)이 부족해지게 된다. 이 때에 세그먼트 클리닝이 수행된다. 본 발명에 따른 세그먼트 클리닝 방법에 대하여는 추후 자세히 설명한다.
도 5는 스토리지 장치(20)에 저장 되는 데이터의 구성 단위를 설명하기 위한 도면이다.
세그먼트(SEGMENT)(53)는 다수의 블록(BLK)(51)을 포함하고, 섹션(SECTION)(55)은 다수의 세그먼트(53)를 포함하고, 존(ZONE)(57)은 다수의 섹션(55)을 포함할 수 있다. 예를 들어, 블록(51)은 4Kbyte이고, 세그먼트(53)는 512개의 블록(51)을 포함하여 2M byte일 수 있다. 이러한 구성은, 스토리지 장치(20)의 포맷(format) 시점에서 결정될 수 있으나, 이에 한정되는 것은 아니다. 섹션(55)과 존(57)의 사이즈는 포맷 시점에서 수정될 수도 있다. F2FS 파일 시스템은 모든 데이터를 4Kbyte의 페이지 단위로 리드/라이트할 수 있다. 즉, 블록(51)에 하나의 페이지가 저장되고, 세그먼트(53)에 다수의 페이지가 저장될 수 있다.
복수의 세그먼트(53)가 모여서 하나의 세그먼트 그룹을 구성할 수 있다. 예를 들어, 도 6에 도시된 것과 같이, 스토리지 장치(20)의 저장 영역에는 제1 세그먼트 그룹(53-1)과 제2 세그먼트 그룹(53-2)이 포함될 수 있다. 이미 설명한 바와 같이, 각각의 세그먼트 그룹에는 빅팀 포인트 연산 수식이 대응될 수 있다. 예를 들어, 제1 세그먼트 그룹(53-1)에는 제1 빅팀 포인트 연산 수식이 대응되고, 제2 세그먼트 그룹(53-2)에는 제2 빅팀 포인트 연산 수식이 대응될 수 있다. 본 발명에 따르면 빅팀 세그먼트를 선정함에 있어서, 각 세그먼트가 소속된 세그먼트 그룹에 따라 서로 다른 방식으로 상기 선정을 위한 빅팀 포인트가 연산된다. 이러한 방식에 의하여 각각의 세그먼트를 그 특성에 맞는 방식으로 빅팀 세그먼트 적합성에 대한 평가를 수행할 수 있는 효과가 있다.
일 실시예에 따르면, 각각의 세그먼트 그룹은 대응되는 어드레스 영역 내에 위치하는 세그먼트들로 구성될 수 있다. 상기 어드레스는 물리 어드레스 또는 논리 어드레스일 수 있다. 예를 들어, 제1 세그먼트 그룹은 제1 어드레스 영역 내에 위치하는 세그먼트들로 구성되고, 상기 제2 세그먼트 그룹은 제1 어드레스 영역과 다른 제2 어드레스 영역 내에 위치하는 세그먼트들로 구성될 수 있다.
도 6에 도시된 것과 같이, 스토리지 장치(20)의 저장 영역에는 제1 세그먼트 그룹(53-1)과 제2 세그먼트 그룹(53-2) 뿐만 아니라 제3 세그먼트 그룹(53-3)이 포함될 수도 있다. 제1 내지 3 세그먼트 그룹(53-1 내지 53-3)은 모두 다른 빅팀 포인트 연산 수식에 대응되거나, 제1 세그먼트 그룹(53-1)을 제외한 나머지 두개의 세그먼트 그룹이 같은 빅팀 포인트 연산 수식을 사용할 수 있다.
도 7에 도시된 것과 같이, 제1 세그먼트 그룹(53-1)은 신규로 라이트된 데이터를 포함하는 세그먼트들로 구성되고, 제2 세그먼트 그룹(53-2)은 제1 세그먼트 그룹(53-1) 또는 제3 세그먼트 그룹(53-3) 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성되며, 제3 세그먼트 그룹(53-3)은 세그먼트 클리닝의 결과 라이트-백 된 상기 클린 세그먼트들로 구성될 수 있다.
제1 세그먼트 그룹(53-1)에는 제1 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율(u)과, 상기 세그먼트에 포함된 블록 중 가장 최근에 수정된 블록의 수정 시각을 이용하여 산출된 에이지(age)를 이용하는 제1 빅팀 포인트 연산 수식이 대응될 수 있다. 상기 제1 빅팀 포인트 연산 수식은 u가 작을수록 상기 빅팀 포인트가 커지고, age가 클수록 상기 빅팀 포인트가 커지는 것일 수 있다. F2FS 파일 시스템은 빅팀 포인트가 큰 순서대로 소정 개수의 빅팀 포인트를 선정할 수 있다. 제1 세그먼트 그룹(53-1)에는 신규 라이트 데이터가 포함되므로, 블록의 활용도 및 블록의 갱신 가능성이 유동적이다. 따라서, F2FS 파일 시스템은 제1 세그먼트 그룹(53-1)에 포함된 데이터에 대하여 활용도 및 에이지를 모두 고려하여 빅팀 포인트를 연산할 수 있다.
즉, 상기 제1 빅팀 포인트 연산 수식은 아래와 같다.
Figure pat00003
제2 세그먼트 그룹(53-2)은 갱신된 적이 있는 데이터로 구성되는 점에서, 갱신 가능성이 높은 데이터로 구성된 세그먼트 그룹이다. 한번 갱신된 데이터는 또 다시 갱신될 가능성이 높으므로, 제2 세그먼트 그룹(53-2) 내에서 빅팀 세그먼트를 선정하기 위하여는 세그먼트에 포함된 블록 중 라이브 블록의 비율(u)만을 이용하여 빅팀 포인트를 연산할 수 있다. 반면에, 제3 세그먼트 그룹(53-3)은 세그먼트 클리닝의 결과 라이트-백 된 데이터들로 구성된 것으로, 갱신 가능성이 낮은 데이터로 구성된 세그먼트 그룹이다. 제3 세그먼트 그룹(53-3) 내의 데이터 역시 모두 갱신 가능성이 낮은 데이터 만으로 구성되는 점에서, F2FS 파일 시스템은 제3 세그먼트 그룹(53-3) 내의 데이터에 대하여도 세그먼트에 포함된 블록 중 라이브 블록의 비율(u)만을 이용하여 빅팀 포인트를 연산할 수 있다. 즉, 제2, 3 세그먼트 그룹(53-2, 53-3)에는 상기 세그먼트에 포함된 블록(block) 중 라이브 블록의 수를 상기 세그먼트에 포함된 전체 블록의 수로 나눈 값을 이용한 제2 빅팀 포인트 연산 수식이 대응될 수 있다. 제2 빅팀 포인트 연산 수식은 연산 부하를 적게 발생시키므로, F2FS 파일 시스템은 제2, 3 세그먼트 그룹(53-2, 53-3)에 대하여는 신속하게 빅팀 포인트 연산 작업을 수행할 수 있다.
한편, 스토리지 장치(20)에 저장되는 파일은 도 9에 도시된 것과 같은, 인덱싱 구조(indexing structure)를 가질 수 있다. 하나의 파일은 다수의 데이터 와, 다수의 데이터와 연관된 다수의 노드를 포함할 수 있다. 데이터 블록(70)은 데이터를 저장하는 부분이고, 노드 블록(80, 81~88, 91~95)은 노드를 저장하는 부분이다.
노드 블록(80, 81~88, 91~95)은 다이렉트 노드 블록(direct node block)(81~88), 인다이렉트 노드 블록(indirect node block)(91~95), 아이노드 블록(inode block)(80)을 포함할 수 있다. F2FS 파일 시스템에서, 하나의 파일은 하나의 아이노드 블록(80)을 가진다.
한편, 비트맵(640)을 구성하는 각각의 비트는 데이터 블록(70)뿐만 아니라 노드 블록(80, 81~88, 91~95)의 라이브 블록 여부도 가리킬 수 있다.
다이렉트 노드 블록(81~88)은 아이노드 블록(80)의 식별자 및 데이터 블록(70)을 직접 가리키는 데이터 포인터(data pointer)를 다이렉트 노드 블록(81~88)의 자식 블록인 데이터 블록의 수만큼 포함한다. 다이렉트 노드 블록(81~88)은 각 데이터 블록(70)이, 아이노드 블록(80)에 대응되는 파일 내에서 몇번째 블록인지에 대한 정보, 즉 블록의 오프셋 정보를 더 저장한다.
인다이렉트 노드 블록(91~95)은 다이렉트 노드 블록 또는 다른 인다이렉트 노드 블록을 가리키는 포인터를 포함한다. 인다이렉트 노드 블록(91~95)은 예를 들어, 제1 인다이렉트 노드 블록(91~94), 제2 인다이렉트 노드 블록(95) 등을 포함할 수 있다. 제1 인다이렉트 노드 블록(91~94)은 다이렉트 노드 블록(83~88)을 가리키는 제1 노드 포인터를 포함한다. 제2 인다이렉트 노드 블록(95)은 제1 인다이렉트 노드 블록(93, 94)을 가리키는 제2 노드 포인터를 포함한다.
아이노드 블록(80)은 데이터 포인터, 다이렉트 노드 블록(81, 82)를 가리키는 제1 노드 포인터, 제1 인다이렉트 노드 블록(91, 92)을 가리키는 제2 노드 포인터, 제2 인다이렉트 노드 블록(95)를 가라키는 제3 노드 포인터 중 적어도 하나를 포함할 수 있다. 하나의 파일은 예를 들어, 최대 3Tbyte일 수 있고, 이러한 대용량의 파일은 다음과 같은 인덱스 구조를 가질 수 있다. 예를 들어, 아이노드 블록(80) 내의 데이터 포인터는 994개이고, 994개의 데이터 포인터 각각은 994개의 데이터 블록(70) 각각을 가리킬 수 있다. 제1 노드 포인터는 2개이고, 2개의 제1 노드 포인터 각각은 2개의 다이렉트 노드 블록(81, 82)를 가리킬 수 있다. 제2 노드 포인터는 2개이고, 2개의 제2 노드 포인터 각각은 2개의 제1 인다이렉트 노드 블록(91, 92)을 가리킬 수 있다. 제3 노드 포인터는 1개이고, 제2 인다이렉트 노드 블록(95)를 가리킬 수 있다.
도 10a 내지 10d는, 본 발명의 몇몇 실시예들에 따라, F2FS 파일 시스템이 구성하는 스토리지 장치(20)의 저장 영역 구성을 보다 자세하게 도시한 것이다.
먼저, 일 실시예에 따르면, 상기 F2FS 파일 시스템은 스토리지 장치(20)의 저장 영역을 랜덤 접근 방식의 제1 영역(30) 및 순차적 접근 방식의 제2 영역(40)을 포함하도록 도 10a에 도시된 것과 같이 구성할 수 있다.
구체적으로, 제1 영역(30)은 슈퍼블록(61, 62), 체크 포인트 영역(CheckPoint area, CP)(63), 세그먼트 정보 테이블(Segment Information Table, SIT)(64), 노드 어드레스 테이블(Node Address Table, NAT)(65), 세그먼트 요약 영역(Segment Summary Area, SSA)(66) 등을 포함할 수 있다.
먼저, 슈퍼블록(61, 62)에는, 파일 시스템(16)의 디폴트 정보가 저장된다. 예를 들어, 블록(51)의 크기, 블록(51)의 개수, 파일 시스템(16)의 상태 플러그(clean, stable, active, logging, unknown) 등이 저장될 수 있다. 도시된 것과 같이, 슈퍼블록(61, 62)은 2개일 수 있고, 각각에는 동일한 내용이 저장될 수 있다. 따라서, 둘 중 어느 하나에 문제가 발생하더라도, 다른 하나를 이용할 수 있다.
체크 포인트 영역(63)은 체크 포인트를 저장한다. 체크 포인트는 논리적인 중단점으로서, 이러한 중단점까지의 상태가 완전하게 보존된다. 컴퓨팅 시스템의 동작 중에 사고(예를 들어, 셧다운(shutdown))가 발생하면, 파일 시스템(16)은 보존된 체크 포인트를 이용하여 데이터를 복구할 수 있다. 이러한 체크 포인트의 생성 시점은, 예를 들어, 주기적으로 생성, Umount 시점, System shutdown 시점 등일 수 있으나, 이에 한정되는 것은 아니다.
도 11에 도시된 것과 같이, 노드 어드레스 테이블(65)은 노드 각각에 대응되는 다수의 노드 식별자(NODE ID)와, 다수의 노드 식별자 각각에 대응되는 다수의 물리 어드레스(physical address)를 포함할 수 있다. 예를 들어, 노드 식별자 N0에 대응되는 노드 블록은 물리 어드레스 a에 대응되고, 노드 식별자 N1에 대응되는 노드 블록은 물리 어드레스 b에 대응되고, 노드 식별자 N2에 대응되는 노드 블록은 물리 어드레스 c에 대응될 수 있다. 모든 노드(아이노드, 다이렉트 노드, 인다이렉트 노드 등)는 각각 고유의 노드 식별자를 갖는다. 다르게 설명하면, 모든 노드(아이노드, 다이렉트 노드, 인다이렉트 노드 등)는 노드 어드레스 테이블(65)로부터 고유의 노드 식별자를 할당 받을 수 있다. 노드 어드레스 테이블(65)은 아이노드의 노드 식별자, 다이렉트 노드의 노드 식별자 및 인다이렉트 노드의 노드 식별자 등을 저장할 수 있다. 각 노드 식별자에 대응되는 각 물리 어드레스는 업데이트(update)될 수 있다.
세그먼트 정보 테이블(Segment Information Table)(64)은 각 세그먼트 내에 포함 된 라이브 블록의 개수와, 각 블록이 라이브 블록인지 여부를 나타내는 비트맵(640)을 포함한다. 비트맵(640)을 구성하는 각 비트는 대응 되는 각 블록이 라이브 블록인지 여부를 나타낸다. 세그먼트 정보 테이블(64)은 세그먼트 클리닝 작업에서 사용될 수 있다. 즉, 파일 시스템 모듈(103)은 빅팀 세그먼트 내에 포함 된 라이브 블록을 식별하기 위하여 세그먼트 정보 테이블(64)에 포함 된 상기 비트맵을 참조할 수 있다.
세그먼트 정보 테이블(64)은 빅팀 세그먼트를 선정하는 용도로도 참조될 수 있다. 즉, 세그먼트 내에 포함된 블록들 중 라이브 블록의 갯수가 몇 개인지 또는 라이브 블록의 비율이 몇 개인지에 따라 상기 빅팀 세그먼트가 선정될 수 있다.
세그먼트 요약 영역(Segment Summary Area)(66)은 제2 영역(40)의 각 세그먼트에 포함 된 각 블록이 속하는 부모 노드의 식별자를 기술한다.
다이렉트 노드 블록(81~88)은 자신의 자식 블록인 데이터 블록(70)에 대한 접근을 위하여, 각 데이터 블록(70)의 어드레스 정보를 가진다. 반면, 인다이렉트 노드 블록(91~95)은 자신의 자식 노드 블록에 대한 접근을 위하여, 자신의 각 자식 노드의 식별자 목록을 가진다. 특정 노드 블록의 식별자를 알게 되면, 노드 어드레스 테이블(65)을 조회하여 그 물리 어드레스도 알 수 있다.
한편, 로그 구조화된 파일시스템에서는 데이터 블록에 쓰여진 데이터를 기존의 저장 위치에서 다른 값으로 오버라이트(overwrite)하지 않고, 로그 끝에 갱신 된 데이터를 가진 새로운 데이터 블록을 라이트하는 방식을 취한다. 따라서, 기존 데이터 블록의 부모 노드 블록 역시 데이터 블록에 대한 어드레스를 수정해야 한다. 따라서, 특정 데이터 블록을 오버라이트하거나, 세그먼트 클리닝 단계에서 로그 끝으로 라이트-백 하는 경우, 그 데이터 블록의 부모 노드에 대한 정보가 필요하다. 그러나, 각 데이터 블록 또는 각 노드 블록은 자신의 부모 노드에 대한 정보를 알기 어렵다. 따라서, 본 발명에 따른 F2FS 파일 시스템은 각 데이터 블록 또는 각 노드 블록이 자신의 부모 노드 블록의 식별자를 확인할 수 있는 인덱스(index)가 기재된 세그먼트 요약 영역(66)을 두어, 데이터 블록 또는 노드 블록이 부모 노드 블록의 식별자를 쉽게 알 수 있도록 한다.
하나의 세그먼트 요약 블록은, 제2 영역(40)에 위치한 하나의 세그먼트에 대한 정보를 가지고 있다. 또한, 세그먼트 요약 블록은 다수의 요약 정보로 구성되어 있으며, 하나의 요약 정보는 하나의 데이터 블록 또는 하나의 노드 블록에 대응된다.
제2 영역(40)은 도 10a에 도시된 바와 같이, 서로 분리된 데이터 세그먼트(data segment)(DS0, DS1)과 노드 세그먼트(node segment)(NS0, NS1)을 포함할 수 있다. 다수의 데이터는 데이터 세그먼트(DS0, DS1)에 저장되고, 다수의 노드는 노드 세그먼트(NS0, NS1)에 저장될 수 있다. 데이터와 노드가 분리되는 영역이 서로 다르면, 효율적으로 세그먼트를 관리할 수 있고, 데이터를 리드할 때 보다 효과적으로 빠른 시간 내에 리드할 수 있다.
도면에서는, 제1 영역(30)은 슈퍼블록(61, 62), 체크 포인트 영역(62), 세그먼트 정보 테이블(64), 노드 어드레스 테이블(65), 세그먼트 요약 영역(66) 순서로 되어 있으나, 이에 한정되는 것은 아니다. 예를 들어, 세그먼트 정보 테이블(64)과 노드 어드레스 테이블(65)의 위치가 바뀌어도 무방하고, 노드 어드레스 테이블(65)과 세그먼트 요약 영역(66)의 위치가 바뀌어도 무방하다.
F2FS 파일 시스템은 스토리지 장치(20)의 저장 영역을 도 10b에 도시된 것과 같이 구성할 수도 있다. 도 10b를 참조하면, 본 발명의 다른 실시예에 따른 컴퓨팅 시스템의 스토리지 장치에서, 제2 영역(40)은 서로 분리된 다수의 세그먼트(S1~Sn, 단, n은 자연수)를 포함할 수 있다. 각 세그먼트(S1~Sn)에는, 데이터와 노드 구분없이 저장될 수 있는 점에서, 데이터 세그먼트와 노드 세그먼트가 별도로 관리되는 도 10a와 다르다.
F2FS 파일 시스템은 스토리지 장치(20)의 저장 영역을 도 10c에 도시된 것과 같이 구성할 수도 있다. 도 10c를 참조하면, 제1 영역(30)은 세그먼트 요약 영역(도 10a의 66 참조)을 포함하지 않는다. 즉, 제1 영역(30)은 슈퍼블록(61, 62), 체크 포인트 영역(62), 세그먼트 정보 테이블(64), 노드 어드레스 테이블(65)을 포함한다. 대신, 세그먼트 요약 정보는 제2 영역(40)내에 저장될 수 있다. 구체적으로, 제2 영역(40)은 다수의 세그먼트(S0~Sn)를 포함하고, 각 세그먼트(S0~Sn)는 다수의 블록으로 구분된다. 각 세그먼트(S0~Sn)의 적어도 하나의 블록(SS0~SSn)에 세그먼트 요약 정보가 저장될 수 있다.
F2FS 파일 시스템은 스토리지 장치(20)의 저장 영역을 도 10d에 도시된 것과 같이 구성할 수도 있다. 도 10d를 참조하면, 도 10c와 마찬가지로, 제1 영역(30)은 세그먼트 요약 영역(도 10a의 66 참조)을 포함하지 않는다. 즉, 제1 영역(30)은 슈퍼블록(61, 62), 체크 포인트 영역(62), 세그먼트 정보 테이블(64), 노드 어드레스 테이블(65)을 포함한다. 세그먼트 요약 정보는 제2 영역(40) 내에 저장될 수 있다. 제2 영역(40)은 다수의 세그먼트(53)를 포함하고, 각 세그먼트(53)는 다수의 블록(BLK0~BLKm)으로 구분되고, 각 블록(BLK0~BLKm)은 OOB(Out Of Band)(OOB1~OOBm, 단, m은 자연수) 영역을 포함할 수 있다. OOB 영역(OOB1~OOBm)에 세그먼트 요약 정보를 저장할 수 있다.
이하에서, 도 12a 및 도 12b를 이용하여, F2FS 파일 시스템이 데이터 갱신 작업을 수행하는 것을 설명하도록 한다. 도 12a 내지 12b는 도 1의 스토리지 장치에 저장되는 데이터가 갱신 되고, 그에 따라 비트맵(640)도 갱신되는 과정을 설명하기 위한 개념도이다. 도 12a는 데이터 갱신 전에 FILE 0가 "ABC"라는 데이터를 저장하고 있는 것을 도시하고, 도 12b는 어플리케이션이 FILE 0에 대한 "ADC"로의 갱신을 명령함에 따라, FILE 0가 "ADC"라는 데이터를 저장하게 되는 것을 도시한다. F2FS 파일 시스템은 도 9에 도시된 것과 같은 형태로 FILE 0를 위한 노드 및 데이터 블록을 구성하나, 도 12a 및 도 12b에서는 설명의 편의를 위하여, 아이노드가 하나의 다이렉트 노드(N0)를 가리키고, 다이렉트 노드(N0)는 세개의 데이터 블록을 가리키는 것으로 FILE 0가 구성된다고 가정하고 설명한다.
먼저, 도 12a를 참조하면, 로그 영역(41) 내의 제1 데이터 세그먼트(DS0)에 제1 내지 3 데이터 블록(BLK 0, BLK 1, BLK 2)이 포함 된다. 제1 데이터 블록(BLK 0)에는 "A", 제2 데이터 블록(BLK 1)에는 "B", 제3 데이터 블록(BLK 2)에는 "C"가 각각 저장된다고 가정한다. 도 9a에 도시된 것과 달리 제1 데이터 세그먼트(DS0)에는 제1 내지 3 데이터 블록뿐만 아니라 더 많은 데이터 블록이 포함될 수 있다.
로그 영역(41) 내의 제1 노드 세그먼트(NS0)에 상기 다이렉트 노드(N0) 블록이 포함될 수 있다. 상기 다이렉트 노드(N0) 블록에는 적어도 노드의 식별자(N0), 제1 내지 3 데이터 블록에 대한 물리 어드레스 정보가 저장될 수 있다. 도 122a에 도시된 것과 같이, 상기 다이렉트 노드(N0) 블록의 물리 어드레스는 "a"이다.
도 12a에 도시된 것과 같이, 비트맵(640)은 제1 데이터 블록(BLK 0)에 대응되는 비트(6400), 제2 데이터 블록(BLK 1)에 대응되는 비트(6401), 제3 데이터 블록에 대응되는 비트(6402) 및 다이렉트 노드(N0)에 대응되는 비트(6403)를 포함한다. 제1 내지 3 데이터 블록은 모두 유효한 데이터를 저장하고 있는 라이브 블록이므로, 비트맵(640)의 제1 내지 3 데이터 블록에 대응되는 비트(6400, 6401, 6402)에는 라이브 블록임을 가리키는 값(예를 들어, "1", 이하 동일)이 세팅될 수 있다. 또한, 다이렉트 노드(N0) 블록도 유효한 데이터를 저장하고 있는 라이브 블록이므로, 비트맵(640)의 다이렉트 노드 블록에 대응되는 비트(6403)에도 라이브 블록임을 가리키는 값이 세팅될 수 있다.
한편, NAT에는 상기 다이렉트 노드 블록의 식별자인 N0와 N0의 물리 어드레스인 "a"가 저장될 수 있다.
도 12b를 참조하여, 데이터가 갱신 된 FILE 0의 구성을 설명한다.
어플리케이션이 FILE 0의 "ABC"를 "ADC"로 갱신할 것을 명령했으므로, "B"를 저장하는 제2 데이터 블록(BLK 1)이 갱신되어야 한다. F2FS 파일 시스템은, 제2 데이터 블록(BLK 1)에 저장 되어 있는 "B"를 "D"로 갱신하는 대신, "D"를 저장하는 신규의 제4 데이터 블록(BLK 3)을 로그 영역(41)의 끝에 위치한 제2 데이터 세그먼트(DS1)에 저장한다. 즉, 갱신 후의 FILE 0는 제0 데이터 블록(BLK 0), 제4 데이터 블록(BLK 3) 및 제2 데이터 블록(BLK 2)으로 구성된다. 이에 따라, 상기 다이렉트 노드(N0) 블록 역시 두번째 데이터 블록을 가리키는 물리 어드레스 정보가 제4 데이터 블록의 물리 어드레스 정보로 갱신되어야 한다. F2FS 파일 시스템은, 기존에 저장되어 있던 노드 N0의 자식 블록 물리 어드레스 정보를 갱신하는 것 대신, 제0 데이터 블록(BLK 0), 제4 데이터 블록(BLK 3) 및 제2 데이터 블록(BLK 2)의 물리 어드레스 정보를 자식 블록의 어드레스 정보로 가지되, 노드 식별자는 N0로 동일한 새로운 노드 블록을 생성한다. 새로운 노드 블록은 로그 영역(41)의 끝에 위치한 제2 노드 세그먼트에 포함될 수 있다.
제4 데이터 블록 및 제2 노드 세그먼트에 포함되는 노드 N0 블록이 새로 라이트 됨에 따라, 제4 데이터 블록(BLK 3)에 대응되는 비트(6404) 및 제2 노드 세그먼트에 포함되는 새로 쓰여진 노드 블록에 대응되는 비트(6405)의 값도 라이브 블록을 가리키는 값으로 세팅된다.
한편, 제2 데이터 블록(BLK 1) 및 제1 노드 세그먼트에 포함된 노드 N0 블록은 더 이상 유효한 데이터가 아니므로, 제2 데이터 블록에 대응되는 비트(6401) 및 제1 노드 세그먼트에 포함된 노드 N0 블록에 대응되는 비트(6403)의 값은 무효 블록을 가리키는 값(예를들어, "0", 이하 동일)으로 세팅된다.
노드 블록 N0의 물리 어드레스는 "a"에서 "f"로 바뀌게 된다. 종래의 로그 구조화된 파일 시스템에 따르면, 노드 블록 N0의 부모 노드인 인다이렉트 노드에 포함 된 노드 블록 N0의 물리 어드레스 정보도 수정되어야할 것이다. 또, 상기 인다이렉트 노드 역시 새로운 노드 블록에 쓰여질 것이므로, 노드 블록의 갱신 작업은 부모 노드 블록으로 아이노드에 이를 때까지 계속 전이된다. 이러한 문제를 wandering tree 문제라 한다. Wandering tree 문제는 불필요하게 너무 많은 노드들이 새로 쓰여지도록 하므로, 순차적 접근 라이트의 라이트 효율화 효과를 희석시킬 수 있다.
본 발명에 따른 F2FS 파일 시스템은 데이터 블록의 갱신으로 인하여, 다이렉트 노드 블록이 새로 쓰여져야 하는 경우, 노드 어드레스 테이블(65) 내에서 다이렉트 노드에 대응되는 물리 어드레스를 수정하기만 하면되고("a"에서 "f"로), 노드 블록의 갱신 작업은 다이렉트 노드 이상으로 전이되지 않는다. 따라서, 본 발명에 따른 F2FS 파일 시스템은 종래의 로그 구조화된 파일 시스템에서 발생하는 wandering tree 문제를 해결한다.
이하, 도 13a 내지 13e를 참조하여 본 발명에 따른 F2FS 파일 시스템이 세그먼트 클리닝을 수행하는 과정을 설명한다.
도 13a를 참조하면, 로그 영역(41)에 세그먼트 S0 내지 세그먼트 S9가 포함되어 있다. 프리 영역(42)이 기준치 보다 좁게 형성되어 있는 등의 이유로 세그먼트 클리닝 작업이 개시된다. 먼저, 로그 영역(41)에 포함 되어 있는 세그먼트들 중 빅팀 세그먼트가 선정된다.
빅팀 세그먼트가 선정되는 과정은, 세그먼트 S0 내지 S9가 속한 세그먼트 그룹에 대응되는 빅팀 포인트 연산 수식을 각 세그먼트에 적용하여 빅팀 포인트를 연산하고 상기 빅팀 포인트를 기준으로 하여 상기 빅팀 세그먼트를 선정하는 것을 포함한다. 도 13a에서는 세그먼트 S1, S3, S5, S6가 빅팀 세그먼트로 선정된 상황을 도시한다.
도 13a에는 후기입 캐쉬(104)도 도시되어 있다. 후기입 캐쉬(104)에는 세그먼트 S3, S5, S6에 포함된 라이브 블록들(LB3, LB5, LB6)이 기 적재되어 있는 것으로 도시되어 있다. 후기입 캐쉬(104)의 각 엔트리에 저장되어 있는 데이터에 대응하는 더티 비트(Dirty bit)도 도시되어 있다. 후기입 캐쉬(104)는 플러쉬(flush)를 진행할 때, 더티 비트가 세팅되어 있는 엔트리에 적재되어 있는 데이터들을 스토리지 장치(20)에 라이트-백(write-back)한다.
다음으로, F2FS 파일 시스템은, 빅팀 세그먼트에 포함된 라이브 블록들이 후기입 캐쉬(104)에 기 적재되어 있는지 조회한다. 각 빅팀 세그먼트의 라이브 블록은 세그먼트 정보 테이블(SIT)(64)에 포함된 비트맵(640)을 참조하여 신속하게 식별될 수 있다.
또한, 후기입 캐쉬(104)는 각 엔트리에 저장된 데이터 블록들이 속한 파일의 식별자 및 데이터 블록들의 상기 파일 내에서의 위치를 나타내는 오프셋 정보를 관리하므로, F2FS 파일 시스템은 상기 라이브 블록의 파일 식별자 및 오프셋 정보를 이용하여, 상기 라이브 블록의 적재 여부를 후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)에 조회할 수 있다. F2FS 파일 시스템은, 각 라이브 블록의 부모 노드 식별자를 세그먼트 요약 영역(66)에서 조회하고, 노드 어드레스 테이블(65)에서 상기 부모 노드 식별자에 대응하는 물리 어드레스를 얻고, 상기 물리 어드레스에 저장된 상기 부모 노드 블록에서, 상기 라이브 블록이 소속된 파일의 식별자 및 상기 라이브 블록의 상기 오프셋 정보를 얻을 수 있다.
도 13a에 도시된 바와 같이, 빅팀 세그먼트 S1, S3, S5, S6에 포함된 라이브 블록들 중, S3, S5, S6의 라이브 블록인 LB3, LB5, LB6는 후기입 캐쉬(104)에 기 적재되어 있으나, S1의 라이브 블록인 LB1은 아직 후기입 캐쉬(104)에 적재되어 있지 않은 상황이다. 따라서, F2FS 파일 시스템은, LB1을 스토리지 장치(20)로부터 리드하고, 리드 된 LB1을 후기입 캐쉬(104)에 적재하도록, 후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)에 요청한다. 이러한 과정은 도 13b에 도시되어 있다.
다음으로, F2FS 파일 시스템은, 기 적재 되어 있었거나, 새로 적재된 상기 라이브 블록들에 대응하는 더티 플래그가 세팅되도록, 후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)에 요청한다.
이미 언급한 바와 같이, 후기입 캐쉬(104)는 플러쉬 시점에 더티 플래그가 세팅되어 있는 엔트리에 저장된 데이터를 일괄적으로 스토리지 장치(20)에 라이트-백 한다. 따라서, 빅팀 세그먼트에 포함된 라이브 블록들이 후기입 캐쉬(104)에 적재된 시점과 상기 라이트-백이 수행되는 시점 사이에는 다소 시간 차가 존재할 수 있다. 도 13c에 도시된 바와 같이, 상기 라이트-백이 수행되기 전에 애플리케이션의 명령에 의하여 상기 파일에 대한 데이터 추가(append) 명령이 호출될 수 있다. 후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)은, 상기 데이터 추가 명령에 따라 추가되어야 하는 블록(BLK A, BLK B)을 바로 스토리지 장치(20)에 추가하는 것이 아니라, 후기입 캐쉬(104)에 입력할 수 있다. 도 13c에 도시된 바와 같이, BLK A, BLK B는 스토리지 장치(104)에 저장되어 있지 않은 상태이므로, 더티 비트가 세팅된다.
도 13d에 도시된 바와 같이, 후기입 캐쉬(104)의 플러쉬 타임이 되면, 후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)은 후기입 캐쉬(104)에 적재되어 있는 데이터 중, 더티 비트가 세팅되어 있는 데이터를 스토리지 장치(20)에 라이트-백 한다.
후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)은 상기 라이브 블록만으로 구성된 클린 세그먼트 S10를 로그 영역(41) 끝에 라이트-백 하고, 데이터 추가 명령에 따라 추가되어야 하는 블록 BLK A, BLK B를 세그먼트 S11에 포함시켜 라이트-백 할 수 있다. 도 13d에 도시된 것과 달리, 하나의 세그먼트에 포함될 수 있는 블록의 수에 여유가 있다면, 세그먼트 S10에 상기 라이브 블록들뿐만 아니라, BLK A, BLK B도 포함될 수 있다.
후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)은 상기 클린 세그먼트 S10 및 세그먼트 S11을 라이트 한 것이 반영되도록, 비트맵(640)을 갱신할 수 있다. 즉, 상기 클린 세그먼트 S10에 포함된 상기 라이브 블록에 대응되는 비트와 상기 세그먼트 S11에 포함된 BLK A에 대응되는 비트와 BLK B에 대응되는 비트가 라이브 블록을 가리키는 값으로 세팅될 수 있다.
한편, 상기 라이트-백에 따라 빅팀 세그먼트 S1, S3, S5, S6은 프리 영역(42)으로 환원될 수 있다. 후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)은 상기 빅팀 세그먼트들이 프리 영역(42)으로 환원된 것이 반영되도록, 비트맵(640)을 갱신할 수 있다. 즉, 빅팀 세그먼트 S1, S3, S5, S6에 포함되는 모든 블록에 대응 되는 비트들이 모두 무효 블록을 가리키는 값으로 세팅될 수 있다.
후기입 캐쉬(104)를 관리하는 메모리 관리 모듈(15) 또는 가상 파일 시스템(14)은 라이트-백 될 데이터를 같은 파일에 포함된 데이터끼지 모아서 라이트-백한다. 따라서, 라이트-백 된 후에는 하나의 파일에 속한 데이터가 인접하여 배치될 수 있는 효과가 있다.
도 13a 및 도 13d를 비교하여 설명하면, 본 발명에 따른 세그먼트 클리닝 이전에는 4개의 빅팀 세그먼트가 로그 영역(41)에 포함되어 있었으나, 상기 클리닝 결과 상기 4개의 빅팀 세그먼트에 포함되어 있던 라이브 블록이 하나의 클린 세그먼트 S10으로 통합되어 3개의 세그먼트가 새로 프리 영역으로 반환될 수 있다.
본 발명에 따른 세그먼트 클리닝 이전에는 로그 영역(41)이 하나의 연결된 영역으로 구성되어 있었으나, 세그먼트 클리닝 결과, 로그 영역(41)에 포함되어 있던 빅팀 세그먼트들이 프리 영역으로 반환됨으로써, 도 13e에 도시된 것과 같이 로그 영역(41)이 둘 이상의 분할된 영역으로 구성된다. 도 13e와 같이 로그 영역(41) 및 프리 영역(42)이 구성된 상태에서, 추가로 세그먼트가 기록되어야 하는 경우, 일단 로그의 끝에 위치한 프리 영역(42)에 세그먼트가 기록되고, 스토리지 장치(20)의 저장 영역 끝에 이른 경우, 다시 제2 영역(40)의 처음부터 프리 영역(42)을 찾게된다. 세그먼트 S1, S3, S5, S6는 프리 영역(42)으로 반환 된 것이므로, S1, S3, S5, S6 세그먼트에 새로운 데이터 또는 노드 블록들이 순차적 접근 방식으로 라이트될 수 있다.
이하에서, 본 발명의 몇몇 실시예에 따른 컴퓨팅 시스템이 적용될 수 있는 구체적인 시스템을 설명한다. 이하에서 설명되는 시스템은 예시적인 것에 불과하고, 이에 한정되는 것은 아니다.
도 14 내지 도 16은 본 발명의 몇몇 실시예에 따른 컴퓨팅 시스템의 구체적인 다른 예를 설명하기 위한 블록도이다.
우선, 도 14를 참조하면, 스토리지 장치(20)는 비휘발성 메모리 장치(22) 및 컨트롤러(21)를 포함할 수 있다.
비휘발성 메모리 장치(22)는 컨트롤러(21)의 제어에 따라 데이터를 리드/라이트(read/write)하고, 랜덤 접근(random access) 방식으로 라이트(write)되는 제1 영역(30) 및 순차적 접근(sequential access) 방식으로, 복수의 블록으로 구성되는 복수의 세그먼트가 라이트 되는 제2 영역(40)으로 저장 영역이 구성된다. 제2 영역(40)은 상기 복수의 세그먼트가 저장 된 로그 영역 및 세그먼트가 저장 될 수 있는 프리 영역으로 구성되고, 제1 영역(30)에는 제2 영역(40)에 저장된 데이터에 대한 메타 데이터가 저장되고, 상기 메타 데이터는 대응 블록의 라이브 여부를 가리키는 비트맵(640)을 포함한다. 비트맵(640)은 세그먼트 클리닝 프로세스에서 빅팀 세그먼트(victim segment) 내의 라이브 블록(live block)을 식별하기 위해 참조되는 데이터이다.
여기서, 비휘발성 메모리 장치(22)의 제1 영역(30)에는, 전술한 슈퍼블록(61, 62), 체크 포인트 영역(63), 세그먼트 정보 테이블(64), 노드 어드레스 테이블(65) 등이 상기 메타 데이터로써 저장되어 있을 수 있다. 세그먼트 정보 테이블(64)에는 비트맵(640)이 포함된다.
비트맵(640)을 구성하는 비트와 상기 블록은 일대일 대응한다.
컨트롤러(21)는 호스트 장치(10) 및 비휘발성 메모리 장치(22)에 연결된다. 호스트 장치(10)로부터의 요청에 응답하여, 컨트롤러(21)는 비휘발성 메모리 장치(22)를 액세스하도록 구성된다. 예를 들면, 컨트롤러(21)는 비휘발성 메모리 장치(22)의 리드, 라이트, 이레이즈, 그리고 백그라운드(background) 동작을 제어하도록 구성된다. 컨트롤러(21)는 비휘발성 메모리 장치(22) 및 호스트(Host) 사이에 인터페이스를 제공하도록 구성된다. 컨트롤러(21)는 비휘발성 메모리 장치(22)를 제어하기 위한 펌웨어(firmware)를 구동하도록 구성된다.
컨트롤러(21)는, 상기 세그먼트 클리닝 프로세스의 진행 중, 호스트 장치(10)의 제어에 따라 상기 로그 영역의 끝에 위치한 프리 영역에 상기 라이브 블록으로 구성 된 클린 세그먼트를 라이트-백하고, 비트맵(640)을 업데이트 하되, 상기 비트맵에 포함된 비트 중, 상기 빅팀 세그먼트 내의 라이브 블록 위치에 대응하는 비트를 무효 블록을 의미하는 값으로 세팅하고, 비트맵(640)에 포함된 비트 중, 상기 클린 세그먼트 내의 라이브 블록 위치에 대응하는 비트를 라이브 블록을 의미하는 값으로 세팅할 수 있다.
예시적으로, 컨트롤러(21)는 램(RAM, Random Access Memory), 프로세싱 유닛(processing unit), 호스트 인터페이스(host interface), 그리고 메모리 인터페이스(memory interface)와 같은 잘 알려진 구성 요소들을 더 포함한다. 램(RAM)은 프로세싱 유닛의 동작 메모리, 비휘발성 메모리 장치(22) 및 호스트 장치(10) 사이의 캐쉬 메모리, 그리고 비휘발성 메모리 장치(22) 및 호스트 장치(10) 사이의 버퍼 메모리 중 적어도 하나로서 이용된다. 프로세싱 유닛은 컨트롤러(21)의 제반 동작을 제어한다.
컨트롤러(21)는 버퍼(210)를 구비한 것일 수 있다. 버퍼(210)는 예를 들어 램(RAM, Random Access Memory), 특히 D램으로 구성될 수 있다.
컨트롤러(21) 및 비휘발성 메모리 장치(22)는 하나의 반도체 장치로 집적될 수 있다. 예시적으로, 컨트롤러(21) 및 비휘발성 메모리 장치(22)는 하나의 반도체 장치로 집적되어, 메모리 카드를 구성할 수 있다. 예를 들면, 컨트롤러(21) 및 비휘발성 메모리 장치(22)는 하나의 반도체 장치로 집적되어 PC 카드(PCMCIA, personal computer memory card international association), 컴팩트 플래시 카드(CF), 스마트 미디어 카드(SM, SMC), 메모리 스틱, 멀티미디어 카드(MMC, RS-MMC, MMCmicro), SD 카드(SD, miniSD, microSD, SDHC), 유니버설 플래시 기억장치(UFS) 등과 같은 메모리 카드를 구성할 것이다.
컨트롤러(21) 및 비휘발성 메모리 장치(22)는 하나의 반도체 장치로 집적되어 SSD(Solid State Drive)를 구성할 수 있다. SSD는 반도체 메모리에 데이터를 저장하도록 구성되는 저장 장치를 포함한다. 호스트 장치(10)에 SSD가 연결되는 경우, 호스트 장치(10)의 동작 속도는 획기적으로 개선될 수 있다.
예시적으로, 비휘발성 메모리 장치(22) 또는 스토리지 장치(20)는 다양한 형태들의 패키지로 실장될 수 있다. 예를 들면, 비휘발성 메모리 장치(22) 또는 스토리지 장치(20)는 PoP(Package on Package), Ball grid arrays(BGAs), Chip scale packages(CSPs), Plastic Leaded Chip Carrier(PLCC), Plastic Dual In Line Package(PDIP), Die in Waffle Pack, Die in Wafer Form, Chip On Board(COB), Ceramic Dual In Line Package(CERDIP), Plastic Metric Quad Flat Pack(MQFP), Thin Quad Flatpack(TQFP), Small Outline(SOIC), Shrink Small Outline Package(SSOP), Thin Small Outline(TSOP), Thin Quad Flatpack(TQFP), System In Package(SIP), Multi Chip Package(MCP), Wafer-level Fabricated Package(WFP), Wafer-Level Processed Stack Package(WSP) 등과 같은 방식으로 패키지화되어 실장될 수 있다.
이어서, 도 15를 참조하면, 스토리지 장치(20)는 비휘발성 메모리 장치(24) 및 컨트롤러(23)를 포함할 수 있다. 비휘발성 메모리 장치(24)는 복수의 비휘발성 메모리 칩들을 포함한다. 복수의 비휘발성 메모리 칩들은 복수의 그룹들로 분할된다. 복수의 비휘발성 메모리 칩들의 각 그룹은 하나의 공통 채널을 통해 컨트롤러(23)와 통신하도록 구성된다. 예를 들어, 복수의 비휘발성 메모리 칩들은 제 1 내지 제 k 채널들(CH1~CHk)을 통해 컨트롤러(23)와 통신하는 것으로 도시되어 있다.
도 15에서, 하나의 채널에 복수의 비휘발성 메모리 칩들이 연결되는 것으로 설명되었다. 그러나, 하나의 채널에 하나의 비휘발성 메모리 칩이 스토리지 장치(20)가 변형될 수 있음이 이해될 것이다.
이어서, 도 16을 참조하면, 시스템(3000)은 중앙 처리 장치(3100), 램(3200, RAM, Random Access Memory), 사용자 인터페이스(3300), 전원(3400), 그리고 도 12의 스토리지 장치(20)를 포함할 수 있다.
시스템(3000)은 시스템 버스(3500)를 통해, 중앙처리장치(3100), 램(3200), 사용자 인터페이스(3300), 그리고 전원(3400)에 전기적으로 연결된다. 사용자 인터페이스(3300)를 통해 제공되거나, 중앙 처리 장치(3100)에 의해서 처리된 데이터는 시스템(3000)에 저장된다.
도 16에서, 비휘발성 메모리 장치(24)는 컨트롤러(23)를 통해 시스템 버스(3500)에 연결되는 것으로 도시되어 있다. 그러나, 비휘발성 메모리 장치(24)는 시스템 버스(3500)에 직접 연결되도록 구성될 수도 있다.
이하, 본 발명의 일 실시예에 따른 비트맵을 이용한 세그먼트 클리닝 방법에 대하여 도 17 내지 20을 참조하여 설명한다. 도 17은 본 실시예에 따른 비트맵을 이용한 세그먼트 클리닝 방법의 순서도이다.
먼저, 로그 영역에 포함 된 세그먼트들 중 프리 영역으로 환원할 빅팀 세그먼트를 선정한다(S102). 본 실시예에 따른 빅팀 세그먼트 선정 방법에 대하여 도 18 내지 20을 참조하여 보다 자세히 설명한다.
빅팀 세그먼트 선정에 관한 일 실시예에 대하여, 도 18을 참조하여 설명한다.
로그 영역에 포함된 전체 세그먼트에 대하여, 도 18에 도시된 동작이 수행된다. 즉, 각각의 세그먼트가 속한 세그먼트 그룹을 세그먼트 어드레스 등을 통하여 식별하고(S1022), 제1 세그먼트 그룹인 경우 제1 빅팀 포인트 연산 수식에 의하고(S1024), 제2 세그먼트 그룹 또는 제3 세그먼트 그룹인 경우 제2 빅팀 포인트 연산 수식에 의하여(S1026) 빅팀 포인트를 연산한다. 로그 영역에 포함된 전체 세그먼트 중, 상기 빅팀 포인트를 기준으로 소정 개수의 빅팀 세그먼트가 선정된다.
빅팀 세그먼트 선정에 관한 다른 실시예에 대하여, 도 19를 참조하여 설명한다. 도 19에 도시된 실시예는 도 18에 도시된 것과는 달리, 제1 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트가 선정되고(S1030), 제2, 3 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트가 선정될 수 있다(S1031). 도 19에 도시된 실시예는 제1 빅팀 포인트 연산 수식과 제2 빅팀 포인트 연산 수식 간의 포인트 산정 불균형에 의하여 제1 세그먼트 그룹과 제2, 3 세그먼트 그룹 중 어느 한쪽에서 빅팀 세그먼트가 많이 선정되는 것을 방지할 수 있는 효과가 있다.
빅팀 세그먼트 선정에 관한 또 다른 실시예에 대하여, 도 20을 참조하여 설명한다. 도 20에 도시된 실시예는 도 19에 도시된 것과는 달리, 제2 세그먼트 그룹 내에서 소정 개수의 빅팀 세그먼트가 선정되고(S1032), 3 세그먼트 그룹 내에서도 소정 개수의 빅팀 세그먼트가 선정될 수 있다(S1033). 도 20에 도시된 실시예에 따르면, 제1 내지 3 세그먼트 그룹 내에서 기 지정된 개수의 빅팀 세그먼트가 선정되는 것이 보장되는 효과가 있다.
다시, 도 17으로 돌아가서 설명한다. 상기 빅팀 세그먼트에 포함된 블록들 중, 유효 데이터가 저장된 라이브 블록을 식별한다(S104). 특정 블록이 라이브 블록인지 여부는, 로그 영역과 다른 영역에 저장된 메타데이터 중, 각 블록이 라이브 블록인지 여부를 가리키는 비트맵 데이터를 참조하여 신속하게 식별할 수 있다.
다음으로, 식별된 각각의 라이브 블록이 후기입 캐쉬에 기 적재되어 있는지 조회한다(S106). 상기 각각의 라이브 블록의 파일 식별자 및 오프셋 정보는 상기 라이브 블록의 부모 노드에서 얻을 수 있고, 상기 부모 노드에 대한 정보는 상기 메타데이터에서 얻을 수 있다. 상기 파일 식별자 및 오프셋 정보를 이용하여 상기 기 적재 여부를 조회할 수 있다.
상기 라이브 블록이 상기 후기입 캐쉬에 기 적재되어 있지 않은 경우, 상기 라이브 블록을 리드하고(S108), 상기 후기입 캐쉬에 적재한다(S110).
다음으로, 캐쉬에 적재된 상기 라이브 블록들에 대한 더티 비트의 세팅을 상기 후기입 캐쉬를 관리하는 모듈에 요청한다(S112). 그 결과, 상기 후기입 캐쉬의 플리쉬 시점에, 상기 후기입 캐쉬가 상기 적재된 라이브 블록들을 로그 영역의 끝에 라이트-백 해준다(S118). 즉, 직접 세그먼트 클리닝에 필요한 라이트-백을 하지 않아도 되고, 후기입 캐쉬 자체 기능에 의하여 같은 파일에 속한 블록이 인접하여 라이트-백 되는 효과도 거둘 수 있다.
후기입 캐쉬의 특성 상, 상기 라이브 블록의 적재 시점과 플러쉬 시점 사이에 시간 차이가 있을 수 있다. 세그먼트 클리닝의 타입이 백그라운드 타입인 경우에 상기 시간 차이가 용인될 수 있으나, 프리 영역의 부족으로 수행 되는 긴급(ON-DEMAND) 타입인 경우에는, 상기 플러쉬 시점까지 기다리면 라이트 작업이 지연될 수 있다. 따라서, 본 실시예에 따르면, 세그먼트 클리닝 타입이 긴급 타입인 경우, 상기 후기입 캐쉬에 바로 라이트-백 해줄 것을 요청할 수 있다(S116). 라이트-백(S116)이 진행된 후, 상기 빅팀 세그먼트의 프리 영역으로의 반환 및 상기 라이브 블록의 라이트-백을 상기 비트맵에 반영할 수 있다. 즉, 상기 비트맵에 포함된 비트 중, 상기 빅팀 세그먼트 내의 라이브 블록 위치에 대응하는 비트를 무효 블록을 의미하는 값으로 세팅하고, 상기 비트맵에 포함된 비트 중, 상기 클린 세그먼트 내의 라이브 블록 위치에 대응하는 비트를 라이브 블록을 의미하는 값으로 세팅할 수 있다.
후기입 캐쉬의 플러쉬에 의한 라이트-백(S118)이 이뤄지는 경우에도 상기 빅팀 세그먼트의 프리 영역으로의 반환 및 상기 라이브 블록의 라이트-백이 상기 비트맵에 반영된다.
이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

Claims (10)

  1. 스토리지 장치와의 데이터 송수신을 중계하는 인터페이스; 및
    상기 스토리지 장치에 저장 된 복수의 세그먼트(segment) 중 빅팀(victim) 세그먼트를 선정하고, 상기 빅팀 세그먼트 내의 라이브 블록을 식별하며, 상기 식별된 라이브 블록을 상기 인터페이스를 통하여 상기 스토리지 장치에 라이트-백 하고 상기 빅팀 세그먼트를 프리 영역으로 환원하는 세그먼트 클리닝을 수행하는 파일 시스템 모듈을 포함하되,
    상기 파일 시스템 모듈은, 상기 복수의 세그먼트 중 일부로 구성된 제1 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제1 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고, 상기 복수의 세그먼트 중 적어도 다른 일부로 구성된 제2 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하며, 상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정하는 호스트 장치.
  2. 제1 항에 있어서,
    상기 제1 세그먼트 그룹은 신규로 라이트 된 데이터를 포함하는 세그먼트들로 구성되는 것인 호스트 장치.
  3. 제2 항에 있어서,
    상기 제2 세그먼트 그룹은 상기 제1 세그먼트 그룹 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성되는 것인 호스트 장치.
  4. 제2 항에 있어서,
    상기 제2 세그먼트 그룹은 상기 라이트-백 된 데이터를 포함하는 것인 호스트 장치.
  5. 제1 항에 있어서,
    상기 제1 세그먼트 그룹은 제1 어드레스 영역 내에 위치하는 세그먼트들로 구성되고, 상기 제2 세그먼트 그룹은 제1 어드레스 영역과 다른 제2 어드레스 영역 내에 위치하는 세그먼트들로 구성되는 호스트 장치.
  6. 제1 항에 있어서,
    상기 제1 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율(u)과, 상기 세그먼트에 포함된 블록 중 가장 최근에 수정된 블록의 수정 시각을 이용하여 산출된 에이지(age)를 이용하는 것인 호스트 장치.
  7. 제1 항에 있어서,
    상기 제2 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록(block) 중 라이브 블록의 수를 상기 세그먼트에 포함된 전체 블록의 수로 나눈 값을 이용한 것인 호스트 장치.
  8. 제1 항에 있어서,
    상기 파일 시스템 모듈은,
    상기 빅팀 포인트를 기준으로, 하나의 섹션 당 소정 개수의 빅팀 세그먼트를 선정하되,
    상기 섹션은 소정 개수의 세그먼트로 구성되는 것인 호스트 장치.
  9. 스토리지 장치에 저장 된 복수의 세그먼트(segment) 중 빅팀(victim) 세그먼트를 선정하고;
    상기 빅팀 세그먼트 내의 라이브 블록을 식별하고;
    상기 식별된 라이브 블록을 상기 스토리지 장치에 라이트-백 하고;
    상기 빅팀 세그먼트를 프리 영역으로 환원하는 것을 포함하되,
    상기 빅팀 세그먼트를 선정하는 것은,
    상기 복수의 세그먼트 중 일부로 구성된 제1 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제1 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하고;
    상기 복수의 세그먼트 중 다른 일부로 구성된 제2 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하며;
    상기 빅팀 포인트를 기준으로 상기 빅팀 세그먼트를 선정하는 것을 포함하는 세그먼트 클리닝 방법.
  10. 제9 항에 있어서,
    상기 복수의 세그먼트 중 또 다른 일부로 구성된 제3 세그먼트 그룹에 포함된 모든 세그먼트에 대하여 상기 제2 빅팀 포인트 연산 수식에 따라 빅팀 포인트를 연산하는 것을 더 포함하고,
    상기 제1 세그먼트 그룹은 신규로 라이트 된 데이터를 포함하는 세그먼트들로 구성된 것이고,
    상기 제2 세그먼트 그룹은 상기 제1 세그먼트 그룹 소속의 세그먼트에 포함된 데이터가 갱신되는 경우 라이트되는 데이터를 포함하는 세그먼트들로 구성되는 것이며,
    상기 제3 세그먼트 그룹은 상기 라이트-백된 데이터를 포함하는 것이고,
    상기 제1 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율과, 상기 세그먼트에 포함된 블록 중 가장 최근에 수정된 블록의 수정 시각을 이용하여 산출된 에이지를 이용하는 것이고,
    상기 제2 빅팀 포인트 연산 수식은 상기 세그먼트에 포함된 블록 중 라이브 블록의 비율을 이용하는 것인 세그먼트 클리닝 방법.
KR1020120110673A 2012-10-05 2012-10-05 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법 KR102007650B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120110673A KR102007650B1 (ko) 2012-10-05 2012-10-05 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법
US14/046,515 US9323772B2 (en) 2012-10-05 2013-10-04 Segment group-based segment cleaning apparatus and methods for storage units

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120110673A KR102007650B1 (ko) 2012-10-05 2012-10-05 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20140044558A true KR20140044558A (ko) 2014-04-15
KR102007650B1 KR102007650B1 (ko) 2019-10-23

Family

ID=50433533

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120110673A KR102007650B1 (ko) 2012-10-05 2012-10-05 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법

Country Status (2)

Country Link
US (1) US9323772B2 (ko)
KR (1) KR102007650B1 (ko)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8671265B2 (en) 2010-03-05 2014-03-11 Solidfire, Inc. Distributed data storage system providing de-duplication of data using block identifiers
US9054992B2 (en) 2011-12-27 2015-06-09 Solidfire, Inc. Quality of service policy sets
US9838269B2 (en) 2011-12-27 2017-12-05 Netapp, Inc. Proportional quality of service based on client usage and system metrics
EP3103245B1 (en) * 2014-02-05 2019-06-19 Seon Design (USA) Corp. Uploading data from mobile devices
US20150244795A1 (en) 2014-02-21 2015-08-27 Solidfire, Inc. Data syncing in a distributed system
US9798728B2 (en) 2014-07-24 2017-10-24 Netapp, Inc. System performing data deduplication using a dense tree data structure
US10133511B2 (en) 2014-09-12 2018-11-20 Netapp, Inc Optimized segment cleaning technique
US9671960B2 (en) 2014-09-12 2017-06-06 Netapp, Inc. Rate matching technique for balancing segment cleaning and I/O workload
US9836229B2 (en) 2014-11-18 2017-12-05 Netapp, Inc. N-way merge technique for updating volume metadata in a storage I/O stack
US9720601B2 (en) 2015-02-11 2017-08-01 Netapp, Inc. Load balancing technique for a storage array
US9762460B2 (en) 2015-03-24 2017-09-12 Netapp, Inc. Providing continuous context for operational information of a storage system
US9710317B2 (en) 2015-03-30 2017-07-18 Netapp, Inc. Methods to identify, handle and recover from suspect SSDS in a clustered flash array
US10108344B1 (en) * 2015-05-06 2018-10-23 American Megatrends, Inc. Systems, devices and methods using a solid state device as a caching medium with an SSD filtering or SSD pre-fetch algorithm
US9740566B2 (en) 2015-07-31 2017-08-22 Netapp, Inc. Snapshot creation workflow
US10013346B2 (en) * 2015-11-17 2018-07-03 Western Digital Technologies, Inc. Method of decreasing write amplification of NAND flash using a journal approach
US10929022B2 (en) 2016-04-25 2021-02-23 Netapp. Inc. Space savings reporting for storage system supporting snapshot and clones
US10642763B2 (en) 2016-09-20 2020-05-05 Netapp, Inc. Quality of service policy sets
JP7102455B2 (ja) * 2020-03-26 2022-07-19 株式会社日立製作所 ファイルストレージシステム及びファイルストレージシステムの管理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101017067B1 (ko) * 2008-04-08 2011-02-25 재단법인서울대학교산학협력재단 낸드 플래시 메모리를 위한 지역성 기반의 가비지 컬렉션기법
KR101067018B1 (ko) * 2009-04-17 2011-09-22 서울대학교산학협력단 가비지 컬렉션 수행 방법 및 상기 방법을 이용한 플래시 메모리 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5530850A (en) 1993-10-25 1996-06-25 International Business Machines Corporation Data storage library array with log-structured file system which allows simultaneous write and garbage collection
US5933840A (en) 1997-05-19 1999-08-03 International Business Machines Corporation Garbage collection in log-structured information storage systems using age threshold selection of segments
US7428560B1 (en) 2004-03-12 2008-09-23 Sun Microsystems, Inc. Age segregation for garbage collector
JP4051359B2 (ja) 2004-07-26 2008-02-20 株式会社アプリックス 世代別ガベージコレクション方法及び世代別ガベージコレクションプログラム
US7509471B2 (en) 2005-10-27 2009-03-24 Sandisk Corporation Methods for adaptively handling data writes in non-volatile memories
JP2007213252A (ja) 2006-02-08 2007-08-23 Hitachi Ltd ゴミ集め処理プログラム及びゴミ集め処理方法
US8041883B2 (en) 2007-05-09 2011-10-18 Stmicroelectronics S.R.L. Restoring storage devices based on flash memories and related circuit, system, and method
KR101153688B1 (ko) 2010-10-15 2012-06-18 성균관대학교산학협력단 데이터 페이지들에 대해 무효화 기회를 부여하는 방법 및 이를 위한 낸드 플래시 메모리 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101017067B1 (ko) * 2008-04-08 2011-02-25 재단법인서울대학교산학협력재단 낸드 플래시 메모리를 위한 지역성 기반의 가비지 컬렉션기법
KR101067018B1 (ko) * 2009-04-17 2011-09-22 서울대학교산학협력단 가비지 컬렉션 수행 방법 및 상기 방법을 이용한 플래시 메모리 장치

Also Published As

Publication number Publication date
US9323772B2 (en) 2016-04-26
US20140101115A1 (en) 2014-04-10
KR102007650B1 (ko) 2019-10-23

Similar Documents

Publication Publication Date Title
KR102007650B1 (ko) 세그먼트 그룹을 고려하는 세그먼트 클리닝 장치 및 방법
KR102002830B1 (ko) 세그먼트 클리닝 장치 및 방법
KR101977575B1 (ko) 디렉토리 엔트리 조회 장치, 그 방법 및 디렉토리 엔트리 조회 프로그램이 기록된 기록 매체
US11249951B2 (en) Heuristic interface for enabling a computer device to utilize data property-based data placement inside a nonvolatile memory device
KR102050725B1 (ko) 컴퓨팅 시스템 및 컴퓨팅 시스템의 데이터 관리 방법
US11687446B2 (en) Namespace change propagation in non-volatile memory devices
KR102050723B1 (ko) 컴퓨팅 시스템 및 그 데이터 관리 방법
KR102050732B1 (ko) 컴퓨팅 시스템 및 컴퓨팅 시스템의 데이터 관리 방법
CN110908927A (zh) 数据储存装置及其删除命名空间的方法
US20140095771A1 (en) Host device, computing system and method for flushing a cache
US10025706B2 (en) Control device, storage device, and storage control method
KR20210068699A (ko) 스토리지 장치, 스토리지 시스템 및 스토리지 장치의 동작 방법
JP6215631B2 (ja) コンピュータシステム及びそのデータ管理方法
US20190196732A1 (en) FLEXIBLE OVER-PROVISIONING OF STORAGE SPACE WITHIN SOLID-STATE STORAGE DEVICES (SSDs)
US20140095558A1 (en) Computing system and method of managing data thereof
KR20140042520A (ko) 비트맵을 이용한 세그먼트 클리닝 장치 및 상기 비트맵을 저장하는 스토리지 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant