KR20190128369A - 캐싱 장치 및 방법 - Google Patents

캐싱 장치 및 방법 Download PDF

Info

Publication number
KR20190128369A
KR20190128369A KR1020180052468A KR20180052468A KR20190128369A KR 20190128369 A KR20190128369 A KR 20190128369A KR 1020180052468 A KR1020180052468 A KR 1020180052468A KR 20180052468 A KR20180052468 A KR 20180052468A KR 20190128369 A KR20190128369 A KR 20190128369A
Authority
KR
South Korea
Prior art keywords
function
write
processing
hooked
cache
Prior art date
Application number
KR1020180052468A
Other languages
English (en)
Other versions
KR102052312B1 (ko
Inventor
김상욱
현병훈
Original Assignee
주식회사 애포샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 애포샤 filed Critical 주식회사 애포샤
Priority to KR1020180052468A priority Critical patent/KR102052312B1/ko
Publication of KR20190128369A publication Critical patent/KR20190128369A/ko
Application granted granted Critical
Publication of KR102052312B1 publication Critical patent/KR102052312B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/073Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

캐싱 장치가 제공된다. 본 발명의 일 실시예에 따른 캐싱 장치는 캐시(cache), 쓰기 관련 함수의 호출을 후킹하는 후킹 모듈 및 상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하지 않는다는 판정에 응답하여 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하고, 상기 기 설정된 함수에 해당한다는 판정에 응답하여 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 처리 모듈을 포함할 수 있다. 이때, 상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 상기 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고, 상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴일 수 있다.

Description

캐싱 장치 및 방법{APPARATUS AND METHOD FOR CACHING}
본 발명은 캐싱 장치 및 방법에 관한 것이다. 보다 자세하게는, 캐시의 장애 발생을 고려하여 데이터의 안전성을 제공함과 동시에 높은 데이터 쓰기 성능을 보장할 수 있는 캐싱 장치 및 그 장치에 의해 수행되는 캐싱 방법에 관한 것이다.
캐시(cache)는 데이터가 보관되는 임시 저장소로, 애플리케이션의 데이터 읽기 및 쓰기 성능을 향상시키기 위해 이용되는 장치이다. 데이터 쓰기 성능은 캐시의 쓰기 정책과 밀접한 관련이 있으며, 캐시의 쓰기 정책은 크게 라이트 쓰루(write-through) 정책과 라이트 백(write-back) 정책으로 구분된다.
도 1에 도시된 바와 같이, 라이트 쓰루 정책은 특정 데이터(e.g. x=100)가 캐시와 스토리지에 모두 기록되면 요청된 쓰기 작업이 완료되는 정책이다. 반면에, 라이트 백 정책은 특정 데이터(e.g. x=100)가 캐시에 기록되면 곧바로 쓰기 작업이 완료되는 정책이다.
상기와 같은 캐시 쓰기 정책의 장단점은 명확하다. 라이트 쓰루 정책은 항상 데이터의 일관성(coherency)을 보장하기 때문에, 캐시의 장애 상황에 강인하나, 데이터 쓰기 성능이 스토리지의 쓰기 성능에 의해 제한되는 단점이 있다. 라이트 백 정책은 높은 쓰기 성능을 보장할 수 있으나, 캐시에 장애가 발생한 경우 최신 데이터(e.g. 더티 데이터)가 손실되어 데이터의 안전성이 보장될 수 없다는 단점이 있다. 따라서, 어느 하나의 쓰기 정책만을 고수하는 경우, 데이터의 안전성과 높은 쓰기 성능이 함께 보장될 수는 없다.
한편, 캐시의 쓰기 정책에 따른 제어를 수행하는 등 전반적인 캐시 관리를 수행하는 캐시 관리 모듈은 일반적으로 운영체제(operation system) 내부에 구현된다. 예를 들어, 도 2에 도시된 바와 같이, 캐시 관리 모듈은 커널 레이어(e.g. 블록 레이어)에 구현되는 것이 통상적인 구현 방식이다.
캐시 관리 모듈이 운영체제 내부에 구현되는 경우, 애플리케이션의 "fsync()" 함수 호출에 따라 캐시에 존재하는 모든 더티 데이터(dirty data)가 스토리지로 플러시(flush)된다. 예를 들어, 도 2에 도시된 바와 같이, 애플리케이션(#1)의 "fsync()" 함수 호출에 따라, 캐시에 존재하는 애플리케이션(#2)의 더티 데이터(D2) 또한 스토리지로 플러시된다. 이와 같은 경우, 애플리케이션(#1)의 fsync() 함수에 의한 쓰기 지연이 다른 애플리케이션(#2)의 성능에 영향을 미치는 문제가 발생된다.
한국공개특허 제10-2013-0010690호 (2013.01.30 공개)
본 발명이 해결하고자 하는 기술적 과제는, 캐시의 장애 상황에 대한 데이터 안전성을 제공할 수 있는 캐싱 장치 및 그 장치에 의해 수행되는 캐싱 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는, 데이터의 안전성을 제공함과 동시에 높은 쓰기 성능을 보장할 수 있는 캐싱 장치 및 그 장치에 의해 수행되는 캐싱 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는, 더티 데이터의 플러시에 따른 쓰기 지연이 다른 애플리케이션의 성능을 저하시키는 문제를 해결할 수 있는 캐싱 장치 및 그 장치에 의해 수행되는 캐싱 방법을 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 캐싱 장치는, 캐시(cache), 쓰기 관련 함수의 호출을 후킹하는 후킹 모듈 및 상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하지 않는다는 판정에 응답하여 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하고, 상기 기 설정된 함수에 해당한다는 판정에 응답하여 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 처리 모듈을 포함하되, 상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 상기 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고, 상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴인 것을 특징으로 하는, 캐싱 장치.
일 실시예에서, 상기 기 설정된 함수는, 동기화 함수일 수 있다.
일 실시예에서, 상기 제1 처리 루틴은, 상기 타깃 데이터의 파일 오프셋과 상기 캐시 상의 저장 위치 간의 매핑 정보를 생성하는 루틴을 포함할 수 있다.
일 실시예에서, 상기 처리 모듈은, 백그라운드에서 동작하는 워커(worker)를 이용하여 상기 캐시의 더티 데이터(dirty data)를 스토리지로 플러시(flush)할 수 있다.
일 실시예에서, 상기 처리 모듈은, 상기 후킹된 쓰기 관련 함수의 타깃 파일의 수정 빈도가 임계치 미만이라는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 상기 제2 처리 루틴에 따라 처리할 수 있다.
일 실시예에서, 상기 처리 모듈은, 상기 후킹된 쓰기 관련 함수를 호출한 애플리케이션과 연관된 더티 데이터의 크기가 임계치 이상이라는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 상기 제2 처리 루틴에 따라 처리할 수 있다.
일 실시예에서, 상기 후킹된 쓰기 관련 함수는 제1 애플리케이션에 의해 호출된 제1 함수 및 제2 애플리케이션에 의해 호출된 제2 함수를 포함하고, 상기 처리 모듈은, 상기 제1 함수 및 상기 제2 함수가 모두 상기 기 설정된 함수에 해당한다는 판정에 응답하여, 기 설정된 기준에 기초하여 상기 제1 함수 및 상기 제2 함수 중 적어도 하나의 함수를 선택하고, 상기 선택된 함수를 상기 제2 처리 루틴에 따라 처리할 수 있다.
일 실시예에서, 상기 후킹 모듈 및 상기 처리 모듈은, 애플리케이션 레이어(application layer)에 위치할 수 있다.
상기 기술적 과제를 해결하기 위한, 본 발명의 다른 실시예에 따른 캐싱 방법은, 캐싱 장치에서 수행되는 캐싱(caching) 방법에 있어서, 쓰기 관련 함수의 호출을 후킹(hooking)하는 단계, 상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정하는 단계, 상기 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하는 단계 및 상기 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 단계를 포함하되, 상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고, 상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴일 수 있다.
상기 기술적 과제를 해결하기 위한, 본 발명의 또 다른 실시예에 따른 컴퓨터 프로그램은, 컴퓨팅 장치와 결합하여, 쓰기 관련 함수의 호출을 후킹(hooking)하는 단계, 상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정하는 단계, 상기 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하는 단계 및 상기 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 단계를 실행시키기 위하여 컴퓨터로 판독가능한 기록매체에 저장될 수 있다. 이때, 상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고, 상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴일 수 있다.
도 1은 캐시 쓰기 정책을 비교 설명하기 위한 도면이다.
도 2는 캐시 관리 모듈이 운영체제 내부에 구현되는 경우 발생될 수 있는 문제점을 설명하기 위한 도면이다.
도 3은 본 발명의 제1 구현예에 따른 컴퓨팅 장치를 나타내는 블록도이다.
도 4는 본 발명의 일 실시예에 따른 캐시 관리 모듈의 구현 위치를 나타내는 예시도이다.
도 5는 본 발명의 일 실시예에 따른 캐시 관리 모듈을 나타내는 블록도이다.
도 6은 본 발명의 일 실시예에 따라 쓰기 관련 함수가 제1 처리 루틴에 따라 처리되는 과정을 설명하기 위한 예시도이다.
도 7은 본 발명의 일 실시예에 따라 쓰기 관련 함수가 제2 처리 루틴에 따라 처리되는 과정을 설명하기 위한 예시도이다.
도 8은 본 발명의 일 실시예에 따라 복수의 애플리케이션이 복수의 쓰기 관련 함수를 호출하는 경우의 처리 과정을 설명하기 위한 예시도이다.
도 9는 본 발명의 일 실시예에 따른 캐싱 장치를 나타내는 하드웨어 구성도이다.
도 10은 본 발명의 제2 구현예에 따른 컴퓨팅 장치를 나타내는 블록도이다.
도 11 및 도 12는 본 발명의 제1 실시예에 따른 캐싱 방법을 나타내는 흐름도이다.
도 13은 본 발명의 제2 실시예에 따른 캐싱 방법을 나타내는 흐름도이다.
도 14는 본 발명의 제3 실시예에 따른 캐싱 방법을 나타내는 흐름도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 발명의 몇몇 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.
도 3은 본 발명의 제1 구현예에 따른 컴퓨팅 장치(10)를 나타내는 블록도이다. 특히, 도 3은 본 발명의 실시예에 따른 캐싱 장치(100)가 일반적인 컴퓨팅 장치에 구현된 것을 예시하고 있다.
도 3을 참조하면, 상기 제1 구현예에 따른 컴퓨팅 장치(10)는 캐싱 장치(100), 애플리케이션(160) 및 스토리지(180)를 포함하도록 구성될 수 있다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 구성 요소가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 3에 도시된 컴퓨팅 장치(10)의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 적어도 하나의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다.
상기 제1 구현예에서, 캐싱 장치(100)는 애플리케이션(160)의 읽기 및 쓰기 데이터에 대한 캐싱 기능을 제공하는 장치이다. 상기 캐싱 기능을 제공하기 위해, 캐싱 장치(100)는 캐시 관리 모듈(120) 및 캐시(140)를 포함하도록 구성될 수 있다.
캐시 관리 모듈(120)은 캐시(140)에 대한 전반적인 제어 및 관리 기능을 수행하는 모듈이다. 캐시 관리 모듈(120)의 세부 구성 및 동작에 대한 자세한 설명은 이후 도 5 이하의 도면을 참조하여 상세하게 설명하도록 한다.
본 발명의 실시예에 따르면, 도 4에 도시된 바와 같이, 캐시 관리 모듈(120)은 애플리케이션 레이어(31)에 위치하도록 구현(e.g. 유저 레벨 라이브러리)될 수 있다. 즉, 캐시 관리 모듈(120)은 애플리케이션 레이어(31)에서 캐시(140)의 더티 데이터 정보를 관리한다. 또한, 캐시 관리 모듈(120)은 운영체제의 커널을 거치지 않고 쓰기 데이터를 직접 캐시(140)에 저장할 수 있다. 본 실시예에 따르면, 커널이 캐시의 더티 데이터 정보를 알 수 없으며, 커널이 특정 애플리케이션의 동기화 함수(e.g. fsync())를 처리하더라도 다른 애플리케이션의 더티 데이터가 스토리지(180)로 플러시되지 않는다. 따라서, 특정 애플리케이션의 동기화 함수에 의한 쓰기 지연이 다른 애플리케이션의 성능에 부정적인 영향을 미치는 문제가 해결될 수 있다.
참고로, 애플리케이션 레이어라는 용어는 당해 기술 분야에서 유저 레벨, 유저 영역, 애플리케이션 영역 등 다양한 용어와 혼용되어 사용될 수 있다.
다시 도 3을 참조하면, 캐시(140)는 애플리케이션(160)의 데이터 읽기 및 쓰기 성능을 향상시키기 위해 이용되는 장치이다. 캐시(140)는 스토리지(180)보다 상대적으로 빠른 접근 속도를 갖는 장치로 구현된다면, 어떠한 장치로 구현되더라도 무방하다. 예를 들어, 캐시(140)는 SSD(solid state drive), HDD(hard disk drive) 등의 비휘발성 메모리로 구현될 수 있고, SRAM(static random access memory), DRAM(dynamic random access memory) 등의 휘발성 메모리로 구현될 수도 있다.
상기 제1 구현예에서, 애플리케이션(160)은 캐싱 장치(100)으로부터 캐싱 기능을 제공받는 임의의 소프트웨어이다.
상기 제1 구현예에서, 스토리지(180)는 애플리케이션(160)의 데이터를 저장하기 위해 이용되는 장치다. 스토리지(180)는 캐시(140)보다 상대적으로 느린 접근 속도를 갖는 장치로 구현될 수 있다.
본 명세서에서, "스토리지"라는 용어는 캐시와 구별하기 위한 용도로 사용되는 용어이다. 따라서, 스토리지(180) 또한 SSD, HDD(hard disk drive) 등의 비휘발성 메모리로 구현될 수 있고, SRAM(static random access memory), DRAM(dynamic random access memory) 등의 휘발성 메모리로 구현될 수도 있다.
지금까지 도 1을 참조하여 본 발명의 제1 구현예에 따른 컴퓨팅 장치(10)에 대하여 설명하였다. 이하에서는, 본 발명의 일 실시예에 따른 캐시 관리 모듈(120)의 구성 및 동작에 대하여 도 5 내지 도 8을 참조하여 설명하도록 한다.
도 5는 본 발명의 일 실시예에 따른 캐시 관리 모듈(120)을 나타내는 블록도이다.
도 5를 참조하면, 캐시 관리 모듈(120)은 후킹 모듈(121) 및 처리 모듈(123)을 포함하도록 구성될 수 있다. 다만, 도 5에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 5에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다. 또한, 도 5에 도시된 캐시 관리 모듈(120)의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 적어도 하나의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다.
각 구성 요소를 살펴보면, 후킹 모듈(121)은 애플리케이션에 의해 호출된 쓰기 관련 함수(e.g. write(), fsync() 등의 쓰기 시스템 콜)를 후킹한다. 구체적으로, 후킹 모듈(121)은 상기 쓰기 관련 함수에 대한 후킹을 설정하고, 후킹을 통해 애플리케이션의 쓰기 관련 함수 호출을 감지하며, 감지된 쓰기 관련 함수의 제어 흐름을 인터셉트하여 처리 모듈(123)에게 제공한다.
후킹 모듈(121)이 쓰기 관련 함수를 후킹하는 방법은 어떠한 방법이 이용되더라도 무방하다. 예를 들어, 후킹 모듈(121)은 당해 기술 분야에서 널리 알려진 적어도 하나의 후킹 기법을 이용하여 쓰기 관련 함수를 후킹할 수 있다.
처리 모듈(123)은 후킹된 쓰기 관련 함수를 적절한 처리 루틴에 따라 처리한다. 구체적으로, 처리 모듈(123)은 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지를 판정하고, 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리한다. 이와 반대로, 처리 모듈(123)은 상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리한다. 이때, 상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 캐시(140)에 기록하여 더티 데이터가 생성되도록 처리하는 루틴을 의미한다. 즉, 상기 제1 처리 루틴은 라이트 백 정책에 따른 처리 루틴을 의미할 수 있다. 또한, 상기 제2 처리 루틴은 캐시(140)에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴을 의미한다. 이하에서는, 다른 언급이 없는 한 "제1 처리 루틴"과 "제2 처리 루틴"이라는 용어를 위와 동일한 의미로 사용하도록 한다.
본 발명의 실시예에 따르면, 상기 기 설정된 함수는 동기화 함수(e.g. fsync())일 수 있다. 애플리케이션의 동기화 요청은 데이터의 안전성 보장을 요청하는 애플리케이션의 의도로 해석될 수 있기 때문이다. 본 실시예에 따르면, 애플리케이션의 동기화 요청을 힌트로 활용함으로써, 애플리케이션 수준의 데이터 안전성이 보장될 수 있다. 아울러, 동기화 함수 외의 쓰기 관련 함수는 라이트 백 정책에 따라 처리될 것이기 때문에, 높은 쓰기 성능 또한 보장될 수 있다. 이하에서는, 상기 기 설정된 함수가 동기화 함수임을 가정하여, 본 발명의 몇몇 실시예들에 대한 설명을 이어가도록 한다. 다만, 이는 이해의 편의를 제공하기 위한 것일 뿐, 실시예에 따라 얼마든지 다른 종류의 함수가 처리 루틴을 결정하는 기준 함수로 설정될 수 있다.
또한, 본 발명의 실시예에 따르면, 처리 모듈(123) 백그라운드(background)에서 동작하는 워커(worker)를 이용하여 캐시의 더티 데이터를 스토리지로 플러시할 수 있다. 상기 워커는 쓰레드, 프로세스 등 어떠한 형태로 구현되더라도 무방하다.
일 예에서, 상기 워커는 소정의 주기에 따라 더티 데이터를 플러시할 수 있다. 다른 예에서, 상기 워커는 캐시의 더티 데이터 비율이 임계치 이상이라는 판정에 응답하여 더티 데이터를 플러시할 수 있다. 또 다른 예에서, 상기 워커는 스토리지의 대기 I/O 작업 수가 임계치 미만이라는 판정에 응답하여, 더티 데이터를 플러시할 수 있다. 또 다른 예에서, 상기 워커는 전술한 예시들의 조합에 기초하여 더티 데이터를 플러시할 수 있다.
상술한 실시예에 따르면, 상기 제2 처리 루틴에 따라 캐시의 더티 데이터가 스토리지에 플러시되기 전이라도 백그라운드 워커를 통해 일부 또는 전부의 더티 데이터가 플러시될 수 있다. 따라서, 데이터의 안전성이 더욱 향상되고, 더티 데이터 플러시에 따른 처리 지연은 최소화될 수 있다.
처리 모듈(123)이 캐시 쓰기 정책에 따라 후킹된 쓰기 관련 함수를 처리하는 과정은 도 6, 도 7, 도 11 및 도 12를 참조하여 부연 설명하도록 한다. 또한, 복수의 애플리케이션이 동기화 함수를 호출한 경우의 처리 과정에 대해서는 도 8 및 도 14를 참조하여 후술하도록 한다.
기타 처리 모듈(123)의 동작에 대한 설명은 도 11 내지 도 14에 대한 설명 부분을 더 참조하도록 한다.
도 5의 각 구성 요소는 소프트웨어(Software) 또는, FPGA(Field Programmable Gate Array)나 ASIC(Application-Specific Integrated Circuit)과 같은 하드웨어(Hardware)를 의미할 수 있다. 그렇지만, 상기 구성 요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(Addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성 요소들 안에서 제공되는 기능은 더 세분화된 구성 요소에 의하여 구현될 수 있으며, 복수의 구성 요소들을 합하여 특정한 기능을 수행하는 하나의 구성 요소로 구현될 수도 있다.
이하에서는, 도 6 및 도 7을 참조하여 후킹된 쓰기 관련 함수가 각 처리 루틴에 따라 처리되는 과정에 대하여 설명하도록 한다.
먼저, 도 6은 본 발명의 일 실시예에 따라 후킹된 쓰기 관련 함수가 제1 처리 루틴에 따라 처리되는 과정을 도시하고 있다.
도 6에 도시된 바와 같이, 처리 모듈(123)은 후킹 모듈(121)에 의해 후킹된 쓰기 관련 함수가 동기화 함수(e.g. fsync())에 해당하지 않는다는 판정에 응답하여, 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리한다. 구체적으로, 처리 모듈(123)은 후킹된 쓰기 관련 함수의 타깃 데이터를 캐시(140)의 적절한 위치에 저장하고, 쓰기 작업을 완료한다.
이때, 처리 모듈(123)은 상기 타깃 데이터에 대한 메타데이터를 생성하고, 생성된 메타데이터를 캐시(140)의 특정 영역에 저장한다. 상기 메타데이터는, 상기 타깃 데이터의 쓰기 정보(e.g. 파일 디스크립터, 파일 오프셋, 타깃 데이터의 크기 등)와 캐시(140) 상의 저장 위치 간의 매핑 정보를 포함할 수 있다. 상기 메타데이터는 더티 데이터에 대한 읽기, 플러시 등의 작업을 수행하는 경우에 참조될 수 있다.
다음으로, 도 7은 본 발명의 일 실시예에 따라 후킹된 쓰기 관련 함수가 제2 처리 루틴에 따라 처리되는 과정을 도시하고 있다.
도 7에 도시된 바와 같이, 처리 모듈(123)은 후킹 모듈(121)에 의해 후킹된 쓰기 관련 함수가 동기화 함수(e.g. fsync())에 해당한다는 판정에 응답하여, 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리한다. 구체적으로, 처리 모듈(123)은 캐시(140)로 더티 데이터(D)에 대한 동기화 명령을 전송함으로써, 캐시(140)에 보관된 애플리케이션(160)의 더티 데이터가 스토리지(180)로 플러시되도록 처리 한다.
지금까지 도 6 및 도 7을 참조하여 각 처리 루틴에 따라 후킹된 쓰기 관련 함수가 처리되는 과정에 대하여 설명하였다. 이하에서는, 도 8을 참조하여 복수의 애플리케이션이 동기화 함수를 호출한 경우의 처리 과정에 대하여 설명하도록 한다.
도 8을 참조하면, 복수의 애플리케이션(161, 163)이 동기화 함수를 호출한 경우, 처리 모듈(123)은 기 설정된 기준에 따라 특정 애플리케이션(161)의 동기화 함수("fsync()#1")를 선택하고, 선택된 동기화 함수 ("fsync()#1")만을 상기 제2 처리 루틴에 따라 처리할 수 있다. 즉, 도 8에 도시된 바와 같이, 처리 모듈(123)은 애플리케이션(161)의 더티 데이터(D1)만이 스토리지(180)로 플러시되도록 처리할 수 있다.
상기 기 설정된 기준은 애플리케이션에 의해 호출된 쓰기 관련 함수가 라이트 쓰루 정책에 따라 처리된 빈도(e.g. 동기화 함수의 호출 빈도), 각 애플리케이션과 연관된 더티 데이터의 크기 등을 포함할 수 있다. 예를 들어, 처리 모듈(123)은 더티 데이터의 크기가 더 큰 애플리케이션의 동기화 함수만을 상기 제2 처리 루틴에 따라 처리할 수 있다. 더티 데이터의 크기가 클수록 캐시 장애에 따른 데이터 손실 비용이 증가하기 때문이다.
처리 모듈(123)이 복수의 동기화 함수에 대하여 선별적으로 제2 처리 루틴을 적용하는 방법에 대한 설명은 도 14를 참조하여 부연 설명하도록 한다.
지금까지 도 5 내지 도 8을 참조하여 본 발명의 실시예에 따른 캐시 관리 모듈(120)의 구성 및 동작에 대하여 설명하였다. 이하에서는, 본 발명의 일 실시예에 따른 캐싱 장치(100)의 하드웨어 구성에 대하여 설명하도록 한다.
도 9는 본 발명의 일 실시예에 따른 캐싱 장치(100)를 나타내는 하드웨어 구성도이다.
도 9를 참조하면, 캐싱 장치(100)는 하나 이상의 프로세서(101), 버스(105), 캐시(107), 프로세서(101)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(103)와, 캐시 관리 소프트웨어(109a)를 저장하는 스토리지(109)를 포함할 수 있다. 다만, 도 9에는 본 발명의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 9에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(101)는 캐싱 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(101)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(101)는 본 발명의 실시예들에 따른 방법을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 캐싱 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(103)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(103)는 본 발명의 실시예들에 따른 캐싱 방법을 실행하기 위하여 스토리지(109)로부터 하나 이상의 프로그램(109a)을 로드할 수 있다. 도 9에서 메모리(103)의 예시로 RAM이 도시되었다.
메모리(103)에 캐시 관리 소프트웨어(109a)가 로드되면, 메모리(103) 상에 도 5에 도시된 캐시 관리 모듈(120)이 구현될 수 있다.
버스(105)는 캐싱 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(105)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
캐시(107)는 캐싱 장치(100)의 유무선 인터넷 통신을 지원한다. 또한, 캐시(107)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 캐시(107)는 본 발명의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.
스토리지(109)는 상기 하나 이상의 프로그램(109a)을 비임시적으로 저장할 수 있다. 도 9에서 상기 하나 이상의 프로그램(109a)의 예시로 캐시 관리 소프트웨어(109a)가 도시되었다.
스토리지(109)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
캐시(107)는 스토리지(109)에 대한 임시 저장소로 동작할 수도 있고, 별도의 스토리지(미도시)에 대한 임시 저장소로 동작할 수도 있다.
캐시 관리 소프트웨어(109a)는 메모리(103)에 로드될 때 프로세서(101)로 하여금 본 발명의 몇몇 실시예들에 따른 캐싱 방법을 수행하도록 하는 인스트럭션들(instructions)을 포함할 수 있다. 여기서, 상기 인스트럭션은 기능을 기준으로 묶인 일련의 명령어들로서 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 가리킨다.
예를 들어, 캐시 관리 소프트웨어(109a)는 쓰기 관련 함수의 호출을 후킹(hooking)하는 동작, 상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정하는 동작 및 상기 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하는 동작 및 상기 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 동작을 수행하도록 하는 인스트럭션들을 포함할 수 있다.
지금까지 도 9를 참조하여 본 발명의 일 실시예에 따른 캐싱 장치(100)의 하드웨어 구성에 대하여 설명하였다. 이하에서는, 보다 이해의 편의를 제공하기 위해, 본 발명의 제2 구현예에 따른 컴퓨팅 장치(20)에 대하여 간략하게 설명하도록 한다.
도 10은 본 발명의 제2 구현예에 따른 컴퓨팅 장치(20)를 나타내는 블록도이다. 특히, 도 10은 본 발명의 실시예에 따른 캐싱 장치(100)가 클라우드 스토리지 서비스를 제공하는 서버에 구현된 것을 예시하고 있다.
도 10을 참조하면, 컴퓨팅 장치(20)는 클라우드 스토리지 서비스를 제공하는 소정의 서버로 동작하고, 캐싱 장치(100)는 클라우드 스토리지 서비스를 이용하는 다수의 클라이언트(301, 303, 305)에게 캐싱 기능을 제공할 수 있다. 예를 들어, 캐싱 장치(100)는 각 클라이언트(301, 303, 305)에 대한 가상의 캐시를 생성하고, 생성된 가상의 캐시를 통해 각 클라이언트(301, 303, 305)에게 독립적인 캐싱 기능을 제공할 수 있다. 이때, 상기 가상의 캐시 각각은 물리적인 캐시(140)의 일 부분에 대응될 수 있다.
상기 제2 구현예에서, 컴퓨팅 장치(20)는 서비스 모듈(151, 153, 155)을 통해 클라이언트(301, 303, 305)에게 클라우드 스토리지 서비스를 제공할 수 있다. 서비스 모듈(151, 53, 155)는 가상 머신(virtual machine), 컨테이너(container) 등으로 구현될 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
종래와 같이 운영체제 내부에 캐시 관리 모듈(120)이 구현되는 경우, 클라이언트(301)의 가상 캐시에 대한 동기화 처리로 인해 다른 클라이언트(303, 305)의 서비스 성능이 저하되는 문제가 발생될 수 있다.
그러나, 본 발명의 실시예에 따라, 캐시 관리 모듈(120)이 어플리케이션 영역에 구현되는 경우, 클라이언트(301)의 가상 캐시에 대한 동기화 처리가 다른 클라이언트(303, 305)의 서비스 성능에 영향을 미치지 않는다. 따라서, 본 발명의 실시예에 따른 캐시 장치(100)가 클라우드 스토리지 서비스를 제공하는 서버에 구현되는 경우, 보다 원활한 스토리지 서비스의 제공이 가능하며, 사용자들의 서비스 만족도가 향상될 수 있다.
상기 제2 구현예에서, 클라이언트(301, 303, 305)는 네트워크를 통해 컴퓨팅 장치(20)와 통신할 수 있다. 여기서, 상기 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 이동 통신망(mobile radio communication network), Wibro(Wireless Broadband Internet) 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.
지금까지 도 10을 참조하여 본 발명의 제2 구현예에 따른 컴퓨팅 장치(20)에 대하여 설명하였다. 상술한 바와 같이, 본 발명의 실시예에 따른 캐싱 장치(100)는 다양한 장치(e.g. 컴퓨팅 장치 10, 20)에 범용적으로 활용될 수 있다.
이하에서는, 도 11 이하의 도면을 참조하여 본 발명의 몇몇 실시예에 따른 캐싱 방법에 대하여 상세하게 설명한다. 이하, 상기 캐싱 방법의 각 단계는, 캐시가 구비된 장치에 의해 수행될 수 있다. 예를 들어, 상기 장치는 캐싱 장치(100)일 수 있다. 이하에서는, 상기 캐싱 방법이 전술한 캐싱 장치(100)에 의해 수행되는 것을 가정하여 설명을 이어가도록 한다. 다만, 설명의 편의를 위해, 상기 캐싱 방법에 포함되는 각 단계의 동작 주체는 그 기재가 생략될 수도 있다. 또한, 상기 캐싱 방법의 각 단계는 메모리에 로드될 때 프로세서에 의해 실행되는 컴퓨터 프로그램(e.g. 캐시 관리 소프트웨어 109a)의 인스트럭션들로 구현될 수 있다.
도 11은 본 발명의 제1 실시예에 따른 캐싱 방법의 흐름도이다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.
도 11을 참조하면, 상기 제1 실시예에 따른 캐싱 방법은 캐싱 장치(100)가 쓰기 관련 함수에 대한 후킹을 설정하는 단계(S100)에서 시작된다.
단계(S120)에서, 상기 후킹을 통해 쓰기 관련 함수의 호출이 감지되었다는 판정에 응답하여, 단계(S140)가 수행된다. 또한, 단계(S120)에서, 캐싱 장치(100)는 애플리케이션에 의해 호출된 쓰기 관련 함수를 후킹한다.
단계(S140)에서, 캐싱 장치(100)는 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 판정한다. 상기 기 설정된 함수는 처리 루틴을 결정하는 기준 함수를 의미한다. 예를 들어, 상기 기 설정된 함수는 "fsync()"와 같은 동기화 함수일 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
단계(S160)에서, 상기 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 캐싱 장치(100)는 제1 처리 루틴에 따라 후킹된 쓰기 관련 함수를 처리한다. 전술한 바와 같이, 상기 제1 처리 루틴은 라이트 백 정책에 따른 처리 루틴을 의미한다.
구체적으로, 도 12에 도시된 바와 같이, 캐싱 장치(100)는 쓰기 관련 함수의 타깃 데이터를 캐시에 저장하고, 상기 타깃 데이터에 대한 매핑 정보를 생성한다(S162, S164). 전술한 바와 같이, 상기 매핑 정보는 캐시 관리에 이용되는 메타데이터로, 상기 타깃 데이터의 쓰기 정보(e.g. 파일 디스크립터, 파일 오프셋, 타깃 데이터의 크기 등)와 캐시(140) 상의 저장 위치 간의 매핑 정보를 포함할 수 있다. 또한, 캐싱 장치(100)는 상기 타깃 데이터를 스토리지에 저장하지 않고, 후킹된 쓰기 관련 함수에 대한 처리 작업을 완료한다.
단계(S180)에서, 상기 기 설정된 함수에 해당한다는 판정에 응답하여, 캐싱 장치(100)는 제2 처리 루틴에 따라 후킹된 쓰기 관련 함수를 처리한다. 전술한 바와 같이, 상기 제2 처리 루틴은 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴을 의미한다.
지금까지 도 11 및 도 12를 참조하여 보 발명의 제1 실시예에 따른 캐싱 방법에 대하여 설명하였다. 상술한 방법에 따르면, 애플리케이션에 의해 호출되는 다양한 종류의 쓰기 관련 함수 중에서 일부 함수는 라이트 백 정책에 따라 처리되고, 특정 함수의 호출됨에 따라 더티 데이터가 스토리지에 반영된다. 따라서, 라이트 백 정책만을 고수하는 경우에 비해 데이터 안전성이 향상될 수 있으며, 라이트 쓰루 정책만을 고수하는 경우에 비해 데이터 쓰기 성능이 향상될 수 있다. 특히, 상기 특정 함수가 동기화 함수로 설정되는 경우, 애플리케이션 수준의 데이터 안전성이 보장될 수 있다.
이하에서는, 도 13을 참조하여 본 발명의 제2 실시예에 따른 캐싱 방법에 대하여 설명하도록 한다.
도 13은 본 발명의 제2 실시예에 따른 캐싱 방법의 흐름도이다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다. 중복된 설명을 배제하기 위해, 앞서 설명한 실시예에 동일한 사항에 대한 설명은 생략하고 차이점을 중심으로 설명하도록 한다.
도 13을 참조하면, 상기 제2 실시예에 따른 캐싱 방법 또한 캐싱 장치(100)가 쓰기 관련 함수에 대한 후킹을 설정하는 단계(S200)에서 시작된다.
상기 제1 실시예와 동일하게, 단계(S210, S220)에서, 캐싱 장치(100)는 쓰기 관련 함수의 호출을 후킹하고, 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정한다.
상기 제1 실시예와 다르게, 캐싱 장치(100)는 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수가 지정된 조건을 만족하는지 여부에 대한 판정을 추가로 수행한다(S230).
또한, 상기 지정된 조건이 만족되는 경우에 한하여, 캐싱 장치(100)는 제2 처리 루틴에 따라 후킹된 쓰기 관련 함수를 처리한다(S240). 이와 반대로, 상기 지정된 조건이 만족되지 않는 경우, 캐싱 장치(100)는 제1 처리 루틴에 따라 후킹된 쓰기 관련 함수를 처리한다(S250).
상기 지정된 조건은 실시예에 따라 달라질 수 있다.
일 실시예에서, 상기 지정된 조건은 쓰기 관련 함수의 타깃 파일의 수정 패턴(e.g. 수정 빈도, 최근 수정 시간, 수정 시간 사이의 시간 간격, 동기화 된 이후의 수정된 횟수)에 기초한 조건을 포함할 수 있다.
예를 들어, 캐싱 장치(100)는 상기 타깃 파일의 수정 빈도가 임계치 미만인 조건이 만족된 경우에 한하여, 상기 제2 처리 루틴을 적용할 수 있다. 수정 빈도가 높은 파일은 빠른 시간 내에 다시 수정될 가능성이 높기 때문이다.
다른 예를 들어, 캐싱 장치(100)는 상기 타깃 파일이 동기화된 이후의 수정 횟수가 임계치 이상인 조건이 만족된 경우에 한하여, 상기 제2 처리 루틴을 적용할 수 있다.
본 실시예에 따르면, 타깃 파일의 수정 패턴을 이용하여, 상기 제2 처리 루틴에 따라 더티 데이터가 스토리지로 플러시되는 횟수가 최소화될 수 있다. 이에 따라, 애플리케이션의 데이터 쓰기 성능이 더욱 향상될 수 있다.
다른 실시예에서, 상기 지정된 조건은 쓰기 관련 함수를 호출한 애플리케이션의 더티 데이터 크기에 기초한 조건을 포함할 수 있다. 예를 들어, 캐싱 장치(100)는 상기 더티 데이터의 크기가 임계치 이상이라는 판정에 응답하여, 후킹된 쓰기 관련 함수를 상기 제2 처리 루틴에 따라 처리할 수 있다. 더티 데이터의 크기가 클수록, 캐시 장애에 따른 데이터 손실 비용이 증가하기 때문이다. 본 실시예에 따르면, 데이터의 손실 비용은 최소화되고, 애플리케이션의 데이터 쓰기 성능은 더욱 향상될 수 있다.
또 다른 실시예에서, 상기 지정된 조건은 전술한 실시예들의 조합에 의해 결정될 수 있다.
지금까지 도 13을 참조하여 본 발명의 제2 실시예에 따른 캐싱 방법에 대하여 설명하였다. 상술한 방법에 따르면, 상기 제1 실시예보다 엄격한 조건 하에 라이트 쓰루 정책이 적용된다. 따라서, 애플리케이션의 데이터 쓰기 성능이 더욱 향상될 수 있다.
이하에서는, 본 발명의 제3 실시예에 따른 캐싱 방법에 대하여 설명하도록 한다. 상기 제3 실시예에 따른 캐싱 방법은 복수의 애플리케이션에 의해 동기화 함수(즉, 라이트 쓰루 정책에 따라 처리되는 함수)가 호출되는 경우의 캐싱 방법에 관한 것이다. 도 14를 참조하여, 상기 제3 실시예에 따른 캐싱 방법에 대하여 설명한다.
도 14는 본 발명의 제3 실시예에 따른 캐싱 방법의 흐름도이다. 단, 이는 본 발명의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다. 중복된 설명을 배제하기 위해, 앞서 설명한 실시예에 동일한 사항에 대한 설명은 생략하고 차이점을 중심으로 설명하도록 한다.
도 14를 참조하면, 상기 제3 실시예에 따른 캐싱 방법 또한 캐싱 장치(100)가 쓰기 관련 함수에 대한 후킹을 설정하는 단계(S300)에서 시작된다.
단계(S310, S320)에서, 캐싱 장치(100)는 복수의 애플리케이션에 의해 호출된 복수의 쓰기 관련 함수의 호출을 후킹하고, 후킹된 각각의 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정한다.
단계(S330)에서, 복수의 쓰기 관련 함수가 기 설정된 함수에 해당한다는 판정에 응답하여, 캐싱 장치(100)는 상기 복수의 쓰기 관련 함수 중에서 특정 애플리케이션에 의해 호출된 쓰기 관련 함수를 선택한다.
단계(S340)에서, 캐싱 장치(100)는 선택된 쓰기 관련 함수만을 제2 처리 루틴에 따라 처리한다(S340).
캐싱 장치(100)는 기 설정된 기준에 따라 적어도 하나의 애플리케이션에 의해 호출된 쓰기 관련 함수를 선택할 수 있다.
일 실시예에서, 상기 기 설정된 기준은 각 애플리케이션에 의해 호출된 쓰기 관련 함수가 상기 제2 처리 루틴에 따라 처리된 빈도를 포함할 수 있다. 예를 들어, 제1 애플리케이션의 쓰기 관련 함수가 상기 제2 처리 루틴에 따라 처리된 빈도가 높은 경우(e.g. 빈번하게 fsync()를 호출하는 애플리케이션), 제2 애플리케이션의 쓰기 관련 함수만이 상기 제2 처리 루틴에 따라 처리될 수 있다. 본 실시예에 따르면, 상기 제2 처리 루틴에 따른 처리 횟수가 줄어들기 때문에 애플리케이션의 데이터 쓰기 성능이 더욱 향상될 수 있다. 뿐만 아니라, 애플리케이션 간에 공평하게 상기 제2 처리 루틴에 따른 플러시 정책이 적용됨으로써, 동일한 수준의 데이터 안전성이 각 애플리케이션에게 제공될 수 있다.
다른 실시예에서, 상기 기 설정된 기준은 각 애플리케이션과 연관된 더티 데이터의 크기를 포함할 수 있다. 예를 들어, 캐싱 장치(100)는 더티 데이터의 크기가 더 큰 애플리케이션의 쓰기 관련 함수만을 상기 제2 처리 루틴에 따라 처리할 수 있다. 더티 데이터의 크기가 클수록, 캐시 장애에 따른 데이터 손실 비용이 증가하기 때문이다. 본 실시예에 따르면, 데이터의 손실 비용을 최소화함과 동시에 데이터 쓰기 성능은 향상될 수 있다.
또 다른 실시예에서, 상기 기 설정된 기준은 전술한 실시예들의 조합에 기초하여 결정될 수 있다.
지금까지 도 14를 참조하여 본 발명의 제3 실시예에 따른 캐싱 방법에 대하여 설명하였다. 상술한 방법에 따르면, 복수의 애플리케이션의 함수 호출이 라이트 쓰루 정책에 따라 처리되어야 하는 경우, 특정 애플리케이션의 함수 호출만을 상기 제2 처리 루틴에 따라 처리함으로써 전반적인 데이터 쓰기 성능이 향상될 수 있다.
지금까지 도 3 내지 도 14를 참조하여 본 발명의 몇몇 실시예들 및 그에 따른 효과들을 언급하였다. 본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
지금까지 도 3 내지 도 14를 참조하여 설명된 본 발명의 개념은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (12)

  1. 캐시(cache);
    쓰기 관련 함수의 호출을 후킹하는 후킹 모듈; 및
    상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하지 않는다는 판정에 응답하여 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하고, 상기 기 설정된 함수에 해당한다는 판정에 응답하여 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 처리 모듈을 포함하되,
    상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 상기 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고,
    상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴인 것을 특징으로 하는,
    캐싱 장치.
  2. 제1 항에 있어서,
    상기 기 설정된 함수는,
    동기화 함수인 것을 특징으로 하는,
    캐싱 장치.
  3. 제1 항에 있어서,
    상기 제1 처리 루틴은,
    상기 타깃 데이터의 파일 오프셋과 상기 캐시 상의 저장 위치 간의 매핑 정보를 생성하는 루틴을 포함하는 것을 특징으로 하는,
    캐싱 장치.
  4. 제1 항에 있어서,
    상기 처리 모듈은,
    백그라운드에서 동작하는 워커(worker)를 이용하여 상기 캐시에 존재하는 더티 데이터를 스토리지로 플러시(flush)하는 것을 특징으로 하는,
    캐싱 장치.
  5. 제1 항에 있어서,
    상기 처리 모듈은,
    상기 후킹된 쓰기 관련 함수의 타깃 파일에 대한 수정 빈도가 임계치 미만이라는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 상기 제2 처리 루틴에 따라 처리하는 것을 특징으로 하는,
    캐싱 장치.
  6. 제1 항에 있어서,
    상기 처리 모듈은,
    상기 후킹된 쓰기 관련 함수를 호출한 애플리케이션과 연관된 더티 데이터의 크기가 임계치 이상이라는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 상기 제2 처리 루틴에 따라 처리하는 것을 특징으로 하는,
    캐싱 장치.
  7. 제1 항에 있어서,
    상기 후킹된 쓰기 관련 함수는 제1 애플리케이션에 의해 호출된 제1 함수 및 제2 애플리케이션에 의해 호출된 제2 함수를 포함하고,
    상기 처리 모듈은,
    상기 제1 함수 및 상기 제2 함수가 모두 상기 기 설정된 함수에 해당한다는 판정에 응답하여, 기 설정된 기준에 기초하여 상기 제1 함수 및 상기 제2 함수 중 적어도 하나의 함수를 선택하고, 상기 선택된 함수를 상기 제2 처리 루틴에 따라 처리하는 것을 특징으로 하는,
    캐싱 장치.
  8. 제7 항에 있어서,
    상기 기 설정된 기준은,
    각 애플리케이션에 의해 호출된 쓰기 관련 함수가 상기 제2 처리 루틴에 따라 처리된 빈도를 포함하는 것을 특징으로 하는,
    캐싱 장치.
  9. 제7 항에 있어서,
    상기 기 설정된 기준은,
    각 애플리케이션과 연관된 더티 데이터의 크기를 포함하는 것을 특징으로 하는,
    캐싱 장치.
  10. 제1 항에 있어서,
    상기 후킹 모듈 및 상기 처리 모듈은,
    애플리케이션 레이어(application layer)에 위치하는 것을 특징으로 하는,
    캐싱 장치.
  11. 캐싱 장치에서 수행되는 캐싱(caching) 방법에 있어서,
    쓰기 관련 함수의 호출을 후킹(hooking)하는 단계;
    상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정하는 단계;
    상기 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하는 단계; 및
    상기 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 단계를 포함하되,
    상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고,
    상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴인 것을 특징으로 하는,
    캐싱 방법.
  12. 컴퓨팅 장치와 결합하여,
    쓰기 관련 함수의 호출을 후킹(hooking)하는 단계;
    상기 후킹된 쓰기 관련 함수가 기 설정된 함수에 해당하는지 여부를 판정하는 단계;
    상기 기 설정된 함수에 해당하지 않는다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제1 처리 루틴에 따라 처리하는 단계; 및
    상기 기 설정된 함수에 해당한다는 판정에 응답하여, 상기 후킹된 쓰기 관련 함수를 제2 처리 루틴에 따라 처리하는 단계를 실행시키되,
    상기 제1 처리 루틴은 상기 후킹된 쓰기 관련 함수의 타깃 데이터를 캐시에 기록하여 더티 데이터(dirty data)가 생성되도록 처리하는 루틴이고,
    상기 제2 처리 루틴은 상기 캐시에 존재하는 더티 데이터가 스토리지에 반영되도록 처리하는 루틴인, 컴퓨터로 판독가능한 기록매체에 저장된,
    컴퓨터 프로그램.
KR1020180052468A 2018-05-08 2018-05-08 캐싱 장치 및 방법 KR102052312B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180052468A KR102052312B1 (ko) 2018-05-08 2018-05-08 캐싱 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180052468A KR102052312B1 (ko) 2018-05-08 2018-05-08 캐싱 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190128369A true KR20190128369A (ko) 2019-11-18
KR102052312B1 KR102052312B1 (ko) 2019-12-05

Family

ID=68727949

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180052468A KR102052312B1 (ko) 2018-05-08 2018-05-08 캐싱 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102052312B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130010690A (ko) 2011-07-19 2013-01-29 에스케이텔레콤 주식회사 송신장치 및 수신장치와 그 장치의 동작 방법
KR20170042593A (ko) * 2014-08-15 2017-04-19 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 파일 시스템에서의 플러싱 기법
KR101747894B1 (ko) * 2012-01-16 2017-06-15 퀄컴 인코포레이티드 하이브리드 동시 기록/후기록 캐시 정책 매니저들, 및 관련 시스템들 및 방법들
KR20170136366A (ko) * 2016-06-01 2017-12-11 삼성전자주식회사 전자 장치 및 전자 장치의 파일 데이터 저널링 방법
KR101826073B1 (ko) * 2013-09-27 2018-02-06 인텔 코포레이션 메모리 관리를 위한 캐시 동작들
KR101841997B1 (ko) * 2012-08-31 2018-03-27 샌디스크 테크놀로지스 엘엘씨 순응적 존속을 위한 시스템, 방법 및 인터페이스

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130010690A (ko) 2011-07-19 2013-01-29 에스케이텔레콤 주식회사 송신장치 및 수신장치와 그 장치의 동작 방법
KR101747894B1 (ko) * 2012-01-16 2017-06-15 퀄컴 인코포레이티드 하이브리드 동시 기록/후기록 캐시 정책 매니저들, 및 관련 시스템들 및 방법들
KR101841997B1 (ko) * 2012-08-31 2018-03-27 샌디스크 테크놀로지스 엘엘씨 순응적 존속을 위한 시스템, 방법 및 인터페이스
KR101826073B1 (ko) * 2013-09-27 2018-02-06 인텔 코포레이션 메모리 관리를 위한 캐시 동작들
KR20170042593A (ko) * 2014-08-15 2017-04-19 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 파일 시스템에서의 플러싱 기법
KR20170136366A (ko) * 2016-06-01 2017-12-11 삼성전자주식회사 전자 장치 및 전자 장치의 파일 데이터 저널링 방법

Also Published As

Publication number Publication date
KR102052312B1 (ko) 2019-12-05

Similar Documents

Publication Publication Date Title
US10242022B1 (en) Systems and methods for managing delayed allocation on clustered file systems
JP5663060B2 (ja) フラッシュメモリシステムの高速起動を容易にする方法およびシステム
US9507732B1 (en) System and method for cache management
US8997098B2 (en) Hypervisor-based server duplication system and method and storage medium storing server duplication computer program
US9547591B1 (en) System and method for cache management
US9680954B2 (en) System and method for providing virtual desktop service using cache server
US10824362B2 (en) File migration to persistent memory
US10140194B2 (en) Storage system transactions
WO2019061352A1 (zh) 数据加载方法及装置
US20050071550A1 (en) Increasing through-put of a storage controller by autonomically adjusting host delay
US10318166B1 (en) Preserving locality of storage accesses by virtual machine copies in hyper-converged infrastructure appliances
CA3071330C (en) Dynamic trim processing with disk caching
US9804965B2 (en) Virtual machine host server apparatus and method for operating the same
US10901914B2 (en) Method for writing multiple copies into storage device, and storage device
KR102052312B1 (ko) 캐싱 장치 및 방법
US10983818B2 (en) Method and system for preventing execution of a dirty virtual machine on an undesirable host server in a virtualization cluster environment
US20140059291A1 (en) Method for protecting storage device data integrity in an external operating environment
CN105612505A (zh) Cpu调度的方法和装置
CN107209720B (zh) 用于页面高速缓存的系统及方法以及存储介质
CN112748865A (zh) 用于存储管理的方法、电子设备和计算机程序产品
KR102456017B1 (ko) 응용 프로그램간 파일 공유 장치 및 방법
KR20210067014A (ko) 캐싱 장치 및 방법
KR102237566B1 (ko) 완전 복제된 가상 머신의 디스크 이미지 파일 캐싱 시스템 및 방법
US20140059293A1 (en) Method for protecting a gpt cached disks data integrity in an external operating system environment
US20230409240A1 (en) Systems and methods for managing a storage system

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right