WO2020101343A1

WO2020101343A1 - 데이터베이스 관리 시스템에서의 변경 데이터 캡쳐 구현 기법

Info

Publication number: WO2020101343A1
Application number: PCT/KR2019/015429
Authority: WO
Inventors: 조오욱; 윤정일; 강승훈; 이형도
Original assignee: 주식회사 실크로드소프트
Priority date: 2018-11-14
Filing date: 2019-11-13
Publication date: 2020-05-22
Also published as: KR20200056526A; KR102119258B1; US20210271660A1; US11314719B2

Abstract

본 개시의 일 실시예에 따라 인코딩된 명령들을 포함하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 소스(source) 데이터베이스 서버의 하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 변경 데이터 캡쳐(CDC:Change Data Capture)를 위한 단계들을 수행하도록 한다. 상기 단계들은: 소스 데이터베이스 서버에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써, 상기 트랜잭션과 연관되는 하나 이상의 객체들에 대하여 발생된 복수의 SQL(Structured Query Language) 연산들을 식별하는 단계; 식별된 복수의 SQL 연산들이 발생한 순서에 기반하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력(previous SQL operation history)이 CDC 파일에 존재하는지 여부를 판단하는 단계; CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정하는 단계; 결정된 정보를 상기 CDC 파일에 기록하는 단계; 및 CDC 파일을 타겟(target) 데이터베이스 서버로 전송할 것을 결정하는 단계를 포함할 수 있다.

Description

[규칙 제26조에 의한 보정 29.11.2019]　데이터베이스 관리 시스템에서의 변경 데이터 캡쳐 구현 기법

본 발명은 데이터베이스 관리 시스템(DBMS)에 관한 것으로, 보다 구체적으로 변경 데이터 캡쳐(CDC:Change Data Capture)에 관한 것이다.

기업의 비즈니스는 폭발적인 데이터의 증가와 다양한 환경 및 플랫폼의 등장으로 빠르게 확장되고 있다. 새로운 비즈니스 환경이 도래함에 따라서, 보다 더 효율적이고 유연한 데이터 서비스와 정보의 처리, 데이터 관리 기능이 필요하게 되었다. 이러한 변화에 맞춰서 기업 비즈니스 구현의 기반이 되는 고성능, 고가용성 및 확장성의 문제를 해결하기 위한 데이터베이스에 대한 연구가 계속되고 있다.

기업 내에서 관리되는 데이터는 종종 소스(source) 위치로부터 타겟(target) 위치로 마이그레이션 또는 복제되어 관리할 필요가 있다. 예를 들어, 은행 업무를 구현하기 위한 데이터베이스 시스템은, 액세스하는 클라이언트의 특성에 따라서 다수의 외부 고객들이 동시에 액세스할 수 있는 데이터베이스 및 내부 직원들이 액세스할 수 있는 데이터베이스로 분류될 수 있다. 소스 데이터베이스 시스템으로부터의 변경 데이터를 타겟 데이터베이스 시스템으로 넘겨주는 솔루션은 변경 데이터 캡쳐(CDC:Change Data Capture)라 지칭된다. CDC는 예를 들어 소스 데이터베이스 시스템에서의 로그 파일을 판독 및 해석하여 소스 데이터베이스 시스템에서의 변경 데이터를 복제하고자 하는 타겟 데이터베이스 시스템에 리플레이(replay)시키는 방식으로 구현될 수 있다.

데이터 백업이나 데이터 통합 작업을 수행하는 경우 방대한 데이터를 다뤄야한다. 원본 소스 데이터베이스 시스템에서 최근 변경된 데이터만 선택하여 다른 타겟 데이터베이스 시스템으로 옮기게 되면, 시스템의 로드를 줄일 수 있을 뿐만 아니라 전체적인 작업의 생산성이 향상될 수 있다. 특히, 하나의 시스템에 있는 대량의 데이터를 정기적으로 추출하여 다른 시스템으로 이동시키는 데이터 통합 혹은 데이터 웨어하우스의 업무의 경우, CDC 기술을 이용하게 되면 데이터를 추출하고 이동시키는데 소요되는 시간이 크게 줄어들 수 있다. 또한, 24시간 운영이 요구되는 업무 시스템의 경우에도 CDC 기술을 이용하게 되면, 다운타임 없이 실시간 백업과 데이터 통합이 가능할 수 있다.

나아가, 데이터베이스의 성능향상을 위한 쿼리 오프로딩(query offloading)을 구현하는데 있어서, 예를 들어 마스터(master) 데이터베이스에서는 쓰기/업데이트만을 허용하고, 스테이징(staging) 데이터베이스에서는 마스터 데이터베이스의 데이터의 적어도 일부를 복제하고 그리고 N개의 슬레이브(slave) 데이터베이스로 복제된 데이터를 복사하여 전달한다. 이러한 쿼리 오프로딩을 사용하는 경우, 데이터베이스에 대한 쓰기 로직은 마스터 데이터베이스에서 수행되고 그리고 읽기 로직은 슬레이브 데이터베이스에서 수행될 수 있어서, 트랜잭션의 종류에 따른 분리가 가능해질 수 있다. 이에 따라 데이터베이스의 처리량이 증가되는 등과 같이 데이터베이스의 성능이 향상될 수 있다.

전술한 이유들 때문에, 주요 데이터베이스 업체들이 현재 CDC 솔루션에 대한 제품을 지속적으로 개발하고 있다.

이러한 CDC를 구현하기 위한 방식은 예를 들어, 로우 타임스탬프(row timestamp) 방식, 로우 버전(row version) 방식, 락(lock) 방식, 로우 상태 지시자(row state indicator) 방식, 테이블 트리거(table trigger) 방식 및 이벤트 프로그래밍(event programming) 방식이 존재할 수 있다.

특히 CDC 솔루션에 있어서, 복수개의 데이터베이스 시스템들 간의 데이터의 정합성을 유지하기 위해서는 양 데이터베이스들 간에 동기화가 이루어져야 한다. 하지만, 이러한 동기화를 구현하기 위해서는 데이터베이스 리소스들에 대한 오버헤드를 초래할 수 있다.

본 발명의 선행기술문헌은 하기와 같다.

(특허문헌 1) 미국 등록 특허 US6,999,977

(특허문헌 2) 미국 등록 특허 US7,111,023

(특허문헌 3) 미국 등록 특허 US7,657,576

(특허문헌 4) 미국 등록 특허 US7,647,354

(특허문헌 5) 미국 등록 특허 US9,727,624

(특허문헌 6) 미국 등록 특허 US9,442,995

(특허문헌 7) 미국 등록 특허 US8,510,270

(특허문헌 8) 미국 등록 특허 US9,298,878

(특허문헌 9) 미국 등록 특허 US7,461,103

(특허문헌 10) 미국 등록 특허 US7,065,538

(특허문헌 11) 미국 등록 특허 US7,668,878

(특허문헌 12) 미국 등록 특허 US6,832,229

(특허문헌 13) 미국 등록 특허 US8,799,213

(특허문헌 14) 미국 등록 특허 US9,230,002

(특허문헌 15) 미국 등록 특허 US9,009,104

(특허문헌 16) 미국 등록 특허 US6,981,004

(특허문헌 17) 미국 등록 특허 US6,976,022

(특허문헌 18) 미국 등록 특허 US7,908,243

(특허문헌 19) 미국 등록 특허 US9,841,909

(특허문헌 20) 미국 등록 특허 US9,495,252

(특허문헌 21) 미국 등록 특허 US8,676,759

(특허문헌 22) 미국 등록 특허 US9,646,042

(특허문헌 23) 미국 등록 특허 US9,047,392

(특허문헌 24) 미국 등록 특허 US7,831,574

(특허문헌 25) 미국 등록 특허 US8,874,506

(특허문헌 26) 미국 등록 특허 US8,385,657

(특허문헌 27) 미국 공개 특허 US2016-0314147

(특허문헌 28) 미국 공개 특허 US2018-0081924

본 개시내용의 실시예들은 DB의 중단 없이 효율적으로 변경 데이터 캡쳐(CDC)를 구현하기 위한 것이다.

본 개시내용의 실시예들은 타겟 DB에서 메모리를 효율적으로 관리하기 위한 것이다.

본 개시내용의 일 실시예에 따라 인코딩된 명령들을 포함하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 소스(source) 데이터베이스 서버의 하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 변경 데이터 캡쳐(CDC:Change Data Capture)를 위한 방법을 수행하도록 한다. 상기 방법은: 소스 데이터베이스 서버에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써, 상기 트랜잭션과 연관되는 하나 이상의 객체들에 대하여 발생된 복수의 SQL(Structured Query Language) 연산들을 식별하는 단계; 식별된 복수의 SQL 연산들이 발생한 순서에 기반하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력(previous SQL operation history)이 CDC 파일에 존재하는지 여부를 판단하는 단계; CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정하는 단계; 결정된 정보를 상기 CDC 파일에 기록하는 단계; 및 CDC 파일을 타겟(target) 데이터베이스 서버로 전송할 것을 결정하는 단계를 포함할 수 있다.

본 개시내용의 일 실시예에 따라 변경 데이터 캡쳐(CDC:Change Data Capture)를 구현하기 위한 하나 이상의 프로세서를 포함하는 데이터베이스 서버가 개시된다. 상기 데이터베이스 서버는, 소스 데이터베이스 서버, 또는 소스 데이터베이스 서버와 타겟 데이터베이스 서버 사이에 존재하는 임의의 형태의 에이전트 서버를 포함할 수 있다. 상기 하나 이상의 프로세서는: 소스 데이터베이스 서버에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써, 상기 트랜잭션과 연관되는 하나 이상의 객체들에 대하여 발생된 복수의 SQL(Structured Query Language) 연산들을 식별하는 동작; 식별된 복수의 SQL 연산들이 발생한 순서에 기반하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력(previous SQL operation history)이 CDC 파일에 존재하는지 여부를 판단하는 동작; CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정하는 동작; 결정된 정보를 상기 CDC 파일에 기록하는 동작; 및 CDC 파일을 타겟(target) 데이터베이스 서버로 전송할 것을 결정하는 동작을 수행할 수 있다.

본 개시내용의 일 실시예에 따라, 인코딩된 명령들을 포함하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우, 하나 이상의 프로세서로 하여금 변경 데이터 캡쳐(CDC:Change Data Capture)를 위한 방법을 수행하도록 한다. 상기 방법은: 소스 데이터베이스 서버로부터 CDC 파일을 수신하는 단계; CDC 파일에 기록된 메타 정보를 판독함으로써, 상기 타겟 데이터베이스 서버에 대응되는 메타 정보가 존재하는지 여부를 판단하는 단계; 대응되는 메타 정보가 존재하지 않는 경우, 상기 CDC 파일에 기록된 메타 정보를 메모리에 로딩하는 단계; CDC 파일에 기록된 SQL 연산을 판독하고, 그리고 상기 판독된 SQL 연산과 대응되는 상기 메모리 상에서의 상기 메타 정보를 사용함으로써 상기 SQL 연산과 대응되는 SQL 문(statement)을 생성하는 단계; 및 생성된 SQL 문을 상기 타겟 데이터베이스 서버에 적용시키는 단계를 포함할 수 있다.

본 개시내용의 일 실시예에 따라, 변경 데이터 캡쳐(CDC:Change Data Capture)를 구현하기 위한 하나 이상의 프로세서를 포함하는 데이터베이스 서버가 개시된다. 상기 데이터베이스 서버는, 타겟 데이터베이스 서버, 또는 소스 데이터베이스 서버와 타겟 데이터베이스 서버 사이에 존재하는 임의의 형태의 에이전트 서버를 포함할 수 있다. 상기 하나 이상의 프로세서는: 소스 데이터베이스 서버로부터 CDC 파일을 수신하는 동작; CDC 파일에 기록된 메타 정보를 판독함으로써, 상기 타겟 데이터베이스 서버에 대응되는 메타 정보가 존재하는지 여부를 판단하는 동작; 대응되는 메타 정보가 존재하지 않는 경우, 상기 CDC 파일에 기록된 메타 정보를 메모리에 로딩하는 동작; CDC 파일에 기록된 SQL 연산을 판독하고, 그리고 상기 판독된 SQL 연산과 대응되는 상기 메모리 상에서의 상기 메타 정보를 사용함으로써 상기 SQL 연산과 대응되는 SQL 문(statement)을 생성하는 동작; 및 생성된 SQL 문을 상기 타겟 데이터베이스 서버에 적용시키는 동작을 수행할 수 있다.

본 개시내용의 일 실시예에 따라 DB의 중단 없이 효율적으로 변경 데이터 캡쳐(CDC)가 구현될 수 있다.

본 개시내용의 일 실시예에 따라 타겟 DB에서 메모리가 효율적으로 관리될 수 있다.

다양한 실시예들이 도면을 참조하여 기재될 것이며, 여기서 유사한 참조번호들은 총괄적으로 유사한 구성요소 혹은 유사한 모듈을 지칭하는데 사용된다. 이하의 실시예들에서, 설명의 목적을 위하여, 다수의 특정한 세부사항들이 하나 이상의 실시예들에 대한 총체적 이해를 위해 제시된다. 하지만, 이러한 실시예(들)이 이러한 특정한 세부사항들 없이 실시될 수도 있다. 다른 예시들에서, 공지의 구조들 및 장치들이 하나 이상의 실시예들에 대한 설명을 용이하게 하기 위하여 블록도 형태로 도시된다.

도 1은 본 개시내용의 일 실시예에 따른 데이터베이스 시스템을 예시적으로 도시한다.

도 2는 본 개시내용의 일 실시예에 따른 데이터베이스 시스템에서의 소스 데이터베이스 서버 및 타겟 데이터베이스 서버를 예시적으로 도시한다.

도 3은 본 개시내용의 일 실시예에 따라 소스 데이터베이스 서버(혹은 에이전트 서버)에서 수행되는 CDC 방법을 예시적으로 도시하는 순서도이다.

도 4는 본 개시내용의 일 실시예에 따라 소스 데이터베이스 서버(혹은 에이전트 서버)에서 수행되는 CDC 방법을 예시적으로 도시하는 순서도이다.

도 5는 본 개시내용의 일 실시예에 따라 타겟 데이터베이스 서버(혹은 에이전트 서버)에서 수행되는 CDC 방법을 예시적으로 도시하는 순서도이다.

도 6은 본 개시내용의 일 실시예에 따라 데이터베이스 시스템에서 수행되는 CDC 동작들을 개략적으로 도시한다.

도 7은 본 개시내용의 일 실시예에 따라 데이터베이스 시스템에서 수행되는 CDC 동작들을 개략적으로 도시한다.

도 8은 본 개시내용의 일 실시예에 따라 CDC 솔루션을 구현하기 위한 예시적인 컴퓨팅 장치에 대한 블록도를 도시한다.

다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나 이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.

또한, 다양한 양상들 및 특징들이 다수의 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 컴포넌트들, 모듈들 등 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.

본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 하드웨어, 하드웨어와 소프트웨어의 조합, 및 소프트웨어를 의미할 수 있다.

더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.

또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.

본 명세서에서의 컴퓨터 판독가능 매체는 컴퓨터 시스템에 의해서 판독될 수 있도록 프로그램 및 데이터가 저장되는 모든 종류의 저장 매체를 포함할 수 있다. 본 발명의 일 양상에 따르면, 이러한 매체는 ROM(판독 전용 메모리), RAM(랜덤 액세스 메모리), CD(컴팩트 디스크)-ROM, DVD(디지털 비디오 디스크)-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등을 포함할 수 있다. 추가적으로, 이러한 매체는 네트워크로 연결된 시스템에 분산되어, 분산 방식으로 컴퓨터가 판독가능한 코드들 및/또는 명령들을 저장할 수도 있다.

본 발명의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 발명의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다. 또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.

도 1은 본 발명의 일 실시예에 따른 데이터베이스 시스템(100)에 대한 개략도를 도시한다.

도 1에서 도시되는 바와 같이, 데이터베이스 시스템(100)은 소스 데이터베이스 서버(110), 타겟 데이터베이스 서버(120) 및/또는 에이전트 서버(130)를 포함할 수 있다.

도 1에서 도시되지는 않았지만, 데이터베이스 시스템(100)은 클라이언트를 더 포함할 수 있다. 클라이언트는 데이터베이스 서버들과 통신하기 위한 매커니즘을 갖는 시스템에서의 임의의 형태의 노드(들)를 의미할 수 있다. 예를 들어, 이러한 클라이언트는 PC, 랩탑 컴퓨터, 워크스테이션, 단말 및/또는 네트워크 접속성을 갖는 임의의 전자 디바이스를 포함할 수 있다. 또한, 클라이언트는 에이전트, API(Application Programming Interface) 및 플러그-인(Plug-in) 중 적어도 하나에 의해 구현되는 임의의 서버를 포함할 수도 있다.

본 발명의 일 실시예에서, 클라이언트로부터 발행된 쿼리에 따라서, 소스 데이터베이스 서버(110), 타겟 데이터베이스 서버(120) 및/또는 에이전트 서버(130)의 후술될 동작들이 수행될 수 있다.

데이터베이스 서버들(110 및 120)은, 예를 들어, 마이크로프로세서, 메인프레임 컴퓨터, 디지털 싱글 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨터 시스템 또는 컴퓨터 디바이스를 포함할 수 있다. 이러한 데이터베이스 서버들(110 및 120) 각각은, 도시되지는 않았지만, DBMS(Database Management System) 및/또는 영구 저장 매체(persistent storage)를 포함할 수 있다.

본 명세서에서의 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)는 데이터베이스 시스템(100)에서의 임의의 형태의 노드(node)들을 의미할 수 있다. 추가적인 실시예로서, 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)는 하나의 데이터베이스 서버에 통합되어 관리 및/또는 클러스터링될 수도 있다. 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)는 하나의 데이터베이스 서버에 통합되어 서로 연계된 다중 데이터베이스를 구성할 수도 있다.

본 발명의 일 실시예에서, 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)는 서로 원격에 위치한 이종의 데이터베이스 서버를 의미할 수도 있다. 더불어, 도 1에서는 2개의 데이터베이스 서버들을 도시하고 있으나, 이보다 많은 데이터베이스 서버들 또한 본 발명의 범위에 포함될 수도 있다.

도 1에서는 도시되지 않았지만, 데이터베이스 서버들(110 및 120)은 버퍼 캐시를 포함하는 하나 이상의 메모리를 포함할 수 있다. 또한, 도 1에서는 도시되지 않았지만, 데이터베이스 서버(110 및 120)는 하나 이상의 프로세서를 포함할 수 있다. 따라서, 데이터베이스 서버 내의 DBMS는 상기 메모리 상에서 상기 프로세서에 의하여 동작될 수 있다.

여기서, 메모리는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 프로세서가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 메모리는 프로세서에 의하여 동작 될 수 있다. 메모리는 데이터 값을 포함하는 데이터 테이블 및/또는 트랜잭션에 따른 로그 레코드들을 저장할 수 있다. 예를 들어, 로그 레코드들을 메모리의 별도의 트랜잭션 로그 저장을 담당하는 별도의 구성요소에 저장될 수도 있다. 본 명세서에서의 트랜잭션이란, 통상적으로 정보의 교환이나 데이타베이스 업데이트 등과 같은 일련의 작업들에 대한 연속적인 처리단위를 의미할 수 있다. 이러한 트랜잭션은, 데이타베이스의 무결성(integrity)이 보장되는 상태에서 요청된 작업을 완수하기 위한 작업의 기본 단위를 나타낸다. 본 개시내용에서의 로그 레코드는 리두로그에 대한 레코드를 의미하며, 데이터베이스 내에서의 데이터의 구조 및 조직에 대한 변경내용(예컨대, 테이블, 컬럼(column), 로우(row), 데이터 타입, 인덱스 등에 관련 변경 내용을 식별할 수 있는 데이터 레코드를 포함할 수 있다.

본 개시내용의 일 실시예에서 데이터 테이블의 데이터 값 및/또는 로그 레코드들은 메모리로부터 영구 저장 매체에 기록될 수 있다. 추가적인 양상에서, 메모리는 버퍼 캐시를 포함하며, 상기 버퍼 캐시의 블록에는 이러한 데이터 및/또는 로그 레코드들이 저장될 수 있다. 상기 데이터 및/또는 로그 레코드들은 백그라운드 프로세스에 의하여 영구 저장 매체에 기록될 수 있다.

데이터베이스 서버 내의 영구 저장 매체는, 예를 들어 자기(magnetic) 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스와 같은, 임의의 데이터를 지속적으로 할 수 있는 비-휘발성(non-volatile) 저장 매체를 의미한다. 이러한 영구 저장 매체는 다양한 통신 수단을 통하여 데이터베이스 서버들(110 및 120)의 프로세서 및 메모리와 통신할 수 있다. 추가적인 실시예에서, 이러한 영구 저장 매체는 데이터베이스 서버(110 및 120) 외부에 위치하여 데이터베이스 서버(110 및 120)와 통신가능할 수도 있다.

DBMS는 데이터베이스 서버(110 및 120)에서 필요한 데이터를 검색, 삽입, 수정, 삭제 및/또는 로그 레코드 관리 등과 같은 동작들을 수행하는 것을 허용하기 위한 프로그램으로서, 전술한 바와 같이, 데이터베이스 서버(110 및 120)의 메모리에서 프로세서에 의하여 구현될 수 있다.

클라이언트와 데이터베이스 서버들(110 및 120) 또는 데이터베이스 서버들(110 및 120)은 네트워크(미도시)를 통하여 서로 통신할 수 있다. 본 발명의 일 실시예에 따른 네트워크는 공중전화 교환망(PSTN:Public Switiched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.

또한, 본 명세서에서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다. 추가적인 실시예로서, 본 명세서에서의 네트워크는 데이터베이스 링크(dblink)를 포함할 수도 있으며, 이에 따라 데이터베이스 서버들(110, 120)은 이러한 데이터베이스 링크를 통해 서로 통신하여 이로부터 또는 다른 데이터베이스 서버로부터의 데이터/로그 레코드들을 가져올 수도 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.

도 1에서 도시되는 바와 같이, 소스 데이터베이스 서버(110)는 타겟 데이터베이스 서버(120)의 원격에 위치할 수 있다. 또한, 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)는 동일 타입의 서버들이거나 또는 서로 호환되지 않는 이기종의(heterogeneous) 데이터베이스 서버를 의미할 수 있다.

추가적으로, 소스 데이터베이스 서버(110)는 임의의 타입의 데이터베이스로서 명령들을 실행 및 저장하기 위한 프로세서 및 메모리를 포함하는 디바이스를 포함할 수 있으나 이로 한정되지는 않는다. 즉, 소스 데이터베이스는 소프트웨어, 펌웨어 및 하드웨어 또는 이들의 조합을 포함할 수도 있다. 소프트웨어는 데이터베이스 테이블, 스키마, 인덱스 및/또는 데이터를 생성, 삭제 및 수정하기 위한 애플리케이션(들)을 포함할 수 있다. 소스 데이터베이스 서버(110)는 클라이언트 또는 다른 컴퓨팅 디바이스로부터의 트랜잭션들을 수신할 수 있으며, 예시적인 트랜잭션들은 소스 데이터베이스 서버(110)에서의 데이터, 테이블 및/또는 인덱스 등을 검색, 추가, 수정 및/또는 삭제하는 것을 포함할 수 있다.

타겟 데이터베이스 서버(120)는 소스 데이터베이스 서버(110)에서 발생된 데이터 변경 내용이 복제 또는 동기화되는 데이터베이스 서버를 의미하며, 전술한 소스 데이터베이스 서버(110)의 특징의 적어도 일부분을 포함할 수 있다. 예를 들어, 타겟 데이터베이스 서버(120)는 소스 데이터베이스 서버(110)의 데이터, 데이터 타입들, 테이블들, 인덱스들 및/또는 로그 레코드들에 대한 복사본을 저장할 수 있다.

본 명세서에서의 로그 레코드는 데이터베이스 내의 데이터의 구조, 조직에 대한 변경내용 및/또는 테이블, 컬럼, 데이터 타입, 인덱스, 데이터 등과 관련된 변경 내용을 식별할 수 있는 데이터 레코드를 의미할 수 있다. 이러한 로그 레코드는 트랜잭션 혹은 연산을 고유하게 식별하기 위한 정보 및/또는 상기 트랜잭션 혹은 연산에 따라 변경된 데이터 레코드를 식별하기 위한 정보를 의미할 수 있다.

본 발명의 일 실시예에서, 에이전트 서버(130)는 소스 데이터베이스 서버(110)와 타겟 데이터베이스 서버(120)간의 CDC를 구현하기 위한 별도의 엔티티를 의미할 수 있다. 따라서, 에이전트 서버(130)는 CDC 특징들을 구현하기 위한 임의의 동작들을 수행할 수 있다. 예를 들어, 에이전트 서버(130)는 본 개시내용에서 소스 데이터베이스 서버(110)로부터 데이터를 수신 및 처리한 다음에, 타겟 데이터베이스 서버(120)로 송신하여, 타겟 데이터베이스 서버(120)에서 변경 데이터가 적용될 수 있도록 허용할 수 있다.

에이전트 서버(130)는 임의의 타입의 서버로서 명령들을 실행 및 저장하기 위한 프로세서 및 메모리를 포함하는 디바이스를 포함할 수 있으나 이로 한정되지는 않는다. 에이전트 서버(130)는 소프트웨어, 펌웨어 및 하드웨어 또는 이들의 조합을 포함할 수도 있다. 예를 들어, 에이전트 서버(130)의 동작들을 구현하는 소프트웨어는 소스 데이터베이스(110) 및/또는 타겟 데이터베이스(120)에 설치될 수 있다. 예를 들어, 에이전트 서버(130)는 임의의 형태의 CDC 모듈로서 동작할 수 있다. 이러한 예시에서, CDC 모듈은 소스 데이터베이스 서버(120) 및/또는 타겟 데이터베이스 서버(130)에 설치되어, 소스 데이터베이스 서버(120)와 타겟 데이터베이스 서버(130) 간의 CDC 특징들이 구현될 수 있도록 허용할 수 있다.

도 1에서 도시되는 에이전트 서버(130)의 기능들은 소스 데이터베이스 서버(110) 및/또는 타겟 데이터베이스 서버(120)에 일부분으로 통합될 수도 있다. 예를 들어, 에이전트 서버(130)의 CDC 기능은 타겟 데이터베이스 서버(120)에 의해 대체될 수 있다.

도 2는 본 개시내용의 일 실시예에 따른 데이터베이스 시스템(100)에서의 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)를 예시적으로 도시한다.

도 2에서 도시되는 데이터베이스 서버들(110 및 120)의 컴포넌트들을 예시적인 것이며, 추가적인 컴포넌트들이 존재하거나, 혹은 상기 컴포넌트들 중 일부는 생략되거나 통합될 수도 있다.

도 2에서 도시되는 바와 같이, 소스 데이터베이스 서버(110)는 추출 모듈(210), 기록 모듈(220), 판독 모듈(230), 송수신 모듈(240) 및 저장 모듈(250)을 포함할 수 있다. 전술한 모듈들은 소스 데이터베이스 서버(110)의 하나 이상의 프로세서들이 수행하는 기능들에 대한 집합체를 의미할 수 있다. 또한, 전술한 모듈들에 의해 수행되는 동작들 및 기능들은 하나 이상의 스레드(thread) 혹은 프로세스에 의해 수행될 수 있다.

추출 모듈(210)은 소스 데이터베이스 서버(110)에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 획득할 수 있다. 추출 모듈(210)은 소스 데이터베이스 서버(110)로부터 리두 로그를 수신할 수 있거나 혹은 소스 데이터베이스 서버(110)에 리두 로그에 액세스할 수 있다. 클라이언트에 의해 개시된 트랜잭션에 따라 소스 데이터베이스 서버(110)에서 데이터, 테이블 및/또는 인덱스 등에 대한 변경이 발생되는 경우, 해당 트랜잭션에 대한 로그 레코드가 소스 데이터베이스 서버(110)에 기록될 수 있다. 이러한 경우, 추출 모듈(210)은 소스 데이터베이스 서버(110)에서의 로그 버퍼 및/또는 로그 파일 등에 기록된 트랜잭션에 대한 리두 로그를 확인 및 분석함으로써, 변경 데이터에 대한 로그 레코드를 획득할 수 있다. 이러한 경우, 추출 모듈(210)은 리두 로그를 분석함으로써 변경된 데이터만을 추출할 수 있다. 추출 모듈(210)은 하나 이상의 규칙에 기초하여 혹은 임의의 형태의 딥러닝 알고리즘에 기초하여, 추출된 로그 레코드를 분석할 수 있다.

추가적으로, 추출 모듈(210)은 로그 레코드들의 발생 시점에 따른 순서에 기초하여 정렬시킬 수 있다. 예를 들어, 추출 모듈(210)은 SCN(System Change Number)에 기초하여 로그 레코드들을 정렬시킬 수 있다. 즉, 기록 모듈(210)는 소스 데이터베이스 서버(110)의 로그 레코드들을 시계열적으로 정렬할 수 있다.

추출 모듈(210)은 트랜잭션과 연관되는 하나 이상의 객체들에 대해서 발생된 복수의 SQL 연산들을 식별할 수 있다. 본 명세서에서 SQL 연산은 SQL로 작성된 임의의 형태의 연산을 의미할 수 있다. SQL 연산은 예를 들어, DML(Data Manipulation Language) 연산, DDL(Data Definition Language) 연산 및/또는 DCL(Data Control Language) 연산을 포함할 수 있다. 추가적으로, 추출 모듈(210)은 식별된 SQL 연산들을 발생한 순서대로 정리하여 기록 모듈(220)에 전달할 수 있다.

기록 모듈(220)은 로그 레코드들의 발생 시점에 따른 순서에 기초하여 정렬시킬 수 있다. 예를 들어, 기록 모듈(220)은 SCN(System Change Number)에 기초하여 로그 레코드들을 정렬시킬 수 있다. 즉, 기록 모듈(220)는 소스 데이터베이스 서버(110)의 로그 레코드들을 시계열적으로 정렬할 수 있다. 따라서, SCN이 앞선 로그 레코드는 그 보다 후속하는 SCN을 가진 로그 레코드 보다 먼저 기록될 수 있다. 기록 모듈(220)은 식별된 복수의 SQL 연산들이 발생한 순서에 기초하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력이 CDC 파일에 존재하는지 여부를 판단할 수 있다. 본 명세서에서 CDC 파일은 소스 데이터베이스 서버(110)로부터 타겟 데이터베이스 서버(120)로 전달되는, 트랜잭션(연산) 순서대로 정리된 파일을 의미할 수 있다. 기록 모듈(220)은 CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정하고 그리고 결정된 정보를 CDC 파일에 기록할 수 있다.

예를 들어, 기록 모듈(220)은 SQL 연산에 대응되는 객체(예컨대, 테이블)에 대한 메타 정보가 CDC 파일에 존재하는지 여부에 기초하여, 이전 SQL 연산 이력이 CDC 파일에 존재하는지 여부를 판단할 수 있다. 여기에서의 메타 정보는, 테이블 유저 정보, 테이블 이름 정보, 컬럼 이름 정보, 컬럼 순서 정보 및 컬럼 타입 정보 중 적어도 하나를 포함할 수 있다. 또한, 기록 모듈(220)은 SQL 연산에 대응되는 객체에 대해서 이전에 DML 연산 혹은 DDL 연산이 수행되었는지 여부에 기초하여, 상기 이전 SQL 연산 이력이 상기 CDC 파일에 존재하는지 여부를 판단할 수 있다. 전술한 기록 모듈(220)의 이전 SQL 연산 이력에 대한 판단은, 트랜잭션과 연관되는 객체들 전체에 대해서 상기 SQL 연산이 발생한 순서대로(예컨대, SCN의 시간적 선후 관계에 따라서) 수행될 수 있다.

기록 모듈(220)은 CDC 파일에서의 이전 SQL 연산 이력이 존재하지 않는 경우, 해당 객체에 대한 DD(Data Dictionary) 정보를 사용하여 해당 객체에 대한 메타 정보를 생성하고, 그리고 상기 CDC 파일에서의 이전 SQL 연산 이력이 존재하는 경우, 상기 해당 객체에 대한 메타 정보를 생성하지 않을 것을 결정할 수 있다. 또한, 기록 모듈(220)은 해당 객체에 대한 메타 정보가 생성된 경우, 상기 해당 객체와 관련된 SQL 연산 및 상기 메타 정보를 상기 CDC 파일에 기록할 것을 결정하고, 그리고 상기 해당 객체에 대한 메타 정보가 생성되지 않은 경우, 상기 해당 객체와 관련된 SQL 연산을 상기 CDC 파일에 기록할 것을 결정할 수 있다.

판독 모듈(230)은 CDC 파일을 판독하여 CDC 파일을 타겟(target) 데이터베이스 서버로 전송하는 것을 허용하기 위하여 판독된 CDC 파일 혹은 CDC 파일에 기록된 정보를 송수신 모듈(240)로 전달할 수 있다. 판독 모듈(230)은 CDC 파일 또는 CDC 파일에 기록된 정보가 타겟 데이터베이스 서버(120)에 적합한 포맷으로 변환할 수도 있다.

송수신 모듈(240)은 데이터베이스 서버들(110 및 120)의 통신 기능 그리고/또는 클라이언트와의 통신 기능을 제공할 수 있다. 예를 들어, 송수신 모듈(240)은 소스 데이터베이스 서버(110)의 외부에 위치하는 경우, 추출된 로그 레코드들을 소스 데이터베이스 서버(110)로부터 수신할 수 있다. 송수신 모듈(240)은 임의의 네트워크 및/또는 데이터베이스 링크를 이용하여 데이터베이스 서버들(110 및 120) 간의 통신을 허용할 수 있다. 송수신 모듈(240)은 클라이언트로부터의 입력을 수신할 수 있다. 예를 들어, 송수신 모듈(240)은 클라이언트로부터 데이터 저장, 변경 및 조회 그리고 인덱스 빌드, 변경 및 조회와 관련된 요청을 수신할 수 있다. 추가적으로, 송수신 모듈(240)은 데이터베이스 서버로 프로시저를 호출하는 방식으로 데이터베이스 서버들 간의 정보 전달을 허용할 수 있다. 또한, 송수신 모듈(240)은 데이터베이스 복제와 관련하여 데이터베이스 서버들 간에 전달되는 임의의 데이터/정보를 송수신하는 기능을 제공할 수 있다.

송수신 모듈(240)은 전달받은 CDC 파일 혹은 CDC 파일에 기록된 정보를 타겟 데이터베이스 서버(120)로 송신할 수 있다. 송수신 모듈(240)은 CDC 파일 또는 CDC 파일에 기록된 정보가 타겟 데이터베이스 서버(120)에 적합한 포맷으로 변환하고 변환된 포맷을 타겟 데이터베이스 서버(120)로 송신할 수도 있다.

저장 모듈(250)은 추출된 로그 레코드를 저장하는 등과 같이 본 개시내용의 실시예들에 따른 CDC 특징을 수행하는 것과 관련되어 저장되는 임의의 데이터를 저장할 수 있다. 저장 모듈(250)은 DBMS 및/또는 영구저장매체에 포함될 수 있다. 추가적으로, 저장 모듈(250)은 업데이트 요청과 관련된 저장을 수행할 수 있다. 저장 모듈(250)은 데이터 테이블 및 인덱스 테이블 등을 저장할 것을 결정할 수 있다. 저장 모듈(250)은 데이터에 대해서 데이터 테이블 상에서의 저장 위치 그리고 영구저장매체 상에서의 저장 위치를 결정할 수도 있다.

도 2에서 도시되는 바와 같이, 타겟 데이터베이스 서버(120)는 송수신 모듈(310), 기록 모듈(320), 판독 모듈(330), 변경 및 반영 모듈(340) 및 저장 모듈(350)을 포함할 수 있다.

송수신 모듈(310)은 소스 데이터베이스 서버(110) 혹은 에이전트 서버(130)로부터 CDC 파일 혹은 CDC 파일에 저장된 정보를 수신할 수 있다. 송수신 모듈(310)은 전술한 소스 데이터베이스 서버(110)의 송수신 모듈(240)과 동일한 형태의 통신 기능을 제공할 수 있다.

기록 모듈(320)은 소스 데이터베이스 서버(110)로부터 수신된 CDC 파일 혹은 CDC 파일에 대한 정보를 타겟 데이터베이스 서버(120)의 CDC 파일에 기록할 수 있다. 예를 들어, 기록 모듈(320)은 소스 데이터베이스 서버(110)로부터 수신된 CDC 파일과 동일한 파일을 그대로 자신의 CDC 파일로 사용할 것을 결정하거나 또는 CDC 파일에 대한 정보와 동일한 정보를 CDC 파일에 기록할 수 있다. 추가적인 실시예에서, 소스 데이터베이스 서버(110)로부터 수신된 CDC 파일을 그대로 채용하는 경우, 타겟 데이터베이스 서버(120)에서의 기록 모듈(320)은 송수신 모듈(310)로 대체될 수도 있다.

판독 모듈(330)은 타겟 데이터베이스 서버(120)에 존재하는 CDC 파일을 판독할 수 있다. 판독 모듈(330)은 판독된 CDC 파일을 변경 및 반영 모듈(340)로 전달할 수 있다. 판독 모듈(330)은 CDC 파일을 타겟 데이터베이스 서버(120)의 형식에 맞도록 수정하여 변경 및 반영 모듈(340)로 전달할 수도 있다. 판독 모듈(330)은 소스 데이터베이스 서버(110)에 의해 기록된 순서대로 CDC 파일을 판독할 수 있다.

추가적으로, 판독 모듈(330)은 판독된 CDC 파일에 기초하여, 타겟 데이터베이스 서버(120)에서 변경 및 반영되어야 할 데이터를 결정할 수도 있다. 이러한 경우, 판독 모듈(330)은 타겟 데이터베이스 서버(120)에 반영되어 있는 데이터와 판독한 CDC 파일에 포함된 데이터를 비교하는 동작을 수행할 수 있다. 이에 따라 판독 모듈(330)은 변경 및 반영 모듈(340)이 타겟 데이터베이스 서버(120)로 최소한의 데이터만을 반영할 수 있도록 제어할 수 있다.

추가적으로, 판독 모듈(330)은 CDC 파일에 기록된 메타 정보를 판독함으로써, 타겟 데이터베이스 서버(120)에 대응되는 메타 정보가 존재하는지 여부를 판단할 수도 있다.

변경 및 반영 모듈(340)은 객체에 대한 메타 정보가 CDC 파일에 기록되었는지 여부를 확인할 수 있다. 변경 및 반영 모듈(340)은 CDC 파일에 기록된 메타 정보를 판독함으로써, 타겟 데이터베이스 서버(120)에 대응되는 메타 정보가 존재하는지 여부를 판단할 수 있다. 변경 및 반영 모듈(340)은 메타 정보가 존재하지 않는 경우 메모리 상에 메타 정보를 로딩하고 그리고 메타 정보가 존재하는 경우 존재하는 메타 정보를 그대로 사용할 수 있다. 즉, 변경 및 반영 모듈(340)은 대응되는 메타 정보가 타겟 데이터베이스 서버(120)의 메모리에 로딩되어 있는지 여부에 기초하여 메타 정보의 로딩 여부를 결정하며, 그리고 대응되는 메타 정보가 존재하는 경우, CDC 파일에 기록된 메타 정보를 메모리에 로딩하지 않고 타겟 데이터베이스 서버(120)의 로딩되어 있는 상기 대응되는 메타 정보를 사용할 것을 결정할 수 있다.

변경 및 반영 모듈(340)은 CDC 파일에 기록된 SQL 연산을 판독하고, 그리고 상기 판독된 SQL 연산과 대응되는 메모리 상에서의 메타 정보를 사용함으로써 상기 SQL 연산과 대응되는 SQL 문(statement)을 생성할 수 있다. 또한, 변경 및 반영 모듈(340)은 상기 생성된 SQL 문을 타겟 데이터베이스 서버(120)에 적용시킴으로써, 타겟 데이터베이스 서버(120)에 소스 데이터베이스 서버(110)에서의 변경 데이터가 최종적으로 반영될 수 있도록 허용할 수 있다.

예를 들어, 변경 및 반영 모듈(340)은 전달받은 CDC 파일에서 최초로 메타 데이터를 인식하고 해당 메타 데이터를 메모리에 로딩시킨 후, 그 다음 SQL 연산을 CDC 파일에서 인식한 뒤 로딩된 메타 데이터를 이용하여 해당 SQL 연산에 대한 SQL 문을 생성할 수 있다. 생성된 SQL 문을 타겟 데이터베이스 서버(120)에 반영한 이후, 변경 및 반영 모듈(340)은 해당 CDC 파일에서 트랜잭션에 대한 commit을 인식하고 commit을 타겟 데이터베이스 서버(120)에 반영할 수 있다.

도 3에서 도시되는 단계들은 예시적인 것이며, 추가적인 단계가 존재할 수 있거나 혹은 해당 단계들 중 일부가 생략될 수도 있다. 도 3에서 도시되는 단계들은 소스 데이터베이스 서버(110) 또는 에이전트 서버(130)에서 수행될 수 있다. 설명의 편의를 위해, 이하에서는 소스 데이터베이스 서버(110)에서 수행되는 것을 가정하여 설명하기로 한다.

소스 데이터베이스 서버(110)는, 소스 데이터베이스 서버(110)에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써, 트랜잭션과 연관되는 하나 이상의 객체들에 대해 발생된 SQL 연산들을 식별할 수 있다(410). 클라이언트에 의해 개시된 트랜잭션에 따라 소스 데이터베이스 서버(110)에서 데이터, 테이블 및/또는 인덱스에 대한 변경이 발생되는 경우, 해당 트랜잭션에 대한 로그 레코드가 소스 데이터베이스 서버(110)에 기록될 수 있다. 이러한 경우, 소스 데이터베이스 서버(110)는 소스 데이터베이스 서버(110)에서의 로그 버퍼 및/또는 로그 파일에 기록된 로그 레코드를 분석함으로써 변경 데이터를 추출할 수 있다. 예를 들어, 소스 데이터베이스 서버(110)는 소스 테이블에서 DML이 발생된 경우 가장 최근에 획득/추출한 변경 데이터 이후 신규 변경된 데이터를 변경 데이터로서 추출할 수 있다. 다른 예시로, 소스 데이터베이스 서버(110)는 소스 테이블에 대한 DDL이 발생된 경우, 해당 테이블에 대한 DDL을 변경 데이터로 인식하여, 타겟 데이터베이스 서버(120)에 반영되어야 하는 변경 데이터로서 추출할 수 있다. 추가적으로, 소스 데이터베이스 서버(110)는 변경 데이터들의 SCN 값을 기초로 하여 변경 데이터들을 시계열적으로 정렬할 수도 있다.

소스 데이터베이스 서버(110)는, 식별된 복수의 SQL 연산들이 발생한 순서에 기반하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력이 CDC 파일에 존재하는지 여부를 판단할 수 있다(420). 그리고나서, 소스 데이터베이스 서버(110)는, CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정할 수 있다(430). 예를 들어, 소스 데이터베이스 서버(110)가 제 1 DB 객체에 대한 연산들을 나타내는 변경 데이터를 추출한 경우, 소스 데이터베이스 서버(110)는 기존에 제 1 DB 객체에 대하여 이전에 DML 혹은 DDL 연산이 수행되었는지 여부를 판단할 수 있다. 이러한 예시에서, 소스 데이터베이스 서버(110)는 DML 혹은 DDL 연산이 상기 제 1 DB 객체에 대해서 이전에 수행되지 않았다면, 메모리로부터 상기 제 1 DB 객체에 대한 메타 정보(예컨대, DD(Data Dictionary) 정보)를 받아올 수 있다. 소스 데이터베이스 서버(110)는 제 1 DB 객체에 대한 DD 정보를 사용하여 제 1 DB 객체에 대한 메타 정보를 생성할 수 있다. 소스 데이터베이스 서버(110)는 DML 혹은 DDL 연산이 상기 제 1 DB 객체에 대해서 이전에 수행되었다면, 제 1 DB 객체 대한 메타 정보가 존재할 것이기 때문에 메타 정보를 추가로 생성하지 않을 것이다. 본 개시내용에서, 예를 들어, 메타 정보는 테이블 유저 정보, 테이블 이름 정보, 컬럼 이름 정보, 컬럼 순서 정보 및 컬럼 타입 정보 중 적어도 하나를 포함할 수 있다. 일 실시예에서, 소스 데이터베이스 서버(110)는, 특정 트랜잭션과 연관되는 객체들 전체에 대해서 SQL 연산이 발생한 순서대로, 해당 SQL 연산의 대상이 되는 객체 각각에 대한 이전 SQL 연산 이력이 CDC 파일에 존재하는지 여부를 판단할 수 있다.

소스 데이터베이스 서버(110)는 결정된 정보를 CDC 파일에 기록할 수 있다(440). 단계 430에서는 메타 정보를 생성하여 생성된 메타 정보가 CDC 파일에 기록될지 여부가 결정될 수 있다. 단계 440에서는, 소스 데이터베이스 서버(110)가 메타 정보와 SQL 연산 정보를 모두 CDC 파일에 기록하거나, 혹은 SQL 연산 정보만을 CDC 파일에 기록할 수 있다. 일 실시예에서, 소스 데이터베이스 서버(110)는 메타 정보 및 SQL 연산 정보를 CDC 파일에 기록하는데 있어서, 해당 객체에 대한 메타 정보를 SQL 연산 정보보다 CDC 파일에서의 앞 부분에 기록할 수 있다. 또한, 본 개시내용의 일 실시예에 따라서, 소스 데이터베이스 서버(110)는 제 1 트랜잭션이 제 2 트랜잭션 보다 먼저 커밋된 경우, 상기 제 1 트랜잭션에 포함된 SQL 연산을 상기 제 2 트랜잭션에 포함된 SQL 연산 보다 CDC 파일에서의 앞 부분에 기록할 수 있다. 전술한 기록 규칙들에 의해서, 소스 데이터베이스 서버(110)와 타겟 데이터베이스 서버(120)는 단일의 파일에 메타 정보 및 SQL 연산 정보를 모두 기록하면서도 효율적으로 CDC를 구현할 수 있다.

전술한 기록 규칙들에 따라 기록되는 경우, 타겟 데이터베이스 서버(120)에서 전달 받은 CDC 파일을 판독하고 해당 파일을 타겟 데이터베이스 서버(120)에 적용할 때, 특정 객체에 대한 메타 정보를 먼저 판독하고난 뒤, 해당 메타 정보와 관련된 SQL 연산 정보에 대응되는 SQL 문을 해당 메타 정보를 이용하여 용이하게 작성할 수 있게 된다.

전술한 바와 같이, 본 개시내용의 일 실시예에 따라서, SQL 연산 및 메타 정보가 단일의 CDC 파일에 함께 기록될 수 있기 때문에, 메타 정보만을 따로 관리하는 별도의 파일이 존재하는 실시예에 비해서, 효율적인 방식으로 CDC를 구현할 수 있다. 예를 들어, CDC 파일에는 SQL 연산 정보만을 기록하고 메타 정보를 기록 및 관리하는 별도의 파일이 존재하는 실시예의 경우, 메타 정보를 기록하는 파일에 모든 객체에 대한 메타 정보가 필수적으로 저장되어 있어야 한다. 나아가, 메타 정보만을 따로 관리하는 경우에는 DDL이 발생하는 경우, 메타 정보의 수정이 이루어져야 하기 때문에, 일명 "Stop The World"라 지칭될 수 있는 데이터베이스 서버에서의 작동 중단이 발생될 수 밖에 없다. 이러한 경우, 타겟 데이터베이스 서버(120)의 입장에서는 메타 정보가 메타 파일로 관리되기 때문에, 모든 객체들에 대한 메타 정보를 저장하는 메타 파일을 자신의 메모리에 로딩시켜놓아야 한다. 따라서, 이러한 실시예에 따르면 메모리의 사용량이 극대화된다는 단점이 존재한다. 하지만, 본 개시내용의 일 실시예에 따라서 메타 정보 및 SQL 연산 정보를 하나의 파일로 관리하면, 소스 데이터베이스 서버(110)와 타겟 데이터베이스 서버(120) 간에 메모리 사용량을 줄이면서 CDC를 구현하는데 있어서 데이터 레이턴시 또한 최소화시킬 수 있게 된다. 본 개시내용의 일 실시예에 따르면, 하나의 CDC 파일에 DML 혹은 DDL이 발생한 테이블에 대한 메타 정보만을 기록해 놓기 때문에, 메모리 사용량이 획기적으로 줄어들 수 있게 된다. 더불어, 본 개시내용의 일 실시예에 따르면, 특정 테이블에 대한 메타 데이터 단위로 메모리 로딩을 수행하며, 그리고 상기 특정 테이블에 대한 메타 데이터가 메모리에 로딩이 된 다음에 해당 특정 테이블에 대한 SQL 연산을 기록하기 때문에, 데이터베이스 서버에서 CDC를 구현하는데 있어서 성능 저하의 요소를 제거시킬 수 있다.

소스 데이터베이스 서버(110)는 CDC 파일을 타겟 데이터베이스 서버(120)로 전송할 것을 결정할 수 있다(450). 소스 데이터베이스 서버(110)와 타겟 데이터베이스 서버(120) 간의 통신은, 임의의 형태의 통신 네트워크 및/또는 임의의 형태의 dblink에 의해 수행될 수 있다.

도 4에서 도시되는 단계들은 예시적인 것이며, 추가적인 단계가 존재할 수 있거나 혹은 해당 단계들 중 일부가 생략될 수도 있다. 도 4에서 도시되는 단계들은 소스 데이터베이스 서버(110) 또는 에이전트 서버(130)에서 수행될 수 있다. 설명의 편의를 위해, 이하에서는 소스 데이터베이스 서버(110)에서 수행되는 것을 가정하여 설명하기로 한다.

도 4는 DML 연산이 이루어진 경우에 대한 실시예들 및 DDL 연산이 이루어진 경우에 대한 실시예들을 예시적으로 도시한다.

도 4에서 도시되는 바와 같이, 소스 데이터베이스 서버(110)는 소스 데이터베이스 서버(110)에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써 트랜잭션과 연관되는 하나 이상의 객체들에 대해 발생된 SQL 연산들을 식별할 수 있다(510). 클라이언트에 의해 개시된 트랜잭션에 따라 소스 데이터베이스 서버(110)에서 데이터, 테이블 및/또는 인덱스에 대한 변경이 발생되는 경우, 해당 트랜잭션에 대한 로그 레코드가 소스 데이터베이스 서버(110)에 기록될 수 있다. 이러한 경우, 소스 데이터베이스 서버(110)는 소스 데이터베이스 서버(110)에서의 로그 버퍼 및/또는 로그 파일에 기록된 로그 레코드를 분석함으로써 변경 데이터를 추출할 수 있다. 예를 들어, 소스 데이터베이스 서버(110)는 소스 테이블에서 DML이 발생된 경우 가장 최근에 획득/추출한 변경 데이터 이후 신규 변경된 데이터를 변경 데이터로서 추출할 수 있다. 다른 예시로, 소스 데이터베이스 서버(110)는 소스 테이블에 대한 DDL이 발생된 경우, 해당 테이블에 대한 DDL을 변경 데이터로 인식하여, 타겟 데이터베이스 서버(120)에 반영되어야 하는 변경 데이터로서 추출할 수 있다. 추가적으로, 소스 데이터베이스 서버(110)는 변경 데이터들의 SCN 값을 기초로 하여 변경 데이터들을 시계열적으로 정렬할 수도 있다.

소스 데이터베이스 서버(110)는 식별된 복수의 SQL 연산들 각각에 대한 타입을 결정할 수 있다(520). 예를 들어, 소스 데이터베이스 서버(110)는 식별된 복수의 SQL 연산들 각각이 DML 연산이지 또는 DDL 연산인지를 결정할 수 있다. 전술한 바와 같이, SQL 연산의 타입에 따라서, CDC 파일에 정보를 기록하는 방식이 상이해질 수 있다.

SQL 연산에 대한 타입이 DML 연산인 것으로 결정된 경우, 단계 530에서, 소스 데이터베이스 서버(110)는 DML 연산과 대응되는 객체에 대한 이전 SQL 연산 이력이 존재하는지 여부에 대한 판단이 필요하다고 결정할 수 있다(530). 그리고나서, 소스 데이터베이스 서버(110)는 CDC 파일에서의 이전 SQL 연산 이력이 존재하는지 여부를 판단할 수 있다.

이전 SQL 연산 이력이 CDC 파일에서 존재한다고 결정된 경우, 소스 데이터베이스 서버(110)는 해당 객체에 대한 DD 정보를 사용하여 해당 객체에 대한 메타 정보를 생성할 수 있다(550). 이전 SQL 연산 이력이 CDC 파일에 존재하지 않는다고 결정된 경우, 소스 데이터베이스 서버(110)는 해당 객체에 대한 메타 정보를 생성하지 않고 기존에 생성된 메타 정보를 이용할 것을 결정할 수 있다(550).

그리고나서, 소스 데이터베이스 서버(110)는 해당 객체에 대한 메타 정보가 생성된 경우 해당 객체와 관련된 SQL 연산 및 생성된 메타 정보를 단일의 CDC 파일에 기록할 것을 결정할 수 있다(560). 또한, 소스 데이터베이스 서버(110)는 해당 객체에 대한 메타 정보의 생성이 필요하지 않다고 판단한 경우, SQL 연산을 상기 단일의 CDC 파일에 기록할 것을 결정할 수 있다.

그리고나서, 소스 데이터베이스 서버(110)는 CDC 파일을 타겟 데이터베이스 서버(120)로 전송할 것을 결정할 수 있다(570).

단계 520으로 되돌아가서, 식별된 복수의 SQL 연산에 대한 타입이 DDL 타입으로 결정되는 경우, DDL 연산의 특성에 따라서, 해당 객체에 대해서 새롭게 DD 정보가 인입된 DDL 연산에 따라 수정되어야 한다. 따라서, 소스 데이터베이스 서버(110)는 SQL 연산의 타입이 DDL 타입으로 결정된 경우, DDL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력이 CDC 파일에 존재하는지 여부를 판단하지 않을 것을 결정할 수 있다(540). 그리고나서, 소스 데이터베이스 서버(110)는 인입된 DDL 연산에 기초하여, DDL 연산에 대응되는 객체에 대한 메타 정보를 생성하고 그리고 생성된 메타 정보를 CDC 파일에 기록할 것을 결정할 수 있다(540). 일 실시예에서, DDL 연산에 대응되는 메타 정보는, CDC 파일에서 DDL 연산 이전에 수행된 다른 SQL 연산들의 기록 위치 보다 후속된 위치에 기록될 수 있다. 그리고나서, 소스 데이터베이스 서버(110)는 정보가 기록된 CDC 파일을 타겟 데이터베이스 서버(120)로 전송할 것을 결정할 수 있다(570).

도 5는 본 개시내용의 일 실시예에 따라 타겟 데이터베이스 서버(120)(혹은 에이전트 서버(130))에서 수행되는 CDC 방법을 예시적으로 도시하는 순서도이다.

도 5에서 도시되는 단계들은 예시적인 것이며, 추가적인 단계가 존재할 수 있거나 혹은 해당 단계들 중 일부가 생략될 수도 있다. 도 5에서 도시되는 단계들은 타겟 데이터베이스 서버(120) 또는 에이전트 서버(130)에서 수행될 수 있다. 설명의 편의를 위해, 이하에서는 타겟 데이터베이스 서버(120)에서 수행되는 것을 가정하여 설명하기로 한다.

도 5에서 도시되는 바와 같이, 타겟 데이터베이스 서버(120)는 소스 데이터베이스 서버(110)로부터 CDC 파일을 수신할 수 있다(1010). 타겟 데이터베이스 서버(120)는 소스 데이터베이스 서버(110)에 의해 생성된 CDC 파일을 수신하여, 타겟 데이터베이스 서버(120)에 적용시킬 수 있다. 소스 데이터베이스 서버(110)와 타겟 데이터베이스 서버(120) 간의 통신은, 임의의 형태의 통신 네트워크 및/또는 임의의 형태의 dblink에 의해 수행될 수 있다.

타겟 데이터베이스 서버(120)는 수신된 CDC 파일에 기록된 메타 정보를 판독함으로써, 타겟 데이터베이스 서버(120)에 대응되는 메타 정보가 메모리에 존재하는지 여부를 판단할 수 있다(1020). CDC 파일은, 소스 데이터베이스 서버(110)에 의해 기록된 순서대로 타겟 데이터베이스 서버(120)에서 판독될 수 있다. 따라서, 타겟 데이터베이스 서버(120)는 소스 데이터베이스 서버(110)에서 사전결정된 기록 규칙에 따라 기록된 CDC 파일을 그 기록 순서대로 판독하고 그리고 판독된 순서대로 대응되는 동작들을 수행함으로써, 메모리의 사용량을 줄일 수 있을 뿐만 아니라 레이턴시 없이 CDC 동작이 수행될 수 있다.

타겟 데이터베이스 서버(120)는, 대응되는 메타 정보가 존재하지 않는 경우, 상기 CDC 파일에 기록된 메타 정보를 메모리에 로딩할 수 있다(1030). 또한, 타겟 데이터베이스 서버(120)는 대응되는 메타 정보가 존재하는 경우, 상기 CDC 파일에 기록된 메타 정보를 새롭게 로딩하지 않고, 기존에 존재하는 메타 정보를 사용할 것을 결정할 수 있다(1030). 예를 들어, 타겟 데이터베이스 서버(120)의 메모리에 특정 테이블에 대한 메타 정보가 사전에 로딩된 경우, 새롭게 메모리에 메타 정보를 로딩할 필요가 없기 때문에, 기존 로딩된 메타 정보를 이용하여 타겟 데이터베이스 서버(120)로의 변경 데이터 반영 동작이 수행될 수 있다.

타겟 데이터베이스 서버(120)는 CDC 파일에 기록된 SQL 연산을 순서대로 판독하고, 그리고 상기 판독된 SQL 연산과 대응되는 상기 메모리 상에서의 상기 메타 정보를 사용함으로써, SQL 연산과 대응되는 SQL 문을 생성할 수 있다(1040). 타겟 데이터베이스 서버(120)에 의해 생성되는 SQL 문은 소스 데이터베이스 서버(110)에서 수행한 SQL 연산을 발생시키기 위한 SQL 문을 의미할 수 있다. 타겟 데이터베이스 서버(120)는 CDC 파일에 기록된 SQL 연산 정보 및 메타 정보를 사용하여, 소스 데이터베이스 서버(110)에서 수행한 SQL 연산과 동일한 SQL 연산을 수행함으로써 자신의 DB에 변경 데이터를 자동적으로 반영시킬 수 있다.

그리고나서, 타겟 데이터베이스 서버(120)는 생성된 SQL 문을 상기 타겟 데이터베이스 서버에 적용시킬 수 있다. 전술한 방식을 통해, 자동적으로 소스 데이터베이스 서버(110)에서 수행된 SQL 연산에 대응되는 변경 데이터가 타겟 데이터베이스 서버(120)에 반영될 수 있다.

전술한 바와 같이, 타겟 데이터베이스 서버(120)가 자신의 DB에 변경 데이터를 반영할 때 사용하는 CDC 파일에는, 소스 데이터베이스 서버(110)의 객체들 중 SQL 연산이 발생한 객체에 대한 메타 정보가 기록될 수 있다. 이러한 방식으로, 타겟 데이터베이스 서버(120)는 자신의 메모리에 모든 객체들에 대한 메타 정보를 로딩할 필요가 없으며, 소스 데이터베이스 서버(110)에서의 변경 데이터와 관련되는 객체들에 대한 메타 정보만을 메모리에 로딩하기 때문에, 데이터베이스 서버 내에서의 메모리 사용이 상당히 줄어들 수 있게 된다.

도 6은 본 개시내용의 일 실시예에 따라 데이터베이스 시스템에서 수행되는 CDC 동작들을 개략적으로 도시한다. 도 6에서는 소스 데이터베이스 서버(110)와 타겟 데이터베이스 서버(120) 간에 수행되는 동작들이 예시적으로 표현된다.

도 6에서 도시되는 바와 같이, 소스 데이터베이스 서버(110)는 소스 DBMS(610) 및 소스 프로세서(620)를 포함할 수 있다. 이러한 소스 DBMS(610)는 소스 데이터베이스 서버(110)의 메모리 상에서 소스 프로세서(620)에 의해 동작될 수 있다.

여기서, 메모리는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 프로세서가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 메모리는 전술한 바와 같이 프로세서에 의하여 동작 될 수 있다. 메모리는 변경 데이터 등과 같은 임의의 형태의 데이터를 저장할 수 있다. 또는 메모리는 데이터 값을 포함하는 데이터 테이블(data table) 등을 저장할 수 있다. 본 발명의 일 실시예에서 변경 데이터 및/또는 상기 데이터 테이블의 데이터 값은 메모리로부터 영구 저장 매체에 기록될 수 있다. 추가적인 양상에서, 메모리는 버퍼 캐시를 포함하며, 상기 버퍼 캐시의 데이터 블록에는 데이터가 저장될 수 있다. 상기 데이터는 백그라운드 프로세스에 의하여 영구 저장 매체에 기록될 수 있다.

본 명세서에서의 영구 저장 매체는, 예를 들어 자기(magnetic) 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스와 같은, 임의의 데이터를 지속적으로 할 수 있는 비-휘발성(non-volatile) 저장 매체를 의미한다. 이러한 영구 저장 매체는 다양한 통신 수단을 통하여 데이터베이스 서버(110 및 120)의 프로세서 및 메모리와 통신할 수 있다. 추가적인 실시예에서, 이러한 영구 저장 매체는 데이터베이스 서버(110 및 120) 외부에 위치하여 데이터베이스 서버(110 및 120)와 통신가능할 수도 있다.

DBMS(610, 710)는 데이터베이스 서버(110 및 120)에서 필요한 데이터를 검색, 삽입, 수정 및/또는 삭제 등과 같은 동작들을 수행하는 것을 허용하기 위한 프로그램으로서, 전술한 바와 같이, 데이터베이스 서버(110 및 120)의 메모리에서 프로세서(620, 720)에 의하여 구현될 수 있다. 또한, 소스 DBMS(610)는 소스 데이터베이스 서버(110)에서 발생되는 트랜잭션에 대한 리두 로그를 생성, 관리 및 저장하도록 결정할 수 있다. 소스 프로세서(620)는 CDC 동작을 구현하기 위하여 저장된 리두 로그를 추출하고 그리고 분석하며(630), CDC 파일(670)에 해당 내용을 기록하고, 그리고 CDC 파일(670)을 판독하여(650) 네트워크(140)를 통하여 타겟 데이터베이스 서버(120)로 송신할 수 있다(660). 소스 프로세서(620)의 추출(630), 기록(640), 판독(650) 및 송신(660) 동작들 각각은, 전술한 바와 같이 도 2에서의 추출 모듈(210), 기록 모듈(220), 판독 모듈(230) 및 송수신 모듈(240)이 수행하는 동작들에 대응될 수 있다. 추가적으로, 추출(630), 기록(640), 판독(650) 및 송신(660) 동작들은 각각 개별적인 스레드에 의해 수행될 수 있다. 또한, 추출(630), 기록(640), 판독(650) 및 송신(660) 동작들 중 복수개가 하나의 스레드에 의해 수행될 수도 있다. 또한, 추출(630), 기록(640), 판독(650) 및 송신(660) 동작들은 개별적인 프로세스에 의해 각각 수행되거나 혹은 하나의 프로세스가 상기 동작들 중 복수의 동작들을 수행할 수도 있다. 이하에서는 설명의 편의를 위하여 하나의 프로세스가 하나의 모듈 동작을 수행하는 것을 가정하여 본 개시내용의 실시예들에 따른 CDC 특징들을 기술하기로 한다.

본 개시내용의 일 실시예에서, 트랜잭션에 대한 Commit 연산이 수행되는 경우, 소스 프로세서(620)에서의 CDC 동작이 개시될 수 있다. 예를 들어, 소스 프로세서(620)는 트랜잭션의 Commit 연산이 수행되는 경우, 추출 동작(630)을 수행할 수 있다. 다른 예시로, 소스 프로세서(620)는 사전결정된 횟수의 Commit 연산이 수행되는 경우(예컨대, 2개의 트랜잭션에 대한 Commit 연산들이 수행된 경우), 해당 Commit 연산들과 관련된 복수의 트랜잭션들에 대한 CDC 동작을 개시할 수 있다. 다른 실시예에서, 사전결정된 시간 주기 혹은 사전결정된 SCN 주기에 따라서, 소스 프로세서(620)의 CDC 동작이 개시될 수 있다.

도 6에서 도시되는 바와 같이, 소스 DBMS(610)에서 T1 객체 및 T2 객체에 대한 트랜잭션들(680)이 인입될 수 있다. 상기 트랜잭션들(680)은 제 1 트랜잭션 및 제 2 트랜잭션을 포함할 수 있다. 제 1 트랜잭션은 T1 객체에 대한 Delete 연산 및 Commit 연산을 포함할 수 있다. 제 2 트랜잭션은 T1 객체에 대한 Insert 연산, T2 객체에 대한 Update 연산 및 Commit 연산을 포함할 수 있다. 소스 DBMS(610)에서 수행된 SQL 연산들(680)은 Commit 연산이 수행된 시점에 기초하여 시계열적으로 그리고 트랜잭션 단위로 정렬될 수 있다. 도 6에서는 제 1 트랜잭션에 대한 Commit 연산이 제 2 트랜잭션에 대한 Commit 연산 보다 먼저 이루어졌기 때문에, 제 1 트랜잭션에 대한 SQL 연산들이 제 2 트랜잭션에 대한 SQL 연산들 보다 앞 부분에 배치될 수 있다.

소스 프로세서(620)(예컨대, 추출(630) 스레드)는 리두 로그에서 T1 객체에 대한 Delete 연산 및 Commit 연산을 추출하여 시간 순서대로 정렬하고 이를 예컨대, 판독(640) 스레드로 전달할 수 있다. 판독(640) 스레드는 가장 앞서 배치되어 있는 T1 객체에 대한 Delete 연산(즉, Delete T1)을 확인하고 그리고 CDC 파일(670)에 T1 객체에 대한 이전 SQL 연산 이력이 존재하는지 여부를 판단할 수 있다. 일례로, 판독(640) 스레드는 T1 객체에 대한 이전 DML 혹은 DDL이 이루어졌는지 여부를 판단할 수 있다. 도 6에서 도시되는 바와 같이, T1 객체에 대해서는 이전 SQL 연산이 수행되지 않았기 때문에, 판독(640) 스레드는 메모리 상에 보유하고 있는 DD(Data Dictionary) 정보를 이용하여 T1에 대한 메타 정보(즉, T1 DD)를 생성할 수 있다. 그리고나서, 판독(640) 스레드는 T1에 대한 메타 정보인 T1 DD와 T1에 대한 Delete 연산인 Delete T1을 CDC 파일(670)에 기록할 수 있다. 이러한 경우, 메타 정보인 T1 DD는 SQL 연산 정보인 Delete T1 보다 CDC 파일에서의 앞 부분에 기록될 수 있다. 추가적으로, 판독(640) 스레드는 T1 객체에 대한 commit 연산을 CDC 파일(670)에 기록할 수 있다. 이러한 경우, Commit 연산은 CDC 파일(670)에서의 Delete T1이 기록된 부분 보다 뒷 부분에 기록될 수 있다.

본 개시내용의 일 실시예에서, 추출(630) 스레드는 리두로그에서 제 2 트랜잭션에 포함된, T1 객체에 대한 Insert 연산, T2 객체에 대한 Update 연산 및 제 2 트랜잭션의 Commit 연산을 추출할 수 있다. 추출(630) 스레드는 SQL 연산들의 발생 순서에 따라, Insert T1, Update T2 및 Commit 연산의 순서대로 배치할 수 있다. 제 2 트랜잭션이 제 1 트랜잭션 보다 이후에 Commit이 이루어졌기 때문에, 소스 DBMS(610)에서 수행된 SQL 연산들(680) 중 제 1 트랜잭션에 관한 SQL 연산들이 제 2 트랜잭션에 관한 SQL 연산들 보다 앞에 배치되도록 정렬될 수 있다. 판독(640) 스레드는 Delete T1 및 제 1 트랜잭션에 대한 Commit 연산을 판독 및 처리한 이후에, 트랜잭션 2와 관련된 연산들을 판독할 것이다. 판독(640) 스레드는 T1 객체에 대한 Insert 연산(즉, Insert T1)을 판독하고 CDC 파일(670)에 T1 객체에 대한 DML 혹은 DDL이 발생되었는지 여부(즉, 이전 SQL 연산 이력이 존재하는지 여부)를 판단할 수 있다. 상기 제 1 트랜잭션과 관련된 연산들(즉, Delete T1)을 처리하는데 있어서 CDC 파일(670)에 T1 객체에 대한 DD 정보가 기록되었기 때문에, 판독(640) 스레드는 CDC 파일(670)에 T1 객체에 대한 이전 SQL 연산 이력이 존재한다고 판단할 것이다. 이러한 상황에서, 판독(640) 스레드는 T1 객체에 대한 메타 정보를 생성하지 않고 T1 객체에 대한 Insert 연산(즉, Insert T1)을 CDC 파일(670)에서의 다음 기록 위치에 기록할 수 있다. 그리고나서, 판독(640) 스레드는 T2 객체에 대한 Update 연산을 인식할 수 있다. 판독(640) 스레드는 T2 객체에 대해서 이전 SQL 연산이 존재하는지 여부를 CDC 파일(670)을 체크하여 판단할 것이고, 이전 SQL 연산이 존재하지 않기 때문에, 메모리 상에 저장되어 있는 T2 객체에 대한 DD 정보를 이용하여 T2 객체에 대한 메타 정보(즉, T2 DD)를 생성할 수 있다. 그리고나서, 판독(640) 스레드는 T2 객체에 대한 메타 정보를 CDC 파일(670)의 다음 위치에 기록할 수 있다. 그리고나서, 판독(640)스레드는 T2 객체에 대한 메타 정보를 기록한 위치의 후속하는 위치에 T2 객체에 대한 Update 연산(즉, Update T2)을 기록할 수 있다. 추가적으로, 판독(640) 스레드는 T2 객체에 대한 Commit 연산을 CDC 파일(670)에 기록할 수 있다. 이러한 경우, Commit 연산은 CDC 파일(670)에서의 Update T2가 기록된 부분 보다 뒷 부분에 기록될 수 있다. 전술한 방식으로 트랜잭션들에 대한 Commit 시점 및 연산들의 발생 시점에 기초하여 CDC 파일(670)에 정보(690)가 기록될 수 있다. 이러한 방식으로 단일의 CDC 파일(670)에 메타 정보 및 SQL 연산 정보 모두가 기록될 수 있기 때문에, 효율적인 방식으로 CDC가 구현될 수 있다. 또한, Commmit이 발생한 메타 정보만이 소스 데이터베이스 서버(110)에서의 메모리에서 로딩될 수 있으며 그리고 CDC 파일(670)에는 본 개시내용의 실시예들에 따른 기록 규칙에 따른 순서대로 정보(690)가 기록되기 때문에, 타겟 데이터베이스 서버(120)는 소스 데이터베이스 서버(110)가 작성한 단일의 CDC 파일(670)에 기록된 순서대로 판독하면서 자신의 DB에 변경 데이터들을 용이하게 반영할 수 있다. 즉, 타겟 데이터베이스 서버(120)가 자신의 DB에 변경 데이터를 반영할 때 사용하는 CDC 파일에는, 소스 데이터베이스 서버(110)의 객체들 중 SQL 연산이 발생한 객체에 대한 메타 정보가 기록될 수 있다. 이러한 방식으로, 타겟 데이터베이스 서버(120)는 자신의 메모리에 모든 객체들에 대한 메타 정보를 로딩할 필요가 없으며, 소스 데이터베이스 서버(110)에서의 변경 데이터와 관련되는 객체들에 대한 메타 정보만을 메모리에 로딩하기 때문에, 데이터베이스 서버 내에서의 메모리 사용이 상당히 줄어들 수 있게 된다.

본 개시내용의 추가적인 양상에서, 클라이언트(110)와 데이터베이스 서버(120 및 130) 또는 데이터베이스 서버들(120 및 130)은 네트워크(미도시)를 통하여 서로 통신할 수 있다. 본 발명의 일 실시예에 따른 네트워크는 공중전화 교환망(PSTN:Public Switiched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.

또한, 본 명세서에서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다. 또한, 본 명세서에서의 네트워크는 데이터베이스 링크(dblink)를 포함할 수 있으며, 이에 따라 소스 데이터베이스 서버(110) 및 타겟 데이터베이스 서버(120)(또는 에이전트 서버(130))는 이러한 데이터베이스 링크를 통해 서로 통신하여 다른 데이터베이스 서버로부터의 데이터를 가져올 수 있다. 일례로, 상기 데이터베이스 링크는 소스 데이터베이스 서버(110)로부터 타겟 데이터베이스 서버(120)로의 데이터베이스 링크를 포함할 수 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.

도 6에서 도시되는 바와 같이, 타겟 데이터베이스 서버(120)는 타겟 DBMS(710) 및 타겟 프로세서(720)를 포함할 수 있다. 이러한 타겟 DBMS(710)는 타겟 데이터베이스 서버(120)의 메모리 상에서 타겟 프로세서(720)에 의해 동작될 수 있다. 타겟 데이터베이스 서버(120)의 하드웨어적 구성들 및 타겟 DBMS(710)에 대한 설명은 전술한 소스 데이터베이스 서버(110)의 하드웨어적 구성들 및 소스 DBMS(610) 구성과 동일하기 때문에, 해당 설명은 여기에서 생략될 것이다.

타겟 프로세서(720)는 CDC 동작을 구현하기 위하여 CDC 파일(670)을 수신(730)하고, 자신의 CDC 파일(770)에 해당 내용을 기록(740)하고(또는 수신된 CDC 파일(670)을 그대로 자신의 CDC 파일(770)로 사용하고), 그리고 CDC 파일(770)을 판독(750)하여, 타겟 DBMS(710)로 변경 데이터를 반영(760)시킬 수 있다. 타겟 프로세서(720)의 수신(730), 기록(740), 판독(750) 및 변경/반영(760) 동작들 각각은, 전술한 바와 같이 도 2에서의 수신 모듈(310), 기록 모듈(320), 판독 모듈(330) 및 변경/반영 모듈(340)이 수행하는 동작들에 대응될 수 있다. 추가적으로, 수신(730), 기록(740), 판독(750) 및 변경/반영(760) 동작들은 각각 개별적인 스레드에 의해 수행될 수 있다. 또한, 수신(730), 기록(740), 판독(750) 및 변경/반영(760) 동작들 중 복수개가 하나의 스레드에 의해 수행될 수도 있다. 또한, 수신(730), 기록(740), 판독(750) 및 변경/반영(760) 동작들은 개별적인 프로세스에 의해 각각 수행되거나 혹은 하나의 프로세스가 상기 동작들 중 복수의 동작들을 수행할 수도 있다. 이하에서는 설명의 편의를 위하여 하나의 프로세스가 하나의 모듈 동작을 수행하는 것을 가정하여 본 개시내용의 실시예들에 따른 CDC 특징들을 기술하기로 한다.

타겟 데이터베이스 서버(120)의 타겟 프로세서(720)(예컨대, 수신(730) 스레드)는 소스 데이터베이스 서버(110)로부터 CDC 파일(670)을 수신할 수 있다. 타겟 데이터베이스 서버(120)의 타겟 프로세서(720)는 수신된 CDC 파일(670)을 자신의 CDC 파일(770)에 동일하게 기록(740)하거나 혹은 수신된 CDC 파일(670)을 자신의 CDC 파일(770)으로 사용할 수도 있다. 타겟 프로세서(720)의 판독(750) 스레드는 CDC 파일(770)에 기록된 정보(780)를 판독하여 변경/반영(760) 스레드로 전달할 수 있다.

변경/반영(760) 스레드는 CDC 파일(770)에서 가장 먼저 기록된 T1 DD 라는 메타 정보를 판독하여, 자신의 메모리에 T1 객체에 대한 DD 메타 정보가 존재하는지 여부를 판단할 수 있다. 타겟 데이터베이스 서버(120)의 메모리에 T1 객체에 대한 메타 정보가 존재하지 않는 경우, 타겟 데이터베이스 서버(120)는 T1 DD 메타 정보를 자신의 메모리로 로딩할 수 있다. 그리고나서, 변경/반영(760) 스레드는 CDC 파일(770)에서 T1 DD라는 정보 이후에 기록된 Delete T1 확인할 수 있다. 변경/반영(760) 스레드는 메모리상에 로딩된 T1 DD 메타정보를 이용하여 T1 객체에 대한 Delete 연산을 수행하기 위한 SQL문을 자동으로 생성하여 타겟 DBMS(710)에 반영할 수 있다. 그리고나서, 변경/반영(760) 스레드는 Commit을 확인하고, Commit을 타겟 DBMS(710)에 반영할 수 있다. 그리고나서, 변경/반영(760) 스레드는 CDC 파일(770)에서의 다음번 기록된 정보인 Insert T1을 확인할 수 있다. T1 객체에 대한 연산이기 때문에, 변경/반영(760) 스레드는 메모리상에서 로딩된 T1 객체에 대한 메타정보를 이용하여 T1 객체에 Insert 연산을 수행하기 위한 SQL문을 생성할 수 있다.

변경/반영(760) 스레드는 CDC 파일(770)에서의 그 다음 위치에 기록되어 있는 T2 DD 메타정보를 확인할 수 있다. 변경/반영(760) 스레드는 T2 객체에 대한 DD 메타정보가 타겟 데이터베이스 서버(120)의 메모리에 존재하는지 여부를 검사할 수 있다. 변경/반영(760) 스레드는 자신의 메모리에 로딩되어 있는 T2 객체에 대한 메타 정보가 없다고 결정된 경우 T2 객체에 대한 메타 정보(즉, T2 DD 메타 정보)를 타겟 데이터베이스 서버(120)의 메모리에 로딩할 수 있다. 그리고나서, 변경/반영(760) 스레드는 CDC 파일(770)에서의 그 다음 위치에 기록되어 있는 Update T2를 인식할 수 있다. 변경/반영(760) 스레드는 T2 객체에 대한 메타 정보를 메모리에서 로딩할 수 있으며 그리고 상기 메타 정보를 이용함으로써 T2 객체에 대한 Update 연산과 대응되는 SQL 문을 자동으로 생성할 수 있다. 그리고나서, 변경/반영(760) 스레드는 T2 객체에 대한 Update 연산을 수행하기 위한 SQL 문을 자신의 DBMS(710)에 반영할 수 있다. 그리고나서, 변경/반영(760) 스레드는 Commit을 확인하고 이를 DBMS(710)에 반영할 수 있다.

본 개시내용의 일 실시예에 따라, CDC 파일에 대한 기록 규칙은 특정 객체에 대한 메타 정보를 1순위로 기록하고 특정 테이블에 대한 DML 혹은 DDL을 이에 후속하여 기록하는 것을 포함할 수 있다. 본 개시내용의 일 실시예에 따라, CDC 파일에 대한 기록 규칙은 Commit이 일어난 순서에 따라 기록될 트랜잭션들의 순서를 결정하고 그리고 메타 정보를 SQL 연산 정보에 앞에 기록함에 따라, 단일의 CDC 파일에 대한 전달을 통하여, CDC가 용이하게 이루어질 수 있다. 본 개시내용의 일 실시예에 따라, 모든 메타 정보를 메모리에 로딩시켜 놓고 CDC를 구현하는 구성(즉, 메타 정보와 SQL 연산 정보를 개별 파일에 의해 관리하는 구성)에 비해 메모리 사용량이 상당히 줄어들 수 있을 뿐만 아니라 DDL 발생 등의 상황에서 데이터베이스 서버의 동작이 멈추는 상황이 방지될 수 있다. 더불어, 본 개시내용의 일 실시예에 따른 CDC 특징들은 복수개의 테이블에 대한 DML 혹은 DDL을 반영하는데 있어서 기존 구조에 비해 메모리 사용량을 획기적으로 줄일 수 있다.

메타 정보와 SQL 연산 정보를 별도로 관리하는 CDC 구현 방식들은, 전체 객체들에 대한 메타 정보를 기록하는 별도의 파일을 양 데이터베이스 서버들 간에 송수신하면서 공유한다. 따라서, 이러한 구현 방식들은, 타겟 데이터베이스 서버(120)에서 DML이 발생하지 않은 객체에 대한 DD 정보도 메모리에 보유할 것을 요구한다. 즉, 타겟 데이터베이스 서버(120)는 모든 객체(예컨대, 테이블) 혹은 메모리 용량에 따라 최대한 많은 객체에 대한 DD 정보를 메모리에 보유하고 있어야 한다. 또한, 이러한 경우, DDL 발생시, 메타 정보를 기록한 파일을 수동으로 생성 및 전송해야하거나 또는 메타 정보를 기록한 파일을 자동으로 전송한다고 하더라도 소스 데이터베이스 서버(110)에서는 메타 파일의 전송이 완료될 때 까지 유휴(idle) 상태로 대기하여야 한다. 하지만, 본 개시내용의 일 실시예에 따른 CDC 구현 방식들은 메타 정보가 저장되는 메타 파일을 별도로 생성하여 전송할 필요가 없을 뿐만 아니라 소스 데이터베이스 서버(110)의 유휴 상태를 발생시키지 않는다. 따라서, 본 개시내용의 일 실시예에 따른 CDC 구현 방식들은 실시간 DDL 동기화를 허용할 수 있다. 나아가, 본 개시내용의 일 실시예에 따른 CDC 구현 방식들은 DML이 발생한 테이블에 대한 DD 정보를 관리하기 때문에 타겟 데이터베이스 서버(120)에서의 메모리 관리가 효율적으로 이루어질 수 있다. 예를 들어, 판독/기록과 관련하여 하나의 CDC 파일에 대한 DD를 관리하게 되며 그리고 변경/반영과 관련하여 DML 발생 객체에 대한 DD를 관리하게 될 것이기 때문에, 보다 리소스 효율적인 CDC 구현이 가능해질 수 있다.

도 7에서 도시되는 실시예는 도 6에서 도시되는 실시예에 DDL 특징이 추가된 것으로서, 도 6에서의 실시예들과 공통적인 내용들은 설명의 편의를 위해 이하에서는 생략될 것이다. 예를 들어, 도 7에서의 추출(830), 기록(840), 판독(850), 및 송신(860) 동작들은 각각 도 6에서의 추출(630), 기록(640), 판독(650), 및 송신(660) 동작들과 대응될 수 있다. 또한, 도 7에서의 수신(930), 기록(940), 판독(950), 및 변경/반영(960) 동작들은 각각 도 6에서의 수신(730), 기록(740), 판독(750), 및 변경/반영(760) 동작들과 대응될 수 있다. 또한, 도 7에서의 소스 DBMS(810), 소스 프로세서(820), 타겟 DBMS(910) 및 타겟 프로세서(920)는 각각 도 6에서의 소스 DBMS(610), 소스 프로세서(620), 타겟 DBMS(710) 및 타겟 프로세서(720)와 대응될 수 있다.

도 7에서 도시되는 바와 같이, 소스 DBMS(810)에 트랜잭션들(880)이 인입될 수 있다. 도 7에서의 예시에서, 상기 트랜잭션들(880)은 Insert T1, Update T2 및 Commit을 포함하는 제 1 트랜잭션, Delete T3 및 Commit을 포함하는 제 2 트랜잭션, 및 DDL T1을 포함하는 제 3 트랜잭션을 포함할 수 있다. 소스 프로세서(820)는 참조번호 880에서 도시되는 바와 같이, 인입된 트랜잭션들에 포함된 연산들을 발생 시간 순서대로 배치할 수 있다. 예를 들어, 추출(830) 스레드는 소스 DBMS(810)에서 발생된 트랜잭션들에 대한 리두 로그를 분석하여, 변경된 데이터에 대한 정보를 참조번호 880과 같이 추출하여 정렬시킬 수 있다.

제 2 트랜잭션이 제 1 트랜잭션보다 늦게 시작되었다고 하더라도 제 2 트랜잭션의 Commit 시점이 제 1 트랜잭션의 Commit 시점보다 빠르기 때문에, 소스 프로세서(820)는, 제 2 트랜잭션과 관련된 SQL 연산들을 제 1 트랜잭션과 관련된 SQL 연산들 보다 CDC 파일(870)에 먼저 기록할 수 있다. 트랜잭션들과 관련된 SQL 연산들은 트랜잭션 내에서 발생된 시간 순서에 따라 CDC 파일(870)에 기록될 수 있다.

도 7에 도시되는 바와 같이, 기록(840) 스레드는 제 2 트랜잭션에서 T3 객체에 대한 Delete 연산이 수행되었다는 것을 인식할 수 있다. 기록(840) 스레드는 T3 객체에 대한 메타 정보가 CDC 파일(870)에 존재하는지 여부를 확인할 수 있다. 즉, 기록(840) 스레드는 T3 객체에 대해 이전 SQL 수행 이력이 있는지 여부를 CDC 파일(870)에서 확인할 수 있다. T3 객체에 대한 메타 정보가 존재하지 않기 때문에, 기록(840) 스레드는 메모리 상에 로딩되어 있는 DD 정보를 이용함으로써 T3 객체에 대한 메타 정보를 생성하고 그리고 생성된 메타 정보(즉, T3 DD #1)를 CDC 파일(870)에 기록한다. 그리고나서, 기록(840) 스레드는 T3 객체에 대한 Delete 연산(즉, Delete T3)을 CDC 파일(870)에 기록할 수 있다. 추가적으로, 기록(840) 스레드는 제 2 트랜잭션에 대한 Commit 연산을 CDC 파일(870)에 기록할 수 있다. Commit 연산의 기록 위치는 Delete T3의 기록 위치 보다 뒷 부분이다.

기록(840) 스레드는 제 2 트랜잭션에 대한 CDC 파일(870)로의 기록을 완료한 후, 제 1 트랜잭션에 대한 CDC 파일(870)로의 기록을 시작할 수 있다. 기록(840) 스레드는 Insert T1을 확인하고 T1 객체에 대한 메타 정보가 CDC 파일(870)에 존재하는지 여부를 검사할 수 있다. 도 7에서 도시되는 바와 같이, 현재 CDC 파일(870)에는 T3 객체에 대한 메타 정보만이 기록되어 있기 때문에, 기록(840) 스레드는 T3 객체에 대한 메타 정보를 메모리의 DD 정보(예컨대, T3 객체에 대한 DD 정보)를 가지고 생성할 수 있다. 그리고나서, 기록(840) 스레드는 생성된 T3 객체에 대한 메타 정보(즉, TT DD #1)를 CDC 파일(870)로 기록할 수 있다. 그리고나서, 기록(840) 스레드는 이전에 확인한 Insert T1 연산을 CDC 파일(870)에서 메타 정보가 기록된 위치 이후의 위치에 기록할 수 있다. 기록(840) 스레드는 제 1 트랜잭션에서 Insert T1 다음에 발생된 SQL 연산인 Update T2 연산을 확인할 수 있다. 기록(840) 스레드는 T2 객체에 대한 메타 정보가 CDC 파일(870)에 존재하는지 여부를 검사할 수 있다. 현재 CDC 파일(870)에는 T3 객체에 대한 메타 정보 및 T2 객체에 대한 메타 정보가 기록되어 있기 때문에, 기록(840) 스레드는 T2 객체에 대한 메타 정보가 존재하지 않는다고 판단할 수 있다. 이러한 경우, 기록(840) 스레드는 메모리 상에 로딩되어 있는 T2 객체에 대한 DD 정보를 참고하여, T2 객체에 대한 메타 정보를 생성할 수 있다. 그리고나서, 기록(840) 스레드는 생성된 T2 객체의 메타 정보를 CDC 파일(870)로 기록할 수 있다. T2 객체의 메타 정보는 직전에 기록된 Insert T1의 기록 위치에 후속되는 위치에 기록될 수 있다. 그리고나서, 기록(840) 스레드는 기록된 메타 정보와 대응되는 Update T2 연산을 CDC 파일(870)에 후속해서 기록할 수 있다. 그리고나서 기록(840) 스레드는 제 1 트랜잭션에 대한 Commit 연산을 CDC 파일(870)에 기록할 수 있다. Commit 연산의 기록 위치는 Update T2의 기록 위치 보다 뒷 부분이다.

기록(840) 스레드는 제 1 트랜잭션에 대한 연산들을 모두 반영한 뒤에 제 3 트랜잭션(DDL T1을 포함함)을 확인할 수 있다. 기록(840) 스레드는 SQL 연산에 대한 타입을 확인하여, DDL 타입인 것으로 결정할 수 있다. 즉, 기록(840) 스레드는 SQL 연산에 대한 타입이 DML 연산인 것으로 결정된 경우, 상기 DML 연산과 대응되는 객체에 대한 상기 이전 SQL 연산 이력이 CDC 파일(870)에 존재하는지 여부를 판단하기로 결정할 수 있다. 또한, 기록(840) 스레드는 SQL 연산에 대한 타입이 DDL 연산인 것으로 결정된 경우, 상기 DDL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력이 CDC 파일(870)에 존재하는지 여부를 판단하지 않고, 상기 DDL 연산에 기초하여, 상기 DDL 연산에 대응되는 객체에 대한 메타 정보를 생성하고 그리고 생성된 메타 정보를 상기 CDC 파일에 기록할 것을 결정할 수 있다. 따라서, 기록(840) 스레드는 T1에 대한 DDL 연산에 대응되는 메타 정보를 생성하여 DDL T1을 CDC 파일(870)에 도 7에서 도시되는 바와 같이 기록할 수 있다.

판독(850) 스레드는 기록(840) 스레드에 의해 기록된 CDC 파일(870)을 판독하여 송신(860) 스레드로 전달할 수 있다. 송신(860) 스레드는 전달받은 CDC 파일(870)을 네트워크(140)를 통해 타겟 데이터베이스 서버(120)로 전송할 수 있다.

타겟 데이터베이스 서버(120)의 타겟 프로세서(920)는 수신(930) 스레드에 의해 CDC 파일(870)을 수신할 수 있다. 타겟 프로세서(920)의 기록(940) 스레드는 자신의 CDC 파일(970)에 수신된 CDC 파일(870)에 기록된 정보를 동일한 순서로 기록할 수 있다. 또는, 타겟 프로세서(920)의 기록(940) 스레드는 수신된 CDC 파일(870)을 그대로 자신의 CDC 파일(970)로 사용할 수도 있다. 따라서, 타겟 데이터베이스 서버(120)의 CDC 파일(970)은 참조번호 980과 같이 소스 데이터베이스 서버(110)에서 기록한 순서대로 정보들을 포함할 수 있다.

타겟 데이터베이스 서버(120)의 판독(950) 스레드는 CDC 파일(970)에 기록된 정보(980)를 변경/반영(920) 스레드로 전달할 수 있으며, 변경/반영(920) 스레드는 전달 받은 정보를 타겟 DBMS(910)에 반영하여, 타겟 DBMS(910)와 소스 DBMS(810)의 동기화를 수행할 수 있다. 변경/반영(920) 스레드는 참조번호 980로 표현된 정보의 기록 순서대로 타겟 DBMS(910)로의 반영을 수행할 수 있다. CDC 파일(970)에는 특정 SQL 연산에 대한 메타 정보가 먼저 기록되고 그 뒤에 대응되는 SQL 연산 정보가 기록될 수 있으며 그리고 DDL 연산에 대해서는 해당 메타 정보가 기록되기 때문에, 타겟 데이터베이스 서버(120)는 자신의 메모리에 많은 객체들에 대한 메타 정보를 로딩시킬 필요가 없으며, DML이 발생한 객체에 대한 메타 정보를 로딩시켜 반영을 처리할 수 있다. 구체적인 반영 방식에 대해서는 도 6과 관련하여 상술되었기 때문에, 도 7에서는 이에 대한 설명을 생략하기로 한다.

본 발명이 일반적으로 하나 이상의 컴퓨터 상에서 실행될 수 있는 컴퓨터 실행가능 명령어와 관련하여 전술되었지만, 당업자라면 본 발명이 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다는 것을 잘 알 것이다.

일반적으로, 프로그램 모듈은 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조, 기타 등등을 포함한다. 또한, 당업자라면 본 발명의 방법이 단일-프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알 것이다.

본 발명의 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.

컴퓨터는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 이러한 컴퓨터 판독가능 저장 매체는 휘발성 및 비휘발성 매체, 이동식 및 비-이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.

컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터등을 구현하는 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.

컴퓨터(1102)를 포함하는 본 발명의 여러가지 측면들을 구현하는 예시적인 환경(1100)이 나타내어져 있으며, 컴퓨터(1102)는 처리 장치(1104), 시스템 메모리(1106) 및 시스템 버스(1108)를 포함한다. 시스템 버스(1108)는 시스템 메모리(1106)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(1104)에 연결시킨다. 처리 장치(1104)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(1104)로서 이용될 수 있다.

시스템 버스(1108)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(1106)는 판독 전용 메모리(ROM)(1110) 및 랜덤 액세스 메모리(RAM)(1112)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(1110)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(1102) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(1112)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.

컴퓨터(1102)는 또한 내장형 하드 디스크 드라이브(HDD)(1114)(예를 들어, EIDE, SATA)―이 내장형 하드 디스크 드라이브(1114)는 또한 적당한 섀시(도시 생략) 내에서 외장형 용도로 구성될 수 있음―, 자기 플로피 디스크 드라이브(FDD)(1116)(예를 들어, 이동식 디스켓(1118)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), 및 광 디스크 드라이브(1120)(예를 들어, CD-ROM 디스크(1122)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(1114), 자기 디스크 드라이브(1116) 및 광 디스크 드라이브(1120)는 각각 하드 디스크 드라이브 인터페이스(1124), 자기 디스크 드라이브 인터페이스(1126) 및 광 드라이브 인터페이스(1128)에 의해 시스템 버스(1108)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(1124)는 USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘다를 포함한다.

이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(1102)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 발명의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.

운영 체제(1130), 하나 이상의 애플리케이션 프로그램(1132), 기타 프로그램 모듈(1134) 및 프로그램 데이터(1136)을 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(1112)에 저장될 수 있다. 운영 체제, 애플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(1112)에 캐싱될 수 있다. 본 발명이 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.

사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(1138) 및 마우스(1140) 등의 포인팅 장치를 통해 컴퓨터(1102)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(1108)에 연결되어 있는 입력 장치 인터페이스(1142)를 통해 처리 장치(1104)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.

모니터(1144) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(1146) 등의 인터페이스를 통해 시스템 버스(1108)에 연결된다. 모니터(1144)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.

컴퓨터(1102)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(1148) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1148)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(1102)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(1150)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(1152) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(1154)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.

LAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(1156)를 통해 로컬 네트워크(1152)에 연결된다. 어댑터(1156)는 LAN(1152)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(1152)은 또한 무선 어댑터(1156)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 모뎀(1158)을 포함할 수 있거나, WAN(1154) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(1154)을 통해 통신을 설정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(1158)은 직렬 포트 인터페이스(1142)를 통해 시스템 버스(1108)에 연결된다. 네트워크화된 환경에서, 컴퓨터(1102)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(1150)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.

컴퓨터(1102)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.

Wi-Fi(Wireless Fidelity)는 유선 없이도 인터넷 등으로의 연결을 가능하게 해준다. Wi-Fi는 이러한 장치, 예를 들어, 컴퓨터가 실내에서 및 실외에서, 즉 기지국의 통화권 내의 아무 곳에서나 데이터를 전송 및 수신할 수 있게 해주는 셀 전화와 같은 무선 기술이다. Wi-Fi 네트워크는 안전하고 신뢰성있으며 고속인 무선 연결을 제공하기 위해 IEEE 802.11(a,b,g, 기타)이라고 하는 무선 기술을 사용한다. 컴퓨터를 서로에, 인터넷에 및 유선 네트워크(IEEE 802.3 또는 이더넷을 사용함)에 연결시키기 위해 Wi-Fi가 사용될 수 있다. Wi-Fi 네트워크는 비인가 2.4 및 5 GHz 무선 대역에서, 예를 들어, 11Mbps(802.11a) 또는 54 Mbps(802.11b) 데이터 레이트로 동작하거나, 양 대역(듀얼 대역)을 포함하는 제품에서 동작할 수 있다.

본 발명의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 발명의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 발명의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.

여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.

제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 발명의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.

제시된 실시예들에 대한 설명은 임의의 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

상기와 같이 발명의 실시를 위한 최선의 형태에서 관련 내용을 기술하였다.

Claims

인코딩된 명령들을 포함하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 변경 데이터 캡쳐(CDC:Change Data Capture)를 위한 방법을 수행하도록 하며, 상기 방법은:

소스(source) 데이터베이스 서버에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써, 상기 트랜잭션과 연관되는 하나 이상의 객체들에 대하여 발생된 복수의 SQL(Structured Query Language) 연산들을 식별하는 단계;

식별된 SQL 연산에 대응되는 객체에 대한 메타 정보가 상기 CDC 파일에 존재하는지 여부에 기초하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력(previous SQL operation history)이 CDC 파일에 존재하는지 여부를 판단하는 단계;

상기 CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정하는 단계;

상기 결정된 정보를 상기 CDC 파일에 기록하는 단계; 및

상기 CDC 파일을 타겟(target) 데이터베이스 서버로 전송할 것을 결정하는 단계;

를 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 1 항에 있어서,

상기 메타 정보는: 테이블 유저 정보, 테이블 이름 정보, 컬럼 이름 정보, 컬럼 순서 정보 및 컬럼 타입 정보 중 적어도 하나를 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 1 항에 있어서,

상기 이전 SQL 연산 이력이 상기 CDC 파일에 존재하는지 여부를 판단하는 단계는,

상기 SQL 연산에 대응되는 객체에 대해서 이전에 DML(Data Manipulation Language) 연산 혹은 DDL(Data Definition Language) 연산이 수행되었는지 여부에 추가적으로 기초하여, 상기 이전 SQL 연산 이력이 상기 CDC 파일에 존재하는지 여부를 판단하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 1 항에 있어서,

상기 이전 SQL 연산 이력이 상기 CDC 파일에 존재하는지 여부를 판단하는 단계는,

상기 트랜잭션과 연관되는 객체들 전체에 대해서 상기 SQL 연산이 발생한 순서대로 수행되는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 1 항에 있어서,

상기 CDC 파일에는 상기 소스 데이터베이스 서버의 객체들 중 상기 SQL 연산이 발생한 객체에 대한 메타 정보가 기록되는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 1 항에 있어서,

상기 CDC 파일에 기록할 정보를 결정하는 단계는:

상기 CDC 파일에서의 이전 SQL 연산 이력이 존재하지 않는 경우, 해당 객체에 대한 DD(Data Dictionary) 정보를 사용하여 상기 해당 객체에 대한 메타 정보를 생성하고, 그리고 상기 CDC 파일에서의 이전 SQL 연산 이력이 존재하는 경우, 상기 해당 객체에 대한 메타 정보를 생성하지 않을 것을 결정하는 단계;

를 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 6 항에 있어서,

상기 CDC 파일에 기록할 정보를 결정하는 단계는:

상기 해당 객체에 대한 메타 정보가 생성된 경우, 상기 해당 객체와 관련된 SQL 연산 및 상기 메타 정보를 상기 CDC 파일에 기록할 것을 결정하고, 그리고 상기 해당 객체에 대한 메타 정보가 생성되지 않은 경우, 상기 해당 객체와 관련된 SQL 연산을 상기 CDC 파일에 기록할 것을 결정하는 단계;

를 더 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 7 항에 있어서,

상기 SQL 연산 및 상기 메타 정보는, 단일의 CDC 파일에 함께 기록되는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 6 항에 있어서,

상기 결정된 정보를 상기 CDC 파일에 기록하는 단계는,

상기 해당 객체에 대한 메타 정보를 상기 해당 객체와 관련된 SQL 연산 보다 상기 CDC 파일에서의 앞 부분에 기록하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 6 항에 있어서,

상기 트랜잭션은 제 1 트랜잭션 및 제 2 트랜잭션을 포함하며, 그리고

상기 제 1 트랜잭션이 상기 제 2 트랜잭션 보다 먼저 커밋(commit)된 경우, 상기 제 1 트랜잭션에 포함된 SQL 연산이 상기 제 2 트랜잭션에 포함된 SQL 연산 보다 상기 CDC 파일에서의 앞 부분에 기록되는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 10 항에 있어서,

상기 제 1 트랜잭션이 적어도 제 1 객체와 관련되고 그리고 상기 제 2 트랜잭션이 상기 제 1 객체 및 상기 제 1 객체와 상이한 제 2 객체와 관련되는 경우, 상기 결정된 정보를 상기 CDC 파일에 기록하는 단계는:

상기 제 1 트랜잭션에 따라 생성된 제 1 객체에 대한 메타 정보, 상기 제 1 트랜잭션에 따라 생성된 제 1 객체에 대한 SQL 연산, 상기 제 2 트랜잭션에 따라 생성된 제 1 객체에 대한 SQL 연산, 상기 제 2 트랜잭션에 따라 생성된 제 2 객체에 대한 메타 정보, 그리고 상기 제 2 트랜잭션에 따라 생성된 제 2 객체에 대한 SQL 연산의 순서로 상기 CDC 파일에 기록하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 1 항에 있어서,

상기 SQL 연산은, DML(Data Manipulation Language) 연산 및 DDL(Data Definition Language) 연산 중 적어도 하나의 타입을 포함하며,

상기 방법은:

상기 식별된 복수의 SQL 연산들 각각에 대한 타입을 결정하는 단계;

SQL 연산에 대한 타입이 DML 연산인 것으로 결정된 경우, 상기 DML 연산과 대응되는 객체에 대한 상기 이전 SQL 연산 이력이 상기 CDC 파일에 존재하는지 여부를 판단할 것을 결정하는 단계; 및

상기 SQL 연산에 대한 타입이 DDL 연산인 것으로 결정된 경우, 상기 DDL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력이 상기 CDC 파일에 존재하는지 여부를 판단하지 않고, 상기 DDL 연산에 기초하여, 상기 DDL 연산에 대응되는 객체에 대한 메타 정보를 생성하고 그리고 생성된 메타 정보를 상기 CDC 파일에 기록할 것을 결정하는 단계;

를 더 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
변경 데이터 캡쳐(CDC:Change Data Capture)를 구현하기 위한 하나 이상의 프로세서를 포함하는 데이터베이스 서버로서,

상기 하나 이상의 프로세서는:

소스 데이터베이스 서버에서 처리되는 트랜잭션에 대한 정보를 포함하는 로그 레코드를 분석함으로써, 상기 트랜잭션과 연관되는 하나 이상의 객체들에 대하여 발생된 복수의 SQL(Structured Query Language) 연산들을 식별하는 동작;

식별된 SQL 연산에 대응되는 객체에 대한 메타 정보가 상기 CDC 파일에 존재하는지 여부에 기초하여, 개별 SQL 연산과 대응되는 객체에 대한 이전 SQL 연산 이력(previous SQL operation history)이 CDC 파일에 존재하는지 여부를 판단하는 동작;

상기 CDC 파일에서의 이전 SQL 연산 이력의 존재 여부에 기초하여, 상기 CDC 파일에 기록할 정보를 결정하는 동작;

상기 결정된 정보를 상기 CDC 파일에 기록하는 동작; 및

상기 CDC 파일을 타겟(target) 데이터베이스 서버로 전송할 것을 결정하는 동작;

을 수행하는,

하나 이상의 프로세서를 포함하는 데이터베이스 서버.
인코딩된 명령들을 포함하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서로 하여금 변경 데이터 캡쳐(CDC:Change Data Capture)를 위한 방법을 수행하도록 하며, 상기 방법은:

소스 데이터베이스 서버로부터 CDC 파일을 수신하는 단계;

상기 CDC 파일에 기록된 메타 정보를 판독함으로써, 타겟 데이터베이스 서버에 대응되는 메타 정보가 존재하는지 여부를 판단하는 단계;

상기 대응되는 메타 정보가 존재하지 않는 경우, 상기 CDC 파일에 기록된 메타 정보를 메모리에 로딩하는 단계;

상기 CDC 파일에 기록된 SQL 연산을 판독하고, 그리고 상기 판독된 SQL 연산과 대응되는 상기 메모리 상에서의 상기 메타 정보를 사용함으로써 상기 SQL 연산과 대응되는 SQL 문(statement)을 생성하는 단계; 및

상기 생성된 SQL 문을 상기 타겟 데이터베이스 서버에 적용시키는 단계;

를 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 14 항에 있어서,

상기 CDC 파일은, 상기 소스 데이터베이스 서버에 의해 기록된 순서대로 상기 타겟 데이터베이스 서버에서 판독되는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 14 항에 있어서,

상기 타겟 데이터베이스 서버에 상기 대응되는 메타 정보가 존재하는지 여부를 판단하는 단계는, 상기 대응되는 메타 정보가 상기 타겟 데이터베이스 서버의 메모리에 로딩되어 있는지 여부에 기초하여 판단하며, 그리고

상기 방법은: 상기 대응되는 메타 정보가 존재하는 경우, 상기 CDC 파일에 기록된 메타 정보를 메모리에 로딩하지 않고 상기 타겟 데이터베이스 서버의 로딩되어 있는 상기 대응되는 메타 정보를 사용할 것을 결정하는 단계;

를 더 포함하는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
제 14 항에 있어서,

상기 CDC 파일에는 상기 소스 데이터베이스 서버의 객체들 중 상기 SQL 연산이 발생한 객체에 대한 메타 정보가 기록되는,

컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
변경 데이터 캡쳐(CDC:Change Data Capture)를 구현하기 위한 하나 이상의 프로세서를 포함하는 데이터베이스 서버로서,

상기 하나 이상의 프로세서는:

소스 데이터베이스 서버로부터 CDC 파일을 수신하는 동작;

상기 CDC 파일에 기록된 메타 정보를 판독함으로써, 타겟 데이터베이스 서버에 대응되는 메타 정보가 존재하는지 여부를 판단하는 동작;

상기 대응되는 메타 정보가 존재하지 않는 경우, 상기 CDC 파일에 기록된 메타 정보를 메모리에 로딩하는 동작;

상기 CDC 파일에 기록된 SQL 연산을 판독하고, 그리고 상기 판독된 SQL 연산과 대응되는 상기 메모리 상에서의 상기 메타 정보를 사용함으로써 상기 SQL 연산과 대응되는 SQL 문(statement)을 생성하는 동작; 및

상기 생성된 SQL 문을 상기 타겟 데이터베이스 서버에 적용시키는 동작;

을 수행하는,

하나 이상의 프로세서를 포함하는 데이터베이스 서버.