KR102247249B1 - 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램 - Google Patents

데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램 Download PDF

Info

Publication number
KR102247249B1
KR102247249B1 KR1020190137095A KR20190137095A KR102247249B1 KR 102247249 B1 KR102247249 B1 KR 102247249B1 KR 1020190137095 A KR1020190137095 A KR 1020190137095A KR 20190137095 A KR20190137095 A KR 20190137095A KR 102247249 B1 KR102247249 B1 KR 102247249B1
Authority
KR
South Korea
Prior art keywords
task
tasks
sub
processing
worker thread
Prior art date
Application number
KR1020190137095A
Other languages
English (en)
Inventor
남주현
박상영
Original Assignee
주식회사 티맥스티베로
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티맥스티베로 filed Critical 주식회사 티맥스티베로
Priority to KR1020190137095A priority Critical patent/KR102247249B1/ko
Priority to US16/836,902 priority patent/US20210132987A1/en
Application granted granted Critical
Publication of KR102247249B1 publication Critical patent/KR102247249B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2308Concurrency control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24535Query rewriting; Transformation of sub-queries or views
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30076Arrangements for executing specific machine instructions to perform miscellaneous control operations, e.g. NOP
    • G06F9/3009Thread control instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5017Task decomposition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5018Thread allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5022Workload threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

전술한 과제를 해결하기 위한 본 개시의 일 실시예에서, 하나 이상의 프로세서들에 의해 실행 가능한 컴퓨턴 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 상기 하나 이상의 프로세서로 하여금 베이스 관리 시스템에서 비동기적 데이터 처리를 위한 동작들을 수행하도록 하며, 상기 동작들은: 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하는 동작, 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 동작, 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하는 동작 및 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 동작을 포함할 수 있다.

Description

데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램{A COMPUTER PROGRAM FOR ASYNCHRONOUS DATA PROCESSING IN A DATABASE MANAGEMENT SYSTEM}
본 개시는 데이터베이스 관리 시스템(DBMS)에 관한 것으로, 보다 구체적으로 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램에 관한 것이다.
데이터베이스는 여러 사람에 공유되어 사용될 목적으로 통합하여 관리되는 표준 데이터의 집합을 의미한다. 일반적으로 한 조직체의 특정 영역과 연관된 데이터를 수집하며, 이는 여러 수준의 의사 결정을 지원하기 위한 정보를 제공하기 위해 사용될 수 있다.
오늘날 데이터의 양이 갈수록 방대해짐에 따라 데이터베이스에서 필요한 데이터를 검색하거나 데이터를 변경(삽입, 수정, 삭제 및 갱신)하기 위해서 이를 효율적으로 지원하는 데이터베이스 관리 시스템(이하, DBMS)의 활용도가 높아지고 있다.
DBMS는 모든 데이터를 테이블 형태로 데이터베이스 저장할 수 있다. 테이블은 데이터베이스에서 데이터를 저장하는 기본 구조를 말하며, 하나의 테이블은 하나 이상의 레코드들로 구성된다. 이러한 DBMS는 외부로부터 특정 질의(Query)가 입력되는 경우, 입력된 질의에 따라 데이터베이스에 데이터를 선택, 삽입, 삭제 및 갱신 등의 기능을 수행한다. 여기서 질의란, 데이터베이스의 테이블에 저장되어 있는 데이터에 대한 어떠한 요구, 즉 데이터에 대한 어떠한 조작을 하기 원하는지를 기술한 것을 의미하는 것으로서, SQL(Structured Query Language)과 같은 언어를 통해 표현될 수 있다.
상기 DBMS에서는 레코드를 테이블의 형태로 디스크 상에 저장하고, 외부(클라이언트 또는 다른 응용 프로그램)로부터의 질의에 대응하여 이를 갱신한다. 이때, 외부의 질의에 대응하는 하나의 task를 하나의 CPU가 처리하는 경우, 부하가 크고 속도가 느려질 수 있기 때문에, 여러 개의 CPU를 병렬로 연결하여 동기식 처리 방식을 통해 데이터 처리 속도를 향상시킬 수 있다.
동기식 처리 방식은, 직렬적으로 task를 수행하는 것을 의미할 수 있다. 구체적으로, 동기식 처리 방식은 task를 순차적으로 실행하는 것으로, 스레드가 특정 작업을 수행하는 경우, 다음 작업을 할당하여 대기시키고, 스레드가 특정 작업의 처리를 완료하면 대기 중이던 다음 작업을 처리하도록 하는 방식이다.
다만, 동기식 처리 방식을 통해 task를 순차적으로 수행하는 경우, 작업을 수행하는 복수의 스레드 간의 데이터 처리 속도 차이에 따라, 각 스레드에서 처리되는 작업이 불균형하여 특정 스레드가 대기 상태로 머물 수 있다. 이는, 스레드 자원 사용에 있어 비효율적이며, 작업 처리 속도의 저하를 초래할 우려가 있다.
따라서, DBMS에서 데이터 흐름에 따라 복수의 스레드에게 비동기적으로 작업을 할당하여 각 스레드가 균형적으로 작업을 수행하도록 함으로써 자원 활용에 효율성을 증대시키기 위한 컴퓨터 프로그램의 수요가 당 업계에 존재할 수 있다.
일본 등록 특허 제4611830호
본 개시는 전술한 배경기술에 대응하여 안출된 것으로, 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램을 제공하기 위한 것이다.
전술한 과제를 해결하기 위한 본 개시의 일 실시예에, 하나 이상의 프로세서들에 의해 실행 가능한 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 위한 동작들을 수행하도록 하며, 상기 동작들은: 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하는 동작, 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 동작, 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하는 동작 및 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 동작을 포함할 수 있다.
대안적으로, 제 1 항에 있어서, 상기 하나 이상의 작업 각각은, 상기 쿼리에 대응하는 동작들을 일정 기준으로 분류한 그룹으로, 데이터를 병렬 처리하는 병렬 처리 관계, 또는 데이터를 연계 처리하는 종속 관계 중 적어도 하나의 관계를 형성할 수 있다.
대안적으로, 상기 하나 이상의 작업이 종속 관계를 형성하는 경우, 상기 종속 관계를 형성하는 작업들은, 상기 서브 작업의 처리 결과에 따라 생성되는 데이터를 슬레이브 작업에 전달하는 마스터 작업 및 상기 마스터 작업으로부터 전달받은 데이터에 기초하여 연산을 수행하는 상기 슬레이브 작업을 포함할 수 있다.
대안적으로, 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 동작은, 상기 하나 이상의 작업 중 마스터 작업을 수행하기 위해 워커 스레드에게 상기 마스터 작업의 서브 작업을 할당하는 동작, 상기 마스터 작업에 대한 작업 진행도가 사전 결정된 임계치 이상인 경우, 상기 마스터 작업에 대응하는 슬레이브 작업을 수행하기 위한 적어도 하나의 추가 할당 워커 스레드를 식별하는 동작 및 상기 추가 할당 워커 스레드에게 상기 슬레이브 작업에 대한 서브 작업을 할당하는 동작을 포함할 수 있다.
대안적으로, 상기 추가 할당 워커 스레드는, 상기 마스터 작업에 대응하는 작업을 수행하는 워커 스레드, 서브 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나일 수 있다.
대안적으로, 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하는 동작은, 상기 하나 이상의 작업 각각에 할당된 메모리 사용량에 기초하여 상기 균형 여부를 판별하는 동작 또는, 상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신한 작업 관련 메시지에 기초하여 상기 균형 여부를 판별하는 동작 중 적어도 하나의 동작을 포함할 수 있다.
대안적으로, 상기 하나 이상의 작업 각각에 할당된 메모리 사용량에 기초하여 상기 균형 여부를 판별하는 동작은, 상기 하나 이상의 작업 각각에 할당된 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 동작 및 상기 하나 이상의 작업 각각이 형성하는 종속 관계 별 메모리 사용량이 사전 결정된 제 2 임계 사용량을 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 동작을 포함하고, 상기 종속 관계 별 메모리 사용량은, 마스터 작업 및 슬레이브 작업 각각에 포함된 작업들 각각의 메모리 사용량의 합으로 식별될 수 있다.
대안적으로, 상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신한 작업 관련 메시지에 기초하여 상기 균형 여부를 판별하는 동작은, 상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지에 기초하여 상기 하나 이상의 작업 각각의 데이터 처리 결과를 식별하는 동작 및 상기 하나 이상의 작업 간의 데이터 처리 결과의 차이가 사전 결정된 임계치를 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 동작을 포함할 수 있다.
대안적으로, 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 동작은, 상기 작업의 불균형과 관련된 작업의 서브 작업을 수행하기 위한 추가 할당 워커 스레드를 식별하는 동작 및 상기 추가 할당 워커 스레드에게 상기 불균형과 관련된 서브 작업을 할당하는 동작을 포함하고, 그리고 상기 추가 할당 워커 스레드는, 상기 불균형과 관련된 작업에 대한 서브 작업을 수행하는 워커 스레드, 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나일 수 있다.
본 개시의 다른 실시예에서 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 방법이 개시된다. 상기 방법은, 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하는 단계, 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 단계, 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하는 단계 및 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 단계를 포함할 수 있다.
본 개시의 다른 일 실시예에 따르면 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 서버가 개시된다. 상기 서버는 하나 이상의 코어를 포함하는 프로세서, 상기 프로세서에 의해 실행가능한 프로그램 코드들을 저장하는 메모리 및 클라이언트와 데이터를 송수신하는 네트워크부를 포함하며, 상기 프로세서는, 상기 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하고, 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하고, 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하고, 그리고 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당할 수 있다.
본 개시는 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 수행하는 컴퓨터 프로그램을 제공할 수 있다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 구체적인 세부사항들 없이 실시될 수 있음은 명백할 것이다.
도 1은 본 개시의 일 실시예와 관련된 서버의 블록 구성도를 도시한다.
도 2는 본 개시의 일 실시예와 관련된 하나의 쿼리에 대응하는 하나 이상의 작업 및 서브 작업을 개략적으로 나타낸 도면이다.
도 3은 본 개시의 일 실시예와 관련된 하나의 쿼리에 대응하여 분할된 작업을 예시적으로 도시한 예시도이다.
도 4는 본 개시의 일 실시예와 관련된 하나의 쿼리에 대응하여 분할된 작업을 수행하는 과정을 개략적으로 나타낸 예시도이다.
도 5는 본 개시의 다른 실시예와 관련된 하나의 쿼리에 대응하여 분할된 작업을 예시적으로 도시한 예시도이다.
도 6은 본 개시의 또 다른 실시예와 관련된 하나의 쿼리에 대응하여 분할된 작업을 예시적으로 도시한 예시도이다.
도 7은 본 개시의 일 실시예와 관련된 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 제공하기 위한 순서도를 도시한다.
도 8은 본 개시의 일 실시예와 관련된 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 수행하기 위한 모듈을 도시한다.
도 9는 본 개시의 일 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
다양한 실시예들이 이제 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시의 이해를 제공하기 위해서 제시된다. 그러나, 이러한 실시예들은 이러한 구체적인 설명 없이도 실행될 수 있음이 명백하다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시 적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시 적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
본 개시와 관련된 데이터베이스 관리 시스템에서 비동기적 데이터 처리는, 서버(100)를 통해 구현될 수 있다.
클라이언트는 서버(100)와 통신을 위한 매커니즘을 갖는 임의의 형태의 노드(들)를 의미할 수 있다. 예를 들어, 이러한 클라이언트는 PC, 랩탑 컴퓨터, 워크스테이션, 단말 및/또는 네트워크 접속성을 갖는 임의의 전자 디바이스를 포함할 수 있다. 또한, 클라이언트는 에이전트, API(Application Programming Interface) 및 플러그-인(Plug-in) 중 적어도 하나에 의해 구현되는 임의의 서버를 포함할 수도 있다.
본 개시의 일 실시예에 따르면, 클라이언트로부터 발행된 쿼리에 따라서, 서버(100)의 후술될 동작들이 수행될 수 있다.
서버(100)는 예를 들어, 마이크로프로세서, 메인프레임 컴퓨터, 디지털 싱글 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨터 시스템 또는 컴퓨터 디바이스를 포함할 수 있다. 이러한 서버(100)는 DBMS(Database Management System)을 포함할 수 있다. 또한, 서버(100)는 쿼리를 실행하기 위한 장치와 상호 교환 가능하게 사용될 수도 있다.
DBMS는 서버(100)에서 쿼리에 대한 파싱, 필요한 데이터를 검색, 삽입, 수정 및/또는 삭제 등과 같은 동작들을 수행하는 것을 허용하기 위한 프로그램으로써, 서버(100)의 저장부(120)에서 프로세서(130)에 의하여 구현될 수 있다.
서버(100)는 임의의 타입의 데이터베이스로서 명령들을 실행 및 저장하기 위한 프로세서(130) 및 저장부(120)를 포함하는 디바이스를 포함할 수 있으나 이로 한정되지는 않는다. 즉, 서버(100)는 소프트웨어, 펌웨어, 하드웨어 또는 이들의 조합을 포함할 수도 있다. 소프트웨어는 데이터베이스 테이블, 스키마, 인덱스 및/또는 데이터를 생성, 삭제 및 수정하기 위한 애플리케이션(들)을 포함할 수 있다. 서버(100)는 클라이언트 또는 다른 컴퓨팅 디바이스로부터의 트랜잭션을 수신할 수 있으며, 예시적인 트랜잭션들은 서버(100)에서의 데이터, 테이블 및/또는 인덱스 등을 검색, 삽입, 수정, 삭제 및/또는 레코드 관리하는 것을 포함할 수 있다.
도 1은 본 개시의 일 실시예와 관련된 서버의 블록 구성도를 도시한다.
도 1에 도시되는 바와 같이, 서버(100)는 네트워크부(110), 저장부(120) 및 프로세서(130)를 포함할 수 있다. 전술한 컴포넌트들은 예시적인 것으로서, 본 개시내용의 권리범위가 전술한 컴포넌트들로 제한되지 않는다. 즉, 본 개시내용의 실시예들에 대한 구현 양태에 따라서 추가적인 컴포넌트들이 포함되거나 또는 전술한 컴포넌트들 중 일부가 생략될 수 있다.
본 개시의 일 실시예에 따르면, 서버(100)는 클라이언트와 데이터를 송수신하는 네트워크부(110)를 포함할 수 있다. 또한, 네트워크부(110)는 서버(100)와 클라이언트와의 통신 기능을 제공할 수 있다. 네트워크부(110)는 클라이언트로부터의 입력을 수신할 수 있다. 예를 들어, 네트워크부(110)는 클라이언트로부터 데이터의 저장, 변경 및 조회와 인덱스 빌드의 변경 및 조회와 관련된 요청을 수신할 수 있다. 네트워크부(110)는 서버(100)의 외부에 위치하는 경우, 특정 테이블에 대하여 수신한 SQL에 기초한 연산을 수행하여 생성한 출력 테이블을 서버(100)로부터 수신할 수 있다. 추가적으로, 네트워크부(110)는 서버(100)로 프로시저를 호출하는 방식으로 서버(100)와 클라이언트 간의 정보 전달을 허용할 수 있다. 추가 실시예로서, 본 명세서에서의 네트워크부(110)는 데이터베이스 링크(dblink)를 포함할 수도 있으며, 이에 따라 서버(100)는 이러한 데이터베이스 링크를 통해 통신하여 다른 데이터베이스 서버로부터 데이터들을 수신할 수도 있다.
본 개시의 일 실시예에 따르면, 저장부(120)는 영구 저장 매체(persistent storage) 및 메모리를 포함할 수 있다.
영구 저장 매체는, 예를 들어 자기(magnetic) 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스와 같은, 임의의 데이터를 지속적으로 할 수 있는 비-휘발성(non-volatile) 저장 매체를 의미할 수 있다. 이러한 영구 저장 매체는 다양한 통신 수단을 통하여 서버(100)의 프로세서(130) 및 메모리와 통신할 수 있다. 추가적인 실시예에서, 이러한 영구 저장 매체는 서버(100) 외부에 위치하여 서버(100)와 통신 가능할 수도 있다.
메모리는, 예를 들어 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 프로세서가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 메모리는 프로세서(130)에 의하여 동작 될 수 있다. 메모리는 데이터 값을 포함하는 데이터 테이블(data table)을 임시로 저장할 수 있다. 데이터 테이블은 데이터 값을 포함할 수 있으며, 본 개시의 일 실시예에서 데이터 테이블의 데이터 값은 메모리로부터 영구 저장 매체에 기록될 수 있다. 추가적인 양상에서, 메모리는 버퍼 캐시를 포함하며, 상기 버퍼 캐시의 데이터 블록에는 데이터가 저장될 수 있다. 버퍼 캐시에 저장된 데이터는 백그라운드 프로세스에 의하여 영구 저장 매체에 기록될 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 통산적으로 서버(100)의 전반적인 동작을 제어할 수 있다. 프로세서(130)는 위에서 살펴본 구성요소들을 통해 신호, 데이터, 정보 등을 처리하거나, 저장부(120)에 저장된 응용프로그램을 구동함으로써, 데이터베이스 관리 성능을 향상시키기 위한 동작들을 수행할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할할 수 있다. 구체적으로, 프로세서(130)는 클라이언트로부터 발행된 쿼리를 수신하여 쿼리에 대응하는 동작을 식별할 수 있으며, 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할할 수 있다.
작업은, 쿼리에 대응하는 동작들을 일정 기준으로 분류한 그룹으로, 각각의 작업들은 서로 데이터를 병렬 처리하는 병렬 처리 관계, 또는 데이터를 연계 처리하는 종속 관계 중 적어도 하나의 관계를 형성할 수 있다. 또한, 작업은 워커 스레드에서 처리되는 데이터 처리의 최소 단위인 하나 이상의 서브 작업을 포함할 수 있다. 하나 이상의 서브 작업은, 작업 각각에서 워커 스레드가 처리할 수 있는 최소 단위일 수 있다. 예를 들어, 작업이 2000개의 로우를 포함하는 제 1 테이블의 레코드를 스캔하는 작업의 경우, 제 1 테이블의 1~1000 로우(row)의 레코드를 스캔하는 제 1 서브 작업 및 제 1 테이블의 1001~2000 로우의 레코드를 스캔하는 제 2 서브 작업을 포함할 수 있다. 전술한 각 서브 작업의 스캔 범위에 대한 구체적인 수치의 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
병렬 처리 관계는, 작업들 간의 형성되는 데이터 처리 관계가 데이터 처리의 병렬 수행이 가능한 관계일 수 있다. 예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 제 1 테이블 스캔에 대한 제 1 작업, 제 2 테이블 스캔에 대한 제 2 작업, 제 1 테이블 및 제 2 테이블의 특정 칼럼(column)에 대한 정렬을 수행하는 제 3 작업으로 분할되는 경우, 각 테이블을 스캔하는 작업은 병렬로 수행될 수 있다. 즉, 제 1 작업 및 제 2 작업은 병렬 처리 관계일 수 있다. 전술한 각 작업에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
종속 처리 관계는, 데이터를 연계 처리하는 작업들 간에 형성되는 관계일 수 있으며, 마스터 작업 및 슬레이브 작업을 포함할 수 있다. 마스터 작업은, 하나 이상의 작업 각각에 대한 서브 작업의 처리 결과를 슬레이브 작업에 전달하는 작업일 수 있다. 또한, 슬레이브 작업은 마스터 작업의 처리 결과에 대한 데이터에 기초하여 연산을 수행하는 작업일 수 있다. 예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 제 1 테이블 스캔에 대한 제 1 작업 및 제 1 테이블의 제 1 칼럼 및 제 2 칼럼의 레코드들에 대한 병합을 수행하는 제 2 작업으로 분할되는 경우, 제 1 작업에 대한 처리 이후, 제 2 작업의 처리가 수행될 수 있다. 즉, 제 1 테이블을 스캔하는 제 1 작업과, 제 1 작업을 통해 스캔된 레코드들을 병합하는 제 2 작업은 서로 종속 처리 관계일 수 있다. 이 경우, 제 1 작업은 제 2 작업으로 처리된 데이터를 전달하는 마스터 작업일 수 있으며, 제 2 작업은 제 1 작업의 처리 결과에 따른 데이터를 입력으로 하여 연산을 수행하는 슬레이브 작업일 수 있다. 전술한 각 작업에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
보다 구체적인 예를 들어, 클라이언트로부터 발행된 제 1 쿼리(200)가 T1 및 T2 테이블을 C3칼럼의 레코드를 기준으로 정렬하기 위한 쿼리인 경우, 프로세서(130)는 해당 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할할 수 있다. 자세히 설명하면, 프로세서(130)는 제 1 쿼리(200)에 대한 동작을 도 2에 도시된 바와 같이, T1 테이블의 레코드를 스캔하기 위한 제 1 작업(210), T2 테이블의 레코드를 스캔하기 위한 제 2 작업(220), 그리고 제 1 작업(210) 및 제 2 작업(220)을 통해 스캔된 레코드들을 C3 칼럼의 레코드들을 기준으로 정렬하는 제 3 작업(230)으로 분할할 수 있다. 이러한 분할은 쿼리에 대한 실행 계획(plan)에 기초하여 수행될 수 있다.
이 경우, 제 1 작업(210) 및 제 2 작업(220)은 각 테이블을 스캔하는 작업으로 서로 병렬 처리 관계일 수 있다. 다시 말해, T1 테이블 및 T2 테이블 각각의 레코드 스캔하는 제 1 작업(210) 및 제 2 작업(220)은 병렬로 수행될 수 있다. 또한, 제 1 작업(210) 및 제 2 작업(220)에서 각 테이블의 레코드에 스캔 작업이 수행된 이후, 제 3 작업(230)에 대한 처리가 수행될 수 있다. T1 테이블을 스캔하는 제 1 작업(210)과 제 1 작업을 통해 스캔된 레코드들을 병합하는 제 3 작업(230)은 서로 종속 처리 관계일 수 있다. 또한, T2 테이블을 스캔하는 제 2 작업(220)과 제 2 작업을 통해 스캔된 레코드들을 병합하는 제 3 작업(230)은 서로 종속 처리 관계일 수 있다. 즉, 제 1 작업(210)과 제 2 작업(220)은 처리된 데이터(즉, 스캔된 레코드)를 제 3 작업(230)으로 전달하는 마스터 작업일 수 있으며, 제 3 작업(230)은 제 1 작업(210)과 제 2 작업(220)의 처리 결과에 따른 데이터에 기초하여 정렬을 위한 연산을 수행하는 슬레이브 작업일 수 있다.
또한, 프로세서(130)에 의해 분할된 제 1 작업(210), 제 2 작업(220) 및 제 3 작업(230) 각각은 하나 이상의 서브 작업을 포함할 수 있다. 도 2에 도시된 바와 같이, 제 1 작업(210)은, T1 테이블에서 1~1000 로우의 레코드를 스캔하기 위한 제 1 서브 작업(211) 및 T1 테이블에서 1001~2000 로우의 레코드를 스캔하기 위한 제 2 서브 작업(212)을 포함할 수 있다. 또한, 제 2 작업(220)은, T2 테이블에서 1~1000 로우의 레코드를 스캔하기 위한 제 1 서브 작업(221) 및 T2 테이블에서 1001~2000 로우의 레코드를 스캔하기 위한 제 2 서브 작업(222)을 포함할 수 있다. 또한, 제 3 작업(230)은, 제 1 작업(210) 및 제 2 작업(220)을 통해 스캔된 레코드들을 C3 칼럼의 레코드들의 크기를 구간 별 분할하여 정렬을 수행하기 위한 제 1 서브 작업(231) 및 제 2 서브 작업(232)을 포함할 수 있다. 구체적으로, 제 3 작업(230)의 제 1 서브 작업(231)은 0~100까지의 C3 칼럼의 레코드를 기준으로 정렬을 수행하는 서브 작업일 수 있으며, 제 3 작업(230)의 제 2 서브 작업(232)은 101~200까지의 C3 칼럼의 레코드를 기준으로 정렬을 수행하는 서브 작업일 수 있다. 도 2를 참조하여 서술한 쿼리, 작업, 서브 작업에 대한 구체적인 기재들은, 본 개시의 이해를 돕기 위한 예시일 뿐, 본 개시는 이에 제한되지 않는다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당할 수 있다. 구체적으로, 프로세서(130)는 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할할 수 있으며, 분할된 하나 이상의 작업 각각은 병렬 처리 관계 또는, 종속 처리 관계를 형성함에 따라, 병렬적으로 처리되거나, 종속적으로 처리될 수 있다. 또한, 하나 이상의 작업 각각은 병렬 처리 가능한 하나 이상의 서브 작업을 포함할 수 있다. 다시 말해, 프로세서(130)는 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드로 할당하여 각 작업의 서브 작업이 병렬적으로 수행되도록 할 수 있다.
예를 들어, 제 1 작업이 제 1 테이블을 스캔하는 작업이며, 제 2 작업이 제 2 테이블을 스캔하는 작업인 경우, 제 1 작업 및 제 2 작업은 병렬적으로 처리될 수 있다. 또한, 제 1 작업은, 제 1 테이블의 1~100까지의 로우를 스캔하는 제 1 서브 작업 및 101~200까지의 로우를 스캔하는 제 2 서브 작업을 포함할 수 있으며, 제 2 작업은 제 2 테이블의 1~50까지의 로우를 스캔하는 제 1 서브 작업 및 51~100까지의 로우를 스캔하는 제 2 서브 작업을 포함할 수 있다. 이 경우, 제 1 작업 및 제 2 작업 각각에 포함된 서브 작업들은 병렬적으로 수행될 수 있다. 즉, 제 1 작업과 제 2 작업이 병렬로 처리됨과 동시에 각 작업에 대응하는 서브 작업들 또한 병렬 처리가 가능할 수 있다. 전술한 작업 및 서브 작업에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(130)는 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하고, 하나 이상의 작업 각각에 병렬 처리 가능한 서브 작업들을 하나 이상의 워커 스레드로 할당하여 병렬적으로 처리되도록 함으로써, 쿼리에 대응하는 동작의 처리 속도를 향상시킬 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 마스터 작업에 대한 서브 작업이 수행된 이후, 슬레이브 작업에 대한 서브 작업이 수행되도록 할 수 있다. 구체적으로, 하나 이상의 작업이 종속 관계를 형성하는 경우, 슬레이브 작업은 마스터 작업의 수행 결과에 따라 전달되는 데이터를 통해 연산을 수행하기 때문에, 마스터 작업에 대한 서브 작업이 수행된 이후 시점에 수행되어야 할 수 있다. 이에 따라, 프로세서(130)는 마스터 작업에 대한 서브 작업을 하나 이상의 워커 스레드에게 할당하여 데이터를 처리한 이후, 마스터 작업에 대응하는 슬레이브 작업에 대한 서브 작업을 하나 이상의 워커 스레드에게 할당할 수 있다.
자세히 설명하면, 프로세서(130)는 하나 이상의 작업 중 마스터 작업을 수행하기 위해 워커 스레드에게 마스터 작업의 서브 작업을 할당할 수 있다. 또한, 프로세서(130)는 마스터 작업에 대한 작업 진행도가 사전 결정된 임계치 이상인 경우, 마스터 작업에 대응하는 슬레이브 작업을 수행하기 위한 적어도 하나의 추가 할당 워커 스레드를 식별할 수 있다. 추가 할당 워커 스레드는, 마스터 작업에 대응하는 작업을 수행하는 워커 스레드, 서브 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나일 수 있다. 또한, 프로세서(130)는 추가 할당 워커 스레드에게 슬레이브 작업에 대한 서브 작업을 할당할 수 있다.
즉, 프로세서(130)는 마스터 작업에 대한 서브 작업이 사전 결정된 임계치만큼 처리되는 시점(즉, 슬레이브 작업에 대한 서브 작업이 처리 가능한 시점)에 대응하여 추가 할당 워커 스레드에게 슬레이브 작업에 대한 서브 작업을 할당하여 처리되도록 할 수 있다. 또한, 마스터 작업에 대한 서브 작업을 수행하는 워커 스레드, 서브 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나를 추가 할당 워커 스레드로 식별하여 비동기적으로 작업을 할당할 수 있어, 유휴 워커 스레드를 최소화시킬 수 있다.
따라서, 각 작업의 처리 가능한 최적의 시기에 각 작업의 서브 작업에 워커 스레드를 할당할 수 있어, 데이터 처리의 흐름을 원활하게 할 수 있다. 또한, 유휴 워커 스레드를 식별하여 비동기적으로 작업에 대한 서브 작업을 처리하도록 하여 워커 스레드 자원 활용에 효율을 증대시킬 수 있다.
프로세서(130)가 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 보다 구체적인 과정은 도 3 및 도 4를 참조하여 이하에서 후술하도록 한다.
도 3에 도시된 바와 같이, 클라이언트로부터 발행된 제 2 쿼리(300)가 테이블 T에 대한 정렬(즉, order by)을 수행하기 위한 쿼리인 경우, 프로세서(130)는 테이블 T에 대한 정렬 동작을 하나 이상의 작업으로 분할할 수 있다. 자세히 설명하면, 프로세서(130)는 제 2 쿼리(300)에 대응하는 동작이 테이블 T에 C2 칼럼에 위치한 레코드를 기준으로 각 로우의 레코드를 정렬하는 동작임을 식별할 수 있다. 프로세서(130)는 제 2 쿼리(300)에 대응하는 동작을 T 테이블의 레코드들을 스캔하기 위한 제 1 작업(400) 및 제 1 작업을 통해 식별된 레코드들을 C2 칼럼의 레코드를 기준으로 정렬하는 제 2 작업(500)으로 분할할 수 있다. 이 경우, 제 1 작업(400)의 수행 결과가 제 2 작업(500)의 입력에 해당하는 종속 관계이므로, 제 1 작업(400)이 마스터 작업일 수 있으며, 제 2 작업(500)은 마스터 작업에 대응하는 슬레이브 작업일 수 있다.
제 1 작업(400)은 도 4에 도시된 바와 같이, 테이블 T의 1~4 로우의 레코드를 스캔하기 제 1 서브 작업(411) 및 테이블 T의 5~8 로우의 레코드들을 스캔하기 위한 제 2 서브 작업(421)을 포함할 수 있다. 프로세서(130)는 제 1 서브 작업(411)을 제 1 워커 스레드(410)에 할당하고, 제 2 서브 작업(421)을 제 2 워커 스레드(420)에 할당하여 각 서브 작업이 병렬적으로 수행되도록 할 수 있다. 프로세서(130)는 제 1 작업(즉, 마스터 작업, 400)의 처리 결과(즉, 테이블 T의 레코드 스캔)를 제 2 작업에 전달할 수 있다.
제 1 작업(400)의 처리 결과에 대한 데이터를 전달받는 제 2 작업(즉, 슬레이브 작업, 500)은 C2 칼럼의 0~40까지의 레코드를 기준으로 정렬을 수행하는 제 1 서브 작업(511) 및 C2 칼럼의 41 이상의 레코드를 기준으로 정렬을 수행하는 제 2 서브 작업(521)을 포함할 수 있다.
또한, 프로세서(130)는, 도 4에 도시된 바와 같이, 제 2 작업(500)의 제 1 서브 작업(511)을 제 3 워커 스레드(510)에게 할당할 수 있으며, 제 2 작업(500)의 제 2 서브 작업(521)을 제 4 워커 스레드(520)에게 할당할 수 있다. 이 경우, 제 3 워커 스레드(510) 및 제 4 워커 스레드(520)는 프로세서(130)에 의해 식별된 추가 할당 워커 스레드일 수 있다. 즉, 제 3 워커 스레드(510) 및 제 4 워커 스레드(520)는 마스터 작업을 수행하는 워커 스레드(즉, 제 1 워커 스레드(410) 또는, 제 2 워커 스레드(420))이거나, 서브 작업이 할당되지 않은 워커 스레드(즉, 유휴 워커 스레드)이거나 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나일 수 있다.
프로세서(130)는 제 3 워커 스레드(510) 및 제 4 워커 스레드(520) 각각이 제 1 서브 작업(511) 및 제 2 서브 작업(521)을 수행하여 처리된 데이터에 기초하여 도 4에 도시된 바와 같은 결과 테이블(600)을 생성할 수 있다. 도 3 및 도 4를 참조하여 전술한 작업 및 서브 작업 구체적인 수치에 대한 기재는 예시일 뿐, 본 개시는 3개 이상의 작업 및 서브 작업을 포함할 수 있음이 당 업계의 통상의 지식을 가진 자에게 자명할 것이다.
즉, 프로세서(130)는 하나 이상의 작업(즉, 마스터 작업 및 슬레이브 작업) 각각에 대한 서브 작업들을 병렬로 처리할 수 있다. 이에 따라, 각 작업의 서브 작업들에 대한 병렬 수행을 통해 데이터 처리의 속도를 향상시킴과 동시에, 서브 작업을 수행에 가중되는 부하를 분담시킬 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 작업의 처리에 대한 균형 여부를 판별할 수 있다. 프로세서(130)는 하나 이상의 작업들의 병렬 처리에서 병목 등 비효율적인 상태가 발생하는지 여부를 판별할 수 있다. 프로세서(130)는 각각의 작업의 진행이 고르게 수행되는지, 병목이 발생하는지 여부를 판별할 수 있다. 프로세서(130)는 작업과 관련한 리소스 사용량, 작업의 진행 상태 등에 기초하여 하나 이상의 작업들 사이의 처리 균형 여부를 판단할 수 있다. 구체적으로, 프로세서(130)는 하나 이상의 작업 각각에 할당된 메모리 사용량 및 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지 중 적어도 하나에 기초하여 각 작업에서 수행되는 데이터 처리의 균형 여부를 판별할 수 있다.
자세히 설명하면, 프로세서(130)는 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할할 수 있다. 이 경우, 하나 이상의 작업 각각에는 데이터를 임시 저장 가능한 메모리가 할당될 수 있으며, 작업에 포함된 서브 작업의 데이터 처리 결과가 각각의 메모리에 임시 저장(즉, 버퍼)될 수 있다.
프로세서(130)는 하나 이상의 작업 각각에 할당된 메모리 사용량을 식별할 수 있다. 또한, 프로세서(130)는 하나 이상의 작업 각각의 메모리 사용량과 사전 결정된 임계 사용량의 비교에 기초하여 하나 이상의 작업 각각에서 수행되는 데이터 처리의 균형 여부를 판별할 수 있다.
구체적으로, 프로세서(130)는 하나 이상의 작업 각각에 할당된 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 경우, 하나 이상의 작업의 처리가 불균형한 것으로 판단할 수 있다. 제 1 임계 사용량은, 각 작업에서 수행되는 데이터 처리가 적정한지 여부를 판단하는 기준일 수 있다.
예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 제 1 테이블 스캔에 대한 제 1 작업, 제 2 테이블 스캔에 대한 제 2 작업으로 분할되며, 제 1 작업의 메모리 사용량이 20%이고, 제 2 작업의 메모리 사용량이 70%이고, 그리고 사전 결정된 임계 사용량이 65%인 경우, 프로세서(130)는 제 2 작업에 대한 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 것을 식별하여, 작업의 처리가 불균형한 것으로 판단할 수 있다.
다른 예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 테이블 스캔에 대한 제 1 작업, 스캔된 테이블의 레코드에 대한 hash join을 수행하는 제 2 작업 및 제 2 작업의 결과에 대한 필터를 적용하는 제 3 작업으로 분할되며, 각 작업의 메모리 사용량이 18%, 75% 및 12%이고, 그리고 사전 결정된 제 1 임계 사용량이 70%인 경우, 프로세서(130)는 제 2 작업에 대한 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 것을 식별하여, 작업의 처리가 불균형한 것으로 판단할 수 있다. 전술한 각 작업에 대한 메모리 사용량 및 사전 결정된 제 1 임계 사용량의 구체적인 수치에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
또한, 프로세서(130)는 하나 이상의 작업 각각이 형성하는 종속 관계 별 메모리 사용량이 사전 결정된 제 2 임계 사용량을 초과하는 경우, 하나 이상의 작업의 처리가 불균형한 것으로 판단할 수 있다. 종속 관계 별 메모리 사용량은, 마스터 작업 및 슬레이브 작업 각각에 포함된 작업들의 메모리 사용량의 합일 수 있다. 제 2 임계 사용량은 마스터 작업 및 슬레이브 작업 즉, 종속 관계를 형성하는 작업들 간의 데이터 처리가 적정한지 여부를 판단하는 기준일 수 있다.
구체적인 예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 제 1 테이블을 스캔하는 제 1 작업, 제 2 테이블을 스캔하는 제 2 작업, 그리고 제 1 작업 및 제 2 작업을 통해 스캔된 레코드들에 대한 정렬을 수행하는 제 3 작업으로 분할되는 경우, 각 작업의 메모리 사용량은 40%, 55% 및 45%이며, 사전 결정된 제 1 임계 사용량 및 사전 결정된 제 2 임계 사용량 각각은 70% 및 90%일 수 있다. 제 1 작업 및 제 2 작업은 제 3 작업에 처리된 데이터를 전달하는 마스터 작업이며, 제 3 작업은 마스터 작업에서 처리된 데이터에 기초하여 연산을 수행하는 슬레이브 작업일 수 있다. 이 경우, 종속 관계 별 메모리 사용량은, 마스터 작업인 제 1 작업의 메모리 사용량과 제 2 작업의 메모리 사용량의 합을 통해 95%로 식별될 수 있으며, 슬레이브 작업인 제 3 작업의 메모리 사용량을 통해 45%로 식별될 수 있다. 즉, 각 작업의 메모리 사용량은 사전 결정된 제 1 임계 사용량(즉, 75%)을 초과하지 않으나, 각 종속 관계 별 메모리 사용량 중 마스터 작업의 메모리 사용량(95%)이 사전 결정된 제 2 임계 사용량(90%)을 초과하므로, 프로세서(130)는 하나 이상의 작업에서 수행되는 데이터 처리를 불균형으로 판단할 수 있다. 전술한 각 작업에 대한 메모리 사용량, 사전 결정된 제 1 임계 사용량 및 사전 결정된 제 2 임계 사용량의 구체적인 수치에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(130)는 특정 작업에 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 경우, 특정 작업에 데이터 처리가 비 효율적인 상태로 판단하여 하나 이상의 작업 각각에서 수행되는 데이터 처리가 불균형한 것으로 판단할 수 있다. 또한, 프로세서(130)는 마스터 작업과 슬레이브 작업 각각의 종속 관계 별 메모리 사용량이 사전 결정된 제 2 임계 사용량을 초과하는 경우, 형성된 종속 관계에서 데이터가 처리되지 못하고 지연되는 병목 현상이 발생하는 것으로 판단하여 하나 이상의 작업 각각에서 수행되는 데이터 처리가 불균형한 것으로 판단할 수 있다. 예를 들어, 마스터 작업이 수행되지 않아 슬레이브 작업에 대한 처리가 불가능한 경우로 판단할 수 있다.
또한, 프로세서(130)는 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지에 기초하여 하나 이상의 작업 각각에서 수행되는 데이터 처리의 균형 여부를 판별할 수 있다. 워커 스레드로부터 수신하는 작업 관련 메시지는, 서브 작업에 대한 처리 완료에 관한 메시지일 수 있다.
구체적으로, 프로세서(130)는 하나 이상의 워커 스레드로부터 수신한 작업 관련 메시지에 기초하여 하나 이상의 작업 각각의 데이터 처리 결과를 식별할 수 있다. 각 작업의 데이터 처리 결과는 서브 작업이 완료된 정도 나타낼 수 있다. 또한, 하나 이상의 작업 각각의 데이터 처리 결과의 차이가 사전 결정된 임계치 이하인 경우, 하나 이상의 작업 각각에서 수행되는 데이터 처리를 균형으로 판별할 수 있다. 또한, 프로세서(130) 하나 이상의 작업 각각의 데이터 처리 결과의 차이가 사전 결정된 임계치를 초과하는 경우, 하나 이상의 작업 각각에서 수행되는 데이터 처리를 불균형으로 판별할 수 있다.
예를 들어, 쿼리에 대응하는 동작은 프로세서(130)에 의해 제 1 테이블 스캔에 대한 제 1 작업, 제 1 작업을 통해 스캔된 레코드를 정렬하는 제 2 작업으로 분할될 수 있다. 또한, 사전 결정된 임계치는 700일 수 있으며, 제 1 작업에 대한 서브 작업들을 수행하는 워커 스레드들로부터 제 1 테이블에 1000 로우까지의 스캔을 완료하였다는 작업 관련 메시지를 수신하고, 그리고 제 2 작업에 대한 서브 작업들을 수행하는 워커 스레드들로부터 200 로우까지의 정렬을 완료하였다는 작업 관련 메시지를 수신할 수 있다. 이 경우, 프로세서(130)는 제 1 작업과 제 2 작업의 데이터 처리 결과 차이가 800으로 사전 결정된 임계치인 700을 초과하는 것을 식별하여 하나 이상의 작업의 처리를 불균형으로 판단할 수 있다. 즉, 프로세서(130)는 테이블에 대한 스캔 작업은 1000 로우까지 완료되었으나, 스캔된 레코드들에 대한 정렬 작업은 200 로우까지 완료된 것을 식별하여, 레코드 정렬 작업(즉, 제 2 작업)에 병목이 발생한 것으로 판단할 수 있다.
다른 예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 테이블 스캔에 대한 제 1 작업, 스캔된 테이블의 레코드에 대한 hash join을 수행하는 제 2 작업 및 제 2 작업의 결과에 대한 필터를 적용하는 제 3 작업으로 분할될 수 있다.
또한, 사전 결정된 임계치는 500일 수 있으며, 제 1 작업에 대한 서브 작업들을 수행하는 워커 스레드들로부터 테이블에 1000 로우까지의 스캔을 완료하였다는 작업 관련 메시지를 수신하며, 제 2 작업에 대한 서브 작업들을 수행하는 워커 스레드들로부터 700 로우까지 join을 완료하였다는 작업 관련 메시지를 수신하고, 그리고 제 3 작업에 대한 서브 작업들을 수행하는 워커 스레드들로부터 20 로우 까지의 filter 처리를 완료하였다는 작업 관련 메시지를 수신할 수 있다. 이 경우, 프로세서(130)는 제 2 작업과 제 3 작업의 데이터 처리 결과 차이가 680으로 사전 결정된 임계치인 500을 초과하는 것을 식별하여 하나 이상의 작업의 처리를 불균형으로 판단할 수 있다. 즉, 프로세서(130)는 join 작업은 700 로우까지 완료되었으나, 조인된 레코드들에 대한 필터 작업은 20 로우까지 완료된 것을 식별하여, 조인된 레코드들에 대한 필터 작업(즉, 제 3 작업)에 병목이 발생한 것으로 판단할 수 있다. 전술한 각 작업에 관한 데이터 처리의 구체적인 수치 및 사전 결정된 임계치에 대한 구체적인 수치에 대한 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
즉, 프로세서(130)는 각 작업의 서브 작업을 수행하는 워커 스레드들로부터 수신한 작업 관련 메시지를 통해 각 작업의 데이터 처리 정도를 식별할 수 있으며, 각 작업의 처리 정도가 사전 결정된 임계치를 초과하는 시점을 하나 이상의 작업의 처리가 불균형한 것으로 판단할 수 있다.
본 개시의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 작업의 처리가 불균형한 것으로 판단한 경우, 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당할 수 있다. 구체적으로, 프로세서(130)는 작업의 불균형과 관련된 작업의 서브 작업을 수행하기 위한 추가 할당 워커 스레드를 식별할 수 있다. 추가 할당 워커 스레드는, 불균형과 관련된 작업에 대한 서브 작업을 수행하는 워커 스레드, 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나일 수 있다.
예를 들어, 쿼리에 대응하는 동작이 프로세서(130)에 의해 제 1 테이블을 스캔하는 제 1 작업, 제 2 테이블을 스캔하는 제 2 작업, 그리고 제 1 작업 및 제 2 작업을 통해 스캔된 레코드들에 대한 정렬을 수행하는 제 3 작업으로 분할되는 경우, 각 작업의 메모리 사용량은 80%, 55% 및 45%이며, 사전 결정된 제 1 임계 사용량은 75%일 수 있다. 프로세서(130)는 제 1 테이블을 스캔하는 작업이 사전 결정된 제 1 임계 사용량을 초과하는 것을 식별할 수 있다. 즉, 프로세서(130)는 제 1 작업(즉, 마스터 작업)의 처리 결과로 생성된 데이터가 제 3 작업(즉, 슬레이브 작업)에서 소비되지 않은 것으로 판단하여 제 3 작업의 서브 작업을 수행하기 위한 추가 할당 워커 스레드를 식별할 수 있다. 이 경우, 추가 할당 워커 스레드는, 제 1 작업의 서브 작업을 수행하는 워커 스레드, 제 2 작업의 서브 작업을 수행하는 워커 스레드일 수 있다.
프로세서(130)는 마스터 작업에 해당하는 제 1 작업 및 제 2 작업의 서브 작업 중 적어도 하나를 수행하는 워커 스레드를 추가 할당 워커 스레드로 식별하여 불균형에 관련된 작업인 제 3 작업(즉, 슬레이브 작업)의 서브 작업을 할당할 수 있다.
이에 따라, 테이블 스캔에 대한 작업을 수행하는 마스터 작업의 워커 스레드가 줄어들고, 레코드 정렬 작업을 수행하는 슬레이브 작업의 워커 스레드가 증가할 수 있다. 따라서, 제 3 작업의 서브 작업에 대한 처리 속도가 증가하여 제 1 작업에서 처리되는 데이터를 소비할 수 있으므로, 제 1 작업의 메모리 사용량이 감소될 수 있다(즉, 제 1 작업의 처리 결과 버퍼된 데이터가 제 3 작업을 통해 소비될 수 있다). 제 1 작업의 메모리 사용량이 감소되어 사전 결정된 제 1 임계 사용량 이하가 되는 경우, 프로세서(130)는 각 작업의 처리가 균형한 것으로 판단하여 제 3 작업의 서브 작업을 할당한 워커 스레드에게 다시 제 1 작업 및 제 2 작업의 서브 작업을 할당하여 테이블에 대한 스캔인 마스터 작업을 수행하도록 할 수 있다. 전술한 각 작업의 메모리 사용량 및 사전 결정된 메모리 사용량에 대한 구체적인 기재는 예시일 뿐, 본 개시는 이에 제한되지 않는다.
도 5를 참조하여 보다 구체적으로 설명하면, 제 3 쿼리(700)를 수신하는 경우, 프로세서(130)는 T1(711) 및 T2(721) 테이블을 C1 칼럼의 레코드들을 기준으로 정렬하는 동작을 하나 이상의 작업으로 분할할 수 있다. 구체적으로, 프로세서(130)는 T1 테이블(711)의 레코드들을 스캔하기 위한 제 1 작업(710), T2 테이블(721)의 레코드들을 스캔하기 위한 제 2 작업(720), 그리고 제 1 작업(710) 및 제 2 작업(720)을 통해 스캔된 레코드들을 C1 칼럼의 레코드를 기준으로 정렬하는 제 3 작업(730)으로 분할할 수 있다. 이 경우, 제 1 작업(710) 및 제 2 작업(720)의 수행 결과가 제 3 작업(730)의 입력에 해당하는 종속 관계이므로, 제 1 작업(710) 및 제 2 작업(720)은 마스터 작업일 수 있으며, 제 3 작업은 마스터 작업에 대응하는 슬레이브 작업일 수 있다.
제 1 작업(710)은 T1 테이블(711)의 1~10 로우의 레코드를 스캔하기 위한 제 1 서브 작업 및 T1 테이블(711)의 11~20 로우의 레코드를 스캔하기 위한 제 2 서브 작업을 포함할 수 있다, 또한, 제 2 작업(720)은 T2 테이블(721)의 1~10 로우의 레코드를 스캔하기 위한 제 1 서브 작업 및 T2 테이블(721)의 11~20 로우의 레코드를 스캔하기 위한 제 2 서브 작업을 포함할 수 있다. 또한, 제 3 작업(730)은 C1 칼럼의 0~10까지의 레코드를 기준으로 정렬을 수행하는 제 1 서브 작업 및 C1 칼럼의 21~40 까지의 레코드를 기준으로 정렬을 수행하는 제 2 서브 작업을 포함할 수 있다.
예를 들어, 제 2 작업(720)의 메모리 사용량 85%로 사전 결정된 제 1 임계 사용량(80%)을 초과하는 경우, 프로세서(130)는 제 2 작업(720)의 제 1 서브 작업 및 제 2 서브 작업을 통해 처리된 데이터가 제 3 작업(730)에서 소비되지 못하는 것을 식별하여 각 작업의 데이터 처리가 불균형한 것으로 판단할 수 있다. 이에 따라, 프로세서(130)는 T2 테이블(721)을 스캔하는 제 2 작업(710)의 제 1 서브 작업 및 제 2 서브 작업을 수행하는 워커 스레드들 중 적어도 하나의 워커 스레드에게 제 3 작업의 서브 작업을 할당할 수 있다.
즉, 프로세서(130)는 제 2 작업(720)의 제 1 서브 작업의 수행을 완료한 워커 스레드 또는, 제 2 작업(720)의 제 2 서브 작업의 수행을 완료한 워커 스레드 중 적어도 하나의 워커 스레드에게 제 3 작업(730)의 제 3 서브 작업(C1 칼럼의 41 이상의 레코드를 기준으로 정렬을 수행)을 할당할 수 있다. 프로세서(130)가 불균형과 관련된 제 3 작업(730)의 서브 작업을 제 2 작업(720)의 서브 작업을 수행하는 워커 스레드에게 재할당함에 따라, 제 3 작업(730)을 수행하는 워커 스레드의 수가 증가하고, 제 2 작업(720)의 서브 작업을 수행하는 워커 스레드 수가 감소할 수 있다. 다시 말해, 처리량이 많은 작업을 식별하고, 해당 작업에 비 동기적으로 추가 할당 워커 스레드를 식별하여 해당 작업의 서브 작업에 할당시킴으로써, 데이터의 우선적으로 처리할 수 있도록 할 수 있다.
다른 예를 들어, 도 6을 참조하면, 쿼리에 대응하는 동작이 프로세서(130)에 의해 테이블 스캔에 대한 제 1 작업(810), 스캔된 테이블의 레코드에 대한 hash join을 수행하는 제 2 작업(820) 및 제 2 작업(820)의 결과에 대한 필터를 적용하는 제 3 작업(830)으로 분할되며, 각 작업의 메모리 사용량이 18%, 75% 및 12%이고, 그리고 사전 결정된 제 1 임계 사용량이 70%인 경우, 프로세서(130)는 제 2 작업에 대한 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 것을 식별하여, 작업의 처리가 불균형한 것으로 판단할 수 있다. 즉, 프로세서(130)는 제 2 작업(820)의 처리 결과로 생성된 데이터가 제 3 작업(830)에서 소비되지 않은 것으로 판단하여 제 3 작업(830)의 처리 속도를 향상시키기 위해, 제 3 작업(830)의 서브 작업을 수행하기 위한 추가 할당 워커 스레드를 식별할 수 있다. 이 경우, 추가 할당 워커 스레드는, 제 1 작업(810) 및 제 2 작업(820)의 서브 작업을 수행하는 워커 스레드일 수 있다.
즉, 프로세서(130)는 불균형과 관련된 제 2 작업(820)에 대한 서브 작업을 수행하는 워커 스레드 또는, 제 1 작업(810)의 서브 작업을 수행하는 워커 스레드에게 제 3 작업(830)의 서브 작업을 비 동기적으로 할당하여. 제 3 작업(830)의 처리 속도를 향상시켜 제 2 작업(820)의 메모리에 버퍼링된 데이터를 빠르게 소비하도록 할 수 있다.
이에 따라, 제 3 작업(830)의 서브 작업에 대한 처리 속도가 증가하여 제 2 작업(820)에 처리되는 데이터를 소비할 수 있으므로, 제 2 작업(820)의 메모리 사용량이 감소될 수 있다. 즉, 제 2 작업(820)의 처리 결과 버퍼된 데이터가 제 3 작업의 처리 속도 향상으로 인해 소비될 수 있어, 병목 현상이 해소될 수 있다.
또한, 제 3 작업(830)의 처리 속도 향상으로 인해 제 2 작업(820)의 메모리 사용량이 감소되어 사전 결정된 제 1 임계 사용량 이하가 되는 경우, 프로세서(130)는 각 작업의 처리가 균형적인 것으로 판단하여, 제 3 작업(830)의 서브 작업을 할당한 워커 스레드에게 다시 제 1 작업(810) 및 제 2 작업(820)의 서브 작업을 할당하여 테이블 스캔 또는, hash join에 대한 작업을 수행하도록 할 수 있다.
따라서, 프로세서(130)는 하나 이상의 작업 각각에, 특정 워커 스레드들을 매칭시켜 대응하는 작업을 수행하도록 하는 것이 아닌, 데이터의 흐름에 따라 특정 작업에 병목 현상이 생기는 경우, 다른 작업의 워커 스레드 또는, 유휴 워커 스레드를 비 동기적으로 할당함으로써, 각 작업 간 데이터 처리가 효율적으로 이루어지게 할 수 있다. 즉, 작업의 처리 상황에 따라 유동적인 데이터 처리가 가능하여 쿼리에 대응하는 데이터 처리의 속도가 향상될 수 있으며, 특정 작업에서 발생하는 병목 현상을 빠르게 해소시킬 수 있다.
도 7은 본 개시의 일 실시예와 관련된 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 위한 방법을 예시적으로 도시한 순서도이다.
본 개시의 일 실시예에 따르면, 서버(100)는 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할할 수 있다(910).
본 개시의 일 실시예에 따르면, 서버(100)는 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당할 수 있다(920).
본 개시의 일 실시예에 따르면, 서버(100)는 하나 이상의 작업의 처리에 대한 균형 여부를 판별할 수 있다(930).
본 개시의 일 실시예에 따르면, 서버(100)는 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당할 수 있다(940).
전술한 도 7에 도시된 단계들은 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 즉, 전술한 단계는 본 개시의 일 실시예에 불과할 뿐, 본 개시의 권리 범위는 이에 제한되지 않는다.
도 8은 본 개시의 일 실시예와 관련된 데이터 베이스 관리 시스템에서 비동기적 데이터 처리를 수행하기 위한 모듈을 도시한다.
본 개시의 일 실시예에 따르면, 서버는 다음과 같은 모듈에 의해 구현될 수 있다.
본 개시의 일 실시예에 따르면, 서버(100)는 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하기 위한 모듈(1010), 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하기 위한 모듈(1020), 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하기 위한 모듈(1030) 및 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하기 위한 모듈(1040)을 포함할 수 있다.
대안적으로, 제 1 항에 있어서, 상기 하나 이상의 작업 각각은, 상기 쿼리에 대응하기 위한 모듈들을 일정 기준으로 분류한 그룹으로, 데이터를 병렬 처리하는 병렬 처리 관계, 또는 데이터를 연계 처리하는 종속 관계 중 적어도 하나의 관계를 형성할 수 있다.
대안적으로, 상기 하나 이상의 작업이 종속 관계를 형성하는 경우, 상기 종속 관계를 형성하는 작업들은, 상기 서브 작업의 처리 결과에 따라 생성되는 데이터를 슬레이브 작업에 전달하는 마스터 작업 및 상기 마스터 작업으로부터 전달받은 데이터에 기초하여 연산을 수행하는 상기 슬레이브 작업을 포함할 수 있다.
대안적으로, 상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하기 위한 모듈은, 상기 하나 이상의 작업 중 마스터 작업을 수행하기 위해 워커 스레드에게 상기 마스터 작업의 서브 작업을 할당하기 위한 모듈, 상기 마스터 작업에 대한 작업 진행도가 사전 결정된 임계치 이상인 경우, 상기 마스터 작업에 대응하는 슬레이브 작업을 수행하기 위한 적어도 하나의 추가 할당 워커 스레드를 식별하기 위한 모듈 및 상기 추가 할당 워커 스레드에게 상기 슬레이브 작업에 대한 서브 작업을 할당하기 위한 모듈을 포함할 수 있다.
대안적으로, 상기 추가 할당 워커 스레드는, 상기 마스터 작업에 대응하는 작업을 수행하는 워커 스레드, 서브 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하기 위한 모듈을 수행하는 워커 스레드 중 적어도 하나일 수 있다.
대안적으로, 상기 하나 이상의 작업의 처리에 대한 균형 여부를 판별하기 위한 모듈은, 상기 하나 이상의 작업 각각에 할당된 메모리 사용량에 기초하여 상기 균형 여부를 판별하기 위한 모듈 또는, 상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신한 작업 관련 메시지에 기초하여 상기 균형 여부를 판별하기 위한 모듈 중 적어도 하나의 동작을 포함할 수 있다.
대안적으로, 상기 하나 이상의 작업 각각에 할당된 메모리 사용량에 기초하여 상기 균형 여부를 판별하기 위한 모듈은, 상기 하나 이상의 작업 각각에 할당된 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하기 위한 모듈 및 상기 하나 이상의 작업 각각이 형성하는 종속 관계 별 메모리 사용량이 사전 결정된 제 2 임계 사용량을 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하기 위한 모듈을 포함하고, 상기 종속 관계 별 메모리 사용량은, 마스터 작업 및 슬레이브 작업 각각에 포함된 작업들 각각의 메모리 사용량의 합으로 식별될 수 있다.
대안적으로, 상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신한 작업 관련 메시지에 기초하여 상기 균형 여부를 판별하기 위한 모듈은, 상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지에 기초하여 상기 하나 이상의 작업 각각의 데이터 처리 결과를 식별하기 위한 모듈 및 상기 하나 이상의 작업 간의 데이터 처리 결과의 차이가 사전 결정된 임계치를 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하기 위한 모듈을 포함할 수 있다.
대안적으로, 상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하기 위한 모듈은, 상기 작업의 불균형과 관련된 작업의 서브 작업을 수행하기 위한 추가 할당 워커 스레드를 식별하기 위한 모듈 및 상기 추가 할당 워커 스레드에게 상기 불균형과 관련된 서브 작업을 할당하기 위한 모듈을 포함하고, 그리고 상기 추가 할당 워커 스레드는, 상기 불균형과 관련된 작업에 대한 서브 작업을 수행하는 워커 스레드, 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하기 위한 모듈을 수행하는 워커 스레드 중 적어도 하나일 수 있다.
본 개시의 일 실시예에 따르면, 데이터베이스 시스템에서 비동기적 데이터 처리를 수행하기 위한 모듈은, 서버를 구현하기 위한 수단, 회로 또는, 로직에 의하여 구현될 수도 있다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있으나, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
도 9는 본 개시의 일 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
본 개시가 일반적으로 하나 이상의 컴퓨터 상에서 실행될 수 있는 컴퓨터 실행가능 명령어와 관련하여 전술되었지만, 당업자라면 본 개시가 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다는 것을 잘 알 것이다.
일반적으로, 프로그램 모듈은 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조, 기타 등등을 포함한다. 또한, 당업자라면 본 개시의 방법이 단일-프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알 것이다.
본 개시의 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.
컴퓨터는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 이러한 컴퓨터 판독가능 저장 매체는 휘발성 및 비휘발성 매체, 이동식 및 비-이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터등을 구현하는 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.
컴퓨터(1102)를 포함하는 본 개시의 여러가지 측면들을 구현하는 예시적인 환경(1100)이 나타내어져 있으며, 컴퓨터(1102)는 처리 장치(1104), 시스템 메모리(1106) 및 시스템 버스(1108)를 포함한다. 시스템 버스(1108)는 시스템 메모리(1106)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(1104)에 연결시킨다. 처리 장치(1104)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(1104)로서 이용될 수 있다.
시스템 버스(1108)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(1106)는 판독 전용 메모리(ROM)(1110) 및 랜덤 액세스 메모리(RAM)(1112)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(1110)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(1102) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(1112)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.
컴퓨터(1102)는 또한 내장형 하드 디스크 드라이브(HDD)(1114)(예를 들어, EIDE, SATA)―이 내장형 하드 디스크 드라이브(1114)는 또한 적당한 섀시(도시 생략) 내에서 외장형 용도로 구성될 수 있음―, 자기 플로피 디스크 드라이브(FDD)(1116)(예를 들어, 이동식 디스켓(1118)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), 및 광 디스크 드라이브(1120)(예를 들어, CD-ROM 디스크(1122)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(1114), 자기 디스크 드라이브(1116) 및 광 디스크 드라이브(1120)는 각각 하드 디스크 드라이브 인터페이스(1124), 자기 디스크 드라이브 인터페이스(1126) 및 광 드라이브 인터페이스(1128)에 의해 시스템 버스(1108)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(1124)는 USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘다를 포함한다.
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(1102)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 개시의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.
운영 체제(1130), 하나 이상의 애플리케이션 프로그램(1132), 기타 프로그램 모듈(1134) 및 프로그램 데이터(1136)를 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(1112)에 저장될 수 있다. 운영 체제, 애플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(1112)에 캐싱될 수 있다. 본 개시가 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(1138) 및 마우스(1140) 등의 포인팅 장치를 통해 컴퓨터(1102)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(1108)에 연결되어 있는 입력 장치 인터페이스(1142)를 통해 처리 장치(1104)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.
모니터(1144) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(1146) 등의 인터페이스를 통해 시스템 버스(1108)에 연결된다. 모니터(1144)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.
컴퓨터(1102)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(1148) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1148)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(1102)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(1150)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(1152) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(1154)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(1156)를 통해 로컬 네트워크(1152)에 연결된다. 어댑터(1156)는 LAN(1152)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(1152)은 또한 무선 어댑터(1156)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 모뎀(1158)을 포함할 수 있거나, WAN(1154) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(1154)을 통해 통신을 설정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(1158)은 직렬 포트 인터페이스(1142)를 통해 시스템 버스(1108)에 연결된다. 네트워크화된 환경에서, 컴퓨터(1102)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(1150)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.
컴퓨터(1102)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.
Wi-Fi(Wireless Fidelity)는 유선 없이도 인터넷 등으로의 연결을 가능하게 해준다. Wi-Fi는 이러한 장치, 예를 들어, 컴퓨터가 실내에서 및 실외에서, 즉 기지국의 통화권 내의 아무 곳에서나 데이터를 전송 및 수신할 수 있게 해주는 셀 전화와 같은 무선 기술이다. Wi-Fi 네트워크는 안전하고 신뢰성있으며 고속인 무선 연결을 제공하기 위해 IEEE 802.11(a,b,g, 기타)이라고 하는 무선 기술을 사용한다. 컴퓨터를 서로에, 인터넷에 및 유선 네트워크(IEEE 802.3 또는 이더넷을 사용함)에 연결시키기 위해 Wi-Fi가 사용될 수 있다. Wi-Fi 네트워크는 비인가 2.4 및 5 GHz 무선 대역에서, 예를 들어, 11Mbps(802.11a) 또는 54 Mbps(802.11b) 데이터 레이트로 동작하거나, 양 대역(듀얼 대역)을 포함하는 제품에서 동작할 수 있다.
본 개시의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 개시의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 개시의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
제시된 실시예들에 대한 설명은 임의의 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 개시를 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 개시는 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

Claims (11)

  1. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에서 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 이하의 동작들을 수행하도록 하며, 상기 동작들은:
    클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하는 동작;
    상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 동작;
    상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지에 기초하여 상기 하나 이상의 작업 각각의 데이터 처리 결과를 식별하는 동작;
    상기 하나 이상의 작업 간의 데이터 처리 결과의 차이가 사전 결정된 임계치를 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 동작; 및
    상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  2. 제 1 항에 있어서,
    상기 하나 이상의 작업 각각은,
    상기 쿼리에 대응하는 동작들을 일정 기준으로 분류한 그룹으로, 데이터를 병렬 처리하는 병렬 처리 관계, 또는 데이터를 연계 처리하는 종속 관계 중 적어도 하나의 관계를 형성하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  3. 제 2 항에 있어서,
    상기 하나 이상의 작업이 종속 관계를 형성하는 경우, 상기 종속 관계를 형성하는 작업들은, 상기 서브 작업의 처리 결과에 따라 생성되는 데이터를 슬레이브 작업에 전달하는 마스터 작업 및 상기 마스터 작업으로부터 전달받은 데이터에 기초하여 연산을 수행하는 상기 슬레이브 작업을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  4. 제 1 항에 있어서,
    상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 동작은,
    상기 하나 이상의 작업 중 마스터 작업을 수행하기 위해 워커 스레드에게 상기 마스터 작업의 서브 작업을 할당하는 동작;
    상기 마스터 작업에 대한 작업 진행도가 사전 결정된 임계치 이상인 경우, 상기 마스터 작업에 대응하는 슬레이브 작업을 수행하기 위한 적어도 하나의 추가 할당 워커 스레드를 식별하는 동작; 및
    상기 추가 할당 워커 스레드에게 상기 슬레이브 작업에 대한 서브 작업을 할당하는 동작;
    을 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  5. 제 4 항에 있어서,
    상기 추가 할당 워커 스레드는,
    상기 마스터 작업에 대응하는 작업을 수행하는 워커 스레드, 서브 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나인,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  6. 제 1 항에 있어서,
    상기 하나 이상의 작업 각각에 할당된 메모리 사용량에 기초하여 균형 여부를 판별하는 동작;
    을 더 포함하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  7. 제 6 항에 있어서,
    상기 하나 이상의 작업 각각에 할당된 메모리 사용량에 기초하여 균형 여부를 판별하는 동작은,
    상기 하나 이상의 작업 각각에 할당된 메모리 사용량이 사전 결정된 제 1 임계 사용량을 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 동작; 및
    상기 하나 이상의 작업 각각이 형성하는 종속 관계 별 메모리 사용량이 사전 결정된 제 2 임계 사용량을 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 동작;
    을 포함하고,
    상기 종속 관계 별 메모리 사용량은, 마스터 작업 및 슬레이브 작업 각각에 포함된 작업들 각각의 메모리 사용량의 합으로 식별되는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  8. 삭제
  9. 제 1 항에 있어서,
    상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 동작은,
    상기 작업의 불균형과 관련된 작업의 서브 작업을 수행하기 위한 추가 할당 워커 스레드를 식별하는 동작; 및
    상기 추가 할당 워커 스레드에게 상기 불균형과 관련된 서브 작업을 할당하는 동작;
    을 포함하고, 그리고
    상기 추가 할당 워커 스레드는,
    상기 불균형과 관련된 작업에 대한 서브 작업을 수행하는 워커 스레드, 작업이 할당되지 않은 워커 스레드 또는, 다른 쿼리에 대응하는 동작을 수행하는 워커 스레드 중 적어도 하나인,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  10. 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 방법으로,
    클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하는 단계;
    상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하는 단계;
    상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지에 기초하여 상기 하나 이상의 작업 각각의 데이터 처리 결과를 식별하는 단계;
    상기 하나 이상의 작업 간의 데이터 처리 결과의 차이가 사전 결정된 임계치를 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하는 단계; 및
    상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는 단계;
    를 포함하는,
    데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 방법.
  11. 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 수행하는 서버로서,
    하나 이상의 코어를 포함하는 프로세서;
    상기 프로세서에서 실행가능한 프로그램 코드들을 포함하는 저장부; 및
    클라이언트 단말과 데이터를 송수신하는 네트워크부;
    를 포함하고, 그리고
    상기 프로세서는,
    상기 클라이언트로부터 발행된 쿼리를 수신하는 경우, 상기 쿼리에 대응하는 동작을 하나 이상의 작업으로 분할하고,
    상기 하나 이상의 작업 각각에 대한 서브 작업을 하나 이상의 워커 스레드 각각에 할당하고,
    상기 하나 이상의 작업 각각에 대한 서브 작업을 처리하는 상기 하나 이상의 워커 스레드로부터 수신된 작업 관련 메시지에 기초하여 상기 하나 이상의 작업 각각의 데이터 처리 결과를 식별하고,
    상기 하나 이상의 작업 간의 데이터 처리 결과의 차이가 사전 결정된 임계치를 초과하는 경우, 상기 하나 이상의 작업의 처리가 불균형한 것으로 판단하고, 그리고
    상기 하나 이상의 작업의 처리가 불균형으로 판단되는 경우, 상기 불균형과 관련한 작업의 서브 작업을 워커 스레드에 재할당하는,
    데이터베이스 관리 시스템에서 비동기적 데이터 처리를 수행하는 서버.
KR1020190137095A 2019-10-31 2019-10-31 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램 KR102247249B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020190137095A KR102247249B1 (ko) 2019-10-31 2019-10-31 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램
US16/836,902 US20210132987A1 (en) 2019-10-31 2020-03-31 Computer program for asynchronous data processing in a database management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190137095A KR102247249B1 (ko) 2019-10-31 2019-10-31 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020210054053A Division KR20210053830A (ko) 2021-04-27 2021-04-27 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
KR102247249B1 true KR102247249B1 (ko) 2021-05-03

Family

ID=75689025

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190137095A KR102247249B1 (ko) 2019-10-31 2019-10-31 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램

Country Status (2)

Country Link
US (1) US20210132987A1 (ko)
KR (1) KR102247249B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177062B (zh) * 2021-05-25 2023-06-09 深圳前海微众银行股份有限公司 一种数据查询方法及装置
CN113438304B (zh) * 2021-06-23 2023-04-07 平安消费金融有限公司 基于数据库集群的数据查询方法、装置、服务器及介质
CN113449142A (zh) * 2021-06-30 2021-09-28 北京百度网讯科技有限公司 信息处理方法及装置、电子设备、存储介质及产品
CN113641476B (zh) * 2021-08-16 2023-07-14 腾讯科技(深圳)有限公司 一种任务调度方法、游戏引擎、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4611830Y1 (ko) 1967-09-30 1971-04-23
JP2007249468A (ja) * 2006-03-15 2007-09-27 Hitachi Ltd Cpu割当方法、cpu割当プログラム、cpu割当装置、および、データベース管理システム
JP2008181287A (ja) * 2007-01-24 2008-08-07 Hitachi Ltd データのリカバリを制御する装置及び方法
KR20090035545A (ko) * 2006-07-26 2009-04-09 마이크로소프트 코포레이션 초대형 데이터베이스 상의 데이터 처리

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9396030B2 (en) * 2013-03-13 2016-07-19 Samsung Electronics Co., Ltd. Quota-based adaptive resource balancing in a scalable heap allocator for multithreaded applications
CA3118302A1 (en) * 2018-11-08 2020-05-14 SafeAI, Inc. Performing tasks using autonomous machines

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4611830Y1 (ko) 1967-09-30 1971-04-23
JP2007249468A (ja) * 2006-03-15 2007-09-27 Hitachi Ltd Cpu割当方法、cpu割当プログラム、cpu割当装置、および、データベース管理システム
KR20090035545A (ko) * 2006-07-26 2009-04-09 마이크로소프트 코포레이션 초대형 데이터베이스 상의 데이터 처리
JP2008181287A (ja) * 2007-01-24 2008-08-07 Hitachi Ltd データのリカバリを制御する装置及び方法

Also Published As

Publication number Publication date
US20210132987A1 (en) 2021-05-06

Similar Documents

Publication Publication Date Title
KR102247249B1 (ko) 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램
US20110185364A1 (en) Efficient utilization of idle resources in a resource manager
KR101013073B1 (ko) 태스크 분배 및 병렬 처리 시스템과 그 방법
WO2015117565A1 (en) Methods and systems for dynamically allocating resources and tasks among database work agents in smp environment
US20120096468A1 (en) Compute cluster with balanced resources
WO2020125396A1 (zh) 一种共享数据的处理方法、装置及服务器
CN113821311A (zh) 任务执行方法及存储设备
CN110383764A (zh) 无服务器系统中使用历史数据处理事件的系统和方法
CN112753022A (zh) 数据库环境中的自动查询重试
JP2014120097A (ja) 情報処理装置、プログラム、及び、情報処理方法
CN105874426A (zh) 一种系统调用命令的批处理方法及装置
US6549931B1 (en) Distributing workload between resources used to access data
JP2011118864A (ja) リソース制御方法及びリソース制御システム
CN117331678B (zh) 面向异构算力联邦的多集群作业资源规格计算方法和系统
KR20210053830A (ko) 데이터베이스 관리 시스템에서 비동기적 데이터 처리를 위한 컴퓨터 프로그램
JP2009037369A (ja) データベースサーバへのリソース割当て方法
US9110823B2 (en) Adaptive and prioritized replication scheduling in storage clusters
US12028269B2 (en) Method for optimal resource selection based on available GPU resource analysis in large-scale container platform
CN108241508B (zh) 处理OpenCL内核的方法及用于该方法的计算设备
US10824640B1 (en) Framework for scheduling concurrent replication cycles
KR101889749B1 (ko) 메시지 스케줄링 방법
CN113742646A (zh) 将单语言复合函数编译为单个实体
JP6445876B2 (ja) リソース割当装置、リソース割当システム、および、リソース割当方法
US20240232213A1 (en) Future scheduler for database systems
US11595319B2 (en) Differential overbooking in a cloud computing environment

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant