KR102005343B1 - Partitioned space based spatial data object query processing apparatus and method, storage media storing the same - Google Patents

Partitioned space based spatial data object query processing apparatus and method, storage media storing the same Download PDF

Info

Publication number
KR102005343B1
KR102005343B1 KR1020170181486A KR20170181486A KR102005343B1 KR 102005343 B1 KR102005343 B1 KR 102005343B1 KR 1020170181486 A KR1020170181486 A KR 1020170181486A KR 20170181486 A KR20170181486 A KR 20170181486A KR 102005343 B1 KR102005343 B1 KR 102005343B1
Authority
KR
South Korea
Prior art keywords
partition
spatial data
space
data object
query
Prior art date
Application number
KR1020170181486A
Other languages
Korean (ko)
Other versions
KR20190079354A (en
Inventor
정성원
조범준
Original Assignee
서강대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교산학협력단 filed Critical 서강대학교산학협력단
Priority to KR1020170181486A priority Critical patent/KR102005343B1/en
Publication of KR20190079354A publication Critical patent/KR20190079354A/en
Application granted granted Critical
Publication of KR102005343B1 publication Critical patent/KR102005343B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법에 관한 것으로, 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 분할 공간 생성부 및 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 인덱스 트리 생성부를 포함한다. 따라서, 본 발명은 데이터 공간을 효율적으로 분할하고 적절한 테이블 스키마를 사용하여 효율적인 질의 처리를 할 수 있다.The present invention relates to a partition space-based spatial data object query processing apparatus and method, comprising: a partition space generation unit for generating a plurality of partition spaces by partitioning a data space including at least one spatial data object and the plurality of partition spaces And an index tree generation unit for generating an index tree based on minimum boundary rectangle (MBR) information including all of the information about the spatial data object included in the partition and the partition. Therefore, the present invention can efficiently partition the data space and perform efficient query processing using an appropriate table schema.

Description

분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법, 이를 기록한 기록매체{PARTITIONED SPACE BASED SPATIAL DATA OBJECT QUERY PROCESSING APPARATUS AND METHOD, STORAGE MEDIA STORING THE SAME}Spatial data object query processing apparatus and method based on partition space, and recording medium recording the same {PARTITIONED SPACE BASED SPATIAL DATA OBJECT QUERY PROCESSING APPARATUS AND METHOD, STORAGE MEDIA STORING THE SAME}

본 발명은 공간 데이터 객체 질의처리 기술에 관한 것으로, 보다 상세하게는 데이터 공간을 효율적으로 분할하고 적절한 테이블 스키마를 사용하여 효율적인 질의 처리를 할 수 있는 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법에 관한 것이다.The present invention relates to a spatial data object query processing technology, and more particularly, to a partition space-based spatial data object query processing apparatus and method capable of efficiently partitioning a data space and performing an efficient query processing using an appropriate table schema. It is about.

공간 데이터와 같은 다차원 데이터에 대한 효과적인 유사 질의어(similarity query) 처리의 핵심은 공간적으로 인접한 오브젝트들을 물리적으로도 가까운 위치에 저장하고, 검색시 필요한 영역에 속한 데이터만 접근하는 것이다. 그러나, 하둡(Hadoop)과 같이 일반적으로 빅데이터를 다루기 위해 사용되는 클라우드 컴퓨팅 기반의 프레임워크들은 오브젝트들 간의 공간적 인접성을 고려하지 않고 있기 때문에 질의 처리시 대량의 긍정 오류(false positive)를 포함한 데이터를 검색하게 된다.The key to effective similarity query processing on multidimensional data such as spatial data is to store spatially adjacent objects in a physically close location and access only the data belonging to the area required for retrieval. However, cloud computing-based frameworks commonly used to deal with big data, such as Hadoop, do not take into account the spatial proximity between objects, so they do not contain data with a large amount of false positives when processing queries. Search.

공간 데이터 객체 질의는 범위 질의(Range Query) 및 kNN 질의(k-Nearest Neighbor Query)를 포함할 수 있고, HBase와 같은 NoSQL 데이터베이스 관리 시스템을 이용한 인덱싱 방법은 분산 파일 시스템에서 빠른 데이터 임의 접근과 효율적인 데이터 갱신을 위한 효과적인 프레임워크를 제공할 수 있다. 범위 질의는 질의 포인트 q와 질의 반경 r을 입력으로 받아 질의 포인트 q로부터의 거리가 r보다 작은 데이터 객체 집합을 결과로서 반환한다. kNN 질의는 질의 포인트 q와 최근접 이웃의 수 k를 입력으로 받아 질의 포인트 q로부터 가장 근접한 k개의 데이터 객체 집합을 결과로서 반환한다.Spatial data object queries can include range queries and k-Nearest neighbor queries, and indexing methods using NoSQL database management systems such as HBase provide fast data random access and efficient data in distributed file systems. It can provide an effective framework for updating. The range query takes as input a query point q and a query radius r and returns as a result a set of data objects whose distance from the query point q is less than r. The kNN query takes as input a query point q and the number of nearest neighbors k and returns as a result the set of k data objects closest to the query point q.

HBase에서의 색인 생성은 1차원 행 키(Rowkey)만 지원하도록 설계된 점이 문제이다. 따라서, 선형화(linearization) 기법은 일반적으로 HBase 시스템에서 공간 데이터를 저장하는데 사용된다. 이러한 방법은 데이터 공간을 그리드(grid) 모양의 셀(cell)로 세분화하고 z-순서를 사용하여 셀을 순차적으로 정렬한다. 공간 데이터의 행 키는 해당 셀의 z-순서 번호를 사용하여 생성될 수 있다. The problem with indexing in HBase is that it is designed to support only one-dimensional row keys. Therefore, linearization techniques are commonly used to store spatial data in HBase systems. This method subdivides the data space into grid-shaped cells and uses the z-order to sort the cells sequentially. The row key of the spatial data can be generated using the z-order number of the corresponding cell.

도 4는 선형화 기법을 사용하여 범위 질의를 처리하는 과정을 설명하는 예시도이다. 도 4를 참조하면, 범위 질의(Range Query)(410)가 실행되면 질의 범위 내의 최소 및 최대 z-순서 값이 계산될 수 있다. 다음으로 행 키가 z-순서 범위 내에 있는 행을 검색하여 질의가 처리될 수 있다. 그러나, 공간적 근접성을 완벽하게 보장할 수 없기 때문에 선형화 기법의 결과에는 종종 많은 긍정 오류(False Positive)(430)가 포함될 수 있다.4 is an exemplary diagram illustrating a process of processing a range query using a linearization technique. Referring to FIG. 4, when a range query 410 is executed, minimum and maximum z-order values within a query range may be calculated. Next, the query can be processed by retrieving rows whose row key is within the z-order range. However, the result of the linearization technique can often include a large number of false positives 430 because spatial proximity cannot be fully guaranteed.

도 5는 다차원 인덱싱 레이어를 사용하여 범위 질의를 처리하는 과정을 설명하는 예시도이다. 도 5를 참조하면, 범위 질의(510)가 실행되면 먼저 인덱스 레이어(Index Layer)(530)를 검색하고 관련 영역과 연관된 행 키가 있는 행만을 접근함으로써 긍정 오류를 줄일 수 있다. 그러나, 이러한 방법은 공간 분할의 단위가 크기 때문에 질의 처리 시 여전히 많은 양의 긍정 오류에 대한 접근이 필요할 수 있다.5 is an exemplary diagram illustrating a process of processing a range query using a multidimensional indexing layer. Referring to FIG. 5, when the range query 510 is executed, a false positive may be reduced by first searching an index layer 530 and accessing only rows having a row key associated with a related area. However, this method may still require access to a large amount of false positives in query processing because of the large unit of spatial partitioning.

한국공개특허 제10-2016-0004781(2016.01.13)호는 빅데이터 프레임워크를 활용한 온톨로지 질의 처리방법에 관한 것으로, 테이블에 저장되는 각 노드들에 클래스 타입을 접두어로 저장하도록 하고, 클래스(Class)와 프로퍼티(Property)들을 각각의 테이블 컬럼 패밀리로 정의하도록 스키마를 세분화하여 저장하며, HBase 기반 RDF 저장소의 개선된 테이블 스키마를 기반으로 질의를 분석하여 HBase 필터를 적용해 검색해야 하는 데이터의 양을 획기적으로 줄여 효율적으로 질의를 처리할 수 있도록 하고, 기존 질의 처리기에서 처리하지 못한 중첩 트리플 패턴 질의를 처리할 수 있다.Korean Patent Laid-Open No. 10-2016-0004781 (2016.01.13) relates to an ontology query processing method using a big data framework, and stores a class type as a prefix in each node stored in a table. Classify and store the schema to define each table column family and properties, and analyze the query based on the improved table schema of the HBase-based RDF repository to apply the HBase filter to search. It is possible to process queries efficiently by reducing the number of blocks, and to process nested triple pattern queries that cannot be processed by the existing query processor.

한국등록특허 제10-1117709(2012.02.10)호는 공간 분할 트리의 최소 데이터-불균등 커버를 이용한 다차원 히스토그램 방법 및 이를 실행하기 위한 프로그램이 저장된 기록매체에 관한 것으로, 주어진 공간을 다양한 크기의 공간들로 분할하여 형성한 공간 분할 트리 내 각 분할된 공간 내 데이터 객체의 불균등에 기초하여 최소 데이터-불균등 커버를 판단한 후 이에 기반하여 히스토그램의 버킷을 생성함으로써, 종래의 다차원 히스토그램 방법과 달리 데이터 객체가 균등하게 분포되지 않은 상황에서도 영역 질의의 선택도에 대한 추정값 계산의 정확성을 확보하는 효과가 있다.Korean Patent No. 10-1117709 (2012.02.10) relates to a multi-dimensional histogram method using a minimum data-uneven cover of a spatial partition tree and a recording medium storing a program for executing the same. Based on the inequality of the data objects in the partitioned space formed by dividing by, the minimum data-unbalance cover is determined, and a bucket of the histogram is created based on this, so that the data objects are equal, unlike the conventional multidimensional histogram method. Even in a non-distributed situation, it is effective to secure the accuracy of the estimation calculation for the selectivity of the region query.

한국공개특허 제10-2016-0004781(2016.01.13)호Korean Patent Publication No. 10-2016-0004781 (2016.01.13) 한국등록특허 제10-1117709(2012.02.10)호Korea Patent Registration No. 10-1117709 (2012.02.10)

본 발명의 일 실시예는 데이터 공간을 효율적으로 분할하고 적절한 테이블 스키마를 사용하여 효율적인 질의 처리를 할 수 있는 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법을 제공하고자 한다.An embodiment of the present invention is to provide a partition space-based spatial data object query processing apparatus and method capable of efficiently partitioning a data space and efficient query processing using an appropriate table schema.

본 발명의 일 실시예는 재귀적인 사분할을 통해 분할된 복수의 분할 공간 및 공간 데이터 객체의 최소 경계 사각형을 기초로 인덱스 트리를 생성할 수 있는 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법을 제공하고자 한다.An embodiment of the present invention provides an apparatus and method for processing a spatial data object based on a partition space capable of generating an index tree based on a plurality of partition spaces divided by a recursive quadrant and a minimum bounding rectangle of the spatial data object. To provide.

본 발명의 일 실시예는 효율적인 인덱스 트리를 이용하여 유사 질의를 처리함으로써 긍정 오류를 효과적으로 줄일 수 있는 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법을 제공하고자 한다.An embodiment of the present invention is to provide an apparatus and method for processing a spatial data object based on partition space that can effectively reduce false positives by processing similar queries using an efficient index tree.

실시예들 중에서, 분할 공간 기반의 공간 데이터 객체 질의처리장치는 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 분할 공간 생성부 및 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 인덱스 트리 생성부를 포함한다.In one or more embodiments, a partition space-based spatial data object query processing apparatus may include a partition space generation unit configured to generate a plurality of partition spaces by partitioning a data space including at least one spatial data object and information on the plurality of partition spaces. And an index tree generation unit for generating an index tree based on minimum boundary rectangle (MBR) information including all spatial data objects included in the partition.

상기 분할 공간 생성부는 상기 복수의 분할 공간들 각각에 관해 해당 공간 데이터 객체의 밀집도가 특정 기준 이하가 될 때까지 해당 분할 공간을 해당 분할 공간의 중심점을 기준으로 재귀적으로 재분할 할 수 있다.The partition space generator may repartition the partition space recursively based on the center point of the partition space until the density of the corresponding spatial data object becomes less than or equal to a specific criterion for each of the plurality of partition spaces.

상기 인덱스 트리 생성부는 상기 분할 공간에 관한 정보를 기초로 생성된 키(Key) 값 및 상기 최소 경계 사각형 정보를 기초로 생성된 밸류(Value) 값을 포함하는 행 데이터로 구성된 테이블을 기초로 상기 인덱스 트리를 생성할 수 있다.The index tree generation unit indexes the index based on a table including row data including a key value generated based on the information about the partition space and a value generated based on the minimum boundary rectangle information. You can create a tree.

상기 인덱스 트리 생성부는 상기 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 상기 키 값을 생성할 수 있다.Each time the partition space is generated, the index tree generator displays a partition space in a direction close to the origin as 0 and a partition space in a distant direction as 1 for each axis, and connects bits for each axis. You can generate key values.

상기 인덱스 트리 생성부는 상기 분할 공간에 대한 재귀적인 재분할이 발생하는 경우 이전 분할 정보 및 현재 발생한 재분할 공간에 대한 정보를 연결하는 방식으로 표시할 수 있다.When the recursive repartition of the partition space occurs, the index tree generation unit may display the partition information by connecting the previous partition information and the information on the current repartition space.

상기 인덱스 트리 생성부는 내부 노드에 관한 상기 행 데이터를 저장하는 인덱스 테이블 및 리프 노드에 관한 상기 행 데이터를 저장하는 데이터 테이블을 생성함으로써 상기 인덱스 트리를 생성할 수 있다.The index tree generating unit may generate the index tree by generating an index table for storing the row data of an internal node and a data table for storing the row data of a leaf node.

상기 분할 공간 기반의 공간 데이터 객체 질의처리장치는 상기 인덱스 트리를 이용하여 공간 데이터 객체 질의를 처리하는 질의 처리부를 더 포함할 수 있다.The spatial data object query processing apparatus based on the partition space may further include a query processing unit that processes a spatial data object query using the index tree.

상기 질의 처리부는 상기 인덱스 트리를 이용하여 질의 포인트와 질의 반경을 포함하는 범위 질의 또는 질의 포인트와 최근접 이웃 수를 포함하는 kNN 질의를 처리할 수 있다.The query processing unit may process a range query including a query point and a query radius or a kNN query including a query point and a nearest neighbor number using the index tree.

실시예들 중에서, 분할 공간 기반의 공간 데이터 객체 질의처리방법은 분할 공간 기반의 공간 데이터 객체 질의처리장치에서 수행되는 공간 데이터 객체 질의처리방법에 있어서, (a) 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 단계 및 (b) 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 단계를 포함한다.Among the embodiments, the spatial data object query processing method based on the partition space in the spatial data object query processing method performed in the spatial data object query processing apparatus based on (a) comprising at least one spatial data object. Generating a plurality of divided spaces by dividing a data space; and (b) minimum boundary rectangle (MBR) information including all information about the plurality of divided spaces and spatial data objects included in the divided spaces. Generating an index tree based on the;

상기 (b) 단계는 상기 분할 공간에 관한 정보를 기초로 생성된 키(Key) 값 및 상기 최소 경계 사각형 정보를 기초로 생성된 밸류(Value) 값을 포함하는 행 데이터로 구성된 테이블을 기초로 상기 인덱스 트리를 생성하는 단계일 수 있다.The step (b) may be performed based on a table including row data including a key value generated based on the information about the partition space and a value value generated based on the minimum boundary rectangle information. It may be a step of generating an index tree.

상기 (b) 단계는 상기 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 상기 키 값을 생성하는 단계일 수 있다.In step (b), each time the partition space is generated, the partition space in the direction close to the origin is represented by 0 and the partition space in the distant direction is 1 for each axis, and the bits for each axis are connected. The key value may be generated.

상기 (b) 단계는 상기 분할 공간에 대한 재귀적인 재분할이 발생하는 경우 이전 분할 정보 및 현재 발생한 재분할 공간에 대한 정보를 연결하는 방식으로 표시하는 단계일 수 있다.In the step (b), when recursive repartitioning of the divided space occurs, the step of displaying the previous partitioning information and information on the current repartitioned space may be displayed in a manner of being connected.

상기 (b) 단계는 내부 노드에 관한 상기 행 데이터를 저장하는 인덱스 테이블 및 리프 노드에 관한 상기 행 데이터를 저장하는 데이터 테이블을 생성함으로써 상기 인덱스 트리를 생성하는 단계일 수 있다.The step (b) may be the step of generating the index tree by creating an index table for storing the row data for an internal node and a data table for storing the row data for a leaf node.

상기 분할 공간 기반의 공간 데이터 객체 질의처리방법은 (c) 상기 인덱스 트리를 이용하여 공간 데이터 객체 질의를 처리하는 단계를 더 포함할 수 있다.The partition space based spatial data object query processing method may further include (c) processing a spatial data object query using the index tree.

상기 (c) 단계는 상기 인덱스 트리를 이용하여 질의 포인트와 질의 반경을 포함하는 범위 질의 또는 질의 포인트와 최근접 이웃 수를 포함하는 kNN 질의를 처리하는 단계일 수 있다.Step (c) may be a step of processing a range query including a query point and a query radius or a kNN query including a query point and a nearest neighbor number using the index tree.

실시예들 중에서, 기록매체는 분할 공간 기반의 공간 데이터 객체 질의처리장치에서 수행되는 공간 데이터 객체 질의처리방법을 기록하는 컴퓨터 수행 가능한 기록매체에 있어서, 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 과정 및 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 과정을 포함한다.In one or more embodiments, the recording medium may be a computer-executable recording medium for recording a spatial data object query processing method performed by a spatial data object query processing apparatus based on a partition space, and includes a data space including at least one spatial data object. The index tree is divided based on a process of generating a plurality of partition spaces by partitioning and information on minimum bounding rectangles (MBRs) including information on the plurality of partition spaces and spatial data objects included in the partition spaces. The process of creation.

개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.The disclosed technique can have the following effects. However, since a specific embodiment does not mean to include all of the following effects or only the following effects, it should not be understood that the scope of the disclosed technology is limited by this.

본 발명의 일 실시예에 따른 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법은 재귀적인 사분할을 통해 분할된 복수의 분할 공간 및 공간 데이터 객체의 최소 경계 사각형을 기초로 인덱스 트리를 생성할 수 있다.An apparatus and method for processing a spatial data object based on a partition according to an embodiment of the present invention may generate an index tree based on a plurality of partition spaces and minimum bounding rectangles of spatial data objects partitioned through recursive partitioning. have.

본 발명의 일 실시예에 따른 분할 공간 기반의 공간 데이터 객체 질의처리장치 및 방법은 효율적인 인덱스 트리를 이용하여 유사 질의를 처리함으로써 긍정 오류를 효과적으로 줄일 수 있다.The partition space-based spatial data object query processing apparatus and method according to an embodiment of the present invention can effectively reduce false positives by processing similar queries using an efficient index tree.

도 1은 본 발명의 일 실시예에 따른 분할 공간 기반의 공간 데이터 객체 질의처리 시스템을 설명하는 도면이다.
도 2는 도 1에 있는 공간 데이터 객체 질의처리장치를 설명하는 블록도이다.
도 3은 도 1에 있는 공간 데이터 객체 질의처리장치에서 공간 데이터 객체 질의를 처리하는 과정을 설명하는 순서도이다.
도 4는 선형화 기법을 사용하여 범위 질의를 처리하는 과정을 설명하는 예시도이다.
도 5는 다차원 인덱싱 레이어를 사용하여 범위 질의를 처리하는 과정을 설명하는 예시도이다.
도 6은 공간 데이터 객체 질의처리장치에서 수행되는 공간 분할 과정을 설명하는 예시도이다.
도 7은 도 2에 있는 인덱스 트리 생성부에서 생성하는 인덱스 트리 노드의 구조를 설명하는 예시도이다.
도 8은 도 2에 있는 인덱스 트리 생성부에서 생성하는 인덱스 트리 노드에 대한 테이블 구성을 설명하는 예시도이다.
도 9는 공간 데이터 객체 질의처리장치에서 수행되는 범위 질의 처리 과정을 설명하는 예시도이다.
1 is a diagram illustrating a partition space based spatial data object query processing system according to an exemplary embodiment of the present invention.
FIG. 2 is a block diagram illustrating a spatial data object query processing apparatus in FIG. 1.
3 is a flowchart illustrating a process of processing a spatial data object query in the spatial data object query processing apparatus of FIG. 1.
4 is an exemplary diagram illustrating a process of processing a range query using a linearization technique.
5 is an exemplary diagram illustrating a process of processing a range query using a multidimensional indexing layer.
6 is an exemplary diagram illustrating a spatial partitioning process performed by a spatial data object query processing apparatus.
FIG. 7 is an exemplary diagram illustrating a structure of an index tree node generated by the index tree generator of FIG. 2.
8 is an exemplary diagram illustrating a table configuration of an index tree node generated by the index tree generator of FIG. 2.
9 is an exemplary view illustrating a range query processing process performed by a spatial data object query processing apparatus.

본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.Description of the present invention is only an embodiment for structural or functional description, the scope of the present invention should not be construed as limited by the embodiments described in the text. That is, since the embodiments may be variously modified and may have various forms, the scope of the present invention should be understood to include equivalents capable of realizing the technical idea. In addition, the objects or effects presented in the present invention does not mean that a specific embodiment should include all or only such effects, the scope of the present invention should not be understood as being limited thereby.

한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.On the other hand, the meaning of the terms described in the present application should be understood as follows.

"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.Terms such as "first" and "second" are intended to distinguish one component from another component, and the scope of rights should not be limited by these terms. For example, the first component may be named a second component, and similarly, the second component may also be named a first component.

어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being "connected" to another component, it should be understood that there may be other components in between, although it may be directly connected to the other component. On the other hand, when a component is referred to as being "directly connected" to another component, it should be understood that there is no other component in between. On the other hand, other expressions describing the relationship between the components, such as "between" and "immediately between" or "neighboring to" and "directly neighboring to", should be interpreted as well.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Singular expressions should be understood to include plural expressions unless the context clearly indicates otherwise, and terms such as "comprise" or "have" refer to a feature, number, step, operation, component, part, or feature thereof. It is to be understood that the combination is intended to be present and does not exclude in advance the possibility of the presence or addition of one or more other features or numbers, steps, operations, components, parts or combinations thereof.

각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.In each step, an identification code (e.g., a, b, c, etc.) is used for convenience of description, and the identification code does not describe the order of the steps, and each step clearly indicates a specific order in context. Unless stated otherwise, they may occur out of the order noted. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.

본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can be embodied as computer readable code on a computer readable recording medium, and the computer readable recording medium includes all kinds of recording devices in which data can be read by a computer system. . Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.

여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.All terms used herein have the same meaning as commonly understood by one of ordinary skill in the art unless otherwise defined. Generally, the terms defined in the dictionary used are to be interpreted to coincide with the meanings in the context of the related art, and should not be interpreted as having ideal or excessively formal meanings unless clearly defined in the present application.

도 1은 본 발명의 일 실시예에 따른 분할 공간 기반의 공간 데이터 객체 질의처리 시스템을 설명하는 도면이다.1 is a diagram illustrating a partition space based spatial data object query processing system according to an exemplary embodiment of the present invention.

도 1을 참조하면, 분할 공간 기반의 공간 데이터 객체 질의처리 시스템(이하, 공간 데이터 객체 질의처리 시스템이라 한다.)(100)은 사용자 단말(110), 공간 데이터 객체 질의처리장치(130) 및 데이터베이스(150)를 포함할 수 있다.Referring to FIG. 1, a partition-based spatial data object query processing system (hereinafter, referred to as a spatial data object query processing system) 100 includes a user terminal 110, a spatial data object query processing apparatus 130, and a database. 150 may be included.

사용자 단말(110)은 공간 데이터 객체 질의를 입력하고 관련 응답을 확인할 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 공간 데이터 객체 질의처리장치(130)와 네트워크를 통해 연결될 수 있고, 사용자 단말1(110a) 내지 사용자 단말n(110c)을 포함하는 복수의 사용자 단말(110)은 공간 데이터 객체 질의처리장치(130)와 동시에 연결될 수 있다.The user terminal 110 may correspond to a computing device capable of inputting a spatial data object query and confirming a related response, and may be implemented as a smartphone, a notebook, or a computer, and is not limited thereto. It can also be implemented. The user terminal 110 may be connected to the spatial data object query processing apparatus 130 through a network, and the plurality of user terminals 110 including the user terminal 1 (110a) to the user terminal n (110c) may be a spatial data object. The query processing apparatus 130 may be connected at the same time.

공간 데이터 객체 질의처리장치(130)는 공간 분할을 통해 생성한 인덱스 트리를 이용하여 공간 데이터 객체 질의를 수신하여 처리할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 공간 데이터 객체 질의처리장치(130)는 사용자 단말(110)과 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 주고 받을 수 있다.The spatial data object query processing apparatus 130 may be implemented as a server corresponding to a computer or a program capable of receiving and processing a spatial data object query using an index tree generated by spatial partitioning. The spatial data object query processing apparatus 130 may be wirelessly connected to the user terminal 110 through Bluetooth, WiFi, or the like, and may exchange data with the user terminal 110 through a network.

공간 데이터 객체 질의처리장치(130)는 데이터베이스(150)를 포함하여 구현될 수 있고, 데이터베이스(150)와 독립적으로 구현될 수 있다. 데이터베이스(150)와 독립적으로 구현된 경우 공간 데이터 객체 질의처리장치(130)는 데이터베이스(150)와 유선 또는 무선으로 연결되어 데이터를 주고 받을 수 있다.The spatial data object query processing apparatus 130 may be implemented including a database 150 and may be implemented independently of the database 150. When implemented independently of the database 150, the spatial data object query processing apparatus 130 may be connected to the database 150 by wire or wirelessly to exchange data.

데이터베이스(150)는 공간 데이터 객체 질의처리를 위해 필요한 다양한 정보들을 저장할 수 있는 저장장치이다. 데이터베이스(150)는 사용자 단말(110)로부터 수신한 적어도 하나의 범위 질의 또는 kNN 질의에 관한 정보 및 해당 질의를 처리하여 얻은 결과를 저장할 수 있고, 반드시 이에 한정되지 않고, 공간 데이터 객체 질의처리장치(130)가 공간 데이터 객체 질의를 처리하는 과정에서 다양한 형태로 수집하거나 가공한 정보들을 저장할 수 있다.The database 150 is a storage device that can store various information necessary for processing spatial data object queries. The database 150 may store information about at least one range query or kNN query received from the user terminal 110 and a result obtained by processing the query, but is not limited thereto, and the spatial data object query processing apparatus ( 130 may store information collected or processed in various forms in the process of processing the spatial data object query.

일 실시예에서, 데이터베이스(150)는 공간 데이터들을 저장하고 관리할 수 있는 HBase에 해당할 수 있다. 여기에서, HBase는 아파치 HBase(Apache HBase)로서 하둡(Hadoop) 플랫폼을 위한 공개 비관계형 분산 데이터베이스에 해당할 수 있다. HBase는 구조화된 대용량의 데이터에 빠른 임의접근을 제공하는 구글의 빅 테이블과 비슷한 데이터 모델을 가지고, HDFS(Hadoop Distributed File System)의 데이터에 대한 실시간 임의 읽기/쓰기 기능을 제공할 수 있다.In one embodiment, the database 150 may correspond to HBase capable of storing and managing spatial data. Here, HBase is Apache HBase, which may correspond to an open, non-relational database for the Hadoop platform. HBase has a data model similar to Google's Big Table, which provides fast random access to large amounts of structured data, and can provide real-time random read / write of data from the Hadoop Distributed File System (HDFS).

데이터베이스(150)는 특정 범위에 속하는 정보들을 저장하는 적어도 하나의 독립된 서브-데이터베이스들로 구성될 수 있고, 적어도 하나의 독립된 서브-데이터베이스들이 하나로 통합된 통합 데이터베이스로 구성될 수 있다. 적어도 하나의 독립된 서브-데이터베이스들로 구성되는 경우에는 각각의 서브-데이터베이스들은 블루투스, WiFi 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 상호 간의 데이터를 주고 받을 수 있다. 데이터베이스(150)는 통합 데이터베이스로 구성되는 경우 각각의 서브-데이터베이스들을 하나로 통합하고 상호 간의 데이터 교환 및 제어 흐름을 관리하는 제어부를 포함할 수 있다.The database 150 may be composed of at least one independent sub-databases that store information belonging to a specific range, and may be configured as an integrated database in which at least one independent sub-databases are integrated into one. When composed of at least one independent sub-database, each sub-database may be wirelessly connected through Bluetooth, WiFi, and the like, and may exchange data with each other through a network. When the database 150 is configured as an integrated database, the database 150 may include a control unit for integrating respective sub-databases into one and managing data exchange and control flow between them.

도 2는 도 1에 있는 공간 데이터 객체 질의처리장치를 설명하는 블록도이다.FIG. 2 is a block diagram illustrating a spatial data object query processing apparatus in FIG. 1.

도 2를 참조하면, 공간 데이터 객체 질의처리장치(130)는 분할 공간 생성부(210), 인덱스 트리 생성부(230), 질의 처리부(250) 및 제어부(270)를 포함할 수 있다.Referring to FIG. 2, the spatial data object query processing apparatus 130 may include a partition space generator 210, an index tree generator 230, a query processor 250, and a controller 270.

분할 공간 생성부(210)는 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성할 수 있다. 여기에서, 데이터 공간은 공간 데이터 객체가 정의되는 다차원 공간에 해당할 수 있다. 공간 데이터 객체는 각 차원에 해당하는 속성 값을 포함하여 정의될 수 있고, 분할 공간 생성부(210)는 공간 데이터 객체가 가질 수 있는 각 속성 값들의 범위를 이용하여 데이터 공간을 정의할 수 있다.The partition space generator 210 may generate a plurality of partition spaces by partitioning a data space including at least one spatial data object. Here, the data space may correspond to the multidimensional space in which the spatial data object is defined. The spatial data object may be defined including attribute values corresponding to each dimension, and the partition space generator 210 may define a data space using a range of attribute values that the spatial data object may have.

예를 들어, 분할 공간 생성부(210)는 데이터 공간이 2차원 좌표계를 가지고 각 축의 길이가 원점으로부터 100의 길이를 가지는 정사각형 공간에 해당하는 경우, 해당 공간의 중심점인 (50, 50)의 위치를 기준으로 해당 중심점을 지나는 각 축에 평행한 직선을 기초로 4개의 분할 공간으로 사분할 할 수 있다. 사분할 된 각 분할 공간은 모두 정사각형에 해당할 수 있고, 동일한 크기를 가질 수 있다.For example, when the data space corresponds to a square space having a two-dimensional coordinate system and the length of each axis having a length of 100 from the origin, the partition space generating unit 210 has a position of (50, 50) which is the center point of the space. Based on this, it can be divided into four divided spaces based on a straight line parallel to each axis passing through the center point. Each divided partition may correspond to a square and may have the same size.

일 실시예에서, 분할 공간 생성부(210)는 복수의 분할 공간들 각각에 관해 해당 공간 데이터 객체의 밀집도가 특정 기준 이하가 될 때까지 해당 분할 공간을 해당 분할 공간의 중심점을 기준으로 재귀적으로 재분할 할 수 있다. 여기에서, 공간 데이터 객체의 밀집도는 특정 분할 공간 내에 존재하는 공간 데이터 객체의 수에 해당할 수 있다. 예를 들어, 분할 공간 내에 존재하는 공간 데이터 객체의 수가 4 이하가 될 때까지 재분할을 하는 경우 분할 공간 생성부(210)는 특정 분할 공간이 해당 분할 공간 내에 9개의 공간 데이터 객체를 포함하고 있다면 해당 분할 공간을 4개의 분할 공간으로 재분할 할 수 있고, 재분할된 분할 공간 중에서 4개 이상의 공간 데이터 객체를 포함하고 있는 분할 공간이 존재하는 경우 해당 분할 공간에 대해서는 재분할 과정을 다시 수행할 수 있다.In one embodiment, the partition space generation unit 210 recursively divides the partition space with respect to each of the plurality of partition spaces based on the center point of the partition space until the density of the corresponding spatial data object is less than or equal to a specific criterion. Can be subdivided. Here, the density of the spatial data objects may correspond to the number of spatial data objects existing in a specific partition space. For example, when repartitioning until the number of spatial data objects existing in the partition is less than or equal to 4, the partition generation unit 210 corresponds to a specific partition if the partition includes 9 spatial data objects in the partition. The partition may be repartitioned into four partitions, and if there is a partition including four or more spatial data objects among the partitioned partitions, the partition may be repartitioned.

인덱스 트리 생성부(230)는 분할 공간에 관한 정보 및 해당 분할 공간 데이터 객체를 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성할 수 있다. 여기에서, 최소 경계 사각형은 해당 분할 공간 데이터 객체를 모두 포함하는 사각형 중에서 넓이가 가장 최소인 사각형에 해당할 수 있다. 인덱스 트리 생성부(230)는 특정 분할 공간 및 해당 분할 공간에 존재하는 공간 데이터 객체들 모두를 포함하는 최소 경계 사각형 각각에 대한 정보를 이용하여 인덱스 트리를 생성할 수 있다.The index tree generation unit 230 may generate an index tree based on information about the partition space and minimum boundary rectangle (MBR) information including the partition data object. Here, the minimum bounding rectangle may correspond to the rectangle having the smallest width among the rectangles containing all the partition data objects. The index tree generator 230 may generate an index tree by using information about each of the minimum bounding rectangles including all the partitions and the spatial data objects existing in the partitions.

일 실시예에서, 인덱스 트리 생성부(230)는 분할 공간에 관한 정보를 기초로 생성된 키(Key) 값 및 최소 경계 사각형 정보를 기초로 생성된 밸류(Value) 값을 포함하는 행 데이터로 구성된 테이블을 기초로 인덱스 트리를 생성할 수 있다. 예를 들어, 인덱스 트리 생성부(230)는 (키, 밸류) 값으로 구성된 행 데이터를 생성하여 HBase 테이블의 한 행으로 저장할 수 있다.In one embodiment, the index tree generator 230 is composed of row data including a key value generated based on information on partition space and a value value generated based on minimum bounding rectangle information. You can create an index tree based on a table. For example, the index tree generation unit 230 may generate row data composed of (key, value) values and store the row data as one row of the HBase table.

일 실시예에서, 인덱스 트리 생성부(230)는 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 키 값을 생성할 수 있다. 예를 들어, 인덱스 트리 생성부(230)는 분할을 통해 생성된 분할 공간이 있는 경우 해당 분할에서 x축에 대해서는 원점으로부터 먼 방향이고 y축에 대해서는 원점에서 가까운 방향의 분할 공간이라면 각각 '1', '0'으로 표시될 수 있고 이를 연결하여 최종적으로 '10'으로 표시될 수 있다.In one embodiment, each time the partition space is generated, the index tree generator 230 displays the partition space in the direction close to the origin as 0 and the partition space in the far direction as 1 for each axis, and the bit for each axis. You can create a key value by concatenating (bit). For example, if there is a partition space generated through partitioning, the index tree generator 230 is '1' if the partition space is a direction far from the origin with respect to the x axis and a direction closer to the origin with respect to the y axis in the partition. , '0' and may be connected and finally displayed as '10'.

일 실시예에서, 인덱스 트리 생성부(230)는 분할 공간에 대한 재귀적인 재분할이 발생하는 경우 이전 분할 정보 및 현재 발생한 재분할 공간에 대한 정보를 연결하는 방식으로 표시할 수 있다. 예를 들어, 인덱스 트리 생성부(230)는 분할을 통해 생성되고 '10'으로 표시된 분할 공간에 대해 재분할이 발생한 경우, 재분할된 4개의 분할 공간들은 각각 '00', '01', '10' 및 '11'로 표시될 수 있고, 이전 분할 정보인 '10'에 연결되어 최종적으로 '1000', '1001', '1010' 및 '1011'로 표시될 수 있다. According to an embodiment, the index tree generator 230 may display the previous partition information and the information on the currently generated repartitioned space in a manner of concatenating repartitioned partitions. For example, when the index tree generator 230 is generated through partitioning and repartitioning occurs for the partition space indicated by '10', the four partitioned partitioned spaces are '00', '01', and '10', respectively. And '11', and may be connected to '10' which is the previous split information and finally displayed as '1000', '1001', '1010' and '1011'.

일 실시예에서, 인덱스 트리 생성부(230)는 내부 노드에 관한 행 데이터를 저장하는 인덱스 테이블 및 리프 노드에 관한 행 데이터를 저장하는 데이터 테이블을 생성함으로써 인덱스 트리를 생성할 수 있다. 인덱스 테이블은 내부 노드에 관한 행 데이터를 저장할 수 있고, 내부 노드에 관한 행 데이터는 분할 공간 생성부(210)에 의해 생성된 분할 공간에 관한 정보를 기초로 생성된 키 값, 해당 내부 노드를 루트로 하는 트리 내에 존재하는 공간 데이터 객체의 수, 해당 내부 노드의 자식 노드 정보 및 각 자식 노드와 연관된 MBR 정보를 포함할 수 있다. 데이터 테이블은 리프 노드에 관한 행 데이터를 저장할 수 있고, 리프 노드에 관한 행 데이터는 각 리프 노드와 연관된 분할 공간에 관한 정보를 기초로 생성된 키 값, 해당 리프 노드와 연관된 분할 공간 내에 존재하는 공간 데이터 객체에 관한 정보를 포함할 수 있다.In an embodiment, the index tree generator 230 may generate an index tree by generating an index table that stores row data about an internal node and a data table that stores row data about a leaf node. The index table may store row data about an internal node, and the row data about an internal node may be a key value generated based on the information about the partition space generated by the partition generator 210, and the root of the corresponding internal node. The number of spatial data objects existing in the tree may be included, child node information of the corresponding internal node, and MBR information associated with each child node. The data table can store row data about leaf nodes, where the row data about leaf nodes is a key value generated based on information about the partition space associated with each leaf node, and a space within the partition space associated with that leaf node. May contain information about the data object.

질의 처리부(250)는 인덱스 트리 생성부(230)를 통해 생성된 인덱스 트리를 이용하여 공간 데이터 객체 질의를 처리할 수 있다. 여기에서, 인덱스 트리는 Q-MBR(Quadrand-based MBR) 트리에 해당할 수 있다. Q-MBR 및 이를 이용한 Q-BMR 트리에 대해서는 도 6 내지 8에서 보다 자세히 설명한다.The query processor 250 may process a spatial data object query using the index tree generated by the index tree generator 230. Here, the index tree may correspond to a quadrand-based MBR (Q-MBR) tree. The Q-MBR and the Q-BMR tree using the same will be described in more detail with reference to FIGS. 6 to 8.

일 실시예에서, 질의 처리부(250)는 인덱스 트리 생성부(230)를 통해 생성된 인덱스 트리를 이용하여 질의 포인트와 질의 반경을 포함하는 범위 질의 또는 질의 포인트와 최근접 이웃 수를 포함하는 kNN 질의를 처리할 수 있다. 보다 구체적으로, 질의 처리부(250)는 인덱스를 탐색하는 동안 Q-MBR 트리를 너비 우선 순서(Breadth First Search, BFS)에 따라 탐색하고 다음 반복(iteration)을 로드하기 위한 행 키(Rowkey)를 계산할 수 있다. In one embodiment, the query processor 250 uses the index tree generated by the index tree generator 230 to query a range query including a query point and a query radius or a kNN query including a query point and a nearest neighbor number. Can be processed. More specifically, the query processor 250 searches the Q-MBR tree according to Breadth First Search (BFS) while searching the index, and calculates a row key for loading the next iteration. Can be.

일 실시예에서, 질의 처리부(250)는 범위 질의 처리를 위한 인덱스 검색을 위해 N, I 및 D라는 세 집합을 사용할 수 있다. 여기에서, N은 현재의 반복(iteration)에서 탐색을 위해 로드된 노드를 저장할 수 있다. I는 다음 반복(iteration)에서 인덱스 테이블에서 로드될 행 키 집합에 해당할 수 있다. D는 데이터 테이블에서 로드할 행 키 집합에 해당할 수 있다.In one embodiment, the query processing unit 250 may use three sets of N, I, and D to search the index for range query processing. Here, N can store the loaded node for searching in the current iteration. I may correspond to a set of row keys to be loaded from the index table in the next iteration. D may correspond to a set of row keys to load from the data table.

질의 처리부(250)는 루트 노드의 행 키를 I에 삽입한 다음 인덱스 테이블에서 노드를 로드하여 탐색을 시작할 수 있다. 질의 처리부(250)는 인덱스 트리의 최대 깊이를 알고 있는 경우 루트 노드에 대한 단일 행 키만 삽입하는 대신 하위 레벨 노드에 대한 복수의 행 키를 I에 삽입할 수 있다. The query processor 250 may insert the row key of the root node into I and then load the node from the index table to start the search. When the query processor 250 knows the maximum depth of the index tree, the query processor 250 may insert a plurality of row keys for lower level nodes into I, instead of inserting only a single row key for the root node.

질의 처리부(250)는 현재 노드가 내부 노드인 경우 자식 노드의 MBR과 질의 포인트 q 간의 최소 거리를 계산할 수 있고, 거리가 질의 반경 r 이내에 있는 자식의 행 키를 I에 삽입할 수 있다. 질의 처리부(250)는 N에 있는 모든 노드를 탐색한 후 I에 저장된 행 키를 사용하여 추가 노드들을 프리패치(prefetch)하고 다음 반복(iteration)을 위해 N에 결과를 저장할 수 있다. When the current node is an internal node, the query processor 250 may calculate a minimum distance between the MBR of the child node and the query point q, and insert a row key of a child whose distance is within the query radius r into I. The query processing unit 250 may search all nodes in N and then prefetch additional nodes using the row key stored in I and store the result in N for the next iteration.

질의 처리부(250)는 인덱스 탐색 과정에서 리프 노드에 도달하면 리프 노드의 행 키를 D에 저장할 수 있고, 질의 처리 마지막 단계에서 관련 공간 데이터 객체를 로드할 수 있다. 질의 처리부(250)는 I에 노드가 없는 경우 리프 노드에 저장된 공간 데이터 객체를 D에 로드할 수 있고, 공간 데이터 객체와 질의 포인트 q 간의 거리를 계산하여 범위 질의에 응답할 수 있다.When the query processor 250 reaches the leaf node during the index search, the query processor 250 may store the row key of the leaf node in D, and load the relevant spatial data object at the end of the query processing. If there is no node in I, the query processor 250 may load the spatial data object stored in the leaf node in D, and may calculate a distance between the spatial data object and the query point q and respond to the range query.

질의 처리부(250)는 질의 포인트 q와의 거리가 질의 반경 r보다 작거나 같은 공간 데이터 객체만을 결과 집합에 삽입할 수 있다. 질의 처리부(250)는 결과 집합에 속한 공간 데이터 객체에 관한 정보를 질의 처리 결과로서 사용자 단말(110)에 제공할 수 있다.The query processor 250 may insert only a spatial data object whose distance from the query point q is less than or equal to the query radius r to the result set. The query processor 250 may provide the user terminal 110 with information about the spatial data object belonging to the result set as a query processing result.

일 실시예에서, 질의 처리부(250)는 kNN 질의 처리를 위해 N과 Q의 두가지 우선순위 큐(Queue)를 유지할 수 있다. 여기에서, N은 질의 포인트에서 MBR까지의 최소 거리의 오름차순으로 노드를 저장할 수 있고, Q는 kNN의 후보 집합을 내림차순으로 저장할 수 있다.In one embodiment, the query processor 250 may maintain two priority queues, N and Q, for kNN query processing. Here, N may store nodes in ascending order of the minimum distance from the query point to MBR, and Q may store kNN candidate sets in descending order.

질의 처리부(250)는 kNN 질의 두 단계로 처리할 수 있다. 첫 번째 단계에서 질의 처리부(250)는 근사 범위 r을 사용하여 리프 노드의 행 키를 찾기 위해 Q-MBR 트리를 탐색할 수 있다. 여기에서, 근사 범위는 원하는 이웃 수를 찾기 위해 충분한 수의 공간 데이터 객체를 보장하는 최소 거리에 해당할 수 있다. The query processor 250 may process the kNN query in two steps. In the first step, the query processing unit 250 may search the Q-MBR tree to find the row key of the leaf node using the approximation range r. Here, the approximate range may correspond to a minimum distance that guarantees a sufficient number of spatial data objects to find the desired number of neighbors.

질의 처리부(250)는 인덱스 탐색 과정에서 N에 저장된 노드들을 순차적으로 검사하여 최소 거리가 r보다 작은 자식 노드를 가지고 있는지를 결정할 수 있다. 질의 처리부(250)는 자식 노드의 최소 거리가 r보다 작은 경우 자식 노드의 행 키를 리스트 I에 삽입할 수 있다. 질의 처리부(250)는 범위 r은 초기 단계에서 매우 크게 설정할 수 있고, 현재 노드보다 가까운 노드의 객체 수가 k를 초과하면 N에서 노드의 최대 거리로 갱신할 수 있다. The query processor 250 may sequentially check nodes stored in N to determine whether the minimum distance has a child node smaller than r. The query processor 250 may insert the row key of the child node into the list I when the minimum distance of the child node is smaller than r. The query processing unit 250 may set the range r to be very large at an initial stage, and may update from N to the maximum distance of the node when the number of objects of a node closer than the current node exceeds k.

질의 처리부(250)는 현재 노드가 리프 노드인 경우 현재 노드의 행 키를 리스트 L에 저장하여 함께 로드할 수 있다. 질의 처리부(250)는 N에 더 이상 노드가 없으면 행 키가 I에 저장된 노드를 로드할 수 있다. 질의 처리부(250)는 N에 노드가 없고 I에 행 키가 없을 때 첫 번째 단계를 종료할 수 있다. 질의 처리부(250)는 인덱스 검색 후 L에 저장된 리프 노드의 공간 데이터 객체를 로드하고 거리를 평가하여 질의 결과 집합을 식별할 수 있다. 질의 처리부(250)는 평가된 공간 데이터 객체를 Q에 저장할 수 있고, 평가할 공간 데이터 객체가 더 이상 없을 때 질의 결과 집합을 반환할 수 있다.When the current node is a leaf node, the query processor 250 may store the row key of the current node in the list L and load the same together. If there are no more nodes in N, the query processor 250 may load the node in which the row key is stored in I. The query processing unit 250 may terminate the first step when there is no node in N and there is no row key in I. The query processor 250 may identify the query result set by loading the spatial data object of the leaf node stored in L and evaluating the distance after the index search. The query processor 250 may store the evaluated spatial data object in Q, and may return a query result set when there are no more spatial data objects to be evaluated.

제어부(270)는 공간 데이터 객체 질의처리장치(130)의 전체적인 동작을 제어하고, 분할 공간 생성부(210), 인덱스 트리 생성부(230) 및 질의 처리부(250) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.The controller 270 controls the overall operation of the spatial data object query processing apparatus 130 and manages a control flow or data flow between the partition space generator 210, the index tree generator 230, and the query processor 250. can do.

도 3은 도 1에 있는 공간 데이터 객체 질의처리장치에서 공간 데이터 객체 질의를 처리하는 과정을 설명하는 순서도이다.3 is a flowchart illustrating a process of processing a spatial data object query in the spatial data object query processing apparatus of FIG. 1.

도 3을 참조하면, 공간 데이터 객체 질의처리장치(130)는 분할 공간 생성부(210)를 통해 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성할 수 있다(단계 S310). 일 실시예에서, 분할 공간 생성부(210)는 복수의 분할 공간들 각각에 관해 해당 공간 데이터 객체의 밀집도가 특정 기준 이하가 될 때까지 해당 분할 공간을 해당 분할 공간의 중심점을 기준으로 재귀적으로 재분할 할 수 있다.Referring to FIG. 3, the spatial data object query processing apparatus 130 may generate a plurality of partition spaces by dividing a data space including at least one spatial data object through the partition space generation unit 210 (step). S310). In one embodiment, the partition space generation unit 210 recursively divides the partition space with respect to each of the plurality of partition spaces based on the center point of the partition space until the density of the corresponding spatial data object is less than or equal to a specific criterion. Can be subdivided.

공간 데이터 객체 질의처리장치(130)는 인덱스 트리 생성부(230)를 통해 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형 정보를 기초로 인덱스 트리를 생성할 수 있다(단계 S330). 일 실시예에서, 인덱스 트리 생성부(230)는 분할 공간에 관한 정보를 기초로 생성된 키(Key) 값 및 최소 경계 사각형 정보를 기초로 생성된 밸류(Value) 값을 포함하는 행 데이터로 구성된 테이블을 기초로 인덱스 트리를 생성할 수 있다.The spatial data object query processing apparatus 130 may generate the index tree based on the minimum bounding rectangle information including all the information about the partition space and the spatial data objects included in the partition space through the index tree generator 230. It may be (step S330). In one embodiment, the index tree generator 230 is composed of row data including a key value generated based on information on partition space and a value value generated based on minimum bounding rectangle information. You can create an index tree based on a table.

일 실시예에서, 인덱스 트리 생성부(230)는 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 키 값을 생성할 수 있다. 일 실시예에서, 인덱스 트리 생성부(230)는 분할 공간에 대한 재귀적인 재분할이 발생하는 경우 이전 분할 정보 및 현재 발생한 재분할 공간에 대한 정보를 연결하는 방식으로 표시할 수 있다. 일 실시예에서, 인덱스 트리 생성부(230)는 내부 노드에 관한 행 데이터를 저장하는 인덱스 테이블 및 리프 노드에 관한 행 데이터를 저장하는 데이터 테이블을 생성함으로써 인덱스 트리를 생성할 수 있다.In one embodiment, each time the partition space is generated, the index tree generator 230 displays the partition space in the direction close to the origin as 0 and the partition space in the far direction as 1 for each axis, and the bit for each axis. You can create a key value by concatenating (bit). According to an embodiment, the index tree generator 230 may display the previous partition information and the information on the currently generated repartitioned space in a manner of concatenating repartitioned partitions. In an embodiment, the index tree generator 230 may generate an index tree by generating an index table that stores row data about an internal node and a data table that stores row data about a leaf node.

공간 데이터 객체 질의처리장치(130)는 질의 처리부(250)를 통해 인덱스 트리 생성부(230)에 의해 생성된 인덱스 트리를 이용하여 공간 데이터 객체 질의를 처리할 수 있다(단계 S350). 일 실시예에서, 질의 처리부(250)는 인덱스 트리를 이용하여 질의 포인트와 질의 반경을 포함하는 범위 질의 또는 질의 포인트와 최근접 이웃 수를 포함하는 kNN 질의를 처리할 수 있다.The spatial data object query processing apparatus 130 may process the spatial data object query by using the index tree generated by the index tree generator 230 through the query processor 250 (step S350). In one embodiment, the query processing unit 250 may process a range query including the query point and the query radius or a kNN query including the query point and the nearest neighbor number using the index tree.

도 6은 공간 데이터 객체 질의처리장치에서 수행되는 공간 분할 과정을 설명하는 예시도이다.6 is an exemplary diagram illustrating a spatial partitioning process performed by a spatial data object query processing apparatus.

도 6을 참조하면, 공간 데이터 객체 질의처리장치(130)는 분할 공간 생성부(210)를 통해 원점(611)을 기준으로 수직으로 교차하고 각각 80의 최대 크기를 갖는 두개의 축에 의해 형성되는 데이터 공간(610)을 정의할 수 있다. 분할 공간 생성부(210)는 데이터 공간(610)을 공간의 중심점 (40,40)을 기준으로 사분할하여 복수의 분할 공간들을 생성할 수 있다. 분할 공간 생성부(210)는 해당 공간 데이터 객체의 밀집도가 특정 기준 이하가 될 때까지 해당 분할 공간을 재귀적으로 재분할 할 수 있다. 도 6에서, 밀집도는 4에 해당할 수 있다. 즉, 분할 공간 생성부(210)는 단일 분할 공간 내부에 존재하는 공간 데이터 객체의 수가 4이하가 될 때까지 재귀적으로 공간을 재분할 할 수 있다.Referring to FIG. 6, the spatial data object query processing apparatus 130 is formed by two axes having a maximum size of 80 and vertically intersecting with respect to the origin 611 through the partition space generating unit 210. Data space 610 may be defined. The partition space generation unit 210 may generate a plurality of partition spaces by dividing the data space 610 based on the center points 40 and 40 of the space. The partition generation unit 210 may repartition the partitions recursively until the density of the corresponding spatial data object is less than or equal to a specific criterion. In FIG. 6, the density may correspond to four. That is, the partition generation unit 210 may repartition the space recursively until the number of spatial data objects existing in the single partition is less than or equal to four.

공간 데이터 객체 질의처리장치(130)는 데이터 공간(610)을 분할한 후 각 사분면에 존재하는 공간 데이터 객체에 대한 최소 경계 사각형(MBR)(613)을 생성할 수 있다. 공간 데이터 객체 질의처리장치(130)는 분할 공간(631) 및 MBR(633)에 관한 정보를 기초로 Q-MBR(Quadrand-based MBR)(630)을 생성할 수 있고, HBase 데이터베이스에 저장할 수 있다. 공간 데이터 객체 질의처리장치(130)는 Q-MBR(630)을 HBase 테이블에 저장하여 계층적 인덱스 트리의 빌딩 블록으로 사용할 수 있다. The spatial data object query processing apparatus 130 may generate a minimum boundary rectangle (MBR) 613 for the spatial data object existing in each quadrant after dividing the data space 610. The spatial data object query processing apparatus 130 may generate a Q-MBR (Quadrand-based MBR) 630 based on the information about the partition space 631 and the MBR 633, and may store the information in the HBase database. . The spatial data object query processing apparatus 130 may store the Q-MBR 630 in an HBase table and use it as a building block of a hierarchical index tree.

분할 공간(631)에 관한 정보는 업데이트 비용을 줄이기 위해 행 키로 사용될 수 있다. 각 열 값은 별도의 키(key)-밸류(value) 쌍 형식으로 저장될 수 있고, 행 키를 업데이트하면 해당 키-밸류 쌍에 많은 수의 삽입이 발생할 수 있다. 따라서, 자주 업데이트되는 MBR(633) 정보는 행 키로 사용할 수 없다. 최악의 경우는 업데이트가 발생할 때 그룹화된 공간 데이터 객체에 대해 새로운 행 키를 만들고 모든 키-밸류 쌍을 다시 생성하는 경우에 해당할 수 있다. 따라서, MBR(633) 정보는 상대적으로 업데이트하기 어려운 열에 저장될 수 있고, 공간 질의 처리 중에 거리 계산에 사용될 수 있다.Information about the partition space 631 can be used as a row key to reduce the update cost. Each column value can be stored in a separate key-value pair format, and updating a row key can result in a large number of insertions in that key-value pair. Therefore, frequently updated MBR 633 information cannot be used as a row key. The worst case might be when you create a new row key for the grouped spatial data objects and regenerate all the key-value pairs when the update occurs. Thus, the MBR 633 information can be stored in a row that is relatively difficult to update and can be used for distance calculation during spatial query processing.

도 7은 도 2에 있는 인덱스 트리 생성부에서 생성하는 인덱스 트리 노드의 구조를 설명하는 예시도이다.FIG. 7 is an exemplary diagram illustrating a structure of an index tree node generated by the index tree generator of FIG. 2.

도 7을 참조하면, 공간 데이터 객체 질의처리장치(130)는 인덱스 트리 생성부(230)를 통해 Q-MBR을 생성하고 관리할 수 있는 인덱스 트리를 생성할 수 있다. 여기에서, 인덱스 트리는 Q-MBR 트리에 해당할 수 있고, HBase 테이블 또는 메모리 인덱스로 구현될 수 있다. Q-MBR 트리는 쿼드 트리 구조와 유사할 수 있다. Referring to FIG. 7, the spatial data object query processing apparatus 130 may generate an index tree for generating and managing a Q-MBR through the index tree generator 230. Here, the index tree may correspond to a Q-MBR tree and may be implemented as an HBase table or a memory index. The Q-MBR tree may be similar to a quad tree structure.

일 실시예에서, 인덱스 트리 생성부(230)는 내부 노드(Internal Node)에 관한 행 데이터를 저장하는 인덱스 테이블 및 리프 노드(Leaf Node)에 관한 행 데이터를 저장하는 데이터 테이블을 생성함으로써 인덱스 트리를 생성할 수 있다. 내부 노드는 인덱스 테이블(Index Table)에 저장될 수 있고, 노드의 사분면 정보(Quadrant), 자식 노드의 MBR(MBRs of children) 및 서브 트리에 포함된 공간 데이터 객체의 수(Number of objects)로 구성될 수 있다. 리프 노드는 데이터 테이블(Data Table)에 저장될 수 있고, 사분면(Quadrant), 리프 노드의 공간 데이터 객체의 수(Number of objects) 및 공간 데이터 객체 목록으로 구성될 수 있다.In an embodiment, the index tree generator 230 generates an index tree by generating an index table for storing row data about an internal node and a data table for storing row data about a leaf node. Can be generated. Internal nodes can be stored in an index table and consist of the quadrant information of the node, the MBRs of children (MBRs) of the child nodes, and the number of objects contained in the subtree. Can be. Leaf nodes may be stored in a data table and may comprise a quadrant, a number of objects of a leaf node, and a list of spatial data objects.

도 8은 도 2에 있는 인덱스 트리 생성부에서 생성하는 인덱스 트리 노드에 대한 테이블 구성을 설명하는 예시도이다.8 is an exemplary diagram illustrating a table configuration of an index tree node generated by the index tree generator of FIG. 2.

도 8을 참조하면, 리프 노드 영역 내에 존재하는 공간 데이터 객체에 대한 포인터 대신 사분면 정보를 사용하여 데이터 테이블에 저장된 공간 데이터 객체에 직접 접근할 수 있다. 도 8에 포함된 테이블의 구성은 도 6에 표시된 공간 데이터 객체에 대한 계층적인 Q-MBR 인덱스 구조의 예를 포함하고 있다. 각각의 Q-MBR은 인덱스 트리의 리프 노드에 해당할 수 있고, 부모 노드의 Q-MBR은 자식 노드의 Q-MBR들을 포함하는 사분면과 MBR로 표현될 수 있다. Referring to FIG. 8, quadrant information may be used to directly access the spatial data object stored in the data table instead of the pointer to the spatial data object existing in the leaf node region. The configuration of the table included in FIG. 8 includes an example of a hierarchical Q-MBR index structure for the spatial data object shown in FIG. Each Q-MBR may correspond to a leaf node of the index tree, and the Q-MBR of the parent node may be represented by a quadrant including the Q-MBRs of the child node and the MBR.

인덱스 테이블의 'Meta family' 항목의 '#objects' 값은 해당 노드를 루트 노드로 하는 트리 내에 존재하는 공간 데이터 객체의 수를 나타낸다. 예를 들어, 'Rowkey' 항목 값이 'Root'인 노드에 대해 '#objects' 값이 15이므로 해당 트리 내에 존재하는 공간 데이터 객체의 수는 15개에 해당한다.The '#objects' value of the 'Meta family' item in the index table indicates the number of spatial data objects in the tree whose node is the root node. For example, because the value of '#objects' is 15 for a node with a value of 'Rowkey' item 'Root', the number of spatial data objects in the tree is 15.

도 9는 공간 데이터 객체 질의처리장치에서 수행되는 범위 질의 처리 과정을 설명하는 예시도이다.9 is an exemplary view illustrating a range query processing process performed by a spatial data object query processing apparatus.

도 9를 참조하면, 공간 데이터 객체 질의처리장치(130)은 질의 처리부(250)를 통해 범위 질의를 처리할 수 있다. 질의 처리부(250)는 R0의 행 키를 L에 삽입할 수 있고, 이를 N에 로드함으로써 시작할 수 있다. 질의 처리부(250)는 두 개의 자식 노드인 R2 및 R3이 질의 범위에 중첩되므로 R2 및 R3의 행 키를 첫 번째 반복(iteration)에서 I에 삽입할 수 있고, 인덱스 테이블로부터 함께 로드할 수 있다. 동일하게, R9 및 R6의 행 키가 삽입되어 두 번째 반복(iteration)에서 로드될 수 있다. 질의 처리부(250)는 R9 및 R6가 리프 노드이므로 다음 반복(iteration)에서 범위 질의에 대한 응답을 위해 R9 및 R6의 공간 데이터 객체를 검사할 수 있다. 결과 집합 R은 2개의 공간 데이터 객체 p1과 p2를 포함하고 있고, 탐색할 노드가 없기 때문에 질의 처리부(250)는 탐색을 종료할 수 있다.Referring to FIG. 9, the spatial data object query processing apparatus 130 may process a range query through the query processing unit 250. The query processing unit 250 may insert the row key of R0 into L, and may start by loading it into N. Since the two child nodes R2 and R3 overlap each other in the query range, the query processor 250 may insert the row keys of R2 and R3 into I in the first iteration and load them together from the index table. Equally, the row keys of R9 and R6 can be inserted and loaded in the second iteration. Since R9 and R6 are leaf nodes, the query processing unit 250 may examine the spatial data objects of R9 and R6 for the response to the range query in the next iteration. The result set R includes two spatial data objects p1 and p2, and since there are no nodes to search, the query processor 250 may terminate the search.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although described above with reference to a preferred embodiment of the present invention, those skilled in the art will be variously modified and changed within the scope of the invention without departing from the spirit and scope of the invention described in the claims below I can understand that you can.

100: 분할 공간 기반의 공간 데이터 객체 질의처리 시스템
110: 사용자 단말 130: 공간 데이터 객체 질의처리장치
150: 데이터베이스
210: 분할 공간 생성부 230: 인덱스 트리 생성부
250: 질의 처리부 270: 제어부
410: 범위 질의 430: 긍정 오류
510: 범위 질의 530: 인덱스 레이어
610: 데이터 공간 611: 원점
613: 최소 경계 사각형 630: Q-MBR
631: 분할 공간 633: MBR
100: Spatial Data Object Query Processing System based on Partition
110: user terminal 130: spatial data object query processing apparatus
150: database
210: partition space generation unit 230: index tree generation unit
250: query processing unit 270: control unit
410: range query 430: affirmative error
510: range query 530: index layer
610: data space 611: origin
613: Minimum bounding rectangle 630: Q-MBR
631: partition space 633: MBR

Claims (16)

적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 분할 공간 생성부; 및
상기 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 키(Key) 값을 생성하고, 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 인덱스 트리 생성부를 포함하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
A partition space generation unit configured to generate a plurality of partition spaces by partitioning a data space including at least one spatial data object; And
Whenever the division space is created, the division space in the direction close to the origin is 0 for each axis and the division space in the distant direction is represented by 1, and the key value is connected by connecting bits for each axis. And an index tree generator for generating an index tree based on minimum boundary rectangle (MBR) information including all the information about the plurality of partitions and the spatial data objects included in the partitions. Spatial data object query processing apparatus based on partition space.
제1항에 있어서, 상기 분할 공간 생성부는
상기 복수의 분할 공간들 각각에 관해 해당 공간 데이터 객체의 밀집도가 특정 기준 이하가 될 때까지 해당 분할 공간을 해당 분할 공간의 중심점을 기준으로 재귀적으로 재분할 하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
The method of claim 1, wherein the partition space generating unit
Partition data based on partition space, characterized in that the partition space is recursively divided based on the center point of the partition space until the density of the corresponding spatial data object is less than a specific criterion for each of the plurality of partition spaces. Object Query Processing Unit.
제1항에 있어서, 상기 인덱스 트리 생성부는
상기 분할 공간에 관한 정보를 기초로 생성된 상기 키(Key) 값 및 상기 최소 경계 사각형 정보를 기초로 생성된 밸류(Value) 값을 포함하는 행 데이터로 구성된 테이블을 기초로 상기 인덱스 트리를 생성하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
The method of claim 1, wherein the index tree generation unit
Generating the index tree based on a table composed of row data including the key value generated based on the information about the partition space and a value value generated based on the minimum boundary rectangle information; Spatial data object query processing apparatus based on the partition space.
삭제delete 제1항에 있어서, 상기 인덱스 트리 생성부는
상기 분할 공간에 대한 재귀적인 재분할이 발생하는 경우 이전 분할 정보 및 현재 발생한 재분할 공간에 대한 정보를 연결하는 방식으로 표시하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
The method of claim 1, wherein the index tree generation unit
Partitioning-based spatial data object query processing apparatus characterized in that when the recursive re-partition for the partition space is generated in a manner of connecting the previous partition information and the information on the current re-partitioned space.
제3항에 있어서, 상기 인덱스 트리 생성부는
내부 노드에 관한 상기 행 데이터를 저장하는 인덱스 테이블 및 리프 노드에 관한 상기 행 데이터를 저장하는 데이터 테이블을 생성함으로써 상기 인덱스 트리를 생성하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
The method of claim 3, wherein the index tree generation unit
And said index tree is created by creating an index table for storing said row data for internal nodes and a data table for storing said row data for leaf nodes.
제1항에 있어서,
상기 인덱스 트리를 이용하여 공간 데이터 객체 질의를 처리하는 질의 처리부를 더 포함하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
The method of claim 1,
Spatial data object query processing apparatus based on the partition space further comprises a query processing unit for processing a spatial data object query using the index tree.
제7항에 있어서, 상기 질의 처리부는
상기 인덱스 트리를 이용하여 질의 포인트와 질의 반경을 포함하는 범위 질의 또는 질의 포인트와 최근접 이웃 수를 포함하는 kNN 질의를 처리하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리장치.
The method of claim 7, wherein the query processing unit
A spatial data object query processing apparatus based on partition space, which processes a range query including a query point and a query radius or a kNN query including a query point and a nearest neighbor number using the index tree.
분할 공간 기반의 공간 데이터 객체 질의처리장치에서 수행되는 공간 데이터 객체 질의처리방법에 있어서,
(a) 적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 단계; 및
(b) 상기 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 키(Key) 값을 생성하고, 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 단계를 포함하는 분할 공간 기반의 공간 데이터 객체 질의처리방법.
In the spatial data object query processing method performed in the spatial data object query processing apparatus based on partition space,
(a) dividing a data space including at least one spatial data object to generate a plurality of partition spaces; And
(b) Whenever the division space is created, the division space in the direction close to the origin is 0 for each axis and the division space in the distant direction is 1, and a bit is connected for each axis. Generating an index tree and generating an index tree based on minimum bounding rectangle (MBR) information including all information about the plurality of partitions and spatial data objects included in the partitions. Spatial data object query processing method based on partition.
제9항에 있어서, 상기 (b) 단계는
상기 분할 공간에 관한 정보를 기초로 생성된 상기 키(Key) 값 및 상기 최소 경계 사각형 정보를 기초로 생성된 밸류(Value) 값을 포함하는 행 데이터로 구성된 테이블을 기초로 상기 인덱스 트리를 생성하는 단계인 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리방법.
The method of claim 9, wherein step (b)
Generating the index tree based on a table composed of row data including the key value generated based on the information about the partition space and a value value generated based on the minimum boundary rectangle information; Spatial data object query processing method based on partitioning, characterized in that the step.
삭제delete 제9항에 있어서, 상기 (b) 단계는
상기 분할 공간에 대한 재귀적인 재분할이 발생하는 경우 이전 분할 정보 및 현재 발생한 재분할 공간에 대한 정보를 연결하는 방식으로 표시하는 단계인 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리방법.
The method of claim 9, wherein step (b)
When the recursive repartition for the partition space occurs, displaying the partition information based on the partition information, characterized in that the step of connecting the previous partition information and the information on the current repartitioned space.
제10항에 있어서, 상기 (b) 단계는
내부 노드에 관한 상기 행 데이터를 저장하는 인덱스 테이블 및 리프 노드에 관한 상기 행 데이터를 저장하는 데이터 테이블을 생성함으로써 상기 인덱스 트리를 생성하는 단계인 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리방법.
The method of claim 10, wherein step (b)
Generating the index tree by generating an index table for storing the row data for an internal node and a data table for storing the row data for a leaf node; .
제9항에 있어서,
(c) 상기 인덱스 트리를 이용하여 공간 데이터 객체 질의를 처리하는 단계를 더 포함하는 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리방법.
The method of claim 9,
and (c) processing the spatial data object query using the index tree.
제14항에 있어서, 상기 (c) 단계는
상기 인덱스 트리를 이용하여 질의 포인트와 질의 반경을 포함하는 범위 질의 또는 질의 포인트와 최근접 이웃 수를 포함하는 kNN 질의를 처리하는 단계인 것을 특징으로 하는 분할 공간 기반의 공간 데이터 객체 질의처리방법.
The method of claim 14, wherein step (c)
And processing a range query including a query point and a query radius or a kNN query including a query point and a nearest neighbor number using the index tree.
분할 공간 기반의 공간 데이터 객체 질의처리장치에서 수행되는 공간 데이터 객체 질의처리방법을 실행하는 코드가 저장된 컴퓨터 판독가능 기록매체에 있어서,
적어도 하나의 공간 데이터 객체를 포함하는 데이터 공간을 분할하여 복수의 분할 공간들을 생성하는 과정; 및
상기 분할 공간이 생성될 때마다 각각의 축에 대해 원점에서 가까운 방향의 분할 공간을 0, 먼 방향의 분할 공간을 1로 표시하고 각 축에 대한 비트(bit)를 연결하여 키(Key) 값을 생성하고, 상기 복수의 분할 공간에 관한 정보 및 해당 분할 공간에 포함된 공간 데이터 객체를 모두 포함하는 최소 경계 사각형(Minimum Boundary Rectangle, MBR) 정보를 기초로 인덱스 트리를 생성하는 과정을 포함하는 기록매체.

A computer-readable recording medium having stored thereon code for executing a spatial data object query processing method performed in a partition-based spatial data object query processing apparatus,
Generating a plurality of partition spaces by dividing a data space including at least one spatial data object; And
Whenever the division space is created, the division space in the direction close to the origin is 0 for each axis and the division space in the distant direction is represented by 1, and the key value is connected by connecting bits for each axis. And generating an index tree based on minimum boundary rectangle (MBR) information including all the information about the plurality of partitions and the spatial data objects included in the partitions. .

KR1020170181486A 2017-12-27 2017-12-27 Partitioned space based spatial data object query processing apparatus and method, storage media storing the same KR102005343B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170181486A KR102005343B1 (en) 2017-12-27 2017-12-27 Partitioned space based spatial data object query processing apparatus and method, storage media storing the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170181486A KR102005343B1 (en) 2017-12-27 2017-12-27 Partitioned space based spatial data object query processing apparatus and method, storage media storing the same

Publications (2)

Publication Number Publication Date
KR20190079354A KR20190079354A (en) 2019-07-05
KR102005343B1 true KR102005343B1 (en) 2019-10-01

Family

ID=67225627

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170181486A KR102005343B1 (en) 2017-12-27 2017-12-27 Partitioned space based spatial data object query processing apparatus and method, storage media storing the same

Country Status (1)

Country Link
KR (1) KR102005343B1 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102202500B1 (en) * 2019-11-21 2021-01-13 인하대학교 산학협력단 Space reduction technique for speeding up the computation of spatial keyword cover problem
KR102354343B1 (en) * 2019-12-18 2022-01-21 서강대학교산학협력단 Spatial indexing method and apparatus for blockchain-based geospatial data
KR102293819B1 (en) * 2019-12-26 2021-08-26 한국국토정보공사 Spatial information based digital twin service providing device and method
KR102470139B1 (en) * 2020-04-01 2022-11-23 삼육대학교산학협력단 Device and method of searching objects based on quad tree
CN113312436B (en) * 2020-07-27 2024-04-19 阿里巴巴集团控股有限公司 Spatial index processing method and device
CN113722314B (en) * 2020-12-31 2024-04-16 京东城市(北京)数字科技有限公司 Space connection query method and device, electronic equipment and storage medium
KR20230120347A (en) 2022-02-09 2023-08-17 주식회사 티맥스티베로 Method for indexing data

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101117709B1 (en) * 2009-12-15 2012-02-24 한국과학기술원 A method for multi-dimensional histograms using a minimal skew cover in a space partitioning tree and recording medium storing program for executing the same
KR20160004781A (en) 2014-07-04 2016-01-13 (주)프람트테크놀로지 Ontology Query Processing by Using Big Data Framework

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
조범준 외 1명, HBase 기반의 공간질의처리를 위한 MBR tree 인덱싱 기법, 한국정보과학회 2016년 동계학술대회 논문집 (2016.12.공개)*

Also Published As

Publication number Publication date
KR20190079354A (en) 2019-07-05

Similar Documents

Publication Publication Date Title
KR102005343B1 (en) Partitioned space based spatial data object query processing apparatus and method, storage media storing the same
US8688723B2 (en) Methods and apparatus using range queries for multi-dimensional data in a database
JP4878178B2 (en) Data processing method and apparatus, and processing program therefor
US7512282B2 (en) Methods and apparatus for incremental approximate nearest neighbor searching
CN112765405B (en) Method and system for clustering and inquiring spatial data search results
EP3101556B1 (en) Indexing dynamic hierarchical data
CN105989015B (en) Database capacity expansion method and device and method and device for accessing database
Roumelis et al. The xBR-tree: an efficient access method for points
KR101116663B1 (en) Partitioning Method for High Dimensional Data
KR100994724B1 (en) Method of processing top-K skyline queries having with higher probabilities in uncertain database
Sudhir et al. Replicated layout for in-memory database systems
US11048730B2 (en) Data clustering apparatus and method based on range query using CF tree
Alis et al. Parallel processing of big point clouds using Z-Order-based partitioning
CN109657060B (en) Safety production accident case pushing method and system
Jo et al. Quadrant-based MBR-tree indexing technique for range query over HBase
Hadian et al. COAX: Correlation-Aware Indexing on Multidimensional Data with Soft Functional Dependencies
KR102354343B1 (en) Spatial indexing method and apparatus for blockchain-based geospatial data
KR20220099745A (en) A spatial decomposition-based tree indexing and query processing methods and apparatus for geospatial blockchain data retrieval
KR101679011B1 (en) Method and Apparatus for moving data in DBMS
Huang et al. ACR-Tree: Constructing R-Trees Using Deep Reinforcement Learning
Oliveira et al. CLAP, ACIR and SCOOP: Novel techniques for improving the performance of dynamic Metric Access Methods
Yang et al. Workload-based ordering of multi-dimensional data
Samoladas et al. Tree Data Structures and Efficient Indexing Techniques for Big Data Management: A Comprehensive Study
Arpitha et al. A Navigation Supporting System Using R-Tree
Harikumar et al. Implementation of projected clustering based on SQL queries and UDFs in relational databases

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant