WO2014178544A1 - 컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체 - Google Patents

컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체 Download PDF

Info

Publication number
WO2014178544A1
WO2014178544A1 PCT/KR2014/002966 KR2014002966W WO2014178544A1 WO 2014178544 A1 WO2014178544 A1 WO 2014178544A1 KR 2014002966 W KR2014002966 W KR 2014002966W WO 2014178544 A1 WO2014178544 A1 WO 2014178544A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
sorting
sort
sets
less
Prior art date
Application number
PCT/KR2014/002966
Other languages
English (en)
French (fr)
Inventor
허진석
최안나
Original Assignee
주식회사 실리콘아츠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 실리콘아츠 filed Critical 주식회사 실리콘아츠
Publication of WO2014178544A1 publication Critical patent/WO2014178544A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30032Movement instructions, e.g. MOVE, SHIFT, ROTATE, SHUFFLE
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation

Definitions

  • the present invention relates to a computer executable collation technique, and more particularly, a computer executable data sorting method capable of efficiently sorting data through inflection point extraction in a merge sort process, a data sorting system for performing the same, and storing the same. It relates to a recording medium.
  • collation refers to listing data items in a specified order.
  • the data may be sorted in an ascending order method in which the values are arranged from the smallest to the largest, or in a descending order method in which the values are arranged in the larger to the smaller.
  • Data sorting can be broadly divided into sorting by comparison and sorting by distribution.
  • sorting by comparison includes selection sorting, quick sorting, bubble sorting, insertion sorting, cell sorting, hip sorting and merge sorting
  • sorting by scattering includes radix sorting and radix swap sorting.
  • Korean Patent No. 10-0968374 discloses a data processing method and data data by header information alignment that can perform a movement of a compressed stream generated by processing a defect of a compressed stream in a pre / post processor or matching to a specific setting.
  • a processing apparatus and data processing equipment including the processing apparatus are disclosed. This data processing method can improve the speed of the pre / post processor very quickly by performing the payload movement in bytes even when the header length of the layer N by the pre / post processor is changed.
  • Korean Patent Laid-Open Publication No. 10-2013-0015731 discloses a partition scan method and device, a memory system, and data using a partial index RID sort that reduces the number of disk I / Os that take the most time during the sorting process by performing a single read and write. Disclosed is an alignment method. Since the data sorting method is designed to minimize random access and efficiently process sequential access, the efficiency of the enterprise storage means using flash memory can be greatly increased.
  • Merge sorting is inefficient when sorting data that is partially sorted, and internal memory cannot be used when sorting large data, thereby increasing the load of external memory.
  • An embodiment of the present invention is to provide a computer-implemented data sorting method that can efficiently sort the data by detecting the inflection point in the merge sort process.
  • An embodiment of the present invention is to provide a computer-implemented data sorting method capable of efficiently sorting a large amount of data by performing a primary sorting and a secondary sorting process.
  • One embodiment of the present invention is to provide a computer-executable data sorting method that can reduce the data sorting time by processing the data sorting in parallel through software or hardware.
  • the computer-executable data sorting method comprises the steps of (a) generating a set of Y data sorts comprising N or less data (where N is a natural number) capable of processing X data at once in volatile memory, ( b) for each of the Y data alignment sets, generating M data subsets (where M is a natural number) by detecting an inflection point and merging the M data subsets to perform a first order sorting; and ( c) merging a set of Y data sorts on which the primary sorting has been performed to perform secondary sorting.
  • the step (a) comprises partitioning the X data into (Y-1) data sorting sets and a single data sorting set, wherein each of the (Y-1) data sorting sets The number of data present may correspond to N.
  • the number of data in the single data alignment set may be equal to or less than the N.
  • the step (a) may include generating the Y data alignment set by dividing the X data into the N or less data sequentially in order to fall within a specific error range.
  • the step (a) may include detecting an inflection point for the X data and determining the specific error range according to the number of the detected inflection points and dividing the data into N or less data.
  • the step (b) may be performed by analyzing the N data or less, storing an index value for an inflection point representing a change in the N or less data flows, and based on the stored index value. Dividing up to four pieces of data to generate the M subsets of data.
  • the step (b) may further include generating M data subsets by dividing the N or less data into multiples of two or more when the inflection points for the N or less detected data are continuously generated.
  • the step (b) may include processing the merging of the M data subsets for each of the Y data alignment sets in parallel.
  • Step (b) is a step of checking the data storage format for the Y data sorting set when the primary sort is completed, and direct sorting or indirect sorting according to the checked data storage format.
  • the method may further include determining and storing the determined memory in a specific memory.
  • the step (c) is a step of checking the sorting state for the X data when the secondary sort is performed, and repeating the secondary sort if all sorts for the X data is not completed It may further comprise the step.
  • the method may further include storing in the nonvolatile memory.
  • the computer-implemented collation system may include a collation set generation unit configured to generate Y collation sets including N or less data (where N is a natural number) capable of processing X data at once in volatile memory; For each of the Y data sorting sets, a first sort performing unit detects an inflection point, generates M data subsets (where M is a natural number), and merges the M data subsets to perform first order sorting. And a secondary sorting unit configured to perform the secondary sorting by merging the Y data sorting sets on which the primary sorting has been performed.
  • the data storage format for the X data items is checked and non-volatile is determined by determining direct sorting or indirect sorting according to the checked data storage format.
  • the apparatus may further include a nonvolatile memory storage unit for storing in the memory.
  • a computer executable collation recording medium is a computer executable collation recording medium having recorded thereon a computer program providing a data alignment performed in a computer executable data sorting system, wherein the X data are processed all at once in volatile memory.
  • the computer-implementable data sorting method can efficiently sort data through inflection point extraction in a merge sort process.
  • the computer-implementable data sorting method can efficiently sort a large amount of data by performing a primary sorting process and a secondary sorting process.
  • the computer-executable data sorting method can reduce data sorting time by simultaneously processing data sorting in parallel through software or hardware.
  • 1 is a diagram illustrating a conventional merge alignment process.
  • FIG. 2 is a block diagram illustrating a computer executable data alignment system in accordance with one embodiment of the present invention.
  • FIG. 3 is a flow chart illustrating a computer executable data sorting process performed in the computer executable data sorting system of FIG. 2.
  • FIG. 4 is a diagram illustrating the computer executable data alignment process of FIG.
  • FIG. 5 illustrates alignment of data through inflection point detection in the computer executable data alignment process of FIG. 2.
  • first and second are intended to distinguish one component from another component, and the scope of rights should not be limited by these terms.
  • first component may be named a second component, and similarly, the second component may also be named a first component.
  • first item, second item and / or third item should be understood to include all combinations that can be suggested from one or more related items.
  • first item, second item and / or third item may be given from two or more of the first, second or third items as well as the first, second or third items. Any combination of the possible items.
  • an identification code (e.g., a, b, c, etc.) is used for convenience of description, and the identification code does not describe the order of the steps, and each step clearly indicates a specific order in context. Unless stated otherwise, they may occur out of the order noted. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.
  • the present invention can be embodied as computer readable code on a computer readable recording medium
  • the computer readable recording medium includes all kinds of recording devices in which data can be read by a computer system.
  • Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like, and are also implemented in the form of a carrier wave (for example, transmission over the Internet). It also includes.
  • the computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
  • 1 is a diagram illustrating a conventional merge alignment process.
  • a merge sort may sequentially sort two subsets and merge them into one set.
  • the merge sort performs an ascending sort from the first data subset to the eighth data subset (69, 10, 30, 2, 16, 8, 31, and 22), in step 1, the first data. Sort the subset and the second data subset to generate one 1-2 data subset, and in step 2, sort the third and fourth data subsets to generate one 3-4 data subset, In step 3, you create one 1-2-3-4 data subset by sorting 1-2 data subsets and 3-4 data subsets, and sort the fifth and sixth data subsets into one 5- 6 Create a data subset, and in step 4, sort the seventh and eighth data subsets to create one 7-8 data subset, and in step 5, the 5-6 data subsets and 7-8 data subsets. 5-6-7-8 data parts by sorting a set Create a set, and sort the 1-2-3-4 data subset and the 5-6-7-8 data subset in step 6 to produce one 1-2-3-4-5-6-7-8 data. Can be generated.
  • FIG. 2 is a block diagram illustrating a computer executable data alignment system in accordance with one embodiment of the present invention.
  • the computer-executable data sorting system 100 may include a data sorting set generating unit 210, a primary sorting performing unit 220, and a secondary sorting performing unit ( 230, the nonvolatile memory storage unit 240 and the control unit 250.
  • the collation set generating unit 210 generates Y collation sets including N data (N is a natural number) or less, which can process X data in a volatile memory at once.
  • the data sorting set generator 210 may divide the X data into (Y-1) data sorting sets and a single data sorting set.
  • the number of data in each of the (Y-1) collation sets may correspond to N, and the number of data in a single collation set may be equal to or less than N.
  • the data sorting set generation unit 210 may divide 115 data into five data sorting sets and one data sorting set. The number of data in each of the five collation sets may correspond to 20, and the number of data in one collation set may correspond to 15.
  • the data sorting set generator 210 may generate the Y data sorting sets by sequentially dividing the X data into N or less data so as to fall within a specific error range.
  • the data alignment set generator 210 may detect an inflection point for the X data, determine a specific error range according to the number of detected inflection points, and divide the data into N or less data. For example, the data alignment set generator 210 may analyze 100 data to detect an inflection point for 100 data. If the number of inflection points for the 100 pieces of data corresponds to 23, the data sorting set generation unit 210 determines a specific error range as [1] and includes 6, 6, 6, and 5 inflection points. You can split 100 pieces of data to create four sets of collations.
  • the data sorting set generation unit 210 determines a specific error range as [3] and sets the number of inflection points to 13, 13, and 13 Five data alignment sets may be generated by dividing 100 data into 10, 10, and 10 pieces.
  • the primary sorting unit 220 detects an inflection point for each of the Y data sorting sets, generates M data subsets (M is a natural number), and merges the M data subsets to perform the primary sorting. do.
  • the primary sorting unit 220 analyzes N or less pieces of data, stores index values for inflection points representing changes in N or less data flows, and stores N or less based on the stored index values.
  • M data subsets can be generated by partitioning the data. For example, in FIG. 5, the first order sorting unit 220 analyzes ten data a of 1, 3, 5, 4, 2, 6, 8, 9, 10, and 7 and 10 data flows. The index value for the inflection point representing the change (b) of (b) is stored (b-1), and ten, three, two, four and one data are divided based on the stored index value (b-1). Subset can be generated (c).
  • the primary sorting unit 220 may sort (d) the data subset in which the change (b) of the 10 data flows corresponds to the downward direction (I2 'and I1' in b-1). In this case, the sorting may correspond to an ascending order.
  • the primary sorting unit 220 may generate M data subsets by dividing the N or less data into multiples of 2 or more when the inflection points for the N or less detected data are continuously generated. Can be.
  • the primary sorting unit 220 analyzes 10 data, and when 10 data flow changes (that is, an inflection point) occur four or more times in a unit of data, 10 data of the data flow is determined. Five data subsets can be generated by dividing by two rather than by dividing according to the change.
  • the primary sort performer 220 may process the merge of M data subsets for each of the Y data sort sets in parallel.
  • the primary sort performer 220 may process the merging of M data subsets for each of the Y data sort sets through the software in parallel. For example, the primary sort performer 220 may simultaneously process the merging of 10 data subsets for each of the four collation sets through software including a plurality of First In First Out (FIFO) structures. have.
  • FIFO First In First Out
  • the primary sorting unit 220 may process the merging of M data subsets for each of the Y data sorting sets in hardware through hardware. For example, the primary sort performer 220 merges five data subsets for each of four sets of collation through hardware including dual-core or quad-core. Can be processed simultaneously.
  • the primary sort performing unit 220 checks the data storage format for the Y collation set when the primary sort is completed, and determines direct sorting or indirect sorting according to the data storage format. Can be stored in memory.
  • the specific memory temporarily stores the Y collation sets when the primary sort is completed, so that when the secondary sort is performed in the secondary sort performer 230, the Y collation set for which the primary sort is completed is quickly stored. You can make it readable.
  • the primary sorting unit 220 stores the data storage format for the Y data sorting set as [Data] and stores the data in the cache memory through direct sorting.
  • the direct sort may perform sorting by outputting only data for Y collation sets.
  • the primary sorting unit 220 checks the data storage format of the Y data sorting set as [Index], and then indirect sorting to cache memory. Can be stored.
  • the indirect sorting may be performed by outputting only indexes for the Y collation set.
  • the secondary sort performing unit 230 merges the Y data sort sets on which the primary sort has been performed to perform the secondary sort.
  • the secondary sorting unit 230 may check the sorting state of the X data when the secondary sorting is performed, and repeat the secondary sorting if all sorts of the X data are not completed.
  • the secondary sorting unit 230 may include 10 collation sets in which a primary sort is completed in a specific memory, where 10 collation sets each include 10 data (corresponding to N). Read and perform a secondary sort on a set of 10 collations.
  • the secondary sorting unit 230 may check the sorting state of the 100 pieces of data on which the secondary sorting is performed and repeat the secondary sorting if all sorts of the 100 pieces of data are not completed.
  • the nonvolatile memory storage unit 240 checks the data storage format for the X pieces of data when the secondary sorting is completed, and determines direct sorting or indirect sorting according to the data storage format.
  • the nonvolatile memory may correspond to a memory other than volatile memory (for example, hard, CD, diskette, usb).
  • the nonvolatile memory storage unit 240 may store the data storage format for the X data as [Data] and store the data in the nonvolatile memory through direct sorting.
  • the direct sort may perform sorting by outputting only data for X data.
  • the nonvolatile memory storage unit 240 may store the data storage format for the X data as [index] and store the data in the nonvolatile memory through indirect sorting.
  • indirect sorting may perform sorting by outputting only indexes for X data.
  • the control unit 250 controls the overall operation of the data sorting system 100, the data sorting set generating unit 210, the primary sorting performing unit 220, the secondary sorting performing unit 230, and the nonvolatile memory storage unit.
  • the control flow or data flow between the 240 may be controlled.
  • FIG. 3 is a flow chart illustrating a computer executable data sorting process performed in the computer executable data sorting system of FIG. 2.
  • the data sorting set generating unit 210 generates Y data sorting sets including N data (N is a natural number) or less capable of processing X data at once in a volatile memory (step S301). .
  • the data sorting set generator 210 may divide the X data into (Y-1) data sorting sets and a single data sorting set.
  • the number of data in each of the (Y-1) collation sets may correspond to N, and the number of data in a single collation set may be equal to or less than N.
  • the data sorting set generation unit 210 includes two data sorting sets including N data (a) and N data and a single data sort including N or N or less data. It can be divided into sets (b).
  • the primary sorting unit 220 detects an inflection point for each of the Y data sorting sets, generates M data subsets (M is a natural number), and merges the M data subsets to perform the primary sorting. (Step S302).
  • the primary sorting unit 220 analyzes N or less pieces of data, stores index values for inflection points representing changes in N or less data flows, and stores N or less based on the stored index values.
  • M data subsets can be generated by partitioning the data. For example, in FIG. 4, the primary sort performer 220 divides the Y1 collation set into three data subsets and the Y2 collation set into four data subsets based on the index values for the inflection points. It is possible to divide (c) the Y3 collation set into three data subsets. The primary sort performer 220 may merge the divided data subsets to perform the primary sort d.
  • the primary sort performing unit 220 checks the data storage format for the Y collation set when the primary sort is completed, and determines direct sorting or indirect sorting according to the data storage format. Can be stored in memory.
  • the secondary sort performing unit 230 merges the Y data sort sets on which the primary sort has been performed to perform the secondary sort (step S303).
  • the secondary sorting unit 230 may check the sorting state of the X data when the secondary sorting is performed, and repeat the secondary sorting if all sorts of the X data are not completed. .
  • the secondary sorting unit 230 may merge (y) Y data sorting sets (d) primaryly sorted by the primary sorting unit 230 and sort them into X data. Can be.
  • the nonvolatile memory storage unit 240 checks the data storage format for the X pieces of data when the secondary sorting is completed, and determines direct sorting or indirect sorting according to the data storage format. In step S304.

Abstract

본 발명은 컴퓨터 실행 가능한 데이터 정렬 기술에 관한 것으로 병합 정렬 과정에서 변곡점 추출을 통해 데이터를 효율적으로 정렬할 수 있는 컴퓨터 실행 가능한 데이터 정렬 방법 및 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체에 관한 것이다.

Description

컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체
본 발명은 컴퓨터 실행 가능한 데이터 정렬 기술에 관한 것으로, 보다 상세하게는, 병합 정렬 과정에서 변곡점 추출을 통해 데이터를 효율적으로 정렬할 수 있는 컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체에 관한 것이다.
일반적으로, 데이터 정렬은 데이터 항목을 지정된 순서대로 나열하는 것을 말한다. 이때, 데이터는 값이 작은 쪽에서 큰 쪽으로 나열하는 오름차순 방식(Ascending Order) 또는 값이 큰 쪽에서 작은 쪽으로 나열하는 내림차순 방식(Descending Order)으로 정렬될 수 있다. 데이터 정렬은 크게 비교에 의한 정렬 및 분산에 의한 정렬로 나눌 수 있다. 여기에서, 비교에 의한 정렬은 선택 정렬, 퀵 정렬, 버블 정렬, 삽입 정렬, 셀 정렬, 히프 정렬 및 병합 정렬을 포함하고, 분산에 의한 정렬은 기수 정렬 및 기수 교환 정렬을 포함한다.
한국등록특허 제10-0968374호는 전/후 처리기에서 압축 스트림의 결함을 처리하거나 특정 설정으로 정합하면서 발생하는 압축 스트림의 이동을 수행할 수 있는 헤더 정보 정렬에 의한 데이터의 처리방법, 데이터 자료의 처리장치, 및 그 처리장치를 포함한 데이터 처리장비를 개시한다. 이러한 데이터 처리 방법은 전/후 처리기에 의한 계층 N의 헤더 길이가 변한 경우에도 페이로드의 이동을 바이트 단위로 수행하여 전/후 처리기의 속도를 매우 빠르게 향상시킬 수 있다.
한국공개특허 10-2013-0015731호는 한번의 읽고 쓰기로 정렬을 수행하여 정렬 과정 중에 시간이 가장 많이 걸리는 디스크 입출력 횟수를 줄이는 부분적인 인덱스 RID 정렬을 통한 파티션 스캔 방법 및 장치, 메모리 시스템, 및 데이터 정렬 방법을 개시한다. 이러한 데이터 정렬 방법은 임의적인 접근을 최소화하고 순차적인 접근을 효과적으로 처리할 수 있게 설계되었기 때문에 플래시 메모리를 이용한 엔터프라이즈 스토리지 수단에 있어서 효율이 크게 증대될 수 있다.
병합 정렬은 부분적으로 정렬되어 있는 데이터를 정렬할 때 비효율적이고 대용량 데이터의 정렬 시 내부 메모리의 사용이 불가능하여 외부 메모리의 부하가 증가하는 문제점이 있다.
본 발명의 일 실시예는 병합 정렬 과정에서 변곡점 검출을 통해 데이터를 효율적으로 정렬할 수 있는 컴퓨터 실행 가능한 데이터 정렬 방법을 제공하고자 한다.
본 발명의 일 실시예는 1차 정렬 및 2차 정렬 과정을 수행하여 대용량 데이터를 효율적으로 정렬할 수 있는 컴퓨터 실행 가능한 데이터 정렬 방법을 제공하고자 한다.
본 발명의 일 실시예는 소프트웨어 또는 하드웨어를 통해 데이터 정렬을 병렬로 동시에 처리하여 데이터 정렬 시간을 절감할 수 있는 컴퓨터 실행 가능한 데이터 정렬 방법을 제공하고자 한다.
실시예들 중에서, 컴퓨터 실행 가능한 데이터 정렬 방법은 (a) X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(상기 N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성하는 단계, (b) 상기 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(상기 M은 자연수)의 데이터 부분집합을 생성하고, 상기 M개의 데이터 부분집합을 병합하여 1차 정렬을 수행하는 단계 및 (c) 상기 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행하는 단계를 포함한다.
일 실시예에서, 상기 (a) 단계는 상기 X개의 데이터를 (Y-1)개의 데이터 정렬 집합과 단일의 데이터 정렬 집합으로 분할하는 단계를 포함하고, 상기 (Y-1)개의 데이터 정렬 집합 각각에 있는 데이터의 개수가 상기 N에 해당할 수 있다. 상기 (a) 단계는 상기 단일의 데이터 정렬 집합에 있는 데이터의 개수는 상기 N과 같거나 적을 수 있다.
상기 (a) 단계는 특정 오차 범위 이내에 해당하도록 상기 X개의 데이터를 순차적으로 가변의 상기 N개 이하의 데이터로 분할하여 상기 Y개의 데이터 정렬 집합을 생성하는 단계를 포함할 수 있다.
상기 (a) 단계는 상기 X개의 데이터에 대한 변곡점을 검출하는 단계 및 상기 검출된 변곡점의 개수에 따라 상기 특정 오차 범위를 결정하여 상기 N개 이하의 데이터로 분할하는 단계를 포함할 수 있다.
일 실시예에서, 상기 (b) 단계는 상기 N개 이하의 데이터를 분석하여 상기 N개 이하의 데이터 흐름의 변화를 나타내는 변곡점에 대한 인덱스 값을 저장하는 단계 및 상기 저장된 인덱스 값을 기초로 상기 N개 이하의 데이터를 분할하여 상기 M개의 데이터 부분집합을 생성하는 단계를 포함할 수 있다.
상기 (b) 단계는 상기 검출된 N개 이하의 데이터에 대한 변곡점이 연속하여 발생하면 상기 N개 이하의 데이터를 2 이상의 배수로 분할하여 M개의 데이터 부분집합을 생성하는 단계를 더 포함할 수 있다.
상기 (b) 단계는 상기 Y개의 데이터 정렬 집합 각각에 대한 상기 M개의 데이터 부분집합의 병합을 병렬로 처리하는 단계를 포함할 수 있다.
상기 (b) 단계는 상기 1차 정렬이 완료되면 상기 Y개의 데이터 정렬 집합에 대한 데이터 저장 형식을 체크하는 단계 및 상기 체크된 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 특정 메모리에 저장하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 (c) 단계는 상기 2차 정렬이 수행되면 상기 X개의 데이터에 대한 정렬 상태를 확인하는 단계 및 상기 X개의 데이터에 대한 모든 정렬이 완료되지 않았으면 상기 2차 정렬을 반복하는 단계를 더 포함할 수 있다.
일 실시예에서, 상기 2차 정렬이 완료되면 상기 X개의 데이터에 대한 데이터 저장 형식을 체크하는 단계 및 상기 체크된 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 비휘발성 메모리에 저장하는 단계를 더 포함할 수 있다.
실시예들 중에서, 컴퓨터 실행 가능한 데이터 정렬 시스템은 X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(상기 N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성하는 데이터 정렬 집합 생성부, 상기 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(상기 M은 자연수)의 데이터 부분집합을 생성하고, 상기 M개의 데이터 부분집합을 병합하여 1차 정렬을 수행하는 1차 정렬 수행부 및 상기 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행하는 2차 정렬 수행부를 포함한다.
일 실시예에서, 상기 2차 정렬이 완료되면 상기 X개의 데이터에 대한 데이터 저장 형식을 체크하고 상기 체크된 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 비휘발성 메모리에 저장하는 비휘발성 메모리 저장부를 더 포함할 수 있다.
실시예들 중에서, 컴퓨터 실행 가능한 데이터 정렬 기록매체는 컴퓨터 실행 가능한 데이터 정렬 시스템에서 수행되는 데이터 정렬을 제공하는 컴퓨터 프로그램을 기록한 컴퓨터 실행 가능한 데이터 정렬 기록매체에 있어서, X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(상기 N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성하는 기능, 상기 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(상기 M은 자연수)의 데이터 부분집합을 생성하고, 상기 M개의 데이터 부분집합을 병합하여 1차 정렬을 수행하는 기능 및 상기 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행하는 기능을 포함한다.
본 발명의 일 실시예에 따른 컴퓨터 실행 가능한 데이터 정렬 방법은 병합 정렬 과정에서 변곡점 추출을 통해 데이터를 효율적으로 정렬할 수 있다.
본 발명의 일 실시예에 따른 컴퓨터 실행 가능한 데이터 정렬 방법은 1차 정렬 및 2차 정렬 과정을 수행하여 대용량 데이터를 효율적으로 정렬할 수 있다.
본 발명의 일 실시예에 따른 컴퓨터 실행 가능한 데이터 정렬 방법은 소프트웨어 또는 하드웨어를 통해 데이터 정렬을 병렬로 동시에 처리하여 데이터 정렬 시간을 절감할 수 있다.
도 1은 종래의 병합 정렬 과정을 설명하는 도면이다.
도 2는 본 발명의 일 실시예에 따른 컴퓨터 실행 가능한 데이터 정렬 시스템을 설명하는 블록도이다.
도 3은 도 2에 있는 컴퓨터 실행 가능한 데이터 정렬 시스템에서 수행되는 컴퓨터 실행 가능한 데이터 정렬 과정을 설명하는 순서도이다.
도 4는 도 2에 있는 컴퓨터 실행 가능한 데이터 정렬 과정을 예시한 도면이다.
도 5는 도 2에 있는 컴퓨터 실행 가능한 데이터 정렬 과정에서 변곡점 검출을 통한 데이터의 정렬을 예시한 도면이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
“및/또는”의 용어는 하나 이상의 관련 항목으로부터 제시 가능한 모든 조합을 포함하는 것으로 이해되어야 한다. 예를 들어, “제1 항목, 제2 항목 및/또는 제3 항목”의 의미는 제1, 제2 또는 제3 항목뿐만 아니라 제1, 제2 또는 제3 항목들 중 2개 이상으로부터 제시될 수 있는 모든 항목의 조합을 의미한다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한, 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 종래의 병합 정렬 과정을 설명하는 도면이다.
도 1을 참조하면, 병합 정렬은 두 개의 부분집합을 순차적으로 정렬하여 하나의 집합으로 병합할 수 있다.
일 실시예에서, 병합 정렬은 제1 데이터 부분집합부터 제8 데이터 부분집합(69, 10, 30, 2, 16, 8, 31 및 22)까지 오름차순 정렬을 수행할 때, 1단계에서 제1 데이터 부분집합과 제2 데이터 부분집합을 정렬하여 하나의 1-2 데이터 부분집합을 생성하고, 2단계에서 제3 데이터 부분집합과 제4 데이터 부분집합을 정렬하여 하나의 3-4 데이터 부분집합을 생성하고, 3단계에서 1-2 데이터 부분집합과 3-4 데이터 부분집합을 정렬하여 하나의 1-2-3-4 데이터 부분집합을 생성하고 제5 데이터 부분집합과 제6 데이터 부분집합을 정렬하여 하나의 5-6 데이터 부분집합을 생성하고, 4단계에서 제7 데이터 부분집합과 제8 데이터 부분집합을 정렬하여 하나의 7-8 데이터 부분집합을 생성하고, 5단계에서 5-6 데이터 부분집합과 7-8 데이터 부분집합을 정렬하여 하나의 5-6-7-8 데이터 부분집합을 생성하며, 6단계에서 1-2-3-4 데이터 부분집합과 5-6-7-8 데이터 부분집합을 정렬하여 하나의 1-2-3-4-5-6-7-8 데이터를 생성할 수 있다.
종래의 병합 정렬은 시간 복잡도가 0으로 안정적인 장점이 있지만, 부분적으로 정렬된 데이터를 정렬할 때 또는 대용량 데이터를 정렬할 때 효율성이 떨어진다는 단점이 있다. 따라서 본 발명은 병합 정렬 과정에서 변곡점을 추출하여 부분적으로 정렬된 데이터 및 대용량 데이터를 효율적으로 정렬할 수 있다.
도 2는 본 발명의 일 실시예에 따른 컴퓨터 실행 가능한 데이터 정렬 시스템을 설명하는 블록도이다.
도 2를 참조하면, 컴퓨터 실행 가능한 데이터 정렬 시스템(100)(이하, 데이터 정렬 시스템(100))은 데이터 정렬 집합 생성부(210), 1차 정렬 수행부(220), 2차 정렬 수행부(230), 비휘발성 메모리 저장부(240) 및 제어부(250)를 포함한다.
데이터 정렬 집합 생성부(210)는 X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성한다.
일 실시예에서, 데이터 정렬 집합 생성부(210)는 X개의 데이터를 (Y-1)개의 데이터 정렬 집합과 단일의 데이터 정렬 집합으로 분할할 수 있다. 여기에서, (Y-1)개의 데이터 정렬 집합 각각에 있는 데이터의 개수는 N에 해당할 수 있고, 단일의 데이터 정렬 집합에 있는 데이터의 개수는 N과 같거나 적을 수 있다. 예를 들어, 데이터 정렬 집합 생성부(210)는 115개의 데이터를 5개의 데이터 정렬 집합과 1개의 데이터 정렬 집합으로 분할할 수 있다. 5개의 데이터 정렬 집합 각각에 있는 데이터의 개수는 20개에 해당하고, 1개의 데이터 정렬 집합에 있는 데이터의 개수는 15개에 해당할 수 있다.
다른 일 실시예에서, 데이터 정렬 집합 생성부(210)는 특정 오차 범위 이내에 해당하도록 X개의 데이터를 순차적으로 N개 이하의 데이터로 분할하여 Y개의 데이터 정렬 집합을 생성할 수 있다.
데이터 정렬 집합 생성부(210)는 X개의 데이터에 대한 변곡점을 검출하고 검출된 변곡점의 개수에 따라 특정 오차 범위를 결정하여 N개 이하의 데이터로 분할할 수 있다. 예를 들어, 데이터 정렬 집합 생성부(210)는 100개의 데이터를 분석하여 100개의 데이터에 대한 변곡점을 검출할 수 있다. 데이터 정렬 집합 생성부(210)는 100개의 데이터에 대한 변곡점의 개수가 23개에 해당하면 특정 오차 범위를 [1]로 결정하고 변곡점의 개수를 6개, 6개, 6개 및 5개 포함하도록 100개의 데이터를 분할하여 4개의 데이터 정렬 집합을 생성할 수 있다. 다른 예를 들어, 데이터 정렬 집합 생성부(210)는 100개의 데이터에 대한 변곡점의 개수가 59개에 해당하면 특정 오차 범위를 [3]로 결정하고 변곡점의 개수를 13개, 13개, 13개, 10개 및 10개 포함하도록 100개의 데이터를 분할하여 5개의 데이터 정렬 집합을 생성할 수 있다.
1차 정렬 수행부(220)는 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(M은 자연수)의 데이터 부분집합을 생성하고, M개의 데이터 부분집합을 병합하여 1차 정렬을 수행한다.
일 실시예에서, 1차 정렬 수행부(220)는 N개 이하의 데이터를 분석하여 N개 이하의 데이터 흐름의 변화를 나타내는 변곡점에 대한 인덱스 값을 저장하고 저장된 인덱스 값을 기초로 N개 이하의 데이터를 분할하여 M개의 데이터 부분집합을 생성할 수 있다. 예를 들어, 도 5에서, 1차 정렬 수행부(220)는 1, 3, 5, 4, 2, 6, 8, 9, 10, 7의 10개의 데이터(a)를 분석하여 10개의 데이터 흐름의 변화(b)를 나타내는 변곡점에 대한 인덱스 값을 저장(b-1)하고, 저장된 인덱스 값(b-1)을 기초로 10개의 데이터를 분할하여 3개, 2개, 4개 및 1개의 데이터 부분집합을 생성(c)할 수 있다. 여기에서, 1차 정렬 수행부(220)는 10개의 데이터 흐름의 변화(b)가 하향(b-1에서 I2↘ 및 I1↘)에 해당하는 데이터 부분집합을 정렬(d)할 수 있다. 이때, 정렬은 오름차순(Ascending Order)에 해당할 수 있다.
다시 도 2를 참조하면, 1차 정렬 수행부(220)는 검출된 N개 이하의 데이터에 대한 변곡점이 연속하여 발생하면 N개 이하의 데이터를 2 이상의 배수로 분할하여 M개의 데이터 부분집합을 생성할 수 있다. 예를 들어, 1차 정렬 수행부(220)는 10개의 데이터를 분석하여 10개의 데이터 흐름의 변화(즉, 변곡점)가 데이터 1개 단위로 4번 이상 연속하여 발생하면 10개의 데이터를 데이터 흐름의 변화에 따라 분할하지 않고 2개씩 분할하여 5개의 데이터 부분집합을 생성할 수 있다.
1차 정렬 수행부(220)는 Y개의 데이터 정렬 집합 각각에 대한 M개의 데이터 부분집합의 병합을 병렬로 처리할 수 있다.
일 실시예에서, 1차 정렬 수행부(220)는 소프트웨어를 통해 Y개의 데이터 정렬 집합 각각에 대한 M개의 데이터 부분집합의 병합을 병렬로 처리할 수 있다. 예를 들어, 1차 정렬 수행부(220)는 복수의 FIFO(First In First Out) 구조들을 포함하고 있는 소프트웨어를 통해 4개의 데이터 정렬 집합 각각에 대한 10개의 데이터 부분집합의 병합을 동시에 처리할 수 있다.
다른 일 실시예에서, 1차 정렬 수행부(220)는 하드웨어를 통해 Y개의 데이터 정렬 집합 각각에 대한 M개의 데이터 부분집합의 병합을 병렬로 처리할 수 있다. 예를 들어, 1차 정렬 수행부(220)는 듀얼코어(Dual-Core) 또는 쿼드코어(Quad-Core)를 포함하고 있는 하드웨어를 통해 4개의 데이터 정렬 집합 각각에 대한 5개의 데이터 부분집합의 병합을 동시에 처리할 수 있다.
1차 정렬 수행부(220)는 1차 정렬이 완료되면 Y개의 데이터 정렬 집합에 대한 데이터 저장 형식을 체크하고 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 특정 메모리에 저장할 수 있다. 여기에서, 특정 메모리는 1차 정렬이 완료되면 Y개의 데이터 정렬 집합을 임시적으로 저장하고 있어, 2차 정렬 수행부(230)에서 2차 정렬 수행 시 1차 정렬이 완료된 Y개의 데이터 정렬 집합을 빠르게 읽을 수 있도록 할 수 있다.
일 실시예에서, 1차 정렬 수행부(220)는 Y개의 데이터 정렬 집합에 대한 데이터 저장 형식을 [데이터(Data)]로 체크하면 직접 정렬(Direct Sorting)을 통해 캐시 메모리(Cache Memory)에 저장할 수 있다. 여기에서, 직접 정렬은 Y개의 데이터 정렬 집합에 대한 데이터들만 출력하여 정렬을 수행할 수 있다.
다른 일 실시예에서, 1차 정렬 수행부(220)는 Y개의 데이터 정렬 집합에 대한 데이터 저장 형식을 [인덱스(Index)]로 체크하면 간접 정렬(Indirect Sorting)을 통해 캐시 메모리(Cache Memory)에 저장할 수 있다. 여기에서, 간접 정렬은 Y개의 데이터 정렬 집합에 대한 인덱스들만 출력하여 정렬을 수행할 수 있다.
2차 정렬 수행부(230)는 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행한다.
일 실시예에서, 2차 정렬 수행부(230)는 2차 정렬이 수행되면 X개의 데이터에 대한 정렬 상태를 확인하고 X개의 데이터에 대한 모든 정렬이 완료되지 않았으면 2차 정렬을 반복할 수 있다. 예를 들어, 2차 정렬 수행부(230)는 특정 메모리에서 1차 정렬이 완료된 10개의 데이터 정렬 집합(여기에서, 10개의 데이터 정렬 집합은 각각 10개의 데이터(N에 해당함)를 포함함)을 읽어 10개의 데이터 정렬 집합에 대한 2차 정렬을 수행한다. 2차 정렬 수행부(230)는 2차 정렬이 수행된 100개의 데이터에 대한 정렬 상태를 확인하고 100개의 데이터에 대한 모든 정렬이 완료되지 않았으면 2차 정렬을 반복할 수 있다.
비휘발성 메모리 저장부(240)는 2차 정렬이 완료되면 X개의 데이터에 대한 데이터 저장 형식을 체크하고 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 비휘발성 메모리에 저장한다. 여기에서, 비휘발성 메모리는 휘발성 메모리가 아닌 다른 메모리(예를 들어, 하드, CD, 디스켓, usb)에 해당할 수 있다.
일 실시예에서, 비휘발성 메모리 저장부(240)는 X개의 데이터에 대한 데이터 저장 형식을 [데이터(Data)]로 체크하면 직접 정렬(Direct Sorting)을 통해 비휘발성 메모리에 저장할 수 있다. 여기에서, 직접 정렬은 X개의 데이터에 대한 데이터들만 출력하여 정렬을 수행할 수 있다.
다른 일 실시예에서, 비휘발성 메모리 저장부(240)는 X개의 데이터에 대한 데이터 저장 형식을 [인덱스(Index)]로 체크하면 간접 정렬(Indirect Sorting)을 통해 비휘발성 메모리에 저장할 수 있다. 여기에서, 간접 정렬은 X개의 데이터에 대한 인덱스들만 출력하여 정렬을 수행할 수 있다.
제어부(250)는 데이터 정렬 시스템(100)의 전체적인 동작을 제어하고, 데이터 정렬 집합 생성부(210), 1차 정렬 수행부(220), 2차 정렬 수행부(230) 및 비휘발성 메모리 저장부(240) 간의 제어 흐름 또는 데이터 흐름을 제어할 수 있다.
도 3은 도 2에 있는 컴퓨터 실행 가능한 데이터 정렬 시스템에서 수행되는 컴퓨터 실행 가능한 데이터 정렬 과정을 설명하는 순서도이다.
도 3을 참조하면, 데이터 정렬 집합 생성부(210)는 X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성한다(단계 S301).
일 실시예에서, 데이터 정렬 집합 생성부(210)는 X개의 데이터를 (Y-1)개의 데이터 정렬 집합과 단일의 데이터 정렬 집합으로 분할할 수 있다. 여기에서, (Y-1)개의 데이터 정렬 집합 각각에 있는 데이터의 개수는 N에 해당할 수 있고, 단일의 데이터 정렬 집합에 있는 데이터의 개수는 N과 같거나 적을 수 있다. 예를 들어, 도 4에서, 데이터 정렬 집합 생성부(210)는 X개의 데이터(a)를 N개의 데이터를 포함하는 2개의 데이터 정렬 집합과 N개 또는 N개 이하의 데이터를 포함하는 단일의 데이터 정렬 집합으로 분할(b)할 수 있다.
1차 정렬 수행부(220)는 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(M은 자연수)의 데이터 부분집합을 생성하고, M개의 데이터 부분집합을 병합하여 1차 정렬을 수행한다(단계 S302).
일 실시예에서, 1차 정렬 수행부(220)는 N개 이하의 데이터를 분석하여 N개 이하의 데이터 흐름의 변화를 나타내는 변곡점에 대한 인덱스 값을 저장하고 저장된 인덱스 값을 기초로 N개 이하의 데이터를 분할하여 M개의 데이터 부분집합을 생성할 수 있다. 예를 들어, 도 4에서, 1차 정렬 수행부(220)는 변곡점에 대한 인덱스 값을 기초로 Y1 데이터 정렬 집합을 3개의 데이터 부분집합으로 분할하고 Y2 데이터 정렬 집합을 4개의 데이터 부분집합으로 분할하며 Y3 데이터 정렬 집합을 3개의 데이터 부분집합으로 분할(c)할 수 있다. 1차 정렬 수행부(220)는 분할된 각각의 데이터 부분집합을 병합하여 1차 정렬(d)을 수행할 수 있다.
1차 정렬 수행부(220)는 1차 정렬이 완료되면 Y개의 데이터 정렬 집합에 대한 데이터 저장 형식을 체크하고 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 특정 메모리에 저장할 수 있다.
2차 정렬 수행부(230)는 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행한다(단계 S303).
일 실시예에서, 2차 정렬 수행부(230)는 2차 정렬이 수행되면 X개의 데이터에 대한 정렬 상태를 확인하고 X개의 데이터에 대한 모든 정렬이 완료되지 않았으면 2차 정렬을 반복할 수 있다. 예를 들어, 도 4에서, 2차 정렬 수행부(230)는 1차 정렬 수행부(230)에서 1차 정렬된 Y개의 데이터 정렬 집합(d)을 병합하여 X개의 데이터로 정렬(e)할 수 있다.
비휘발성 메모리 저장부(240)는 2차 정렬이 완료되면 X개의 데이터에 대한 데이터 저장 형식을 체크하고 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 비휘발성 메모리에 저장한다(단계 S304).
상기에서는 본 출원의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 출원을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (14)

  1. (a) X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(상기 N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성하는 단계;
    (b) 상기 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(상기 M은 자연수)의 데이터 부분집합을 생성하고, 상기 M개의 데이터 부분집합을 병합하여 1차 정렬을 수행하는 단계; 및
    (c) 상기 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행하는 단계를 포함하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  2. 제1항에 있어서, 상기 (a) 단계는
    상기 X개의 데이터를 (Y-1)개의 데이터 정렬 집합과 단일의 데이터 정렬 집합으로 분할하는 단계를 포함하고,
    상기 (Y-1)개의 데이터 정렬 집합 각각에 있는 데이터의 개수는 상기 N에 해당하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  3. 제2항에 있어서, 상기 (a) 단계는
    상기 단일의 데이터 정렬 집합에 있는 데이터의 개수가 상기 N과 같거나 적은 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  4. 제1항에 있어서, 상기 (a) 단계는
    특정 오차 범위 이내에 해당하도록 상기 X개의 데이터를 순차적으로 가변의 상기 N개 이하의 데이터로 분할하여 상기 Y개의 데이터 정렬 집합을 생성하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  5. 제4항에 있어서, 상기 (a) 단계는
    상기 X개의 데이터에 대한 변곡점을 검출하는 단계; 및
    상기 검출된 변곡점의 개수에 따라 상기 특정 오차 범위를 결정하여 상기 N개 이하의 데이터로 분할하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  6. 제5항에 있어서, 상기 (b) 단계는
    상기 N개 이하의 데이터를 분석하여 상기 N개 이하의 데이터 흐름의 변화를 나타내는 변곡점에 대한 인덱스 값을 저장하는 단계; 및
    상기 저장된 인덱스 값을 기초로 상기 N개 이하의 데이터를 분할하여 상기 M개의 데이터 부분집합을 생성하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  7. 제6항에 있어서, 상기 (b) 단계는
    상기 검출된 N개 이하의 데이터에 대한 변곡점이 연속하여 발생하면 상기 N개 이하의 데이터를 2 이상의 배수로 분할하여 M개의 데이터 부분집합을 생성하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  8. 제1항에 있어서, 상기 (b) 단계는
    상기 Y개의 데이터 정렬 집합 각각에 대한 상기 M개의 데이터 부분집합의 병합을 병렬로 처리하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  9. 제8에 있어서, 상기 (b) 단계는
    상기 1차 정렬이 완료되면 상기 Y개의 데이터 정렬 집합에 대한 데이터 저장 형식을 체크하는 단계; 및
    상기 체크된 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 특정 메모리에 저장하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  10. 제1항에 있어서, 상기 (c) 단계는
    상기 2차 정렬이 수행되면 상기 X개의 데이터에 대한 정렬 상태를 확인하는 단계; 및
    상기 X개의 데이터에 대한 모든 정렬이 완료되지 않았으면 상기 2차 정렬을 반복하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  11. 제10항에 있어서,
    상기 2차 정렬이 완료되면 상기 X개의 데이터에 대한 데이터 저장 형식을 체크하는 단계; 및
    상기 체크된 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 비휘발성 메모리에 저장하는 단계를 더 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 방법.
  12. X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(상기 N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성하는 데이터 정렬 집합 생성부;
    상기 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(상기 M은 자연수)의 데이터 부분집합을 생성하고, 상기 M개의 데이터 부분집합을 병합하여 1차 정렬을 수행하는 1차 정렬 수행부; 및
    상기 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행하는 2차 정렬 수행부를 포함하는 컴퓨터 실행 가능한 데이터 정렬 시스템.
  13. 제12항에 있어서,
    상기 2차 정렬이 완료되면 상기 X개의 데이터에 대한 데이터 저장 형식을 체크하고 상기 체크된 데이터 저장 형식에 따라 직접 정렬(Direct Sorting) 또는 간접 정렬(Indirect Sorting)을 결정하여 비휘발성 메모리에 저장하는 비휘발성 메모리 저장부를 더 포함하는 것을 특징으로 하는 컴퓨터 실행 가능한 데이터 정렬 시스템.
  14. 컴퓨터 실행 가능한 데이터 정렬 시스템에서 수행되는 데이터 정렬을 제공하는 컴퓨터 프로그램을 기록한 컴퓨터 실행 가능한 데이터 정렬 기록매체에 있어서,
    X개의 데이터를 휘발성 메모리에서 한꺼번에 처리 가능한 N개(상기 N은 자연수) 이하의 데이터를 포함하는 Y개의 데이터 정렬 집합을 생성하는 기능;
    상기 Y 개의 데이터 정렬 집합 각각에 대하여, 변곡점을 검출하여 M개(상기 M은 자연수)의 데이터 부분집합을 생성하고, 상기 M개의 데이터 부분집합을 병합하여 1차 정렬을 수행하는 기능; 및
    상기 1차 정렬이 수행된 Y개의 데이터 정렬 집합을 병합하여 2차 정렬을 수행하는 기능을 포함하는 컴퓨터 프로그램을 기록한 컴퓨터 실행 가능한 데이터 정렬 기록매체.
PCT/KR2014/002966 2013-04-29 2014-04-07 컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체 WO2014178544A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2013-0047652 2013-04-29
KR20130047652A KR101482229B1 (ko) 2013-04-29 2013-04-29 컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체

Publications (1)

Publication Number Publication Date
WO2014178544A1 true WO2014178544A1 (ko) 2014-11-06

Family

ID=51843628

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/002966 WO2014178544A1 (ko) 2013-04-29 2014-04-07 컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체

Country Status (2)

Country Link
KR (1) KR101482229B1 (ko)
WO (1) WO2014178544A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224624A (zh) * 2015-09-22 2016-01-06 广州神马移动信息科技有限公司 一种实现倒排链快速归并的方法和装置
US10649771B2 (en) 2017-03-31 2020-05-12 Samsung Electronics Co., Ltd. Semiconductor device
KR102235803B1 (ko) 2017-03-31 2021-04-06 삼성전자주식회사 반도체 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221254A (ja) * 1995-02-16 1996-08-30 Fujitsu Ltd マージソート方法及びマージソート装置
JP2001331353A (ja) * 2000-05-22 2001-11-30 Teijin Ltd データベースへのデータ入力システム及びそのプログラムを記憶した記録媒体
JP2007133576A (ja) * 2005-11-09 2007-05-31 Hitachi Information & Communication Engineering Ltd ソート処理方法及びプログラム
KR20110101647A (ko) * 2010-03-09 2011-09-16 삼성전자주식회사 고속 정렬 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221254A (ja) * 1995-02-16 1996-08-30 Fujitsu Ltd マージソート方法及びマージソート装置
JP2001331353A (ja) * 2000-05-22 2001-11-30 Teijin Ltd データベースへのデータ入力システム及びそのプログラムを記憶した記録媒体
JP2007133576A (ja) * 2005-11-09 2007-05-31 Hitachi Information & Communication Engineering Ltd ソート処理方法及びプログラム
KR20110101647A (ko) * 2010-03-09 2011-09-16 삼성전자주식회사 고속 정렬 장치 및 방법

Also Published As

Publication number Publication date
KR101482229B1 (ko) 2015-01-14
KR20140128770A (ko) 2014-11-06

Similar Documents

Publication Publication Date Title
CN104142822B (zh) 使用信息检索进行源代码流分析
WO2013151221A1 (ko) 대용량 데이터의 클러스터 결과 분석 시스템 및 방법
WO2014175637A1 (ko) 프로세서 검증을 위한 테스트 케이스 생성 장치 및 방법과, 검증장치
WO2014178544A1 (ko) 컴퓨터 실행 가능한 데이터 정렬 방법, 이를 수행하는 데이터 정렬 시스템 및 이를 저장하는 기록매체
Chaudhry et al. Fault-tolerant metric and partition dimension of graphs
WO2020138607A1 (ko) 챗봇을 이용한 질의 응답 방법 및 장치
WO2018016671A2 (ko) 보안 취약점 점검을 위한 위험성 코드 검출 시스템 및 그 방법
CN107330009A (zh) 主题词分类模型创建方法、创建装置及存储介质
CN109657197B (zh) 一种叠前深度偏移计算方法及系统
WO2015163720A1 (ko) 3차원 영상 생성 방법, 이를 수행하는 3차원 영상 생성 장치 및 이를 저장하는 기록매체
CN107526970A (zh) 基于动态二进制平台检测运行时程序漏洞的方法
Hoefler et al. Runtime detection and optimization of collective communication patterns
WO2021091124A1 (ko) 복수의 파일들 각각에 대한 피쳐들의 분포 정보를 기초로 기준 파일에 대한 유사 파일의 탐색이 가능한 전자 장치 및 동작 방법
Sulzmann et al. Derivatives for regular shuffle expressions
CN1129070C (zh) 程序设计中内存操作错误的识别方法
WO2021080043A1 (ko) 시퀀싱 플랫폼 특이적인 오류를 줄인 체성 돌연변이 검출 장치 및 방법
CN102819524B (zh) 基于关键字的字符序列分割方法及装置
WO2012030027A1 (ko) 멀티 코어 프로세서를 기반으로 하는 문자열 매칭 장치 및 그것의 문자열 매칭 방법
CN110245492A (zh) 基于张量分解的安卓app重打包检测方法
WO2022107925A1 (ko) 딥러닝 객체 검출 처리 장치
WO2016137035A1 (ko) 테스트 케이스 생성 장치와 방법 및 이를 실행하기 위한 프로그램을 기록한 컴퓨터로 판독가능한 기록매체
CN113835712B (zh) 一种按照给定字段值进行判断的快速数据包分组路由方法
Wen et al. Code similarity detection using ast and textual information
WO2022145524A1 (ko) 이종 데이터 정형화 방법 및 장치
WO2021054512A1 (ko) 지식 베이스 보강을 위한 시스템 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14791738

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14791738

Country of ref document: EP

Kind code of ref document: A1