KR20100062854A - Method for stream pattern mining using bitwise map - Google Patents

Method for stream pattern mining using bitwise map Download PDF

Info

Publication number
KR20100062854A
KR20100062854A KR1020090030988A KR20090030988A KR20100062854A KR 20100062854 A KR20100062854 A KR 20100062854A KR 1020090030988 A KR1020090030988 A KR 1020090030988A KR 20090030988 A KR20090030988 A KR 20090030988A KR 20100062854 A KR20100062854 A KR 20100062854A
Authority
KR
South Korea
Prior art keywords
bitmap
transaction
sliding window
item
frequent pattern
Prior art date
Application number
KR1020090030988A
Other languages
Korean (ko)
Other versions
KR101128504B1 (en
Inventor
룡 김
허홍석
박종흥
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20100062854A publication Critical patent/KR20100062854A/en
Application granted granted Critical
Publication of KR101128504B1 publication Critical patent/KR101128504B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • G06F5/01Methods or arrangements for data conversion without changing the order or content of the data handled for shifting, e.g. justifying, scaling, normalising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30029Logical and Boolean instructions, e.g. XOR, NOT
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30032Movement instructions, e.g. MOVE, SHIFT, ROTATE, SHUFFLE

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PURPOSE: A method for mining a stream pattern using a bitmap is provided to use a bitmap based on a sliding window, thereby efficiently compressing stream data which are continuously inputted. CONSTITUTION: Frequent pattern candidate groups about an item group are combined(S706). The item group includes more items than a previous time group. A bitmap of the combined frequent pattern candidate groups is calculated(S708). A bitmap support rate about the calculated bitmap is calculated.

Description

비트맵을 이용한 스트림 빈발 패턴 마이닝 방법{Method for Stream Pattern Mining using Bitwise Map}Method for Stream Pattern Mining using Bitwise Map}

본 발명은 비트맵을 이용한 스트림 빈발 패턴 마이닝 방법에 관한 것이다. 특히 본 발명은 비트맵을 이용하여 연속적으로 입력되는 스트림 데이터를 표현하고, 비트맵에 기반한 스트림 빈발 패턴 마이닝을 이용하여 빈발 패턴을 확인하는 방법에 관한 것이다.The present invention relates to a stream frequent pattern mining method using a bitmap. In particular, the present invention relates to a method of expressing stream data continuously input using a bitmap, and identifying frequent patterns using stream frequent pattern mining based on bitmaps.

본 발명은 지식경제부 및 정보통신연구진흥원의 우정기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2006-X-001-03, 과제명: 실시간 우편물류 요소기술 개발].The present invention is derived from the research conducted as part of the postal technology development project of the Ministry of Knowledge Economy and the Ministry of Information and Communication Research and Development. [Task management number: 2006-X-001-03, Task name: Real-time postal logistics element technology development].

컴퓨터 기술이 신속하게 발전하고 있다. 컴퓨터 입력 기술이 발전함에 따라, 짧은 시간 내에 많은 데이터를 연속 입력하는 것이 가능해졌으며, 컴퓨터 처리 기술의 발전에 따라 방대한 양의 스트림 데이터가 입력되고 있다.Computer technology is developing rapidly. With the development of computer input technology, it is possible to continuously input a large amount of data in a short time, and with the development of computer processing technology, a large amount of stream data is input.

이와 같은 방대한 양의 스트림 데이터를 처리하는 기법 중 하나의 방법으로 빈발 패턴 마이닝 방법이 이용된다. 스트림 빈발 패턴 마이닝 기법을 이용하여 입력되는 스트림 데이터에 처리함에 있어서, 다음과 같은 조건을 만족하여야 한다. The frequent pattern mining method is used as one of the techniques for processing such a large amount of stream data. In processing the input stream data using the stream frequent pattern mining technique, the following conditions must be satisfied.

먼저, 연속적으로 입력되는 방대한 양의 스트림 데이터를 한 번만 스캔해야하며, 새로운 데이터가 입력되기 전에 입력된 데이터를 신속하게 처리하여야 하며, 처리된 결과를 사용자에게 신속하게 통보하여야 한다. 또한, 입력된 데이터를 처리함에 있어서 제한된 메모리 용량 이내에서 처리하여야 한다.First, a large amount of continuous stream data that is continuously input should be scanned only once, the input data must be processed quickly before new data is input, and the user must be notified of the processed result promptly. In addition, the input data must be processed within a limited memory capacity.

스트림 빈발 패턴 마이닝을 수행하는 방법에 있어서, 다양한 기법이 존재한다. 기존에는 스트림 데이터 표현 압축 기법을 수행함에 있어서, 많은 양의 메모리를 소비하게 되며, 이에 따라 스트림 빈발 패턴 마이닝 기법도 많은 양의 메모리를 소비하는 문제점을 갖는다.In a method of performing stream frequent pattern mining, various techniques exist. Conventionally, in performing the stream data representation compression technique, a large amount of memory is consumed. Accordingly, the stream frequent pattern mining technique also has a problem of consuming a large amount of memory.

본 발명이 이루고자 하는 기술적 과제는 스트림 데이터에 대한 데이터 손실 없이 소량의 메모리로 표현되는 비트맵 압축 기법과, 비트맵 압축 기법에 기반하여 신속한 계산 능력과 메모리 효율성이 향상된 스트림 빈발 패턴 마이닝 기법을 제공하는 것이다.SUMMARY OF THE INVENTION The present invention provides a bitmap compression technique represented by a small amount of memory without data loss for stream data, and a stream frequent pattern mining technique with improved fast computation and memory efficiency based on the bitmap compression technique. will be.

이를 위하여 본 발명의 실시예에 따른 빈발 패턴 확인 방법은 연속적으로 입력되는 스트림 데이터의 트랜잭션에 대한 빈발 패턴을 확인하는 방법으로서, (a) 입력되는 트랜잭션에 포함되어 있는 아이템 집합의 비트맵 지지도를 확인하는 단계; (b) 비트맵 지지도가 사전에 설정된 지지도 이상이면 빈발 패턴으로 판정하고, 이전의 아이템 집합보다 특정 수의 아이템을 더 포함하는 아이템 집합에 대한 빈발 패턴 후보 집합을 조합하는 단계; (c) 조합된 하나 이상의 빈발 패턴 후보 집합의 비트맵을 계산하고, 계산된 비트맵에 대한 비트맵 지지도를 산출하는 단계; 및 (d) 빈발 패턴 후보 집합이 존재하지 않을 때까지, (b) 단계 이후의 과정을 반복하여 수행하는 단계를 포함한다.To this end, the frequent pattern checking method according to an embodiment of the present invention is a method of checking a frequent pattern for a transaction of continuously input stream data, and (a) confirming a bitmap support of a set of items included in the input transaction. Doing; (b) determining a frequent pattern if the bitmap support is greater than or equal to a preset support, and combining a frequent pattern candidate set for an item set further including a specific number of items than the previous item set; (c) calculating a bitmap of the combined set of one or more frequent pattern candidates and calculating bitmap support for the calculated bitmap; And (d) repeating the process after step (b) until there is no frequent pattern candidate set.

또한, 본 발명의 실시예에 따른 비트맵 압축 방법은 연속적으로 입력되는 스트림 데이터의 트랜잭션에 대한 비트맵 압축 방법으로서, (a) 입력되는 트랜잭션을 슬라이딩 윈도우의 시간 구간에 삽입하는 단계; (b) 트랜잭션에 포함된 아이템이 슬라이딩 윈도우에 존재하는지 여부를 확인하여, 존재가 확인되면 아이템의 비트맵을 사전에 설정된 비트만큼 이동시킨 후 사전에 설정된 비트값을 추가하고, 트랜잭션에 포함된 아이템이 슬라이딩 윈도우에 존재하지 않으면 새로운 비트맵을 할당하여 슬라이딩 윈도우에 추가하는 단계; 및 (c) 슬라이딩 윈도우에서 비트맵 지지도가 0인 아이템을 삭제하는 단계를 포함한다.In addition, a bitmap compression method according to an embodiment of the present invention is a bitmap compression method for a transaction of stream data that is continuously input, the method comprising the steps of: (a) inserting the input transaction in the time interval of the sliding window; (b) Checking whether the item included in the transaction exists in the sliding window, and if the existence is confirmed, move the bitmap of the item by a predetermined bit, add a preset bit value, and then include the item included in the transaction. If not present in the sliding window, assigning a new bitmap and adding the new bitmap to the sliding window; And (c) deleting the item having the bitmap support of 0 in the sliding window.

본 발명에 따르면, 슬라이딩 윈도우를 기반으로 하는 비트맵을 이용하여, 연속적으로 입력되는 스트림 데이터를 효율적으로 압축할 수 있으며, 스트림 빈발 패턴 마이닝 기법에서 압축된 스트림 데이터를 이용함으로써, 기존의 스트림 빈발 패턴 마이닝 기법보다 메모리 사용량을 효율적으로 줄이고, 스트림 빈발 패턴 탐사에 대한 처리 시간을 단축시키는 효과를 기대할 수 있다.According to the present invention, it is possible to efficiently compress stream data continuously input by using a bitmap based on a sliding window, and by using stream data compressed in a stream frequent pattern mining technique, an existing stream frequent pattern It can be expected to reduce the memory usage more efficiently than the mining technique and to reduce the processing time for stream frequent pattern detection.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명 이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention. As those skilled in the art would realize, the described embodiments may be modified in various different ways, all without departing from the spirit or scope of the present invention. In the drawings, parts irrelevant to the description are omitted in order to clearly describe the present invention, and like reference numerals designate like parts throughout the specification.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Throughout the specification, when a part is said to "include" a certain component, it means that it can further include other components, without excluding other components unless specifically stated otherwise. In addition, the terms “… unit”, “… unit”, “module”, etc. described in the specification mean a unit that processes at least one function or operation, which may be implemented by hardware or software or a combination of hardware and software. have.

본 발명은 연속적으로 입력되는 스트림 데이터를 손실 없이 효율적으로 압축하고, 메모리 사용량을 줄이며 신속하게 처리하는 비트맵을 이용한 스트림 빈발 패턴 마이닝 기법에 관한 것이다.The present invention relates to a stream frequent pattern mining technique using bitmaps that efficiently compresses continuously input stream data without loss, reduces memory usage, and processes the data rapidly.

도 1은 본 발명의 실시예에 따른 슬라이딩 윈도우(TimeSW: Time-sensitive Sliding Window)를 나타낸 도면이다.1 is a diagram illustrating a time-sensitive sliding window (TimeSW) according to an embodiment of the present invention.

본 발명에서 입력되는 스트림 데이터의 아이템을 'i'라고 하면, 아이템들의 집합(ψ)은 'ψ = {i1, i2, …, im}'으로 표현된다. 이하에 있어서, 아이템들의 집합(ψ)을 아이템 셋이라고 칭하여 설명하기로 하며, 아이템 셋은 공집합이 아니다. 또한, k 개의 아이템으로 구성된 아이템 셋을 k-아이템 셋이라고 칭하여 설명하기로 한다.When an item of stream data input in the present invention is called 'i', the set of items ψ is' ψ = {i 1 , i 2 ,... , i m } '. In the following, a set of items ψ will be described as an item set, and the item set is not an empty set. In addition, an item set consisting of k items will be described as a k-item set.

트랜잭션 스트림 데이터는 연속적으로 입력되는 트랜잭션으로서, 'TSD = T1, T2, …, Tt'으로 표현된다. 이와 같은 트랜잭션 스트림 데이터에서, 가장 마지막에 입력되는 트랜잭션은 'Tt'이다.Transaction is a transaction data stream is continuously input, 'TSD = T 1, T 2, ... , T t '. In such transaction stream data, the last transaction entered is 'T t '.

그리고, 트랜잭션(T)은 시간 구간(Time Unit)의 아이디(TUid), 트랜잭션 아이디(Tid) 및 아이템 셋으로 구성되며, ' T=(TUid, Tid, itemset)'으로 표현된다.In addition, the transaction (T) is composed of an ID (TUid), a transaction ID (Tid) and an item set of a time interval, and is expressed as 'T = (TUid, Tid, itemset)'.

트랜잭션 스트림 데이터의 시간에 민감하게 적용되는 슬라이딩 윈도우(TimeSW)는 시간 구간(TU)을 선택하기 위한 윈도우이다. 그리고, 각각의 시간 구간(TUi)은 |TUi| 개의 트랜잭션으로 구성되어 있다. 여기서, |TUi|는 시간 구간(TUi)의 크기이다The sliding window TimeSW, which is sensitive to the time of transaction stream data, is a window for selecting a time interval TU. And, each time interval (TU i ) is | TU i | It consists of two transactions. Here, | TU i | is the size of the time interval TU i .

그리고, ω개의 시간 구간 크기를 갖는 슬라이딩 윈도우(TimeSWN-ω+1)는 '[TUN-ω+1, TUN-ω+2, …, TUN]'로 표현된다. 여기서, 'N-ω+1'은 현재 시점 슬라이딩 윈도우 시간 구간의 아이디이고, 'N'는 마지막 시점 슬라이딩 윈도우 시간 구간 (TUN)의 TUid이다.In addition, the sliding window TimeSW N−ω + 1 having a size of ω time intervals is defined as “[TU N−ω + 1 , TU N−ω + 2 ,... , TU N ] '. Here, 'N−ω + 1' is an ID of the current view sliding window time interval and 'N' is a TUid of the last view sliding window time interval (TU N ).

각 슬라이딩 윈도우는 ω개의 시간 구간으로 구성되며 그 크기 값은 '|ω| = |TUN-ω+1| + |TUN-ω+2| + … + |TUN|'로 표현된다. 그리고, 전체 슬라이딩 윈도우의 크기는 '|TimeSW|'로 표현된다.Each sliding window consists of ω time intervals whose magnitude value is' | ω | = | TU N-ω + 1 | + | TU N-ω + 2 | +… + | TU N | ' The size of the entire sliding window is represented by '| TimeSW |'.

새로운 스트림 데이터가 입력되면, 슬라이딩 윈도우(TimeSW)는 이동하게 된다. 슬라이딩 윈도우의 이동에 따라, 이전의 시간 구간 트랜잭션은 삭제되고, 새로운 시간 구간 트랜잭션들이 추가된다. When the new stream data is input, the sliding window TimeSW moves. As the sliding window moves, the old time period transactions are deleted and new time period transactions are added.

이전의 시간 구간 트랜잭션의 효율적인 삭제를 위하여, 시간 구간 내의 트랜잭션 크기 배열(TSA)을 사용하는 것이 바람직하다. 본 발명의 실시예에 따른 트랜잭션 크기 배열은 도 2와 같다.For efficient deletion of previous time interval transactions, it is desirable to use a transaction size arrangement (TSA) within the time interval. Transaction size arrangement according to an embodiment of the present invention is shown in FIG.

슬라이딩 윈도우(TimeSW) 내의 아이템을 'X'라고 하면, 아이템 X의 지지도는 'sup(X)TimeSW'로 표현된다. 아이템 X에 대한 지지도가 사전에 설정된 최소 지지도보다 크면 빈발 패턴으로 정의된다. 이와 같은 빈발 패턴의 결정 조건은 'sup(X)TimeSW≥s*|TimeSW|'로 표현되며, 여기서, s는 사전에 설정된 최소 지지도이다.When an item in the sliding window TimeSW is called 'X', the support of the item X is expressed as 'sup (X) TimeSW '. If the support for item X is greater than the predetermined minimum support, it is defined as a frequent pattern. The determination condition of the frequent pattern is expressed as 'sup (X) TimeSW ≥ s * | TimeSW |', where s is a predetermined minimum support degree.

그리고, ω개의 시간 구간 크기를 갖는 슬라이딩 윈도우(TimeSWN-ω+1) 내의 각 아이템 X에 대하여, |TimeSWN-ω+1| 크기의 비트 시퀀스는 Bit(X)TimeSWN-ω+1로 표현된다. Then, for each item X in the sliding window TimeSW N−ω + 1 having ω time interval sizes, | TimeSW N−ω + 1 | A bit sequence of size is represented by Bit (X) TimeSWN−ω + 1 .

새로운 시간 구간 TUN 내의 트랜잭션들이 입력되면, 비트맵으로 압축하는 비트맵 압축 과정을 수행해야한다.When transactions within a new time interval TU N are input, a bitmap compression process that compresses the bitmap must be performed.

도 3은 본 발명의 실시예에 따른 비트맵 압축 방법을 설명하기 위한 순서도이다.3 is a flowchart illustrating a bitmap compression method according to an embodiment of the present invention.

새로운 시간 구간 TUN 내의 트랜잭션들이 입력되면, 슬라이딩 윈도 우(TimeSW)가 모두 채워진 상태인지 여부를 확인한다(S310).When transactions in the new time interval TU N are input, it is checked whether the sliding window TimeSW is fully filled (S310).

슬라이딩 윈도우가 모두 채워진 상태이면, 맨 처음으로 트랜잭션이 삽입된 구간, 즉, TUN-ω+1에 저장된 트랜잭션을 슬라이딩 윈도우로부터 삭제하고(S320), 트랜잭션 크기 배열(TSA)에서도 |TUN-ω+1|을 삭제한다(S330). 그리고, 나머지 트랜잭션 배열을 앞쪽으로 하나씩 이동시킨 뒤(S324), 마지막 트랜잭션 크기 배열 TSA[ω]에 새롭게 입력된 시간 구간의 트랜잭션 |TUN|을 삽입한다(S326).If the sliding windows are all filled, the transaction in which the transaction is inserted for the first time, that is, the transaction stored in the TU N-ω + 1 is deleted from the sliding window (S320), and in the transaction size array (TSA), the | TU N-ω Delete +1 | (S330). Then, after moving the other transaction arrays forward one by one (S324), the transaction | TU N | of the newly entered time interval is inserted into the last transaction size array TSA [ω] (S326).

그러나, S310 단계에서 슬라이딩 윈도우(TimeSW)에 빈 구간이 존재하면, 트랜잭션 크기 배열(TSA)의 맨 뒤 구간에 새롭게 입력된 시간 구간의 트랜잭션 |TUN|을 삽입한다(S330).However, if an empty section exists in the sliding window TimeSW in step S310, a transaction | TU N | of a newly input time section is inserted in the last section of the transaction size array TSA (S330).

S326 단계 또는 S330 단계를 통하여, 슬라이딩 윈도우에 새롭게 입력된 시간 구간의 트랜잭션이 삽입되면, 새로 입력된 시간 구간 TUN 내의 모든 트랜잭션의 각 아이템 x에 대하여, x가 슬라이딩 윈도우에 존재하는지 여부를 확인한다(S340). x가 슬라이딩 윈도우에 존재하면, 해당 아이템 x의 비트맵 Bit(x)를 왼쪽으로 1비트 이동시킨 후(S350), 아이템 x의 비트맵에 비트값 '1'을 추가한다(S352).When a transaction of a newly input time interval is inserted into the sliding window through step S326 or S330, for each item x of all transactions in the newly input time interval TU N , it is checked whether x exists in the sliding window. (S340). If x is present in the sliding window, the bitmap Bit (x) of the corresponding item x is moved one bit to the left (S350), and then a bit value '1' is added to the bitmap of the item x (S352).

그러나, S340 단계에서의 확인 결과, x가 슬라이딩 윈도우에 존재하지 않으면, 새로운 비트맵 Bit(x)에 비트값 '1'을 할당하고(S360), 슬라이딩 윈도우에 추가한다(S362).However, as a result of checking in step S340, if x does not exist in the sliding window, a bit value '1' is assigned to the new bitmap Bit (x) (S360), and added to the sliding window (S362).

S352 단계 또는 S362 단계에 의하여, 슬라이딩 윈도우에 비트맵이 추가되면, 슬라이딩 윈도우 내에서 새로 입력된 시간 구간 TUN 내에 없는 아이템 x에 대해서는 |TUN| 비트만큼 앞쪽으로 이동시킨다(S370).When the bitmap is added to the sliding window by the step S352 or the step S362, for the item x that is not within the newly input time interval TU N in the sliding window, | TU N | Moving forward by a bit (S370).

그리고, 슬라이딩 윈도우 내의 모든 아이템들에서 지지도가 '0'인 아이템은 삭제한다(S380).In operation S380, items having a support of '0' are deleted from all items in the sliding window.

이와 같은 비트맵 압축 기법은 도 4에 기재된 알고리즘으로 구현될 수 있다.Such a bitmap compression technique may be implemented with the algorithm described in FIG. 4.

도 5 및 도 6은 본 발명의 실시예에 따라, 도 4에 기재된 알고리즘을 이용한 비트맵 압축 기법의 처리 과정을 설명하기 위한 도면이다.5 and 6 are diagrams for describing a processing procedure of a bitmap compression technique using the algorithm described in FIG. 4 according to an embodiment of the present invention.

도 5에 도시된 바에 따라, TU1에서 T1의 tid를 갖는 스트림 데이터가 처음으로 입력된다. 이에 따라, 'be'로 구성되는 아이템이 입력되어, b의 비트맵 Bit(b)와 e의 비트맵 Bit(e)에는 1이 각각 할당된다. 이에 따라, Bit(b)은 '1', Bit(e)은 '1'이 된다.As shown in FIG. 5, stream data having a tid of T 1 in TU 1 is input for the first time. Accordingly, an item consisting of 'be' is inputted, and 1 is assigned to the bitmap bit (b) of b and the bitmap bit (e) of e, respectively. Accordingly, Bit (b) becomes '1' and Bit (e) becomes '1'.

첫 번째 아이템이 입력된 후, TU1에서 T2의 tid를 갖는 아이템이 입력된다. 이에 따라, 'bce'로 구성되는 아이템이 입력되어, b의 비트맵 Bit(b), c의 비트맵 Bit(c)와 e의 비트맵 Bit(e)에는 비트값 '1'이 추가로 각각 할당된다. 이에 따라, Bit(b)은 '11', Bit(c)는 '1', Bit(e) 은 '11'이 된다.After the first item is entered, an item with a tid of T 2 in TU 1 is entered. Accordingly, an item consisting of 'bce' is input, and bit value '1' is additionally added to bitmap bit (b) of b, bitmap bit (c) of c and bitmap Bit (e) of e, respectively. Is assigned. Accordingly, Bit (b) is '11', Bit (c) is '1', and Bit (e) is '11'.

두 번째 아이템이 입력된 후, TU1에서 T3의 tid를 갖는 'ce'로 구성되는 아이템이 입력된다. 이에 따라 c의 비트맵 Bit(c)와 e의 비트맵 Bit(e)에는 비트값 '1'이 추가로 각각 할당되어, Bit(c)는 '11', Bit(e) 은 '111'이 된다. 그러나, b 에 대한 아이템은 입력되지 않았으므로, b의 비트맵 Bit(b)에는 비트값 '0'이 할당되며, 이에 따라, Bit(b)는 '110'이 된다.After the second item is entered, an item consisting of 'ce' with tid of T 3 in TU 1 is entered. Accordingly, bit value '1' is additionally assigned to bitmap bit (c) of bit c and bitmap bit (e) of e, respectively, so that Bit (c) is '11' and Bit (e) is '111'. do. However, since the item for b has not been input, the bit value '0' is assigned to the bitmap Bit (b) of b, whereby Bit (b) becomes '110'.

이와 같은 방법을 통하여, 스트림 데이터가 입력되면, 6A와 같이 비트맵이 할당된다. In this way, when stream data is input, a bitmap is allocated as in 6A.

TU3에서 T7의 tid를 갖는 아이템까지 입력되면, b의 비트맵과 e의 비트맵은 각각 7 비트의 크기를 갖게 된다. 이에 따라, 제1 슬라이딩 윈도우(TimeSW1)에는 6B와 같이 각 아이템의 비트 배열이 형성된다. 이와 같이 제1 슬라이딩 윈도우(TimeSW1)의 비트 배열이 7 비트의 크기가 되면, 비트맵 압축 기법을 수행하여, 6C와 같은 형태의 제2 슬라이딩 윈도우(TimeSW2)를 형성한다.If TU 3 is input to an item having a tid of T 7, the bitmap of b and the bitmap of e each have a size of 7 bits. Accordingly, a bit array of each item is formed in the first sliding window TimeSW 1 as shown in 6B. As described above, when the bit array of the first sliding window TimeSW 1 has a size of 7 bits, a bitmap compression technique is performed to form a second sliding window TimeSW 2 having a form such as 6C.

TU4에서 T8의 tid를 갖는 아이템 'bcde'가 입력되면, 제2 슬라이딩 윈도우(TimeSW2)의 각 아이템의 비트맵에 '1' 또는 '0'을 추가시킨다.When an item 'bcde' having a tid of T 8 is input in TU 4 , '1' or '0' is added to a bitmap of each item of the second sliding window TimeSW 2 .

도 5에 도시된 바와 같이 TU4에서 T9의 tid를 갖는 아이템까지의 입력이 종료되면, 제2 슬라이딩 윈도우(TimeSW2)를 구성하는 각각의 비트맵은 6E와 같은 비트 배열을 포함하게 된다.As shown in FIG. 5, when the input from the TU 4 to the item having the tid of T 9 ends, each bitmap constituting the second sliding window TimeSW 2 includes a bit array such as 6E.

이와 같은 비트맵 압축 기법에 의해 표현된 스트림 데이터를 기반으로, 슬라이딩 윈도우 TimeSWN-ω+1 내의 빈발 패턴을 탐사할 수 있다.Based on the stream data represented by such a bitmap compression technique, a frequent pattern in the sliding window TimeSW N−ω + 1 can be explored.

도 7은 본 발명의 실시예에 따른 빈발 패턴 마이닝 기법을 설명하기 위한 순 서도이다.7 is a flowchart illustrating a frequent pattern mining technique according to an embodiment of the present invention.

먼저, 빈발 패턴 마이닝을 위하여, 슬라이딩 윈도우 내의 모든 아이템 x의 비트맵 Bit(x)에 대한 지지도를 확인한다. 이 때, Bit(x)에 대한 지지도는 sup(x)TimeSW로 산출된다. 여기서, sup(x)TimeSW는 Bit(x) 내에 있는 1 비트의 개수이다. First, for frequent pattern mining, the support of the bitmap Bit (x) of all items x in the sliding window is checked. At this time, the support for Bit (x) is calculated as sup (x) TimeSW . Here, sup (x) TimeSW is the number of 1 bits in Bit (x).

그리고, 확인된 비트맵의 지지도를 사전에 설정된 최소 지지도와 비교한다. 여기서, 최소 지지도는 |TimeSW|*s로 산출되며, s는 사전에 설정된 최소 지지도로서 [0, 1] 사이의 수치이다(S702).Then, the support of the identified bitmap is compared with a preset minimum support. Here, the minimum support is calculated as | TimeSW | * s, and s is a predetermined minimum support, which is a value between [0, 1] (S702).

비트맵의 지지도와 사전에 설정된 최소 지지도를 비교한 결과, 비트맵 지지도가 최소 지지도보다 크거나 같으면 빈발 패턴으로 판정하고, 1-아이템 셋 빈발 패턴(FI1)을 추가한다(S704).As a result of comparing the support of the bitmap with the preset minimum support, if the bitmap support is greater than or equal to the minimum support, it is determined as a frequent pattern, and a 1-item set frequent pattern FI 1 is added (S704).

1-아이템 셋 빈발 패턴(FI1)이 결정되면, 1-아이템 셋 빈발 패턴(FI1)을 기반으로 2-아이템 셋 빈발 패턴의 후보 집합(CI2)을 조합한다. 이 때, 2-아이템 셋 빈발 패턴의 후보 집합 생성을 위한 알고리즘은 아프리오리(Apriori) 알고리즘에 기반한 GCIA(Generation of Candidate Itemsets using Apriori property)을 사용하는 것이 바람직하다(S706). When the 1-item set frequent pattern FI 1 is determined, the candidate set CI 2 of the 2-item set frequent pattern is combined based on the 1-item set frequent pattern FI 1 . In this case, as an algorithm for generating a candidate set of the 2-item set frequent pattern, it is preferable to use a Generation of Candidate Itemsets using Apriori property (GCIA) based on an Apriori algorithm (S706).

조합된 2-아이템 셋이 구성되면, 조합된 모든 2-아이템 셋의 빈발 패턴 후보 집합(CI2)에 대하여 AND 연산을 통하여 비트맵을 계산한다. 예로써, 조합된 2-아이 템을 'ab'라고 하면, 각 아이템 셋은 a와 b로 구성되며, 아이템 셋(ab)의 비트맵 Bit(ab)는 Bit(a)와 Bit(b)의 AND 연산에 의하여 산출할 수 있다(S708).When the combined 2-item set is configured, a bitmap is calculated through an AND operation on the frequent pattern candidate set CI 2 of all the combined 2-item sets. For example, if the combined two-item is 'ab', each item set is composed of a and b, and the bitmap bit (ab) of the item set (ab) is a bit (a) and a bit (b). It can calculate by AND operation (S708).

그리고, 생성된 모든 2-아이템 셋 후보 집합(CI2)에 대한 각 아이템 셋의 비트맵이 계산되면, 각 2-아이템 셋(c2)의 비트맵에 대한 지지도를 확인한다. 이 때, 각 2-아이템 셋(c2)의 비트맵에 대한 지지도는 sup(c2)TimeSW로 산출된다.When the bitmap of each item set for all generated 2-item set candidate sets CI 2 is calculated, the support for the bitmap of each 2-item set c 2 is checked. At this time, the support for the bitmap of each 2-item set (c 2 ) is calculated as sup (c 2 ) TimeSW .

2-아이템 셋(c2)의 비트맵에 대한 지지도가 산출되면, 산출된 2-아이템 셋의 지지도를 사전에 설정된 최소 지지도(|TimeSW|*s)와 비교한다(S710).When the support for the bitmap of the 2 -item set (c 2 ) is calculated, the calculated support of the 2-item set is compared with a preset minimum support (| TimeSW | * s) (S710).

2-아이템 셋(c2)의 비트맵에 대한 지지도(sup(c2)TimeSW)가 최소 지지도(|TimeSW|*s)보다 크거나 같으면 빈발 패턴으로 판정하고, 2-아이템 셋 빈발 패턴(FI2)을 추가한다(S712).If the support for the bitmap of the 2 -item set (c 2 ) (sup (c 2 ) TimeSW ) is greater than or equal to the minimum support (| TimeSW | * s), it is determined as a frequent pattern, and the 2-item set frequent pattern (FI 2 ) is added (S712).

마찬가지 방법으로 2-아이템 셋 빈발 패턴을 기반으로 3-아이템 셋 빈발 패턴의 후보 집합(CI3)을 조합하고(S716), 3-아이템 셋 빈발 패턴의 후보 집합(CI3)을 이용하여 비트맵을 계산하여(S720), 3-아이템 셋(c3)의 비트맵에 대한 지지도와 사전에 설정된 최소 지지도(|TimeSW|*s)를 비교한다(S722).In the same manner, a candidate set (CI 3 ) of the 3-item set frequent pattern is combined based on the 2-item set frequent pattern (S716), and a bitmap using the candidate set (CI 3 ) of the 3 -item set frequent pattern. By calculating (S720), the support for the bitmap of the 3 -item set (c 3 ) and the predetermined minimum support (| TimeSW | * s) are compared (S722).

3-아이템 셋(c3)의 비트맵에 대한 지지도(sup(c3)TimeSW)가 최소 지지도(|TimeSW|*s)보다 크거나 같으면 빈발 패턴으로 판정하여, 3-아이템 셋 빈발 패 턴(FI3)을 추가한다(S724).If the support for the bitmap of the 3 -item set (c 3 ) (sup (c 3 ) TimeSW ) is greater than or equal to the minimum support (| TimeSW | * s), it is determined as a frequent pattern, and the 3-item set frequent pattern ( FI 3 ) is added (S724).

그리고, 3-아이템 셋 빈발 패턴을 기반으로 4-아이템 셋 빈발 패턴의 후보를 산출하는 등, k의 숫자를 하나씩 늘려가면서 k-아이템 셋의 빈발 패턴을 확인하는 S716 이후의 과정을 반복하여 수행한다(S726).The process after S716 for checking the frequent pattern of the k-item set is repeated while increasing the number of k one by one, for example, calculating a candidate of the four-item set frequent pattern based on the 3-item set frequent pattern. (S726).

이와 같은 과정은 더 이상 k-아이템 셋 후보 집합인 CIk가 존재하지 않을 때까지 반복한다(S718).This process is repeated until there is no more k k -item set candidate set CI k (S718).

이와 같은 빈발 패턴 마이닝 기법은 도 8에 기재된 알고리즘으로 구현될 수 있다.Such a frequent pattern mining technique may be implemented by the algorithm described in FIG. 8.

도 9는 도 6에 기술된 비트맵 데이터를 이용하여, 비트맵을 이용한 빈발 패턴 마이닝 과정에 대한 단계별 처리 과정의 결과를 나타낸 예시 도면이다.FIG. 9 is an exemplary diagram illustrating a result of a stepwise processing for a frequent pattern mining process using a bitmap using the bitmap data described in FIG. 6.

이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다. The embodiments of the present invention described above are not only implemented by the apparatus and method but may be implemented through a program for realizing the function corresponding to the configuration of the embodiment of the present invention or a recording medium on which the program is recorded, The embodiments can be easily implemented by those skilled in the art from the description of the embodiments described above.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.Although the embodiments of the present invention have been described in detail above, the scope of the present invention is not limited thereto, and various modifications and improvements of those skilled in the art using the basic concepts of the present invention defined in the following claims are also provided. It belongs to the scope of rights.

도 1은 본 발명의 실시예에 따른 슬라이딩 윈도우를 나타낸 도면,1 is a view showing a sliding window according to an embodiment of the present invention,

도 2는 본 발명의 실시예에 따른 트랜잭션 크기 배열을 나타낸 도면,2 illustrates a transaction size arrangement in accordance with an embodiment of the present invention;

도 3은 본 발명의 실시예에 따른 비트맵 압축 방법을 설명하기 위한 순서도,3 is a flowchart illustrating a bitmap compression method according to an embodiment of the present invention;

도 4는 본 발명의 실시예에 따른 비트맵 압축 기법 알고리즘을 나타낸 도면,4 is a diagram illustrating a bitmap compression scheme algorithm according to an embodiment of the present invention;

도 5는 본 발명의 실시예에 따른 스트림 데이터의 예시도,5 is an exemplary diagram of stream data according to an embodiment of the present invention;

도 6은 본 발명의 실시예에 따라, 비트맵 압축 기법 알고리즘을 이용한 스트림 데이터의 처리 과정을 설명하기 위한 도면,6 is a view for explaining a process of processing stream data using a bitmap compression scheme algorithm according to an embodiment of the present invention;

도 7은 본 발명의 실시예에 따른 빈발 패턴 마이닝 기법을 설명하기 위한 순서도,7 is a flowchart illustrating a frequent pattern mining technique according to an embodiment of the present invention;

도 8은 본 발명의 실시예에 따른 빈발 패턴 마이닝 기법 알고리즘을 나타낸 도면,8 illustrates a frequent pattern mining algorithm algorithm according to an embodiment of the present invention;

도 9는 본 발명의 실시예에 따라 비트맵을 이용한 빈발 패턴 마이닝 과정에 대한 단계별 처리 과정의 결과를 나타낸 예시도이다.9 is an exemplary view showing a result of a step-by-step processing for the frequent pattern mining process using a bitmap according to an embodiment of the present invention.

Claims (10)

연속적으로 입력되는 스트림 데이터의 트랜잭션에 대한 빈발 패턴을 확인하는 방법에 있어서,In the method of confirming a frequent pattern for a transaction of stream data continuously input, (a) 입력되는 트랜잭션에 포함되어 있는 아이템 집합의 비트맵 지지도를 확인하는 단계;(a) checking the bitmap support of the item set included in the input transaction; (b) 상기 비트맵 지지도가 사전에 설정된 지지도 이상이면 빈발 패턴으로 판정하고, 이전의 아이템 집합보다 특정 수의 아이템을 더 포함하는 아이템 집합에 대한 빈발 패턴 후보 집합을 조합하는 단계;(b) determining the frequent pattern if the bitmap support is greater than or equal to a preset support, and combining a frequent pattern candidate set for an item set further including a specific number of items than a previous item set; (c) 조합된 하나 이상의 빈발 패턴 후보 집합의 비트맵을 계산하고, 상기 계산된 비트맵에 대한 비트맵 지지도를 산출하는 단계; 및(c) calculating a bitmap of the combined set of one or more frequent pattern candidates and calculating bitmap support for the calculated bitmap; And (d) 상기 빈발 패턴 후보 집합이 존재하지 않을 때까지, 상기 (b) 단계 이후의 과정을 반복하여 수행하는 단계(d) repeating the steps after step (b) until the frequent pattern candidate set does not exist 를 포함하는 빈발 패턴 확인 방법.Frequent pattern check method comprising a. 제1항에 있어서,The method of claim 1, 상기 단계 (a)는,Step (a) is, 상기 트랜잭션이 삽입된 슬라이딩 윈도우 내의 모든 아이템에 대한 비트맵을 확인하는 단계; 및Identifying bitmaps for all items in the sliding window into which the transaction is inserted; And 상기 비트맵에 포함된 '1' 비트 개수를 확인하여, 상기 비트맵 지지도를 확 인하는 단계Confirming the bitmap support by checking the number of '1' bits included in the bitmap 를 포함하는 빈발 패턴 확인 방법.Frequent pattern check method comprising a. 제1항에 있어서,The method of claim 1, 상기 단계 (b)는,Step (b) is, 상기 비트맵 지지도와 상기 트랜잭션이 삽입된 슬라이딩 윈도우의 크기와 사전에 설정된 최소 지지도―여기서, 상기 최소 지지도는 0과 1 사이의 값임―가 곱해진 값을 비교하여, 빈발 패턴 여부를 판정하는 것을 특징으로 하는 빈발 패턴 확인 방법.Comparing the bitmap support with the size of the sliding window into which the transaction is inserted and a predetermined minimum support, wherein the minimum support is a value between 0 and 1, to determine whether there is a frequent pattern. Frequent pattern check method. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2, 상기 단계 (c)는,Step (c) is, (c1) 상기 빈발 패턴 후보 집합에 대한 AND 연산을 통해 비트맵을 계산하는 단계; 및(c1) calculating a bitmap through an AND operation on the frequent pattern candidate set; And (c2) 상기 비트맵에 포함된 '1' 비트 개수를 확인하여, 상기 비트맵 지지도를 확인하는 단계(c2) checking the bitmap support by checking the number of '1' bits included in the bitmap 를 포함하는 빈발 패턴 확인 방법.Frequent pattern check method comprising a. 제1항에 있어서,The method of claim 1, 상기 단계 (b)는,Step (b) is, 상기 비트맵 지지도가 사전에 설정된 최소 지지도 이상이면, 이전의 아이템 집합보다 하나의 아이템이 더 포함된 아이템 집합에 대한 빈발 패턴 후보 집합을 조합하는 것을 특징으로 하는 빈발 패턴 확인 방법.And if the bitmap support is greater than or equal to a preset minimum support, combining a frequent pattern candidate set for an item set including one more item than the previous item set. 연속적으로 입력되는 스트림 데이터의 트랜잭션에 대한 비트맵 압축 방법에 있어서,In the bitmap compression method for a transaction of stream data continuously input, (a) 입력되는 트랜잭션을 슬라이딩 윈도우의 시간 구간에 삽입하는 단계;(a) inserting an input transaction into a time interval of a sliding window; (b) 상기 트랜잭션에 포함된 아이템이 상기 슬라이딩 윈도우에 존재하는지 여부를 확인하여, 존재가 확인되면 상기 아이템의 비트맵을 사전에 설정된 비트만큼 이동시킨 후 사전에 설정된 비트값을 추가하고, 상기 트랜잭션에 포함된 아이템이 상기 슬라이딩 윈도우에 존재하지 않으면 새로운 비트맵을 할당하여 상기 슬라이딩 윈도우에 추가하는 단계; 및(b) checking whether an item included in the transaction exists in the sliding window, and if the existence is confirmed, moving the bitmap of the item by a predetermined bit, adding a preset bit value, and adding the transaction. Allocating a new bitmap to the sliding window if the item included in the sliding window does not exist in the sliding window; And (c) 상기 슬라이딩 윈도우에서 비트맵 지지도가 0인 아이템을 삭제하는 단계(c) deleting an item having a bitmap support of 0 from the sliding window 를 포함하는 비트맵 압축 방법.Bitmap compression method comprising a. 제6항에 있어서,The method of claim 6, 상기 단계 (a)는 Step (a) is (a1) 상기 트랜잭션의 입력이 확인되면, 상기 트랜잭션을 수용하는 슬라이딩 윈도우의 시간 구간이 모두 채워진 상태인지 여부를 확인하는 단계;(a1) confirming whether or not the time interval of the sliding window that accommodates the transaction is filled when the input of the transaction is confirmed; (a2) 상기 슬라이딩 윈도우의 시간 구간이 모두 채워진 상태이면 맨 처음 입 력된 트랜잭션을 삭제하여 상기 입력된 트랜잭션을 삽입시키는 단계; 및(a2) inserting the input transaction by deleting the first input transaction when the time intervals of the sliding window are all filled; And (a3) 상기 슬라이딩 윈도우가 모두 채워진 상태가 아니면, 상기 슬라이딩 윈도우에서 트랜잭션이 채워진 시간 구간의 바로 뒤에 위치한 시간 구간에 상기 입력된 트랜잭션을 삽입하는 단계(a3) inserting the input transaction into a time interval located immediately after the time interval in which the transaction is filled in the sliding window when the sliding windows are not all filled; 를 포함하는 비트맵 압축 방법.Bitmap compression method comprising a. 제7항에 있어서, 상기 단계 (a2)는The method of claim 7, wherein step (a2) (a21) 상기 슬라이딩 윈도우에서 가장 앞에 위치한 시간 구간에 삽입되어 있는 트랜잭션을 삭제하는 단계;(a21) deleting a transaction inserted in a time interval located at the front of the sliding window; (a22) 상기 슬라이딩 윈도우의 시간 구간에 채워진 트랜잭션을 하나씩 앞쪽으로 이동시키는 단계; 및(a22) moving forward the transactions filled in the time interval of the sliding window one by one; And (a23) 상기 슬라이딩 윈도우에서 가장 뒤에 위치한 시간 구간에 상기 입력된 트랜잭션을 삽입하는 단계(a23) inserting the input transaction in a time interval located at the end of the sliding window; 를 포함하는 비트맵 압축 방법.Bitmap compression method comprising a. 제6항에 있어서,The method of claim 6, 상기 단계 (b)는,Step (b) is, (b1) 상기 트랜잭션에 포함된 아이템이 상기 슬라이딩 윈도우에 존재하는지 여부를 확인하는 단계;(b1) checking whether an item included in the transaction exists in the sliding window; (b2) 상기 트랜잭션에 포함된 아이템이 상기 슬라이딩 윈도우에 존재하면, 상기 아이템의 비트맵을 앞쪽으로 1비트씩 이동시킨 후, 상기 비트맵에 '1'의 비트값을 추가하는 단계; 및(b2) if an item included in the transaction exists in the sliding window, moving a bitmap of the item forward by one bit, and adding a bit value of '1' to the bitmap; And (b3) 상기 트랜잭션에 포함된 아이템이 상기 슬라이딩 윈도우에 존재하지 않으면, 상기 아이템에 대한 비트맵을 할당하고, 상기 할당된 비트맵에 '1'의 비트값을 추가하는 단계(b3) if an item included in the transaction does not exist in the sliding window, allocating a bitmap for the item and adding a bit value of '1' to the allocated bitmap. 를 포함하는 비트맵 압축 방법.Bitmap compression method comprising a. 제6항에 있어서,The method of claim 6, 상기 단계 (b)와 상기 단계 (c) 사이에,Between step (b) and step (c), 상기 슬라이딩 윈도우에 포함되어 있는 비트맵 중, 상기 트랜잭션에 포함되어 있지 않은 아이템의 비트맵에 대하여, 상기 시간 구간의 크기만큼 앞쪽으로 이동시키는 단계Among the bitmaps included in the sliding window, moving forward of the bitmap of the item not included in the transaction by the size of the time interval. 를 추가로 포함하는 비트맵 압축 방법.Bitmap compression method further comprising.
KR1020090030988A 2008-12-02 2009-04-09 Method for Stream Pattern Mining using Bitwise Map KR101128504B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20080121436 2008-12-02
KR1020080121436 2008-12-02

Publications (2)

Publication Number Publication Date
KR20100062854A true KR20100062854A (en) 2010-06-10
KR101128504B1 KR101128504B1 (en) 2012-03-27

Family

ID=42363059

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090030988A KR101128504B1 (en) 2008-12-02 2009-04-09 Method for Stream Pattern Mining using Bitwise Map

Country Status (1)

Country Link
KR (1) KR101128504B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140108017A (en) * 2013-02-28 2014-09-05 삼성전자주식회사 Method and apparatus for pattern discoverty in sequence data
KR20140131471A (en) * 2013-05-03 2014-11-13 삼성전자주식회사 Method and Apparatus for mining temporal pattern
KR101872241B1 (en) * 2017-03-24 2018-06-28 경희대학교 산학협력단 Method, apparatus and computer program for information compression
KR20190103918A (en) * 2018-02-13 2019-09-05 재단법인대구경북과학기술원 System and method for large-scale frequent pattern mining on distributed systems

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100913027B1 (en) * 2002-09-23 2009-08-20 이원석 Data Mining Method and Data Mining System
KR100776640B1 (en) * 2005-09-27 2007-11-16 인하대학교 산학협력단 System and method for finding the time sensitive frequent itemsets
KR100812378B1 (en) * 2005-11-28 2008-03-11 이원석 estDec+ method for finding frequent itemsets over data streams using compressed-Prefix trees

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140108017A (en) * 2013-02-28 2014-09-05 삼성전자주식회사 Method and apparatus for pattern discoverty in sequence data
KR20140131471A (en) * 2013-05-03 2014-11-13 삼성전자주식회사 Method and Apparatus for mining temporal pattern
KR101872241B1 (en) * 2017-03-24 2018-06-28 경희대학교 산학협력단 Method, apparatus and computer program for information compression
KR20190103918A (en) * 2018-02-13 2019-09-05 재단법인대구경북과학기술원 System and method for large-scale frequent pattern mining on distributed systems

Also Published As

Publication number Publication date
KR101128504B1 (en) 2012-03-27

Similar Documents

Publication Publication Date Title
CN104008064B (en) The method and system compressed for multi-level store
US11816015B2 (en) Management of event log information of a memory sub-system
KR101128504B1 (en) Method for Stream Pattern Mining using Bitwise Map
CN106203631B (en) The parallel Frequent Episodes Mining and system of description type various dimensions sequence of events
KR101993793B1 (en) Conservative garbage collecting and tagged integers for memory management
CN104424256A (en) Method and device for generating Bloom filter
CN110928851B (en) Method, device and equipment for processing log information and storage medium
CN109408682A (en) A kind of method of regular expression matching, system and equipment
CN111858146A (en) Method, apparatus and computer program product for recovering data
CN116210211A (en) Anomaly detection in network topology
CN101911058A (en) Generation of a representative data string
CN112783447A (en) Method, apparatus, device, medium, and article of manufacture for processing snapshots
WO2023082629A1 (en) Data storage method and apparatus, electronic device, and storage medium
CN111736774A (en) Redundant data processing method and device, server and storage medium
US9165020B2 (en) String substitution apparatus, string substitution method and storage medium
JP6549786B2 (en) Data cleansing system, method and program
Li et al. A single-scan algorithm for mining sequential patterns from data streams
CN106844480A (en) One kind cleaning compares storage method
Shan et al. Lcfi: A fault injection tool for studying lossy compression error propagation in hpc programs
CN104424285A (en) Method and device for performing impact analysis on change request
US10416888B2 (en) Parallel processing device, method for controlling parallel processing device, and controller used in parallel processing device
CN113010891A (en) Application program safety detection method and device, electronic equipment and storage medium
KR20220115859A (en) Edge table representation of the process
JP6835688B2 (en) Analysis management system and analysis management method
CN108073712B (en) Method and device for deleting main data in information system and computer equipment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150126

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180119

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee