KR20140057886A - 프로세스 분석을 위한 데이터 전처리 시스템 - Google Patents

프로세스 분석을 위한 데이터 전처리 시스템 Download PDF

Info

Publication number
KR20140057886A
KR20140057886A KR1020120124201A KR20120124201A KR20140057886A KR 20140057886 A KR20140057886 A KR 20140057886A KR 1020120124201 A KR1020120124201 A KR 1020120124201A KR 20120124201 A KR20120124201 A KR 20120124201A KR 20140057886 A KR20140057886 A KR 20140057886A
Authority
KR
South Korea
Prior art keywords
data
definition
sql
event
scheme
Prior art date
Application number
KR1020120124201A
Other languages
English (en)
Other versions
KR101433139B1 (ko
Inventor
설성욱
김정아
김민구
이훈
Original Assignee
(주)토탈소프트뱅크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)토탈소프트뱅크 filed Critical (주)토탈소프트뱅크
Priority to KR1020120124201A priority Critical patent/KR101433139B1/ko
Publication of KR20140057886A publication Critical patent/KR20140057886A/ko
Application granted granted Critical
Publication of KR101433139B1 publication Critical patent/KR101433139B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 프로세스 분석을 위한 데이터 전처리 시스템은 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부를 포함하는 정의 모듈; 상기 정의 모듈에 기록된 정보를 이용하여 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈; 및 상기 제어 모듈로부터 데이터를 수신하여 프로세스 분석을 위한 표준 형식의 파일로 변환하는 표준 변환 모듈을 포함하여 이루어지는 것을 특징으로 한다.

Description

프로세스 분석을 위한 데이터 전처리 시스템 {Data Preprocessing System For Process Analysis}
본 발명은 데이터 처리 시스템에 관한 것이다. 보다 구체적으로 데이터베이스로부터 데이터를 추출하여 프로세스 분석을 위한 표준 형식으로 제공하는 데이터 전처리 시스템에 관한 것이다.
세계화로 인해 국가 간 교역량이 증가함에 따라 컨테이너선을 이용한 해상 운송은 국제 무역에서 큰 비중을 차지하고 있으며, 삼면이 바다로 둘러싸여 있는 우리나라의 경우에도 국제운송의 대부분을 해상운송이 점유하고 있다.
현재 우리나라를 비롯한 많은 국가들은 해상 운송의 거점 역할을 하는 항만의 효율성을 높이기 위한 여러 가지 자동화 컨테이너 터미널 시스템을 개발하고 있다.
터미널 운영시스템(TOS: Terminal Operation System)은 선사, 운송사, 항구로 들어오는 선박으로부터 컨테이너에 대한 정보를 받고, 모든 컨테이너가 정확한 위치로 가장 효과적인 방법으로 이동될 수 있도록 터미널 내 컨테이너의 흐름을 관리하는 시스템으로서, 컨테이너 터미널의 자동화를 위한 필수적인 요소이다.
TOS는 컨테이너의 흐름 관리를 위한 각종 정보 및 컨테이너에 관한 각종 이벤트 정보를 데이터베이스에 저장하고 있으므로 TOS에 기록된 이벤트 로그를 프로세스 마이닝 프로그램을 사용하여 분석하면 현재 이루어지고 있는 컨테이너 관리 프로세스를 파악할 수 있으며, 파악된 프로세스를 통해 현재 시스템의 문제점을 발견하고 문제점을 개선할 수 있는 새로운 프로세스를 설계할 수 있다.
그러나 TOS에 기록된 이벤트 로그를 프로세스 마이닝 프로그램이 요구하는 XMXL(Mining XML) 형식으로 변환하기 위해서는 해당 데이터베이스의 저장 방식을 모두 파악하고 있는 전문가가 필요하며, 그 추출 방식 또한 매우 번거롭고, 데이터 추출시마다 데이터 추출을 위한 전과정을 다시 수행해야하는 등의 여러 가지 문제점이 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은 데이터베이스로부터 프로세스 마이닝을 위해 사용될 데이터를 추출하기 위한 데이터 전처리 시스템을 제공하는 것이다.
본 발명의 다른 목적은 워크플로우 정의부 및 SQL 정의부를 구비함으로써 TOS 데이터베이스 저장방식에 대한 전문적 지식이 없는 사용자도 데이터베이스로부터 프로세스 마이닝을 위해 사용될 데이터를 추출할 수 있게 하기 위한 데이터 전처리 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 워크플로우 정의부 및 SQL 정의부를 구비함으로써 SQL문의 자동 재사용이 가능한 데이터 전처리 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 데이터 추출 모듈 및 표준 변환 모듈을 구비함으로써 중간 단계 파일을 생성할 필요 없이 데이터베이스로부터 직접 프로세스 분석을 위한 표준 형식의 파일을 추출할 수 있는 데이터 전처리 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 정의 작성 모듈을 구비함으로써 워크플로우 정의부 및 SQL 정의부의 작성/수정/삭제, 워크플로우 정의부 스킴에 대응하는 SQL문의 확인/변경, 특정 스킴의 선택/배제를 사용자에게 제공할 수 있는 데이터 전처리 시스템을 제공하는 것이다.
상기의 목적을 달성하기 위해 본 발명의 일 실시예에 따른 프로세스 분석을 위한 데이터 전처리 시스템은 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부를 포함하는 정의 모듈; 상기 정의 모듈에 기록된 정보를 이용하여 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈; 및 상기 제어 모듈로부터 데이터를 수신하여 프로세스 분석을 위한 표준 형식의 파일로 변환하는 표준 변환 모듈을 포함하여 이루어지는 것을 특징으로 한다.
워크플로우 정의는 프로세스와 관련된 대상을 조회하기 위한 스킴 및 대상과 관련된 이벤트를 조회하기 위한 스킴을 포함하고 있으며, 각 스킴에는 각 스킴에 대응하는 SQL문을 상기 SQL정의부로부터 찾기 위한 식별자(ID)가 포함되어 있다.
이벤트를 조회하기 위한 스킴에는 대상을 조회하는 스킴과 달리 해당 이벤트가 어떤 행위를 위한 것인지를 나타내는 워크플로우 모델 엘리먼트(Workflow Model Element)와 이벤트 타입(Event Type) 정보가 추가적으로 요구된다.
대상을 조회하기 SQL문은 대상의 아이디를 조회하기 위한 변수를 포함하며, 이벤트를 조회하기 위한 SQL문은 관련된 대상의 아이디 및 이벤트 발생 시간을 조회하기 위한 변수를 포함한다.
각 SQL문은 데이터 조회 시간 범위를 조건문에 포함하고 있으며, 이 조회 시간 범위는 사용자가 원하는 데이터 조회 시간 범위를 입력하였을 때 모든 SQL문에 동일하게 적용된다.
본 발명의 다른 실시예에 따른 데이터 전처리 시스템은 워크플로우 정의부 또는 SQL 정의부에 저장된 데이터를 사용자가 작성, 수정, 삭제할 수 있는 사용자 인터페이스를 제공하는 정의 작성 모듈을 더 포함할 수 있다.
사용자 인터페이스는 해당 스킴에 대응하는 SQL 정의 표시, 수정, 테스트 기능을 제공할 수 있으며, 데이터 추출시 특정 스킴을 적용하거나 배제하도록 선택할 수 있는 기능을 제공할 수도 있다.
본 발명은 워크플로우 정의부 및 SQL 정의부를 구비함으로써 데이터베이스 저장방식에 대한 전문적 지식이 없는 사용자도 데이터베이스로부터 프로세스 마이닝을 위해 사용될 데이터를 손쉽게 추출할 수 있으며, 한번 작성된 SQL문이 자동 재사용이 가능한 데이터 전처리 시스템을 제공하는 효과를 갖는다.
또한 데이터 추출 모듈 및 표준 변환 모듈을 구비함으로써 중간 단계 파일을 생성할 필요 없이 데이터베이스로부터 직접 프로세스 분석을 위한 표준 형식의 파일을 추출할 수 있으며, 정의 작성 모듈을 구비함으로써 워크플로우 정의부 및 SQL 정의부의 작성/수정/삭제, 워크플로우 정의부 스킴에 대응하는 SQL문의 확인/변경, 특정 스킴의 선택/배제를 사용자에게 제공할 수 있는 데이터 전처리 시스템을 제공하는 효과를 갖는다.
제1도는 프로세스 마이닝 프로그램의 표준 입력 파일 형식인 MXML 구조를 보여주는 도면이다.
제2도는 MXML에서 허용하는 모든 이벤트 종류(Event Type) 및 연결관계를 예시적으로 보여주는 도면이다.
제3도는 본 발명의 일 실시예에 따른 데이터 전처리 시스템을 보여주는 블럭도이다.
제4도는 본 발명의 일 실시예에 따른 데이터 전처리 시스템에 사용되는 워크플로우 정의를 예시적으로 보여주는 도면이다.
제5도 및 제6도는 본 발명의 일 실시예에 따른 데이터 전처리 시스템에 사용되는 SQL문을 예시적으로 보여주는 도면이다.
제7도는 본 발명의 다른 실시예에 따른 데이터 전처리 시스템을 보여주는 블럭도이다.
제8도는 본 발명의 다른 실시예에 따른 데이터 전처리 시스템에 사용되는 예시적인 사용자 인터페이스를 보여주는 도면이다.
본 발명은 클릭 한 번만으로 데이터베이스로부터 데이터를 추출하여 프로세스 분석을 위한 표준 형식의 데이터를 생성할 수 있는 데이터 전처리 시스템에 관한 것이다.
프로세스 분석을 위한 표준 형식의 데이터란 데이터 마이닝 솔루션과 같이 프로세스를 분석할 수 있는 프로그램에서 사용될 수 있는 형식의 데이터로서 일반적으로 도 1에 도시된 바와 같은 MXML이 표준 형식이다.
이러한 MXML(Mining XML)의 구조를 살펴보면, 프로세스(Process) 아래에 여러 개의 프로세스 인스턴스(Process Instance) 데이터가 존재하고, 하나의 프로세스 인스턴스 아래에 여러 개의 오디트 트레일 엔트리(Audit Trail Entry) 데이터가 존재한다.
프로세스 인스턴스는 대상(case)을 의미하는 것으로, 컨테이너 프로세스에서는 개별 컨테이너, 선박(vessel), 트럭 등이 프로세스 인스턴스에 해당될 수 있다.
오디트 트레일 엔트리는 이벤트(event)를 의미하는 것으로, 컨테이너 프로세스에서는 QC 양하 작업 생성, QC 양하 작업 완료 등이 오디트 트레일 엔트리에 해당될 수 있다.
또한 오디트 트레일 엔트리 아래에는 워크플로우 모델 엘리먼트(WorkflowModelElement), 이벤트 타입(EventType), 타임스탬프(TimeStamp), 오리지네이터(Originator), 어트리뷰트(Attribute) 데이터가 존재한다.
워크플로우 모델 엘리먼트는 프로세스 내에 존재하는 각각의 행위로서 이벤트 단위로 세분화가 가능하며, 컨테이너 프로세스에서는 QC 양하, YQ 양하장치, YQ 반출상차 등이 워크플로우 모델 엘리먼트에 해당될 수 있다.
이벤트 타입은 워크플로우 모델 엘리먼트를 이벤트 단위로 세분화하였을 때 해당 이벤트가 워크플로우 모델 엘리먼트 내에서 어떤 이벤트에 해당하는지를 명시한다. 컨테이너 프로세스에서는 예를 들어 작업 생성(schedule), 작업 완료(complete) 등으로 이벤트 타입을 나타낼 수 있다.
도 2에 도시된 바와 같이 MXML에서 정의할 수 있는 이벤트 타입간에는 연관 관계(paper: A Meta Model for Process Mining Data)가 존재한다. 도 2에서의 메인 플로우는 Schedule-assign-start-complete의 흐름을 가지며, 꼭 모든 흐름을 정의하지 않아도 프로세스 분석은 가능하다(예를 들어 모든 워크플로우 모델 엘리먼트를 complete 이벤트 한 종류만으로 정의할 수도 있음).
타임 스탬프는 해당 이벤트가 발생한 시각이고, 오리지네이터는 해당 이벤트를 발생시킨 행위자이며, 어트리뷰트는 타임 스탬프와 오리지네이터를 제외한 모든 데이터 상에 존재하는 속성 정보이다. 어트리뷰트는 오디트 트레일 엔트리와 프로세스 인스턴스 양쪽 모두에 존재할 수 있으며, 분석 대상 객체 자체에 대한 속성은 프로세스 인스턴스의 어트리뷰트로, 행위에 대한 속성은 오디트 트레일의 어트리뷰트로 정의한다.
본 발명에 따른 프로세스 분석을 위한 데이터 전처리 시스템(100)은 워크플로우 정의와 SQL 정의가 기록된 정의 모듈(110), 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈(120), 및 추출된 데이터를 프로세스 분석을 위한 표준 형식으로 변환하는 표준 변환 모듈(130)을 포함하여 이루어져, 도 3에 도시된 바와 같이 데이터베이스로부터 필요한 데이터를 추출하여 프로세스 분석을 위한 표준 형식의 데이터를 생성한다.
보다 상세히 설명하면, 본 발명에 따른 데이터 전처리 시스템(100)은 앞서 설명한 바와 같은 표준 형식의 데이터를 추출하기 위해 데이터베이스에 저장된 이벤트 로그로부터 필요한 데이터를 조회하여 추출해야 한다.
이를 위해 본 발명에 따른 데이터 전처리 시스템의 정의 모듈(110)에는 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부(111)와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부(112)가 포함되어 있다.
보다 상세히 설명하면, 워크플로우 정의에는 프로세스 분석을 위한 모든 대상과 각 대상과 관련된 이벤트들이 정의되어 있다. 이를 위해 대상인 프로세스 인스턴스를 조회하기 위한 프로세스 스킴(ProcessScheme)과 프로세스 스킴 아래에 각 이벤트인 오디트 트레일 엔트리를 조회하기 위한 1개 이상의 오디트 트레일 스킴(AuditTrailScheme)이 포함되어 있다.
또한 각 스킴에는 스킴과 관련된 SQL문을 찾기 위한 ID(SqlMapperID)가 포함되어 있으며, 각 ID에 대응하는 SQL문은 SQL 정의부(112)에 포함되어 있어 각 스킴과 관련된 데이터를 데이터 베이스에서 조회할 수 있다.
특히 본 발명에 따른 워크플로우 정의부에는 워크플로우 모델 엘리먼트(Work Model Element), 이벤트 타입, 타임스탬프, 오리지네이터, 어트리뷰트 등 오디트 트레일 엔트리에 포함되어 있어야 하는 데이터(도1 참조) 중 타임스탬프, 오리지네이터 등은 개별 레코드마다 다른 값을 갖는 데이터이지만 해당 이벤트가 프로세스 상의 어떤 이벤트에 해당하는지는 데이터베이스의 데이터에 존재하지 않고 정의를 통해 지정하는 것이라는 점에서 워크플로우 모델 엘리먼트(Work Model Element), 이벤트 타입은 워크플로우 정의의 스킴에 정의함으로써 개별 SQL마다 워크플로우 모델 엘리먼트와 이벤트 타입이 포함되어야 하는 불필요함을 제거한다.
이러한 워크플로우 정의와 SQL정의부에 포함되는 SQL문을 도 4 내지 도 6에 예시적으로 도시하였으며, 도면에 예시적으로 도시된 바와 같이 워크플로우 정의와 SQL정의는 xml형식으로 작성될 수 있다. 이러한 도면을 참고로 다시 한번 상세히 설명하면 다음과 같다.
도 4에는 반입부터 반출까지 프로세스에 의해 처리된 컨테이너들을 조회하기 위한 프로세스 스킴과 프로세스 스킴 아래에 컨테이너와 관련된 이벤트(반입 장치 작업 생성, 반입 장치 작업 완료)를 조회하기 위한 오디트 트레일 스킴이 예시적으로 도시되어 있다.
도 4의 프로세스 스킴에는 프로세스에 의해 처리된 컨테이너들을 데이터베이스에서 조회하기 위한 SQL문을 매칭시키기 위한 ID인 selectContainer가 포함되어 있으며, 이에 해당하는 도 5에 도시된 바와 같은 SQL문이 SQL정의부(112)에 포함되어 있다.
또한 오디트 트레일 스킴에도 해당 이벤트를 조회하기 위한 SQL문을 매칭시키기 위한 ID가 포함되어 있으며, 이 중 selectCompleteGateIn에 해당하는 예시적인 SQL문이 도 6에 도시되어 있다.
또한 도 4에 도시된 바와 같이 오디트 트레일 스킴에는 워크플로우 모델 엘리먼트(Workflow Model Element)와 이벤트 타입(Event type)이 정의되어 있다.
이와 같이 워크플로우 모델 엘리먼트와 이벤트 타입이 워크플로우 정의 스킴 내에 포함되어 있음으로써 각각의 SQL문과 SQL문에 의해 조회된 데이터가 워크플로우 모델 엘리먼트(Workflow Model Element)와 이벤트 타입(Event type)에 대한 정보를 포함하고 있어야 하는 불필요함을 제거할 수 있다.
컨테이너 데이터를 조회하기 위한 SQL정의를 나타내고 있는 도 5를 참고로 프로세스 인스턴스를 조회하는 SQL정의에 대해 살펴보면, 대상인 프로세스 인스턴스를 조회하기 위한 SQL문에는 반드시 대상의 아이디를 조회하기 위한 변수(CASE_ID)가 반드시 포함되어 있어야 한다. 그리고 SQL문의 조건문에는 데이터 조회 시간 범위가 포함되어 있어야 한다.
이러한 정보가 포함되어 있어야 하는 이유는 해당 SQL문을 사용하여 해당 데이터 조회 시간 범위 내에 있는 대상(도 6에서는 컨테이너)의 데이터를 조회할 수 있으며, 케이스 아이디를 통해 조회된 데이터가 어느 대상에 대한 데이터인지를 구분할 수 있기 때문이다.
컨테이너 반입 장치 완료 이벤트를 조회하기 위한 SQL정의를 나타내고 있는 도 6을 참고로 오디트 트레일 엔트리를 조회하는 SQL정의에 대해 살펴보면, 이벤트인 프로세스 인스턴스를 조회하기 위한 SQL문에는 반드시 대상의 아이디를 조회하기 위한 변수와 이벤트 발생 시간(타임스탬프)을 조회하기 위한 변수가 반드시 포함되어 있어야 하며, SQL문의 조건문에 데이터 조회 시간 범위가 포함되어 있어야 한다.
이러한 정보가 포함되어 있어야하는 이유는 해당 SQL문을 사용하여 해당 데이터 조회 시간 범위 내에 있는 이벤트의 데이터를 조회할 수 있으며, 케이스 아이디를 통해 조회된 데이터가 어느 대상에 대한 데이터인지, 타임 스탬프 정보를 통해 몇 시에 발생하였는지를 구분할 수 있기 때문이다.
데이터 조회 시간 범위는 사용자가 데이터를 조회하고자 하는 시간 범위를 입력할 때 모든 SQL문에 동일하게 적용되어 해당 조회 시간 범위 내의 대상 및 이벤트가 조회될 수 있다.
또한 도 6에는 타임 스탬프가 Timestamp가 아닌 ATE_TIME으로 기재되어 있다. 이는 특정 데이터베이스 관리 시스템(DBMS)의 SQL문에서 Timestamp가 특별한 의미로 이용되는 단어이므로 이를 대신하여 ATE_TIME이라는 변수명을 적용한 것이며, 앞서 설명한 CASE_ID라는 변수명 역시 다른 DBMS에서 문제가 발생할 경우 향후 다른 변수명으로 대체될 수 있다.
본 발명의 일 실시예에 따른 데이터 전처리 시스템은 사용자가 원하는 조회 시간 범위를 입력하기만 하면 앞서 설명한 정의 모듈(110)의 데이터들을 이용하여 데이터 추출 모듈(120)이 연결된 데이터베이스(200)로부터 데이터를 추출한다.
이를 위해 데이터 추출 모듈은 데이터베이스 연결 정보를 포함하고 있어야 하며, 정의 모듈의 SQL문을 사용하여 데이터베이스로부터 데이터를 추출할 수 있어야 한다. 이러한 데이터 추출 모듈은 마이바티스 플러그인(Mybatis Plug_In)을 활용하여 구현할 수 있다.
본 발명의 일 실시예에 따른 데이터 전처리 시스템에서 표준 변환 모듈(130)로서 프로엠 임포트(ProM Import)가 사용될 수 있다. 해당 프로그램은 MXML 형식을 개발한 아인트호벤 공과대학에서 개발한 오픈소스 프로그램으로 데이터베이스에서 SQL 조회를 통해 얻은 결과를 txt, csv 등의 문자열 파일로 출력한 뒤 이 파일을 프로엠 임포트의 입력으로 제공하여 MXML 파일을 얻을 수 있다.
그러나 본 발명의 일 실시예에 따른 데이터 전처리 시스템은 위와 같은 데이터 추출 모듈(120)을 표준 변환 모듈(130) 앞에 플러그인 형태로 연결함으로써 txt, csv 등과 같은 중간 단계의 파일 생성 필요 없이 프로세스 분석을 위한 표준 형식의 MXML 파일을 바로 얻을 수 있다.
지금까지 본 발명의 일 실시예에 따른 데이터 전처리 시스템을 도면을 참고로 설명하였다. 이러한 데이터 전처리 시스템을 사용할 경우, 전문가가 미리 워크플로우 정의 및 SQL 정의를 한 번만 작성해 두면 해당 데이터베이스의 구조를 파악하지 못하는 비전문가라 하더라도 데이터를 조회하고자 하는 시간 범위만 입력하면 프로세스 분석을 위한 데이터를 표준 형식으로 추출해 낼 수 있다.
또한 본 발명의 다른 실시예에 따른 데이터 전처리 시스템은 도 7에 도시된 바와 같이 정의 모듈에 저장된 정보를 사용자가 수정할 수 있도록 사용자 인터페이스(UI)를 제공하는 정의 작성 모듈(140)을 더 포함할 수 있다.
정의 작성 모듈(140)은 정의 모듈(110)에 연결되어 정의 모듈에 저장된 워크플로우와 SQL문을 사용자가 작성/수정/삭제할 수 있도록 하는 기능을 제공한다.
본 발명의 정의 작성 모듈은 사용자가 워크플로우의 프로세스 스킴, 오디트 트레일 스킴을 작성/수정/삭제할 수 있도록 기능을 제공할 뿐만 아니라 해당 스킴에 대응하는 SQL문을 표시해 주고 이를 테스트할 수 있도록 하여 잘못된 경우 수정할 수 있도록 하는 기능을 제공한다.
또한 데이터 추출시 특정 스킴을 적용하거나 배제하도록 선택할 수 있는 기능을 제공하여 특정 대상에 대한 데이터 또는 특정 이벤트에 관련된 데이터만을 추출하여 이와 관련된 프로세스만을 분석할 수 있도록 한다.
위와 같은 정의 작성 모듈(140)에 의해 제공되는 사용자 인터페이스의 예시적인 형태가 도 8에 도시되어 있으며, 사용자는 이러한 사용자 인터페이스를 사용하여 분석 대상에 대한 스킴 (Process Scheme) 및 이벤트에 대한 스킴 (Audit Trail Scheme)의 작성, 스킴 추가/수정, 삭제, 선택한 스킴에 대한 각종 정보 표시(SQL문 포함), 수정, 테스트, 적용 여부 선택 기능 등을 사용할 수 있다.
비록 지금까지 구체적인 실시예를 참고로 본 발명을 상세히 설명하였으나 본 발명은 이러한 실시예에 한정되는 것이 아니며, 본 발명의 요지를 벗어나지 않는 범위 내에서 당업자에 의해 수정 및 변형되어 실시될 수 있으며, 그러한 수정 및 변형 역시 이하의 특허청구범위에 속하는 것으로 보아야 한다.
100: 데이터 전처리 시스템 110: 정의 모듈
111: 워크플로우 정의부 112: SQL 정의부
120: 데이터 추출 모듈 130: 표준 변환 모듈
140: 정의 작성 모듈 200: 데이터베이스

Claims (9)

  1. 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부를 포함하는 정의 모듈;
    상기 정의 모듈에 기록된 정보를 이용하여 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈; 및
    상기 제어 모듈로부터 데이터를 수신하여 프로세스 분석을 위한 표준 형식의 파일로 변환하는 표준 변환 모듈;
    을 포함하여 이루어지는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  2. 제1항에 있어서,
    상기 워크플로우 정의는 프로세스와 관련된 대상을 조회하기 위한 스킴 및 대상과 관련된 이벤트를 조회하기 위한 스킴을 포함하고 있으며, 각 스킴에는 각 스킴에 대응하는 SQL문을 상기 SQL정의부로부터 찾기 위한 식별자(ID)가 포함되어 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  3. 제2항에 있어서,
    상기 이벤트를 조회하기 위한 스킴에 워크플로우 모델 요소와 이벤트 타입이 정의되어 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  4. 제2항에 있어서,
    대상을 조회하기 SQL문은 대상의 아이디를 조회하기 위한 변수를 포함하며, 데이터 조회 시간 범위를 조건문에 포함하고 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  5. 제2항에 있어서,
    이벤트를 조회하기 위한 SQL문은 관련된 대상의 아이디 및 이벤트 발생 시간을 조회하기 위한 변수를 포함하며, 데이터 조회 시간 범위를 조건문에 포함하고 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  6. 제4항 또는 제5항에 있어서,
    상기 데이터 조회 시간 범위는 사용자가 원하는 데이터 조회 시간 범위가 입력되면 모든 SQL문에 동일하게 적용되는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  7. 제1항에 있어서,
    상기 워크플로우 정의부 또는 SQL 정의부에 저장된 데이터를 사용자가 작성, 수정, 삭제할 수 있는 사용자 인터페이스를 제공하는 정의 작성 모듈을 더 포함하는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  8. 제7항에 있어서,
    상기 사용자 인터페이스는 해당 스킴에 대응하는 SQL 정의 표시, 수정, 테스트 기능을 제공하는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
  9. 제6항에 있어서,
    상기 사용자 인터페이스는 데이터 추출시 특정 스킴을 적용하거나 배제하도록 선택할 수 있는 기능을 제공하는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
KR1020120124201A 2012-11-05 2012-11-05 프로세스 분석을 위한 데이터 전처리 시스템 KR101433139B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120124201A KR101433139B1 (ko) 2012-11-05 2012-11-05 프로세스 분석을 위한 데이터 전처리 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120124201A KR101433139B1 (ko) 2012-11-05 2012-11-05 프로세스 분석을 위한 데이터 전처리 시스템

Publications (2)

Publication Number Publication Date
KR20140057886A true KR20140057886A (ko) 2014-05-14
KR101433139B1 KR101433139B1 (ko) 2014-08-26

Family

ID=50888407

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120124201A KR101433139B1 (ko) 2012-11-05 2012-11-05 프로세스 분석을 위한 데이터 전처리 시스템

Country Status (1)

Country Link
KR (1) KR101433139B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101687239B1 (ko) * 2016-05-06 2016-12-16 주식회사 위즈온텍 빅데이터 스트림 모델링 시스템 및 방법
KR20180065416A (ko) * 2016-12-07 2018-06-18 (주)에스피파트너스 빅데이터 분석 프로세스 모델링을 위한 인터페이스 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100500329B1 (ko) * 2001-10-18 2005-07-11 주식회사 핸디소프트 워크플로우 마이닝 시스템 및 방법
KR100984049B1 (ko) * 2007-11-07 2010-09-30 (주)케투씨소프트 응용업무관리 시스템 및 그 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101687239B1 (ko) * 2016-05-06 2016-12-16 주식회사 위즈온텍 빅데이터 스트림 모델링 시스템 및 방법
KR20180065416A (ko) * 2016-12-07 2018-06-18 (주)에스피파트너스 빅데이터 분석 프로세스 모델링을 위한 인터페이스 장치

Also Published As

Publication number Publication date
KR101433139B1 (ko) 2014-08-26

Similar Documents

Publication Publication Date Title
Li et al. Extracting object-centric event logs to support process mining on databases
US7778979B2 (en) Method and apparatus for compressing log record information
CN108052618B (zh) 数据管理方法及装置
Ingvaldsen et al. Preprocessing support for large scale process mining of SAP transactions
US8463811B2 (en) Automated correlation discovery for semi-structured processes
KR20150132858A (ko) 메타데이터 관리를 위한 시스템
CN108108297A (zh) 自动化测试的方法和装置
US20120260265A1 (en) Extracting and processing data from heterogeneous computer applications
CN112580914A (zh) 汇集多源数据的企业级数据中台系统的实现方法及装置
EP3444741A1 (en) Generating rules to detect security vulnerabilities based on vulnerability primitives with entry point finder
CN101675415A (zh) 程序模式分析装置、模式出现状况信息产生方法、模式信息生成装置及程序
CN116383193A (zh) 一种数据管理方法、装置、电子设备和存储介质
KR101433139B1 (ko) 프로세스 분석을 위한 데이터 전처리 시스템
US20120291018A1 (en) Method and apparatus for managing evaluation of computer program code
CN111061733A (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
EP3444738A1 (en) Entry point finder
US20140250124A1 (en) Data editing device and data editing method
KR100850550B1 (ko) 국제 항공안전 규정관리 시스템
CN113919761A (zh) 一种诉讼案件管理方法、系统及装置
Verbeek et al. XES tools
US10572669B2 (en) Checking for unnecessary privileges with entry point finder
Esposito et al. MANA: Identifying and mining unstructured business processes
US10719609B2 (en) Automatic impact detection after patch implementation with entry point finder
CN111352824A (zh) 测试方法、装置及计算机设备
US11995076B2 (en) System, computing platform and method of integrating data from a plurality of data sources

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170710

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180712

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190812

Year of fee payment: 6