KR101433139B1 - Data Preprocessing System For Process Analysis - Google Patents

Data Preprocessing System For Process Analysis Download PDF

Info

Publication number
KR101433139B1
KR101433139B1 KR1020120124201A KR20120124201A KR101433139B1 KR 101433139 B1 KR101433139 B1 KR 101433139B1 KR 1020120124201 A KR1020120124201 A KR 1020120124201A KR 20120124201 A KR20120124201 A KR 20120124201A KR 101433139 B1 KR101433139 B1 KR 101433139B1
Authority
KR
South Korea
Prior art keywords
data
sql
definition
event
module
Prior art date
Application number
KR1020120124201A
Other languages
Korean (ko)
Other versions
KR20140057886A (en
Inventor
설성욱
김정아
김민구
이훈
Original Assignee
(주)토탈소프트뱅크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)토탈소프트뱅크 filed Critical (주)토탈소프트뱅크
Priority to KR1020120124201A priority Critical patent/KR101433139B1/en
Publication of KR20140057886A publication Critical patent/KR20140057886A/en
Application granted granted Critical
Publication of KR101433139B1 publication Critical patent/KR101433139B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 프로세스 분석을 위한 데이터 전처리 시스템은 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부를 포함하는 정의 모듈; 상기 정의 모듈에 기록된 정보를 이용하여 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈; 및 상기 데이터 추출 모듈로부터 데이터를 수신하여 프로세스 분석을 위한 표준 형식의 파일로 변환하는 표준 변환 모듈을 포함하여 이루어지는 것을 특징으로 한다.A data preprocessing system for analyzing a process according to the present invention includes: a definition module including a workflow definition unit for defining data to be extracted and an SQL definition unit for defining how to query the data in a database; A data extraction module for extracting data from a database using information recorded in the definition module; And a standard conversion module for receiving data from the data extraction module and converting the data into a standard format file for process analysis.

Description

프로세스 분석을 위한 데이터 전처리 시스템 {Data Preprocessing System For Process Analysis}[0001] The present invention relates to a data preprocessing system for process analysis,

본 발명은 데이터 처리 시스템에 관한 것이다. 보다 구체적으로 데이터베이스로부터 데이터를 추출하여 프로세스 분석을 위한 표준 형식으로 제공하는 데이터 전처리 시스템에 관한 것이다.
The present invention relates to a data processing system. More specifically, to a data preprocessing system that extracts data from a database and provides the data in a standard format for process analysis.

세계화로 인해 국가 간 교역량이 증가함에 따라 컨테이너선을 이용한 해상 운송은 국제 무역에서 큰 비중을 차지하고 있으며, 삼면이 바다로 둘러싸여 있는 우리나라의 경우에도 국제운송의 대부분을 해상운송이 점유하고 있다.As international trade increases due to globalization, marine transportation using container ships takes up a large part in international trade. In Korea, where three sides are surrounded by sea, most of the international transportation is occupied by maritime transportation.

현재 우리나라를 비롯한 많은 국가들은 해상 운송의 거점 역할을 하는 항만의 효율성을 높이기 위한 여러 가지 자동화 컨테이너 터미널 시스템을 개발하고 있다.Currently, many countries including Korea are developing various automated container terminal systems to enhance the efficiency of ports that serve as a base for marine transportation.

터미널 운영시스템(TOS: Terminal Operation System)은 선사, 운송사, 항구로 들어오는 선박으로부터 컨테이너에 대한 정보를 받고, 모든 컨테이너가 정확한 위치로 가장 효과적인 방법으로 이동될 수 있도록 터미널 내 컨테이너의 흐름을 관리하는 시스템으로서, 컨테이너 터미널의 자동화를 위한 필수적인 요소이다.The Terminal Operation System (TOS) receives information about containers from shipping companies, shipping companies, ships entering the port, and manages the flow of containers in the terminal so that all containers can be moved in the most efficient way to the correct location. System, which is an essential element for automation of container terminals.

TOS는 컨테이너의 흐름 관리를 위한 각종 정보 및 컨테이너에 관한 각종 이벤트 정보를 데이터베이스에 저장하고 있으므로 TOS에 기록된 이벤트 로그를 프로세스 마이닝 프로그램을 사용하여 분석하면 현재 이루어지고 있는 컨테이너 관리 프로세스를 파악할 수 있으며, 파악된 프로세스를 통해 현재 시스템의 문제점을 발견하고 문제점을 개선할 수 있는 새로운 프로세스를 설계할 수 있다.Because TOS stores various kinds of information for managing the container flow and various event information about the container in the database, analyzing the event log recorded in the TOS using the process mining program can grasp the current container management process, Through the identified process, a new process can be designed to detect problems in the current system and to remedy the problems.

그러나 TOS에 기록된 이벤트 로그를 프로세스 마이닝 프로그램이 요구하는 MXML(Mining XML) 형식으로 변환하기 위해서는 해당 데이터베이스의 저장 방식을 모두 파악하고 있는 전문가가 필요하며, 그 추출 방식 또한 매우 번거롭고, 데이터 추출시마다 데이터 추출을 위한 전과정을 다시 수행해야하는 등의 여러 가지 문제점이 있다.
However, in order to convert the event log recorded in the TOS into the MXML (mining XML) format required by the process mining program, a specialist who understands all the storage methods of the database is required, and the extraction method is also very cumbersome. There is a problem in that the entire process for extraction must be performed again.

상기와 같은 문제점을 해결하기 위한 본 발명의 목적은 데이터베이스로부터 프로세스 마이닝을 위해 사용될 데이터를 추출하기 위한 데이터 전처리 시스템을 제공하는 것이다.An object of the present invention is to provide a data preprocessing system for extracting data to be used for process mining from a database.

본 발명의 다른 목적은 워크플로우 정의부 및 SQL 정의부를 구비함으로써 TOS 데이터베이스 저장방식에 대한 전문적 지식이 없는 사용자도 데이터베이스로부터 프로세스 마이닝을 위해 사용될 데이터를 추출할 수 있게 하기 위한 데이터 전처리 시스템을 제공하는 것이다.Another object of the present invention is to provide a data preprocessing system for extracting data to be used for process mining from a database by a user having no expert knowledge on the TOS database storing method by having a workflow defining unit and an SQL defining unit .

본 발명의 또 다른 목적은 워크플로우 정의부 및 SQL 정의부를 구비함으로써 SQL문의 자동 재사용이 가능한 데이터 전처리 시스템을 제공하는 것이다.It is still another object of the present invention to provide a data preprocessing system capable of automatically reusing an SQL statement by having a workflow definition unit and an SQL definition unit.

본 발명의 또 다른 목적은 데이터 추출 모듈 및 표준 변환 모듈을 구비함으로써 중간 단계 파일을 생성할 필요 없이 데이터베이스로부터 직접 프로세스 분석을 위한 표준 형식의 파일을 추출할 수 있는 데이터 전처리 시스템을 제공하는 것이다.Yet another object of the present invention is to provide a data preprocessing system capable of extracting a standard format file for process analysis directly from a database without having to generate an intermediate file by providing a data extraction module and a standard conversion module.

본 발명의 또 다른 목적은 정의 작성 모듈을 구비함으로써 워크플로우 정의부 및 SQL 정의부의 작성/수정/삭제, 워크플로우 정의부 스킴에 대응하는 SQL문의 확인/변경, 특정 스킴의 선택/배제를 사용자에게 제공할 수 있는 데이터 전처리 시스템을 제공하는 것이다.
It is still another object of the present invention to provide a system and method for creating / modifying / deleting a workflow definition part and an SQL definition part, checking / changing an SQL statement corresponding to a workflow definition part scheme, To provide a data preprocessing system that can provide the data.

상기의 목적을 달성하기 위해 본 발명의 일 실시예에 따른 프로세스 분석을 위한 데이터 전처리 시스템은 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부를 포함하는 정의 모듈; 상기 정의 모듈에 기록된 정보를 이용하여 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈; 및 상기 데이터 추출 모듈로부터 데이터를 수신하여 프로세스 분석을 위한 표준 형식의 파일로 변환하는 표준 변환 모듈을 포함하여 이루어지는 것을 특징으로 한다.In order to accomplish the above object, a data preprocessing system for analyzing a process according to an embodiment of the present invention includes a workflow definition unit for defining data to be extracted and an SQL definition unit for defining how to query the data in a database Definition module; A data extraction module for extracting data from a database using information recorded in the definition module; And a standard conversion module for receiving data from the data extraction module and converting the data into a standard format file for process analysis.

워크플로우 정의는 프로세스와 관련된 대상을 조회하기 위한 스킴 및 대상과 관련된 이벤트를 조회하기 위한 스킴을 포함하고 있으며, 각 스킴에는 각 스킴에 대응하는 SQL문을 상기 SQL정의부로부터 찾기 위한 식별자(ID)가 포함되어 있다.The workflow definition includes a scheme for inquiring an object related to a process and a scheme for inquiring an event related to a target. Each scheme includes an identifier (ID) for searching an SQL statement corresponding to each scheme from the SQL definition unit, .

이벤트를 조회하기 위한 스킴에는 대상을 조회하는 스킴과 달리 해당 이벤트가 어떤 행위를 위한 것인지를 나타내는 워크플로우 모델 엘리먼트(Workflow Model Element)와 이벤트 타입(Event Type) 정보가 추가적으로 요구된다.Unlike schemes for querying an object, schemes for querying an event additionally require information of a workflow model element and an event type (Event Type) indicating which action the event is for.

대상을 조회하기 SQL문은 대상의 아이디를 조회하기 위한 변수를 포함하며, 이벤트를 조회하기 위한 SQL문은 관련된 대상의 아이디 및 이벤트 발생 시간을 조회하기 위한 변수를 포함한다.The SQL statement includes a variable for querying the ID of the target. The SQL statement for querying the event includes a variable for inquiring the ID of the related object and the time at which the event occurred.

각 SQL문은 데이터 조회 시간 범위를 조건문에 포함하고 있으며, 이 조회 시간 범위는 사용자가 원하는 데이터 조회 시간 범위를 입력하였을 때 모든 SQL문에 동일하게 적용된다.Each SQL statement contains a data query time span in the conditional statement, and the query time span is the same for all SQL statements when the user enters the desired data query time span.

본 발명의 다른 실시예에 따른 데이터 전처리 시스템은 워크플로우 정의부 또는 SQL 정의부에 저장된 데이터를 사용자가 작성, 수정, 삭제할 수 있는 사용자 인터페이스를 제공하는 정의 작성 모듈을 더 포함할 수 있다.The data preprocessing system according to another embodiment of the present invention may further include a definition creation module that provides a user interface that allows the user to create, modify, and delete data stored in the workflow definition unit or the SQL definition unit.

사용자 인터페이스는 해당 스킴에 대응하는 SQL 정의 표시, 수정, 테스트 기능을 제공할 수 있으며, 데이터 추출시 특정 스킴을 적용하거나 배제하도록 선택할 수 있는 기능을 제공할 수도 있다.
The user interface may provide SQL definition display, modification, and testing functions corresponding to the schemes, and may also provide a function to select or exclude specific schemes when extracting data.

본 발명은 워크플로우 정의부 및 SQL 정의부를 구비함으로써 데이터베이스 저장방식에 대한 전문적 지식이 없는 사용자도 데이터베이스로부터 프로세스 마이닝을 위해 사용될 데이터를 손쉽게 추출할 수 있으며, 한번 작성된 SQL문이 자동 재사용이 가능한 데이터 전처리 시스템을 제공하는 효과를 갖는다.The present invention can easily extract data to be used for process mining from a database even if a user who does not have expert knowledge on the database storing method is provided with the workflow definition unit and the SQL definition unit, System.

또한 데이터 추출 모듈 및 표준 변환 모듈을 구비함으로써 중간 단계 파일을 생성할 필요 없이 데이터베이스로부터 직접 프로세스 분석을 위한 표준 형식의 파일을 추출할 수 있으며, 정의 작성 모듈을 구비함으로써 워크플로우 정의부 및 SQL 정의부의 작성/수정/삭제, 워크플로우 정의부 스킴에 대응하는 SQL문의 확인/변경, 특정 스킴의 선택/배제를 사용자에게 제공할 수 있는 데이터 전처리 시스템을 제공하는 효과를 갖는다.
In addition, by providing the data extraction module and the standard conversion module, it is possible to extract a standard format file for process analysis directly from the database without generating an intermediate level file. By providing the definition creation module, the workflow definition part and the SQL definition part There is an effect of providing a data preprocessing system capable of creating / modifying / deleting data, confirming / changing an SQL statement corresponding to a workflow definition subscheme, and selecting / excluding a specific scheme.

제1도는 프로세스 마이닝 프로그램의 표준 입력 파일 형식인 MXML 구조를 보여주는 도면이다.
제2도는 MXML에서 허용하는 모든 이벤트 종류(Event Type) 및 연결관계를 예시적으로 보여주는 도면이다.
제3도는 본 발명의 일 실시예에 따른 데이터 전처리 시스템을 보여주는 블럭도이다.
제4도는 본 발명의 일 실시예에 따른 데이터 전처리 시스템에 사용되는 워크플로우 정의를 예시적으로 보여주는 도면이다.
제5도 및 제6도는 본 발명의 일 실시예에 따른 데이터 전처리 시스템에 사용되는 SQL문을 예시적으로 보여주는 도면이다.
제7도는 본 발명의 다른 실시예에 따른 데이터 전처리 시스템을 보여주는 블럭도이다.
제8도는 본 발명의 다른 실시예에 따른 데이터 전처리 시스템에 사용되는 예시적인 사용자 인터페이스를 보여주는 도면이다.
FIG. 1 is a diagram showing an MXML structure that is a standard input file format of a process mining program.
FIG. 2 is an exemplary diagram showing all event types (event types) and connection relationships allowed in MXML.
FIG. 3 is a block diagram illustrating a data preprocessing system according to an embodiment of the present invention.
FIG. 4 is an exemplary diagram illustrating a workflow definition used in a data preprocessing system according to an embodiment of the present invention.
FIG. 5 and FIG. 6 illustrate SQL statements used in a data preprocessing system according to an embodiment of the present invention.
7 is a block diagram illustrating a data preprocessing system according to another embodiment of the present invention.
FIG. 8 is a diagram illustrating an exemplary user interface used in a data preprocessing system according to another embodiment of the present invention.

본 발명은 클릭 한 번만으로 데이터베이스로부터 데이터를 추출하여 프로세스 분석을 위한 표준 형식의 데이터를 생성할 수 있는 데이터 전처리 시스템에 관한 것이다.The present invention relates to a data preprocessing system capable of extracting data from a database with a single click and generating standard format data for process analysis.

프로세스 분석을 위한 표준 형식의 데이터란 데이터 마이닝 솔루션과 같이 프로세스를 분석할 수 있는 프로그램에서 사용될 수 있는 형식의 데이터로서 일반적으로 도 1에 도시된 바와 같은 MXML이 표준 형식이다.Data in a standard format for process analysis is data in a format that can be used in a program capable of analyzing a process, such as a data mining solution, and MXML is generally a standard format as shown in Fig.

이러한 MXML(Mining XML)의 구조를 살펴보면, 프로세스(Process) 아래에 여러 개의 프로세스 인스턴스(Process Instance) 데이터가 존재하고, 하나의 프로세스 인스턴스 아래에 여러 개의 오디트 트레일 엔트리(Audit Trail Entry) 데이터가 존재한다.In this MXML (Mining XML) structure, there are several process instances data under a process, and there are several pieces of audit trail entry data under one process instance. do.

프로세스 인스턴스는 대상(case)을 의미하는 것으로, 컨테이너 프로세스에서는 개별 컨테이너, 선박(vessel), 트럭 등이 프로세스 인스턴스에 해당될 수 있다.A process instance refers to a case. In a container process, an individual container, a vessel, a truck, and the like may correspond to a process instance.

오디트 트레일 엔트리는 이벤트(event)를 의미하는 것으로, 컨테이너 프로세스에서는 QC 양하 작업 생성, QC 양하 작업 완료 등이 오디트 트레일 엔트리에 해당될 수 있다.The audit trail entry refers to an event. In the container process, QC unloading job creation and QC unloading job completion may be included in the audit trail entry.

또한 오디트 트레일 엔트리 아래에는 워크플로우 모델 엘리먼트(WorkflowModelElement), 이벤트 타입(EventType), 타임스탬프(TimeStamp), 오리지네이터(Originator), 어트리뷰트(Attribute) 데이터가 존재한다.Below the Audit Trail entry are the Workflow Model Elements, Event Types, Time Stamps, Originators, and Attribute Data.

워크플로우 모델 엘리먼트는 프로세스 내에 존재하는 각각의 행위로서 이벤트 단위로 세분화가 가능하며, 컨테이너 프로세스에서는 QC 양하, YQ 양하장치, YQ 반출상차 등이 워크플로우 모델 엘리먼트에 해당될 수 있다.The workflow model element can be subdivided into individual actions that exist in the process and can be subdivided into event units. In the container process, QC drop, YQ dropout, YQ dropout, and the like may correspond to the workflow model element.

이벤트 타입은 워크플로우 모델 엘리먼트를 이벤트 단위로 세분화하였을 때 해당 이벤트가 워크플로우 모델 엘리먼트 내에서 어떤 이벤트에 해당하는지를 명시한다. 컨테이너 프로세스에서는 예를 들어 작업 생성(schedule), 작업 완료(complete) 등으로 이벤트 타입을 나타낼 수 있다.The event type specifies an event in the workflow model element when the workflow model element is subdivided into event units. Container processes can represent event types, for example, by job creation (schedule), completion (complete), and so on.

도 2에 도시된 바와 같이 MXML에서 정의할 수 있는 이벤트 타입간에는 연관 관계(paper: A Meta Model for Process Mining Data)가 존재한다. 도 2에서의 메인 플로우는 Schedule-assign-start-complete의 흐름을 가지며, 꼭 모든 흐름을 정의하지 않아도 프로세스 분석은 가능하다(예를 들어 모든 워크플로우 모델 엘리먼트를 complete 이벤트 한 종류만으로 정의할 수도 있음).As shown in FIG. 2, there is an association (paper: A Meta Model for Process Mining Data) between event types that can be defined in MXML. The main flow in FIG. 2 has a Schedule-assign-start-complete flow, and it is possible to analyze the process without defining all the flows (for example, all workflow model elements can be defined by only one kind of complete event ).

타임 스탬프는 해당 이벤트가 발생한 시각이고, 오리지네이터는 해당 이벤트를 발생시킨 행위자이며, 어트리뷰트는 타임 스탬프와 오리지네이터를 제외한 모든 데이터 상에 존재하는 속성 정보이다. 어트리뷰트는 오디트 트레일 엔트리와 프로세스 인스턴스 양쪽 모두에 존재할 수 있으며, 분석 대상 객체 자체에 대한 속성은 프로세스 인스턴스의 어트리뷰트로, 행위에 대한 속성은 오디트 트레일의 어트리뷰트로 정의한다.The timestamp is the time when the event occurred, the originator is the actor that triggered the event, and the attribute is the attribute information that exists on all data except the time stamp and originator. Attributes can exist in both audit trail entries and process instances. Attributes for the object being analyzed are attributes of the process instance. Attributes for the behavior are attributes of the audit trail.

본 발명에 따른 프로세스 분석을 위한 데이터 전처리 시스템(100)은 워크플로우 정의와 SQL 정의가 기록된 정의 모듈(110), 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈(120), 및 추출된 데이터를 프로세스 분석을 위한 표준 형식으로 변환하는 표준 변환 모듈(130)을 포함하여 이루어져, 도 3에 도시된 바와 같이 데이터베이스로부터 필요한 데이터를 추출하여 프로세스 분석을 위한 표준 형식의 데이터를 생성한다.The data preprocessing system 100 for analyzing a process according to the present invention includes a definition module 110 in which a workflow definition and an SQL definition are recorded, a data extraction module 120 for extracting data from a database, And a standard conversion module 130 for converting the standard data into a standard format for generating a standard format for process analysis by extracting necessary data from the database as shown in FIG.

보다 상세히 설명하면, 본 발명에 따른 데이터 전처리 시스템(100)은 앞서 설명한 바와 같은 표준 형식의 데이터를 추출하기 위해 데이터베이스에 저장된 이벤트 로그로부터 필요한 데이터를 조회하여 추출해야 한다.In more detail, the data preprocessing system 100 according to the present invention needs to retrieve necessary data from an event log stored in a database in order to extract data in the standard format as described above.

이를 위해 본 발명에 따른 데이터 전처리 시스템의 정의 모듈(110)에는 어떤 데이터를 추출할지를 정의하는 워크플로우 정의부(111)와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부(112)가 포함되어 있다.To this end, the definition module 110 of the data preprocessing system according to the present invention includes a workflow definition unit 111 for defining what data to extract and an SQL definition unit 112 for defining how to query the data in the database have.

보다 상세히 설명하면, 워크플로우 정의에는 프로세스 분석을 위한 모든 대상과 각 대상과 관련된 이벤트들이 정의되어 있다. 이를 위해 대상인 프로세스 인스턴스를 조회하기 위한 프로세스 스킴(ProcessScheme)과 프로세스 스킴 아래에 각 이벤트인 오디트 트레일 엔트리를 조회하기 위한 1개 이상의 오디트 트레일 스킴(AuditTrailScheme)이 포함되어 있다.More specifically, the workflow definition defines all objects for process analysis and events associated with each object. To this end, a process scheme (ProcessScheme) for querying the target process instance and at least one Audit Trail Scheme for querying each event, an audit trail entry under the process scheme, is included.

또한 각 스킴에는 스킴과 관련된 SQL문을 찾기 위한 ID(SqlMapperID)가 포함되어 있으며, 각 ID에 대응하는 SQL문은 SQL 정의부(112)에 포함되어 있어 각 스킴과 관련된 데이터를 데이터 베이스에서 조회할 수 있다.In addition, each scheme includes an ID (SqlMapperID) for searching for an SQL statement related to the schema, and an SQL statement corresponding to each ID is included in the SQL definition unit 112, so that data related to each scheme can be retrieved from the database .

특히 본 발명에 따른 워크플로우 정의부에는 워크플로우 모델 엘리먼트(Work Model Element), 이벤트 타입, 타임스탬프, 오리지네이터, 어트리뷰트 등 오디트 트레일 엔트리에 포함되어 있어야 하는 데이터(도1 참조) 중 타임스탬프, 오리지네이터 등은 개별 레코드마다 다른 값을 갖는 데이터이지만 해당 이벤트가 프로세스 상의 어떤 이벤트에 해당하는지는 데이터베이스의 데이터에 존재하지 않고 정의를 통해 지정하는 것이라는 점에서 워크플로우 모델 엘리먼트(Work Model Element), 이벤트 타입은 워크플로우 정의의 스킴에 정의함으로써 개별 SQL마다 워크플로우 모델 엘리먼트와 이벤트 타입이 포함되어야 하는 불필요함을 제거한다. Particularly, in the workflow definition unit according to the present invention, a time stamp (see FIG. 1) among data (see FIG. 1) that should be included in an audit trail entry such as a work model element, an event type, a time stamp, an originator, , And the originator are data having different values for each individual record. However, the work model element (Work Model Element) is used in that the event corresponds to an event in the process, , The event type is defined in the workflow definition scheme, thereby eliminating the need to include the workflow model element and event type for each individual SQL.

이러한 워크플로우 정의와 SQL정의부에 포함되는 SQL문을 도 4 내지 도 6에 예시적으로 도시하였으며, 도면에 예시적으로 도시된 바와 같이 워크플로우 정의와 SQL정의는 xml형식으로 작성될 수 있다. 이러한 도면을 참고로 다시 한번 상세히 설명하면 다음과 같다.The SQL statements included in the workflow definition and the SQL definition section are illustrated in FIGS. 4 to 6 by way of example, and the workflow definition and the SQL definition can be written in the xml format as illustrated in the figure. Referring to these drawings, a detailed description will be given below.

도 4에는 반입부터 반출까지 프로세스에 의해 처리된 컨테이너들을 조회하기 위한 프로세스 스킴과 프로세스 스킴 아래에 컨테이너와 관련된 이벤트(반입 장치 작업 생성, 반입 장치 작업 완료)를 조회하기 위한 오디트 트레일 스킴이 예시적으로 도시되어 있다.FIG. 4 shows a process scheme for inquiring containers processed by the process from importing to exporting, and an audit trail scheme for inquiring an event related to the container (import device job creation, completion of the import device job) under the process scheme Respectively.

도 4의 프로세스 스킴에는 프로세스에 의해 처리된 컨테이너들을 데이터베이스에서 조회하기 위한 SQL문을 매칭시키기 위한 ID인 selectContainer가 포함되어 있으며, 이에 해당하는 도 5에 도시된 바와 같은 SQL문이 SQL정의부(112)에 포함되어 있다.The process scheme of FIG. 4 includes a selectContainer which is an ID for matching an SQL statement for querying the containers processed by the process in the database, and the corresponding SQL statement as shown in FIG. ).

또한 오디트 트레일 스킴에도 해당 이벤트를 조회하기 위한 SQL문을 매칭시키기 위한 ID가 포함되어 있으며, 이 중 selectCompleteGateIn에 해당하는 예시적인 SQL문이 도 6에 도시되어 있다.Also included in the audit trail scheme is an ID for matching an SQL statement for querying the event. An exemplary SQL statement corresponding to selectCompleteGateIn is shown in FIG.

또한 도 4에 도시된 바와 같이 오디트 트레일 스킴에는 워크플로우 모델 엘리먼트(Workflow Model Element)와 이벤트 타입(Event type)이 정의되어 있다.In addition, as shown in FIG. 4, a workflow model element and an event type are defined in the audit trail scheme.

이와 같이 워크플로우 모델 엘리먼트와 이벤트 타입이 워크플로우 정의 스킴 내에 포함되어 있음으로써 각각의 SQL문과 SQL문에 의해 조회된 데이터가 워크플로우 모델 엘리먼트(Workflow Model Element)와 이벤트 타입(Event type)에 대한 정보를 포함하고 있어야 하는 불필요함을 제거할 수 있다.Since the workflow model element and the event type are included in the workflow definition scheme, data inquired by each SQL statement and SQL statement is included in the workflow model element and information about the event type It is possible to eliminate the unnecessary necessity of including it.

컨테이너 데이터를 조회하기 위한 SQL정의를 나타내고 있는 도 5를 참고로 프로세스 인스턴스를 조회하는 SQL정의에 대해 살펴보면, 대상인 프로세스 인스턴스를 조회하기 위한 SQL문에는 반드시 대상의 아이디를 조회하기 위한 변수(CASE_ID)가 반드시 포함되어 있어야 한다. 그리고 SQL문의 조건문에는 데이터 조회 시간 범위가 포함되어 있어야 한다. Referring to FIG. 5 showing a SQL definition for retrieving container data, a SQL definition for querying a process instance will be described. In an SQL statement for querying a target process instance, a variable (CASE_ID) It must be included. The conditional statement of the SQL statement must include the data query time range.

이러한 정보가 포함되어 있어야 하는 이유는 해당 SQL문을 사용하여 해당 데이터 조회 시간 범위 내에 있는 대상(도 6에서는 컨테이너)의 데이터를 조회할 수 있으며, 케이스 아이디를 통해 조회된 데이터가 어느 대상에 대한 데이터인지를 구분할 수 있기 때문이다.The reason why such information should be included is that the data of the object (container in FIG. 6) within the data inquiry time range can be retrieved by using the corresponding SQL statement, It is because it can distinguish.

컨테이너 반입 장치 완료 이벤트를 조회하기 위한 SQL정의를 나타내고 있는 도 6을 참고로 오디트 트레일 엔트리를 조회하는 SQL정의에 대해 살펴보면, 이벤트인 프로세스 인스턴스를 조회하기 위한 SQL문에는 반드시 대상의 아이디를 조회하기 위한 변수와 이벤트 발생 시간(타임스탬프)을 조회하기 위한 변수가 반드시 포함되어 있어야 하며, SQL문의 조건문에 데이터 조회 시간 범위가 포함되어 있어야 한다.Referring to FIG. 6 showing the SQL definition for retrieving the container import device completion event, the SQL definition for querying the audit trail entry will be described. In the SQL statement for querying the event process instance, Variable and event occurrence time (time stamp) must be included, and the SQL statement condition must include the data query time range.

이러한 정보가 포함되어 있어야하는 이유는 해당 SQL문을 사용하여 해당 데이터 조회 시간 범위 내에 있는 이벤트의 데이터를 조회할 수 있으며, 케이스 아이디를 통해 조회된 데이터가 어느 대상에 대한 데이터인지, 타임 스탬프 정보를 통해 몇 시에 발생하였는지를 구분할 수 있기 때문이다.The reason why this information should be included is that it is possible to inquire data of an event within the data inquiry time range by using the corresponding SQL statement, It is because we can distinguish what occurred at what time.

데이터 조회 시간 범위는 사용자가 데이터를 조회하고자 하는 시간 범위를 입력할 때 모든 SQL문에 동일하게 적용되어 해당 조회 시간 범위 내의 대상 및 이벤트가 조회될 수 있다.The data retrieval time range is applied to all SQL statements when a user enters a time range for retrieving data, so that objects and events within the retrieval time range can be retrieved.

또한 도 6에는 타임 스탬프가 Timestamp가 아닌 ATE_TIME으로 기재되어 있다. 이는 특정 데이터베이스 관리 시스템(DBMS)의 SQL문에서 Timestamp가 특별한 의미로 이용되는 단어이므로 이를 대신하여 ATE_TIME이라는 변수명을 적용한 것이며, 앞서 설명한 CASE_ID라는 변수명 역시 다른 DBMS에서 문제가 발생할 경우 향후 다른 변수명으로 대체될 수 있다.Also, in FIG. 6, the time stamp is described as ATE_TIME, not Timestamp. This is because the Timestamp is used as a special meaning in the SQL statement of a specific database management system (DBMS). Therefore, the variable name of ATE_TIME is applied instead of this, and the variable name of CASE_ID described above is also changed . ≪ / RTI >

본 발명의 일 실시예에 따른 데이터 전처리 시스템은 사용자가 원하는 조회 시간 범위를 입력하기만 하면 앞서 설명한 정의 모듈(110)의 데이터들을 이용하여 데이터 추출 모듈(120)이 연결된 데이터베이스(200)로부터 데이터를 추출한다.The data preprocessing system according to an embodiment of the present invention may use the data of the definition module 110 described above to input data from the database 200 connected to the data extraction module 120 .

이를 위해 데이터 추출 모듈은 데이터베이스 연결 정보를 포함하고 있어야 하며, 정의 모듈의 SQL문을 사용하여 데이터베이스로부터 데이터를 추출할 수 있어야 한다. 이러한 데이터 추출 모듈은 마이바티스 플러그인(Mybatis Plug_In)을 활용하여 구현할 수 있다.To do this, the data extraction module must contain the database connection information and be able to extract data from the database using the SQL statements of the definition module. This data extraction module can be implemented using MyBatis plugin (Mybatis Plug_In).

본 발명의 일 실시예에 따른 데이터 전처리 시스템에서 표준 변환 모듈(130)로서 프로엠 임포트(ProM Import)가 사용될 수 있다. 해당 프로그램은 MXML 형식을 개발한 아인트호벤 공과대학에서 개발한 오픈소스 프로그램으로 데이터베이스에서 SQL 조회를 통해 얻은 결과를 txt, csv 등의 문자열 파일로 출력한 뒤 이 파일을 프로엠 임포트의 입력으로 제공하여 MXML 파일을 얻을 수 있다.In the data preprocessing system according to an embodiment of the present invention, ProM Import may be used as the standard conversion module 130. [ The program is an open source program developed by Eindhoven University of Technology which developed MXML format. It outputs the results obtained from SQL query in database to string file such as txt, csv, and provides this file as input of pro- You can get the file.

그러나 본 발명의 일 실시예에 따른 데이터 전처리 시스템은 위와 같은 데이터 추출 모듈(120)을 표준 변환 모듈(130) 앞에 플러그인 형태로 연결함으로써 txt, csv 등과 같은 중간 단계의 파일 생성 필요 없이 프로세스 분석을 위한 표준 형식의 MXML 파일을 바로 얻을 수 있다. However, in the data preprocessing system according to an embodiment of the present invention, the data extraction module 120 is connected in the form of a plug-in before the standard conversion module 130, so that it is possible to perform the process analysis without the need to generate intermediate files such as txt, csv, You can get MXML files in standard format right away.

지금까지 본 발명의 일 실시예에 따른 데이터 전처리 시스템을 도면을 참고로 설명하였다. 이러한 데이터 전처리 시스템을 사용할 경우, 전문가가 미리 워크플로우 정의 및 SQL 정의를 한 번만 작성해 두면 해당 데이터베이스의 구조를 파악하지 못하는 비전문가라 하더라도 데이터를 조회하고자 하는 시간 범위만 입력하면 프로세스 분석을 위한 데이터를 표준 형식으로 추출해 낼 수 있다.The data preprocessing system according to an embodiment of the present invention has been described with reference to the drawings. If you use this data preprocessing system, even if you are a non-expert who can not understand the structure of the database once the workflow definition and SQL definition are written by experts in advance, you can input the data for process analysis into standard Format.

또한 본 발명의 다른 실시예에 따른 데이터 전처리 시스템은 도 7에 도시된 바와 같이 정의 모듈에 저장된 정보를 사용자가 수정할 수 있도록 사용자 인터페이스(UI)를 제공하는 정의 작성 모듈(140)을 더 포함할 수 있다.The data preprocessing system according to another embodiment of the present invention may further include a definition creation module 140 for providing a user interface (UI) so that the user can modify the information stored in the definition module as shown in FIG. 7 have.

정의 작성 모듈(140)은 정의 모듈(110)에 연결되어 정의 모듈에 저장된 워크플로우와 SQL문을 사용자가 작성/수정/삭제할 수 있도록 하는 기능을 제공한다.The definition creation module 140 provides a function to allow a user to create / modify / delete a workflow and an SQL statement stored in the definition module, which is connected to the definition module 110.

본 발명의 정의 작성 모듈은 사용자가 워크플로우의 프로세스 스킴, 오디트 트레일 스킴을 작성/수정/삭제할 수 있도록 기능을 제공할 뿐만 아니라 해당 스킴에 대응하는 SQL문을 표시해 주고 이를 테스트할 수 있도록 하여 잘못된 경우 수정할 수 있도록 하는 기능을 제공한다.The definition module of the present invention not only provides a function that allows a user to create / modify / delete a process schedule and an audit trail scheme of a workflow, displays an SQL statement corresponding to the scheme, It provides the function to be able to modify it in case.

또한 데이터 추출시 특정 스킴을 적용하거나 배제하도록 선택할 수 있는 기능을 제공하여 특정 대상에 대한 데이터 또는 특정 이벤트에 관련된 데이터만을 추출하여 이와 관련된 프로세스만을 분석할 수 있도록 한다.Also, it provides a function to select or exclude a specific scheme when extracting data, so that only data related to a specific object or a specific event can be extracted, and only relevant processes can be analyzed.

위와 같은 정의 작성 모듈(140)에 의해 제공되는 사용자 인터페이스의 예시적인 형태가 도 8에 도시되어 있으며, 사용자는 이러한 사용자 인터페이스를 사용하여 분석 대상에 대한 스킴 (Process Scheme) 및 이벤트에 대한 스킴 (Audit Trail Scheme)의 작성, 스킴 추가/수정, 삭제, 선택한 스킴에 대한 각종 정보 표시(SQL문 포함), 수정, 테스트, 적용 여부 선택 기능 등을 사용할 수 있다.An exemplary form of the user interface provided by the above definition creation module 140 is shown in FIG. 8, and the user can use this user interface to create a process scheme for the analysis object and a scheme for the event Trail Scheme), adding / modifying / deleting schemes, displaying various information about selected schemes (including SQL statements), modifying, testing, and applying them.

비록 지금까지 구체적인 실시예를 참고로 본 발명을 상세히 설명하였으나 본 발명은 이러한 실시예에 한정되는 것이 아니며, 본 발명의 요지를 벗어나지 않는 범위 내에서 당업자에 의해 수정 및 변형되어 실시될 수 있으며, 그러한 수정 및 변형 역시 이하의 특허청구범위에 속하는 것으로 보아야 한다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but may be modified or altered by those skilled in the art without departing from the gist of the invention. Modifications and variations should also be regarded as falling within the scope of the following claims.

100: 데이터 전처리 시스템 110: 정의 모듈
111: 워크플로우 정의부 112: SQL 정의부
120: 데이터 추출 모듈 130: 표준 변환 모듈
140: 정의 작성 모듈 200: 데이터베이스
100: Data preprocessing system 110: Definition module
111: workflow definition unit 112: SQL definition unit
120: data extraction module 130: standard conversion module
140: definition creation module 200: database

Claims (9)

어떤 데이터를 추출할지를 정의하는 워크플로우 정의부와 해당 데이터를 데이터베이스에서 어떻게 조회할지를 정의하는 SQL 정의부를 포함하는 정의 모듈;
상기 정의 모듈에 기록된 정보를 이용하여 데이터베이스로부터 데이터를 추출하는 데이터 추출 모듈; 및
상기 데이터 추출 모듈로부터 데이터를 수신하여 프로세스 분석을 위한 표준 형식의 파일로 변환하는 표준 변환 모듈;
을 포함하여 이루어지고,
상기 워크플로우 정의부는 프로세스와 관련된 대상을 조회하기 위한 스킴 및 대상과 관련된 이벤트를 조회하기 위한 스킴을 포함하고 있으며, 각 스킴에는 각 스킴에 대응하는 SQL문을 상기 SQL정의부로부터 찾기 위한 식별자(ID)가 포함되어 있으며, 상기 이벤트를 조회하기 위한 스킴에 워크플로우 모델 요소와 이벤트 타입이 정의되어 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
A definition module including a workflow definition unit that defines what data to extract and an SQL definition unit that defines how to query the data in the database;
A data extraction module for extracting data from a database using information recorded in the definition module; And
A standard conversion module that receives data from the data extraction module and converts the data into a standard format file for process analysis;
, ≪ / RTI >
The workflow definition unit includes a schema for querying an object related to the process and a schema for querying an event related to the object. Each scheme includes an identifier (ID) for searching an SQL statement corresponding to each scheme from the SQL definition unit, ), And a workflow model element and an event type are defined in a scheme for inquiring the event.
삭제delete 삭제delete 제1항에 있어서,
대상을 조회하기 SQL문은 대상의 아이디를 조회하기 위한 변수를 포함하며, 데이터 조회 시간 범위를 조건문에 포함하고 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
The method according to claim 1,
Wherein the SQL statement includes a variable for querying the ID of the target and includes a data query time range in the conditional statement.
제1항에 있어서,
이벤트를 조회하기 위한 SQL문은 관련된 대상의 아이디 및 이벤트 발생 시간을 조회하기 위한 변수를 포함하며, 데이터 조회 시간 범위를 조건문에 포함하고 있는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
The method according to claim 1,
Wherein the SQL statement for querying an event includes a variable for inquiring an ID of a related object and an event occurrence time, and includes a data query time range in a conditional statement.
제4항 또는 제5항에 있어서,
상기 데이터 조회 시간 범위는 사용자가 원하는 데이터 조회 시간 범위가 입력되면 모든 SQL문에 동일하게 적용되는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
The method according to claim 4 or 5,
Wherein the data inquiry time range is the same for all SQL statements when a desired data inquiry time range is input.
제1항에 있어서,
상기 워크플로우 정의부 또는 SQL 정의부에 저장된 데이터를 사용자가 작성, 수정, 삭제할 수 있는 사용자 인터페이스를 제공하는 정의 작성 모듈을 더 포함하는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
The method according to claim 1,
Further comprising a definition creation module for providing a user interface that allows a user to create, modify, and delete data stored in the workflow definition unit or the SQL definition unit.
제7항에 있어서,
상기 사용자 인터페이스는 해당 스킴에 대응하는 SQL 정의 표시, 수정, 테스트 기능을 제공하는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
8. The method of claim 7,
Wherein the user interface provides SQL definition display, modification and testing functions corresponding to the schemes.
제7항에 있어서,
상기 사용자 인터페이스는 데이터 추출시 특정 스킴을 적용하거나 배제하도록 선택할 수 있는 기능을 제공하는 것을 특징으로 하는 프로세스 분석을 위한 데이터 전처리 시스템.
8. The method of claim 7,
Wherein the user interface provides a function to select or exclude a specific scheme in extracting data.
KR1020120124201A 2012-11-05 2012-11-05 Data Preprocessing System For Process Analysis KR101433139B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120124201A KR101433139B1 (en) 2012-11-05 2012-11-05 Data Preprocessing System For Process Analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120124201A KR101433139B1 (en) 2012-11-05 2012-11-05 Data Preprocessing System For Process Analysis

Publications (2)

Publication Number Publication Date
KR20140057886A KR20140057886A (en) 2014-05-14
KR101433139B1 true KR101433139B1 (en) 2014-08-26

Family

ID=50888407

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120124201A KR101433139B1 (en) 2012-11-05 2012-11-05 Data Preprocessing System For Process Analysis

Country Status (1)

Country Link
KR (1) KR101433139B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101687239B1 (en) * 2016-05-06 2016-12-16 주식회사 위즈온텍 System and Method for Big Data Stream Modeling
KR20180065416A (en) * 2016-12-07 2018-06-18 (주)에스피파트너스 Interface apparatus for modeling big data analysis process

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030032593A (en) * 2001-10-18 2003-04-26 주식회사 핸디소프트 System and Method for Workflow Mining
KR20090047091A (en) * 2007-11-07 2009-05-12 주식회사 위즈웨어 System for application business managementing and method therefor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030032593A (en) * 2001-10-18 2003-04-26 주식회사 핸디소프트 System and Method for Workflow Mining
KR20090047091A (en) * 2007-11-07 2009-05-12 주식회사 위즈웨어 System for application business managementing and method therefor

Also Published As

Publication number Publication date
KR20140057886A (en) 2014-05-14

Similar Documents

Publication Publication Date Title
Li et al. Extracting object-centric event logs to support process mining on databases
KR102143889B1 (en) System for metadata management
US7778979B2 (en) Method and apparatus for compressing log record information
Ingvaldsen et al. Preprocessing support for large scale process mining of SAP transactions
CN108052618B (en) Data management method and device
US8463811B2 (en) Automated correlation discovery for semi-structured processes
US20120260265A1 (en) Extracting and processing data from heterogeneous computer applications
US8688626B2 (en) Software tool for generating technical business data requirements
CN106547918B (en) Statistical data integration method and system
CN103077192B (en) A kind of data processing method and system thereof
EP3444741A1 (en) Generating rules to detect security vulnerabilities based on vulnerability primitives with entry point finder
CA2997071A1 (en) Metadata-driven data management platform
CN105427545A (en) Drools-based equipment warning management method and device
KR101433139B1 (en) Data Preprocessing System For Process Analysis
CN111061733A (en) Data processing method and device, electronic equipment and computer readable storage medium
EP3444738A1 (en) Entry point finder
US10296496B2 (en) Data editing device and data editing method
US20140201193A1 (en) Intellectual property asset information retrieval system
KR100850550B1 (en) SARPs Management and Implementation System
CN113919761A (en) Litigation case management method, system and device
Verbeek et al. XES tools
Esposito et al. MANA: Identifying and mining unstructured business processes
US10572669B2 (en) Checking for unnecessary privileges with entry point finder
US10719609B2 (en) Automatic impact detection after patch implementation with entry point finder
CN111352824A (en) Test method and device and computer equipment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170710

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180712

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190812

Year of fee payment: 6