KR20180014543A - Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer - Google Patents

Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer Download PDF

Info

Publication number
KR20180014543A
KR20180014543A KR1020160098023A KR20160098023A KR20180014543A KR 20180014543 A KR20180014543 A KR 20180014543A KR 1020160098023 A KR1020160098023 A KR 1020160098023A KR 20160098023 A KR20160098023 A KR 20160098023A KR 20180014543 A KR20180014543 A KR 20180014543A
Authority
KR
South Korea
Prior art keywords
data
actor
performer
user
attribute
Prior art date
Application number
KR1020160098023A
Other languages
Korean (ko)
Inventor
이천희
강동오
배장원
백의현
정준영
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020160098023A priority Critical patent/KR20180014543A/en
Publication of KR20180014543A publication Critical patent/KR20180014543A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a method for analyzing multidimensional data in a simulation based on a performer, which includes the steps of: generating the multidimensional data by extracting an attribute value from each performer according to the performance of the simulation based on the performer; selecting data for each attribute from a user; dividing items which are numbers of the selected data into a preset section to be converted into a nominal value or grouping the data which is the nominal value; retrieving frequent patterns among the converted data by performing frequent pattern mining; selecting an interest core pattern from the user among a plurality of frequency patterns; and visualizing the data by using the selected core patterns. Accordingly, the users can effectively and easily analyze the multidimensional data generated in the simulation based on the performer.

Description

행위자 기반 시뮬레이션에서의 다차원 데이터 분석 장치 및 방법{Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer}TECHNICAL FIELD The present invention relates to an apparatus and method for analyzing multi-dimensional data in an actor-based simulation,

본 발명은 행위자 기반 시뮬레이션 결과 데이터 제공 기술에 관한 것으로, 특히 행위자 기반 시뮬레이션 결과 발생하는 행위자들의 모든 속성값인 다차원 데이터를 시각화하는 장치 및 방법에 관한 것이다.The present invention relates to an actor-based simulation result data providing technology, and more particularly, to an apparatus and a method for visualizing multidimensional data, which are all attribute values of actors generated as a result of actor-based simulation.

행위자 기반 시뮬레이션에서는 시뮬레이션 수행 후 각 행위자들의 속성값들을 집계하여 원하는 시뮬레이션 결과를 출력한다. 이때 경우에 따라 미리 정의된 집계 형태만으로는 결과 분석이 어렵기 때문에 행위자들의 전체 속성값인 다차원 데이터를 다시 분석해야 할 필요가 있다. 이러한 다차원 데이터를 효과적으로 분석하기 위해 다양한 종류의 시각화 방식이 제안되었다. In the actor-based simulation, attribute values of each actor are summed up after simulation and the desired simulation result is output. In this case, because it is difficult to analyze the results by only the predefined aggregation type, it is necessary to analyze the multidimensional data, which is the total attribute value of the actors. To effectively analyze these multidimensional data, various kinds of visualization methods have been proposed.

그 중의 하나의 데이터 시각화 방법에서는 가상의 3차원 차트 공간 인터페이스를 표시하고, 사용자에 의한 입력 수단을 통해 3차원 차트 공간 인터페이스상의 드래그앤 드랍 동작에 따른 스케치패턴을 인식한 후 사용자에 의해 설정된 분류 대상 데이터에 대한 상기 스케치 패턴에 대응하는 차트를 생성하여 3차원 차트 공간 인터페이스를 통해 표시할 수 있다. 하지만 차원수가 증가함에 따라 시각화를 통한 분석에 많은 어려움이 있다. One of the data visualization methods displays a virtual three-dimensional chart space interface, recognizes a sketch pattern according to a drag and drop operation on a three-dimensional chart space interface through input means by a user, A chart corresponding to the sketch pattern for the data can be generated and displayed through the three-dimensional chart space interface. However, as the number of dimensions increases, it is difficult to analyze them through visualization.

본 발명은 행위자 기반 시뮬레이션 수행 후 발생하는 다차원 데이터인 행위자들의 속성값을 사용자가 효과적으로 분석할 수 있는 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 장치 및 방법을 제공한다.The present invention provides a multidimensional data analysis apparatus and method in an actor-based simulation in which a user can effectively analyze attribute values of actors, which are multidimensional data, generated after performing actor-based simulation.

본 발명은 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 방법으로, 행위자 기반 시뮬레이션을 수행에 따라, 각 행위자로부터 속성값을 추출하여 다차원 데이터를 생성하는 단계와, 사용자로부터 각 속성별로 데이터를 선택받는 단계와, 상기 선택받은 데이터 중에서 숫자로 되어 있는 항목들은 소정 구간을 나누어 공칭값으로 변환하거나, 공칭값으로 되어 있는 데이터는 그룹화하는 단계와, 빈발 패턴 마이닝을 수행하여 상기 변환된 데이터 중에서 빈발 패턴들을 검색하는 단계와, 다수의 빈발 패턴 중에 사용자로부터 관심 핵심 패턴을 선택받는 단계와, 선택된 핵심 패턴들을 이용하여 데이터를 시각화하는 단계를 포함한다.The present invention relates to a multidimensional data analysis method in an actor-based simulation, comprising: generating multidimensional data by extracting an attribute value from each actor in accordance with actor-based simulation; selecting data for each attribute from a user; Dividing a predetermined section into numerical values among the selected data and converting the divided data into a nominal value or grouping data having a nominal value; searching for frequent patterns in the converted data by performing frequent pattern mining And receiving a key pattern of interest from a user in a plurality of frequent patterns, and visualizing data using the selected key patterns.

본 발명의 구성에 따르면, 행위자 기반 시뮬레이션에서 발생하는 다차원 데이터를 사용자들이 효과적으로 용이하게 분석할 수 있다. According to the configuration of the present invention, users can easily analyze multidimensional data generated in actor-based simulation.

도 1은 일반적인 시뮬레이션 데이터 출력 인터페이스의 일 예를 도시한 도면이다.
도 2는 본 발명의 일 실시 예에 따른 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 장치의 블록 구성도이다.
도 3은 본 발명의 일 실시 예에 따른 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 방법을 설명하기 위한 순서도이다.
도 4 내지 도 5b는 본 발명에 따라 인구 동태 시뮬레이션 데이터를 분석하는 일 예를 설명하기 위한 도면이다.
1 is a diagram showing an example of a general simulation data output interface.
2 is a block diagram of a multi-dimensional data analysis apparatus in an actor-based simulation according to an embodiment of the present invention.
3 is a flowchart illustrating a method for analyzing multi-dimensional data in an actor-based simulation according to an exemplary embodiment of the present invention.
FIGS. 4 to 5B are views for explaining an example of analyzing the population dynamics simulation data according to the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention, and the manner of achieving them, will be apparent from and elucidated with reference to the embodiments described hereinafter in conjunction with the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as being limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of the invention to those skilled in the art. Is provided to fully convey the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout the specification.

본 발명의 실시 예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이며, 후술되는 용어들은 본 발명의 실시 예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS In the following description of the present invention, detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. , Which may vary depending on the intention or custom of the user, the operator, and the like. Therefore, the definition should be based on the contents throughout this specification.

첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램인스트럭션들(실행 엔진)에 의해 수행될 수도 있으며, 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다.Each block of the accompanying block diagrams and combinations of steps of the flowcharts may be performed by computer program instructions (execution engines), which may be stored in a general-purpose computer, special purpose computer, or other processor of a programmable data processing apparatus The instructions that are executed through the processor of the computer or other programmable data processing equipment will generate means for performing the functions described in each block or flowchart of the block diagram.

이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다.These computer program instructions may also be stored in a computer usable or computer readable memory capable of directing a computer or other programmable data processing apparatus to implement the functionality in a particular manner so that the computer usable or computer readable memory It is also possible for the instructions stored in the block diagram to produce an article of manufacture containing instruction means for performing the functions described in each block or flowchart of the flowchart.

그리고 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명되는 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.And computer program instructions may be loaded onto a computer or other programmable data processing equipment so that a series of operating steps may be performed on a computer or other programmable data processing equipment to create a computer- It is also possible that the instructions that perform the data processing equipment provide the steps for executing the functions described in each block of the block diagram and at each step of the flowchart.

또한, 각 블록 또는 각 단계는 특정된 논리적 기능들을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있으며, 몇 가지 대체 실시 예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하며, 또한 그 블록들 또는 단계들이 필요에 따라 해당하는 기능의 역순으로 수행되는 것도 가능하다.Also, each block or step may represent a portion of a module, segment, or code that includes one or more executable instructions for executing the specified logical functions, and in some alternative embodiments, It should be noted that functions may occur out of order. For example, two successive blocks or steps may actually be performed substantially concurrently, and it is also possible that the blocks or steps are performed in the reverse order of the function as needed.

이하, 첨부 도면을 참조하여 본 발명의 실시 예를 상세하게 설명한다. 그러나 다음에 예시하는 본 발명의 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 다음에 상술하는 실시 예에 한정되는 것은 아니다. 본 발명의 실시 예는 당업계에서 통상의 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위하여 제공된다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, the following embodiments of the present invention may be modified into various other forms, and the scope of the present invention is not limited to the embodiments described below. The embodiments of the present invention are provided to enable those skilled in the art to more fully understand the present invention.

도 1은 일반적인 시뮬레이션 데이터 출력 인터페이스의 일 예를 도시한 도면이다.1 is a diagram showing an example of a general simulation data output interface.

도 1을 참조하면, 3차원 차트 공간 인터페이스는 2차원 차트 영역은 벽면(110)에 위치하고, 3차원 차트 영역은 플로어(120)에 위치한다. 그러나, 차원수가 증가함에 따라 이러한 방식으로 시각화하여 분석하는 데는 많은 어려움이 있다. Referring to FIG. 1, a three-dimensional chart space interface includes a two-dimensional chart area located on a wall surface 110 and a three-dimensional chart area located on a floor 120. However, as the number of dimensions increases, there are many difficulties in visualizing and analyzing in this way.

도 2는 본 발명의 일 실시 예에 따른 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 장치의 블록 구성도이다. 2 is a block diagram of a multi-dimensional data analysis apparatus in an actor-based simulation according to an embodiment of the present invention.

도 2를 참조하면, 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 장치(이하 '장치'로 기재함)는 시뮬레이션부(210), 다차원 데이터 생성부(220), 사용자 데이터 선택부(230), 데이터 변환부(240), 빈발 패턴 마이닝부(250), 핵심 패턴 선택부(260) 및 데이터 시각화부(270)을 포함한다. 2, a multidimensional data analysis apparatus (hereinafter referred to as "apparatus") in the actor-based simulation includes a simulation unit 210, a multidimensional data generation unit 220, a user data selection unit 230, A frequent pattern mining unit 250, a key pattern selection unit 260, and a data visualization unit 270.

시뮬레이션부(210)는 행위자의 기반 시뮬레이션을 수행한다. 이러한 시뮬레이션 수행에 따라, 각 행위자별로 속성값들이 생성되고, 이를 집계하여 사용자들이 원하는 집계치를 내줄 수 있다. The simulation unit 210 performs an actor based simulation. According to the simulation, attribute values are generated for each actor, and the aggregated values can be given by the users.

다차원 데이터 생성부(220)는 추가적인 분석을 위해, 각 행위자로부터 속성값을 추출하여 다차원 데이터를 생성한다. 이는 많은 경우 사용자들은 정밀한 분석을 위해서 시뮬레이션부(210)에 의해 행위자별로 발생한 속성값들을 다시 분석하기 때문이다. 이때, 다차원 데이터는 행렬 형태로 표현되되, 일 실시 예에 따라, 각 행위자들의 속성값 리스트는 행렬의 하나의 열(Row)에 매치된다.The multidimensional data generator 220 extracts attribute values from each actor to generate multidimensional data for further analysis. This is because, in many cases, the users re-analyze attribute values generated by the actor by the simulation unit 210 for precise analysis. At this time, the multidimensional data is expressed in a matrix form. According to one embodiment, the attribute value list of each actor is matched with one row of the matrix.

사용자 데이터 선택부(230)는 사용자들로부터 각 속성(Column) 별로 데이터를 선택받을 수 있다. 이는 다차원 데이터의 크기가 크기 때문이다.이때, 범위(Range) 형태로 선택될 수도 있고, 단일값 형태로 선택되도록 할 수도 있다.The user data selection unit 230 may receive data for each attribute from the users. This is because the size of the multidimensional data is large. In this case, it may be selected as a range type or a single value type.

데이터 변환부(240)는 추후에 빈발 패턴 마이닝(Frequent Pattern Mining)을 수행하기 위해, 숫자로 되어 있는 항목들은 적당히 구간을 나누어 공칭값(Nominal Value)으로 변환하거나, 공칭값(Nominal Value)으로 되어 있는 경우는 그룹화하여 하나로 묶을 수 있다. 이때, 데이터 마이닝(Data Mining) 기법을 이용하여 자동으로 공칭값(Nominal Value)으로 변환(Quantization)을 해준다. 만약 자동으로 변환된 결과를 사용자가 원치 않는 경우, 데이터 변환부(240)는 사용자가 그 결과(Quantization 결과)를 직접 수정하도록 할 수도 있다.In order to perform frequent pattern mining at a later time, the data conversion unit 240 converts the numerical items into appropriate nominal values and converts them into a nominal value or a nominal value If there is one, they can be grouped into one. At this time, the data is automatically converted to a nominal value using a data mining technique. If the user does not want the automatically converted result, the data conversion unit 240 may allow the user to directly modify the result (the quantization result).

빈발 패턴 마이닝부(250)는 빈발 패턴 마이닝(Frequent Pattern Mining)을 수행하여 빈발 패턴(Frequent Pattern)들을 찾아낸다. The frequent pattern mining unit 250 performs frequent pattern mining to find frequent patterns.

핵심 패턴 선택부(260)는 다수의 빈발 패턴(Frequent Pattern) 중에 사용자로부터 관심 핵심 패턴(Pattern)을 선택받는다.The key pattern selection unit 260 selects a key pattern of interest from a user during a plurality of frequent patterns.

데이터 시각화부(270)는 선택된 값들을 가지고 데이터를 시각화한다. 일 실시 예에 따라, 현재까지 선택된 영역에 대해 각 속성(항목)별로 도수분포표를 보여줄 수 있다. 그리고, 사용자로부터 추가 분석 요청이 입력될 경우, 데이터 시각화부(270)는 현재까지 선택된 값에 대한 동작을 사용자 데이터 선택부(230)에 요청한다.The data visualization unit 270 visualizes the data with the selected values. According to one embodiment, a frequency distribution table may be displayed for each attribute (item) for the selected area up to now. When an additional analysis request is input from the user, the data visualization unit 270 requests the user data selection unit 230 to perform an operation on the selected value up to the present.

도 3은 본 발명의 일 실시 예에 따른 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 방법을 설명하기 위한 순서도이고, 도 4 내지 도 5b는 본 발명에 따라 인구 동태 시뮬레이션 데이터를 분석하는 일 예를 설명하기 위한 도면이다.FIG. 3 is a flow chart for explaining a multidimensional data analysis method in the actor-based simulation according to an embodiment of the present invention. FIGS. 4 to 5B illustrate an example of analyzing the dynamics simulation data according to the present invention FIG.

도 3을 참조하면, 장치는 행위자 기반 시뮬레이션을 수행한다(S210). 시뮬레이션을 수행에 따라, 각 행위자별로 속성값들이 생성되고, 이를 집계하여 사용자들이 원하는 집계치를 내줄 수 있다. 하지만 많은 경우 사용자들은 정밀한 분석을 위해서 행위자별로 발생한 속성값들을 다시 분석한다. Referring to FIG. 3, the apparatus performs an agent-based simulation (S210). According to the simulation, attribute values are generated for each actor, and the aggregated values can be given by the users. In many cases, however, users re-analyze attribute values generated by actors for precise analysis.

따라서, 장치는 추가적인 분석을 위해, 각 행위자로부터 속성값을 추출하여 다차원 데이터를 생성한다(S220). 이때, 다차원 데이터는 행렬 형태로 표현되는데, 각 행위자들의 속성값 리스트는 행렬의 하나의 열(Row)에 매치된다. 예컨대, 행위자 기반 인구 동태 시뮬레이션을 수행한 결과에 다른 속성값들이 행위자ID, 시도, 성별, 만나이, 가구주와의_관계, 교육정도, 교육상태, 경제활동상태, 종사상지위, 직업, 혼인상태를 포함하고, 총 행위자가 5명이라면, 도 4에 도시된 바와 같은 다차원 데이터가 생성될 수 있다.Accordingly, the apparatus extracts attribute values from each actor to generate multidimensional data for further analysis (S220). At this time, the multidimensional data is expressed in a matrix form, and the attribute value list of each actor is matched to one row (Row) of the matrix. For example, the results of the agent - based population dynamics simulation show that other attribute values are related to the actor ID, attempt, gender, manners, relationship with the householder, education level, educational status, economic activity status, And if the total actors are five persons, multidimensional data as shown in FIG. 4 can be generated.

그런데, 다차원 데이터의 크기가 크기 때문에, 장치는 사용자들로부터 각 속성(Column) 별로 관심 데이터를 선택받을 수 있다(S230). 이때, 범위(Range) 형태로 선택될 수도 있고, 단일값 형태로 선택되도록 할 수도 있다. 예컨대, 시도라는 속성에 대해 '충남'이라는 범위를 선택받거나, 혼인 상태를 '미혼' 또는 '이혼'으로 선택받을 수도 있다.However, since the size of the multidimensional data is large, the apparatus can select data of interest for each attribute column from the users (S230). In this case, a range type may be selected, or a single value type may be selected. For example, the attribute of 'Attempt' may be selected as 'Chungnam' or the status of marriage may be selected as 'Unmarried' or 'Divorce'.

장치는 추후에 빈발 패턴 마이닝(Frequent Pattern Mining)을 수행하기 위해, 숫자로 되어 있는 항목들은 적당히 구간을 나누어 공칭값(Nominal Value)으로 변환하거나, 공칭값(Nominal Value)으로 되어 있는 경우는 그룹화하여 하나로 묶을 수 있다(S340). 이때 데이터 마이닝(Data Mining) 기법을 이용하여 자동으로 공칭값(Nominal Value)으로 변환(Quantization)을 해준다. 일 실시 예에 따라, 예컨대, 만나이의 속성값을 10세 단위로 그룹화할 수도 있고, 직업에 대해 전문직과 기타 2개로 그룹화할 수도 있다.In order to perform frequent pattern mining at a later time, the device converts the numerical items into a nominal value by appropriately dividing a section, or when the nominal value is set to a nominal value, (S340). At this time, data mining (data mining) technique is automatically converted to nominal value (quantization) is done. According to one embodiment, for example, the attribute values of a man may be grouped in units of ten years, or the profession may be grouped into a profession and the other two.

장치는 자동으로 변환된 결과를 사용자가 원치 않아 수동 변환이 필요한지를 판단(S350)하여, 수동 변환이 필요할 경우 장치는 사용자에 의해 수정된 결과를 입력받는다(S360). 예컨대, 만나이를 '10세 단위'로 자동 그룹화한 결과를 '5세 단위'로 수동 그룹화할 수도 있다.In operation S350, the device determines whether manual conversion is required because the user does not want the converted result automatically. If the manual conversion is required, the device receives the modified result by the user in operation S360. For example, the results of automatic grouping of "ten-year-olds" can be manually grouped into "five-year-olds".

그후, 장치는 빈발 패턴 마이닝(Frequent Pattern Mining)을 수행하여 빈발 패턴(Frequent Pattern)들을 찾아낸다(S370). 즉, 각 열(Row)을 하나의 Transaction으로 보고, 빈발 패턴 마이닝(Frequent Pattern Mining)을 수행한다. 예컨대, 여, 나이:30-34, 남, 나이:20-24, 남, 대학원졸, 전문직이 결과값의 예가 될 수 있다. Thereafter, the apparatus performs frequent pattern mining to find frequent patterns (S370). That is, each row is referred to as a transaction, and frequent pattern mining is performed. For example, age: 30-34, male, age: 20-24, male, graduate school, profession can be an example of the results.

그리고, 장치는 다수의 빈발 패턴(Frequent Pattern) 중에 사용자의 관심 핵심 패턴(Pattern)을 선택받는다(S370). 예컨대, 여, 나이:30-34가 선택될 수 있다.Then, the device selects a key pattern of interest of the user during a plurality of frequent patterns (S370). For example, Age: 30-34 may be selected.

그리고, 장치는 선택된 값들을 가지고 데이터를 시각화한다(S390). 일 실시 예에 따라, 현재까지 선택된 영역에 대해 각 속성(항목)별로 도수분포표를 보여줄 수 있다. 즉, 충남, 미혼 또는 이혼, 여성, 30-34 세인인 행위자들에 대해 직업, 교육 정도, 교육 상태, 가구주와의 관계, 경제활동상태, 종사상의 지위 등의 도수분포표를 시각화 할 수 있다. 도 5a 및 도 5b는 도수 분포표의 일 예가 도시되어 있다. 그런 후, 장치는 사용자로부터 다차원 데이터에 대한 더 자세한 분석 요청이 입력되는지 확인(S400)하여, 추가 분석이 필요할 경우 S330으로 진행한다. The device then visualizes the data with the selected values (S390). According to one embodiment, a frequency distribution table may be displayed for each attribute (item) for the selected area up to now. In other words, it is possible to visualize the frequency distribution charts such as occupation, education level, educational status, relationship with the householder, economic activity status, occupational status, etc. for actors who are in Chungnam, single or divorced, women and 30-34 year olds. 5A and 5B show an example of the frequency distribution table. Then, the apparatus confirms whether a more detailed analysis request for multidimensional data is input from the user (S400), and proceeds to S330 if additional analysis is required.

Claims (1)

행위자 기반 시뮬레이션을 수행에 따라, 각 행위자로부터 속성값을 추출하여 다차원 데이터를 생성하는 단계와,
사용자로부터 각 속성별로 데이터를 선택받는 단계와,
상기 선택받은 데이터 중에서 숫자로 되어 있는 항목들은 소정 구간을 나누어 공칭값으로 변환하거나, 공칭값으로 되어 있는 데이터는 그룹화하는 단계와,
빈발 패턴 마이닝을 수행하여 상기 변환된 데이터 중에서 빈발 패턴들을 검색하는 단계와,
다수의 빈발 패턴 중에 사용자로부터 관심 핵심 패턴을 선택받는 단계와,
선택된 핵심 패턴들을 이용하여 데이터를 시각화하는 단계를 포함함을 특징으로 하는 행위자 기반 시뮬레이션에서의 다차원 데이터 분석 방법.
Generating multidimensional data by extracting attribute values from each actor in accordance with actor-based simulation;
Selecting data for each attribute from a user,
Dividing a number of items into a nominal value by dividing a predetermined section of the selected data or grouping data having a nominal value,
Performing frequent pattern mining to search for frequent patterns among the converted data;
Receiving a key pattern of interest from a user among a plurality of frequent patterns;
And visualizing the data using the selected core patterns. ≪ RTI ID = 0.0 > [10] < / RTI >
KR1020160098023A 2016-08-01 2016-08-01 Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer KR20180014543A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160098023A KR20180014543A (en) 2016-08-01 2016-08-01 Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160098023A KR20180014543A (en) 2016-08-01 2016-08-01 Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer

Publications (1)

Publication Number Publication Date
KR20180014543A true KR20180014543A (en) 2018-02-09

Family

ID=61199061

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160098023A KR20180014543A (en) 2016-08-01 2016-08-01 Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer

Country Status (1)

Country Link
KR (1) KR20180014543A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190967A (en) * 2019-12-16 2020-05-22 北京淇瑀信息科技有限公司 User multi-dimensional data processing method and device and electronic equipment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111190967A (en) * 2019-12-16 2020-05-22 北京淇瑀信息科技有限公司 User multi-dimensional data processing method and device and electronic equipment
CN111190967B (en) * 2019-12-16 2024-04-26 北京淇瑀信息科技有限公司 User multidimensional data processing method and device and electronic equipment

Similar Documents

Publication Publication Date Title
US11210569B2 (en) Method, apparatus, server, and user terminal for constructing data processing model
US20220414544A1 (en) Parallel Development and Deployment for Machine Learning Models
US11586464B2 (en) Techniques for workflow analysis and design task optimization
KR100996443B1 (en) System and method of parallel distributed processing of gpu by dividing dense indexed data-files into parts of search and computation in query and database system thereof
JP6800825B2 (en) Information processing equipment, information processing methods and programs
Rodrigues et al. K-MS: a novel clustering algorithm based on morphological reconstruction
US20210152648A1 (en) Techniques for analyzing the proficiency of users of software applications in real-time
CN114546365B (en) Flow visualization modeling method, server, computer system and medium
JP6178023B2 (en) Module division support apparatus, method, and program
Adler et al. Modelling persistence diagrams with planar point processes, and revealing topology with bagplots
KR20180014543A (en) Apparatus and Method for Analizing Multi-dimensional Data in Simulation based on Performer
JPWO2012147825A1 (en) Application architecture design method, application architecture design apparatus, and recording medium
US20200265071A1 (en) Mixed initiative feature engineering
US20220374801A1 (en) Plan evaluation apparatus and plan evaluation method
KR101732970B1 (en) Method and device of processing 3D CAD data
Gandhi et al. Analysis and implementation of modified K-Medoids algorithm to increase scalability and efficiency for large dataset
Binucci et al. Fully dynamic semantic word clouds
JP5600826B1 (en) Unstructured data processing system, unstructured data processing method and program
JP2019174947A (en) Visualization device, method and program
Genolini et al. Package ‘kml3d’
KR102185980B1 (en) Table processing method and apparatus
CN114780647A (en) Visualization report generation method, device, storage medium and program product
CN116720235A (en) Automatic CAD file labeling method and device and electronic equipment
Abdalla et al. Sets Visualization using their Graph Representation
Chun et al. Consistent digital rays

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal