KR101595024B1 - data analyzing system based on user intent - Google Patents
data analyzing system based on user intent Download PDFInfo
- Publication number
- KR101595024B1 KR101595024B1 KR1020150005966A KR20150005966A KR101595024B1 KR 101595024 B1 KR101595024 B1 KR 101595024B1 KR 1020150005966 A KR1020150005966 A KR 1020150005966A KR 20150005966 A KR20150005966 A KR 20150005966A KR 101595024 B1 KR101595024 B1 KR 101595024B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- analysis
- dashboard
- format
- clients
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G06F17/30312—
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 사용자 기반 데이터 분석 시스템에 관한 것으로서, 상세하게로는 데이터 수집, 분석 및 시각화가 유저(사용자)에 의해 선택에 따라 수행되도록 구성됨으로써 유저 중심의 서비스를 제공함과 동시에 수집, 분석 및 시각화의 효율성을 획기적으로 높일 수 있는 사용자 기반 데이터 분석 시스템에 관한 것이다.The present invention relates to a user-based data analysis system. More particularly, the present invention relates to a user-based data analysis system in which data collection, analysis, and visualization are selectively performed by a user (user) And a user-based data analysis system capable of dramatically improving efficiency.
빅데이터(big data)는 규모가 방대하며 생성주기가 짧고, 형태가 다양한 대규모 데이터로 정의되고, 특히 IT 기술의 비약적인 발달, 소셜 네트워크 서비스(SNS, ) 사용자의 급증, 스마트폰으로 대변되는 모바일 혁명 등의 이유로 인하여 그 증가 속도가 더욱 빨라지고 있다.Big data is defined as large-scale data with a large size, short generation cycle, and various forms. Especially, the rapid development of IT technology, rapid increase of users of social network service (SNS), mobile revolution The rate of increase is accelerating.
이러한 빅데이터는 정치, 사회, 경제, 문화, 과학 기술 등 전 영역에 걸쳐서 인간에게 가치있는 정보를 제공할 수 있는 가능성을 제시함에 따라 빅데이터에 대한 관심이 급증하고 있고, 이에 따라 빅데이터를 수집한 후 이를 분석하여 패턴 및 가치를 검출하는 빅데이터 처리 시스템에 대한 다양한 연구가 진행되고 있다.As Big Data presents the potential to provide valuable information to human beings in all areas such as politics, society, economy, culture, science and technology, interest in big data is increasing rapidly, There are various studies on big data processing systems that analyze patterns and values after analyzing them.
도 1은 종래의 빅데이터 처리 시스템의 통상적인 동작과정을 설명하기 위한 플로차트이다. FIG. 1 is a flowchart for explaining a typical operation procedure of a conventional big data processing system.
종래의 빅데이터 처리 시스템의 동작과정(S100)은 통상적으로 다양한 포맷의 빅데이터를 수집하는 데이터 수집단계(S110)와, 기 설정된 분석알고리즘을 이용하여 데이터 수집단계(S110)에 의해 수집된 데이터들을 분석하여 가치데이터를 검출하는 데이터 분석단계(S120)와, 데이터 분석단계(S120)에 의해 처리된 데이터들을 유저 단말기에 출력하는 시각화단계(S130)로 이루어진다.The operation process (S100) of the conventional big data processing system typically includes a data collection step (S110) of collecting big data of various formats, and a step of collecting the data collected by the data collection step (S110) A data analysis step (S120) of analyzing the value data and a visualization step (S130) of outputting data processed by the data analysis step (S120) to the user terminal.
이와 같이 구성되는 종래의 빅데이터 처리 시스템은 데이터 수집단계(S110), 데이터 분석단계(S120) 및 시각화단계(S130)를 통해 대용량의 다양한 데이터들에 의한 가치데이터를 검출하여 이를 유저에게 제공할 수 있는 장점을 가진다.The conventional large data processing system configured as described above can detect value data by various data of a large capacity through the data collection step (S110), the data analysis step (S120) and the visualization step (S130) .
그러나 종래의 빅데이터 처리 시스템은 데이터 수집단계(S110)에 의해 수집되는 데이터의 포맷이 유저에 의해 선택되는 것이 아니라 서비스 제공자에 의해 결정되기 때문에 사용자는 수동적으로 서비스를 제공받게 되는 한계를 가진다.However, in the conventional big data processing system, since the format of the data collected by the data collection step (S110) is not selected by the user but is determined by the service provider, the user has a limitation that the service is manually provided.
또한 종래의 빅데이터 처리 시스템은 데이터 분석단계(S120)에 의한 데이터 분석이 단순히 기 설정된 분석알고리즘만으로 이루어져 고정된 방식으로만 데이터를 분석하기 때문에 유저는 단순히 서비스 제공자에서 결정한 분석알고리즘에 의해 검출된 분석데이터만을 수동적으로 열람할 수 밖에 없는 한계를 가진다. 즉 데이터의 양이 무한하다고 가정하는 경우 분석알고리즘에 따라 동일 데이터로부터 다양한 패턴값을 검출할 수 있으나, 종래기술(100)은 단순히 고정된 하나의 분석알고리즘만을 사용하기 때문에 분석의 효율성 및 신뢰도가 떨어지는 단점을 가진다.Also, in the conventional big data processing system, since the data analysis by the data analysis step (S120) is performed by only a predetermined analysis algorithm and the data is analyzed only in a fixed manner, the user simply analyzes the data It has a limitation that it can only passively browse data. In other words, when it is assumed that the amount of data is infinite, various pattern values can be detected from the same data according to an analysis algorithm. However, since the
또한 데이터 분석단계(S120)에 의해 검출된 가치데이터는 다양한 항목별(예 : 시간별, 장소별, 장비명, TCP 등)에 따라 다양하게 전시가 이루어질 수 있으나, 종래의 빅데이터 처리 시스템은 시각화단계(S130)에서 분석데이터를 전시하는 방식이 서비스 제공자에 의해 결정된 전시방식으로만 전시되기 때문에 전시효율 및 정보전달력이 떨어지는 문제점이 발생한다.Also, the value data detected in the data analysis step S120 can be variously displayed according to various items (e.g., time, place, equipment name, TCP, etc.), but in the conventional big data processing system, Since the method of displaying the analysis data in step S130 is displayed only by the display method determined by the service provider, the exhibition efficiency and the information transfer ability are deteriorated.
도 2는 국내공개특허 제10-2011-0046199호(발명의 명칭 : 생활 패턴 분석 시스템 및 생활 패턴 분석 방법)에 개시된 생활 패턴 분석 시스템을 나타내는 구성도이다.2 is a block diagram showing a life pattern analysis system disclosed in Korean Patent Laid-Open No. 10-2011-0046199 (entitled Life Pattern Analysis System and Life Pattern Analysis Method).
도 2의 생활 패턴 분석 시스템(이하 종래기술이라고 함)(100)은 메인 서버(101), 네트워크 망(103)을 통해 메인 서버(101)와 유/무선 통신하는 복수의 가입자 서버(105)들과, 고객서버(107)를 포함한다.The life
메인서버(101)는 인터넷 상으로 마이크로 블로그를 제공하는 웹 사이트를 운용하며, 웹 사이트 상의 생활 키워드를 수집하고, 분석하여 생활 패턴을 찾는다.The
또한 메인 서버(101)는 입/출력부(111), 제어부(115) 및 데이터 베이스(113)를 포함한다.The
입/출력부(111)는 네트워크 망(103)을 통하여 복수의 가입자 서버(105)들과, 유/무선 송수신하며, 고객 서버(107)와 송수신하여 검색된 생활 패턴을 전송한다.The input /
제어부(115)는 인터넷 상의 웹 사이트를 운용하며, 각 개인의 블로그의 생활키워드를 수집하고, 이를 분석하여 각 생활 키워드 사이의 상관 관계를 나타내는 생활 패턴을 찾는다. 한편 제어부(115)는 팀 블로그 내의 생활 키워드를 분석하여 팀 블로그의 팀원들 사이에 존재하는 생활 패턴을 분석한다.The
이와 같이 구성된 종래기술(100)은 생활 키워드를 통해 생활 패턴정보를 검출한 후 이를 고객서버(107)로 제공함으로써 고객서버(107)에 접속한 유저는 생활 패턴을 열람할 수 있게 된다.The
그러나 종래기술(100)은 메인서버(101)가 생활 패턴을 분석하기 위한 분석알고리즘을 기 설정하여 저장하고, 기 설정된 분석알고리즘을 이용하여 생활패턴을 분석하도록 구성, 즉 고정된 방법으로 생활 패턴이 검출되기 때문에 유저는 단순히 메인서버(101)에서 결정한 분석알고리즘에 의해 검출된 분석데이터만을 수동적으로 열람하여야 하는 한계를 갖는다. 즉 데이터의 양이 무한하다고 가정하는 경우 분석알고리즘에 따라 동일 데이터로부터 다양한 패턴값을 검출할 수 있으나, 종래기술(100)은 단순히 고정된 하나의 분석알고리즘만을 사용하기 때문에 분석의 효율성 및 신뢰도가 떨어지는 단점을 가진다.However, in the
또한 종래기술(100)은 검출된 분석데이터를 열람할 때 고정된 방식으로만 분석데이터가 전시되는 한계를 가진다. 즉 동일 행동패턴이라고 할지라도 다양한 포맷별(항목별)(예 : 시간별, 지역별 등)로 전시가 이루어지는 경우 유저는 자신이 원하는 항목별로 행동패턴을 열람할 수 있으나, 종래에는 이러한 특성을 전혀 감안하지 않고 단순히 고정된 방식으로만 분석데이터를 전시하기 때문에 정보전달력 및 편의성이 떨어지게 된다.Also, the
본 발명은 이러한 문제를 해결하기 위한 것으로, 본 발명의 해결과제는 복수개의 기 설정된 분석알고리즘들 중 어느 하나를 유저로부터 선택받거나 또는 open API(application program interface)를 제공하여 유저에 의해 자체적으로 제작된 자체 분석알고리즘을 등록받아 선택되거나 등록된 분석알고리즘을 이용하여 수집데이터를 분석하도록 구성됨으로써 분석의 신뢰도 및 정확도를 현저히 높일 수 있는 사용자 기반 데이터 분석 시스템을 제공하기 위한 것이다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and it is an object of the present invention to provide a method and apparatus for selecting one of a plurality of predetermined analysis algorithms from a user or providing an open API (application program interface) And to provide a user-based data analysis system capable of significantly increasing the reliability and accuracy of analysis by being configured to register the self-analysis algorithm and analyze the collected data using the selected or registered analysis algorithm.
또한 본 발명의 다른 해결과제는 데이터 분석이 이루어지고 나면 대시보드를 통해 유저(사용자)의 선택에 따라 분석데이터의 전시항목 및 전시방법이 결정되도록 구성됨으로써 전시효율 및 정보전달력을 높일 수 있는 사용자 기반 데이터 분석 시스템을 제공하기 위한 것이다.Further, another object of the present invention is to provide a display system and a display method of the analysis data, in which a display item and a display method of analysis data are determined according to a user's selection through a dashboard after data analysis is performed, Based data analysis system.
또한 본 발명의 또 다른 해결과제는 데이터 게이트웨이가 기존의 데이터들뿐만 아니라 문서파일(이하 휴먼파일이라고 함)까지 수집하도록 구성됨으로써 분석대상의 범위가 증가되고, 이에 따라 더욱 다양한 데이터분석을 수행할 수 있는 사용자 기반 데이터 분석 시스템을 제공하기 위한 것이다.Further, another object of the present invention is to provide a data gateway which is configured to collect not only existing data but also document files (hereinafter referred to as human files), thereby increasing the scope of the analysis target, Based data analysis system.
상기 과제를 해결하기 위한 본 발명의 해결수단은 수집대상서버들로부터 데이터를 수집 및 분석하며, 분석이 수행된 분석데이터를 접속된 클라이언트에게 제공하기 위한 데이터 분석 시스템에 있어서: 상기 데이터 분석 시스템은 상기 수집대상서버들로부터 데이터를 수집하는 데이터 수집부와, 상기 데이터 수집부에 의해 수집된 데이터를 분석하는 데이터 분석부와, 상기 데이터 분석부에 의해 분석된 데이터가 전시되는 그래픽 사용자 인터페이스(GUI)를 포함하는 대시보드(dashboard)를 생성하는 대시보드 관리부를 포함하는 데이터분석 플랫폼; 상기 데이터분석 플랫폼에 접속하여 상기 대시보드의 그래픽 사용자 인터페이스를 다운로드 받아 열람하는 클라이언트들을 포함하고, 상기 대시보드는 상기 클라이언트들로부터 상기 데이터 분석부에 활용되는 기 설정된 분석알고리즘들 중 어느 하나를 선택받도록 구성되고, 상기 데이터분석 플랫폼의 상기 데이터 분석부는 상기 대시보드를 통해 상기 클라이언트들로부터 선택된 분석알고리즘을 이용하여 데이터 분석을 수행하고, 상기 데이터분석 플랫폼은 상기 클라이언트들에게 open API(application program interface)를 제공하여 상기 클라이언트들로부터 상기 대시보드를 통해 자체 제작한 분석알고리즘을 등록받으며, 상기 데이터 분석부는 상기 클라이언트들로부터 상기 대시보드를 통해 자체 가 분석알고리즘을 등록받으면 등록된 분석알고리즘을 활용하여 데이터 분석을 수행하는 것이다.According to an aspect of the present invention, there is provided a data analysis system for collecting and analyzing data from collection target servers and providing analysis data that has been analyzed to a connected client, the data analysis system comprising: A data analysis unit for analyzing data collected by the data collection unit; and a graphical user interface (GUI) on which data analyzed by the data analysis unit is displayed. A data analysis platform including a dashboard management section for generating a dashboard containing the dashboard; And a client for accessing the data analysis platform and downloading and viewing the graphical user interface of the dashboard, wherein the dashboard is configured to select one of predetermined analysis algorithms used in the data analysis unit from the clients Wherein the data analysis unit of the data analysis platform performs data analysis using an analysis algorithm selected from the clients through the dashboard and the data analysis platform provides an open application program interface (API) And receives an analysis algorithm from the clients through the dashboard, and the data analysis unit analyzes the registered analysis algorithm when the analysis algorithm is registered in the dashboard from the clients. Use it to perform the data analysis.
또한 본 발명에서 상기 데이터분석 플랫폼은 상기 클라이언트들에게 open API(application program interface)를 제공하여 상기 클라이언트들로부터 상기 대시보드를 통해 자체 제작한 분석알고리즘을 등록받으며, 상기 데이터 분석부는 상기 클라이언트들로부터 상기 대시보드를 통해 자체 가 분석알고리즘을 등록받으면 등록된 분석알고리즘을 활용하여 데이터 분석을 수행하는 것이 바람직하다.In addition, in the present invention, the data analysis platform may provide an open API (application program interface) to the clients to register their own analysis algorithms through the dashboard from the clients, Once the analysis algorithm is registered by the dashboard itself, it is desirable to perform data analysis using the registered analysis algorithm.
또한 본 발명에서 상기 데이터 분석부는 기 설정된 패턴분석 알고리즘을 이용하여 상기 데이터 수집부에 의해 수집된 데이터로부터 패턴정보를 검출하는 패턴분석모듈을 더 포함하는 것이 바람직하다.The data analysis unit may further include a pattern analysis module for detecting pattern information from the data collected by the data collection unit using a predetermined pattern analysis algorithm.
또한 본 발명에서 상기 데이터 수집부는 상기 수집대상서버들 각각의 데이터 이동경로에 설치되는 게이트웨이(gateway)인 것이 바람직하다.In the present invention, the data collection unit may be a gateway installed in a data movement path of each of the collection target servers.
또한 본 발명에서 상기 대시보드는 상기 클라이언트들로부터 수집하고자 하는 데이터의 포맷을 입력받으며, 상기 데이터 수집부는 상기 대시보드를 통해 상기 클라이언트들로부터 데이터 포맷을 입력받으면 입력받은 데이터 포맷에 대응되는 데이터를 수집하고, 상기 데이터 포맷은 '시간', '장비명', 'HTTP', 'FTP', 'POP3', 'SMTP', 'IMAP', 'DNS'들 중 적어도 하나 이상을 포함하는 것이 바람직하다.In addition, in the present invention, the dashboard receives a format of data to be collected from the clients, and the data collector receives data format from the clients through the dashboard, and collects data corresponding to the received data format And the data format includes at least one of 'time', 'equipment name', 'HTTP', 'FTP', 'POP3', 'SMTP', 'IMAP', and 'DNS'.
또한 본 발명에서 상기 대시보드 관리부는 상기 데이터 분석부에 의해 분석된 데이터를 디스플레이 하기 위한 대시보드를 생성하며, 생성된 대시보드는 상기 클라이언트들로부터 기 설정된 전시방법들 중 어느 하나를 입력받기 위한 입력란을 포함하고, 상기 대시보드 관리부는 상기 생성된 대시보드를 통해 입력된 전시방법에 따라 상기 분석된 데이터를 전시하는 것이 바람직하다.Also, in the present invention, the dashboard management unit generates a dashboard for displaying the data analyzed by the data analysis unit, and the generated dashboard includes a field for receiving any one of preset display methods from the clients, And the dashboard management unit displays the analyzed data according to the display method input through the generated dashboard.
또한 본 발명에서 상기 기 설정된 전시방법들은 '바(bar) 차트', '라인(line) 차트', 파이(pie) 차트', '테이블(table)'들 중 적어도 하나 이상을 포함하는 것이 바람직하다.In addition, in the present invention, the predetermined display methods include at least one of a bar chart, a line chart, a pie chart, and a table .
또한 본 발명에서 상기 생성된 대시보드는 상기 분석된 데이터에 대한 입력포맷 및 출력포맷을 상기 클라이언트들로부터 입력받는 입력란을 포함하고, 상기 대시보드 관리부는 상기 생성된 대시보드의 상기 입력란을 통해 입력포맷 및 출력포맷이 입력되면 입력된 입력포맷 및 출력포맷에 따라, '바(bar) 차트', '라인(line) 차트', 파이(pie) 차트', '테이블(table)'들 중 상기 클라이언트들로부터 입력된 어느 하나로 상기 분석된 데이터를 전시하는 것이 바람직하다.In the present invention, the generated dashboard may include an input field for receiving an input format and an output format for the analyzed data from the clients, and the dashboard manager may receive an input format A bar chart, a line chart, a pie chart, and a table according to an input format and an output format that are input when the output format is input, And displays the analyzed data in any one of the input data.
또한 본 발명에서 상기 생성된 대시보드는 상기 기 설정된 전시방법들의 목록이 전시되는 전시방법 목록과, 상기 전시방법들 각각을 나타내는 샘플 그래프가 전시되는 전시창들을 포함하고, 상기 클라이언트로부터 상기 전시방법 목록 중 어느 하나가 클릭된 상태로 드래그 되면 드래그 된 전시방법이 상기 클라이언트로부터 입력된 것으로 판단하는 것이 바람직하다.Also, the generated dashboard according to the present invention may include a display method list in which a list of the predetermined exhibition methods is displayed, and an exhibition window in which a sample graph representing each of the exhibition methods is displayed, It may be determined that the dragged display method is input from the client.
또한 본 발명에서 상기 생성된 대시보드는 상기 입력포맷들의 목록이 전시되는 입력포맷 목록과, 상기 출력포맷들의 목록이 전시되는 출력포맷 목록을 포함하고, 상기 클라이언트로부터 상기 입력포맷 목록 또는 출력포맷 목록 중 어느 하나가 클릭된 상태로 상기 전시창들 중 어느 하나의 샘플그래프의 입력 포맷란 또는 출력 포맷란에 드래그 되면 상기 전시방법의 입력포맷 또는 출력포맷은 드래그 된 입력포맷 또는 출력포맷으로 입력된 것으로 판단하는 것이 바람직하다.Also, the generated dashboard may include an input format list in which the list of the input formats is displayed and an output format list in which the list of the output formats is displayed. In the input format list or the output format list If either one of the display windows is clicked and dragged to the input format column or the output format column of one of the display windows, it is determined that the input format or the output format of the display method is input in the dragged input format or output format desirable.
또한 본 발명에서 상기 기 설정된 전시방법들이 '바(bar) 차트', '라인(line) 차트', 파이(pie) 차트'일 때 상기 입력포맷란은 'X'축으로, 상기 출력포맷란은 'Y'축으로 설정되는 것이 바람직하다.In the present invention, when the preset display methods are 'bar chart', 'line chart', or 'pie chart', the input format column is 'X' Axis. ≪ / RTI >
상기 과제와 해결수단을 갖는 본 발명에 따르면 기 설정된 복수개의 분석알고리즘들 중 어느 하나를 유저로부터 입력받으며, 입력된 분석알고리즘을 이용하여 수집데이터를 분석하도록 구성됨으로써 고정된 분석방법이 적용되는 것이 아니라 유저의 선택에 따라 다양한 데이터분석이 가능해지고, 이에 따라 분석의 신뢰도 및 효율성을 획기적으로 높일 수 있다.According to the present invention having the above-mentioned problems and solutions, it is not necessary to apply a fixed analysis method by receiving any one of the predetermined plurality of analysis algorithms from the user and analyzing the collected data using the inputted analysis algorithm According to the user's choice, various data analysis becomes possible, and thus the reliability and efficiency of analysis can be drastically improved.
또한 본 발명에 의하면 클라이언트들에게 open API를 제공하여 유저로부터 자체 제작된 분석알고리즘을 등록받아 이를 데이터 분석에 활용하도록 구성됨으로써 분석의 신뢰도 및 효율성을 더욱 높일 수 있다.Also, according to the present invention, an open API is provided to clients so that a user can register his / her own analysis algorithm and use it for data analysis, thereby improving the reliability and efficiency of analysis.
또한 본 발명에 의하면 분석데이터를 클라이언트에게 디스플레이 할 때 대시보드를 통해 유저(사용자)의 선택에 따라 분석데이터의 전시항목 및 전시방법이 결정되도록 구성됨으로써 전시효율 및 정보전달력을 높일 수 있다.According to the present invention, when the analysis data is displayed to the client, the exhibition items and the display methods of the analysis data are determined according to the selection of the user (user) through the dashboard, thereby enhancing the exhibition efficiency and the information transfer power.
도 1은 종래의 빅데이터 처리 시스템의 통상적인 동작과정을 설명하기 위한 플로차트이다.
도 2는 국내공개특허 제10-2011-0046199호(발명의 명칭 : 생활 패턴 분석 시스템 및 생활 패턴 분석 방법)에 개시된 생활 패턴 분석 시스템을 나타내는 구성도이다.
도 3은 본 발명의 일실시예인 데이터 분석 시스템을 설명하기 위한 구성도이다.
도 4는 도 3의 데이터 게이트웨이를 나타내는 블록도이다.
도 5는 도 3의 데이터분석 플랫폼을 나타내는 블록도이다.
도 6은 도 5를 설명하기 위한 예시도이다.
도 7은 도 3의 데이터 분석부를 나타내는 블록도이다.
도 8은 대시보드 관리부를 나타내는 블록도이다.
도 9는 도 8의 대시보드 관리부에 의해 생성되는 대시보드의 그래픽 사용자 인터페이스를 활용하여 사용자가 데이터 포맷을 자유로이 정의하는 기능을 설명하기 위한 예시도이다.
도 10은 도 8의 대시보드 관리부에 의해 생성되는 대시보드의 그래픽 사용자 인터페이스를 활용하여 사용자가 사용하고자 하는 알고리즘 타입을 자유로이 정의하는 기능을 설명하기 위한 예시도이다.
도 11은 도 8의 대시보드 관리부에 의해 생성되는 대시보드의 그래픽 사용자 인터페이스를 활용하여 사용자가 표출하고자 하는 형태로 대시보드 타입을 자유로이 정의하는 기능을 설명하기 위한 예시도이다.FIG. 1 is a flowchart for explaining a typical operation procedure of a conventional big data processing system.
2 is a block diagram showing a life pattern analysis system disclosed in Korean Patent Laid-Open No. 10-2011-0046199 (entitled Life Pattern Analysis System and Life Pattern Analysis Method).
3 is a block diagram illustrating a data analysis system according to an embodiment of the present invention.
4 is a block diagram illustrating the data gateway of FIG.
5 is a block diagram illustrating the data analysis platform of FIG.
Fig. 6 is an exemplary diagram for explaining Fig. 5. Fig.
FIG. 7 is a block diagram showing the data analysis unit of FIG. 3. FIG.
8 is a block diagram showing a dashboard management unit.
FIG. 9 is an exemplary diagram for explaining a function of a user to freely define a data format by utilizing a graphical user interface of a dashboard generated by the dashboard management unit of FIG. 8. FIG.
FIG. 10 is an exemplary diagram for explaining a function for freely defining an algorithm type that a user desires to use by utilizing a graphical user interface of a dashboard generated by the dashboard management unit of FIG. 8. FIG.
FIG. 11 is an exemplary diagram for explaining a function for freely defining a dashboard type in a form that a user desires to express using a graphical user interface of a dashboard generated by the dashboard management unit of FIG. 8. FIG.
이하, 첨부된 도면을 참조하여 본 발명의 일실시예를 설명한다.Hereinafter, an embodiment of the present invention will be described with reference to the accompanying drawings.
도 3은 본 발명의 일실시예인 데이터 분석 시스템을 설명하기 위한 구성도이다.3 is a block diagram illustrating a data analysis system according to an embodiment of the present invention.
도 3의 데이터 분석 시스템(1)은 데이터 수집 대상인 수집대상서버(7-1), ..., (7-N)들과, 수집대상서버(7-1), ..., (7-N)들의 데이터 이동경로에 설치되어 데이터를 수집하는 데이터 게이트웨이(gateway)(5-1), ..., (5-N)들과, 데이터 게이트웨이(5-1), ..., (5-N)들에 의해 수집된 수집데이터를 분석한 후 가공하여 분석데이터를 웹 화면으로 제공하는 데이터분석 플랫폼(3)과, 데이터분석 플랫폼(3)에 접속하여 데이터를 요청하며 데이터분석 플랫폼(3)으로부터 요청데이터에 대응되는 결과데이터를 모니터에 전시하는 클라이언트(9-1), ..., (9-N)들과, 연결대상(3), (5-1), ..., (5-N), (7-1), ..., (7-N), (9-1), ..., (9-N)들 사이의 데이터 이동경로를 제공하는 통신망(4)으로 이루어진다.The
이때 본 발명에서는 설명의 편의를 위해 데이터 게이트웨이(5-1), ..., (5-N)들이 수집대상서버(7-1), ..., (7-N)들 각각의 데이터 이동경로에 설치되어 데이터를 수집하는 것으로 예를 들어 설명하였으나, 데이터 수집 방식은 이에 한정되지 않으며, 수집대상서버(7-1), ..., (7-N)들로부터 수집데이터를 주기적으로 전송받는 방식 등과 같은 공지된 다양한 방식이 적용될 수 있다.For convenience of explanation, the data gateways 5-1, ..., and 5-N transmit data of each of the collection target servers 7-1, ..., 7-N However, the data collection method is not limited to this, and the collection data may be transmitted periodically from the collection target servers 7-1, ..., 7-N. A variety of known methods such as a receiving method can be applied.
이와 같이 구성되는 데이터 분석 시스템(1)은 사용자 기반, 상세하게로는 유저의 선택에 따라 데이터 수집, 데이터 분석 및 데이터 시각화가 이루어지도록 구성되어 사용자 중심의 서비스를 제공함으로써 기 설정된 수집방법, 분석방법 및 전시방법에 의해서만 데이터 수집, 분석 및 시각화가 고정적으로 이루어져 사용의 편의성 및 분석의 효율성이 떨어지는 종래의 문제점을 획기적으로 해결할 수 있다.The
수집대상서버(7-1), ..., (7-N)들은 소셜 네트워크 서비스(social network service), 포털 사이트, 소프트 스위치, 검색엔진 및 서버, 자동화공정의 HMI 서버 및 PLC 등으로 구성될 수 있다.The collection target servers 7-1, ..., 7-N include a social network service, a portal site, a soft switch, a search engine and a server, an HMI server of an automation process, and a PLC .
클라이언트(9-1), ..., (9-N)들은 통신망(4)의 접속을 지원하여 데이터분석 플랫폼(3)의 형식에 맞게 인자를 제공하여 데이터분석 플랫폼(3)이 제공하는 서비스를 요청할 수 있는 디지털 단말기이며, 데이터분석 플랫폼(3)에 접속하여 데이터분석 플랫폼(3)으로 데이터를 요청하며, 데이터분석 플랫폼(3)으로부터 전송받은 연산처리 데이터를 모니터에 디스플레이 한다.The clients 9-1 to 9-N support the connection of the
또한 클라이언트(9-1), ..., (9-N)들에는 웹 연동 프로그램(웹 브라우저, Netscape 등)이 설치되어 연동 프로그램을 통해 데이터분석 플랫폼(3)에 접속한다.A web interworking program (web browser, Netscape, etc.) is installed in the clients 9-1, ..., 9-N to access the
또한 클라이언트(9-1), ..., (9-N)들은 통신망(4)의 형태에 따라 유선통신모듈 또는 무선통신모듈을 구비하며, 상세하게로는 데스크톱 컴퓨터, 노트북, PDA(Personal Digital Assistant), 스마트폰, 태블릿 PC 등으로 적용될 수 있다.The clients 9-1 to 9-N are provided with a wired communication module or a wireless communication module depending on the type of the
통신망(4)은 데이터분석 플랫폼(3), 데이터 게이트웨이(5-1), ..., (5-N)들, 수집대상서버(7-1), ..., (7-N)들 및 클라이언트(9-1), ..., (9-N)들 사이의 데이터 이동경로를 제공하며, 상세하게로는 근거리 통신망(LAN), 광역통신망(WAN), 이동통신망, 3G LTE망, 4G망 등과 같은 IP를 기반으로 하는 망인 것이 바람직하다.The
데이터 게이트웨이(5-1), ..., (5-N)들은 수집대상서버(7-1), ..., (7-N)들 각각의 데이터 이동경로에 설치되어 수집대상서버(7-1), ..., (7-N)들로부터 송수신되는 데이터들을 수집한다.The data gateways 5-1 to 5-N are installed in the data movement paths of the collection target servers 7-1 to 7-N, -1), ..., (7-N).
이때 본 발명의 데이터 게이트웨이(5-1), ..., (5-N)들에 의해 수집되는 데이터는 통신데이터, 산업데이터, 소셜데이터 및 휴먼데이터로 분류되고, 통신데이터는 3G, LTE 시스템, 네트웍 장비, 보안장비, 인증서버, 소프트스위치 및 웹서버 등으로부터 수집되는 콜 트레이스 정보와 같은 통신관련 정보로 정의되고, 산업데이터는 스카다(SCADA, Supervisory Control And Data Acquisition)와 같은 자동화시스템으로부터 수집되는 시스템 로그 관련정보로 정의되고, 소셜데이터는 소셜 네트워크 서비스, 메일 등으로부터 수집되는 소셜 네트워크 서비스 관련 데이터로 정의되고, 휴먼데이터는 'PDF', 'XML', 'DOC', 'XLS', 'PPT', 'TXT', 'HWP', 'HTML' 등과 같은 문서 관련 정보로 정의된다.The data collected by the data gateways 5-1, ..., and 5-N of the present invention are classified into communication data, industrial data, social data, and human data, Related information such as call trace information collected from network equipment, security equipment, authentication server, softswitch and web server, and the industrial data is transmitted from an automation system such as SCADA (Supervisory Control And Data Acquisition) And the social data is defined as social network service related data collected from social network service and mail and the human data is defined as 'PDF', 'XML', 'DOC', 'XLS' Is defined as document related information such as 'PPT', 'TXT', 'HWP', 'HTML' and the like.
또한 데이터 게이트웨이(5-1), ..., (5-N)들은 데이터분석 플랫폼(3)의 제어에 따라 클라이언트(9-1), ..., (9-N)들에 의해 선택된 데이터 포맷에 따라 수집데이터를 변환, 즉 단일 포맷으로 수집데이터를 변환한 후 이를 주기적으로 데이터분석 플랫폼(3)으로 전송한다. 이때 클라이언트는 데이터분석 플랫폼(3)으로부터 제공받는 대시보드의 그래픽 사용자 인터페이스(GUI)를 통해 수집하고자 하는 데이터의 포맷을 입력할 수 있도록 구성되고, 데이터 포맷은 '시간', '장비명', 'HTTP', 'FTP', 'POP3', 'SMTP', 'IMAP', 'DNS' 등으로 적용될 수 있다.The data gateways 5-1, ..., and 5-N are data selected by the clients 9-1, ..., 9-N under the control of the
본 발명에 적용되는 데이터분석 플랫폼(3)은 응용프로그램이 실행될 수 있는 기초를 이루는 운영체제(Operating system), 미들웨어(middleware), 프로세서 등 하드웨어 및 소프트웨어를 포함한다.The
또한 데이터분석 플랫폼(3)은 기 제작된 그래픽 사용자 인터페이스(graphic user interface)를 포함하는 대시보드(dashboorad)를 접속된 클라이언트(9-1), ..., (9-N)들에게 웹 화면으로 제공하며, 대시보드를 통해 클라이언트로부터 데이터를 요청받으면 요청데이터에 대응되는 연산을 처리하여 연산처리 데이터를 웹 화면으로 클라이언트에게 제공한다. 이때 데이터분석 플랫폼(3)은 대시보드를 통한 클라이언트의 의사결정 및 작업분석에 적절한 함수들을 집중적으로 관리하며, 대시보드를 통해 클라이언트로부터 입력되는 데이터에 대응되는 연산을 처리한 후 이를 하나의 화면에 일괄 표시하는 대시보드를 생성하여 전시하되 클라이언트의 선택에 따른 항목별로 연산처리값을 전시함으로써 클라이언트는 자신이 원하는 항목별로 분석데이터를 일괄 요연하게 열람할 수 있게 된다.The
또한 데이터분석 플랫폼(3)은 접속된 클라이언트(9)로부터 대시보드의 그래픽 사용자 인터페이스(GUI)를 통해 수집하고자 하는 데이터의 포맷 형식을 입력받으면 데이터 게이트웨이(5-1), ..., (5-N)들로부터 전송받은 데이터들 중 입력된 포맷의 데이터들만을 추출함으로써 데이터 수집이 유저에 의하여 선택적으로 이루어지게 되고, 이에 따라 유저는 자신이 원하는 분석데이터를 열람할 수 있게 된다.The
또한 데이터분석 플랫폼(3)은 수집된 데이터들을 분석하여 가치 데이터를 검출하기 위한 복수개의 분석알고리즘들이 기 설정되어 저장되며, 데이터 수집이 완료되면 접속된 클라이언트로부터 기 설정된 분석알고리즘들 중 어느 하나를 선택받으며, 선택된 분석알고리즘을 이용하여 수집데이터를 분석한다.In addition, the
또한 데이터분석 플랫폼(3)은 클라이언트(9-1), ..., (9-N)들에게 open API(application program interface)를 제공하여 클라이언트가 자체적으로 제작한 분석알고리즘(이하 자체 분석알고리즘이라고 함)을 그래픽 사용자 인터페이스(GUI)를 통해 등록받을 수 있도록 구성되고, 클라이언트로부터 자체 분석 알고리즘을 등록받으면 등록된 분석알고리즘을 이용하여 수집데이터를 분석한다.In addition, the
즉 본 발명의 데이터분석 플랫폼(3)은 종래에서와 같이 고정된 분석알고리즘만을 사용하여 데이터 분석을 제한적으로 수행하는 것이 아니라 다양한 분석알고리즘들 중 어느 하나를 클라이언트(유저)로부터 선택받거나 또는 자체 제작한 분석알고리즘을 등록받아 선택되거나 등록된 분석 알고리즘을 이용하여 수집데이터를 분석하도록 구성됨으로써 다양한 분석이 가능해지고, 이에 따라 분석 신뢰도 및 효율성을 높일 수 있게 된다.That is, the
이때 데이터분석 플랫폼(3)에서 제공되는 대시보드의 그래픽 사용자 인터페이스(GUI)는 유저(클라이언트)(5)로부터 자체 제작된 분석라이브러리를 등록받는 등록란과, 기 설정된 분석알고리즘들 중 어느 하나를 선택하기 위한 선택란을 포함함으로써 유저는 자신이 원하는 분석알고리즘을 이용하여 수집데이터를 분석할 수 있게 된다. 즉 데이터는 다양한 포맷 및 내용을 가질 뿐만 아니라 크기가 무한하기 때문에 적용되는 분석알고리즘에 따라 동일 데이터 대비 각기 다른 분석데이터(결과값)이 검출되는 특성을 가지나, 종래에는 고정된 분석알고리즘만을 이용하여 데이터 분석이 이루어짐으로써 분석의 신뢰도 및 정확도가 떨어지게 된다. 이에 따라 본 발명에서는 유저가 분석알고리즘을 선택 또는 등록할 수 있도록 구성됨으로써 유저가 분석하고자 하는 대상에 따라 적합한 분석알고리즘이 적용될 수 있을 뿐만 아니라 동일 데이터를 활용하여 다양한 분석을 수행할 수 있어 분석의 신뢰도 및 정확도를 획기적으로 높일 수 있게 된다.At this time, the graphical user interface (GUI) of the dashboard provided in the
또한 데이터분석 플랫폼(3)은 분석알고리즘에 의해 검출된 분석데이터를 대시보드의 그래픽 사용자 인터페이스를 통해 이를 요청한 클라이언트에게 웹 화면으로 제공한다. 이때 대시보드는 클라이언트로부터 입력값 및 결과값을 입력받을 수 있으며, 입력된 입력값 및 결과값에 따른 분석데이터를 전시함으로써 클라이언트는 자신이 원하는 항목(입력값 또는 결과값)을 선택하여 분석데이터를 일목 요연하게 열람할 수 있게 된다.In addition, the
도 4는 도 3의 데이터 게이트웨이를 나타내는 블록도이다. 4 is a block diagram illustrating the data gateway of FIG.
도 4의 데이터 게이트웨이(5)는 수집대상서버(7)의 데이터 이동경로에 설치되어 수집대상서버(7)로부터 송수신되는 데이터들을 수집하며, 주기적으로 수집데이터를 데이터분석 플랫폼(3)으로 전송한다. The
또한 데이터 게이트웨이(5)는 수집대상서버(7)로부터 송수신되는 데이터들을 수집하는 데이터 수집부(51)와, 데이터 수집부(51)에 의해 수집된 데이터를 클라이언트에 의해 선택된 포맷으로 변환하는 데이터 변환부(53)와, 데이터 변환부(53)에 의하여 단일 포맷으로 변환된 수집데이터를 비동기 방식으로 처리하는 데이터 처리부(55)와, 데이터 통신을 수행하는 통신 인터페이스부(57)로 이루어진다. The
이때 포맷은 '시간', '장비명', 'HTTP', 'FTP', 'POP3', 'SMTP', 'IMAP', 'DNS' 등과 같은 다양한 카테고리들이 적용될 수 있다.In this case, various categories such as 'time', 'equipment name', 'HTTP', 'FTP', 'POP3', 'SMTP', 'IMAP', 'DNS'
데이터 수집부(51)는 전술하였던 바와 같이 통신데이터, 산업데이터, 소셜데이터 및 휴먼데이터를 수집함으로써 다양한 데이터들을 활용하여 행동패턴을 포함하는 다양한 분석데이터를 검출할 수 있게 된다.As described above, the
도 5는 도 3의 데이터분석 플랫폼을 나타내는 블록도이고, 도 6은 도 5를 설명하기 위한 예시도이다.FIG. 5 is a block diagram showing the data analysis platform of FIG. 3, and FIG. 6 is an exemplary diagram for explaining FIG. 5. FIG.
도 5와 6의 데이터분석 플랫폼(3)은 데이터들이 저장되는 데이터베이스부(32)와, 외부와 데이터를 송수신하는 통신 인터페이스부(33)와, 통신 인터페이스부(33)를 통해 전송받은 수집데이터들을 클라이언트(9)에 의해 선택되거나 등록된 분석알고리즘을 이용하여 분석하는 데이터 분석부(35)와, 데이터 분석부(35)에 의해 분석된 분석데이터를 다중 벡터화하여 대시보드를 생성한 후 이를 클라이언트가 원하는 형태로 시각화하여 디스플레이 하는 대시보드 관리부(37)와, 이들 제어대상(32), (33), (35), (37)들을 관리 및 제어하는 제어부(31)로 이루어진다. The
제어부(31)는 데이터분석 플랫폼(3)의 O.S(operating system)이며, 제어대상(32), (33), (35), (37)들을 관리 및 제어한다.The
또한 제어부(31)는 대시보드의 그래픽 사용자 인터페이스(GUI)를 통해 클라이언트(9-1), ..., (9-N)들로부터 수집하고자 하는 데이터의 포맷 정보를 입력받으면 입력된 포맷 정보를 데이터 게이트웨이(5)로 전송한다. 이때 데이터 게이트웨이(5)는 데이터분석 플랫폼(3)의 제어에 따라 클라이언트(9-1), ..., (9-N)들로부터 입력된 포맷 정보에 대응되는 데이터들을 수집한다.The
또한 제어부(31)는 통신 인터페이스부(33)를 통해 데이터 게이트웨이(5-1), ..., (5-N)들로부터 수집데이터를 전송받으면 전송받은 수집데이터를 데이터베이스부(32)에 임시 저장한다.When receiving the collected data from the data gateways 5-1, ..., and 5-N through the
또한 제어부(31)는 통신 인터페이스부(33)를 통해 데이터 게이트웨이(5-1), ..., (5-N)들로부터 전송받은 수집데이터를 데이터 분석부(35)로 입력한다.The
또한 제어부(31)는 대시보드의 그래픽 사용자 인터페이스를 통해 클라이언트(9)로부터 기 설정된 분석알고리즘들 중 어느 하나가 선택되거나 또는 자체 분석알고리즘이 등록되면 선택되거나 또는 등록된 분석알고리즘을 이용하여 수집데이터를 분석하도록 데이터 분석부(35)를 제어한다.Further, the
데이터베이스부(32)에는 수집데이터들이 필드별로 분리되어 임시 저장된다.The collected data is temporarily stored in the
또한 데이터베이스부(32)에는 기 설정된 분석알고리즘들이 저장된다. 이때 기 설정된 분석 알고리즘으로는 산업용 장비(scada)의 다양한 시스템 로그를 분석할 수 있는 알고리즘, 지능형 연관 검색으로 다양한 추천서비스를 지원할 수 있는 FP-Growth 및 CF 알고리즘 등과 같은 공지된 다양한 분석알고리즘들이 적용될 수 있다.The
또한 데이터베이스부(32)에는 기 제작된 그래픽 사용자 인터페이스들이 저장된다.The
도 7은 도 3의 데이터 분석부를 나타내는 블록도이다.FIG. 7 is a block diagram showing the data analysis unit of FIG. 3. FIG.
데이터 분석부(35)는 도 7에 도시된 바와 같이 클라이언트(9)로부터 기 설정된 분석알고리즘들 중 어느 하나가 선택되거나 또는 클라이언트(9)에 의해 자체 제작된 분석알고리즘이 등록되면 선택되거나 등록된 분석알고리즘을 이용하여 수집데이터를 분석하는 데이터 분석엔진모듈(351)과, 기 설정된 패턴 분석알고리즘을 이용하여 수집데이터를 분석하는 패턴분석모듈(353)로 이루어진다.The
또한 데이터 분석부(35)에 의해 분석된 데이터는 대시보드 관리부(37)에 의하여 대시보드로 생성된 후 대시보드의 그래픽 사용자 인터페이스를 통해 웹 화면으로 클라이언트(9)에게 제공된다.The data analyzed by the
도 8은 대시보드 관리부를 나타내는 블록도이다.8 is a block diagram showing a dashboard management unit.
대시보드 관리부(37)는 사용자로부터 입력된 입력값에 따른 연산 함수를 호출함과 동시에 데이터 분석부(35)에 의해 분석된 분석데이터를 활용하여 분석대상 항목별 분석값(예 : 주기별 로그 횟수, 시간별 불량률 등)을 산출할 수 있는 연산처리모듈(371)과, 연산처리모듈(371)에 의해 연산 처리된 결과값을 클라이언트로부터 입력된 입력 포맷 및 결과 포맷에 따라 전시되는 대시보드를 생성하는 대시보드 생성모듈(373)로 이루어진다.The
도 9는 도 8의 대시보드 관리부에 의해 생성되는 대시보드의 그래픽 사용자 인터페이스를 활용하여 사용자가 데이터 포맷을 자유로이 정의하는 기능을 설명하기 위한 예시도이고, 도 10은 도 8의 대시보드 관리부에 의해 생성되는 대시보드의 그래픽 사용자 인터페이스를 활용하여 사용자가 사용하고자 하는 알고리즘 타입을 자유로이 정의하는 기능을 설명하기 위한 예시도이고, 도 11은 도 8의 대시보드 관리부에 의해 생성되는 대시보드의 그래픽 사용자 인터페이스를 활용하여 사용자가 표출하고자 하는 형태로 대시보드 타입을 자유로이 정의하는 기능을 설명하기 위한 예시도이다.FIG. 9 is an exemplary view for explaining a function of a user to freely define a data format by utilizing a graphical user interface of a dashboard generated by the dashboard management unit of FIG. 8; FIG. FIG. 11 is a diagram illustrating an example of a function for freely defining an algorithm type that a user intends to use by utilizing a graphical user interface of a dashboard to be generated. FIG. 11 is a graphical user interface The user can freely define the dashboard type in a format that the user wants to express.
도 9의 그래픽 사용자 인터페이스(200)는 클라이언트(9-1), ..., (9-N)들로부터 수집하고자 하는 데이터의 포맷(입력포맷 또는 출력포맷)을 입력받기 위한 입력란(201)과, 입력된 포맷의 타입을 입력받는 타입 입력란(203)을 포함한다. The
이때 포맷의 타입은 공지된 바와 같이 '정수형(int)', '실수형(float)', '나열형(string)', '불린형(boolean)' 등으로 적용될 수 있다.At this time, the type of the format can be applied as 'int', 'float', 'string', 'boolean', etc. as is well known.
도 10의 그래픽 사용자 인터페이스(300)는 클라이언트(9-1), ..., (9-N)들로부터 기 설정된 분석알고리즘들 중 어느 하나를 입력받는 알고리즘 선택란(301)과, 자체 분석알고리즘을 등록받는 등록란(303)과, 분석알고리즘에 의해 생성될 데이터를 정의하는 정의란(305)을 포함한다.The
정의란(305)은 결과값의 명칭을 입력받는 명칭 입력란(351)과, 데이터 타입을 입력받는 타입 입력란(353)을 포함한다.The
도 11의 그래픽 사용자 인터페이스(400)는 데이터 분석부(35)에 검출된 분석데이터를 전시하는 전시창(401)들과, 분석데이터를 전시하기 위한 방식을 입력받는 전시방식 목록(403)과, 입력포맷 및 출력포맷을 선택받기 위한 입출력 포맷 목록(405)과, 전시방법 목록들 각각을 나타내는 샘플 그래프(471)들이 전시되는 전시창(407)을 포함한다.The
전시방식 목록(403)은 공지된 바와 같이 '바(bar) 차트', '라인(line) 차트', 파이(pie) 차트', '테이블(table)' 등과 같은 다양한 전시방식들 중 적어도 하나 이상을 포함한다. 이때 클라이언트는 전시방식 목록(403)들 중 자신이 원하는 전시방식의 목록을 클릭한 상태로 드래그하면 그래픽 사용자 인터페이스(400)는 드래그 된 전시방식이 선택되었다고 판단한다.The
입출력포맷 목록(405)은 입력포맷 및 출력포맷을 입력받는다. 이때 입출력포맷 목록(405)들 중 어느 하나가 전술하였던 샘플그래프(471)들 중 어느 하나의 X축(입력 포맷란)으로 드래그 되면 해당 목록을 X축(입력포맷)으로, 입출력포맷 목록(405)들 중 어느 하나가 전술하였던 샘플그래프(471)들 중 어느 하나의 Y축(출력 포맷란)으로 드래그 되면 해당 목록을 Y축(출력포맷)으로 하여 분석데이터가 전시됨으로써 클라이언트(유저)는 자신이 원하는 전시방식 및 항목별로 분석데이터를 일목요연하게 열람할 수 있게 된다.The input /
1:데이터 분석 시스템 3:데이터 분석 플랫폼
5-1, ..., 5-N:데이터 게이트웨이 7-1, ..., 7-N:수집대상서버
9-1, ..., 9-N:클라이언트 31:제어부
32:데이터베이스부 33:통신인터페이스부
35:데이터분석부 37:대시보드 관리부
51:수집부 53:데이터변환부
55:데이터처리부 57:통신 인터페이스부1: Data Analysis System 3: Data Analysis Platform
5-1, ..., 5-N: data gateway 7-1, ..., 7-N:
9-1, ..., 9-N: client 31:
32: Database part 33: Communication interface part
35: Data analysis unit 37: Dashboard management unit
51: Collecting unit 53: Data conversion unit
55: Data processing unit 57: Communication interface unit
Claims (11)
상기 데이터 분석 시스템은
상기 수집대상서버들로부터 데이터를 수집하는 데이터 수집부와, 상기 데이터 수집부에 의해 수집된 데이터를 분석하는 데이터 분석부와, 상기 데이터 분석부에 의해 분석된 데이터가 전시되는 그래픽 사용자 인터페이스(GUI)를 포함하는 대시보드(dashboard)를 생성하는 대시보드 관리부를 포함하는 데이터분석 플랫폼;
상기 데이터분석 플랫폼에 접속하여 상기 대시보드의 그래픽 사용자 인터페이스를 다운로드 받아 열람하는 클라이언트들을 포함하고,
상기 대시보드는 상기 클라이언트들로부터 상기 데이터 분석부에 활용되는 기 설정된 분석알고리즘들 중 어느 하나를 선택받도록 구성되고, 상기 데이터분석 플랫폼의 상기 데이터 분석부는 상기 대시보드를 통해 상기 클라이언트들로부터 선택된 분석알고리즘을 이용하여 데이터 분석을 수행하고,
상기 데이터분석 플랫폼은 상기 클라이언트들에게 open API(application program interface)를 제공하여 상기 클라이언트들로부터 상기 대시보드를 통해 자체 제작한 분석알고리즘을 등록받으며,
상기 데이터 분석부는 상기 클라이언트들로부터 상기 대시보드를 통해 자체 가 분석알고리즘을 등록받으면 등록된 분석알고리즘을 활용하여 데이터 분석을 수행하는 것을 특징으로 하는 데이터 분석 시스템.A data analysis system for collecting and analyzing data from collection target servers and providing the analyzed data, which has been analyzed, to connected clients, comprising:
The data analysis system
A data analyzer for analyzing data collected by the data collector; a graphical user interface (GUI) for displaying data analyzed by the data analyzer; A data analysis platform that includes a dashboard management unit that generates a dashboard including the dashboard;
And a client connected to the data analysis platform to download and view the graphical user interface of the dashboard,
Wherein the dashboard is configured to select one of predetermined analysis algorithms used in the data analysis unit from the clients and the data analysis unit of the data analysis platform analyzes the analysis algorithm selected from the clients through the dashboard The data analysis is carried out using the < RTI ID = 0.0 >
The data analysis platform provides an open API (application program interface) to the clients to register their own analysis algorithms through the dashboard from the clients,
Wherein the data analysis unit performs data analysis using the registered analysis algorithm when the analysis algorithms are registered by the clients through the dashboard.
The data analysis system according to claim 3, wherein the data collection unit is a gateway installed in a data movement path of each of the collection target servers.
상기 데이터 수집부는 상기 대시보드를 통해 상기 클라이언트들로부터 데이터 포맷을 입력받으면 입력받은 데이터 포맷에 대응되는 데이터를 수집하고,
상기 데이터 포맷은 '시간', '장비명', 'HTTP', 'FTP', 'POP3', 'SMTP', 'IMAP', 'DNS'들 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 데이터 분석 시스템.The method of any one of claims 1, 3, and 4, wherein the dashboard receives a format of data to be collected from the clients,
The data collection unit collects data corresponding to the input data format when receiving the data format from the clients through the dashboard,
Wherein the data format includes at least one of time, equipment name, HTTP, FTP, POP3, SMTP, IMAP, and DNS. system.
The method according to claim 5, wherein the dashboard management unit generates a dashboard for displaying data analyzed by the data analysis unit, and the generated dashboard inputs any one of preset display methods from the clients Wherein the dashboard management unit displays the analyzed data according to the display method input through the generated dashboard.
The method according to claim 6, wherein the predetermined display methods include at least one of a bar chart, a line chart, a pie chart, and a table Wherein the data analysis system comprises:
상기 대시보드 관리부는 상기 생성된 대시보드의 상기 입력란을 통해 입력포맷 및 출력포맷이 입력되면 입력된 입력포맷 및 출력포맷에 따라, '바(bar) 차트', '라인(line) 차트', 파이(pie) 차트', '테이블(table)'들 중 상기 클라이언트들로부터 입력된 어느 하나로 상기 분석된 데이터를 전시하는 것을 특징으로 하는 데이터 분석 시스템.
The method of claim 7, wherein the generated dashboard includes a field for receiving an input format and an output format for the analyzed data from the clients,
If the input format and the output format are inputted through the input field of the generated dashboard, the dashboard management unit may generate a bar chart, a line chart, a pie chart, and displays the analyzed data in any one of the pie charts and tables received from the clients.
The method of claim 8, wherein the generated dashboard includes a display method list in which a list of the predetermined display methods is displayed, and an exhibition window in which a sample graph representing each of the display methods is displayed, Wherein when one of the display method lists is dragged in a clicked state, it is determined that the dragged display method is input from the client.
The method of claim 9, wherein the generated dashboard includes an input format list in which a list of the input formats is displayed and an output format list in which a list of the output formats is displayed, If any one of the format lists is clicked and dragged to an input format column or an output format column of one of the display windows, the input format or output format of the display method is input as a dragged input format or an output format The data analysis system comprising:
The method according to claim 10, wherein when the predetermined display methods are 'bar chart', 'line chart', or 'pie chart', the input format column is 'X' Axis is set to a Y axis.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150005966A KR101595024B1 (en) | 2015-01-13 | 2015-01-13 | data analyzing system based on user intent |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150005966A KR101595024B1 (en) | 2015-01-13 | 2015-01-13 | data analyzing system based on user intent |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101595024B1 true KR101595024B1 (en) | 2016-02-17 |
Family
ID=55457812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150005966A KR101595024B1 (en) | 2015-01-13 | 2015-01-13 | data analyzing system based on user intent |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101595024B1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10248304B2 (en) | 2016-11-30 | 2019-04-02 | Lsis Co., Ltd. | Method for displaying monitoring screen at a display location |
KR102396387B1 (en) * | 2021-12-14 | 2022-05-10 | 한국인터넷진흥원 | Method and for tracking trend of crime slang, apparatus and computer program for performing the method |
WO2022107995A1 (en) * | 2020-11-23 | 2022-05-27 | (주)피씨엔 | Integrated data processing method and device for big data cross model |
KR102569704B1 (en) * | 2023-04-07 | 2023-08-25 | (주)디에스티인터내셔널 | Apparatus and method for activating user-customized heterogeneous big data real-time dashboard |
-
2015
- 2015-01-13 KR KR1020150005966A patent/KR101595024B1/en active IP Right Grant
Non-Patent Citations (1)
Title |
---|
M. Kreuseler외 2. A History Mechanism for Visual Data Mining. 2004.* * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10248304B2 (en) | 2016-11-30 | 2019-04-02 | Lsis Co., Ltd. | Method for displaying monitoring screen at a display location |
WO2022107995A1 (en) * | 2020-11-23 | 2022-05-27 | (주)피씨엔 | Integrated data processing method and device for big data cross model |
KR102396387B1 (en) * | 2021-12-14 | 2022-05-10 | 한국인터넷진흥원 | Method and for tracking trend of crime slang, apparatus and computer program for performing the method |
WO2023113157A1 (en) * | 2021-12-14 | 2023-06-22 | 한국인터넷진흥원 | Method for tracking variation of criminal slang, and apparatus and computer program performing same |
KR102569704B1 (en) * | 2023-04-07 | 2023-08-25 | (주)디에스티인터내셔널 | Apparatus and method for activating user-customized heterogeneous big data real-time dashboard |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11188545B2 (en) | Automated measurement of content quality | |
KR101595024B1 (en) | data analyzing system based on user intent | |
CN109388791B (en) | Dynamic diagram display method and device, computer equipment and storage medium | |
US20200337632A1 (en) | Research performance framework | |
KR20100095208A (en) | System and method for tracking webpage click information | |
CN102087577A (en) | Location independent execution of user interface operations | |
JP2002334101A (en) | Computer system to provide web page suitable for user | |
Trilles et al. | Real-time anomaly detection from environmental data streams | |
JP6712211B2 (en) | Data providing apparatus and data providing method | |
US20130124687A1 (en) | Apparatus and method for detecting modified uniform resource locator | |
KR101973328B1 (en) | Correlation analysis and visualization method of Hadoop based machine tool environmental data | |
CN107145508B (en) | Website data processing method, device and system | |
JP2018072958A5 (en) | ||
US20150154279A1 (en) | Apparatus and method for building relation model based on resource management architecture | |
Sik et al. | Toward cognitive data analysis with big data environment | |
CN116298799A (en) | Multi-interface linkage display method and system for chip test | |
Kumar et al. | A brief investigation on web usage mining tools (WUM) | |
US9536199B1 (en) | Recommendations based on device usage | |
JP2008226017A (en) | Log information generation device and method, log information management device and method, and log information management method and program | |
US12056139B2 (en) | Computerized system and method for automatically detecting anomalies in distributed SCADA systems and dynamically displaying a unified interface therefrom | |
CN111767447A (en) | Method and device for determining user traffic path | |
JP2006350673A (en) | Optimization calculation system | |
Ferraz et al. | Internet of things with Web technologies solution for flood notification in Sao Paulo | |
JP2019105977A (en) | Gateway device, client server system, and program | |
JP2002334248A (en) | Computer system judging customer type in real time |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190211 Year of fee payment: 4 |