KR101645396B1 - Method of processing time-series big data and system thereof - Google Patents
Method of processing time-series big data and system thereof Download PDFInfo
- Publication number
- KR101645396B1 KR101645396B1 KR1020150020464A KR20150020464A KR101645396B1 KR 101645396 B1 KR101645396 B1 KR 101645396B1 KR 1020150020464 A KR1020150020464 A KR 1020150020464A KR 20150020464 A KR20150020464 A KR 20150020464A KR 101645396 B1 KR101645396 B1 KR 101645396B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- field
- event data
- event
- acquisition date
- Prior art date
Links
Images
Classifications
-
- G06F17/30312—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Abstract
Description
본 발명은 빅데이터 처리 방법과 그 시스템에 관한 것으로서, 보다 상세하게는 시계열 빅데이터에 산재되어 있는 다양한 수준의 유의미한 정보를 추출 및 분석할 수 있는 빅데이터 처리 방법과 그 시스템에 관한 것이다.
BACKGROUND OF THE
빅데이터는 일반적인 데이터베이스 시스템으로는 수집, 저장 및 분석하기 어려운 방대한 양의 데이터를 의미한다. 빅데이터의 예로는, 소셜 미디어, 소셜 네트워크 서비스에서 발생하는 소셜 데이터, 네트워크 트래픽 로그 및 웹 서버나 응용 프로그램의 웹 로그, 센서 장비에 의해 획득되는 센싱 데이터와 로그, 차량 운행 데이터(vehicle driving data), 기상 데이터 등을 들 수 있다.Big data is a vast amount of data that is difficult to collect, store, and analyze with a typical database system. Examples of big data include social data generated from social network services, network traffic logs, web logs of web servers and application programs, sensing data and logs obtained by sensor equipment, vehicle driving data, , Weather data, and the like.
상기 센싱 데이터, 차량 운행 데이터, 기상 데이터 등과 같은 시계열 데이터(time-series data)를 포함하는 빅데이터는, 시간이 지날수록 다루어야 할 데이터의 크기가 폭발적으로 증가하게 되고 시간의 흐름에 따라 여러 패턴이 형성및 반복되어 다양한 수준의 유의미한 정보들을 내재하게 된다.Big data including time-series data such as sensing data, vehicle driving data, weather data, etc., explosively increase the size of data to be handled over time, and various patterns Formation, and repetition of various levels of meaningful information.
따라서, 이와 같이 방대한 양의 시계열 빅데이터로부터 다양한 수준의 정보들을 신속하게 추출하여 관리자 또는 사용자에게 제공할 수 있는 빅데이터 처리 방법 및 시스템의 개발이 필요하다.
Therefore, it is necessary to develop a big data processing method and system capable of rapidly extracting various levels of information from the vast amount of time series big data and providing it to the manager or the user.
본 발명의 기술적 사상이 이루고자 하는 기술적 과제는, 시계열 빅데이터에 산재된 다양한 수준의 정보들을 신속하게 추출하여 관리자 또는 사용자에게 제공할 수 있는 빅데이터 처리 방법 및 그 시스템을 제공하는 것이다.
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and it is an object of the present invention to provide a large data processing method and system capable of rapidly extracting various levels of information scattered in time series big data and providing the same to an administrator or a user.
본 발명의 기술적 사상에 의한 일 양태에 따른 빅데이터 처리 방법은, 빅데이터의 로우(raw) 데이터들을 이용하여 상기 로우 데이터들의 획득 일시와 연관된 키(key) 및 값(value)으로 구성되는 하위 계층의 이벤트 데이터들을 생성하는 단계; 상기 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅(sorting)하여, 상기 키들 각각에 대해 획득 일시 순서대로 정렬된 값들을 갖는 리스트들을 생성하는 단계; 및 상기 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성하는 단계;를 포함한다.
A big data processing method according to an aspect of the present invention is a method for processing a big data by using raw data of big data and generating a key data and a value associated with an acquisition date and time of the raw data, Generating event data of the first data stream; Sorting the event data of the lower layer based on the key and generating lists having values arranged in order of acquisition date and time for each of the keys; And generating event data of an upper layer using the lists.
본 발명의 기술적 사상에 의한 다른 양태에 따른 빅데이터 처리 시스템은, 시계열 빅데이터를 처리 및 분석하는 시스템으로, 상기 시계열 빅데이터를 저장하는 빅데이터 저장부; 및 상기 시계열 빅데이터의 로우 데이터들을 이용하여 상기 로우 데이터들이 나타내는 의미에 관한 하위 계층의 이벤트 데이터들을 생성하고, 상기 하위 계층의 이벤트 데이터들을 이용하여 상기 하위 계층의 이벤트 데이터들이 나타내는 의미에 관한 상위 계층의 이벤트 데이터들을 생성하는 이벤트 데이터 생성부;를 포함한다.
According to another aspect of the present invention, there is provided a big data processing system for processing and analyzing time series big data, comprising: a big data storage unit storing the time series big data; And generating event data of a lower layer related to the meaning indicated by the row data using the row data of the time series big data, and using the event data of the lower layer, And an event data generator for generating event data of the event data.
본 발명의 기술적 사상에 의한 빅데이터 처리 방법 및 그 시스템은, 시계열 빅데이터를 구성하는 로우 데이터들 각각에 내재된 기초적 정보, 추출된 기초적 정보들에 내재된 상위 정보, 나아가 상위 정보들에 내재된 그 이상 수준의 상위 정보들과 관련된 이벤트 데이터들 각각을 계층적으로 신속하게 추출할 수 있고, 추출된 이벤트 데이터들 또는 이벤트 데이터들을 분석한 결과정보를 관리자 또는 사용자에게 제공하여 관리자 또는 사용자의 효율적인 빅데이터 이용, 정확한 의사결정을 가능하게 할 수 있다.
The method and system for processing big data according to the technical idea of the present invention is characterized in that basic information contained in each row data constituting time series big data, upper information inherent in extracted basic information, It is possible to hierarchically and quickly extract each of the event data related to the upper level information of the higher level and analyze the extracted event data or event data to provide information to the manager or the user, Data usage, and accurate decision making.
본 발명의 상세한 설명에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 간단한 설명이 제공된다.
도 1은 본 발명의 기술적 사상에 의한 일 실시예에 따른 빅데이터 처리 시스템을 설명하기 위한 도면이다.
도 2는 본 발명의 기술적 사상에 의한 일 실시예에 따른 빅데이터 처리 시스템의 이벤트 데이터 생성부에서 수행되는 빅데이터 처리 방법을 설명하기 위한 순서도이다.
도 3 내지 도 6은 도 2의 빅데이터 처리 방법의 각 단계들을 보다 상세히 설명하기 위한 순서도들이며, 도 7 및 도 8은 도 2의 빅데이터 처리 방법의 각 단계들에서 일부 데이터들의 상태를 예시한 도면이다.BRIEF DESCRIPTION OF THE DRAWINGS A brief description of each drawing is provided to more fully understand the drawings recited in the description of the invention.
FIG. 1 is a diagram for explaining a big data processing system according to an embodiment of the present invention.
2 is a flowchart illustrating a method of processing big data performed in an event data generating unit of a big data processing system according to an embodiment of the present invention.
FIGS. 3 to 6 are flowcharts for explaining each step of the big data processing method of FIG. 2 in more detail; FIGS. 7 and 8 are diagrams illustrating states of some data in each step of the big data processing method of FIG. FIG.
이하, 첨부 도면을 참조하여 본 발명의 실시예들을 상세히 설명한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고, 이들에 대한 중복된 설명은 생략한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. The same reference numerals are used for the same constituent elements in the drawings, and a duplicate description thereof will be omitted.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것으로, 아래의 실시예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 아래의 실시예들로 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하며 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.Embodiments of the present invention will now be described more fully hereinafter with reference to the accompanying drawings, in which exemplary embodiments of the invention are shown. These embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of the invention to those skilled in the art. The present invention is not limited to the following embodiments. Rather, these embodiments are provided so that this disclosure will be more thorough and complete, and will fully convey the concept of the invention to those skilled in the art.
본 발명의 실시예들을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다. 또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.In the following description of the embodiments of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. In addition, numerals (e.g., first, second, etc.) used in the description of the present invention are merely an identifier for distinguishing one component from another. Also, in this specification, when an element is referred to as being "connected" or "connected" with another element, the element may be directly connected or directly connected to the other element, It should be understood that, unless an opposite description is present, it may be connected or connected via another element in the middle.
그리고, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 실시예들을 적절히 표현하기 위해 사용된 용어들로서, 이는 사용자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
The terminologies used herein are terms used to properly represent embodiments of the present invention, which may vary depending on the user, intent of the operator, or custom in the field to which the present invention belongs. Therefore, the definitions of these terms should be based on the contents throughout this specification. Like reference symbols in the drawings denote like elements.
도 1은 본 발명의 기술적 사상에 의한 일 실시예에 따른 빅데이터 처리 시스템을 설명하기 위한 도면이다.FIG. 1 is a diagram for explaining a big data processing system according to an embodiment of the present invention.
도 1을 참조하면, 빅데이터 처리 시스템(100)은 빅데이터 저장부(110), 이벤트 데이터 생성부(130) 및 분석부(150)를 포함할 수 있다. 도 1에 도시되지는 않았으나, 빅데이터 처리 시스템(100)은 빅데이터 저장부(100)의 전단에서 입력된 시계열 데이터들을 빅데이터 저장부(100)에 적합하도록 처리하는 전처리부, 및 분석부(150) 후단에서 처리 및 분석된 데이터들을 관리자 또는 사용자의 이용에 적합하도록 처리하는 후처리부를 더 포함할 수 있다. 이하에서는 설명의 편의를 위해 상기 전처리부 및 후처리부 대한 상세한 설명은 생략한다. Referring to FIG. 1, the big
빅데이터 저장부(100)는, 입력된 시계열 데이터들을 저장할 수 있다. 상기 시계열 데이터들 각각은 해당 데이터가 획득된 시간, 일자 등에 대한 획득 일시 필드, 해당 데이터와 연관된 기기, 기기의 사용자 등을 식별하기 위한 식별자 필드, 해당 일시에 획득된 수치 정보에 대한 수치 필드 등을 포함할 수 있다. 상기 시계열 데이터들은 각각이 획득된 순간에서의 1차적인 의미를 내재할 수 있고, 획득 주기보다 장기적인 관점에서 상기 1차적인 의미보다 상위 계층, 즉 더 높은 수준의 의미들을 내재할 수 있다.The big
일부 실시예에서, 상기 시계열 데이터는 소정의 주기로 획득되는 차량 운행 데이터일 수 있다. 상기 차량 운행 데이터는, VDR(Vehicle Driving Recorder), 센서, 블랙박스 등과 같이 차량에 장착되는 장비를 통해 직접적으로 획득되는 속도, 가속도, RPM 등의 차량 운행 관련 정보를 포함할 수 있다. 또는 상기 차량 운행 데이터는, 차량에 탑승한 탑승자가 소지한 사용자 단말(예를 들어, 스마트폰 등)을 통해 간접적으로 획득되는 차량 운행 관련 정보(예를 들어, 스마트폰에 탑재된 GPS 센서, 가속도 센서 등을 통해 획득 가능한 위치, 속도, 가속도 등)을 포함할 수도 있다. 여기서, 차량 운행 데이터는 획득 주기마다 운행자의 과속 여부, 급가속 여부 등을 나타내는 1차적인 의미를 내재할 수 있으며, 획득 주기보다 장기적인 관점에서 연속 과속 여부, 운전 습관/성향 등을 나타내는 상위 계층의 의미들을 내재할 수 있다.In some embodiments, the time series data may be vehicle driving data obtained at a predetermined cycle. The vehicle driving data may include vehicle driving related information such as speed, acceleration, and RPM directly obtained through equipment mounted on the vehicle such as a VDR (Vehicle Driving Recorder), a sensor, and a black box. Alternatively, the vehicle operation data may include vehicle operation related information (for example, a GPS sensor mounted on the smartphone, acceleration (acceleration), etc.) indirectly obtained through a user terminal (e.g., smart phone or the like) Position, velocity, acceleration, etc., obtainable via sensors, etc.). Here, the vehicle driving data may have a primary meaning indicating whether the driver is overspeed or rapidly accelerated at each acquisition period, and the vehicle speed data may have a primary meaning indicating whether the driver is overspeed, driving habit / Meanings can be inherent.
다른 실시예에서, 상기 시계열 데이터는, 특정 지역이나 공간상에서 주변 환경 및/또는 사물 인식 정보를 수집하기 위한 센서 네트워크의 각 센서 노드로부터 소정의 주기로 획득되는 센싱 데이터일 수 있다. 상기 센서 네트워크는, 빌딩, 주차장, 대형마켓, 공장, 발전소 등을 관리 및 운영하기 위한 네트워크일 수 있으며, 상기 센싱 데이터는 대응하는 센서에서 획득된 소정의 정보를 포함할 수 있다. 여기서, 상기 센서 네트워크가 발전소의 관리 및 운영을 위해 구현된 네트워크이고, 상기 센싱 데이터가 발전 설비의 상태를 감지하기 위한 센서로부터 획득된 데이터인 경우, 상기 센싱 데이터는 획득 주기 별로 발전 설비의 동작 상태를 나타내는 1차적인 의미를 내재할 수 있으며, 획득 주기보다 장기적인 관점에서 발전 설비의 고장 여부 등을 나타내는 상위 계층의 의미들을 내재할 수 있다.In another embodiment, the time series data may be sensed data acquired from each sensor node of the sensor network in a predetermined period to collect surrounding information and / or object recognition information in a specific region or space. The sensor network may be a network for managing and operating a building, a parking lot, a large market, a factory, a power plant, etc., and the sensing data may include predetermined information obtained from a corresponding sensor. Here, if the sensor network is a network implemented for management and operation of a power plant, and the sensing data is data obtained from a sensor for sensing the state of the power generation facility, the sensing data may include an operation state , And it can include the meaning of the upper layer indicating whether the power generation facility is failed or not from the viewpoint of the long term rather than the acquisition cycle.
또 다른 실시예에서, 상기 시계열 데이터는, 강우량, 적설량, 지진 발생 횟수, 기온 변화, 미세먼지 농도 등과 관련된 기상 연관 데이터, 국민총생산액, 물가지수, 총 수출액 등의 경제활동과 관련된 이코노믹 연관 데이터, 특정 기업체의 상품 판매량, 상품 광고액 등과 관련된 마케팅 연관 데이터, 총인구, 인구증가율 등과 관련된 인구(demographic) 연관 데이터, 교통량, 교통사고 건수, 범죄 발생 수 등과 같은 소셜 연관 데이터일 수 있으며, 상술한 데이터들은 획득 주기마다의 1차적인 의미와 획득 주기보다 장기적인 관점에서 더 높은 수준의 의미를 내재할 수 있다.In another embodiment, the time-series data includes at least one of economic related data related to economic activities such as rainfall, snowfall, number of earthquake occurrences, temperature change, weather related data related to fine dust concentration, total gross production value, Related data such as demographic related data related to the sales amount of the commodity of the specific company, the marketing related data related to the product advertisement amount, the total population, the population growth rate, the traffic volume, the traffic accident number, The primary meaning for each acquisition cycle and the higher level of significance from a longer-term perspective than the acquisition cycle can be implied.
빅데이터 저장부(100)는, 저장된 시계열 데이터들을 로우(raw) 형태로 이벤트 데이터 생성부(130)에 전달할 수 있고, 이벤트 데이터 생성부(130)에서 생성된 하위, 상위, 차상위 계층의 이벤트 데이터들을 저장할 수 있다.The big
빅데이터 저장부(110)는, 저장 수단(도시 생략) 및 관리 수단(도시 생략)을 포함하는 분산 파일 시스템(distributed file system), 예를 들어 하둡(hadoop) 분산 파일 시스템으로 구성될 수 있다. 상기 저장 수단은, 예를 들어 물리적으로 떨어져 있는 여러 개의 스토리지들로 구성될 수 있으며, 각각의 스토리지들이 입력된 시계열 데이터들, 계층적인 이벤트 데이터들을 상호 공유 및 저장할 수 있다. 상기 관리 수단은 상기 저장 수단의 상기 시계열 데이터 저장, 상기 저장 수단으로부터 이벤트 데이터 생성부(130)로의 상기 시계열 데이터의 출력 및 이벤트 데이터 생성부(130)로부터 상기 저장 수단으로의 계층적인 이벤트 데이터들의 입력 등을 제어할 수 있다. 그러나 본 발명의 기술적 사상이 이에 한정되는 것은 아니며, 빅데이터 저장부(110)는 빅데이터를 저장하기 위한 클라우드 파일 저장 시스템, 네트워크 저장 시스템 등으로 구성될 수도 있다.
The big
이벤트 데이터 생성부(130)는, 빅데이터 저장부(110)로부터 시계열 데이터들을 로우 형태(이하 로우 데이터라 칭함)로 입력 받을 수 있다. 이벤트 데이터 생성부(130)는, 빅데이터에 내재된 다양한 수준의 의미들을 추출 및 분석하기 위해, 하위 계층의 데이터로부터 상위 계층의 데이터까지 다양한 계층의 이벤트 데이터들을 생성할 수 있다.The event
상세하게는, 이벤트 데이터 생성부(130)는 로우 데이터들을 이용하여 로우 데이터들 각각이 나타내는 의미에 관한 하위 계층의 이벤트 데이터들을 생성할 수 있고, 하위 계층의 이벤트 데이터들을 이용하여 하위 계층의 이벤트 데이터들이 나타내는 의미에 관한 상위 계층의 이벤트 데이터들을 생성할 수 있다. 또한, 이벤트 데이터 생성부(130)는 생성된 상위 계층의 이벤트 데이터들을 기초로 차상위 계층의 이벤트 데이터들을 생성할 수 있다. 이와 같이, 이벤트 데이터 생성부(130)는 기 생성된 낮은 수준의 이벤트 데이터들을 기초로 더 높은 수준의 이벤트 데이터들을 계속적으로 생성할 수 있다.In more detail, the
이벤트 데이터 생성부(130)는, 계층적으로 이벤트 데이터들을 생성함에 있어서, 예를 들어 맵-리듀스 메커니즘을 이용할 수 있다.The event
이벤트 데이터 생성부(130)의 계층적인 이벤트 데이터 생성 프로세스에 대해서는 이하에서 도 2 내지 도 8을 참조하여 더 상세히 설명하기로 한다.
The hierarchical event data generation process of the event
분석부(150)는, 빅데이터 저장부(110)에 저장된 상기 로우 데이터, 상기 계층 이벤트 데이터들 중 적어도 하나를 이용하여 상기 빅데이터가 나타내는 의미에 관한 분석결과정보를 생성할 수 있다. 분석부(150)는, 다양한 데이터 마이닝 분석 기법을 통해 상기 로우 데이터, 상기 계층 이벤트 데이터들 중 적어도 하나를 분석하여 상기 분석결과정보를 생성할 수 있다.The
분석부(150)는, 상기 분석결과정보를 관리자 또는 사용자에게 전달하여 관리자 또는 사용자의 빅데이터 이용, 의사 결정을 도울 수 있다. 한편, 도 1에 도시되지는 않았으나, 구현예에 따라서 분석부(150)는 상기 로우 데이터, 상기 계층 이벤트 데이터들 자체를 관리자 또는 사용자에게 전달하여 관리자 또는 사용자의 빅데이터 이용, 의사 결정을 도울 수도 있다.
The
도 2는 본 발명의 기술적 사상에 의한 일 실시예에 따른 빅데이터 처리 시스템의 이벤트 데이터 생성부에서 수행되는 빅데이터 처리 방법을 설명하기 위한 순서도이고, 도 3 내지 도 6은 도 2의 빅데이터 처리 방법의 각 단계들을 보다 상세히 설명하기 위한 순서도들이며, 도 7 및 도 8은 도 2의 빅데이터 처리 방법의 각 단계들에서 일부 데이터들의 상태를 예시한 도면이다. 도 2에 도시된 빅데이터 처리 방법의 각 단계들은 해당 알고리즘을 구현하는 적어도 하나의 소프트웨어를 통해 이벤트 데이터 생성부(130)에서 수행될 수 있다. 이하에서는, 도 2에 도시된 빅데이터 처리 방법의 각 단계들을 설명함에 있어서, 도 3 내지 도 8을 함께 참조하여 설명한다.
FIG. 2 is a flow chart for explaining a big data processing method performed in an event data generation unit of a big data processing system according to an embodiment of the present invention; FIGS. 3 to 6 are flowcharts And FIGS. 7 and 8 are diagrams illustrating states of some data in each step of the method of processing large data of FIG. 2. Referring to FIG. Each step of the big data processing method shown in FIG. 2 can be performed in the event
하위 계층의 이벤트 데이터 생성 프로세스(Event data generation process of lower layer ( S210S210 ))
도 2를 참조하면, 이벤트 데이터 생성부(130)는, 입력되는 로우 데이터들을 이용하여 상기 로우 데이터들의 획득 일시와 연관된 키 및 값으로 구성되는 하위 계층의 이벤트 데이터들을 생성할 수 있다(S210). 상기 로우 데이터들 중 어느 하나의 로우 데이터에 대한 하위 계층의 이벤트 데이터 생성 예를 도시하는 도 3을 더 참조하여 단계 S210을 더 상세히 설명한다.
Referring to FIG. 2, the event
먼저 이벤트 데이터 생성부(130)는 상기 로우 데이터를 필드 별로 파싱할 수 있다(S310). 즉, 이벤트 데이터 생성부(130)는 상기 로우 데이터를 획득 일시 필드, 식별자 필드 및 수치 필드 별로 파싱할 수 있다. First, the event
여기서, 상기 획득 일시 필드는 상기 로우 데이터가 획득된 시간, 일자 등에 대한 필드일 수 있다. 상기 식별자 필드는 상기 로우 데이터에 대응하는 기기, 사용자 등을 식별하기 위한 필드일 수 있다. 상기 수치 필드는, 예를 들어 상기 로우 데이터가 차량 운행 데이터인 경우, 차량의 속도, 가속도 등에 대한 필드일 수 있다. 다른 예를 들면, 상기 로우 데이터가 발전 설비와 관련된 센싱 데이터인 경우, 상기 수치 필드는 상기 발전 설비의 발전량 등에 대한 필드일 수 있다. 또 다른 예를 들면, 상기 로우 데이터가 기상 데이터인 경우, 상기 수치 필드는 강우량 등에 대한 필드일 수 있다.Here, the acquisition date / time field may be a field for the time, date, etc., at which the row data is acquired. The identifier field may be a field for identifying a device, a user, or the like corresponding to the row data. The numerical field may be, for example, a field for a vehicle speed, an acceleration, etc. when the low data is vehicle driving data. In another example, if the raw data is sensing data related to the power generation facility, the numerical field may be a field for the power generation amount of the power generation facility. As another example, when the raw data is weather data, the numerical field may be a field for rainfall or the like.
이벤트 데이터 생성부(130)는 상기 로우 데이터의 수치 필드에 레코드가 존재하는지 여부를 판단할 수 있다(S320). 이벤트 데이터 생성부(130)는, 상기 로우 데이터의 수치 필드에 레코드가 존재하면 후술되는 단계들을 수행하고, 상기 로우 데이터의 수치 필드에 레코드가 존재하지 않으면 하위 계층의 이벤트 데이터를 생성하지 않고 프로세스를 종료할 수 있다.The event
이벤트 데이터 생성부(130)는, 상기 로우 데이터의 수치 필드에 레코드가 존재하면, 수치 필드의 레코드가 미리 설정된 제1 조건에 부합하는지 여부를 판단할 수 있다(S330).If there is a record in the numeric field of the row data, the event
상기 제1 조건은, 의미 추출을 위한 판단 기준으로서 사용자에 의해 설정될 수 있다. 상기 제1 조건은, 예를 들어, 판단 방법에 따라 상기 수치 필드의 레코드가 소정의 임계치보다 큰 지 여부, 소정의 임계치보다 작은지 여부, 소정의 임계 범위 내인지 여부 등으로 다양하게 설정될 수 있다. The first condition may be set by a user as a judgment criterion for extracting a meaning. The first condition may be variously set according to, for example, a determination method, whether the record of the numeric field is larger than a predetermined threshold, whether it is smaller than a predetermined threshold, whether it is within a predetermined threshold range have.
상기 로우 데이터가 차량 운행 데이터이며 수치 필드가 속도에 대한 필드인 경우를 예로 들면, 상기 제1 조건은 과속인지 여부를 판단하기 위한 기준으로서 상기 수치 필드의 레코드가 일정 속도를 초과하는 것인지 여부로 설정될 수 있다.For example, when the row data is vehicle driving data and the numeric field is a speed field, the first condition is set as a criterion for determining whether the speed is overspeed or not, .
상기 로우 데이터가 발전 설비와 관련된 센싱 데이터이며 수치 필드가 발전량에 대한 필드인 경우를 예로 들면, 상기 제1 조건은 비정상 동작 여부를 판단하기 위한 기준으로서 상기 수치 필드의 레코드가 정상 동작 시의 발전량 오차 범위를 벗어나는지 여부로 설정될 수 있다. For example, when the row data is sensing data related to the power generation facility and the numerical field is a field for the power generation amount, the first condition is a criterion for determining whether the abnormal operation is abnormal, Range can be set.
상기 로우 데이터가 기상 데이터이며 수치 필드가 강우량에 대한 필드인 경우를 예로 들면, 상기 제1 조건은 호우 주의보 발령 등에 요구되는 위험 강우량인지 여부를 판정하기 위한 기준으로서 일정 강우량을 초과하는 것인지 여부로 설정될 수 있다.For example, when the row data is weather data and the numerical field is a field for rainfall, the first condition is set as a criterion for determining whether or not the rainfall amount is the amount of dangerous rainfall required for the announcement of a heavy rainfall warning, .
이벤트 데이터 생성부(130)는, 상기 로우 데이터의 수치 필드 레코드가 상기 제1 조건에 부합하면, 상기 하위 계층의 이벤트 데이터를 생성할 수 있다(S340). 이 때, 이벤트 데이터 생성부(130)는, 하위 계층의 이벤트 종류와 관련된 하위 계층 이벤트 네임 필드를 생성할 수 있으며, '하위 계층 이벤트 네임, 획득 일시, 식별자' 필드의 레코드로 키를 생성하고 '획득 일시'의 레코드로 값을 생성하여 상기 하위 계층의 이벤트 데이터를 생성할 수 있다(도 7의 LD1 내지 LDw 참조). 또는, 이벤트 데이터 생성부(130)는, '획득 일시, 식별자'의 레코드로 키를 생성하고 '획득 일시, 하위 계층 이벤트 네임'의 레코드로 값을 생성하여 상기 하위 계층의 이벤트 데이터를 생성할 수 있다(도 8의 LD1 내지 LDw 참조).The event
예를 들어, 상기 제1 조건이 차량의 과속을 판단하기 위한 기준으로 설정된 경우, 이벤트 데이터 생성부(130)는, 상기 로우 데이터의 수치 필드 레코드가 규정 속도 초과에 해당하면, 하위 계층 이벤트 네임 필드의 레코드로 '과속'을 생성하고 생성된 하위 계층 이벤트 네임 필드의 레코드를 키 또는 값에 포함시켜 하위 계층의 이벤트 데이터를 생성할 수 있다.For example, if the first condition is set as a criterion for determining overspeed of the vehicle, the event
다른 예를 들어, 상기 제1 조건이 발전 설비의 비정상 동작 여부를 판단하기 위한 기준으로 설정된 경우, 이벤트 데이터 생성부(130)는, 상기 로우 데이터의 수치 필드 레코드가 정상 동작 시의 발전량 오차 범위를 벗어나면, 하위 계층 이벤트 네임 필드의 레코드로 '비정상'을 생성하고 생성된 하위 계층 이벤트 네임 필드의 레코드를 키 또는 값에 포함시켜 하위 계층의 이벤트 데이터를 생성할 수 있다.For example, if the first condition is set as a criterion for determining whether the power plant is abnormal, the event
또 다른 예를 들어, 상기 제1 조건이 위험 강우량인지 여부를 판단하기 위한 기준으로 설정된 경우, 이벤트 데이터 생성부(130)는, 상기 로우 데이터의 수치 필드 레코드가 일정 강우량을 초과하면, 하위 계층 이벤트 네임 필드의 레코드로 '위험 강우량'을 생성하고 생성된 하위 계층 이벤트 네임 필드의 레코드를 키 또는 값에 포함시켜 하위 계층의 이벤트 데이터를 생성할 수 있다.
For example, if the first condition is set as a criterion for determining whether the first condition is a critical amount of rainfall, the event
이벤트 데이터 생성부(130)는 상술한 단계 S310 내지 S340를 로우 데이터들 각각에 대해 수행하여 복수의 하위 계층의 이벤트 데이터들을 생성할 수 있다.
The event
리스트 생성 프로세스(List creation process ( S220S220 ))
도 2를 참조하면, 이벤트 데이터 생성부(130)는 키를 기준으로 하위 계층의 이벤트 데이터들을 소팅하여, 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성할 수 있다(S230).Referring to FIG. 2, the
도 4를 더 참조하면, 이벤트 데이터 생성부(130)는, 필드 레코드들 각각을 부분 키로 갖는 키를 기준으로 하위 계층의 이벤트 데이터들을 소팅 시, 먼저 획득 일시 필드의 레코드 이외의 레코드들에 대한 부분 키를 기준으로 하위 계층의 이벤트 데이터들을 소팅하여, 상기 부분 키들 각각에 대해 값들을 정렬시킬 수 있다(S410). 이어서, 이벤트 데이터 생성부(130)는, 획득 일시 필드의 레코드에 대한 부분 키를 기준으로 정렬된 값들을 시간순으로 재정렬하여, 상기 리스트들을 생성할 수 있다(S410).Referring to FIG. 4, when sorting the lower-level event data based on a key having each of the field records as a partial key, the event
예를 들어, 하위 계층의 이벤트 데이터들이 '획득일시, 식별자, 하위 계층 이벤트 네임' 필드의 레코드들 각각을 부분 키로 갖는 경우(도 7의 LD1 내지 LDw 참조), 이벤트 데이터 생성부(130)는 먼저 '식별자'와 '하위 계층 이벤트 네임' 필드의 레코드에 관한 부분 키들 각각을 기준으로 값들을 정렬시키고, 이어서 '획득 일시' 필드의 레코드를 기준으로 정렬된 값들을 시간순으로 재정렬하여 상기 리스트들을 생성할 수 있다(도 7의 LT1 내지 LTx). 이와 같이 '하위 계층 이벤트 네임' 필드의 레코드가 부분 키로 포함되는 경우에는, 후술되는 상위 계층의 이벤트 데이터 생성 프로세스(S230)을 통해 한 종류의 하위 계층 이벤트와 연관된 상위 계층의 이벤트가 추출될 수 있다. 한편, '식별자'와 '하위 계층 이벤트 네임' 필드의 레코드와 관련된 부분 키들을 이용하여 값들을 정렬 시, 어느 부분 키를 먼저 기준으로 하여 값들을 정렬시키더라도 문제되지 않는다.For example, when the event data of the lower layer has each of the records of the 'acquisition date and time, identifier, lower layer event name' field as partial keys (see LD1 to LDw in FIG. 7), the event
다른 예를 들어, 하위 계층의 이벤트 데이터들이 '획득일시, 식별자' 필드의 레코드들 각각을 부분 키로 갖는 경우(도 8의 LD1 내지 LDw 참조), 이벤트 데이터 생성부(130)는 먼저 '식별자' 필드의 레코드를 기준으로 값들을 정렬시키고, 이어서 '획득 일시' 필드의 레코드를 기준으로 정렬된 값들을 시간순으로 재정렬하여 상기 리스트들을 생성할 수 있다(도 8의 LT1 내지 LTx). 이와 같이 '하위 계층 이벤트 네임' 필드의 레코드가 부분 키로 포함되지 않고 값에 포함되는 경우에는, 후술되는 상위 계층의 이벤트 데이터 생성 프로세스(S230)을 통해 여러 종류의 하위 계층 이벤트들과 연관된 상위 계층의 이벤트 데이터가 추출될 수 있다.
For example, when the event data of the lower layer has each of the records of the 'acquisition date and time, identifier' field as a partial key (see LD1 to LDw in FIG. 8), the event
상위 계층의 이벤트 데이터 생성 프로세스(Event data generation process of upper layer ( S230S230 ))
도 2, 도 5 및 도 6을 참조하면, 이벤트 데이터 생성부(130)는 생성된 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성할 수 있다(S230). 여기서 도 5 및 도 6 각각은 도 2에 도시된 상위 계층의 이벤트 데이터 생성 프로세스의 일 구현예로 어느 하나의 리스트에 대해 수행되는 단계들을 나타낸다. 이벤트 데이터 생성부(130)는, 도 5 및 도 6에 도시된 구현예들 중 어느 하나의 구현예만을 복수의 리스트들에 대해 병렬적으로 수행할 수 있으나, 본 발명의 기술적 사상이 이에 한정되는 것은 아니다. 이벤트 데이터 생성부(130)는 도 5 및 도 6에 도시된 구현예들 중 어느 하나는 일부 리스트들에 대해 병렬적으로 수행하고 다른 하나는 다른 리스트들에 대해 병렬적으로 수행할 수도 있다.
2, 5 and 6, the event
먼저, 도 2 및 도 5를 참조하여 상위 계층의 이벤트 데이터 생성 프로세스의 일 구현예를 설명하면, 이벤트 데이터 생성부(130)는 어느 하나의 리스트에서 n번째 값이 첫 번째 값인지 여부를 판단할 수 있다(S510). 이벤트 데이터 생성부(130)는, n번째 값이 첫 번째 값이면 단계 S540을 수행하여 상위 계층의 이벤트 데이터를 생성할 수 있고, n번째 값이 첫 번째 값이 아니면 후속 단계들을 수행할 수 있다.2 and 5, the event
이벤트 데이터 생성부(130)는 n번째 값이 첫 번째 값이 아니면 n번째 값을 필드 별로 파싱할 수 있다(S520). 한편, 단계 S520은 상기 값이 하나의 필드만을 포함하는 경우에는 생략될 수 있다. 이하에서는 상기 값이 획득 일시 필드를 포함하는 경우를 예로 들어 설명한다(도 6도 동일).If the nth value is not the first value, the event
이벤트 데이터 생성부(130)는, n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 제2 조건에 부합하는지 여부를 판단할 수 있다(S530). 여기서, 상기 제2 조건은, 전술한 로우 데이터의 획득 주기에 대응하는지 여부로 설정될 수 있으며, 이벤트 데이터 생성부(130)는 하위 계층의 이벤트 데이터의 값들이 연속적으로 획득된 로우 데이터들에 대한 것인지 여부를 판단할 수 있다.The event
이벤트 데이터 생성부(130)는, n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상위 계층 이벤트 네임 필드와 상위 계층 이벤트 일시 필드를 생성하여 상위 계층의 이벤트 데이터를 생성할 수 있다(S540, 도 7 및 도 8의 HD1 내지 HDy 참조). 이벤트 데이터 생성부(130)는, n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하면, 상위 계층의 이벤트 데이터를 생성하지 않고 n+1번째 값에 대해 단계 S510을 수행할 수 있다(S560).If the record difference between the acquisition date and time field of the n-th value and the acquisition date and time field of the (n-1) th value does not match the second condition, the event
예를 들면, 하위 계층 이벤트 네임이 차량 운행자의 '과속'에 연관된 경우, 이벤트 데이터 생성부(130)는, 상기 n번째 값의 획득 일시 필드와 상기 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상기 레코드 차이에 상응하는 기간 동안 과속이 연속된 것으로 판단할 수 있다. 이에 따라, 이벤트 데이터 생성부(130)는, 상위 계층 이벤트 네임 필드의 레코드를 단기적인 관점에서의 '연속 과속'으로 생성할 수 있고, 획득 일시 필드 레코드 각각과 레코드 차이를 기초로 상위 계층 이벤트 일시 필드의 레코드를 생성하여 상위 계층의 이벤트 데이터를 발생시킬 수 있다.For example, when the lower layer event name is related to the 'overspeed' of the vehicle operator, the event
다른 예를 들면, 하위 계층 이벤트 네임이 발전 설비의 '비정상'에 연관된 경우, 이벤트 데이터 생성부(130)는, 상기 n번째 값의 획득 일시 필드와 상기 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상기 레코드 차이에 상응하는 기간 동안을 단기적인 관점에서의 오작동으로 판단할 수 있다. 이에 따라, 이벤트 데이터 생성부(130)는, 상위 계층 이벤트 네임 필드의 레코드를 '연속 오작동'으로 생성할 수 있다.In another example, when the lower layer event name is related to the 'abnormal' of the power generation facility, the event
또 다른 예를 들면, 하위 계층 이벤트 네임이 '위험 강우량'에 연관된 경우, 이벤트 데이터 생성부(130)는, 상기 n번째 값의 획득 일시 필드와 상기 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상기 레코드 차이에 상응하는 기간 동안 집중적인 호우가 발생된 것으로 판단할 수 있고, 상위 계층 이벤트 네임 필드의 레코드를 단기적인 관점에서의 '연속 위험 강우량'으로 생성할 수 있다. In another example, when the lower layer event name is related to the 'dangerous rainfall amount', the event
이벤트 데이터 생성부(130)는 어느 하나의 리스트에서 n번째 값이 마지막 값인지 여부를 판단할 수 있다(S550). 이벤트 데이터 생성부(130)는, n번째 값이 마지막 값이면 프로세스를 종료하고, n번째 값이 마지막 값이 아니면 n+1번째 값에 대해 단계 S510을 수행할 수 있다(S560).
The event
다음으로, 도 2 및 도 6을 참조하여 상위 계층의 이벤트 데이터 생성 프로세스의 다른 구현예를 설명하면, 이벤트 데이터 생성부(130)는 어느 하나의 리스트에서 n번째 값이 첫 번째 값인지 여부를 판단할 수 있다(S610). 이벤트 데이터 생성부(130)는, n번째 값이 첫 번째 값이면 단계 S650을 수행하여 상위 계층의 이벤트 데이터를 생성할 수 있고, n번째 값이 첫 번째 값이 아니면 후술되는 단계들을 수행할 수 있다.Next, referring to FIG. 2 and FIG. 6, the event
이벤트 데이터 생성부(130)는, n번째 값이 첫 번째 값이 아니면 n번째 값을 필드 별로 파싱할 수 있다(S620). 한편, 단계 S620은 도 5를 참조하여 설명한 바와 같이 상기 값들이 하나의 필드만을 포함하는 경우에는 생략될 수 있다.If the n-th value is not the first value, the event
이벤트 데이터 생성부(130)는, n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 제2 조건에 부합하는지 여부를 판단할 수 있다(S630). 여기서, 상기 제2 조건은, 도 5를 참조하여 설명한 바와 같이 레코드 차이가 전술한 로우 데이터의 획득 주기에 상응하는지 여부로 설정될 수 있다.The event
이벤트 데이터 생성부(130)는, n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하지 않으면 단계 S640을 수행할 수 있고, n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 상기 제2 조건에 부합하면 상위 계층의 이벤트 데이터를 생성하지 않고 n+1번째 제1 값에 대해 단계 S610을 수행할 수 있다(S670).The event
이벤트 데이터 생성부(130)는, 상기 레코드 차이가 상기 제2 조건에 부합하지 않고, n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위에 포함되는지 여부를 판단할 수 있다(S640). 상기 시간 범위는, 소정 시간 구간 내에서 상위 계층의 이벤트 데이터들의 반복 생성을 방지하고 유연하게 시간적 관점을 적용하여 데이터를 분석할 수 있도록, 관리자 또는 사용자에 의해 임의로 설정된 시간 범위일 수 있다. The event
이벤트 데이터 생성부(130)는, n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위에 포함되지 않으면, 상위 계층 이벤트 네임 필드와 상위 계층 이벤트 일시 필드를 생성하여 상위 계층의 이벤트 데이터를 생성할 수 있고(S650, 도 7 및 도 8의 HD1 내지 HDy 참조), n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위에 포함되면 상위 계층의 이벤트 데이터를 생성하지 않고 n+1번째 값에 대해 단계 S610을 수행할 수 있다(S670).If the record of the acquisition date and time field of the n-th value is not included in the preset time range, the event
예를 들면, 하위 계층 이벤트 네임이 차량 운행자의 '과속'에 연관된 경우, 이벤트 데이터 생성부(130)는, 상기 n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위에 속하지 않으면, 상기 레코드 차이에 상응하는 기간 동안을 과속으로 판단하되 소정 시간 범위 내에서의 연속적인 과속은 아닌 것으로 판단할 수 있다. 이에 따라, 이벤트 데이터 생성부(130)는, 상위 계층 이벤트 네임 필드의 레코드를 '연속 과속'으로 생성할 수 있고, 획득 일시 필드 레코드 각각과 레코드 차이를 기초로 상위 계층 이벤트 일시 필드의 레코드를 생성하여 상위 계층의 이벤트 데이터를 발생시킬 수 있다.For example, when the lower layer event name is related to the 'overspeed' of the vehicle operator, if the record of the acquisition date / time field of the n-th value does not belong to the preset time range, It can be determined that the overspeed during the period corresponding to the predetermined time is not the continuous overspeed within the predetermined time range. Accordingly, the event
다른 예를 들면, 하위 계층 이벤트 네임이 발전 설비의 '비정상'에 연관된 경우, 이벤트 데이터 생성부(130)는, 상기 n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위에 속하지 않으면, 상기 레코드 차이에 상응하는 기간 동안 오작동 상태인 것으로 판단하되 소정 시간 범위 내에서의 연속적인 오작동은 아닌 것으로 판단할 수 있다. 이에 따라, 이벤트 데이터 생성부(130)는 상위 계층 이벤트 네임 필드의 레코드를 '연속 오작동'으로 생성할 수 있다.For example, if the lower layer event name is related to the 'abnormal' of the power generation facility, the event
또 다른 예를 들면, 하위 계층 이벤트 네임이 '위험 강우량'에 연관된 경우, 이벤트 데이터 생성부(130)는, 상기 n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위에 속하지 않으면, 상기 레코드 차이에 상응하는 기간 동안의 집중적인 호우 발생으로 판단하되 소정 시간 범위 내에서 연속된 것은 아닌 것으로 판단하여 상위 계층 이벤트 네임 필드의 레코드를 '연속 위험 강우량'으로 생성할 수 있다.In another example, when the lower layer event name is related to the 'dangerous rainfall amount', the event
이벤트 데이터 생성부(130)는 어느 하나의 리스트에서 n번째 값이 마지막값인지 여부를 판단할 수 있다(S660). 이벤트 데이터 생성부(130)는, n번째 값이 마지막 값이면 프로세스를 종료하고, n번째 값이 마지막 값이 아니면 n+1번째 값에 대해 단계 S610을 수행할 수 있다(S670).
The event
차상위 계층의 이벤트 데이터 생성 프로세스(Event data generation process of the next higher layer ( S240S240 ))
도 2를 참조하면, 이벤트 데이터 생성부(130)는 상위 계층의 이벤트 데이터들을 이용하여 차상위 계층의 이벤트 데이터들을 생성할 수 있다(S240). 즉, 이벤트 데이터 생성부(130)는 상위 계층의 이벤트 데이터들보다 장기적인 관점의 의미를 내재하는 차상위 계층의 이벤트 데이터들을 추출할 수 있다.Referring to FIG. 2, the event
이벤트 데이터 생성부(130)는, 상술한 단계 S220 및 단계 S230에서와 유사하게, 상위 계층의 이벤트 데이터들을 시간 순서대로 정렬한 후 상위 계층 이벤트 데이터들의 연속성 여부(또는 연속성 여부 및 소정의 시간 범위 내인지 여부)를 기초로 차상위 계층의 이벤트 데이터들을 생성할 수 있다. 더 상세하게는, 이벤트 데이터 생성부(130)는, 상위 계층의 이벤트 데이터에 포함된 식별자 필드, 상위 계층 이벤트 네임 필드, 상위 계층 이벤트 일시 필드를 기초로 키와 값을 정의할 수 있고, 상위 계층의 이벤트 데이터들을 서로 공통되는 키를 기준으로 소팅하여 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하고, 리스트들을 이용하여 차상위 계층의 이벤트 데이터를 생성할 수 있다.Similar to the above-described steps S220 and S230, the event
이벤트 데이터 생성부(130)는, 상위 계층의 이벤트 데이터들을 이용한 차상위 계층의 이벤트 데이터 생성 프로세스와 유사하게, 차상위 계층의 이벤트 데이터들을 이용하여 더 높은 수준의 이벤트 데이터들을 생성할 수도 있음은 물론이다.The event
이를 통해, 차량 운행 데이터로 구성되는 빅데이터와 관련하여서는, 이벤트 데이터 생성부(130)는 단기적인 관점에서의 '연속 과속'과 관련된 이벤트 데이터로부터 중장기적인 관점에서의 '장기 과속', 차량 운전자의 운전 성향, 패턴 등과 관련된 더 높은 수준의 이벤트 데이터들을 생성할 수 있다. Accordingly, in connection with the big data composed of the vehicle driving data, the event
또한, 센싱 데이터로 구성되는 빅데이터의 경우, 이벤트 데이터 생성부(130)는 단기적인 관점에서의 '연속 오작동'과 관련된 이벤트 데이터 생성으로부터 중장기적인 관점에서의 '장기 오작동', 발전 설비의 고장여부 등과 관련된 더 높은 수준의 이벤트 데이터들을 생성할 수 있다. In the case of the big data constituted by the sensing data, the event
또한, 기상 데이터로 구성되는 빅데이터의 경우, 이벤트 데이터 생성부(130)는 단기적인 관점에서의 '연속 위험 강수량'과 관련된 이벤트 데이터 생성으로부터 중장기적인 관점에서의 '호우 주의보 발령', 시기에 따른 강우량 반복 패턴 등과 관련된 더 높은 수준의 이벤트 데이터들을 생성할 수 있다.
In the case of the big data composed of the weather data, the event
이와 같이, 빅데이터 처리 시스템(100)은, 이벤트 데이터 생성부(130)가 계층적으로 이벤트 데이터들을 추출할 수 있고, 분석부(150)가 계층적 이벤트 데이터들을 기초로 빅데이터에서 반복되는 패턴, 현상, 사건 등을 분석한 결과정보를 관리자 또는 사용자에게 제공할 수 있어, 관리자 또는 사용자의 정확한 의사 결정, 효율적인 대책 마련 등을 가능하게 할 수 있다.In this way, the big
또한, 이벤트 데이터 생성부(130)에서 기초적인 이벤트와 관련 데이터로부터 상위 수준의 이벤트와 관련된 데이터들을 추출해냄에 있어서 병렬적으로 데이터들을 처리할 수 있어, 보다 신속하게 유의미한 정보들을 추출할 수 있고 관리자 또는 사용자의 편의를 도모할 수 있다.
In addition, the event
이상, 본 발명을 바람직한 실시예를 들어 상세하게 설명하였으나, 본 발명은 상기 실시예에 한정되지 않고, 본 발명의 기술적 사상 및 범위 내에서 당 분야에서 통상의 지식을 가진 자에 의하여 여러가지 변형 및 변경이 가능하다.
While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, This is possible.
100: 빅데이터 처리 시스템
110: 빅데이터 저장부
130: 이벤트 데이터 생성부
150: 분석부100: Big data processing system
110: Big data storage unit
130: Event data generation unit
150: Analytical Department
Claims (17)
상기 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅(sorting)하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하는 단계; 및
상기 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성하는 단계;
를 포함하되,
상기 로우 데이터들은, 획득 일시 필드, 식별자 필드 및 수치 필드를 포함하고, 상기 키는, 상기 획득 일시 필드, 식별자 필드 및 소정의 조건 하에 생성되는 하위 계층 이벤트 네임 필드, 또는 상기 획득 일시 필드 및 식별자 필드를 포함하고, 상기 값은, 상기 획득 일시 필드, 또는 상기 획득 일시 필드 및 하위 계층 이벤트 네임 필드를 포함하며,
상기 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성하는 단계는,
상기 정렬된 값들 중 n번째 값을 필드 별로 파싱하는 단계;
상기 n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 미리 설정된 제2 조건에 부합하는지 여부를 판단하는 단계; 및
상기 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상위 계층 이벤트 네임 필드를 생성하고 상기 n번째 값의 획득 일시 필드의 레코드를 기초로 상위 계층 이벤트 일시 필드를 생성하여 상기 상위 계층의 이벤트 데이터를 발생시키는 단계;를 포함하는, 빅데이터 처리 방법.
Generating low-level event data composed of a key and a value associated with the acquisition date and time of the raw data using raw data of the big data;
Sorting the event data of the lower layer based on the key and generating lists having chronologically sorted values for each of the keys; And
Generating event data of an upper layer using the lists;
, ≪ / RTI &
Wherein the raw data includes an acquisition date and time field, an identifier field, and a numeric field, the key including: an acquisition date / time field, an identifier field and a lower layer event name field generated under a predetermined condition, Wherein the value comprises the acquisition date and time field or the acquisition date and time field and a lower layer event name field,
The step of generating event data of an upper layer using the lists may include:
Parsing the n-th value of the sorted values by field;
Determining whether a record difference between the acquisition date and time field of the n-th value and the acquisition date and time field of the (n-1) th value meets a second preset condition; And
If the record difference does not match the second condition, generates an upper layer event name field and generates an upper layer event date field based on the record of the acquisition date / time field of the nth value to generate event data of the upper layer The method comprising the steps < RTI ID = 0.0 > of: < / RTI >
상기 하위 계층의 이벤트 데이터들을 생성하는 단계는,
상기 로우 데이터들 각각을 필드 별로 파싱(parsing)하는 단계;
상기 로우 데이터들 각각의 수치 필드에 레코드가 존재하면, 대응하는 로우 데이터의 수치 필드 레코드가 미리 설정된 제1 조건에 부합하는지 여부를 판단하는 단계; 및
상기 대응하는 로우 데이터의 수치 필드 레코드가 상기 제1 조건에 부합하면, 상기 하위 계층 이벤트 네임 필드를 생성하여 상기 키 및 값으로 구성되는 상기 하위 계층의 이벤트 데이터를 발생시키는 단계;를 포함하는, 빅데이터 처리 방법.
3. The method of claim 2,
Wherein the generating of the lower layer event data comprises:
Parsing each of the row data by fields;
Determining whether a numeric field record of the corresponding row data satisfies a first condition set in advance if a record exists in the numeric field of each of the row data; And
And generating the lower layer event name field to generate event data of the lower layer composed of the key and value if the numeric field record of the corresponding row data satisfies the first condition. Data processing method.
상기 리스트들을 생성하는 단계는,
상기 획득 일시 필드 이외의 필드와 연관된 적어도 하나의 부분 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅하여, 상기 부분 키들 각각에 대해 상기 값들을 정렬시키는 단계; 및
상기 획득 일시 필드와 연관된 부분 키를 기준으로 상기 정렬된 값들을 재정렬하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 상기 리스트들을 생성하는 단계;를 포함하는 빅데이터 처리 방법.
3. The method of claim 2,
Wherein the generating the lists comprises:
Sorting the event data of the lower layer based on at least one partial key associated with a field other than the acquisition date and time field, and sorting the values for each of the partial keys; And
And rearranging the sorted values based on a partial key associated with the acquisition date and time field to generate the lists having chronologically sorted values for each of the keys.
상기 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅(sorting)하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하는 단계; 및
상기 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성하는 단계;
를 포함하되,
상기 로우 데이터들은, 획득 일시 필드, 식별자 필드 및 수치 필드를 포함하고, 상기 키는, 상기 획득 일시 필드, 식별자 필드 및 소정의 조건 하에 생성되는 하위 계층 이벤트 네임 필드, 또는 상기 획득 일시 필드 및 식별자 필드를 포함하고, 상기 값은, 상기 획득 일시 필드, 또는 상기 획득 일시 필드 및 하위 계층 이벤트 네임 필드를 포함하며,
상기 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성하는 단계는,
상기 정렬된 값들 중 n번째 값을 필드 별로 파싱하는 단계;
상기 n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 미리 설정된 제2 조건에 부합하는지 여부를 판단하는 단계; 및
상기 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상기 n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위 내에 속하는지 여부를 판단하는 단계; 및
상기 n번째 값의 획득 일시 필드의 레코드가 상기 시간 범위 내에 속하지 않으면, 상위 계층 이벤트 네임 필드를 생성하고 상기 n번째 값의 획득 일시 필드의 레코드를 기초로 상위 계층 이벤트 일시 필드를 생성하여 상기 상위 계층의 이벤트 데이터를 발생시키는 단계;를 포함하는, 빅데이터 처리 방법.
Generating low-level event data composed of a key and a value associated with the acquisition date and time of the raw data using raw data of the big data;
Sorting the event data of the lower layer based on the key and generating lists having chronologically sorted values for each of the keys; And
Generating event data of an upper layer using the lists;
, ≪ / RTI &
Wherein the raw data includes an acquisition date and time field, an identifier field, and a numeric field, the key including: an acquisition date / time field, an identifier field and a lower layer event name field generated under a predetermined condition, Wherein the value comprises the acquisition date and time field or the acquisition date and time field and a lower layer event name field,
The step of generating event data of an upper layer using the lists may include:
Parsing the n-th value of the sorted values by field;
Determining whether a record difference between the acquisition date and time field of the n-th value and the acquisition date and time field of the (n-1) th value meets a second preset condition; And
Determining whether the record of the acquisition date / time field of the n-th value falls within a predetermined time range if the record difference does not match the second condition; And
If the record of the acquisition date / time field of the n-th value does not fall within the time range, generates an upper layer event name field and generates an upper layer event date / time field based on the record of the acquisition date / And generating event data of the second data.
상기 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅(sorting)하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하는 단계; 및
상기 리스트들을 이용하여 상위 계층의 이벤트 데이터들을 생성하는 단계;
를 포함하되,
상기 로우 데이터들은, 획득 일시 필드, 식별자 필드 및 수치 필드를 포함하고, 상기 키는, 상기 획득 일시 필드, 식별자 필드 및 소정의 조건 하에 생성되는 하위 계층 이벤트 네임 필드, 또는 상기 획득 일시 필드 및 식별자 필드를 포함하고, 상기 값은, 상기 획득 일시 필드, 또는 상기 획득 일시 필드 및 하위 계층 이벤트 네임 필드를 포함하며,
상기 상위 계층의 이벤트 데이터들은,
상위 계층 이벤트 일시와 연관된 키 및 값으로 구성되고,
상기 상위 계층의 이벤트 데이터들을 생성하는 단계 후에,
상기 키를 기준으로 상기 상위 계층의 이벤트 데이터들을 소팅하여, 상기 키들 각각에 대해 상기 시간순으로 정렬된 값들을 갖는 리스트들을 생성하는 단계; 및
상기 리스트들을 이용하여 차(次)상위 계층의 이벤트 데이터들을 생성하는 단계;를 더 포함하는, 빅데이터 처리 방법.
Generating low-level event data composed of a key and a value associated with the acquisition date and time of the raw data using raw data of the big data;
Sorting the event data of the lower layer based on the key and generating lists having chronologically sorted values for each of the keys; And
Generating event data of an upper layer using the lists;
, ≪ / RTI &
Wherein the raw data includes an acquisition date and time field, an identifier field, and a numeric field, the key including: an acquisition date / time field, an identifier field and a lower layer event name field generated under a predetermined condition, Wherein the value comprises the acquisition date and time field or the acquisition date and time field and a lower layer event name field,
The event data of the upper layer includes:
A key and a value associated with the upper layer event date and time,
After generating the event data of the upper layer,
Sorting the event data of the upper layer based on the key to generate lists having the values sorted in chronological order for each of the keys; And
And generating event data of a next higher layer using the lists.
상기 시계열 빅데이터를 저장하는 빅데이터 저장부; 및
상기 시계열 빅데이터의 로우 데이터들을 이용하여 상기 로우 데이터들이 나타내는 의미에 관한 하위 계층의 이벤트 데이터들을 생성하고, 상기 하위 계층의 이벤트 데이터들을 이용하여 상기 하위 계층의 이벤트 데이터들이 나타내는 의미에 관한 상위 계층의 이벤트 데이터들을 생성하는 이벤트 데이터 생성부;
를 포함하되,
상기 이벤트 데이터 생성부는,
상기 로우 데이터들을 이용하여 상기 로우 데이터들의 획득 일시와 연관된 키 및 값으로 구성되는 상기 하위 계층의 이벤트 데이터들을 생성하고,
상기 로우 데이터들은, 획득 일시 필드, 식별자 필드 및 수치 필드를 포함하고, 상기 키는, 상기 획득 일시 필드, 식별자 필드 및 소정의 조건 하에 생성되는 하위 계층 이벤트 네임 필드, 또는 상기 획득 일시 필드 및 식별자 필드를 포함하고,상기 값은, 상기 획득 일시 필드, 또는 상기 획득 일시 필드 및 하위 계층 이벤트 네임 필드를 포함하며,
상기 이벤트 데이터 생성부는,
상기 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하고, 상기 리스트들을 이용하여 상기 상위 계층의 이벤트 데이터들을 생성하고,
상기 이벤트 데이터 생성부는,
상기 정렬된 값들 중 n번째 값을 필드 별로 파싱하고, 상기 n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 미리 설정된 제2 조건에 부합하는지 여부를 판단하고, 상기 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상위 계층 이벤트 네임 필드를 생성하고 상기 n번째 값의 획득 일시 필드의 레코드를 기초로 상위 계층 이벤트 일시 필드를 생성하여 상기 상위 계층의 이벤트 데이터를 발생시키는, 빅데이터 처리 시스템.
It is a system for processing and analyzing time series big data,
A big data storage unit for storing the time series big data; And
Generating event data of a lower layer related to the meaning indicated by the row data using the row data of the time series big data, and generating event data of a lower layer related to the meaning represented by the event data of the lower layer using the event data of the lower layer An event data generation unit for generating event data;
, ≪ / RTI &
Wherein the event data generating unit comprises:
Generating event data of the lower layer composed of keys and values associated with the acquisition date and time of the row data using the row data,
Wherein the raw data includes an acquisition date and time field, an identifier field, and a numeric field, the key including: an acquisition date / time field, an identifier field and a lower layer event name field generated under a predetermined condition, Wherein the value comprises the acquisition date and time field or the acquisition date and time field and a lower layer event name field,
Wherein the event data generating unit comprises:
Sorting event data of the lower layer on the basis of the key, generating lists having values sorted in chronological order with respect to each of the keys, generating event data of the upper layer using the lists,
Wherein the event data generating unit comprises:
Determining whether a record difference between the acquisition date and time field of the n-th value and the acquisition date and time field of the (n-1) -th value satisfies a preset second condition, If the record difference does not match the second condition, generates an upper layer event name field and generates an upper layer event date field based on the record of the acquisition date / time field of the nth value to generate event data of the upper layer Big data processing system.
상기 이벤트 데이터 생성부는,
상기 로우 데이터들 각각을 필드 별로 파싱(parsing)하고,
상기 로우 데이터들 각각의 수치 필드에 레코드가 존재하면, 대응하는 로우 데이터의 수치 필드 레코드가 미리 설정된 제1 조건에 부합하는지 여부를 판단하고,
상기 대응하는 로우 데이터의 수치 필드 레코드가 상기 제1 조건에 부합하면, 상기 하위 계층 이벤트 네임 필드를 생성하여 상기 키 및 상기 값으로 구성되는 상기 하위 계층의 이벤트 데이터를 발생시키는, 빅데이터 처리 시스템.
10. The method of claim 9,
Wherein the event data generating unit comprises:
Parsing each of the row data by field,
Determining whether a numeric field record of the corresponding row data satisfies a first condition set in advance if a record is present in the numeric field of each of the row data,
And if the numeric field record of the corresponding row data meets the first condition, generates the lower layer event name field to generate event data of the lower layer composed of the key and the value.
상기 이벤트 데이터 생성부는,
상기 획득 일시 필드 이외의 필드와 연관된 적어도 하나의 부분 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅하여, 상기 부분 키들 각각에 대해 상기 값들을 정렬시키고,
상기 획득 일시 필드와 연관된 부분 키를 기준으로 상기 정렬된 값들을 재정렬하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 상기 리스트들을 생성하는, 빅데이터 처리 시스템.
10. The method of claim 9,
Wherein the event data generating unit comprises:
Sort the event data of the lower layer based on at least one partial key associated with a field other than the acquisition date and time field, sort the values for each of the partial keys,
And rearranging the sorted values based on a partial key associated with the acquisition date and time field to generate the lists having chronologically sorted values for each of the keys.
상기 시계열 빅데이터를 저장하는 빅데이터 저장부; 및
상기 시계열 빅데이터의 로우 데이터들을 이용하여 상기 로우 데이터들이 나타내는 의미에 관한 하위 계층의 이벤트 데이터들을 생성하고, 상기 하위 계층의 이벤트 데이터들을 이용하여 상기 하위 계층의 이벤트 데이터들이 나타내는 의미에 관한 상위 계층의 이벤트 데이터들을 생성하는 이벤트 데이터 생성부;
를 포함하되,
상기 이벤트 데이터 생성부는,
상기 로우 데이터들을 이용하여 상기 로우 데이터들의 획득 일시와 연관된 키 및 값으로 구성되는 상기 하위 계층의 이벤트 데이터들을 생성하고,
상기 로우 데이터들은, 획득 일시 필드, 식별자 필드 및 수치 필드를 포함하고, 상기 키는, 상기 획득 일시 필드, 식별자 필드 및 소정의 조건 하에 생성되는 하위 계층 이벤트 네임 필드, 또는 상기 획득 일시 필드 및 식별자 필드를 포함하고,상기 값은, 상기 획득 일시 필드, 또는 상기 획득 일시 필드 및 하위 계층 이벤트 네임 필드를 포함하며,
상기 이벤트 데이터 생성부는,
상기 키를 기준으로 상기 하위 계층의 이벤트 데이터들을 소팅하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하고, 상기 리스트들을 이용하여 상기 상위 계층의 이벤트 데이터들을 생성하고,
상기 이벤트 데이터 생성부는,
상기 정렬된 값들 중 n번째 값을 필드 별로 파싱하고, 상기 n번째 값의 획득 일시 필드와 n-1번째 값의 획득 일시 필드 사이의 레코드 차이가 미리 설정된 제2 조건에 부합하는지 여부를 판단하고, 상기 레코드 차이가 상기 제2 조건에 부합하지 않으면, 상기 n번째 값의 획득 일시 필드의 레코드가 미리 설정된 시간 범위 내에 속하는지 여부를 판단하고, 상기 n번째 값의 획득 일시 필드의 레코드가 상기 시간 범위 내에 속하지 않으면, 상위 계층 이벤트 네임 필드를 생성하고 상기 n번째 값의 획득 일시 필드의 레코드를 기초로 상위 계층 이벤트 일시 필드를 생성하여 상기 상위 계층의 이벤트 데이터를 발생시키는, 빅데이터 처리 시스템.
It is a system for processing and analyzing time series big data,
A big data storage unit for storing the time series big data; And
Generating event data of a lower layer related to the meaning indicated by the row data using the row data of the time series big data, and generating event data of a lower layer related to the meaning represented by the event data of the lower layer using the event data of the lower layer An event data generation unit for generating event data;
, ≪ / RTI &
Wherein the event data generating unit comprises:
Generating event data of the lower layer composed of keys and values associated with the acquisition date and time of the row data using the row data,
Wherein the raw data includes an acquisition date and time field, an identifier field, and a numeric field, the key including: an acquisition date / time field, an identifier field and a lower layer event name field generated under a predetermined condition, Wherein the value comprises the acquisition date and time field or the acquisition date and time field and a lower layer event name field,
Wherein the event data generating unit comprises:
Sorting event data of the lower layer on the basis of the key, generating lists having values sorted in chronological order with respect to each of the keys, generating event data of the upper layer using the lists,
Wherein the event data generating unit comprises:
Determining whether a record difference between the acquisition date and time field of the n-th value and the acquisition date and time field of the (n-1) -th value satisfies a preset second condition, Determining whether the record of the acquisition date / time field of the n-th value belongs to a predetermined time range if the record difference does not match the second condition, and if the record of the acquisition date / time field of the n- Generates an upper layer event name field and generates an upper layer event date field based on the record of the acquisition date and time field of the nth value to generate event data of the upper layer.
상기 시계열 빅데이터를 저장하는 빅데이터 저장부; 및
상기 시계열 빅데이터의 로우 데이터들을 이용하여 상기 로우 데이터들이 나타내는 의미에 관한 하위 계층의 이벤트 데이터들을 생성하고, 상기 하위 계층의 이벤트 데이터들을 이용하여 상기 하위 계층의 이벤트 데이터들이 나타내는 의미에 관한 상위 계층의 이벤트 데이터들을 생성하는 이벤트 데이터 생성부;
를 포함하되,
상기 상위 계층의 이벤트 데이터들은,
상위 계층 이벤트 일시와 연관된 키 및 값으로 구성되고,
상기 이벤트 데이터 생성부는,
상기 키를 기준으로 상기 상위 계층의 이벤트 데이터들을 소팅하여, 상기 키들 각각에 대해 시간순으로 정렬된 값들을 갖는 리스트들을 생성하고, 상기 리스트들을 이용하여 차상위 계층의 이벤트 데이터들을 더 생성하는, 빅데이터 처리 시스템.
It is a system for processing and analyzing time series big data,
A big data storage unit for storing the time series big data; And
Generating event data of a lower layer related to the meaning indicated by the row data using the row data of the time series big data, and generating event data of a lower layer related to the meaning represented by the event data of the lower layer using the event data of the lower layer An event data generation unit for generating event data;
, ≪ / RTI &
The event data of the upper layer includes:
A key and a value associated with the upper layer event date and time,
Wherein the event data generating unit comprises:
The event data of the upper layer is sorted by the key, the lists having the values sorted in chronological order are generated for each of the keys, and the event data of the next higher layer is further generated using the lists system.
상기 빅데이터 저장부는,
분산 파일 시스템으로 구성되는, 빅데이터 처리 시스템.
10. The method of claim 9,
The big data storage unit stores,
A big data processing system, consisting of a distributed file system.
상기 빅데이터 저장부는, 상기 이벤트 데이터 생성부에 의해 생성되는 상기 하위 및 상위 계층의 이벤트 데이터들을 더 저장하고,
상기 로우 데이터, 상기 하위 및 상위 계층의 이벤트 데이터들 중 적어도 하나를 이용하여 상기 빅데이터가 나타내는 의미에 관한 분석결과정보를 생성하는 분석부;를 더 포함하는, 빅데이터 처리 시스템.
10. The method of claim 9,
Wherein the big data storage further stores event data of the lower and upper layers generated by the event data generator,
And an analysis unit for generating analysis result information on the meaning indicated by the big data using at least one of the low data and the lower and upper layer event data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150020464A KR101645396B1 (en) | 2015-02-10 | 2015-02-10 | Method of processing time-series big data and system thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150020464A KR101645396B1 (en) | 2015-02-10 | 2015-02-10 | Method of processing time-series big data and system thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101645396B1 true KR101645396B1 (en) | 2016-08-03 |
Family
ID=56708822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150020464A KR101645396B1 (en) | 2015-02-10 | 2015-02-10 | Method of processing time-series big data and system thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101645396B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102065780B1 (en) | 2019-03-20 | 2020-01-13 | (주)제타큐브사이언스 | Electronic apparatus performing prediction of time series data using big data and method for predicting thereof |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243013A (en) * | 2011-05-18 | 2012-12-10 | Hitachi Systems Ltd | Data extraction system for data analysis, method, and program |
KR20140093535A (en) * | 2013-01-18 | 2014-07-28 | 한국전자통신연구원 | Method for parallel mining of temporal relations in large event file |
-
2015
- 2015-02-10 KR KR1020150020464A patent/KR101645396B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243013A (en) * | 2011-05-18 | 2012-12-10 | Hitachi Systems Ltd | Data extraction system for data analysis, method, and program |
KR20140093535A (en) * | 2013-01-18 | 2014-07-28 | 한국전자통신연구원 | Method for parallel mining of temporal relations in large event file |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102065780B1 (en) | 2019-03-20 | 2020-01-13 | (주)제타큐브사이언스 | Electronic apparatus performing prediction of time series data using big data and method for predicting thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103793484B (en) | The fraud identifying system based on machine learning in classification information website | |
CN107577588B (en) | Intelligent operation and maintenance system for mass log data | |
US20220391373A1 (en) | Building system with social media based shooter risk | |
CN110428091B (en) | Risk identification method based on data analysis and related equipment | |
US11301759B2 (en) | Detective method and system for activity-or-behavior model construction and automatic detection of the abnormal activities or behaviors of a subject system without requiring prior domain knowledge | |
US10679135B2 (en) | Periodicity analysis on heterogeneous logs | |
KR101563406B1 (en) | System and method for large unbalanced data classification based on hadoop | |
US20190058719A1 (en) | System and a method for detecting anomalous activities in a blockchain network | |
CN112163008B (en) | Big data analysis-based user behavior data processing method and cloud computing platform | |
CN112434208A (en) | Training of isolated forest and identification method and related device of web crawler of isolated forest | |
AU2019275633B2 (en) | System and method of automated fault correction in a network environment | |
Anaissi et al. | Smart pothole detection system using vehicle-mounted sensors and machine learning | |
KR101968309B1 (en) | SYSTEM AND METHOD FOR text classification | |
KR101598343B1 (en) | System for automatically Identifying spatio-temporal congestion patterns and method thereof | |
KR102124935B1 (en) | Disaster Monitoring System, Method Using Crowd Sourcing, and Computer Program therefor | |
CN113205134A (en) | Network security situation prediction method and system | |
CN106294406B (en) | Method and equipment for processing application access data | |
Pal et al. | DLME: distributed log mining using ensemble learning for fault prediction | |
Abidin et al. | Integrating Twitter traffic information with Kalman filter models for public transportation vehicle arrival time prediction | |
US20170061208A1 (en) | Determining Severity of a Geomagnetic Disturbance on a Power Grid Using Similarity Measures | |
JP7265334B2 (en) | Data collection device, data collection system and data collection method | |
CN113282920B (en) | Log abnormality detection method, device, computer equipment and storage medium | |
KR101645396B1 (en) | Method of processing time-series big data and system thereof | |
US20190171459A1 (en) | Analysis system and analysis method for executing analysis process with at least portions of time series data and analysis data as input data | |
Manjunatha et al. | Real-time big data analytics framework with data blending approach for multiple data sources in smart city applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |