KR101843519B1 - Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward - Google Patents

Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward Download PDF

Info

Publication number
KR101843519B1
KR101843519B1 KR1020170096866A KR20170096866A KR101843519B1 KR 101843519 B1 KR101843519 B1 KR 101843519B1 KR 1020170096866 A KR1020170096866 A KR 1020170096866A KR 20170096866 A KR20170096866 A KR 20170096866A KR 101843519 B1 KR101843519 B1 KR 101843519B1
Authority
KR
South Korea
Prior art keywords
variable
keyword
mesh
network
data
Prior art date
Application number
KR1020170096866A
Other languages
Korean (ko)
Inventor
이재성
Original Assignee
주식회사 지오그레이트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 지오그레이트 filed Critical 주식회사 지오그레이트
Priority to KR1020170096866A priority Critical patent/KR101843519B1/en
Application granted granted Critical
Publication of KR101843519B1 publication Critical patent/KR101843519B1/en

Links

Images

Classifications

    • G06F17/30637
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A method and an apparatus for automatically collecting and analyzing data by using a variable three-dimensional rectangular network keyword are disclosed. The method for automatically collecting and analyzing data by using a variable three-dimensional rectangular network keyword comprises the steps of: generating a variable three-dimensional rectangular network around a central keyword; and filling a plurality of network empty bins on the variable three-dimensional network with a keyword related to the central keyword.

Description

가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법 및 장치{Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward}TECHNICAL FIELD [0001] The present invention relates to a method and apparatus for automatic data collection and analysis using a variable three-dimensional rectangular mesh keyword,

본 발명은 데이터 수집 및 분석 방법에 관한 것으로서, 보다 상세하게는 가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법 및 장치에 관한 것이다.The present invention relates to a data collection and analysis method, and more particularly, to a method and apparatus for automatic data collection and analysis using a variable three-dimensional rectangular network keyword.

4차 산업혁명이 도래하면서 쏟아지는 수많은 데이터를 분석해서 인사이트를 도출하기 위한 수요는 계속 늘어나고 있는 반면에 데이터의 증가와 공급원의 증가로 인해 어떤 데이터를 수집하고 분석할 것인가에 대한 어려움은 증가하였다. While the demand for analyzing and insighting the numerous data pouring into the advent of the Fourth Industrial Revolution continues to increase, there has been an increase in the difficulty of collecting and analyzing certain data due to increased data and increased sources.

이에 따라 데이터의 수집 및 분석이 중요해졌는데, 데이터의 수집 및 분석을 함에 있어서 데이터의 컨텐츠를 하나 하나 확인하고 다시 수집하고 하는 방법으로 하다보니 많은 시간이 소요되고 급변하는 변화에 대응하여 수집 및 분석을 하는 것이 매우 까다롭다.As a result, data collection and analysis became important. In collecting and analyzing data, it is necessary to check and collect data contents one by one. It is very tricky to do.

데이터의 수집을 위해서는 찾고자 하는 데이터의 중심, 추상 키워드가 존재하여야 한다. 추상 키워드를 기반으로 데이터를 수집하려다 보면 너무 광범위한 데이터를 수집하게 되어 정작 원하는 데이터를 뽑아내기 위해서는 데이터의 정재 및 중복제거, 수집된 데이터안에서의 컨텐츠를 보고 관련성이 있는 데이터를 다시 찾아서 수집하는 방법으로 수집 및 분석을 반복하게 된다.In order to collect data, the center of the data to be searched, abstract keyword, must exist. If we try to collect data based on abstract keywords, we collect data that is too broad. In order to extract desired data, we need to retrieve the data in the collected data and retrieve the relevant data again. Collection and analysis.

따라서, 원하는 데이터를 수집 및 분석하는데 있어서 상당한 시간 및 인력이 소요되는 문제가 있는데 이를 해결할 방법이 필요하다.Therefore, there is a problem that a considerable amount of time and manpower is required for collecting and analyzing desired data, and a solution method is needed.

10-2014-011402910-2014-0114029

본 발명의 일 측면은 가변 입체 사각형 그물말 키워드를 이용한 자동 데이터 수집 및 분석 방법을 제공한다.One aspect of the present invention provides an automatic data collection and analysis method using a variable three-dimensional square net keyword.

본 발명의 다른 측면은 가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법을 수행하는 장치를 제공한다.Another aspect of the present invention provides an apparatus for performing an automatic data collection and analysis method using a variable three-dimensional rectangular network keyword.

본 발명의 일 측면에 따른 가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법은 중심 키워드를 중심으로 가변형 입체 사각형 그물망을 생성하는 단계와 상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집에 상기 중심 키워드와 관련된 키워드를 채우는 단계를 포함할 수 있다.According to an aspect of the present invention, there is provided an automatic data collection and analysis method using a variable three-dimensional rectangular network keyword, comprising the steps of: generating a variable-size three-dimensional rectangular network around a central keyword; And filling the associated keywords.

한편, 상기 가변형 입체 사각형 그물망은 상기 중심 키워드를 기준으로 상기 복수의 그물망 빈집이 위치하고, 상기 가변형 입체 사각형 그물망은 가로, 세로, 높이n 포인트씩이 할당된 입체 사각 격자 형태일 수 있다.Meanwhile, the variable-shaped three-dimensional rectangular network may have a plurality of mesh bins based on the center keyword, and the variable-size three-dimensional rectangular network may be in the form of a three-dimensional rectangular grid allocated with n,

또한, 상기 키워드는 최적 스코어를 기반으로 결정되고, 상기 최적 스코어는 상기 중심 키워드를 기준으로 한 직접적인 연관성 지수, 연관 관계 지수 및 데이터의 출현 빈도 지수를 기반으로 결정될 수 있다.Also, the keyword is determined based on an optimal score, and the optimal score can be determined based on a direct association index, an association index, and an appearance frequency index of the data based on the center keyword.

또한, 상기 최적 스코어는 상기 직접적인 연관성 지수, 상기 연관 관계 지수 및 상기 데이터의 출현 빈도 지수에 서로 다른 가중치를 부여하여 결정될 수 있다.The optimal score may be determined by assigning different weights to the direct association index, the association index, and the frequency index of appearance of the data.

또한, 가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법은 상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집이 채워진 경우, 그물망 완료 신호가 생성되는 단계와 상기 그물망 완료 신호를 기반으로 새로운 가변형 그물망이 생성되는 단계를 더 포함할 수 있다.Also, an automatic data collection and analysis method using a variable three-dimensional rectangular network keyword may include generating a network completion signal when a plurality of network empty bins on the variable rectangular solid network are filled in and generating a new variable network based on the network complete signal, And a second step of performing a second step.

본 발명의 또 다른 측면에 따른 가변 입체 사각형 그물망 키워드를 기반으로 자동 데이터 수집 및 분석을 수행하는 데이터 분석 시스템은 프로세서를 포함하고, 상기 프로세서는 중심 키워드를 중심으로 가변형 입체 사각형 그물망을 생성하고, 상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집에 상기 중심 키워드와 관련된 키워드를 채우도록 구현될 수 있다. According to another aspect of the present invention, there is provided a data analysis system for performing automatic data collection and analysis based on a variable three-dimensional rectangular network keyword, the apparatus comprising: a processor for generating a variable rectangular solid network around a center keyword, And fill the plurality of mesh empty spaces on the variable rectangular solid network with keywords related to the center keyword.

한편, 상기 가변형 입체 사각형 그물망은 상기 중심 키워드를 기준으로 상기 복수의 그물망 빈집이 위치하고, 상기 가변형 입체 사각형 그물망은 가로, 세로, 높이n 포인트씩이 할당된 입체 사각 격자 형태일 수 있다.Meanwhile, the variable-shaped three-dimensional rectangular network may have a plurality of mesh bins based on the center keyword, and the variable-size three-dimensional rectangular network may be in the form of a three-dimensional rectangular grid allocated with n,

또한, 상기 키워드는 최적 스코어를 기반으로 결정되고, 상기 최적 스코어는 상기 중심 키워드를 기준으로 한 직접적인 연관성 지수, 연관 관계 지수 및 데이터의 출현 빈도 지수를 기반으로 결정될 수 있다.Also, the keyword is determined based on an optimal score, and the optimal score can be determined based on a direct association index, an association index, and an appearance frequency index of the data based on the center keyword.

또한, 상기 최적 스코어는 상기 직접적인 연관성 지수, 상기 연관 관계 지수 및 상기 데이터의 출현 빈도 지수에 서로 다른 가중치를 부여하여 결정될 수 있다.The optimal score may be determined by assigning different weights to the direct association index, the association index, and the frequency index of appearance of the data.

또한, 상기 프로세서는 상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집이 채워진 경우, 그물망 완료 신호를 생성하고, 상기 그물망 완료 신호를 기반으로 새로운 가변형 그물망을 생성하도록 구현될 수 있다.In addition, the processor may be configured to generate a mesh completion signal when a plurality of mesh blanks on the variable rectangular mesh are filled, and to generate a new mesh based on the mesh completion signal.

본 발명의 실시예에 따른 가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법 및 장치는 수많은 데이터중에서 찾고자 하는 핵심 주제를 선정했을 때 해당 키워드를 중심으로 자동으로 수집하고 분석하는 것을 매우 빠르고, 효과적으로 할 수 있다. The method and apparatus for automatic data collection and analysis using a variable three-dimensional rectangular network keyword according to an embodiment of the present invention are very fast and effective in automatically collecting and analyzing a keyword, can do.

도 1은 본 발명의 실시예에 따른 가변 입체 사각형 그물망(meshup) 키워드를 이용한 자동 데이터 수집 및 분석 방법을 나타낸 순서도이다.
도 2는 본 발명의 실시예에 따른 가변 입체 사각형 그물망(meshup) 키워드를 이용한 자동 데이터 수집 및 분석 방법을 나타낸 개념도이다.
도 3은 본 발명의 실시예에 따른 최적 스코어(optimal score) 및 최고/최적 스코어, 평가 스코어를 결정하기 위한 방법을 나타낸 개념도이다.
도 4는 본 발명의 실시예에 따른 데이터 분석 시스템을 나타낸 개념도이다.
1 is a flowchart illustrating an automatic data collection and analysis method using a variable three-dimensional rectangular mesh keyword according to an embodiment of the present invention.
2 is a conceptual diagram illustrating an automatic data collection and analysis method using a variable three-dimensional rectangular mesh keyword according to an embodiment of the present invention.
3 is a conceptual diagram illustrating a method for determining an optimal score and a best / best score, an evaluation score, according to an embodiment of the present invention.
4 is a conceptual diagram illustrating a data analysis system according to an embodiment of the present invention.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조 부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.The following detailed description of the invention refers to the accompanying drawings, which illustrate, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different, but need not be mutually exclusive. For example, certain features, structures, and characteristics described herein may be implemented in other embodiments without departing from the spirit and scope of the invention in connection with an embodiment. It is also to be understood that the position or arrangement of the individual components within each disclosed embodiment may be varied without departing from the spirit and scope of the invention. The following detailed description is, therefore, not to be taken in a limiting sense, and the scope of the present invention is to be limited only by the appended claims, along with the full scope of equivalents to which such claims are entitled, if properly explained. In the drawings, like reference numerals refer to the same or similar functions throughout the several views.

이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in more detail with reference to the drawings.

다량의 데이터(Bigdata)에 대한 자동 데이터 수집 및 분석을 효과적으로 하기 위해서는 사전(dictionary)을 생성하고 학습 데이터를 만들고 패턴을 파악하여 데이터를 재가공하는 것이 필요하다.In order to effectively collect and analyze large amounts of data (Bigdata), it is necessary to generate a dictionary, create learning data, grasp patterns and re-process the data.

이를 위해서는 가상의 가변적인 그물망을 만들고 중심 키워드를 선정하여 중심 키워드와의 직접적인 연관성 지수(또는 relation level score), 연관 관계 지수(또는 support score)가 높은 데이터와 출현 빈도(또는 frequently score)가 높은 데이터 등의 점수를 합산한 최적 스코어(optimal Score)를 산출하고 지속적으로 변화하고 리프레쉬(refresh)되는 사전 큐브가 생성될 수 있다.To do this, we create a virtual variable network and select the center keyword to select the data that has a direct relevance index (or relation level score), association index (or support score) and high frequency (or frequently score) And a pre-cube that is constantly changed and refreshed can be generated.

도 1은 본 발명의 실시예에 따른 가변 입체 사각형 그물망(meshup) 키워드를 이용한 자동 데이터 수집 및 분석 방법을 나타낸 순서도이다.1 is a flowchart illustrating an automatic data collection and analysis method using a variable three-dimensional rectangular mesh keyword according to an embodiment of the present invention.

도 1에서는 가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석을 수행하기 위한 절차가 개시되어 있다.In FIG. 1, a procedure for performing automatic data collection and analysis using a variable three-dimensional rectangular network keyword is disclosed.

본 발명의 실시예에 따른 가변 입체 사각형 메쉬업 키워드를 이용한 자동 데이터 수집 및 분석 방법 및 장치에서는 광범위한 데이터를 수집하고 분석하기 위해 추상 중심 키워드(abstract core keyword)(또는 중심 키워드(core keyword))가 선정되어 입력될 수 있다.In an automatic data collection and analysis method and apparatus using a variable three-dimensional rectangular mesh-up keyword according to an embodiment of the present invention, an abstract core keyword (or a core keyword) Can be selected and input.

가변 입체 사각형 그물망의 생성 목적은 방대한 데이터 및 분석을 위해 관심사항 및 이슈사항 중심으로 그물망을 만들어 보다 쉽고 빠르게 의미있는 데이터에 대한 수집 및 분석을 하는데 그 목적이 있다.The goal of creating a variable three-dimensional rectangular mesh is to collect and analyze meaningful data more easily and quickly by creating a mesh centered on interests and issues for massive data and analysis.

본 발명에 따른 중심 키워드(Core Keyword))를 기반으로 한 그물망 키워드의 생성을 위해 아래와 같은 단계가 수행될 수 있다.The following steps may be performed to generate a mesh keyword based on the core keyword according to the present invention.

1) 그물망 빈집 (Meshup Empty Block)에 대한 중심점을 기준으로 가로, 세로, 높이 6point씩(+,- 3point)을 격자 형태를 만드는 단계(단계 S110).1) Step of making a lattice shape of 6 points (+, - 3point) in horizontal, vertical, and height based on the center point of the mesh empty block (step S110).

2) 중심 키워드를 중심으로 수집된 데이터중에서 중심 키워드와의 직접적인 연관성 지수(또는 relation level score), 연관 관계 지수(또는 support score)가 높은 데이터와 출현 빈도 지수(또는 frequently score)가 높은 데이터 등의 점수를 합산한 최적 스코어(optimal Score)를 산출하고, 그물망 포인트(Meshup Point)가 되는 키워드를 반복 생성하는 단계(단계 S120).2) Data that are related to the central keyword and have a direct association index (or relation level score), data with a high association score (or support score) and data with a high frequency of occurrence (or frequent score) Calculating an optimal score obtained by summing the scores, and repeatedly generating a keyword that is a mesh point (step S120).

3) 키워드와 중심 키워드와의 직접적인 관계(Core Keyword Relation Level)를 설정하는 단계(단계 S130).3) setting a direct relationship (Core Keyword Relation Level) between the keyword and the central keyword (step S130).

4) 중심 키워드를 기준으로 연관 관계 지수(support score)과 직접적인 연관성 지수(relation level score)(1~3)가 높은 순서로 중심 축을 중심으로 가장 가까운 격자부터 순서대로 키워드 및 격자 위치 정보를 그물망 포인트(Meshup Point)에 반복 입력하는 단계(단계 S140).4) Based on the central keyword, the support score and the relation level score (1 ~ 3) are ranked in order from the closest lattice centered on the central axis. (Step S140).

5) 그물망 안의 모든 그물망 포인트(Meshup Point)가 모두 입력되고 나면 대기 신호를 보내고 8개의 포인트(Point)(하나의 격자)로 구성된 각각의 입체 사각형 안의 각 포인트(Point)로 구성된 키워드에 대한 데이터를 자동 수집 및 적재하는 단계(단계 S150).5) After all the mesh points in the mesh have been input, the data for the keyword consisting of each point in each solid rectangle composed of 8 points (one grid) And automatically collecting and loading (step S150).

6) 각 그물망 포인트(Meshup Point)로 수집된 데이터를 자동/분석하는 단계(단계 S160).6) Automating / analyzing data collected at each mesh point (step S160).

7) 해당 그물망에서 그물망 빈집(Meshup Empty Block)이 수집 데이터로 모두 채워지면 (해당 블록 사이즈(block size)는 사용자에 의해 지정될 수 있다.) 수명 주기를 다한 것으로 판단하고, 중심 키워드를 중심으로 새로운 환경에 맞는 신규 입체 사각형 그물망을 생성하여 환경 변화에 따른 가변 데이터를 수집하는 단계(단계 S170).7) If the Meshup Empty Block in the mesh is filled with the collected data (the block size can be specified by the user), it is judged that the life cycle has been completed. A step S 170 of generating a new three-dimensional rectangular network suitable for a new environment and collecting variable data according to an environment change.

이하, 구체적인 가변 입체 사각형 그물망이 개시된다.Hereinafter, a specific variable three-dimensional rectangular network is disclosed.

도 2는 본 발명의 실시예에 따른 가변 입체 사각형 그물망(meshup) 키워드를 이용한 자동 데이터 수집 및 분석 방법을 나타낸 개념도이다.2 is a conceptual diagram illustrating an automatic data collection and analysis method using a variable three-dimensional rectangular mesh keyword according to an embodiment of the present invention.

도 2에서는 가변 입체 사각형 그물망(meshup) 키워드를 이용한 자동 데이터 수집 및 분석 방법이 개시된다. In FIG. 2, an automatic data collection and analysis method using a variable three-dimensional rectangular mesh keyword is disclosed.

도 2를 참조하면, 데이터 수집 및 분석을 위해 중심 키워드(Core Keyword)를 중심으로 가변형 입체 사각형 그물망(Meshup)이 생성될 수 있다. Referring to FIG. 2, a variable shape solid square mesh may be generated around a core keyword for data collection and analysis.

그물망의 격자의 중심에 그물망 빈집(Meshup Empty Block)이 생성되고, 가로, 세로, 높이n 포인트씩(예를 들어, 6포인트(+,- 3point)) 입체 사각 격자 형태가 생성될 수 있다.A Meshup Empty Block is created at the center of the mesh of the mesh, and a three dimensional rectangular grid shape can be generated by n points (for example, 6 points (+, - 3point)) in the horizontal, vertical and height directions.

중심 키워드 선정 이후에는 수집 시작 시점으로부터 일정 기간(예를 들어, 24시간) 동안 중심 키워드에 대한 초기 데이터가 생성되고, 초기 데이터는 초기 데이터 저장소(initial data repository)에 저장될 수 있다.After the center keyword is selected, initial data for the center keyword is generated for a predetermined period (for example, 24 hours) from the start of collection, and the initial data can be stored in the initial data repository.

그물망 빈집에 입력할 데이터를 찾기 위해 중심 키워드를 기준으로 수집된 초기 데이터의 컨텐츠 내용 상에서 중심 키워드와의 직접적인 연관성 지수(relation level score), 연관 관계 지수(support score), 데이터의 출현 빈도 지수(frequently score)가 결정될 수 있다. 중심 키워드와의 직접적인 연관성 지수, 연관 관계 지수, 데이터의 출현 빈도 지수 순서로 가중치가 부여되고, 점수가 합산(optimal score)될 수 있다. 이러한 합산 결과를 기반으로 중심 키워드를 중심으로 한 키워드가 결정될 수 있다.A relation level score, a support score, and an appearance frequency index of data on a content content of an initial data collected based on a center keyword in order to find data to be input to a blank web site, score) can be determined. The scores are weighted in the order of direct association with the central keyword, association index, and data appearance frequency index, and the scores can be combined (optimal score). Based on the summation result, a keyword centered on the central keyword can be determined.

그물망 빈집에 데이터를 모두 채워넣기 위해 수집된 데이터와 수집 키워드가 초기 데이터 저장소에 저장될 수 있다.The collected data and collected keywords can be stored in the initial data store to fill all of the data in the mesh blank.

그물망 빈집에 데이터를 모두 채워넣기 위해 데이터를 수집하고, 키워드를 결정하는 과정은 그물망 빈집 상의 공간이 채워질 때까지 반복될 수 있다.The process of collecting data and determining the keywords to fill all of the data in the mesh blank can be repeated until the space on the mesh blank is filled.

그물망 빈집 안에는 키워드에 대한 정보, 격자 위치 정보, 날짜 정보가 포함될 수 있다. 그물망 빈집이 모두 채워진 이후, 그물망 완료 신호(Complete Signal)가 생성되고, 더 이상 데이터의 수집 및 키워드의 결정 절차는 수행되지 않을 수 있다.Information on the keyword, lattice location information, and date information may be included in the mesh empty house. After the fillets are all filled, a complete signal is generated and the collection of data and the determination of keywords may no longer be performed.

그물망 완료 신호가 수신되면, 새로운 그물망이 생성되고, 새로운 그물망의 중심 키워드는 중심 키워드와의 직접적인 연관성, 연관 관계 지수, 데이터의 출현 빈도를 합산하여 결정될 수 있다, 새로운 그물망에 대해 전술한 과정이 동일하게 수행될 수 있다. 반복되는 과정 상에서 기존의 그물망과 새로운 그물망에 수집된 데이터의 중복이 일장 임계 퍼센트(예를 들어, 20%) 이상 발생하는 경우, 오래된 그물망의 수명은 다된 것으로 판단될 수 있다.When a network complete signal is received, a new network is created, and the center keyword of the new network can be determined by summing up the direct association with the central keyword, the association index, and the frequency of occurrence of the data. . ≪ / RTI > If the duplication of data collected in the existing network and the new network in the repeated process occurs more than a threshold percentage (for example, 20%), it can be judged that the lifetime of the old network is exhausted.

이하, 본 발명의 실시예에 따른 최적 스코어(optimal score) 및 최고/최적 스코어, 평가 스코어를 결정하기 위한 방법이 개시된다.Hereinafter, a method for determining an optimal score and a best / best score, an evaluation score, according to an embodiment of the present invention is disclosed.

본 발명의 실시예에 따른 최고/최적의 점수를 찾아내기 위해서는 학습데이터에 대한 사전 세트를 만들고 평가하는 데이터 모델을 만드는 것이 필요하다. 전술한 바와 같이 중심 키워드에 대한 직접적인 연관성 지수(또는 relation level score), 연관 관계 지수(또는 support score)가 높은 데이터와 출현 빈도(또는 frequently score)를 기반으로 최적 스코어(optimal Score)가 산출될 수 있다.In order to find the best / optimal score according to an embodiment of the present invention, it is necessary to create a data model that creates and evaluates a dictionary set of learning data. As described above, an optimal score can be calculated based on a direct relevance index (or relation level score) for a central keyword, data having a high association score (or support score), and frequency of occurrence (or a frequent score) have.

또한, 평가 항목 그리고 평가 점수(evaluation score)를 열(column)로 하여 수집되는 키워드마다 자동 평가(evaluation)가 진행될 수 있다. 이 ‹š의 평가 진행 방식은 일별 수집되는 데이터의 양(data gathering qunatity)와 데이터 정제 후 데이터의 양, 그물망의 수명주기를 합산하여 점수화가 수행될 수 있다.In addition, an evaluation may be performed for each keyword collected using an evaluation item and an evaluation score as a column. This method of evaluation can be scored by summing up the data gathering qunatity, the amount of data after data refinement, and the life cycle of the network.

구체적으로 아래와 같은 수식으로 최적 스코어, 최고/최적 스코어 및 평가 스코어가 산출될 수 있다.Specifically, an optimal score, a best / optimal score and an evaluation score can be calculated by the following equation.

<수학식 1>&Quot; (1) &quot;

최적 스코어(optimal score)= 가중치1*연관성 Level+가중치2*연관지수+가중치3*출현빈도Optimal score = weight 1 * relevance level + weight 2 * association score + weight 3 * appearance frequency

최고/최적 스코어(best optimal score) = 학습 데이터를 통해 키워드와 키워드 간에 평가 항목별로 가장 높은 점수를 취한 점수 데이터Best optimal score = score data obtained by taking the highest score among the evaluation items between the keyword and the keyword through the learning data

평가 스코어(evaluation Score)= 키워드와 연관 키워드로 수집되는 Raw 데이터의 양/일별+정제 후 데이터의 양/일별+수명주기Evaluation Score = Amount of raw data collected by keywords and related keywords / Daily + Amount of data after purification / Daily + Life cycle

최적 스코어(optimal score) 및 최고/최적 스코어, 평가 스코어는 다양하게 활용될 수 있다. The optimal score and the best / optimal score, evaluation score can be utilized in various ways.

도 3은 본 발명의 실시예에 따른 데이터 분석 시스템을 나타낸 개념도이다.3 is a conceptual diagram illustrating a data analysis system according to an embodiment of the present invention.

도 3을 참조하면 데이터 분석 시스템은 중심 키워드 입력부(300), 가변형 입체 그물망 생성부(310), 데이터 저장부(320), 최적 스코어 생성부(330), 그물망 완료 결정부(340), 가변형 입체 그물망 수명 결정부(350) 및 프로세서(360)를 포함할 수 있다.3, the data analysis system includes a central keyword input unit 300, a variable three-dimensional network generating unit 310, a data storing unit 320, an optimal score generating unit 330, a network completion determining unit 340, A network life determination unit 350 and a processor 360. [

중심 키워드 입력부(300)는 데이터 수집 및 분석을 위한 중심 키워드(Core Keyword)를 입력 받기 위해 구현될 수 있다.The central keyword input unit 300 may be implemented to receive a core keyword for data collection and analysis.

가변형 입체 그물망 생성부(310)는 데이터 수집 및 분석을 위한 가변형 입체 사각형 그물망(Meshup)을 생성하기 위해 구현될 수 있다. The variable shape solid mesh generation unit 310 may be implemented to generate a variable shape solid mesh for data acquisition and analysis.

가변형 입체 그물망 생성부(310)는 그물망의 격자의 중심에 그물망 빈집(Meshup Empty Block)을 포함하고, 가로, 세로, 높이n 포인트씩(예를 들어, 6포인트(+,- 3point)) 입체 사각 격자 형태로 생성될수 있다. 수집된 데이터가 가변형 입체 그물망 생성부(310) 상에서 그물망 빈집에 위치할 수 있다.The variable-shape three-dimensional mesh generation unit 310 includes a meshup empty block at the center of the mesh grid, and generates a three-dimensional mesh of the mesh shape by n points (for example, 6 points (+, - 3point) Can be generated in a grid form. The collected data may be located in the mesh blank on the variable shape mesh generating unit 310.

가변형 입체 그물망 생성부(310)는 그물망 완료 신호가 수신되면, 새로운 그물망을 생성하기 위해 결정될 수 있다.When the mesh completion signal is received, the variable shape mesh generator 310 may be determined to generate a new mesh.

데이터 저장부(320)는 중심 키워드 선정 이후에는 수집 시작 시점으로부터 일정 기간(예를 들어, 24시간) 동안 중심 키워드에 대한 초기 데이터를 저장하기 위해 구현될 수 있다.The data storage unit 320 may be configured to store initial data for a central keyword for a predetermined period (for example, 24 hours) from the start of collection after the central keyword is selected.

최적 스코어 생성부(330)는 그물망 빈집에 입력할 데이터를 찾기 위해 중심 키워드를 기준으로 수집된 초기 데이터의 컨텐츠 내용 상에서 중심 키워드와의 직접적인 연관성(relation level), 연관 관계 지수(support score), 데이터의 출현 빈도(frequently score)를 결정하고, 각각에 대한 가중치를 기반으로 최적 스코어를 생성하기 위해 구현될 수 있다. The optimal score generation unit 330 generates a relation score, a relation score, a data relevance index, and the like, on the content content of the initial data collected on the basis of the center keyword, A frequency score, and to generate an optimal score based on the weights for each.

그물망 완료 결정부(340)는 그물망 빈집이 모두 채워진 이후, 그물망 완료 신호(Complete Signal)가 생성하기 위해 구현될 수 있다.The mesh completion determiner 340 may be implemented to generate a mesh complete signal (Complete Signal) after all of the mesh empty spaces have been filled.

가변형 입체 그물망 수명 결정부(350)는 가변형 입체 그물망의 수명이 다했는지 여부를 판단하기 위해 구현될 수 있다.The variable mesh network lifetime determiner 350 may be implemented to determine whether the life of the variable mesh is reached.

프로세서(360)는 중심 키워드 입력부(300), 가변형 입체 그물망 생성부(310), 데이터 저장부(320), 최적 스코어 생성부(330), 그물망 완료 결정부(340), 가변형 입체 그물망 수명 결정부(350)의 동작을 제어하기 위해 구현될 수 있다.The processor 360 includes a central keyword input unit 300, a variable three-dimensional network generating unit 310, a data storing unit 320, an optimum score generating unit 330, a network completion determining unit 340, (Not shown).

전술한 방법은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.The above-described methods may be implemented in an application or may be implemented in the form of program instructions that may be executed through various computer components and recorded on a computer-readable recording medium. The computer-readable recording medium may include program commands, data files, data structures, and the like, alone or in combination.

상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들일 수 있고, 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.The program instructions recorded on the computer-readable recording medium may be those specially designed and configured for the present invention and may be those known and used by those skilled in the computer software arts.

컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like.

프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of program instructions include machine language code such as those generated by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules for performing the processing according to the present invention, and vice versa.

이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it will be understood by those skilled in the art that various changes and modifications may be made therein without departing from the spirit and scope of the invention as defined in the appended claims. It will be possible.

Claims (10)

가변 입체 사각형 그물망 키워드를 이용한 자동 데이터 수집 및 분석 방법은,
중심 키워드를 중심으로 가변형 입체 사각형 그물망을 생성하는 단계; 및
상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집에 상기 중심 키워드와 관련된 키워드를 채우는 단계를 포함하되
상기 가변형 입체 사각형 그물망은 상기 중심 키워드를 기준으로 상기 복수의 그물망 빈집이 위치하고,
상기 가변형 입체 사각형 그물망은 가로, 세로, 높이n 포인트씩이 할당된 입체 사각 격자 형태인 것을 특징으로 하는 데이터 수집 및 분석 방법.
An automatic data collection and analysis method using a variable three-
Generating a variable rectangular solid network around a center keyword; And
Filling a plurality of mesh blanks on the variable three-dimensional rectangular mesh with keywords related to the center keyword,
Wherein the variable-shaped three-dimensional rectangular network has the plurality of mesh bins based on the center keyword,
Wherein the variable shape rectangular mesh network is in the form of a three-dimensional square lattice having n, n, and h points assigned thereto.
삭제delete 삭제delete 삭제delete 삭제delete 가변 입체 사각형 그물망 키워드를 기반으로 자동 데이터 수집 및 분석을 수행하는 데이터 분석 시스템에 있어서,
상기 데이터 분석 시스템은 프로세서를 포함하고,
상기 프로세서는 중심 키워드를 중심으로 가변형 입체 사각형 그물망을 생성하고,
상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집에 상기 중심 키워드와 관련된 키워드를 채우도록 구현되되,
상기 가변형 입체 사각형 그물망은 상기 중심 키워드를 기준으로 상기 복수의 그물망 빈집이 위치하고,
상기 가변형 입체 사각형 그물망은 가로, 세로, 높이n 포인트씩이 할당된 입체 사각 격자 형태인 것을 특징으로 하는 데이터 분석 시스템.
A data analysis system for performing automatic data collection and analysis based on a variable three-dimensional rectangular network keyword,
Wherein the data analysis system comprises a processor,
The processor generates a variable three-dimensional rectangular network around a center keyword,
Wherein a plurality of mesh blanks on the variable three-dimensional rectangular mesh are filled with a keyword related to the center keyword,
Wherein the variable-shaped three-dimensional rectangular network has the plurality of mesh bins based on the center keyword,
Wherein the variable-shape three-dimensional rectangular network is in the form of a three-dimensional rectangular lattice with n, n, and h points assigned thereto.
삭제delete 삭제delete 삭제delete 제6항에 있어서,
상기 프로세서는 상기 가변형 입체 사각형 그물망 상의 복수의 그물망 빈집이 채워진 경우, 그물망 완료 신호를 생성하고,
상기 그물망 완료 신호를 기반으로 새로운 가변형 그물망을 생성하도록 구현되는 것을 특징으로 하는 데이터 분석 시스템.
The method according to claim 6,
The processor generates a mesh completion signal when a plurality of mesh bins on the variable rectangular mesh are filled,
And a new variable network is generated based on the network completion signal.
KR1020170096866A 2017-07-31 2017-07-31 Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward KR101843519B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170096866A KR101843519B1 (en) 2017-07-31 2017-07-31 Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170096866A KR101843519B1 (en) 2017-07-31 2017-07-31 Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward

Publications (1)

Publication Number Publication Date
KR101843519B1 true KR101843519B1 (en) 2018-03-29

Family

ID=61906926

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170096866A KR101843519B1 (en) 2017-07-31 2017-07-31 Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward

Country Status (1)

Country Link
KR (1) KR101843519B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130111339A1 (en) 2011-10-28 2013-05-02 Hon Hai Precision Industry Co., Ltd. Computing device, storage medium and method for analyzing step formatted file of measurement graphics

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130111339A1 (en) 2011-10-28 2013-05-02 Hon Hai Precision Industry Co., Ltd. Computing device, storage medium and method for analyzing step formatted file of measurement graphics

Similar Documents

Publication Publication Date Title
JP6032467B2 (en) Spatio-temporal data management system, spatio-temporal data management method, and program thereof
CN102057368B (en) Distribution of properties in a 3D volumetric model using a maximum continuity field
RU2013112926A (en) DEVICE FOR CALCULATION DATA CREATION, METHOD FOR CALCULATING DATA CREATION AND PROGRAM FOR CALCULATING DATA
CN103365916A (en) Earthquake event parameter estimation and acquirement method and system and earthquake event search engine
Vermeulen et al. A comparative study of k‐nearest neighbour techniques in crowd simulation
CN109117433B (en) Index tree object creation and index method and related device thereof
CN106649412B (en) Data processing method and equipment
US9690885B2 (en) Interactive visualization of reservoir simulation data sets
US20230281182A1 (en) R-tree index merging and updating method and apparatus based on hilbert curve, and medium
CN117150095B (en) Hierarchical tree node searching method, electronic equipment and medium
CN113009553A (en) Interpretable seismic motion parameter probability density distribution prediction method based on NGboost and SHAP values
WO2013001070A1 (en) Data base indexing
CN106294785A (en) Content Selection method and system
KR101843519B1 (en) Method and apparatus for automatic collecting and analyzing data based on changeable three dimensional sturcure meshup keyward
CN117370846B (en) Hydraulic fracturing three-dimensional fracture network construction method and system based on microseism event
JP6253053B2 (en) Data search device, data search device control method, and data search device control program
CN110019806A (en) A kind of document clustering method and equipment
Alis et al. Parallel processing of big point clouds using Z-Order-based partitioning
CN103207871A (en) Method and device for evaluating rewriting effect of query string of search system
CN115145930A (en) GIS vector data hierarchical coding method and device based on tree hierarchical index
CN106326255B (en) A kind of pel laminated cutting method and device
CN114491897A (en) Seismic wave numerical simulation method, device, medium and electronic equipment
KR101363335B1 (en) Apparatus and method for generating document categorization model
CN111831622A (en) Data index generation method and device, electronic equipment and readable storage medium
Wang et al. Isosurface extraction and view-dependent filtering from time-varying fields using persistent time-octree (PTOT)

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant