KR20180117460A - Method for detecting issue based on trend analysis device thereof - Google Patents

Method for detecting issue based on trend analysis device thereof Download PDF

Info

Publication number
KR20180117460A
KR20180117460A KR1020170050602A KR20170050602A KR20180117460A KR 20180117460 A KR20180117460 A KR 20180117460A KR 1020170050602 A KR1020170050602 A KR 1020170050602A KR 20170050602 A KR20170050602 A KR 20170050602A KR 20180117460 A KR20180117460 A KR 20180117460A
Authority
KR
South Korea
Prior art keywords
data
issue
time
time series
component
Prior art date
Application number
KR1020170050602A
Other languages
Korean (ko)
Other versions
KR101924352B1 (en
Inventor
이훈석
안순홍
이지민
이상원
박진표
Original Assignee
아시아나아이디티 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아시아나아이디티 주식회사 filed Critical 아시아나아이디티 주식회사
Priority to KR1020170050602A priority Critical patent/KR101924352B1/en
Publication of KR20180117460A publication Critical patent/KR20180117460A/en
Application granted granted Critical
Publication of KR101924352B1 publication Critical patent/KR101924352B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/30705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

Various embodiments of the present invention relate to a method for detecting an issue based on trend analysis and an apparatus thereof. According to an embodiment of the present invention, the method for detecting an issue based on trend analysis includes the steps of: generating time series data for two or more categories based on inputted data; detecting an abnormal trend based on component data included in the time series data; and determining a part of a plurality of keywords designated in two or more time points as the issue, based on at least two or more time points at which the abnormal trend is generated. Accordingly, the present invention can improve the detection performance of an important issue.

Description

트랜드 분석에 기반하는 이슈 검출방법 및 그 장치{METHOD FOR DETECTING ISSUE BASED ON TREND ANALYSIS DEVICE THEREOF}[0001] METHOD FOR DETECTING ISSUE BASED ON TREND ANALYSIS DEVICE THEREOF [0002]

본 발명의 다양한 실시 예는 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치에 관한 것으로, 더욱 상세하게는 입력된 데이터의 트랜드를 분석하고, 트랜드 중 일부를 이슈로 검출하는 방법 및 그 장치에 관한 것이다.Various embodiments of the present invention relate to a method and apparatus for detecting an issue based on trend analysis, and more particularly to a method and an apparatus for analyzing a trend of input data and detecting a part of the trend as an issue .

인터넷 정보 수집에 의하여 외부 환경을 고려한 기업의 내부 데이터 분석 방법이 연구되고 있다. 예를 들어, 고객의 성향을 인터넷 정보에 의하여 트랜드를 파악하고 기업의 실적(예: 품목단위 매출)과 함께 분석함으로써 매출의 변동 요인을 찾거나 또는 신규 상품의 기획 근거를 발하고 있다. 이러한 활동은 실시간 경영(Real-Time Enterprise, RTE)의 개념을 현실화 하는데 큰 영향을 주고 있다.A method for analyzing internal data of companies considering external environment is being studied by collecting Internet information. For example, trends of customers are identified by Internet information and analyzed with the company's performance (eg, unit-level sales) to determine the factors of sales change, or to base the planning of new products. These activities have a great impact on realizing the concept of real-time enterprise (RTE).

기업 환경뿐만 아니라 공공 분야에서도 국민의 안전, 소비자 환경 등 인터넷상의 트랜드 분석을 통해 즉각적인 대응, 정책 전략을 수립할 수 있다. 해외의 경우 이슈 탐지(Horizon Scanning)라는 명명하에 이러한 류의 프로젝트들이 수행 중이다.In the public sector as well as the corporate environment, it is possible to establish an immediate response and policy strategy by analyzing trends on the Internet, such as the safety of the public and the consumer environment. Overseas, these kinds of projects are under the name of "Horizon Scanning".

이때 중요한 것은 수집된 정보를 ?분석? 이라는 과정을 통해서 이슈를 탐지 하는 것이다. 이슈 탐지를 얼마나 실시간으로 수행할 수 있느냐가 실시간 경영의 중요한 요소가 될 수 있다.What is important at this time is to analyze the information collected? The problem is to detect the issue. How real-time issue detection can be performed can be an important factor in real-time management.

특허문헌 제10-2014-0139466호는 예측을 위한 속성이 될 수 있는 웹상의 과거 및 실시간 데이터를 크롤링하는 데이터 크롤링 엔진부; 과거부터 현재까지의 판매 통계 데이터와 상기 크롤링한 속성 데이터를 저장 및 관리하는 데이터베이스부; 상기 데이터베이스부의 데이터에 대한 데이터 전처리 과정을 포함하며 예측을 위한 트레이닝셋, 테스트셋을 포함한 데이터셋을 생성하는 데이터셋 생성부; 선정 및 기설정된 예측 모델, 알고리즘을 통해 상기 데이터셋에 기초하여 예측 목표일에 대응하는 판매 예측 값을 산출하는 데이터 마이닝 엔진부; 상기 판매 예측 값을 관리자에게 제공하는 판매 예측 정보 제공부; 상기 관리자가 판매 예측에 영향을 미칠 것이라 예견하는 데이터를 입력하여 상기 예측을 위한 속성 데이터로 사용함으로써 상기 예측의 정확도를 향상시키는 속성 데이터 수동 입력부; 를 포함하는 것을 특징으로 하는 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치를 개시하고 있다.Patent Document 10-2014-0139466 discloses a data crawling engine unit for crawling past and real-time data on the web, which can be attributes for prediction; A database unit for storing and managing sales statistic data from past to present and the crawled attribute data; A data set generation unit for generating a data set including a training set and a test set for prediction, the data set including a data preprocessing step for data of the database unit; A data mining engine unit for calculating a sales forecast value corresponding to a forecast target date based on the data set through selection and predetermined prediction models and algorithms; A sales forecast information providing unit for providing the sales forecast value to the manager; An attribute data manual input unit for inputting data predicted by the manager to affect a sales forecast and using the data as attribute data for prediction to improve the accuracy of the prediction; And a sales forecast automation device based on manager input.

하지만, 입력된 데이터에 기반하여 발생되는 이슈를 검출하고, 시계열적으로 이슈의 연관성을 분석 및 중요 이슈를 검출하는 데에는 여전히 기술적 한계가 존재한다.However, there are still technical limitations in detecting issues arising from input data, analyzing the relevance of issues in a timely manner, and detecting important issues.

10-2014-0139466 (공개특허공보)10-2014-0139466 (Patent Document 1)

본 발명의 다양한 실시 예에 따르면, 입력된 데이터의 트랜드 분석을 통하여 이슈의 발생을 검출하고, 발생된 이슈들 중 중요 이슈를 검출하는, 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치를 제공할 수 있다. According to various embodiments of the present invention, it is possible to provide an apparatus and method for detecting an issue based on trend analysis, which detects an occurrence of an issue through trend analysis of inputted data and detects an important issue among the generated issues have.

본 발명의 다양한 실시 예에 따르면, 입력된 데이터에 기반하는 시계열 데이터의 트랜드 분석을 통하여 중요 이슈 및 그와 관련된 키워드를 검출하는, 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치를 제공할 수 있다.According to various embodiments of the present invention, it is possible to provide a method and apparatus for detecting an issue based on trend analysis, which detects a key issue and its related keywords through trend analysis of time series data based on input data.

본 발명의 일 실시 예에 따르면, 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하는 단계; 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하는 단계; 및 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계;를 포함하는, 트랜드 분석에 기반하는 이슈 검출방법을 제공한다.According to an embodiment of the present invention, there is provided a method of generating time series data, the method comprising: generating time series data for two or more categories based on input data; Detecting an abnormal trend based on the component data included in the time series data; And determining, as an issue, a part of a plurality of keywords designated at the two or more time points based on at least two time points at which the abnormal trend occurs.

다양한 실시 예에 따르면, 상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함할 수 있다.According to various embodiments, the component data includes information on at least one of a period component, a trend component, an arbitrary component, and a moving average component of each of the time series data for each of the time series data .

또한, 상기 이상 트랜드는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태일 수 있다.The abnormal trend may be a state in which the value corresponding to the time component in the time series data of at least one of the two or more categories is out of a specified numerical range.

또한, 상기 이상 트랜드를 검출하는 단계는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 검출할 수 있다.The step of detecting the abnormal trend may detect at least one of abnormality detected in the time series data of at least one of the two or more categories and abnormality detected.

또한, 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 결정할 수 있다.The step of determining a part of the plurality of keywords designated at the two or more viewpoints as the issue may include applying at least one weight among the time weight according to the distance between the at least two viewpoints and the identity weight according to the identity of the category You can decide.

한편, 본 발명의 일 실시 예에 따르면, 적어도 하나의 외부장치와 통신하는 통신부; 및 상기 통신부를 통해서 상기 외부장치로부터 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하고, 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하고, 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 처리부;를 포함하는, 트랜드 분석에 기반하는 이슈 검출장치를 제공한다.According to an embodiment of the present invention, there is provided a communication apparatus comprising: a communication unit for communicating with at least one external device; And generating a time series data for at least two categories based on data input from the external device through the communication unit, detecting an abnormal trend based on the component data included in the time series data, And a processor for determining a part of the plurality of keywords specified at the two or more viewpoints as an issue based on the two or more viewpoints.

다양한 실시 예에 따르면, 상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함할 수 있다.According to various embodiments, the component data includes information on at least one of a period component, a trend component, an arbitrary component, and a moving average component of each of the time series data for each of the time series data .

또한, 상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태를 상기 이상 트랜드로 결정할 수 있다.In addition, the processing unit may determine, as the abnormal trend, a state in which a value corresponding to a time component in a time series data of at least one of the two or more categories is out of a specified numerical range.

또한, 상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 상기 이상 트랜드로 검출할 수 있다.In addition, the processing unit may detect at least one of the abnormality detected in the time series data of at least one of the two or more categories and the abnormal abnormality detected as the abnormality trend.

또한, 상기 처리부는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정할 수 있다.The processing unit may determine at least one of a plurality of keywords designated at the two or more time points as an issue by applying at least one weight among time weights according to distances between the at least two view points and identity weights according to the identities of the categories .

본 발명의 다양한 실시 예에 따르면, 수집된 정보(데이터)에 기반하여 다양한 카테고리에 대한 시계열 데이터를 분석함으로써 중요 이슈의 검출 성능을 향상시킬 수 있다.According to various embodiments of the present invention, the detection performance of important issues can be improved by analyzing time series data for various categories based on the collected information (data).

또한, 본 발명의 다양한 실시 예에 따르면, 발생되는 복수의 이슈들에 대하여 이슈의 검출 시점의 영향 정도에 기반하여 중요 이슈를 결정함으로써, 실시간 또는 과거 발생된 이슈의 중요 여부를 효과적으로 판단할 수 있다.In addition, according to various embodiments of the present invention, it is possible to effectively determine the importance of an issue generated in real time or in the past by determining an important issue based on the degree of influence of the issue detection time on a plurality of issues to be generated .

도 1은 본 발명의 일 실시 예에 따른 이슈 검출방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 트랜드 검출방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 이상점 추출 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 과거 이슈발생 시점과 시간차에 대한 가중치를 나타내는 그래프이다.
도 5는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 입력된 데이터에 기반하여 생성되는 시계열 데이터 및 시계열 데이터를 구성하는 속성 데이터를 그래프로 나타낸 도면이다.
도 6은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터 및 시계열 데이터에 기반하여 처리된 이동평균 데이터를 그래프로 나타낸 도면이다.
도 7은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터에 기반하여 처리된 표본화 데이터를 그래프로 나타낸 도면이다.
도 8은 본 발명의 일 실시 예에 따른 이슈 검출장치의 구성 요소를 도시한 도면이다.
1 is a flowchart illustrating an issue detection method according to an embodiment of the present invention.
2 is a flowchart illustrating a trend detection method in the issue detection method according to an embodiment of the present invention.
3 is a flowchart illustrating an abnormal point extraction method in an issue detection method according to an embodiment of the present invention.
FIG. 4 is a graph illustrating weights of past issue occurrence times and time differences in the issue detection method according to an embodiment of the present invention.
5 is a graph showing attribute data constituting time series data and time series data generated based on data input in the issue detection method according to an embodiment of the present invention.
FIG. 6 is a graph illustrating moving average data processed based on time series data and time series data in the issue detection method according to an embodiment of the present invention.
7 is a graph illustrating sampled data processed based on time series data in the issue detection method according to an embodiment of the present invention.
FIG. 8 is a diagram illustrating the components of an issue detection apparatus according to an embodiment of the present invention.

이하, 첨부한 도면을 참고로 하여 본 발명의 다양한 실시 예를 상세히 설명한다, 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략할 수 있다. 또한, 명세서 전체를 통하여 동일 또는 유사한 구성 요소에 대해서는 동일한 참조 부호를 사용할 수 있다.Hereinafter, various embodiments of the present invention will be described in detail with reference to the accompanying drawings. In order to clearly illustrate the present invention, parts not related to the description may be omitted. In addition, the same reference numerals can be used for the same or similar components throughout the specification.

본 발명의 다양한 실시 예에서, '또는', '적어도 하나' 등의 표현은 함께 나열된 단어들 중 하나를 나타내거나, 또는 둘 이상의 조합을 나타낼 수 있다. In various embodiments of the present invention, expressions such as 'or', 'at least one', etc. may denote one of the words listed together, or may represent a combination of two or more.

본 발명의 다양한 실시 예에서 사용되는 용어들은 특정 일 실시 예를 설명하기 위한 것으로, 본 발명을 한정하는 것으로 해석되어서는 안되며, 예를 들어, 단수의 표현은 문맥상 명백하게 다른 것으로 명시되지 않는 한 복수의 의미를 포함할 수 있을 것이다.The terms used in various embodiments of the present invention are intended to illustrate a specific embodiment and are not to be construed as limiting the invention, for example, the singular forms "a," "an, May include the meaning of.

이하, 본 발명의 다양한 실시 예에 따르면, 트랜드(또는, 추세, trend) 분석에 기반하여 발생되는 다양한 이슈(issue) 중에서 중요 이슈(hot issue)를 검출하는 방법(이하, 이슈 검출방법) 및 그 장치를 설명한다. 이슈 검출방법은 적어도 하나의 전자장치를 통해서 처리될 수 있다. 일 실시 예에 따르면, 이슈 검출방법을 처리하는 전자장치(이하, 이슈 검출장치)는 입력되는 데이터로부터 시계열 데이터(또는 원시 시계열 데이터)를 생성하고, 시계열 데이터를 통해서 검출되는 트랜드에 기반하여 이슈를 결정할 수 있다.Hereinafter, according to various embodiments of the present invention, a method for detecting a hot issue among various issues generated based on trend (or trend) analysis (hereinafter referred to as an issue detection method) Device. The issue detection method can be processed through at least one electronic device. According to an embodiment, an electronic device (hereinafter, an issue detection device) that processes an issue detection method generates time series data (or raw time series data) from input data and generates an issue based on trends detected through time series data You can decide.

도 1은 본 발명의 일 실시 예에 따른 이슈 검출방법을 설명하기 위한 흐름도이다.1 is a flowchart illustrating an issue detection method according to an embodiment of the present invention.

도 1을 참조하면, 101 동작에서 이슈 검출장치는 데이터 입력을 확인한다. 여기에서, 이슈 검출장치에 입력되는 데이터는 온라인을 통해서 노출(또는 출현)되는 키워드, 기업의 매출 정보와 같이 둘 이상의 카테고리에 대한 정보를 포함할 수 있다. 또한, 입력되는 데이터는 상술한 바와 같이 키워드 및 기업의 매출 정보의 두 카테고리에 한정하지 않고, 업종 관련 뉴스, 날씨, 스포츠, 검색어, 공휴일, 기념일, 시청률, 경제 지표, 통계 데이터, SNS, 웹사이트의 게시글, 댓글과 같이 다양한 범위에서 둘 이상의 카테고리에 대한 정보가 데이터로 입력될 수 있다.Referring to FIG. 1, in operation 101, the issue detection apparatus confirms data input. Here, the data input to the issue detection apparatus may include information on two or more categories such as a keyword exposed through (or appearing on) online, and sales information of a company. As described above, the input data is not limited to the two categories of keyword and sales information of the company, but may include news related to industry, weather, sports, search word, holiday, anniversary, audience rating, Information about two or more categories can be inputted as data in various ranges such as a post,

이슈 검출장치에 입력되는 데이터는, 실시간으로 입력될 수 있고, 또는 지정된 주기에 따라서 입력될 수 있다. 여기서, 이슈 검출장치는 데이터 입력이 없는 경우, 데이터 입력의 대기 상태를 유지할 수 있다.The data input to the issue detection apparatus can be input in real time or can be input in accordance with a specified period. Here, if the issue detection apparatus has no data input, it can maintain the standby state of data input.

103 동작에서 이슈 검출장치는 시계열 데이터를 생성한다. 이슈 검출장치는 입력되는 데이터를 카테고리에 따라서 분류하고 시계열 데이터를 생성할 수 있다. 일 실시 예에 따르면, 이슈 검출장치는 키워드와 매출 정보가 입력되는 경우 키워드 카테고리와 매출 카테고리를 구분하여 시계열 데이터를 생성할 수 있다. 또한, 이슈 검출장치는 키워드에 대한 시계열 데이터를 생성함에 있어서, 키워드 각각에 대한 시계열 데이터를 생성할 수 있다. 또는, 이슈 검출장치는 둘 이상의 키워드를 그룹화하여 그룹 단위의 시계열 데이터를 생성할 수 있다. 여기서, 생성되는 시계열 데이터는, 시간 성분에 대응되는 각각의 카테고리와 관련된 값을 포함할 수 있다.In operation 103, the issue detection apparatus generates time series data. The issue detection apparatus can classify input data according to a category and generate time series data. According to an embodiment, when the keyword and the sales information are input, the issue detection apparatus can generate the time series data by separating the keyword category and the sales category. In addition, when generating the time series data for the keyword, the issue detection apparatus can generate time series data for each keyword. Alternatively, the issue detection apparatus may group two or more keywords to generate time series data in units of groups. Here, the generated time series data may include a value associated with each category corresponding to the time component.

105 동작에서 이슈 검출장치는 트랜드를 검출한다. 이슈 검출장치는 시계열 데이터에 기반하여 트랜드를 검출할 수 있다. 이때, 이슈 검출장치는 시계열 데이터에 포함된 적어도 하나의 성분(또는 성분 데이터)에 기반하여 트랜드를 검출할 수 있고, 또는 시계열 데이터의 표본화 데이터에 기반하여 트랜드를 검출할 수 있다.In operation 105, the issue detection apparatus detects a trend. The issue detection apparatus can detect the trend based on the time series data. At this time, the issue detection apparatus can detect the trend based on at least one component (or component data) included in the time series data, or can detect the trend based on the sampling data of the time series data.

이슈 검출장치는, 검출된 트랜드 중 이상 트랜드(또는 이슈), 예를 들면, 이삼점 또는 이상 증감점을 검출한다. 일 실시 예에 따르면, 이슈 검출장치는 시계열 데이터를 구성하는 다양한 성분들 중 지정된 적어도 하나의 성분에 대하여 이상점을 추출할 수 있다. 또한, 이슈 검출장치는 시계열 데이터에 기반하여 생성된 표본화 데이터에 대하여 이상 증감점을 추출할 수 있다. 여기서, 상술한 복수의 이슈 감지모델, 예를 들면, 이상점을 추출하는 동작 또는 이상 증감점을 추출하는 동작은 입력된 데이터가 포함된 복수의 카테고리 중 적어도 하나의 카테고리에 대하여 수행될 수 있다.The issue detecting apparatus detects an abnormal trend (or issue) among the detected trends, for example, a second or third point or an abnormal increase / decrease point. According to one embodiment, the issue detection apparatus can extract an anomaly point for at least one component among various components constituting time series data. In addition, the issue detection apparatus can extract an anomaly point for the sampled data generated based on the time series data. Here, the above-described plurality of issue detection models, for example, an operation of extracting an anomaly point or an operation of extracting an anomaly point can be performed for at least one of a plurality of categories including input data.

이하, 도 2 및 도 3을 참조하여, 이슈 검출장치가 시계열 데이터에 기반하여 이상점 또는 이상 증감점을 추출하는 다양한 실시 예를 설명할 수 있다.Hereinafter, with reference to FIG. 2 and FIG. 3, various embodiments in which the issue detection apparatus extracts an anomaly point or anomalous enhancement point based on time series data can be described.

도 2는 본 발명의 일 실시 예에 따른 트랜드 검출방법을 설명하기 위한 흐름도이다. 여기서, 트랜드 검출은, 상술한 바와 같이, 적어도 하나의 카테고리에 대한 시계열 데이터의 성분 데이터를 이용하여 이상점을 추출하는 동작 또는 시계열 데이터의 표본값을 이용하여 이상 증감향을 추출하는 동작을 포함할 수 있다. 이하, 도 2의 다양한 실시 예는, 도 1에서 설명한 트랜드 검출방법(105)의 일부 동작으로 수행될 수 있다. 이때, 201 동작은, 도 1의 103 동작 이후에 수행될 수 있다.2 is a flowchart for explaining a trend detection method according to an embodiment of the present invention. As described above, the trend detection includes an operation of extracting an anomaly point using component data of time series data for at least one category or an operation of extracting an anomaly increase / decrease direction using a sample value of time series data . Hereinafter, the various embodiments of FIG. 2 may be performed with some operations of the trend detection method 105 described in FIG. At this time, the operation 201 may be performed after operation 103 of FIG.

201 동작에서 이슈 검출장치는 시계열 분해 여부를 결정한다. 예를 들면, 이슈 검출장치는, 시계열 데이터의 이상점을 추출하는 동작을 수행하는 경우 203 동작을 통해서 시계열 분해를 수행하고, 시계열 데이터의 이상 증감점을 추출하는 동작을 수행하는 경우 207 동작을 통해서 이동평균을 산출하는 동작을 수행할 수 있다.In operation 201, the issue detection apparatus determines whether to decompose the time series. For example, if the issue detection apparatus performs an operation of extracting an anomaly point of time series data and performs an operation of extracting an anomaly point of time series data, operation 207 An operation of calculating a moving average can be performed.

203 동작에서 이슈 검출장치는 시계열 분해를 수행한다. 예를 들면, 이슈 검출장치는 생성된 시계열 데이터를 구성하는 값들에 기반하여 적어도 하나의 성분을 검출할 수 있다. 여기서, 시계열 데이터에 포함되는 성분들은, 예를 들면, 주기(또는 계절, seasonal)성분, 트랜드성분 및 임의성분 중 적어도 하나의 성분을 포함하는 성분 데이터로 제공될 수 있다.In operation 203, the issue detection apparatus performs time series decomposition. For example, the issue detection apparatus can detect at least one component based on the values constituting the generated time series data. Here, the components included in the time series data may be provided as constituent data including at least one of, for example, a period (or seasonal) component, a trend component, and an arbitrary component.

주기성분 데이터는 주기성분 및 시간성분을 포함할 수 있다. 마찬가지로, 트랜드성분 데이터는 트랜드성분 및 시간성분을 포함할 수 있고, 임의성분 데이터는, 임의성분 및 시간성분을 포함할 수 있다. 즉, 시계열 데이터를 구성하는 각각의 성분들은, 도 5에 도시된 바와 같이 시계열 데이터(500)와 마찬가지로, 시간 성분에 대한 값으로 구성되며, 시간의 흐름에 따른 그래프, 표, 테이블 등으로 표시될 수 있다.The period component data may include a period component and a time component. Similarly, the trend component data may include a trend component and a time component, and the arbitrary component data may include an arbitrary component and a time component. That is, as shown in FIG. 5, each of the components constituting the time-series data is composed of values for time components like the time-series data 500, and is displayed as a graph, a table, or a table according to the passage of time .

여기서, 주기 데이터는, 확장과 수축 기간이 지정된 시간 범위의 1단위 주기를 가지고 상호 반복적인 변동하는 값들을 포함하여 구성될 수 있다. 또한, 트랜드 데이터는 기울기를 가지고 상승 또는 하강하는 경향을 나타내는 변동에 대한 값들을 포함하여 구성될 수 있다. 또한, 임의 데이터는 일시적인 이슈, 과거에 없다가 갑자기 발생되는 이슈, 그리고 이슈에 관련된 시점과 관련된 값들을 포함하여 구성될 수 있다.Here, the period data may be configured to include mutually repeated varying values with one unit period of the time range in which the expansion and contraction periods are specified. In addition, the trend data can be configured to include values for fluctuations indicating a tendency to rise or fall with a slope. In addition, the random data may be configured to include temporal issues, issues that have occurred suddenly in the past, and values related to the time related to the issue.

205 동작에서 이슈 검출장치는 성분 데이터 중 적어도 일부에 대하여 이상점을 추출한다. 예를 들면, 이슈 검출장치는 성분 데이터에 대하여 시간성분에 대응되는 값들이 지정된 범위 내에 위치하는지 여부를 확인할 수 있다. 예를 들면, 이슈 검출장치는, 임의성분 데이터에 포함된 값들 중 지정된 수치범위를 벗어난 값이 검출되는 시점을 임의성분 데이터의 이상점으로 결정할 수 있다.In operation 205, the issue detection device extracts an anomaly point for at least a portion of the component data. For example, the issue detection apparatus can confirm whether or not values corresponding to time components for component data are located within a specified range. For example, the issue detection apparatus can determine a point at which a value out of a specified numerical value range among values included in arbitrary component data is detected as an abnormal point of arbitrary component data.

마찬가지로, 이슈 검출장치는, 주기성분 데이터 또는 트랜드성분 데이터에 포함된 값들 중 지정된 수치범위를 벗어난 값이나 지정된 수치 이상 또는 이하의 값이 검출되는 시점을 해당 성분 데이터의 이상점으로 결정할 수 있다. 이때, 각각의 성분 데이터에서 이상점은 둘 이상 포함될 수도 있다. 여기서, 시점은 성분 값이 지정된 수치범위를 벗어나는 순간(또는 시각)에 한정하지 않고, 성분 값이 수치범위를 벗어난 상태 또는 그 시간범위를 포함할 수 있다.Likewise, the issue detection apparatus can determine a value out of the specified numerical range out of the values included in the period component data or the trend component data, or a point at which a value greater than or equal to the specified value is detected as the abnormal point of the component data. At this time, two or more abnormal points may be included in each component data. Here, the viewpoint is not limited to the moment (or time) at which the component value deviates from the specified numerical value range, and the component value may include a state outside the numerical value range or a time range thereof.

이슈 검출장치는, 205 동작을 수행하면, 도 2의 실시 예를 종료할 수 있고, 또는 도 1의 107 동작을 수행할 수 있다.The issue detection apparatus can terminate the embodiment of FIG. 2 or perform the operation 107 of FIG. 1 when the operation 205 is performed.

한편, 207 동작에서, 이슈 검출장치는 시계열 데이터의 이동평균을 산출한다. 이동평균을 산출하는 동작은, 시계열 데이터를 이용하여 이상 증감점을 추출하기 위한 전처리 동작으로 수행될 수 있다.On the other hand, in operation 207, the issue detection apparatus calculates a moving average of time series data. The operation of calculating the moving average can be performed by a preprocessing operation for extracting an anomaly point using time series data.

입력되는 다양한 카테고리의 값들에 기반하여 생성되는 시계열 데이터는 급격한 변동을 포함하여 구성될 수 있다. 이슈 검출장치는 이러한 비선형 데이터의 처리 효과를 향상시키기 위하여 그래프로 표시되는 시계열 데이터를 지정된 시간 간격으로 이동평균을 산출할 수 있다.The time series data generated based on the input values of the various categories can be configured to include abrupt variations. In order to improve the effect of processing nonlinear data, the issue detection apparatus can calculate a moving average at a designated time interval in time series data displayed in a graph.

209 동작에서, 이슈 검출장치는, 시계열 데이터의 이동평균 결과에 기반하여 해당 카테고리에 대한 증감폭을 결정한다. 이슈 검출장치는 시계열 데이터를 지정된 시간 간격으로 이동평균을 이용하여 이상 증감점을 결정하기 위하여 산출된 이동평균 데이터의 증감폭을 결정할 수 있다. In operation 209, the issue detection apparatus determines the increase / decrease width for the category based on the moving average result of the time series data. The issue detection apparatus can determine the increase / decrease width of the calculated moving average data so as to determine the anomalous increase / decrease point by using the moving average at the designated time intervals in the time series data.

일 실시 예에 따르면, 이슈 검출장치는 시계열 데이터의 이동평균 결과를 이용하여 시계열 데이터의 표본화를 수행할 수 있다. 이슈 검출장치는, 시계열 데이터의 이동평균 결과에 미분(예: 1차 미분)을 수행할 수 있다. 이때, 시계열 데이터는 비선형 데이터일 수 있고, 따라서, 이슈 검출장치는, 수치해석적으로 단위 시간당 증감량을 산출할 수 있다. 예를 들면, 표본화 데이터는 시간축에 대하여 일정한 폭(예: 단위 시간)을 가지며, 각각의 단위 시간에 대응되는 값을 포함하여 구성될 수 있다.According to one embodiment, the issue detection apparatus can perform sampling of time series data using moving average results of time series data. The issue detection apparatus can perform a derivative (e.g., a first derivative) on the moving average result of the time series data. At this time, the time series data may be nonlinear data, and therefore, the issue detection apparatus can numerically calculate the increase / decrease amount per unit time. For example, the sampled data may have a constant width (e.g., unit time) with respect to the time axis, and may include a value corresponding to each unit time.

211 동작에서, 이슈 검출장치는 산출된 표본화 데이터에 기반하여 시계열 데이터의 이상 증감점을 추출할 수 있다. 예를 들면, 이슈 검출장치는 표본화 데이터의 단위 시간별로 구분된 시간 성분에 대응되는 값들이 지정된 범위 내에 위치하는지 여부를 확인할 수 있다. 예를 들면, 이슈 검출장치는, 표본화 데이터에 포함된 값들 중 지정된 수치범위를 벗어난 값이나 지정된 수치 이상 또는 이하의 값을 검출하는 경우, 해당 시점을 이상 즘감점으로 결정할 수 있다. 더하여, 이슈 검출장치는, 연속되는 단위 시간당 증감량의 차가 지정된 수치 이상인 것을 확인하는 경우, 해당 시점을 이상 증감점으로 결정할 수 있다. In operation 211, the issue detection apparatus can extract an anomaly point of time-series data based on the calculated sampling data. For example, the issue detection apparatus can confirm whether values corresponding to time components separated by unit time of sampling data are located within a specified range. For example, if the issue detection apparatus detects a value out of a specified numerical range out of the values included in the sampled data, or a value greater than or equal to a specified numerical value, the issue detection apparatus can determine the point of time as an idealism point. In addition, when the issue detection apparatus confirms that the difference in the increase / decrease amount per unit time in continuous time is equal to or larger than the specified value, the issue detection apparatus can determine the point of time as an anomaly increase / decrease point.

일 실시 예에 따르면, 이슈 검출장치는, 표본화 데이터의 단위 시간에 대응되는 값들을 비교하여 이상 증감량을 결정할 수 있다. 예를 들면, 이슈 검출장치는 단위 시간에 대하여 1/4 분위수와 3/4 분위수에 해당하는 구간거리를 기준으로 구간거리 값의 차이가 지정된 수치(또는 배수, 예: 1.5배)보다 큰 경우, 해당 구간을 이상 증감점으로 결정할 수 있다. 이때, 표본화 데이터에 기반하여 검출되는 이상 증감점은 둘 이상 포함될 수 도 있다. 다양한 실시 예에 따르면, 이슈 검출장치는 단위 시간에 대하여 0 내지 1/4 분위수 및/또는 3/4 내지 1분위수에 해당하는 구간 거리를 기준으로 구간거리 값의 차이가 지정된 수치보다 큰 경우 해당 구간을 이상 증감정으로 결정할 수 있다.According to one embodiment, the issue detection apparatus can determine the abnormal increase / decrease amount by comparing values corresponding to the unit time of the sampled data. For example, if the issue detection apparatus determines that the difference of the section distance values is larger than the designated numerical value (or a multiple, for example, 1.5 times) based on the section distance corresponding to the quarter quartile and the quarter quartile, The corresponding section can be determined as an abnormal increase / decrease point. At this time, two or more anomaly points detected based on the sampled data may be included. According to various embodiments, when the difference of the section distance value is larger than a specified value based on the section distance corresponding to 0 to 1/4 quartile and / or 3/4 to 1 quartile per unit time, Can be determined as an abnormal symptom.

여기서, 1/4 분위수 또는 3/4 분위수는 값의 차이에 기반하여 결정된는 이상 증감점을 설명하기 위한 시간적 위치에 대한 일 실시예로, 시간적 위치는 다양한 방법으로 결정될 수 있음은 자명하다. 또한, 상술한 바에 따르면, 기준이 되는 구간(또는 구간거리)는 4분위를 기준으로 설명하고 있지만, 이에 한정하지 않고, 100분위, 주기, 또는 수치와 같이 다양한 실시 예가 가능하다.Herein, it is obvious that the temporal position can be determined by various methods, as an example of a temporal position for describing an anomalous increase / decrease point determined based on a difference of values of a 1/4 quartile or a 3/4 quartile. In addition, according to the above description, the reference interval (or section distance) is described based on the quartile, but the present invention is not limited thereto, and various embodiments such as the 100th quartile, period, or numerical value are possible.

더하여, 이슈 검출장치는, 211 동작에서 설명한 이상 증감점을 결정하는 방법에 한정하지 않고, 이상 증감점을 결정하는 다양한 방법들 중 적어도 일부를 적용하여 표본화 데이터의 이상 증감점을 결정할 수 있음은 자명하다.In addition, the issue detection apparatus is not limited to the method for determining the anomalous increase / decrease point described in operation 211, and it is possible to determine the anomalous increase / decrease point of the sampled data by applying at least some of various methods for determining the anomalous increase / decrease point Do.

이슈 검출장치는, 211 동작을 수행하면, 도 2의 실시 예를 종료할 수 있고, 또는 도 1의 107 동작을 수행할 수 있다.The issue detection apparatus may terminate the embodiment of FIG. 2 or perform the operation 107 of FIG. 1 when the operation 211 is performed.

도 3은 본 발명의 일 실시 예에 따른 이상점 추출 방법을 설명하기 위한 흐름도이다. 이하, 도 3의 다양한 실시 예는, 도 2에서 설명한 이상점 추출(205)의 일부 동작으로 수행될 수 있다. 이때, 301 동작은, 도 2의 203 동작 이후에 수행될 수 있다.3 is a flowchart illustrating an abnormal point extraction method according to an embodiment of the present invention. Hereinafter, the various embodiments of FIG. 3 may be performed with some operations of the abnormal point extraction 205 described in FIG. At this time, the operation 301 may be performed after the operation 203 of FIG.

301 동작에서 이슈 검출장치는 회귀분석을 수행할 수 있다. 본 발명의 일 실시 예에 따른 이슈 검출방법은, 입력되는 데이터의 급격한 변화, 생성, 소멸에 따른 특징을 검출하고, 그 특징에 기반하여 이슈를 검출하는 것일 수 있다. 이때, 데이터에 기반하는 특징들은 다양한 성분들에 표현될 수 있지만, 임의성분 데이터는 입력되는 데이터 중 불규칙적으로 발생되는 정보를 포함할 수 있다. 따라서, 이슈 검출장치는 시계열 데이터에 포함된 적어도 하나의 성분, 예를 들면, 임의성분에 대하여 회귀분석을 수행하여 이상점을 추출하기 위한 비교군(또는 비교대상군)을 결정할 수 있다.In operation 301, the issue detection apparatus can perform a regression analysis. The issue detection method according to an embodiment of the present invention may detect a feature of a sudden change, generation, or extinction of input data, and detect an issue based on the feature. At this time, the data-based features may be expressed in various components, but the arbitrary component data may include irregularly generated information among the input data. Therefore, the issue detection apparatus can perform a regression analysis on at least one component, for example, an arbitrary component included in the time-series data to determine a comparison group (or a comparison target group) for extracting an anomaly point.

이슈 검출장치는, 회귀분석 결과로부터 트랜드성분을 검출할 수 있다. 여기서, 원시 시계열 데이터의 성분 데이터를 원시 성분 데이터로 정의하고, 회귀분석 결과에 기반하는 성분 데이터를 최후 성분 데이터로 정의할 수 있다.The issue detecting apparatus can detect the trend component from the regression analysis result. Here, the component data of the raw time series data is defined as the raw component data, and the component data based on the regression analysis result can be defined as the last component data.

회귀분석 결과를 이용하여 이상점을 추출하는 일 실시 예에 따르면, 최후 트랜드성분 데이터는 임의성분에 대한 트랜드를 포함하고 있음으로, 원시 임의성분 데이터와 최후 트랜드성분 데이터를 비교함으로써 원시 시계열 데이터의 특징을 검출할 수 있다According to an embodiment for extracting an anomaly point by using a result of regression analysis, the last trend component data includes a trend for an arbitrary component. By comparing the raw arbitrary component data with the last trend component data, Can be detected

일 실시 예에 따르면, 이슈 검출장치는 원시 임의성분 데이터와 최후 트랜드성분 데이터의 차이점을 결정할 수 있다. 여기서, “차이점”은 비교 대상의 동일 또는 유사한 값들을 제외한 나머지(residual)의 의미를 포함할 수 있다.According to one embodiment, the issue detection apparatus can determine the difference between the raw arbitrary component data and the latest trend component data. Here, the " difference " may include the meaning of the residual excluding the same or similar values of the comparison object.

303 동작에서, 이슈 검출장치는, 비교결과(예: 차이점)에 기반하여 이상점을 결정할 수 있다. 일 실시 예에 따르면, 이상점은 최후 트랜드성분 데이터와 원시 임의성분 데이터의 차이점에 대하여 지정된 시간적 기준을 기반으로 결정될 수 있다. 예를 들면, 이슈 검출장치는 1/4 분위수와 3/4 분위수의 구간거리(d)를 기준으로 구간거리(d) 값의 지정된 배수(예: 1.5배)보다 큰 값 또는 해당 시점을 이상점으로 결정할 수 있다.In operation 303, the issue detection device may determine an anomaly point based on a comparison result (e.g., a difference). According to one embodiment, the anomalous point may be determined based on a temporal reference specified for the difference between the last trend component data and the raw arbitrary component data. For example, the issue detection apparatus may detect a value larger than a specified multiple (for example, 1.5 times) of the value of the interval distance (d) based on the interval distance (d) between the quarter quartile and the quarter quartile, .

더하여, 이슈 검출장치는, 303 동작에서 설명한 이상점을 결정하는 방법에 한정하지 않고, 이상점을 결정하는 다양한 방법들, 그리고 상술한 바와 같이 이상 증감점을 결정하는 다양한 방법들 중 적어도 일부를 적용하여 차이에 기반하는 이상 증감점을 결정할 수 있음은 자명하다.In addition, the issue detection apparatus is not limited to the method for determining the abnormal point described in the operation 303, but may be applied to various methods for determining the abnormal point, and at least some of the various methods for determining the abnormal increase / decrease point as described above It is obvious that an anomaly point based on the difference can be determined.

이슈 검출장치는, 303 동작을 수행하면, 도 3의 실시 예를 종료할 수 있고, 또는 도 1의 107 동작을 수행할 수 있다.The issue detection apparatus may terminate the embodiment of FIG. 3 or perform the operation 107 of FIG. 1 when the operation 303 is performed.

다시 도 1로 돌아가서, 이슈 검출장치는 발생되는 이슈들 중 중요이슈(hot issue)를 결정할 수 있다.Returning back to FIG. 1, the issue detection apparatus can determine a hot issue among the issues to be generated.

107 동작에서 이슈 검출장치는 시계열 데이터에 기반하여 검출된 이상점 및 이상 증감점에 기반하여 이슈를 결정한다. 이슈는, 이상점 및 이상 증감점에 기반하여 결정되는 시점 및 결정된 시점과 관련된 키워드 중 적어도 일부를 포함할 수 있다. 이슈 검출장치는, 이상점 및 이상 증감점에 기반하여 중요 이슈를 결정함에 있어서, 적어도 하나의 이슈 판정모델을 적용할 수 있다.In operation 107, the issue detection apparatus determines an issue based on the detected anomaly point and the anomaly point based on the time series data. The issue may include at least a part of the keyword related to the point of time determined based on the anomaly point and the anomalous point of increase and the determined point in time. The issue detection apparatus may apply at least one issue judgment model in determining important issues based on the anomaly points and the anomaly points.

여기서, 이상점 및 이상 증감점은 이슈의 발생 시점으로 정의될 수 있다, 또한, 이슈 검출장치는 이슈를 결정함에 있어서, 시간 요소를 중요하게 고려하여 이슈를 결정할 수 있다. 예를 들면, 이슈 검출장치는, 이슈가 발생된 시점으로부터 지정된 시간 범위 내에 이상점 및 이상 증감점 중 적어도 일부가 중복되는 경우, 이슈가 발생된 시점으로부터 이상점 및 이상 증감점의 중복이 확인되는 시간 거리를 참조하여 해당 이슈를 중요 이슈로 결정할 확률을 처리할 수 있다.Here, the anomaly point and the anomalous increase / decrease point can be defined as the occurrence time of the issue. Further, in determining the issue, the issue detection apparatus can determine the issue by taking time elements into consideration. For example, when at least a part of the anomaly point and the anomalous increase / decrease point overlap within a specified time range from the point of occurrence of the issue, the issue detection apparatus confirms the duplication of the anomaly point and the anomalous increase / decrease point from the point of occurrence of the issue The probability of deciding the issue as an important issue can be handled by referring to the time distance.

본 발명의 일 실시 예에 따르면, 중요 이슈를 결정하는 종합판정모델을 아래 수학식(1)로 제공할 수 있다.According to an embodiment of the present invention, a comprehensive judgment model for determining important issues can be provided by the following equation (1).

Figure pat00001
(1)
Figure pat00001
(One)

여기서,

Figure pat00002
는 검출된 이슈에 대한 종합판정값이다.
Figure pat00003
는 데이터의 카테고리로 입력되는 데이에 대하여 구분된 카테고리(
Figure pat00004
)에 대하여
Figure pat00005
=1, 2, 3…… 과 같이 설정될 수 있다.
Figure pat00006
는 현재 시점의 데이터 카테고리(
Figure pat00007
),
Figure pat00008
는 데이터의 카테고리에 따른 가중치(또는 가중치값)이다.
Figure pat00009
는 이슈가 감지된 현재 시점의 표본화 데이터 중 이슈감지 값이다.
Figure pat00010
는 과거
Figure pat00011
시점의 데이터 카테고리(
Figure pat00012
).
Figure pat00013
는 이슈가 감지된 과거
Figure pat00014
시점의 데이터 종류에 따른 가중치이다.
Figure pat00015
는 이슈가 감지된 과거
Figure pat00016
시점의 표본화 데이터 중 이슈감지 값이다. 또한,
Figure pat00017
는 현재시점과 과거
Figure pat00018
시점의 데이터 이질성에 대한 가중치로 수학식(2)로 제공될 수 있다.here,
Figure pat00002
Is a comprehensive determination value for the detected issue.
Figure pat00003
Is divided into categories (< RTI ID = 0.0 >
Figure pat00004
)about
Figure pat00005
= 1, 2, 3 ... ... As shown in FIG.
Figure pat00006
Is the data category of the current point (
Figure pat00007
),
Figure pat00008
Is a weight (or a weight value) according to a category of data.
Figure pat00009
Is the issue detection value among the sampling data at the present time when the issue is detected.
Figure pat00010
Past
Figure pat00011
Data category at point (
Figure pat00012
).
Figure pat00013
Is the past
Figure pat00014
It is the weight according to the data type of the viewpoint.
Figure pat00015
Is the past
Figure pat00016
It is the issue detection value among the sampling data of the viewpoint. Also,
Figure pat00017
The present time and past
Figure pat00018
(2) as a weight for the data heterogeneity of the viewpoint.

Figure pat00019
(2)
Figure pat00019
(2)

또한,

Figure pat00020
와 관련하여 과거 이슈 발생 시점과의 시간차에 대한 가중치 함수를 수학식(3)로 제공할 수 있다.Also,
Figure pat00020
(3), a weight function for the time difference with respect to the time when the past issue occurs.

Figure pat00021
(3)
Figure pat00021
(3)

여기서,

Figure pat00022
Figure pat00023
이고,
Figure pat00024
는 현재 시점과 과거
Figure pat00025
시점의 시간차이고, 시간차는 일수로 제공될 수 있다.
Figure pat00026
는 강조지수로
Figure pat00027
시점에서의 최대 가중치이다.
Figure pat00028
는 최적 시간차로 중요 이슈로 결정하기 위한 최적의 시간차이다. 이때, 최적의 시간차는 기 설정된 상태이며, 특정 시점 또는 지정된 시간범위로 제공될 수 있다.
Figure pat00029
는 유효 이슈 시간범위이다.
Figure pat00030
는 현재시점의 이슈감지일로, 이슈를 감지한 현재 시점이며, 날짜 또는 시각을 포함하여 제공될 수 있다.
Figure pat00031
는 과거
Figure pat00032
시점의 이슈감지일이다.here,
Figure pat00022
The
Figure pat00023
ego,
Figure pat00024
The present time and past
Figure pat00025
Time difference, and the time difference can be provided in days.
Figure pat00026
As an emphasis index
Figure pat00027
It is the maximum weight at the time.
Figure pat00028
Is an optimal time difference for determining an important issue as the optimal time difference. At this time, the optimal time difference is preset and can be provided at a specific time point or a specified time range.
Figure pat00029
Is the effective issue time range.
Figure pat00030
Is a current issue detection date, a current time when an issue is detected, and may be provided including a date or a time.
Figure pat00031
Past
Figure pat00032
This is the issue detection date.

이슈 검출장치는, 수학식(1) 내지 수학식(3)에 기반하여 종합판정값(c)을 결정할 수 있고, 결정된 종합판정값(c)이 지정된 수치 이상인 것을 확인하는 경우 해당 이슈를 중요이슈로 결정할 수 있다.The issue detection apparatus can determine the comprehensive determination value c based on the equations (1) to (3), and when it is confirmed that the determined overall determination value c is equal to or larger than the specified value, .

이슈 검출장치는, 결정된 중요 이슈에 대하여 키워드를 검출할 수 있다. 예를 들면, 이슈 검출장치는, 중요 이슈에 대응되는 키워드 카테고리에 포함된 복수의 키워드 중 노출 빈도가 높게 나타난 키워드 중 적어도 일부를 중요 이슈의 키워드로 결정할 수 있다. 이슈 검출장치는, 결정된 중요 이슈 또는 중요 이슈의 키워드를 출력할 수 있다.The issue detecting apparatus can detect the keyword with respect to the determined important issue. For example, the issue detection apparatus can determine at least a part of the keywords having a high exposure frequency among the plurality of keywords included in the keyword category corresponding to the important issue as the keyword of the important issue. The issue detection apparatus can output the keyword of the determined important issue or important issue.

도 4는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 과거 이슈발생 시점과 시간차에 대한 가중치를 나타내는 그래프(400)이다.FIG. 4 is a graph 400 showing weights of past issue occurrence times and time differences in the issue detection method according to an embodiment of the present invention.

도 4 및 상술한 수학식(3)을 참조하면,

Figure pat00033
는 현재 시점에서
Figure pat00034
만큼의 과거시점(
Figure pat00035
Figure pat00036
의 가중치를 곱연산 처리하는 것으로 설명할 수 있다. 이때, 가중치의 크기는 도 4에 도시된 바와 같이 시간차가 커질수록 감소하고,
Figure pat00037
범위를 벗어나는 시점부터는 영향도가 사라지는 것으로 설명할 수 있다.Referring to FIG. 4 and the above-described equation (3)
Figure pat00033
At this point
Figure pat00034
Of past time points (
Figure pat00035
on
Figure pat00036
Can be explained by performing a multiplication operation process. At this time, the magnitude of the weight decreases as the time difference increases as shown in FIG. 4,
Figure pat00037
It can be explained that the influence disappears from the point outside the range.

즉, 이슈 검출장치는 수학식(1)에 기반하여 종합판정값(c)을 산출함으로써 복수의 이종 카테고리에 대하여 과거 이슈 발생시점을 고려한 현재의 이슈 감지값을 결정할 수 있다. 예를 들어, 현재 시점에서 특정 이슈가 감지(

Figure pat00038
)되고 과거
Figure pat00039
시점의 이슈(
Figure pat00040
)가 있다면, 수학식(3)에 의하여 가중치의 최대값(
Figure pat00041
)을 결정하여 종합판정값(c)이 높게 산출될 수 있다. 즉, 이슈의 재현이 특정 시간 간격을 갖는 경우 현재의 종합판정의 강도가 강화되는 것이다. 반면, 수학식(3)에 의한 가중치가 낮게 결정되더라도 이슈가 반복적으로 검출되는 경우 수학식(1)은 종합판정값(c)을 증가시키게 된다.That is, the issue detection apparatus can determine the current issue detection value considering the past issue occurrence time for a plurality of disparate categories by calculating the comprehensive judgment value (c) based on Equation (1). For example, if a specific issue is detected at the current point
Figure pat00038
) And past
Figure pat00039
Issue at the time (
Figure pat00040
), Then the maximum value of the weight (
Figure pat00041
), And the overall judgment value c can be calculated to be high. That is, when the issue reproduction has a specific time interval, the strength of the current comprehensive judgment is strengthened. On the other hand, when the issue is repeatedly detected even if the weight according to the equation (3) is determined to be low, the equation (1) increases the total judgment value c.

또한, 수학식(3)에서 시간차(

Figure pat00042
) 이후 유효 이슈 시간범위(
Figure pat00043
)에 도달하는 과정 상에서는 종합판정값(c)이 감소하며 결국 유효 이슈 시간범위(
Figure pat00044
)를 벗어나는 경우 해당 특정 이슈는 중요 이슈에 대한 영향력이 제거될 수 있다.In Equation (3), the time difference (
Figure pat00042
) Effective issue time range after (
Figure pat00043
), The total judgment value (c) decreases and eventually the effective issue time range
Figure pat00044
), The particular issue may have an impact on the critical issue.

또한, 상술한 바와 같이, 이슈 검출장치는, 시간에 기반하여 중요 이슈를 결정함으로써, 동시에 이종 카테고리(예: d=1, d=2 …)를 처리하여 다양한 카테고리에 대하여 발생되는 이슈를 검출하고, 복수의 카테고리와 관련하여 중요 이슈를 결정할 수 있다. Furthermore, as described above, the issue detection apparatus detects an issue arising for various categories by simultaneously processing disparate categories (e.g., d = 1, d = 2 ...) by determining important issues based on time , You can determine important issues related to multiple categories.

도 5는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 입력된 데이터에 기반하여 생성되는 시계열 데이터 및 시계열 데이터를 구성하는 속성 데이터를 그래프로 나타낸 도면이다.5 is a graph showing attribute data constituting time series data and time series data generated based on data input in the issue detection method according to an embodiment of the present invention.

이슈 검출장치는, 시계열 데이터(500)에 포함되는 적어도 하나의 성분 데이터를 선택적으로 분리할 수 있다. 도 5에 도시된 바와 같이, 시계열 데이터(500)는, 시간의 흐름에 대하여 입력되는 다양한 카테고리의 정보가 정렬된 데이터로 설명될 수 있다. 시계열 데이터(500)는, 실시간으로 입력되는 데이터 또는 지정된 시간 범위에 대하여 적어도 하나의 시점에 대한 데이터를 수신하여 생성될 수 있다. The issue detection apparatus can selectively separate at least one component data included in the time series data 500. [ As shown in FIG. 5, the time series data 500 can be described by sorted data in which information of various categories inputted for the flow of time is sorted. The time series data 500 can be generated by receiving data input in real time or data for at least one time point for a specified time range.

여기서 시계열 데이터(500)의 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 값으로 제공될 수 있다. 여기서 시간축은, 날짜와 시각 정보를 포함할 수 있다. 또한, 세로축은, 둘 이상의 카테고리에 대한 정보를 종합적으로 표시할 수 있고, 또는 선택적으로 지정된 카테고리의 정보를 표시할 수 있다.Here, the horizontal axis of the time series data 500 may be provided as a time axis, and the vertical axis may be provided as a value for at least one category. Here, the time axis may include date and time information. Further, the vertical axis can collectively display information on two or more categories, or selectively display information of a specified category.

시계열 데이터(500)에 기반하여, 복수의 성분 데이터를 검출할 수 있다. 일 실시 예에 따르면, 도 5에 도시된 바와 같이, 시계열 데이터(500)는, 주기성분 데이터(510), 트랜드성분 데이터(530) 및 임의성분 데이터(550)를 포함할 수 있다. 시계열 데이터(500)로부터 분리된 성분 데이터(510, 530, 550)는, 시계열 데이터와 마찬가지로 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 값으로 제공될 수 있다.Based on the time series data 500, a plurality of component data can be detected. 5, the time-series data 500 may include periodic component data 510, trend component data 530, and optional component data 550. For example, The component data 510, 530, and 550 separated from the time series data 500 may be provided with a time axis for the horizontal axis and a value for at least one category for the vertical axis, as in the time series data.

도 6은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터 및 시계열 데이터에 기반하여 처리된 이동평균 데이터를 그래프로 나타낸 도면이다.FIG. 6 is a graph illustrating moving average data processed based on time series data and time series data in the issue detection method according to an embodiment of the present invention.

이슈 검출장치는, 시계열 데이터(610)의 이동평균을 산출하고, 시계열 데이터에 대응되는 이동평균 데이터(630)를 표시(예: 그래프(600))할 수 있다. 이때, 이슈 검출장치는, 이동평균 데이터에 기반하여 시계열 데이터에 포함된 카테고리 각각에 대한 수치의 변화 또는 변화의 흐름을 확인할 수 있다. 여기서, 이슈 검출장치를 통해서 산출되는 이동평균은, 단순 이동평균, 가중 이동평균, 기하 이동평균, 누적 이동평균 및 지수 이동평균 중 적어도 하나의 이동평균 산출이 적용될 수 있다.The issue detection apparatus can calculate the moving average of the time series data 610 and display the moving average data 630 corresponding to the time series data (for example, the graph 600). At this time, the issue detection apparatus can confirm the change or the flow of the numerical value for each category included in the time series data based on the moving average data. Here, at least one of a simple moving average, a weighted moving average, a geometric moving average, a cumulative moving average, and an exponent moving average may be applied to the moving average calculated through the issue detecting device.

이동평균 데이터 또한, 시계열 데이터와 마찬가지로, 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 이동평균 값으로 제공될 수 있다.Moving average data can also be provided as moving average values for at least one category, such as time series data, with the horizontal axis representing the time axis and the vertical axis representing the time axis data.

도 7은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터에 기반하여 처리된 표본화 데이터를 그래프로 나타낸 도면이다.FIG. 7 is a graph illustrating sampled data processed based on time-series data in the issue detection method according to an embodiment of the present invention.

이슈 검출장치는 이동평균 데이터(630)에 기반하여 표본화를 수행할 수 있다. 표본화 데이터는 도 7에 도시된 바와 같이, 단위 시간을 주기로 값을 가지도록 형성될 수 있다. 이슈 검출장치는, 표본화 데이터에 기반하여 데이터이 변화량을 확인할 수 있다.The issue detection apparatus may perform sampling based on moving average data 630. [ The sampling data may be formed to have a value in a unit time period as shown in FIG. The issue detection apparatus can confirm the amount of change of data based on the sampled data.

표본화 데이터 또한, 시계열 데이터와 마찬가지로, 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 값으로 제공될 수 있다.Sampling data can also be provided as a time axis for the horizontal axis and a value for at least one category as the time series data.

본 발명의 다양한 실시 예에 따르면, 이슈 검출방법은 상술한 바와 같이 적어도 하나의 장치(예: 이슈 검출장치)를 통하여 수행될 수 있다. 도 8은 본 발명의 일 실시 예에 따른 이슈 검출장치(800)의 구성 요소를 도시한다. 이슈 검출장치(800)는, 통신부(801), 입력부(803), 출력부(805), 저장부(807) 및 처리부(809) 중 적어도 하나의 구성 요소를 포함한다.According to various embodiments of the present invention, the issue detection method may be performed through at least one device (e.g., issue detection device) as described above. Figure 8 illustrates the components of an issue detection device 800 in accordance with an embodiment of the present invention. The issue detection apparatus 800 includes at least one of a communication unit 801, an input unit 803, an output unit 805, a storage unit 807, and a processing unit 809.

통신부(801)는 이슈 검출장치(800)와 외부의 통신을 연결할 수 있다. 예를 들면, 통신부(801)는 무선 통신 또는 유선 통신을 통해서 네트워크에 연결되며 외부장치와 통신할 수 있다. 통신부(801)는 연결된 적어도 하나의 외부장치로부터 데이터를 수신할 수 있다. 예를 들면, 통신부(801)는 시계열 데이터를 생성하기 위한 적어도 하나의 카테고리와 관련된 데이터를 외부장치로부터 수신할 수 있다.The communication unit 801 can connect an external communication with the issue detection device 800. [ For example, the communication unit 801 is connected to a network through wireless communication or wired communication and can communicate with an external device. The communication unit 801 can receive data from at least one external device connected thereto. For example, the communication unit 801 can receive data related to at least one category for generating time series data from an external device.

입력부(803)는, 이슈 검출장치(800)에 입력되는 데이터를 처리하기 위한 정보 및/또는 제어명령을 입력하기 위한 구성 요소로서, 예를 들면, 키보드, 키패드, 터치 스크린, 적어도 하나의 버튼, 마이크 중 적어도 하나를 포함할 수 있다. 입력부(803)는 사용자의 조작에 대응하여 입력 데이터를 발생시킨다.The input unit 803 is a component for inputting information and / or a control command for processing data input to the issue detection apparatus 800 and includes, for example, a keyboard, a keypad, a touch screen, And a microphone. The input unit 803 generates input data in response to a user's operation.

출력부(805)는, 처리부(809)를 통한 처리 결과를 출력할 수 있다. 예를 들면, 출력부(805)는 시계열 데이터, 시계열 데이터를 구성하는 적어도 하나의 성분 데이터, 이동평균 데이터, 표본화 데이터, 결정된 중요 이슈, 및 그와 관련된 정보 중 적어도 일부를 출력할 수 있다. 일 실시 예에 따르면, 출력부(805)는 디스플레이 및 스피커 중 적어도 하나의 장치를 포함할 수 있다.The output unit 805 can output the processing result through the processing unit 809. [ For example, the output unit 805 may output at least a part of time series data, at least one component data constituting time series data, moving average data, sampling data, determined important issues, and information related thereto. According to one embodiment, the output 805 may include at least one of a display and a speaker.

출력부(805)가 디스플레이로 구비되는 경우, 처리부(809)를 통해서 디스플레이에 전송되는 데이터는 사용자 그래픽 인터페이스(graphic user interface)로 표시될 수 있다. 또한, 출력부(805)가 스피커로 구비되는 경우, 처리부(809)를 통해서 스피커에 전송되는 데이터는 오디오로 출력할 수 있다.When the output unit 805 is provided as a display, data transmitted to the display through the processing unit 809 may be displayed as a graphic user interface. When the output unit 805 is provided as a speaker, data transmitted to the speaker through the processing unit 809 can be output as audio.

저장부(807)는, 처리부(809) 또는 다른 구성 요소들로부터 수신되거나 생성된 명령 및/또는 데이터를 저장할 수 있다. 저장부(807)는, 예를 들면, 커널, 미들웨어, 어플리케이션 프로그래밍 인터페이스(API: application programming interface) 또는 어플리케이션 등의 프로그래밍 모듈들을 포함할 수 있다. 상술한 각각의 프로그래밍 모듈들은 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 저장부(709)에 저장될 수 있다.The storage unit 807 can store instructions and / or data received or generated from the processing unit 809 or other components. The storage unit 807 may include, for example, a programming module such as a kernel, a middleware, an application programming interface (API), or an application. Each of the above-described programming modules may be stored in the storage unit 709 by software, firmware, hardware, or a combination of at least two of them.

더하여, 저장부(807)는, 통신부(801) 및/또는 입력부(803)를 통해서 입력되는 데이터가 저장되며, 처리부(809)를 통하여 처리되는 데이터, 키워드, 시계열 데이터, 적어도 하나의 성분 데이터, 이동평균 데이터, 표본화 데이터, 중요 이슈 및 그와 관련된 정보 중 적어도 일부가 저장될 수 있다.In addition, the storage unit 807 stores data input through the communication unit 801 and / or the input unit 803, and stores data processed through the processing unit 809, keywords, time series data, at least one component data, At least some of the moving average data, sampling data, important issues and related information may be stored.

처리부(809)는, 전술한 다른 구성 요소들(예: 통신부(801), 입력부(803), 출력부(805) 및 저장부(807))로부터 데이터를 수신하여, 수신한 데이터를 확인하고, 확인된 데이터의 처리를 실행할 수 있다.The processing unit 809 receives data from the above-described other components (for example, the communication unit 801, the input unit 803, the output unit 805, and the storage unit 807), confirms the received data, Processing of the confirmed data can be executed.

일 실시 예에 따르면, 처리부(809)는, 통신부(801) 또는 입력부(803)를 통해서 입력되는 데이터를 확인할 수 있다. 처리부(809)는, 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하고, 생성된 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하고, 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 중요 이슈로 결정할 수 있다.According to one embodiment, the processing unit 809 can confirm the data input through the communication unit 801 or the input unit 803. [ The processing unit 809 generates time series data for two or more categories based on input data, detects an abnormal trend based on the component data included in the generated time series data, and detects at least two or more abnormal trends A part of a plurality of keywords designated at the two or more time points may be determined as an important issue based on the time point.

또한, 처리부(809)는, 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분 데이터, 추세성분 데이터, 임의성분 데이터 및 상기 시계열 데이터 각각의 이동평균 성분 데이터 중 적어도 하나의 성분에 대한 데이터를 처리할 수 있다.Further, the processing unit 809 processes the data for at least one of the periodic component data, the trend component data, the arbitrary component data, and the moving average component data of each of the time series data for each of the time series data .

또한, 처리부(809)는, 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태를 이상 트랜드로 결정할 수 있다.In addition, the processing unit 809 can determine, as an abnormal trend, a state in which a value corresponding to the time component in the time series data of at least one of the two or more categories is out of the specified numerical range.

또한, 처리부(809)는, 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 이상 트랜드로 결정할 수 있다.Further, the processing unit 809 can determine at least one of the abnormality detected in the time-series data of at least one of the two or more categories and the abnormality detected as an abnormal trend.

또한, 처리부(809)는, 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 중요 이슈로 결정할 수 있다.The processing unit 809 applies a weight of at least one of a time weight according to the distance between at least two viewpoints and a uniformity weight according to the identity of the category to apply a part of the plurality of keywords specified at two or more time points to an important issue You can decide.

또한 처리부(809)는, 결정된 중요 이슈에 대하여 키워드를 검출할 수 있다. 예를 들면, 처리부(809)는, 결정된 중요 이슈에 대응되는 시점의 키워드 카테고리에 포함된 복수의 키워드 중 노출 빈도가 높게 나타난 키워드 중 적어도 일부를 중요 이슈의 키워드로 결정할 수 있다.The processing unit 809 can also detect a keyword for the determined important issue. For example, the processing unit 809 can determine at least a part of the keywords having a high exposure frequency among a plurality of keywords included in the keyword category corresponding to the determined important issue, as the keyword of the important issue.

본 발명의 일 실시 예에 따르면, 처리부(809)는 논리적 또는 물리적인 복수개의 구성 요소로 분리 형성될 수 있다. 이때, 처리부(809)의 세부 구성 요소들이 물리적으로 구분되는 경우, 각각의 세부 구성 요소들은 별도의 모듈 형태로 제공될 수 있고, 또는 둘 이상의 모듈이 연결된 하나의 모듈로 구성될 수 있다.According to an embodiment of the present invention, the processing unit 809 may be divided into a plurality of logical or physical components. At this time, when the detailed components of the processing unit 809 are physically divided, each of the detailed components may be provided in a separate module form, or may be composed of one module in which two or more modules are connected.

이슈 검출장치(800)와 연결되는 외부장치는, 이슈 검출장치(800)와 동일 또는 유사한 장치로 제공될 수 있다. 또한, 외부장치는, 이슈 검출장치(800)와 마찬가지로 다양한 장치들 중 하나 또는 그 이상의 조합으로 구성될 수 있다. 예를 들어, 장치는 기재된 장치들 중 적어도 일부, 또는 장치의 기능 중 적어도 일부를 포함하는 구조물로 제공될 수도 있다.The external apparatus connected to the issue detection apparatus 800 may be provided in the same or similar apparatus as the issue detection apparatus 800. [ In addition, the external apparatus may be configured as one or more of various apparatuses as in the issue detection apparatus 800. For example, the device may be provided as a structure that includes at least a portion of the devices described, or at least some of the functionality of the device.

상술한 바에 따르면, 본 발명의 다양한 실시 예에 따른 이슈 검출방법은, 수집된 정보(데이터)에 기반하여 다양한 카테고리에 대한 시계열 데이터를 분석함으로써 중요 이슈의 검출 성능을 향상시킬 수 있다.As described above, the issue detection method according to various embodiments of the present invention can improve the detection performance of important issues by analyzing time series data for various categories based on the collected information (data).

또한, 본 발명의 다양한 실시 예에 따른 이슈 검출방법은, 발생되는 복수의 이슈들에 대하여 이슈의 검출 시점에 기반하여 중요 이슈를 결정함으로써, 실시간 또는 과거 발생된 이슈의 중요 여부에 한정하지 않고, 발생된 이슈 또는 결정된 중요 이슈와 연관된 다양한 정보들을 효과적으로 판단할 수 있다.In addition, the issue detection method according to various embodiments of the present invention determines important issues based on detection time of an issue for a plurality of issues to be generated, thereby not limiting the importance of real-time or past-generated issues, It is possible to effectively judge various information related to the generated issue or the determined important issue.

또한, 본 발명의 다양한 실시 예에 따른 이슈 검출방법은, 둘 이상의 시점에 대하여 발생된 이슈의 연관성을 판단하여 중요 이슈의 중요 여부를 효과적으로 판단할 수 있다.In addition, the issue detection method according to various embodiments of the present invention can effectively determine whether an important issue is important by determining the relevance of an issue generated at two or more viewpoints.

다양한 실시 예에 따르면, 본 발명의 청구항 및/또는 명세서에 기재된 다양한 실시 예에 따른 장치, 방법의 적어도 일부는, 하드웨어, 소프트웨어, 펌웨어, 또는 하드웨어, 소프트웨어 및 펌웨어 중 둘 이상의 조합을 포함하는 형태(예: 모듈, unit)로 구현될(implemented) 수 있다.According to various embodiments, at least some of the devices and methods according to the various embodiments described in the claims of the present invention and / or the specification are in the form of hardware, software, firmware, or a combination of two or more of hardware, For example, modules, units).

모듈은, 일체로 구성된 부품의 최소 단위 또는 그 일부로서 본 발명의 다양한 실시 예를 수행하는 최소 단위 또는 그 일부가 될 수도 있다. 모듈은 기계적으로 또는 전자적으로 구현될 수 있다.A module may be a minimum unit or a portion thereof that performs various embodiments of the present invention as a minimum unit or a part of an integrally constructed component. The module may be implemented mechanically or electronically.

본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서 본 발명의 범위는 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The embodiments of the present invention disclosed in the present specification and drawings are merely illustrative examples of the present invention and are not intended to limit the scope of the present invention in order to facilitate understanding of the present invention. Accordingly, the scope of the present invention should be construed as being included in the scope of the present invention, all changes or modifications derived from the technical idea of the present invention.

800 : 이슈 검출장치 801 : 통신부
803 : 입력부 805 : 출력부
807 : 저장부 809 : 처리부
800: Issue detection apparatus 801:
803: input unit 805: output unit
807: Storage unit 809:

Claims (10)

입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하는 단계;
상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하는 단계; 및
상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계;를 포함하는, 트랜드 분석에 기반하는 이슈 검출방법.
Generating time series data for two or more categories based on input data;
Detecting an abnormal trend based on the component data included in the time series data; And
And determining a part of a plurality of keywords specified at the two or more time points as an issue based on at least two or more time points at which the abnormal trend occurred.
제1항에 있어서,
상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함하는, 트랜드 분석에 기반하는 이슈 검출방법.
The method according to claim 1,
Wherein the component data includes information on at least one of a periodic component, a trend component, an arbitrary component, and a moving average component of each of the time series data, for each of the time series data, based on a trend analysis Issue detection method.
제1항에 있어서,
상기 이상 트랜드는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태인, 트랜드 분석에 기반하는 이슈 검출방법.
The method according to claim 1,
Wherein the abnormal trend is a state in which a value corresponding to a time component in time series data of at least one of the two or more categories is out of a specified numerical range.
제1항에 있어서,
상기 이상 트랜드를 검출하는 단계는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 검출하는, 트랜드 분석에 기반하는 이슈 검출방법.
The method according to claim 1,
Wherein the step of detecting the abnormal trend detects at least one of an abnormal point and an abnormal symptom detected in time series data of at least one of the two or more categories.
제1항에 있어서,
상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 결정하는, 트랜드 분석에 기반하는 이슈 검출방법.
The method according to claim 1,
Wherein the step of determining a part of the plurality of keywords designated at the two or more viewpoints is determined by applying at least one weight among a time weight according to the distance between the at least two viewpoints and an identity weight according to the identity of the category , An issue detection method based on trend analysis.
적어도 하나의 외부장치와 통신하는 통신부; 및
상기 통신부를 통해서 상기 외부장치로부터 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하고, 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하고, 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 처리부;를 포함하는, 트랜드 분석에 기반하는 이슈 검출장치.
A communication unit for communicating with at least one external device; And
Wherein the control unit generates time series data for two or more categories based on data input from the external apparatus through the communication unit, detects an abnormal trend based on the component data included in the time series data, And a processor for determining a part of the plurality of keywords designated at the two or more viewpoints as an issue based on the above-mentioned viewpoints.
제6항에 있어서,
상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함하는, 트랜드 분석에 기반하는 이슈 검출장치.
The method according to claim 6,
Wherein the component data includes information on at least one of a periodic component, a trend component, an arbitrary component, and a moving average component of each of the time series data, for each of the time series data, based on a trend analysis Issue detection device.
제6항에 있어서,
상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태를 상기 이상 트랜드로 결정하는, 트랜드 분석에 기반하는 이슈 검출장치.
The method according to claim 6,
Wherein the processing section determines, as the abnormal trend, a state in which a value corresponding to a time component is out of a specified numerical range in time series data of at least one of the two or more categories.
제6항에 있어서,
상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 상기 이상 트랜드로 검출하는, 트랜드 분석에 기반하는 이슈 검출장치.
The method according to claim 6,
Wherein the processing section detects at least one of an abnormal point and an abnormal symptom loss detected in the time series data of at least one of the two or more categories as the abnormal trend.
제6항에 있어서,
상기 처리부는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는, 트랜드 분석에 기반하는 이슈 검출장치.
The method according to claim 6,
Wherein the processing unit determines at least one of a plurality of keywords specified at the two or more time points as an issue by applying at least one weight among a time weight according to the distance between the at least two view points and an identity weight according to the identity of the category, Issue detection device based on trend analysis.
KR1020170050602A 2017-04-19 2017-04-19 Method for detecting issue based on trend analysis device thereof KR101924352B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170050602A KR101924352B1 (en) 2017-04-19 2017-04-19 Method for detecting issue based on trend analysis device thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170050602A KR101924352B1 (en) 2017-04-19 2017-04-19 Method for detecting issue based on trend analysis device thereof

Publications (2)

Publication Number Publication Date
KR20180117460A true KR20180117460A (en) 2018-10-29
KR101924352B1 KR101924352B1 (en) 2019-02-20

Family

ID=64101553

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170050602A KR101924352B1 (en) 2017-04-19 2017-04-19 Method for detecting issue based on trend analysis device thereof

Country Status (1)

Country Link
KR (1) KR101924352B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650830A (en) * 2020-11-17 2021-04-13 北京字跳网络技术有限公司 Keyword extraction method and device, electronic equipment and storage medium
CN112651539A (en) * 2019-10-12 2021-04-13 富士通株式会社 Information processing apparatus, information processing method, and computer program
KR102344804B1 (en) * 2021-10-19 2021-12-29 주식회사 큐로드 Method for user feedback information management using AI-based monitoring technology
KR20220019576A (en) * 2020-08-10 2022-02-17 네이버 주식회사 Method and system for providing information on search terms whose popularity increase rapidly
CN117056663A (en) * 2023-10-13 2023-11-14 腾讯科技(深圳)有限公司 Data processing method and device, electronic equipment and storage medium

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081491A (en) * 2009-10-05 2011-04-21 Nec Biglobe Ltd Time series analysis device, time series analysis method and program
JP2011141801A (en) * 2010-01-08 2011-07-21 Internatl Business Mach Corp <Ibm> Processing method for time-series analysis of keyword, processing system and computer program thereof
KR20140139466A (en) 2014-11-12 2014-12-05 변동삼 automatic sales forecasting system based on data crawling and manager's input

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081491A (en) * 2009-10-05 2011-04-21 Nec Biglobe Ltd Time series analysis device, time series analysis method and program
JP2011141801A (en) * 2010-01-08 2011-07-21 Internatl Business Mach Corp <Ibm> Processing method for time-series analysis of keyword, processing system and computer program thereof
KR20140139466A (en) 2014-11-12 2014-12-05 변동삼 automatic sales forecasting system based on data crawling and manager's input

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651539A (en) * 2019-10-12 2021-04-13 富士通株式会社 Information processing apparatus, information processing method, and computer program
KR20220019576A (en) * 2020-08-10 2022-02-17 네이버 주식회사 Method and system for providing information on search terms whose popularity increase rapidly
CN112650830A (en) * 2020-11-17 2021-04-13 北京字跳网络技术有限公司 Keyword extraction method and device, electronic equipment and storage medium
CN112650830B (en) * 2020-11-17 2021-11-26 北京字跳网络技术有限公司 Keyword extraction method and device, electronic equipment and storage medium
KR102344804B1 (en) * 2021-10-19 2021-12-29 주식회사 큐로드 Method for user feedback information management using AI-based monitoring technology
CN117056663A (en) * 2023-10-13 2023-11-14 腾讯科技(深圳)有限公司 Data processing method and device, electronic equipment and storage medium
CN117056663B (en) * 2023-10-13 2024-02-13 腾讯科技(深圳)有限公司 Data processing method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
KR101924352B1 (en) 2019-02-20

Similar Documents

Publication Publication Date Title
KR101924352B1 (en) Method for detecting issue based on trend analysis device thereof
JP6703031B2 (en) Method for evaluating relevance between keyword and asset price, apparatus therefor, and method for displaying asset information
CN110390408B (en) Transaction object prediction method and device
CN111309539A (en) Abnormity monitoring method and device and electronic equipment
US11620474B2 (en) Model reselection for accommodating unsatisfactory training data
US11017330B2 (en) Method and system for analysing data
CN113099475A (en) Network quality detection method and device, electronic equipment and readable storage medium
CN114978877B (en) Abnormality processing method, abnormality processing device, electronic equipment and computer readable medium
CN110956278A (en) Method and system for retraining machine learning models
CN110880128A (en) Abnormal information mining method, device and system and terminal equipment
CN114203200A (en) Voice quality inspection method and device, computer equipment and storage medium
CN111178421B (en) Method, device, medium and electronic equipment for detecting user state
CA3035539A1 (en) Systems and methods for measuring collected content significance
US20100042446A1 (en) Systems and methods for providing core property review
US10169707B1 (en) System and method for generating predictions of geopolitical events
CN113377640B (en) Method, medium, device and computing equipment for explaining model under business scene
CN115204733A (en) Data auditing method and device, electronic equipment and storage medium
KR20190061317A (en) Method of providing stock information
O'Brien et al. EWSmethods: an R package to forecast tipping points at the community level using early warning signals, resilience measures, and machine learning models
US20210097414A1 (en) User Interface System Incorporating Analysis of User Interaction Classification
US20200342302A1 (en) Cognitive forecasting
CN113722593A (en) Event data processing method and device, electronic equipment and medium
JP2011227720A (en) Recommendation system, recommendation method and recommendation program
CN113689020A (en) Service information prediction method, device, computer equipment and storage medium
CN112200602A (en) Neural network model training method and device for advertisement recommendation

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant