KR20180117460A - 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치 - Google Patents

트랜드 분석에 기반하는 이슈 검출방법 및 그 장치 Download PDF

Info

Publication number
KR20180117460A
KR20180117460A KR1020170050602A KR20170050602A KR20180117460A KR 20180117460 A KR20180117460 A KR 20180117460A KR 1020170050602 A KR1020170050602 A KR 1020170050602A KR 20170050602 A KR20170050602 A KR 20170050602A KR 20180117460 A KR20180117460 A KR 20180117460A
Authority
KR
South Korea
Prior art keywords
data
issue
time
time series
component
Prior art date
Application number
KR1020170050602A
Other languages
English (en)
Other versions
KR101924352B1 (ko
Inventor
이훈석
안순홍
이지민
이상원
박진표
Original Assignee
아시아나아이디티 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아시아나아이디티 주식회사 filed Critical 아시아나아이디티 주식회사
Priority to KR1020170050602A priority Critical patent/KR101924352B1/ko
Publication of KR20180117460A publication Critical patent/KR20180117460A/ko
Application granted granted Critical
Publication of KR101924352B1 publication Critical patent/KR101924352B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F17/30705
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

본 발명의 다양한 실시 예는 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치에 관한 것이다. 일 실시 예에 따르면, 트랜드 분석에 기반하는 이슈 검출방법은, 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하는 단계; 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하는 단계; 및 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계;를 포함한다.

Description

트랜드 분석에 기반하는 이슈 검출방법 및 그 장치{METHOD FOR DETECTING ISSUE BASED ON TREND ANALYSIS DEVICE THEREOF}
본 발명의 다양한 실시 예는 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치에 관한 것으로, 더욱 상세하게는 입력된 데이터의 트랜드를 분석하고, 트랜드 중 일부를 이슈로 검출하는 방법 및 그 장치에 관한 것이다.
인터넷 정보 수집에 의하여 외부 환경을 고려한 기업의 내부 데이터 분석 방법이 연구되고 있다. 예를 들어, 고객의 성향을 인터넷 정보에 의하여 트랜드를 파악하고 기업의 실적(예: 품목단위 매출)과 함께 분석함으로써 매출의 변동 요인을 찾거나 또는 신규 상품의 기획 근거를 발하고 있다. 이러한 활동은 실시간 경영(Real-Time Enterprise, RTE)의 개념을 현실화 하는데 큰 영향을 주고 있다.
기업 환경뿐만 아니라 공공 분야에서도 국민의 안전, 소비자 환경 등 인터넷상의 트랜드 분석을 통해 즉각적인 대응, 정책 전략을 수립할 수 있다. 해외의 경우 이슈 탐지(Horizon Scanning)라는 명명하에 이러한 류의 프로젝트들이 수행 중이다.
이때 중요한 것은 수집된 정보를 ?분석? 이라는 과정을 통해서 이슈를 탐지 하는 것이다. 이슈 탐지를 얼마나 실시간으로 수행할 수 있느냐가 실시간 경영의 중요한 요소가 될 수 있다.
특허문헌 제10-2014-0139466호는 예측을 위한 속성이 될 수 있는 웹상의 과거 및 실시간 데이터를 크롤링하는 데이터 크롤링 엔진부; 과거부터 현재까지의 판매 통계 데이터와 상기 크롤링한 속성 데이터를 저장 및 관리하는 데이터베이스부; 상기 데이터베이스부의 데이터에 대한 데이터 전처리 과정을 포함하며 예측을 위한 트레이닝셋, 테스트셋을 포함한 데이터셋을 생성하는 데이터셋 생성부; 선정 및 기설정된 예측 모델, 알고리즘을 통해 상기 데이터셋에 기초하여 예측 목표일에 대응하는 판매 예측 값을 산출하는 데이터 마이닝 엔진부; 상기 판매 예측 값을 관리자에게 제공하는 판매 예측 정보 제공부; 상기 관리자가 판매 예측에 영향을 미칠 것이라 예견하는 데이터를 입력하여 상기 예측을 위한 속성 데이터로 사용함으로써 상기 예측의 정확도를 향상시키는 속성 데이터 수동 입력부; 를 포함하는 것을 특징으로 하는 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치를 개시하고 있다.
하지만, 입력된 데이터에 기반하여 발생되는 이슈를 검출하고, 시계열적으로 이슈의 연관성을 분석 및 중요 이슈를 검출하는 데에는 여전히 기술적 한계가 존재한다.
10-2014-0139466 (공개특허공보)
본 발명의 다양한 실시 예에 따르면, 입력된 데이터의 트랜드 분석을 통하여 이슈의 발생을 검출하고, 발생된 이슈들 중 중요 이슈를 검출하는, 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치를 제공할 수 있다.
본 발명의 다양한 실시 예에 따르면, 입력된 데이터에 기반하는 시계열 데이터의 트랜드 분석을 통하여 중요 이슈 및 그와 관련된 키워드를 검출하는, 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치를 제공할 수 있다.
본 발명의 일 실시 예에 따르면, 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하는 단계; 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하는 단계; 및 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계;를 포함하는, 트랜드 분석에 기반하는 이슈 검출방법을 제공한다.
다양한 실시 예에 따르면, 상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함할 수 있다.
또한, 상기 이상 트랜드는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태일 수 있다.
또한, 상기 이상 트랜드를 검출하는 단계는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 검출할 수 있다.
또한, 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 결정할 수 있다.
한편, 본 발명의 일 실시 예에 따르면, 적어도 하나의 외부장치와 통신하는 통신부; 및 상기 통신부를 통해서 상기 외부장치로부터 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하고, 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하고, 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 처리부;를 포함하는, 트랜드 분석에 기반하는 이슈 검출장치를 제공한다.
다양한 실시 예에 따르면, 상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함할 수 있다.
또한, 상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태를 상기 이상 트랜드로 결정할 수 있다.
또한, 상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 상기 이상 트랜드로 검출할 수 있다.
또한, 상기 처리부는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정할 수 있다.
본 발명의 다양한 실시 예에 따르면, 수집된 정보(데이터)에 기반하여 다양한 카테고리에 대한 시계열 데이터를 분석함으로써 중요 이슈의 검출 성능을 향상시킬 수 있다.
또한, 본 발명의 다양한 실시 예에 따르면, 발생되는 복수의 이슈들에 대하여 이슈의 검출 시점의 영향 정도에 기반하여 중요 이슈를 결정함으로써, 실시간 또는 과거 발생된 이슈의 중요 여부를 효과적으로 판단할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 이슈 검출방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 트랜드 검출방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 이상점 추출 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 과거 이슈발생 시점과 시간차에 대한 가중치를 나타내는 그래프이다.
도 5는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 입력된 데이터에 기반하여 생성되는 시계열 데이터 및 시계열 데이터를 구성하는 속성 데이터를 그래프로 나타낸 도면이다.
도 6은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터 및 시계열 데이터에 기반하여 처리된 이동평균 데이터를 그래프로 나타낸 도면이다.
도 7은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터에 기반하여 처리된 표본화 데이터를 그래프로 나타낸 도면이다.
도 8은 본 발명의 일 실시 예에 따른 이슈 검출장치의 구성 요소를 도시한 도면이다.
이하, 첨부한 도면을 참고로 하여 본 발명의 다양한 실시 예를 상세히 설명한다, 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략할 수 있다. 또한, 명세서 전체를 통하여 동일 또는 유사한 구성 요소에 대해서는 동일한 참조 부호를 사용할 수 있다.
본 발명의 다양한 실시 예에서, '또는', '적어도 하나' 등의 표현은 함께 나열된 단어들 중 하나를 나타내거나, 또는 둘 이상의 조합을 나타낼 수 있다.
본 발명의 다양한 실시 예에서 사용되는 용어들은 특정 일 실시 예를 설명하기 위한 것으로, 본 발명을 한정하는 것으로 해석되어서는 안되며, 예를 들어, 단수의 표현은 문맥상 명백하게 다른 것으로 명시되지 않는 한 복수의 의미를 포함할 수 있을 것이다.
이하, 본 발명의 다양한 실시 예에 따르면, 트랜드(또는, 추세, trend) 분석에 기반하여 발생되는 다양한 이슈(issue) 중에서 중요 이슈(hot issue)를 검출하는 방법(이하, 이슈 검출방법) 및 그 장치를 설명한다. 이슈 검출방법은 적어도 하나의 전자장치를 통해서 처리될 수 있다. 일 실시 예에 따르면, 이슈 검출방법을 처리하는 전자장치(이하, 이슈 검출장치)는 입력되는 데이터로부터 시계열 데이터(또는 원시 시계열 데이터)를 생성하고, 시계열 데이터를 통해서 검출되는 트랜드에 기반하여 이슈를 결정할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 이슈 검출방법을 설명하기 위한 흐름도이다.
도 1을 참조하면, 101 동작에서 이슈 검출장치는 데이터 입력을 확인한다. 여기에서, 이슈 검출장치에 입력되는 데이터는 온라인을 통해서 노출(또는 출현)되는 키워드, 기업의 매출 정보와 같이 둘 이상의 카테고리에 대한 정보를 포함할 수 있다. 또한, 입력되는 데이터는 상술한 바와 같이 키워드 및 기업의 매출 정보의 두 카테고리에 한정하지 않고, 업종 관련 뉴스, 날씨, 스포츠, 검색어, 공휴일, 기념일, 시청률, 경제 지표, 통계 데이터, SNS, 웹사이트의 게시글, 댓글과 같이 다양한 범위에서 둘 이상의 카테고리에 대한 정보가 데이터로 입력될 수 있다.
이슈 검출장치에 입력되는 데이터는, 실시간으로 입력될 수 있고, 또는 지정된 주기에 따라서 입력될 수 있다. 여기서, 이슈 검출장치는 데이터 입력이 없는 경우, 데이터 입력의 대기 상태를 유지할 수 있다.
103 동작에서 이슈 검출장치는 시계열 데이터를 생성한다. 이슈 검출장치는 입력되는 데이터를 카테고리에 따라서 분류하고 시계열 데이터를 생성할 수 있다. 일 실시 예에 따르면, 이슈 검출장치는 키워드와 매출 정보가 입력되는 경우 키워드 카테고리와 매출 카테고리를 구분하여 시계열 데이터를 생성할 수 있다. 또한, 이슈 검출장치는 키워드에 대한 시계열 데이터를 생성함에 있어서, 키워드 각각에 대한 시계열 데이터를 생성할 수 있다. 또는, 이슈 검출장치는 둘 이상의 키워드를 그룹화하여 그룹 단위의 시계열 데이터를 생성할 수 있다. 여기서, 생성되는 시계열 데이터는, 시간 성분에 대응되는 각각의 카테고리와 관련된 값을 포함할 수 있다.
105 동작에서 이슈 검출장치는 트랜드를 검출한다. 이슈 검출장치는 시계열 데이터에 기반하여 트랜드를 검출할 수 있다. 이때, 이슈 검출장치는 시계열 데이터에 포함된 적어도 하나의 성분(또는 성분 데이터)에 기반하여 트랜드를 검출할 수 있고, 또는 시계열 데이터의 표본화 데이터에 기반하여 트랜드를 검출할 수 있다.
이슈 검출장치는, 검출된 트랜드 중 이상 트랜드(또는 이슈), 예를 들면, 이삼점 또는 이상 증감점을 검출한다. 일 실시 예에 따르면, 이슈 검출장치는 시계열 데이터를 구성하는 다양한 성분들 중 지정된 적어도 하나의 성분에 대하여 이상점을 추출할 수 있다. 또한, 이슈 검출장치는 시계열 데이터에 기반하여 생성된 표본화 데이터에 대하여 이상 증감점을 추출할 수 있다. 여기서, 상술한 복수의 이슈 감지모델, 예를 들면, 이상점을 추출하는 동작 또는 이상 증감점을 추출하는 동작은 입력된 데이터가 포함된 복수의 카테고리 중 적어도 하나의 카테고리에 대하여 수행될 수 있다.
이하, 도 2 및 도 3을 참조하여, 이슈 검출장치가 시계열 데이터에 기반하여 이상점 또는 이상 증감점을 추출하는 다양한 실시 예를 설명할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 트랜드 검출방법을 설명하기 위한 흐름도이다. 여기서, 트랜드 검출은, 상술한 바와 같이, 적어도 하나의 카테고리에 대한 시계열 데이터의 성분 데이터를 이용하여 이상점을 추출하는 동작 또는 시계열 데이터의 표본값을 이용하여 이상 증감향을 추출하는 동작을 포함할 수 있다. 이하, 도 2의 다양한 실시 예는, 도 1에서 설명한 트랜드 검출방법(105)의 일부 동작으로 수행될 수 있다. 이때, 201 동작은, 도 1의 103 동작 이후에 수행될 수 있다.
201 동작에서 이슈 검출장치는 시계열 분해 여부를 결정한다. 예를 들면, 이슈 검출장치는, 시계열 데이터의 이상점을 추출하는 동작을 수행하는 경우 203 동작을 통해서 시계열 분해를 수행하고, 시계열 데이터의 이상 증감점을 추출하는 동작을 수행하는 경우 207 동작을 통해서 이동평균을 산출하는 동작을 수행할 수 있다.
203 동작에서 이슈 검출장치는 시계열 분해를 수행한다. 예를 들면, 이슈 검출장치는 생성된 시계열 데이터를 구성하는 값들에 기반하여 적어도 하나의 성분을 검출할 수 있다. 여기서, 시계열 데이터에 포함되는 성분들은, 예를 들면, 주기(또는 계절, seasonal)성분, 트랜드성분 및 임의성분 중 적어도 하나의 성분을 포함하는 성분 데이터로 제공될 수 있다.
주기성분 데이터는 주기성분 및 시간성분을 포함할 수 있다. 마찬가지로, 트랜드성분 데이터는 트랜드성분 및 시간성분을 포함할 수 있고, 임의성분 데이터는, 임의성분 및 시간성분을 포함할 수 있다. 즉, 시계열 데이터를 구성하는 각각의 성분들은, 도 5에 도시된 바와 같이 시계열 데이터(500)와 마찬가지로, 시간 성분에 대한 값으로 구성되며, 시간의 흐름에 따른 그래프, 표, 테이블 등으로 표시될 수 있다.
여기서, 주기 데이터는, 확장과 수축 기간이 지정된 시간 범위의 1단위 주기를 가지고 상호 반복적인 변동하는 값들을 포함하여 구성될 수 있다. 또한, 트랜드 데이터는 기울기를 가지고 상승 또는 하강하는 경향을 나타내는 변동에 대한 값들을 포함하여 구성될 수 있다. 또한, 임의 데이터는 일시적인 이슈, 과거에 없다가 갑자기 발생되는 이슈, 그리고 이슈에 관련된 시점과 관련된 값들을 포함하여 구성될 수 있다.
205 동작에서 이슈 검출장치는 성분 데이터 중 적어도 일부에 대하여 이상점을 추출한다. 예를 들면, 이슈 검출장치는 성분 데이터에 대하여 시간성분에 대응되는 값들이 지정된 범위 내에 위치하는지 여부를 확인할 수 있다. 예를 들면, 이슈 검출장치는, 임의성분 데이터에 포함된 값들 중 지정된 수치범위를 벗어난 값이 검출되는 시점을 임의성분 데이터의 이상점으로 결정할 수 있다.
마찬가지로, 이슈 검출장치는, 주기성분 데이터 또는 트랜드성분 데이터에 포함된 값들 중 지정된 수치범위를 벗어난 값이나 지정된 수치 이상 또는 이하의 값이 검출되는 시점을 해당 성분 데이터의 이상점으로 결정할 수 있다. 이때, 각각의 성분 데이터에서 이상점은 둘 이상 포함될 수도 있다. 여기서, 시점은 성분 값이 지정된 수치범위를 벗어나는 순간(또는 시각)에 한정하지 않고, 성분 값이 수치범위를 벗어난 상태 또는 그 시간범위를 포함할 수 있다.
이슈 검출장치는, 205 동작을 수행하면, 도 2의 실시 예를 종료할 수 있고, 또는 도 1의 107 동작을 수행할 수 있다.
한편, 207 동작에서, 이슈 검출장치는 시계열 데이터의 이동평균을 산출한다. 이동평균을 산출하는 동작은, 시계열 데이터를 이용하여 이상 증감점을 추출하기 위한 전처리 동작으로 수행될 수 있다.
입력되는 다양한 카테고리의 값들에 기반하여 생성되는 시계열 데이터는 급격한 변동을 포함하여 구성될 수 있다. 이슈 검출장치는 이러한 비선형 데이터의 처리 효과를 향상시키기 위하여 그래프로 표시되는 시계열 데이터를 지정된 시간 간격으로 이동평균을 산출할 수 있다.
209 동작에서, 이슈 검출장치는, 시계열 데이터의 이동평균 결과에 기반하여 해당 카테고리에 대한 증감폭을 결정한다. 이슈 검출장치는 시계열 데이터를 지정된 시간 간격으로 이동평균을 이용하여 이상 증감점을 결정하기 위하여 산출된 이동평균 데이터의 증감폭을 결정할 수 있다.
일 실시 예에 따르면, 이슈 검출장치는 시계열 데이터의 이동평균 결과를 이용하여 시계열 데이터의 표본화를 수행할 수 있다. 이슈 검출장치는, 시계열 데이터의 이동평균 결과에 미분(예: 1차 미분)을 수행할 수 있다. 이때, 시계열 데이터는 비선형 데이터일 수 있고, 따라서, 이슈 검출장치는, 수치해석적으로 단위 시간당 증감량을 산출할 수 있다. 예를 들면, 표본화 데이터는 시간축에 대하여 일정한 폭(예: 단위 시간)을 가지며, 각각의 단위 시간에 대응되는 값을 포함하여 구성될 수 있다.
211 동작에서, 이슈 검출장치는 산출된 표본화 데이터에 기반하여 시계열 데이터의 이상 증감점을 추출할 수 있다. 예를 들면, 이슈 검출장치는 표본화 데이터의 단위 시간별로 구분된 시간 성분에 대응되는 값들이 지정된 범위 내에 위치하는지 여부를 확인할 수 있다. 예를 들면, 이슈 검출장치는, 표본화 데이터에 포함된 값들 중 지정된 수치범위를 벗어난 값이나 지정된 수치 이상 또는 이하의 값을 검출하는 경우, 해당 시점을 이상 즘감점으로 결정할 수 있다. 더하여, 이슈 검출장치는, 연속되는 단위 시간당 증감량의 차가 지정된 수치 이상인 것을 확인하는 경우, 해당 시점을 이상 증감점으로 결정할 수 있다.
일 실시 예에 따르면, 이슈 검출장치는, 표본화 데이터의 단위 시간에 대응되는 값들을 비교하여 이상 증감량을 결정할 수 있다. 예를 들면, 이슈 검출장치는 단위 시간에 대하여 1/4 분위수와 3/4 분위수에 해당하는 구간거리를 기준으로 구간거리 값의 차이가 지정된 수치(또는 배수, 예: 1.5배)보다 큰 경우, 해당 구간을 이상 증감점으로 결정할 수 있다. 이때, 표본화 데이터에 기반하여 검출되는 이상 증감점은 둘 이상 포함될 수 도 있다. 다양한 실시 예에 따르면, 이슈 검출장치는 단위 시간에 대하여 0 내지 1/4 분위수 및/또는 3/4 내지 1분위수에 해당하는 구간 거리를 기준으로 구간거리 값의 차이가 지정된 수치보다 큰 경우 해당 구간을 이상 증감정으로 결정할 수 있다.
여기서, 1/4 분위수 또는 3/4 분위수는 값의 차이에 기반하여 결정된는 이상 증감점을 설명하기 위한 시간적 위치에 대한 일 실시예로, 시간적 위치는 다양한 방법으로 결정될 수 있음은 자명하다. 또한, 상술한 바에 따르면, 기준이 되는 구간(또는 구간거리)는 4분위를 기준으로 설명하고 있지만, 이에 한정하지 않고, 100분위, 주기, 또는 수치와 같이 다양한 실시 예가 가능하다.
더하여, 이슈 검출장치는, 211 동작에서 설명한 이상 증감점을 결정하는 방법에 한정하지 않고, 이상 증감점을 결정하는 다양한 방법들 중 적어도 일부를 적용하여 표본화 데이터의 이상 증감점을 결정할 수 있음은 자명하다.
이슈 검출장치는, 211 동작을 수행하면, 도 2의 실시 예를 종료할 수 있고, 또는 도 1의 107 동작을 수행할 수 있다.
도 3은 본 발명의 일 실시 예에 따른 이상점 추출 방법을 설명하기 위한 흐름도이다. 이하, 도 3의 다양한 실시 예는, 도 2에서 설명한 이상점 추출(205)의 일부 동작으로 수행될 수 있다. 이때, 301 동작은, 도 2의 203 동작 이후에 수행될 수 있다.
301 동작에서 이슈 검출장치는 회귀분석을 수행할 수 있다. 본 발명의 일 실시 예에 따른 이슈 검출방법은, 입력되는 데이터의 급격한 변화, 생성, 소멸에 따른 특징을 검출하고, 그 특징에 기반하여 이슈를 검출하는 것일 수 있다. 이때, 데이터에 기반하는 특징들은 다양한 성분들에 표현될 수 있지만, 임의성분 데이터는 입력되는 데이터 중 불규칙적으로 발생되는 정보를 포함할 수 있다. 따라서, 이슈 검출장치는 시계열 데이터에 포함된 적어도 하나의 성분, 예를 들면, 임의성분에 대하여 회귀분석을 수행하여 이상점을 추출하기 위한 비교군(또는 비교대상군)을 결정할 수 있다.
이슈 검출장치는, 회귀분석 결과로부터 트랜드성분을 검출할 수 있다. 여기서, 원시 시계열 데이터의 성분 데이터를 원시 성분 데이터로 정의하고, 회귀분석 결과에 기반하는 성분 데이터를 최후 성분 데이터로 정의할 수 있다.
회귀분석 결과를 이용하여 이상점을 추출하는 일 실시 예에 따르면, 최후 트랜드성분 데이터는 임의성분에 대한 트랜드를 포함하고 있음으로, 원시 임의성분 데이터와 최후 트랜드성분 데이터를 비교함으로써 원시 시계열 데이터의 특징을 검출할 수 있다
일 실시 예에 따르면, 이슈 검출장치는 원시 임의성분 데이터와 최후 트랜드성분 데이터의 차이점을 결정할 수 있다. 여기서, “차이점”은 비교 대상의 동일 또는 유사한 값들을 제외한 나머지(residual)의 의미를 포함할 수 있다.
303 동작에서, 이슈 검출장치는, 비교결과(예: 차이점)에 기반하여 이상점을 결정할 수 있다. 일 실시 예에 따르면, 이상점은 최후 트랜드성분 데이터와 원시 임의성분 데이터의 차이점에 대하여 지정된 시간적 기준을 기반으로 결정될 수 있다. 예를 들면, 이슈 검출장치는 1/4 분위수와 3/4 분위수의 구간거리(d)를 기준으로 구간거리(d) 값의 지정된 배수(예: 1.5배)보다 큰 값 또는 해당 시점을 이상점으로 결정할 수 있다.
더하여, 이슈 검출장치는, 303 동작에서 설명한 이상점을 결정하는 방법에 한정하지 않고, 이상점을 결정하는 다양한 방법들, 그리고 상술한 바와 같이 이상 증감점을 결정하는 다양한 방법들 중 적어도 일부를 적용하여 차이에 기반하는 이상 증감점을 결정할 수 있음은 자명하다.
이슈 검출장치는, 303 동작을 수행하면, 도 3의 실시 예를 종료할 수 있고, 또는 도 1의 107 동작을 수행할 수 있다.
다시 도 1로 돌아가서, 이슈 검출장치는 발생되는 이슈들 중 중요이슈(hot issue)를 결정할 수 있다.
107 동작에서 이슈 검출장치는 시계열 데이터에 기반하여 검출된 이상점 및 이상 증감점에 기반하여 이슈를 결정한다. 이슈는, 이상점 및 이상 증감점에 기반하여 결정되는 시점 및 결정된 시점과 관련된 키워드 중 적어도 일부를 포함할 수 있다. 이슈 검출장치는, 이상점 및 이상 증감점에 기반하여 중요 이슈를 결정함에 있어서, 적어도 하나의 이슈 판정모델을 적용할 수 있다.
여기서, 이상점 및 이상 증감점은 이슈의 발생 시점으로 정의될 수 있다, 또한, 이슈 검출장치는 이슈를 결정함에 있어서, 시간 요소를 중요하게 고려하여 이슈를 결정할 수 있다. 예를 들면, 이슈 검출장치는, 이슈가 발생된 시점으로부터 지정된 시간 범위 내에 이상점 및 이상 증감점 중 적어도 일부가 중복되는 경우, 이슈가 발생된 시점으로부터 이상점 및 이상 증감점의 중복이 확인되는 시간 거리를 참조하여 해당 이슈를 중요 이슈로 결정할 확률을 처리할 수 있다.
본 발명의 일 실시 예에 따르면, 중요 이슈를 결정하는 종합판정모델을 아래 수학식(1)로 제공할 수 있다.
Figure pat00001
(1)
여기서,
Figure pat00002
는 검출된 이슈에 대한 종합판정값이다.
Figure pat00003
는 데이터의 카테고리로 입력되는 데이에 대하여 구분된 카테고리(
Figure pat00004
)에 대하여
Figure pat00005
=1, 2, 3…… 과 같이 설정될 수 있다.
Figure pat00006
는 현재 시점의 데이터 카테고리(
Figure pat00007
),
Figure pat00008
는 데이터의 카테고리에 따른 가중치(또는 가중치값)이다.
Figure pat00009
는 이슈가 감지된 현재 시점의 표본화 데이터 중 이슈감지 값이다.
Figure pat00010
는 과거
Figure pat00011
시점의 데이터 카테고리(
Figure pat00012
).
Figure pat00013
는 이슈가 감지된 과거
Figure pat00014
시점의 데이터 종류에 따른 가중치이다.
Figure pat00015
는 이슈가 감지된 과거
Figure pat00016
시점의 표본화 데이터 중 이슈감지 값이다. 또한,
Figure pat00017
는 현재시점과 과거
Figure pat00018
시점의 데이터 이질성에 대한 가중치로 수학식(2)로 제공될 수 있다.
Figure pat00019
(2)
또한,
Figure pat00020
와 관련하여 과거 이슈 발생 시점과의 시간차에 대한 가중치 함수를 수학식(3)로 제공할 수 있다.
Figure pat00021
(3)
여기서,
Figure pat00022
Figure pat00023
이고,
Figure pat00024
는 현재 시점과 과거
Figure pat00025
시점의 시간차이고, 시간차는 일수로 제공될 수 있다.
Figure pat00026
는 강조지수로
Figure pat00027
시점에서의 최대 가중치이다.
Figure pat00028
는 최적 시간차로 중요 이슈로 결정하기 위한 최적의 시간차이다. 이때, 최적의 시간차는 기 설정된 상태이며, 특정 시점 또는 지정된 시간범위로 제공될 수 있다.
Figure pat00029
는 유효 이슈 시간범위이다.
Figure pat00030
는 현재시점의 이슈감지일로, 이슈를 감지한 현재 시점이며, 날짜 또는 시각을 포함하여 제공될 수 있다.
Figure pat00031
는 과거
Figure pat00032
시점의 이슈감지일이다.
이슈 검출장치는, 수학식(1) 내지 수학식(3)에 기반하여 종합판정값(c)을 결정할 수 있고, 결정된 종합판정값(c)이 지정된 수치 이상인 것을 확인하는 경우 해당 이슈를 중요이슈로 결정할 수 있다.
이슈 검출장치는, 결정된 중요 이슈에 대하여 키워드를 검출할 수 있다. 예를 들면, 이슈 검출장치는, 중요 이슈에 대응되는 키워드 카테고리에 포함된 복수의 키워드 중 노출 빈도가 높게 나타난 키워드 중 적어도 일부를 중요 이슈의 키워드로 결정할 수 있다. 이슈 검출장치는, 결정된 중요 이슈 또는 중요 이슈의 키워드를 출력할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 과거 이슈발생 시점과 시간차에 대한 가중치를 나타내는 그래프(400)이다.
도 4 및 상술한 수학식(3)을 참조하면,
Figure pat00033
는 현재 시점에서
Figure pat00034
만큼의 과거시점(
Figure pat00035
Figure pat00036
의 가중치를 곱연산 처리하는 것으로 설명할 수 있다. 이때, 가중치의 크기는 도 4에 도시된 바와 같이 시간차가 커질수록 감소하고,
Figure pat00037
범위를 벗어나는 시점부터는 영향도가 사라지는 것으로 설명할 수 있다.
즉, 이슈 검출장치는 수학식(1)에 기반하여 종합판정값(c)을 산출함으로써 복수의 이종 카테고리에 대하여 과거 이슈 발생시점을 고려한 현재의 이슈 감지값을 결정할 수 있다. 예를 들어, 현재 시점에서 특정 이슈가 감지(
Figure pat00038
)되고 과거
Figure pat00039
시점의 이슈(
Figure pat00040
)가 있다면, 수학식(3)에 의하여 가중치의 최대값(
Figure pat00041
)을 결정하여 종합판정값(c)이 높게 산출될 수 있다. 즉, 이슈의 재현이 특정 시간 간격을 갖는 경우 현재의 종합판정의 강도가 강화되는 것이다. 반면, 수학식(3)에 의한 가중치가 낮게 결정되더라도 이슈가 반복적으로 검출되는 경우 수학식(1)은 종합판정값(c)을 증가시키게 된다.
또한, 수학식(3)에서 시간차(
Figure pat00042
) 이후 유효 이슈 시간범위(
Figure pat00043
)에 도달하는 과정 상에서는 종합판정값(c)이 감소하며 결국 유효 이슈 시간범위(
Figure pat00044
)를 벗어나는 경우 해당 특정 이슈는 중요 이슈에 대한 영향력이 제거될 수 있다.
또한, 상술한 바와 같이, 이슈 검출장치는, 시간에 기반하여 중요 이슈를 결정함으로써, 동시에 이종 카테고리(예: d=1, d=2 …)를 처리하여 다양한 카테고리에 대하여 발생되는 이슈를 검출하고, 복수의 카테고리와 관련하여 중요 이슈를 결정할 수 있다.
도 5는 본 발명의 일 실시 예에 따른 이슈 검출방법에서 입력된 데이터에 기반하여 생성되는 시계열 데이터 및 시계열 데이터를 구성하는 속성 데이터를 그래프로 나타낸 도면이다.
이슈 검출장치는, 시계열 데이터(500)에 포함되는 적어도 하나의 성분 데이터를 선택적으로 분리할 수 있다. 도 5에 도시된 바와 같이, 시계열 데이터(500)는, 시간의 흐름에 대하여 입력되는 다양한 카테고리의 정보가 정렬된 데이터로 설명될 수 있다. 시계열 데이터(500)는, 실시간으로 입력되는 데이터 또는 지정된 시간 범위에 대하여 적어도 하나의 시점에 대한 데이터를 수신하여 생성될 수 있다.
여기서 시계열 데이터(500)의 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 값으로 제공될 수 있다. 여기서 시간축은, 날짜와 시각 정보를 포함할 수 있다. 또한, 세로축은, 둘 이상의 카테고리에 대한 정보를 종합적으로 표시할 수 있고, 또는 선택적으로 지정된 카테고리의 정보를 표시할 수 있다.
시계열 데이터(500)에 기반하여, 복수의 성분 데이터를 검출할 수 있다. 일 실시 예에 따르면, 도 5에 도시된 바와 같이, 시계열 데이터(500)는, 주기성분 데이터(510), 트랜드성분 데이터(530) 및 임의성분 데이터(550)를 포함할 수 있다. 시계열 데이터(500)로부터 분리된 성분 데이터(510, 530, 550)는, 시계열 데이터와 마찬가지로 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 값으로 제공될 수 있다.
도 6은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터 및 시계열 데이터에 기반하여 처리된 이동평균 데이터를 그래프로 나타낸 도면이다.
이슈 검출장치는, 시계열 데이터(610)의 이동평균을 산출하고, 시계열 데이터에 대응되는 이동평균 데이터(630)를 표시(예: 그래프(600))할 수 있다. 이때, 이슈 검출장치는, 이동평균 데이터에 기반하여 시계열 데이터에 포함된 카테고리 각각에 대한 수치의 변화 또는 변화의 흐름을 확인할 수 있다. 여기서, 이슈 검출장치를 통해서 산출되는 이동평균은, 단순 이동평균, 가중 이동평균, 기하 이동평균, 누적 이동평균 및 지수 이동평균 중 적어도 하나의 이동평균 산출이 적용될 수 있다.
이동평균 데이터 또한, 시계열 데이터와 마찬가지로, 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 이동평균 값으로 제공될 수 있다.
도 7은 본 발명의 일 실시 예에 따른 이슈 검출방법에서 시계열 데이터에 기반하여 처리된 표본화 데이터를 그래프로 나타낸 도면이다.
이슈 검출장치는 이동평균 데이터(630)에 기반하여 표본화를 수행할 수 있다. 표본화 데이터는 도 7에 도시된 바와 같이, 단위 시간을 주기로 값을 가지도록 형성될 수 있다. 이슈 검출장치는, 표본화 데이터에 기반하여 데이터이 변화량을 확인할 수 있다.
표본화 데이터 또한, 시계열 데이터와 마찬가지로, 가로축은 시간축으로, 세로축은 적어도 하나의 카테고리에 대한 값으로 제공될 수 있다.
본 발명의 다양한 실시 예에 따르면, 이슈 검출방법은 상술한 바와 같이 적어도 하나의 장치(예: 이슈 검출장치)를 통하여 수행될 수 있다. 도 8은 본 발명의 일 실시 예에 따른 이슈 검출장치(800)의 구성 요소를 도시한다. 이슈 검출장치(800)는, 통신부(801), 입력부(803), 출력부(805), 저장부(807) 및 처리부(809) 중 적어도 하나의 구성 요소를 포함한다.
통신부(801)는 이슈 검출장치(800)와 외부의 통신을 연결할 수 있다. 예를 들면, 통신부(801)는 무선 통신 또는 유선 통신을 통해서 네트워크에 연결되며 외부장치와 통신할 수 있다. 통신부(801)는 연결된 적어도 하나의 외부장치로부터 데이터를 수신할 수 있다. 예를 들면, 통신부(801)는 시계열 데이터를 생성하기 위한 적어도 하나의 카테고리와 관련된 데이터를 외부장치로부터 수신할 수 있다.
입력부(803)는, 이슈 검출장치(800)에 입력되는 데이터를 처리하기 위한 정보 및/또는 제어명령을 입력하기 위한 구성 요소로서, 예를 들면, 키보드, 키패드, 터치 스크린, 적어도 하나의 버튼, 마이크 중 적어도 하나를 포함할 수 있다. 입력부(803)는 사용자의 조작에 대응하여 입력 데이터를 발생시킨다.
출력부(805)는, 처리부(809)를 통한 처리 결과를 출력할 수 있다. 예를 들면, 출력부(805)는 시계열 데이터, 시계열 데이터를 구성하는 적어도 하나의 성분 데이터, 이동평균 데이터, 표본화 데이터, 결정된 중요 이슈, 및 그와 관련된 정보 중 적어도 일부를 출력할 수 있다. 일 실시 예에 따르면, 출력부(805)는 디스플레이 및 스피커 중 적어도 하나의 장치를 포함할 수 있다.
출력부(805)가 디스플레이로 구비되는 경우, 처리부(809)를 통해서 디스플레이에 전송되는 데이터는 사용자 그래픽 인터페이스(graphic user interface)로 표시될 수 있다. 또한, 출력부(805)가 스피커로 구비되는 경우, 처리부(809)를 통해서 스피커에 전송되는 데이터는 오디오로 출력할 수 있다.
저장부(807)는, 처리부(809) 또는 다른 구성 요소들로부터 수신되거나 생성된 명령 및/또는 데이터를 저장할 수 있다. 저장부(807)는, 예를 들면, 커널, 미들웨어, 어플리케이션 프로그래밍 인터페이스(API: application programming interface) 또는 어플리케이션 등의 프로그래밍 모듈들을 포함할 수 있다. 상술한 각각의 프로그래밍 모듈들은 소프트웨어, 펌웨어, 하드웨어 또는 이들 중 적어도 둘 이상의 조합으로 저장부(709)에 저장될 수 있다.
더하여, 저장부(807)는, 통신부(801) 및/또는 입력부(803)를 통해서 입력되는 데이터가 저장되며, 처리부(809)를 통하여 처리되는 데이터, 키워드, 시계열 데이터, 적어도 하나의 성분 데이터, 이동평균 데이터, 표본화 데이터, 중요 이슈 및 그와 관련된 정보 중 적어도 일부가 저장될 수 있다.
처리부(809)는, 전술한 다른 구성 요소들(예: 통신부(801), 입력부(803), 출력부(805) 및 저장부(807))로부터 데이터를 수신하여, 수신한 데이터를 확인하고, 확인된 데이터의 처리를 실행할 수 있다.
일 실시 예에 따르면, 처리부(809)는, 통신부(801) 또는 입력부(803)를 통해서 입력되는 데이터를 확인할 수 있다. 처리부(809)는, 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하고, 생성된 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하고, 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 중요 이슈로 결정할 수 있다.
또한, 처리부(809)는, 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분 데이터, 추세성분 데이터, 임의성분 데이터 및 상기 시계열 데이터 각각의 이동평균 성분 데이터 중 적어도 하나의 성분에 대한 데이터를 처리할 수 있다.
또한, 처리부(809)는, 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태를 이상 트랜드로 결정할 수 있다.
또한, 처리부(809)는, 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 이상 트랜드로 결정할 수 있다.
또한, 처리부(809)는, 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 중요 이슈로 결정할 수 있다.
또한 처리부(809)는, 결정된 중요 이슈에 대하여 키워드를 검출할 수 있다. 예를 들면, 처리부(809)는, 결정된 중요 이슈에 대응되는 시점의 키워드 카테고리에 포함된 복수의 키워드 중 노출 빈도가 높게 나타난 키워드 중 적어도 일부를 중요 이슈의 키워드로 결정할 수 있다.
본 발명의 일 실시 예에 따르면, 처리부(809)는 논리적 또는 물리적인 복수개의 구성 요소로 분리 형성될 수 있다. 이때, 처리부(809)의 세부 구성 요소들이 물리적으로 구분되는 경우, 각각의 세부 구성 요소들은 별도의 모듈 형태로 제공될 수 있고, 또는 둘 이상의 모듈이 연결된 하나의 모듈로 구성될 수 있다.
이슈 검출장치(800)와 연결되는 외부장치는, 이슈 검출장치(800)와 동일 또는 유사한 장치로 제공될 수 있다. 또한, 외부장치는, 이슈 검출장치(800)와 마찬가지로 다양한 장치들 중 하나 또는 그 이상의 조합으로 구성될 수 있다. 예를 들어, 장치는 기재된 장치들 중 적어도 일부, 또는 장치의 기능 중 적어도 일부를 포함하는 구조물로 제공될 수도 있다.
상술한 바에 따르면, 본 발명의 다양한 실시 예에 따른 이슈 검출방법은, 수집된 정보(데이터)에 기반하여 다양한 카테고리에 대한 시계열 데이터를 분석함으로써 중요 이슈의 검출 성능을 향상시킬 수 있다.
또한, 본 발명의 다양한 실시 예에 따른 이슈 검출방법은, 발생되는 복수의 이슈들에 대하여 이슈의 검출 시점에 기반하여 중요 이슈를 결정함으로써, 실시간 또는 과거 발생된 이슈의 중요 여부에 한정하지 않고, 발생된 이슈 또는 결정된 중요 이슈와 연관된 다양한 정보들을 효과적으로 판단할 수 있다.
또한, 본 발명의 다양한 실시 예에 따른 이슈 검출방법은, 둘 이상의 시점에 대하여 발생된 이슈의 연관성을 판단하여 중요 이슈의 중요 여부를 효과적으로 판단할 수 있다.
다양한 실시 예에 따르면, 본 발명의 청구항 및/또는 명세서에 기재된 다양한 실시 예에 따른 장치, 방법의 적어도 일부는, 하드웨어, 소프트웨어, 펌웨어, 또는 하드웨어, 소프트웨어 및 펌웨어 중 둘 이상의 조합을 포함하는 형태(예: 모듈, unit)로 구현될(implemented) 수 있다.
모듈은, 일체로 구성된 부품의 최소 단위 또는 그 일부로서 본 발명의 다양한 실시 예를 수행하는 최소 단위 또는 그 일부가 될 수도 있다. 모듈은 기계적으로 또는 전자적으로 구현될 수 있다.
본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서 본 발명의 범위는 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
800 : 이슈 검출장치 801 : 통신부
803 : 입력부 805 : 출력부
807 : 저장부 809 : 처리부

Claims (10)

  1. 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하는 단계;
    상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하는 단계; 및
    상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계;를 포함하는, 트랜드 분석에 기반하는 이슈 검출방법.
  2. 제1항에 있어서,
    상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함하는, 트랜드 분석에 기반하는 이슈 검출방법.
  3. 제1항에 있어서,
    상기 이상 트랜드는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태인, 트랜드 분석에 기반하는 이슈 검출방법.
  4. 제1항에 있어서,
    상기 이상 트랜드를 검출하는 단계는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 검출하는, 트랜드 분석에 기반하는 이슈 검출방법.
  5. 제1항에 있어서,
    상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 단계는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 결정하는, 트랜드 분석에 기반하는 이슈 검출방법.
  6. 적어도 하나의 외부장치와 통신하는 통신부; 및
    상기 통신부를 통해서 상기 외부장치로부터 입력되는 데이터에 기반하여 둘 이상의 카테고리에 대한 시계열 데이터를 생성하고, 상기 시계열 데이터에 포함된 성분 데이터에 기반하여 이상 트랜드를 검출하고, 상기 이상 트랜드가 발생된 적어도 둘 이상의 시점에 기반하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는 처리부;를 포함하는, 트랜드 분석에 기반하는 이슈 검출장치.
  7. 제6항에 있어서,
    상기 성분 데이터는, 상기 시계열 데이터 각각에 대하여, 대응되는 카테고리의 주기성분, 추세성분, 임의성분 및 상기 시계열 데이터 각각의 이동평균 성분 중 적어도 하나의 성분에 대한 정보를 포함하는, 트랜드 분석에 기반하는 이슈 검출장치.
  8. 제6항에 있어서,
    상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 시간 성분에 대응되는 값이 지정된 수치 범위를 벗어난 상태를 상기 이상 트랜드로 결정하는, 트랜드 분석에 기반하는 이슈 검출장치.
  9. 제6항에 있어서,
    상기 처리부는, 상기 둘 이상의 카테고리 중 적어도 하나에 대한 시계열 데이터에서 검출되는 이상점 및 이상증감량 중 적어도 하나를 상기 이상 트랜드로 검출하는, 트랜드 분석에 기반하는 이슈 검출장치.
  10. 제6항에 있어서,
    상기 처리부는, 상기 적어도 둘 이상의 시점 사이의 거리에 따른 시간 가중치 및 상기 카테고리의 동일성에 따른 동일성 가중치 중 적어도 하나의 가중치를 적용하여 상기 둘 이상의 시점에 지정된 복수의 키워드 중 일부를 이슈로 결정하는, 트랜드 분석에 기반하는 이슈 검출장치.
KR1020170050602A 2017-04-19 2017-04-19 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치 KR101924352B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170050602A KR101924352B1 (ko) 2017-04-19 2017-04-19 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170050602A KR101924352B1 (ko) 2017-04-19 2017-04-19 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20180117460A true KR20180117460A (ko) 2018-10-29
KR101924352B1 KR101924352B1 (ko) 2019-02-20

Family

ID=64101553

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170050602A KR101924352B1 (ko) 2017-04-19 2017-04-19 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR101924352B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612671A (zh) * 2020-12-16 2021-04-06 深圳前海微众银行股份有限公司 系统监控方法、装置、设备及存储介质
CN112651539A (zh) * 2019-10-12 2021-04-13 富士通株式会社 信息处理装置和信息处理方法
CN112650830A (zh) * 2020-11-17 2021-04-13 北京字跳网络技术有限公司 关键词提取方法、装置、电子设备和存储介质
KR102344804B1 (ko) * 2021-10-19 2021-12-29 주식회사 큐로드 인공지능 기반 모니터링 기술을 이용한 유저 피드백 정보 관리방법
KR20220019576A (ko) * 2020-08-10 2022-02-17 네이버 주식회사 급상승 검색어에 대한 정보 제공 방법 및 시스템
CN117056663A (zh) * 2023-10-13 2023-11-14 腾讯科技(深圳)有限公司 一种数据处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081491A (ja) * 2009-10-05 2011-04-21 Nec Biglobe Ltd 時系列分析装置、時系列分析方法、及びプログラム
JP2011141801A (ja) * 2010-01-08 2011-07-21 Internatl Business Mach Corp <Ibm> キーワードの時系列解析のための処理方法、並びにその処理システム及びコンピュータ・プログラム
KR20140139466A (ko) 2014-11-12 2014-12-05 변동삼 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081491A (ja) * 2009-10-05 2011-04-21 Nec Biglobe Ltd 時系列分析装置、時系列分析方法、及びプログラム
JP2011141801A (ja) * 2010-01-08 2011-07-21 Internatl Business Mach Corp <Ibm> キーワードの時系列解析のための処理方法、並びにその処理システム及びコンピュータ・プログラム
KR20140139466A (ko) 2014-11-12 2014-12-05 변동삼 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651539A (zh) * 2019-10-12 2021-04-13 富士通株式会社 信息处理装置和信息处理方法
KR20220019576A (ko) * 2020-08-10 2022-02-17 네이버 주식회사 급상승 검색어에 대한 정보 제공 방법 및 시스템
CN112650830A (zh) * 2020-11-17 2021-04-13 北京字跳网络技术有限公司 关键词提取方法、装置、电子设备和存储介质
CN112650830B (zh) * 2020-11-17 2021-11-26 北京字跳网络技术有限公司 关键词提取方法、装置、电子设备和存储介质
CN112612671A (zh) * 2020-12-16 2021-04-06 深圳前海微众银行股份有限公司 系统监控方法、装置、设备及存储介质
KR102344804B1 (ko) * 2021-10-19 2021-12-29 주식회사 큐로드 인공지능 기반 모니터링 기술을 이용한 유저 피드백 정보 관리방법
CN117056663A (zh) * 2023-10-13 2023-11-14 腾讯科技(深圳)有限公司 一种数据处理方法、装置、电子设备及存储介质
CN117056663B (zh) * 2023-10-13 2024-02-13 腾讯科技(深圳)有限公司 一种数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
KR101924352B1 (ko) 2019-02-20

Similar Documents

Publication Publication Date Title
KR101924352B1 (ko) 트랜드 분석에 기반하는 이슈 검출방법 및 그 장치
CN110390408B (zh) 交易对象预测方法和装置
JP2020123401A (ja) 資産情報のディスプレイ方法
US11620474B2 (en) Model reselection for accommodating unsatisfactory training data
CN113099475B (zh) 网络质量检测方法、装置、电子设备及可读存储介质
US11017330B2 (en) Method and system for analysing data
CN114978877B (zh) 一种异常处理方法、装置、电子设备及计算机可读介质
CN110956278A (zh) 重新训练机器学习模型的方法和系统
CN110880128A (zh) 异常信息挖掘方法、装置、系统及终端设备
CN117745355A (zh) 基于移动端的广告发布系统及发布方法
CN115204733A (zh) 数据审计方法、装置、电子设备及存储介质
US10169707B1 (en) System and method for generating predictions of geopolitical events
CN114203200A (zh) 一种语音质检方法、装置、计算机设备和存储介质
O'Brien et al. EWSmethods: an R package to forecast tipping points at the community level using early warning signals, resilience measures, and machine learning models
CN117132169A (zh) 电力人工智能模型调用评价方法及系统
CN111178421B (zh) 检测用户状态的方法、装置、介质以及电子设备
CA3035539A1 (en) Systems and methods for measuring collected content significance
KR20190061317A (ko) 주식 정보 제공 방법
US20100042446A1 (en) Systems and methods for providing core property review
CN113689020A (zh) 业务信息预测方法、装置、计算机设备和存储介质
JP2017138708A (ja) スカラ特徴量によって時系列変化点を検出可能なプログラム、装置及び方法
CN113377640B (zh) 解释业务场景下模型的方法、介质、装置和计算设备
CN111416744B (zh) 互联网线上监控报警的方法及装置
CN109284354B (zh) 脚本搜索方法、装置、计算机设备及存储介质
US20210097414A1 (en) User Interface System Incorporating Analysis of User Interaction Classification

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant