KR20150083165A - 시간의 흐름에 따른 오피니언 분석 시스템 및 방법 - Google Patents

시간의 흐름에 따른 오피니언 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20150083165A
KR20150083165A KR1020140002410A KR20140002410A KR20150083165A KR 20150083165 A KR20150083165 A KR 20150083165A KR 1020140002410 A KR1020140002410 A KR 1020140002410A KR 20140002410 A KR20140002410 A KR 20140002410A KR 20150083165 A KR20150083165 A KR 20150083165A
Authority
KR
South Korea
Prior art keywords
opinion
text information
analyzing
analysis
text
Prior art date
Application number
KR1020140002410A
Other languages
English (en)
Inventor
조요한
김현기
류법모
오효정
윤여찬
이충희
임수종
장명길
최미란
최윤재
허정
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020140002410A priority Critical patent/KR20150083165A/ko
Priority to US14/257,265 priority patent/US20150193529A1/en
Publication of KR20150083165A publication Critical patent/KR20150083165A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 시간의 흐름에 따른 오피니언 변화를 분석하고 분석 결과를 제시하는 시간 흐름에 따른 오피니언 분석 시스템 및 방법에 관한 것이다.
본 발명의 일면에 따른 시간의 흐름에 따른 오피니언 분석 서버는 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 수신하는 통신부와, 통신부가 수신한 오피니언 분석 요청 신호에 따라 데이터베이스로부터 키워드를 포함하는 텍스트 정보를 수집하는 수집부 및 통신부가 수신한 오피니언 분석 요청 신호에 따라 수집부가 수집한 텍스트 정보를 분석하는 오피니언 분석부를 포함한다.

Description

시간의 흐름에 따른 오피니언 분석 시스템 및 방법{SYSTEM AND METHOD FOR ANALYZING OPINION TIME SERIES}
본 발명은 시간의 흐름에 따른 오피니언 변화를 분석하고 분석 결과를 제시하는 시간의 흐름에 따른 오피니언 분석 시스템 및 방법에 관한 것이다.
블로그, 트위터, 페이스북 등 소셜미디어 사용자가 급격히 증가함에 따라, 특정 이벤트, 제품, 정책 등에 관한 오피니언(감정)을 표현하는 글 역시 기하급수적으로 증가하고 있다.
이러한 오피니언은 이벤트 또는 제품을 기획하는 기업이나, 정책을 세우는 기관의 전략 기획에 있어 중요한 요소이다.
특히, 시간의 흐름에 따라 변화하는 오피니언의 예로서 기업 이미지 변화를 파악하여 마케팅 전략을 세우거나, 정책에 관한 여론 분석을 통하여 적절한 대응 전략을 마련하는 것이 일반적이다.
뿐만 아니라, 선거 기간에는 후보들에 대한 긍정 또는 부정 이미지가 소셜미디어에 나타나게 되고, 이러한 이미지를 분석하여 뉴스 기사에 활용하기도 한다.
이러한 대량의 오피니언에 대한 분석은 소규모의 표본집단을 대상으로 하는 기존 여론 방식의 대안으로 제시되어 높은 신뢰성이 있는 바, 다양한 분야에 적용이 가능할 것으로 예상된다.
그러나, 오피니언 분석 방법은 그 필요성에도 불구하고, 종래 기술은 시간의 흐름에 따라 다양한 오피니언이 어떻게 변화하는지 분석하고, 분석 결과에 대한 근거를 제시하지 못하는 문제점이 있다.
본 발명의 목적은 오피니언의 변화 추이를 분석하고, 텍스트 및 이미지를 이용하여 오피니언 분석 결과에 대한 근거를 제시함으로써, 대용량의 텍스트로부터 분석한 오피니언 정보 및 시간의 흐름에 따른 오피니언 변화를 직관적으로 인식하는 것이 가능한 시간의 흐름에 따른 오피니언 분석 시스템 및 방법을 제공하는 데 목적이 있다.
본 발명의 일면에 따른 시간의 흐름에 따른 오피니언 분석 서버는 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 수신하는 통신부와, 통신부가 수신한 오피니언 분석 요청 신호에 따라 데이터베이스로부터 키워드를 포함하는 텍스트 정보를 수집하는 수집부 및 통신부가 수신한 오피니언 분석 요청 신호에 따라 수집부가 수집한 텍스트 정보를 분석하는 오피니언 분석부를 포함하는 것을 특징으로 한다.
또한, 본 발명의 다른 면에 따른 시간의 흐름에 따른 오피니언 분석 방법은 오피니언 분석 대상에 대한 키워드를 설정하는 키워드 설정 단계와, 오피니언 분석 대상에 대한 검색 기간을 설정하는 기간 설정 단계와, 키워드 설정 단계 및 기간 설정 단계에서 설정한 키워드 및 기간에 따라 키워드를 포함하는 오피니언에 대한 텍스트 정보를 분석하는 설정 기간 내 키워드 관련 오피니언 분석 단계 및 그래프 및 요약 텍스트를 오피니언의 분석 단계의 분석 결과의 근거로 제시하는 그래프 및 요약 텍스트 제시 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 또 다른 면에 따른 시간의 흐름에 따른 오피니언 분석 시스템은 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 송신하는 사용자 단말 및 사용자 단말로부터 오피니언 분석 요청 신호를 수신하고, 데이터베이스로부터 키워드를 포함하는 텍스트 정보를 수집하고, 수집한 텍스트 정보를 분석하여 요약 텍스트를 생성하는 오피니언 분석 서버를 포함하는 것을 특징으로 한다.
본 발명에 따른 시간의 흐름에 따른 오피니언 분석 시스템 및 방법은 입력된 키워드 및 설정된 기간에 따라 오피니언 변화 추이를 분석하여 제시함으로써, 대중 속에서 인식되는 이벤트, 브랜드 및 인물의 이미지에 대한 오피니언 변화를 직관적으로 파악하도록 하는 효과가 있다.
또한, 본 발명에 따르면 특정 제품 또는 서비스에 대한 사용자들의 만족도에 대하여 용이하게 파악할 수 있는 효과가 있고, 특정 정책에 대한 여론의 변화 과정을 추적하는 것이 가능하여, 마케팅 또는 위기 대응 전략에 적용할 수 있는 효과가 있다.
또한, 본 발명에 따르면 오피니언을 분석하여 오피니언 변화 추이를 분석하여 제공함에 있어서 그 근거로서 텍스트 혹은 이미지를 제공하므로, 다양한 오피니언에 대한 근거를 파악할 수 있으며, 요약 텍스트 또는 이미지를 제공하여 대표적인 오피니언의 구체적인 내용 또는 해당 이미지를 용이하게 파악하도록 하는 효과가 있다.
본 발명의 효과는 이상에서 언급한 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 시스템을 나타내는 블록도.
도 2는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 시스템의 사용자 단말기를 나타낸 블록도.
도 3은 본 발명에 따른 오피니언 분석 서버를 나타낸 블록도.
도 4는 본 발명에 따른 오피니언 분석 결과를 나타내는 예시도.
도 5 및 도 6는 본 발명에 따른 단일 오피니언의 변화량 그래프를 나타내는 예시도.
도 7은 본 발명에 따른 다수 오피니언의 변화량 그래프를 나타내는 예시도.
도 8 내지 10은 본 발명에 따른 요약 텍스트의 예시도.
도 11은 본 발명에 따른 요약 이미지의 예시도.
도 12는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 결과에 대한 예시도.
도 13은 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법을 나타낸 순서도.
도 14는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법의 대표 문서 선정 과정을 나타낸 순서도.
도 15는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법의 대표 뉴스 기사 제목 추출 과정을 나타낸 순서도.
이하에서는 도면을 참조하면서, 본 발명의 바람직한 실시예들을 구체적으로 설명한다.
도 1은 본 발명의 일면에 따른 시간의 흐름에 따른 오피니언 분석 시스템을 나타내는 블록도이다.
도 1을 참조하면, 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 시스템은 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 송신하는 사용자 단말(100) 및 사용자 단말(100)로부터 오피니언 분석 요청 신호를 수신하고, 데이터베이스(300)로부터 키워드를 포함하는 텍스트 정보를 수집하고, 수집한 텍스트 정보를 분석하여 요약 텍스트를 생성하는 오피니언 분석 서버(200)를 포함한다.
이 때, 사용자 단말(100)은 사용자의 메뉴 또는 키(key)조작을 입력 받아 웹 브라우저 또는 전용 어플리케이션을 통해 오피니언 분석 대상 키워드 및 기간을 설정하여 오피니언 분석 요청 신호를 요청하고, 오피니언 분석 요청 신호 송신의 결과로 대상 키워드 및 기간에 대한 오피니언 분석 결과를 제공 받는다.
또한, 오피니언 분석 서버(200)는 오피니언 분석 대상 키워드 및 기간 설정에 따라 오피니언을 분석하고, 오피니언 분석 결과에 대한 요약 텍스트 또는 요약 이미지를 생성하여, 그 결과를 사용자 단말(100)에 송신한다.
이 때, 오피니언 분석 서버(200)는 데이터베이스(300)로부터 텍스트 또는 이미지를 수집한다.
도 2는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 시스템의 사용자 단말(100)의 블록도로서, 도 1 및 2를 참조하면, 사용자 단말(100)의 통신부(110)는 통신망을 통하여 오피니언 분석 서버(200)와 데이터를 송수신하고, 입력부(120)는 사용자로부터 웹 브라우저 또는 전용 어플리케이션 실행 신호, 키워드 및 기간 설정 신호를 수신한다.
또한, 제어부(130)는 입력부(120)를 통하여 수신한 웹 브라우저 또는 전용 어플리케이션 실행 신호에 따라 웹 브라우저 또는 전용 어플리케이션을 활성화하고, 오피니언 분석 요청 신호를 오피니언 분석 서버(200)로 송신하고, 표시부(140)는 오피니언 분석 서버(200)로부터 제공받은 오피니언 분석 결과를 표시하며, 제어부(130)는 오피니언 분석 서버(200)로부터 제공받은 오피니언 분석 결과를 저장한다.
도 3은 본 발명에 따른 오피니언 분석 서버(200)를 나타낸 블록도로서, 도 3을 참조하면, 오피니언 분석 서버(200)는 사용자 단말(100)과 연동하여 사용자 단말(100)로부터 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 수신하는 통신부(210)와, 통신부(210)가 수신한 오피니언 분석 요청 신호에 따라 데이터베이스(300)로부터 키워드를 포함하는 문서, 텍스트 정보 및 이미지를 수집하는 수집부(220)와, 수집한 문서 또는 텍스트 정보를 대상으로 오피니언 분석을 수행하는 오피니언 분석부(230)와, 오피니언 분석부(230)의 분석 수행 결과와 관련된 요약 텍스트 및 요약 이미지를 생성하는 요약 텍스트 생성부(240) 및 요약 이미지 생성부(240)를 포함한다.
오피니언(다양한 종류의 감성 또는 의견) 분석 대상이 되는 텍스트 정보는 뉴스, 블로그 트위터, 페이스북 등 자연어로 기술된 모든 웹 데이터로부터 수집된다.
본 발명의 일 실시예에 따른 오피니언 분석 서버(200)는 카테고리 별로 기설정된 핵심단어와 상기 수집부(220)가 수집한 텍스트 정보가 포함하는 단어를 비교하여, 핵심단어 및 텍스트 정보가 포함하는 단어의 일치 횟수가 기설정값 이상인 경우 텍스트 정보를 해당 카테고리로 분류하고, 카테고리 별 텍스트 정보의 양을 수치화하여 텍스트 정보를 분석한다.
그러나, 상술한 일 실시예는 당업자의 이해를 돕기 위하여 본 발명에 따른 오피니언 분석 서버(200)의 오피니언 분석의 일 실시예를 설명한 것으로서, 본 발명에 따른 오피니언 분석이 일 실시예에 한정되는 것은 아니다.
오피니언은 긍정, 부정 두 카테고리로 분류될 수도 있고, 만족, 안심, 두려움, 실망 등 보다 세분화된 카테고리로 분류될 수도 있다.
오피니언 분석 서버(200)는 카테고리 별 텍스트 정보의 양을 수치화하여 텍스트 정보를 분석하는데, 만약 설정된 키워드를 포함하는 텍스트 정보의 ‘만족’ 카테고리로 분류되는 오피니언을 기설정된 기간(예: 한 시간, 하루) 단위로 수치화할 수 있다.
본 발명의 다른 실시예에 따른 오피니언 분석 서버(200)는 기계학습을 통해 학습된 오피니언 분류기(classifier)를 이용하여 블로그 포스트, 페이스북 상태 메시지, 트위터 트윗 등의 텍스트 정보 각각에 대하여 분류기를 사용하여 오피니언을 분류한 후, 임의의 시간 범위에 해당하는 텍스트 정보의 개수를 카운트하는 것 역시 가능하다.
그러나, 본 발명에 따른 오피니언 분석 서버(200)의 오피니언 분석은 상술한 예에 한정되는 것이 아니므로, 각 오피니언 카테고리 별로 절대적인 양을 수치화하는 것이 아니라, 임의의 시간 범위 내에서 각 오피니언 카테고리가 전체 오피니언에서 차지하는 비율을 이용하여 수치화(예: 25%, 40%)하는 것 역시 가능하다.
또한, 오피니언 분석 서버(200)는 오피니언 분석부(230)의 텍스트 정보 분석 결과에 따라서 시간에 따른 카테고리 별 텍스트 정보의 양에 대한 그래프를 생성한다.
오피니언 분석 서버(200)의 요약 텍스트 생성부(240)는 텍스트 정보의 분석 결과에 따라 수집한 텍스트 정보 중에서 대표 텍스트 정보를 선정하여 요약 텍스트를 생성하거나, 텍스트 정보 중 기설정된 횟수 이상으로 포함된 단어를 나열하여 요약 텍스트를 생성한다.
다른 실시예로서, 요약 텍스트 생성부(240)는 클러스터링 알고리즘을 이용하여 수집부(220)가 수집한 텍스트 정보를 클러스터링하고, 클러스터링된 텍스트 정보를 이용하여 요약 텍스트를 생성한다.
이 경우, 요약 텍스트 생성부(240)는 텍스트 정보를 단어 벡터 또는 형태소 벡터로 변환하여 클러스터링 알고리즘을 적용하거나, 모든 텍스트 정보에 대하여 Levenshtein distance와 같은 edit distance를 계산하여 클러스터링할 수 있다.
클러스터링 알고리즘을 적용하기 위하여 기설정된 클러스터 개수로 k-means 클러스터링을 사용할 수 있고, k-nearest neighbors 클러스터링을 사용할 수 도 있으며, hierarchical 클러스터링을 통해 클러스터의 개수를 동적으로 결정할 수도 있다.
오피니언 분석 서버(200)가 수집한 텍스트 정보 중에서 대표 텍스트 정보를 선정하는 경우, 클러스터의 중심(centroid)에 가장 가까운 텍스트 정보를 해당 클러스터의 대표 텍스트 정보로 선정하여 요약 텍스트를 생성한다.
오피니언 분석 서버(200)의 요약 이미지 생성부(240)는 수집부(220)가 수집한 데이터베이스(300) 중 키워드 연관 이미지 정보를 이용하여 요약 이미지를 생성한다.
사용자 단말(100)은 오피니언 분석 서버(200)로부터 분석 결과를 수신하여, 사용자 단말(100)의 표시부(140)는 도 4에 도시된 바와 같이 오피니언 변화 그래프 및 오피니언 요약(요약 텍스트 또는 요약 이미지)을 표시한다.
도 5 및 도 6은 본 발명에 따른 사용자 단말(100)의 표시부(140)가 표시하는 단일 오피니언의 변화량 그래프를 나타내는 예시도로서, 도 5는 단일 오피니언의 양의 증감 추이를 일별로 나타내는 그래프를 도시하며, x축은 날짜, y축은 수치를 나타내고, 도 6은 단일 오피니언 양의 증감 추이를 일별로 나타내나, 마우스가 원 위에 올라왔을 때에만 수치를 보여주고, 다른 경우에는 원의 크기로 증감을 표시한다.
도 7은 본 발명에 따른 다수 오피니언의 변화량 그래프를 나타내는 예시도로서, 기설정된 분석 대상 기간(예: 1일) 단위로 만족, 안심, 두려움, 실망으로 카테고리 분류된 오피니언의 증감 추이를 도시하여, 시간의 흐름에 따른 카테고리 간의 오피니언 변화 추이를 파악할 수 있는 효과가 있다.
즉, 도 7에 따른 그래프의 y축은 각 오피니언 카테고리의 절대적인 수치가 아닌, 전체 오피니언 중 각 오피니언 카테고리가 차지하는 상대적인 비율을 나타내며, 예를 들어 2013년 6월 1일 및 2013년 6월 2일을 비교하였을 때, ‘만족’과 ‘실망’ 카테고리가 차지하는 비율은 증가한 반면, ‘안심’, ‘두려움’ 카테고리가 차지하는 비율은 감소한다.
도 5 내지 도 7의 그래프는 1일 단위로 오피니언 증감 추이를 도시하였으나, 본 발명에 따른 오피니언 분석 대상 기간은 특정 시각부터 특정시각까지가 될 수 있고, 특정 날짜 단위가 될 수도 있다.
도 8 내지 10은 본 발명에 따른 오피니언 요약 텍스트의 예시도이다.
도 8을 참조하면, 오피니언 분석 대상 키워드는 ‘아시아나’이고, 분석 대상 기간은 2013년 7월 8일 이며, 키워드를 포함하고 ‘감동’ 카테고리에 해당하는 텍스트 정보 중 요약 텍스트를 도시한다.
또한, 도 9를 참조하면, 오피니언 분석 대상 키워드는 ‘아시아나’이고, 분석 대상 기간은 2013년 7월 8일 이며, 키워드를 포함하고 ‘감동’ 카테고리에 해당하는 텍스트 정보 중 대표 뉴스 기사 제목을 요약 텍스트로 도시한다.
또한, 도 10을 참조하면, 오피니언 분석 대상 키워드는 ‘아시아나’이고, 분석 대상 기간은 2013년 7월 8일 이며, 키워드를 포함하고 ‘감동’ 카테고리에 해당하는 텍스트 정보 중 기설정된 횟수(예: 5회) 이상 포함된 단어(예: 아시아나, 사고, 승무원, 대응, 침착, 안전)를 나열하여 요약 텍스트로 제시한다.
도 11은 오피니언 요약 이미지의 예시도로서, 본 발명에 따른 요약 이미지 생성부(240)는 키워드(예: 아시아나), 분석 대상 기간(예: 2013년 7월 8일)에 대하여 수집한 이미지 정보 중 ‘감동’ 카테고리의 오피니언과 관련된 요약 이미지를 도시한다.
도 12는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 결과에 대한 예시도이다.
도 12를 참조하면, 사용자 단말(100)의 입력부(120)를 통하여 입력된 분석 대상 키워드는 ‘아시아나’이고, 분석 대상 기간은 2013년 7월 7일부터 2013년 7월 10일까지이다.
오피니언 분석 서버(200)의 수집부(220)는 데이터베이스(300)로부터 텍스트 정보(예: 트위터의 트윗)를 수집하고, 오피니언 분석부(230)는 텍스트 정보를 분석하고, 오피니언 변화 추이에 대한 그래프를 생성하고, 카테고리(안심, 슬픔, 감동, 두려움, 실망, 반대) 별 요약 텍스트를 생성하여 제시한다.
즉, 도 12에 따르면, 본 발명의 실시예에 따른 오피니언 분석부(230)의 트윗 분석 결과를 통하여, 그래프를 통해 샌프란시스코 공항에서 아시아나 항공기의 착륙 사고가 발생한 2013년 7월 7일, 즉 사고 당일 트위터 상에서 ‘안심’과 ‘슬픔’ 오피니언이 지배적이었음을 파악할 수 있다.
사용자 단말(100)의 표시부(140)를 통하여 분석 결과를 확인하는 사용자는 ‘안심’과 ‘슬픔’ 카테고리에 대한 요약 텍스트를 통하여 이러한 카테고리에 대한 오피니언이 지배적이 된 이유를 알 수 있는데, 인명피해가 적어 안심이라는 오피니언이 많았고, 사고 희생자에 대한 슬픔 오피니언이 많았음을 파악할 수 있다.
2013년 7월 8일은 사고 당일인 전날에 비하여 ‘두려움’ 및 ‘감동’ 카테고리에 속하는 오피니언이 급증하였음을 확인할 수 있으며, 이러한 카테고리에 대한 요약 텍스트에 따라서, 항공기 승무원들이 탑승자의 대피를 위하여 헌신한 모습이 감동적이었다는 오피니언과, 사고 피해자들의 외상후 스트레스 장애가 우려된다는 오피니언이 많았음을 확인할 수 있다.
그래프상 2013년 7월 9일은 ‘실망’ 카테고리에 속하는 오피니언이 급증하였음을 확인할 수 있는데, 이러한 카테고리에 대한 요약 텍스트에 따르면 희생자가 한국인이 아니어서 다행이라는 한 보도 매체의 실언으로 인하여 실망했다는 오피니언이 주를 이뤘음을 확인할 수 있다.
그래프상 7월 10일은 ‘반대’ 카테고리에 속하는 오피니언이 급증하였음을 확인할 수 있으며, 이러한 카테고리에 대한 요약 텍스트에 따르면 미 연방교통안전위원회가 항공사고 조사 내용을 섣부르게 공개한 것에 대해 국제 조종사 노조가 비판한 것이 오피니언의 주를 이뤘음을 확인할 수 있다.
도 12에 도시한 그래프 및 요약 텍스트를 포함하는 오피니언 분석 결과는 본 발명의 실시예에 대하여 당업자가 이해하기 쉽도록 하나의 예를 들어 설명한 것일 뿐, 본 발명의 오피니언 분석 방법의 구현은 이러한 예에 의하여 제한되지 아니한다.
도 13은 본 발명의 다른 면에 따른 시간의 흐름에 따른 오피니언 분석 방법을 나타낸 순서도이다.
도 13을 참조하면, 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법은 오피니언 분석 대상에 대한 키워드를 설정하는 키워드 설정 단계(S100)와, 오피니언 분석 대상에 대한 검색 기간을 설정하는 기간 설정 단계(S200)와, 키워드 설정 단계(S100) 및 기간 설정 단계(S200)에서 설정한 키워드 및 기간에 따라 키워드를 포함하는 오피니언에 대한 텍스트 정보를 분석하는 설정 기간 내 키워드 관련 오피니언 분석 단계(S300) 및 그래프 및 요약 텍스트를 오피니언의 분석 단계(S300)의 분석 결과의 근거로 제시하는 그래프 및 요약 텍스트 제시 단계(S400)를 포함한다.
오피니언 분석 단계(S300)는 설정된 기간 내에 작성되고, 설정된 키워드를 포함하는 텍스트 정보를 수집하고, 수집한 텍스트 정보를 기설정된 카테고리 별로 분류하고, 카테고리 별 텍스트 정보의 양을 수치화하여 텍스트 정보를 분석한다.
본 발명의 또 다른 실시예에 따른 오피니언 분석 단계(S300)는 수집된 텍스트 정보가 포함하는 단어 및 카테고리 별로 기설정된 단어의 일치 여부를 비교하여, 일치하는 횟수를 카운트하고, 일치하는 횟수가 기설정값 이상인 경우 텍스트 정보를 기설정된 단어와 대응하는 카테고리로 분류한다.
그러나, 상술한 오피니언 분석 단계의 실시예는 당업자의 이해를 돕기 위한 예시로서, 본 발명에 따른 오피니언 분석 단계(S300)가 이러한 예시에 한정되는 것은 아니다. 예를 들어, 오피니언 분석 단계(S300)는 기계학습을 통해 학습된 오피니언 분류기를 이용하여 블로그 포스트, 페이스북 상태 메시지, 트위터 트윗 등의 텍스트 정보 각각에 대하여 오피니언을 분류한 후, 임의의 시간 범위에 해당하는 텍스트 정보의 개수를 카운트하는 것 역시 가능하다.
본 발명에 따른 그래프 및 요약 텍스트 제시 단계(S400)는 오피니언 분석 단계(S300)의 분석 결과를 이용하여 시간에 따른 카테고리 별 텍스트 정보의 양에 대한 그래프를 생성하는데, 도 5 내지 도 7과 같이 시간에 따른 단일 오피니언의 변화 추이에 대한 그래프를 생성하거나, 복수의 오피니언의 변화 추이에 대한 그래프를 생성한다.
본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법은 키워드와 관련있는 이미지 정보를 데이터베이스로부터 수집하고, 오피니언 분석 단계(S300)의 분석 결과에 따라 요약 이미지를 생성하는 요약 이미지 제시 단계를 더 포함한다.
또한, 본 발명에 따른 그래프 및 요약 텍스트 제시 단계(S400)는 클러스터링 알고리즘을 이용하여 수집한 텍스트 정보를 클러스터링하고, 클러스터링된 텍스트 정보 중 대표 텍스트 정보를 선정하여 요약 텍스트로 제시하거나, 클러스터링된 텍스트 정보 중 기설정된 횟수 이상 포함된 단어를 나열하여 요약 텍스트로 제시한다.
상술한 그래프 및 요약 텍스트 제시 단계(S400)는 당업자의 이해를 돕기 위하여 예시를 들어 설명한 것으로서, 본 발명에 따른 그래프 및 요약 텍스트 제시 단계(S400)가 이러한 예시에 한정되는 것은 아니다.
도 14는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법의 대표 문서 선정 과정을 나타낸 순서도이고, 도 15는 본 발명에 따른 시간의 흐름에 따른 오피니언 분석 방법의 대표 뉴스 기사 제목 추출 과정을 나타낸 순서도이다.
도 14를 참조하면, 요약 텍스트 정보 생성을 위한 대표 문서 선정 과정은 키워드와 관련된 오피니언 관련 문서를 추출하는 단계(S311)와, 클러스터링 알고리즘을 이용하여 오피니언 관련 문서를 클러스터링하는 단계(S312)와, 클러스터 중 크기가 작거나 관련이 없는 문서를 필터링하는 단계(S313)와, 복수의 클러스터 중 각 클러스터를 대표하는 대표 문서를 선정하는 단계(S314) 및 대표 문서를 사용자에게 제시하는 단계(S315)를 포함한다.
대표 문서를 선정하는 단계는 클러스터의 중심(centroid)에 가장 가까운 문서를 대표 문서로 선정할 수 있다.
도 15를 참조하면, 요약 텍스트 정보 생성을 위한 대표 뉴스 기사 제목 선정 과정은 오피니언과 관련된 뉴스 기사를 추출하는 단계(S321)와, 클러스터링 알고리즘을 이용하여 뉴스 기사 제목을 클러스터링 하는 단계(S322)와, 클러스터 필터링하는 단계(S323)와, 복수의 클러스터 중 각 클러스터의 대표 제목을 선정하는 단계(S324) 및 선정된 대표 뉴스 기사 제목을 제시하는 단계(S325)를 포함한다.
이제까지 본 발명의 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100: 사용자 단말 200: 오피니언 분석 서버
300: 데이터베이스 110: 통신부
120: 입력부 130: 제어부
140: 표시부 150: 저장부
210: 통신부 220: 수집부
230: 오피니언 분석부 240: 요약 텍스트 생성부
250: 요약 이미지 생성부

Claims (19)

  1. 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 수신하는 통신부;
    상기 통신부가 수신한 오피니언 분석 요청 신호에 따라 데이터베이스로부터 상기 키워드를 포함하는 텍스트 정보를 수집하는 수집부; 및
    상기 통신부가 수신한 오피니언 분석 요청 신호에 따라 상기 수집부가 수집한 텍스트 정보를 분석하는 오피니언 분석부
    를 포함하는 시간의 흐름에 따른 오피니언 분석 서버.
  2. 제1항에 있어서, 상기 오피니언 분석부는
    상기 수집부가 수집한 텍스트 정보를 기설정된 카테고리 별로 분류하고, 상기 카테고리 별 텍스트 정보의 양을 수치화하여 상기 텍스트 정보를 분석하는 것
    인 시간의 흐름에 따른 오피니언 분석 서버.
  3. 제2항에 있어서, 상기 오피니언 분석부는
    상기 수집부가 수집한 텍스트 정보가 포함하는 단어와 상기 카테고리 별로 기설정된 핵심단어가 일치하는 횟수를 카운트하여 상기 텍스트 정보를 상기 카테고리 별로 분류하는 것
    인 시간의 흐름에 따른 오피니언 분석 서버.
  4. 제1항에 있어서,
    상기 오피니언 분석부의 텍스트 정보 분석 결과에 따라 요약 텍스트를 생성하는 요약 텍스트 생성부
    를 더 포함하는 시간의 흐름에 따른 오피니언 분석 서버.
  5. 제4항에 있어서, 상기 요약 텍스트 생성부는
    클러스터링 알고리즘을 이용하여 상기 수집부가 수집한 텍스트 정보를 클러스터링하고, 클러스터링된 상기 텍스트 정보를 이용하여 상기 요약 텍스트를 생성하는 것
    인 시간의 흐름에 따른 오피니언 분석 서버.
  6. 제1항에 있어서, 상기 수집부는 자연어로 기술된 웹 데이터로부터 상기 텍스트 정보를 수집하고, 상기 키워드와 연관있는 이미지 정보를 수집하는 것
    인 시간의 흐름에 따른 오피니언 분석 서버.
  7. 제6항에 있어서,
    상기 오피니언 분석부의 텍스트 정보 분석 결과에 따라 상기 수집부가 수집한 이미지 정보를 이용하여 요약 이미지를 생성하는 요약 이미지 생성부
    를 더 포함하는 시간의 흐름에 따른 오피니언 분석 서버.
  8. 오피니언 분석 대상에 대한 키워드를 설정하는 키워드 설정 단계;
    상기 오피니언 분석 대상에 대한 검색 기간을 설정하는 기간 설정 단계;
    상기 키워드 설정 단계 및 기간 설정 단계에서 설정한 키워드 및 기간에 따라 상기 키워드를 포함하는 오피니언에 대한 텍스트 정보를 분석하는 설정 기간 내 키워드 관련 오피니언 분석 단계; 및
    그래프 및 요약 텍스트를 상기 오피니언의 분석 단계의 분석 결과의 근거로 제시하는 그래프 및 요약 텍스트 제시 단계
    를 포함하는 시간의 흐름에 따른 오피니언 분석 방법.
  9. 제8항에 있어서, 상기 오피니언 분석 단계는
    상기 설정된 기간 내에 작성되고, 상기 설정된 키워드를 포함하는 상기 텍스트 정보를 수집하고, 상기 수집한 텍스트 정보를 기설정된 카테고리 별로 분류하고, 상기 카테고리 별 텍스트 정보의 양을 수치화하여 상기 텍스트 정보를 분석하는 것
    인 시간의 흐름에 따른 오피니언 분석 방법.
  10. 제9항에 있어서, 상기 오피니언 분석 단계는
    상기 수집된 텍스트 정보가 포함하는 단어 및 상기 카테고리 별로 기설정된 단어의 일치 횟수를 카운트하고, 상기 일치 횟수가 기설정값 이상인 경우 상기 텍스트 정보를 상기 기설정된 단어와 대응하는 카테고리로 분류하는 것
    인 시간의 흐름에 따른 오피니언 분석 방법.
  11. 제9항에 있어서, 상기 그래프 및 요약 텍스트 제시 단계는
    상기 오피니언 분석 단계의 분석 결과를 이용하여 시간에 따른 상기 카테고리 별 텍스트 정보의 양에 대한 그래프를 생성하는 것
    인 시간의 흐름에 따른 오피니언 분석 방법.
  12. 제8항에 있어서,
    상기 키워드와 연관되는 이미지 정보를 수집하고, 상기 오피니언 분석 단계의 분석 결과에 따라 요약 이미지를 생성하는 요약 이미지 제시 단계
    를 더 포함하는 시간의 흐름에 따른 오피니언 분석 방법.
  13. 제9항에 있어서, 상기 그래프 및 요약 텍스트 제시 단계는
    클러스터링 알고리즘을 이용하여 상기 수집한 텍스트 정보를 클러스터링하고, 클러스터링된 상기 텍스트 정보 중 대표 텍스트 정보를 선정하여 요약 텍스트로 제시하거나, 상기 클러스터링된 상기 텍스트 정보 중 기설정된 횟수 이상 포함된 단어를 나열하여 요약 텍스트로 제시하는 것
    인 시간의 흐름에 따른 오피니언 분석 방법.
  14. 오피니언 분석 대상 키워드 및 분석 대상 기간 정보를 포함하는 오피니언 분석 요청 신호를 송신하는 사용자 단말; 및
    상기 사용자 단말로부터 오피니언 분석 요청 신호를 수신하고, 데이터베이스로부터 상기 키워드를 포함하는 텍스트 정보를 수집하고, 상기 수집한 텍스트 정보를 분석하여 상기 요약 텍스트를 생성하는 오피니언 분석 서버
    를 포함하는 시간의 흐름에 따른 오피니언 분석 시스템.
  15. 제14항에 있어서, 상기 오피니언 분석 서버는
    상기 수집한 텍스트 정보를 기설정된 카테고리 별로 분류하고, 상기 카테고리 별 텍스트 정보의 양을 수치화하여 상기 텍스트 정보를 분석하는 것
    인 시간의 흐름에 따른 오피니언 분석 시스템.
  16. 제15항에 있어서, 상기 오피니언 분석 서버는
    상기 카테고리 별로 기설정된 핵심단어와 상기 수집한 텍스트 정보가 포함하는 단어를 비교하여, 상기 핵심단어 및 텍스트 정보가 포함하는 단어의 일치 횟수가 기설정값 이상인 경우 상기 텍스트 정보를 해당 카테고리로 분류하는 것
    인 시간의 흐름에 따른 오피니언 분석 시스템.
  17. 제14항에 있어서, 상기 오피니언 분석 서버는
    상기 텍스트 정보의 분석 결과에 따라 시간에 따른 상기 카테고리별 텍스트 정보의 양에 대한 그래프를 생성하는 것
    인 시간의 흐름에 따른 오피니언 분석 시스템.
  18. 제14항에 있어서, 상기 오피니언 분석 서버는
    상기 텍스트 정보의 분석 결과에 따라 상기 텍스트 정보 중 대표 텍스트 정보를 선정하여 상기 요약 텍스트를 생성하거나, 상기 텍스트 정보 중 기설정된 횟수 이상으로 포함된 단어를 나열하여 상기 요약 텍스트를 생성하는 것
    인 시간의 흐름에 따른 오피니언 분석 시스템.
  19. 제14항에 있어서, 상기 오피니언 분석 서버는
    상기 데이터베이스로부터 상기 키워드와 연관되는 이미지 정보를 수집하고, 상기 수집한 이미지 정보를 이용하여 요약 이미지를 생성하는 것
    인 시간의 흐름에 따른 오피니언 분석 시스템.
KR1020140002410A 2014-01-08 2014-01-08 시간의 흐름에 따른 오피니언 분석 시스템 및 방법 KR20150083165A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140002410A KR20150083165A (ko) 2014-01-08 2014-01-08 시간의 흐름에 따른 오피니언 분석 시스템 및 방법
US14/257,265 US20150193529A1 (en) 2014-01-08 2014-04-21 Opinion analyzing system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140002410A KR20150083165A (ko) 2014-01-08 2014-01-08 시간의 흐름에 따른 오피니언 분석 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20150083165A true KR20150083165A (ko) 2015-07-17

Family

ID=53495388

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140002410A KR20150083165A (ko) 2014-01-08 2014-01-08 시간의 흐름에 따른 오피니언 분석 시스템 및 방법

Country Status (2)

Country Link
US (1) US20150193529A1 (ko)
KR (1) KR20150083165A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018131955A1 (ko) * 2017-01-13 2018-07-19 영남대학교 산학협력단 디지털 컨텐츠를 분석하는 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9535974B1 (en) * 2014-06-30 2017-01-03 Palantir Technologies Inc. Systems and methods for identifying key phrase clusters within documents
US9619557B2 (en) 2014-06-30 2017-04-11 Palantir Technologies, Inc. Systems and methods for key phrase characterization of documents
GB201411912D0 (en) * 2014-07-03 2014-08-20 Realeyes O Method of collecting computer user data
CN109508416B (zh) * 2018-11-09 2021-11-23 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018131955A1 (ko) * 2017-01-13 2018-07-19 영남대학교 산학협력단 디지털 컨텐츠를 분석하는 방법

Also Published As

Publication number Publication date
US20150193529A1 (en) 2015-07-09

Similar Documents

Publication Publication Date Title
Settanni et al. Predicting individual characteristics from digital traces on social media: A meta-analysis
US20170206437A1 (en) Recognition training apparatus, recognition training method, and storage medium
US20150113018A1 (en) Interactive visual analytics for situational awareness of social media
WO2016168036A1 (en) Recommending user actions based on collective intelligence for a multi-tenant data analysis system
CN107077486A (zh) 情感评价系统和方法
US9583099B2 (en) Method and system for performing term analysis in social data
Sufi Identifying the drivers of negative news with sentiment, entity and regression analysis
KR20150083165A (ko) 시간의 흐름에 따른 오피니언 분석 시스템 및 방법
KR20130022042A (ko) 토픽별 오피니언과 소셜 영향력자를 기반으로 토픽을 탐지하고 추적하는 시스템 및 방법
CN106537387B (zh) 检索/存储与事件相关联的图像
KR102458510B1 (ko) 실시간 보완 가능한 마케팅 시스템
Diesner et al. Computational impact assessment of social justice documentaries
JP2015095249A (ja) ブランド診断方法及びそのシステム
Chaparro et al. Sentiment analysis of social network content to characterize the perception of security
KR20180010147A (ko) 사용자 맞춤식 가치 정보 검색 및 소셜 네트워크 구성 시스템 및 그 방법
Xia et al. Evaluation of the elderly health examination app based on the comprehensive evaluation method of AHP-fuzzy theory
CN107330076A (zh) 一种网络舆情信息展示系统及方法
Li Synesthetic design of digital elderly products based on big data
Pei et al. A new method for early detection of mass concern about public health issues
JP6696270B2 (ja) 情報提供サーバ装置、プログラム及び情報提供方法
Foote et al. A computational analysis of social media scholarship
Makhortykh et al. This Is What Pandemic Looks Like: Visual Framing of COVID-19 on Search Engines
Diesner et al. Computational assessment of the impact of social justice documentaries
Al Sailawi et al. Analyzing the Use of Social Media Data to Understand Long-Term Crisis Management Challenges of COVID-19
Park et al. Contextual Meaning-based Approach to Fine-grained Online Product Review Analysis for Product Design

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid