KR101074215B1 - 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법 - Google Patents
여론 분석 장치 및 문서 분석을 통한 여론 평가 방법 Download PDFInfo
- Publication number
- KR101074215B1 KR101074215B1 KR1020090016968A KR20090016968A KR101074215B1 KR 101074215 B1 KR101074215 B1 KR 101074215B1 KR 1020090016968 A KR1020090016968 A KR 1020090016968A KR 20090016968 A KR20090016968 A KR 20090016968A KR 101074215 B1 KR101074215 B1 KR 101074215B1
- Authority
- KR
- South Korea
- Prior art keywords
- emotional
- document
- vector value
- expression
- documents
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Abstract
Description
감성 표현이란, 이성(理性)에 대응되는 개념으로, 외계의 대상을 오관(五官)으로 감각하고 지각하여 표상을 형성하는 인간의 인식에 대한 표현을 의미한다. 상기 감성 표현은 시간과 공간에 따라 변화 가능한 것으로서, 예를 들면 "좋다"라는 표현은 시간과 공간에 따라 거의 변화가 없이 어떤 대상에 대하여 긍정적인 반응을 나타내는 감성표현으로 인정 가능하나, 인터넷의 발달과 세대별 언어습관의 변화로 "짱이다", "쉬크하다" 등도 현재에 맞는 긍정적인 감성표현으로 인정 가능한 것을 들 수 있다.
감성 벡터 값은 상기 감성표현에 대해 긍정의 정도 또는 부정의 정도를 나타내는 값을 말한다.
상기 주제별 구성 용어는 그 주제에 대하여 필수적 또는 대표적인 용어를 말한다.
유사문서란, 조사같은 의미상 불필요한 음절을 뺀 '의미형태소'의 비율 또는 해당 문서들에 포함된 시각적 정보가 비슷한 문서를 의미하고, 유사도란 복수 문서의 '의미형태소'의 비율 또는 시각적 정보 등이 비슷한 유사 정도를 말한다.
상기 유사도의 측정 방법은 종래 기술로서 다양하게 구현이 가능하고, 상기 유사문서 여부는 종래의 검색엔진에서 특정 키워드를 검색시 검색결과로 제시되는 문서가 유사할 경우 별도의 검색결과로 제공하지 않고, '유사한 결과'로 보여주거나 유사문서를 검색해주는 소프트웨어 등의 기술로 구현 가능하다.
상기 문서의 유사도 측정 및 유사문서 판단 기술은 이미 당업자에게 널리 알려진 기술로서 이에 대한 상세한 설명은 생략한다.
Claims (21)
- 주어진 주제에 대한 문서를 수집하는 문서 수집 모듈;상기 문서 수집 모듈에서 수집한 문서들 중에서 분석대상 유효 문서를 추출하는 유효 문서 추출 모듈;상기 유효 문서 추출 모듈에서 추출한 각 유효 문서에서 하나 이상의 감성 표현을 추출하고, 각 감성 표현의 감성벡터 값을 결정하는 내용 분석 모듈;및상기 내용 분석 모듈에서 결정한 각 감성표현의 감성벡터 값을 근거로 상기 주제에 대한 여론 평가 결과를 출력하는 여론 분석 모듈;을 포함하고,상기 내용 분석 모듈은 각 감성 표현이 포함된 문장에서 감성 표현의 강도를 표시하는 형태소의 존재 여부를 체크하여, 존재하는 경우에 그 강도에 따라 상기 추출한 감성벡터 값을 조절하여 해당 감성 표현의 최종 감성벡터 값을 결정하고, 존재하지 않은 경우에 상기 추출한 감성벡터 값을 해당 감성 표현의 최종 감성벡터 값으로 결정하는 것을 특징으로 하는 여론 분석 장치.
- 제1항에 있어서,주제별 복수의 구성 용어, 각 구성 용어에 대한 복수의 감성 표현 및 각 감성 표현에 대한 감성벡터 값이 매핑되어 있는 감성 사전이 저장된 데이터베이스를 더 포함하는 것을 특징으로 하는 여론 분석 장치.
- 제1항에 있어서,상기 문서 수집 모듈은,사용자 요청 또는 지정된 스케줄에 따라 상기 주제에 대한 문서 수집 명령을 발생시키는 스케줄러;및상기 스케줄러의 문서 수집 명령에 의해 미리 등록된 사이트 또는 서버를 검색하여 상기 주제에 대한 문서 및 그 문서의 댓글 중 적어도 하나를 수집하는 문서 수집부;를 포함하는 여론 분석 장치.
- 제1항에 있어서,상기 유효 문서 추출 모듈은,상기 문서 수집 모듈에서 수집한 각 문서를 필터링하여 중복 또는 유사 문서를 제거하는 필터링부;를 포함하는 여론 분석 장치.
- 제4항에 있어서,상기 유효 문서 추출 모듈은,상기 필터링부를 통과한 문서 중에서 상기 주제와 일정 비율 이상의 유사도를 갖는 문서를 유효 문서로 추출하는 유효 문서 추출부;를 더 포함하는 여론 분석 장치.
- 제5항에 있어서,상기 유효 문서 추출부는 상기 필터링부를 통과한 문서를 형태소 분석하여 명사형의 용어를 추출하고, 상기 추출한 용어가 상기 주제의 구성 용어에 해당하는 비율이 일정 비율 이상인 문서의 경우 유효 문서로 추출하는 것을 특징으로 하는 여론 분석 장치.
- 제4항 또는 제5항에 있어서,상기 필터링부는,상기 문서 수집 모듈에서 수집한 각 문서별로 고유한 문서 식별정보를 생성하고, 문서간의 문서 식별정보를 비교하여 중복 또는 유사 문서를 필터링하는 문서 식별정보 필터링부;상기 문서 수집 모듈에서 수집한 각 문서에서 기 저장된 금칙어 사전을 근거로 금칙어를 추출하고, 상기 추출한 금칙어의 가중치를 합산한 값이 임계치를 초과하는 경우 그 문서를 필터링하는 금칙어 필터링부;상기 문서 수집 모듈에서 수집한 각 문서에서 일정값 이상의 유사도를 갖는 인용문서를 필터링하는 유사도 필터링부;중 적어도 하나를 포함하는 것을 특징으로 하는 여론 분석 장치.
- 제1항에 있어서,상기 내용 분석 모듈은,상기 유효 문서 추출 모듈에서 추출한 각 유효 문서를 문장 단위로 분리하는 문장 분리부;상기 문장 분리부에서 분리된 문장 단위의 형태소 분석을 수행하는 형태소 분석부;상기 형태소 분석부에서 분석된 형태소 중에서 기 저장된 감성 사전을 이용 하여 하나 이상의 감성 표현을 추출하는 감성 표현 추출부;상기 감성 표현 추출부에서 추출된 각 감성 표현의 감성벡터 값을 결정하는 감성벡터 값 결정부;및유효 문서별 각 감성 표현에 대해 상기 결정된 감성벡터 값이 표시된 감성 표현 리스트를 생성하는 감성 표현 리스트 생성부;를 포함하는 여론 분석 장치.
- 삭제
- 제8항에 있어서,상기 감성 표현 리스트는 감성 표현의 대상, 감성 표현, 감성벡터 값이 매핑된 형태인 것을 특징으로 하는 여론 분석 장치.
- 제1항에 있어서,상기 여론 분석 모듈은, 각 유효 문서의 감성표현에 대한 감성벡터 값을 종 합하여 찬반 의견으로 분류함으로써 상기 주제에 대한 여론을 평가하는 여론 분석 장치.
- 문서 분석을 통해 여론을 분석하는 장치의 여론 평가 방법에 있어서,(a)주어진 주제에 대한 문서를 수집하는 단계;(b)상기 수집한 문서들을 필터링하여 유효 문서를 추출하는 단계;(c)상기 추출한 각 유효 문서에서 하나 이상의 감성 표현을 추출하는 단계;(d)상기 추출한 각 감성 표현의 감성벡터 값을 결정하는 단계;및(e)상기 각 감성 표현의 감성벡터 값을 근거로 상기 주제에 대한 여론 평가 결과를 출력하는 단계;를 포함하고,상기 (d)단계는 각 감성 표현이 포함된 문장에서 감성 표현의 강도를 표시하는 형태소의 존재 여부를 체크하여, 존재하는 경우에 그 강도에 따라 상기 추출한 감성벡터 값을 조절하여 해당 감성 표현의 최종 감성벡터 값을 결정하고, 존재하지 않은 경우에 상기 추출한 감성벡터 값을 해당 감성 표현의 최종 감성벡터 값으로 결정하는 것을 특징으로 하는 문서 분석을 통한 여론 평가 방법.
- 제12항에 있어서,상기(d) 단계는 상기 각 감성 표현에 대해 감성벡터 값이 표시된 감성 표현 리스트를 생성하는 단계를 포함하며,상기 (e) 단계는 상기 감성 표현 리스트를 근거로 상기 주제에 대한 여론 평가 결과를 생성하는 단계를 포함하는 문서 분석을 통한 여론 평가 방법.
- 제12항에 있어서,상기 (a)단계는,사용자의 요청 또는 일정 주기로 미리 등록된 사이트 또는 서버를 검색하여 상기 주제에 대한 문서 및 그 문서의 댓글 중 적어도 하나를 수집하는 것을 특징으로 하는 문서 분석을 통한 여론 평가 방법.
- 제12항에 있어서,상기 (b)단계는,상기 수집된 문서들에 대해 문서 식별정보 필터링, 금칙어 필터링, 유사도 필터링 중 적어도 하나의 필터링을 수행하는 단계;를 포함하는 문서 분석을 통한 여론 평가 방법.
- 제15항에 있어서,상기 (b)단계는,상기 필터링을 통과한 문서를 제외한 나머지 문서를 형태소 분석하여 명사형의 용어를 추출하는 단계;상기 추출된 용어들이 상기 주제의 구성 용어에 해당하는 비율이 일정 비율 이상인지를 판단하는 단계; 및상기 판단결과 일정 비율 이상인 문서의 경우 유효 문서로 추출하는 단계;를 포함하는 문서 분석을 통한 여론 평가 방법.
- 제12항에 있어서,상기 (c)단계는,상기 추출한 각 유효 문서를 문장 단위로 분리하여 형태소 분석을 수행하는 단계;및기 저장된 감성 사전을 이용하여 상기 분석된 형태소 중에서 감성 표현을 추출하는 단계;를 포함하는 문서 분석을 통한 여론 평가 방법.
- 제12항에 있어서,상기 (d)단계는,상기 추출한 감성 표현의 대상을 확인하는 단계;기 저장된 감성 사전을 검색하여 상기 확인한 대상을 구성 용어로 하며, 상기 구성 용어에 정의된 감성 표현 중에서 상기 추출한 감성 표현에 대한 감성 벡터 값을 추출하는 단계;상기 추출한 감성 표현이 포함된 문장에서 감성 표현의 강도를 표시하는 형태소의 존재 여부에 따라 상기 추출한 감성 벡터 값을 조절하여 감성벡터 값을 결정하는 단계;및유효문서별 각 감성 표현에 대해 상기 결정된 감성벡터 값이 표시된 감성 표현 리스트를 생성하는 단계;를 포함하는 문서 분석을 통한 여론 평가 방법.
- 삭제
- 제12항에 있어서,상기 (e)단계는,각 유효 문서의 감성표현에 대한 감성벡터 값을 종합하여 찬반 의견으로 분류함으로써 상기 주제에 대한 여론을 평가하는 것을 특징으로 하는 문서 분석을 통한 여론 평가 방법.
- 제12항 내지 18항 및 제20항 중 어느 한 항의 문서 분석을 통한 여론 평가 방법을 프로그램으로 기록한 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090016968A KR101074215B1 (ko) | 2009-02-27 | 2009-02-27 | 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090016968A KR101074215B1 (ko) | 2009-02-27 | 2009-02-27 | 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100098014A KR20100098014A (ko) | 2010-09-06 |
KR101074215B1 true KR101074215B1 (ko) | 2011-10-14 |
Family
ID=43005042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090016968A KR101074215B1 (ko) | 2009-02-27 | 2009-02-27 | 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101074215B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180117944A (ko) * | 2017-04-20 | 2018-10-30 | 군산대학교산학협력단 | 객체 평판 마이닝 방법 및 장치 |
KR102020756B1 (ko) | 2018-10-23 | 2019-11-04 | 주식회사 리나소프트 | 머신러닝을 이용한 리뷰 분석 방법 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101322650B1 (ko) * | 2012-02-06 | 2013-10-28 | 주식회사 비엔알아이 | 분석 대상의 속성 분석 시스템 및 방법 그리고, 방법에 대한 컴퓨터프로그램을 저장한 기록 매체 |
WO2015105270A1 (ko) * | 2014-01-10 | 2015-07-16 | 에스케이플래닛 주식회사 | 사용자 장치, 그 제어 방법 및 그를 포함하는 감성 평가 시스템 |
KR102170535B1 (ko) * | 2014-01-13 | 2020-10-27 | 에스케이플래닛 주식회사 | 감성 분석을 통한 사용자 선호 기반의 검색 장치 및 방법 |
KR101663681B1 (ko) * | 2015-06-11 | 2016-10-14 | 주식회사 인포리언스 | 데이터 활용성 및 품질 평가장치, 기록매체 및 컴퓨터 프로그램 |
KR102146152B1 (ko) * | 2018-01-03 | 2020-08-28 | 세종대학교산학협력단 | 관능 평가 방법 및 그 장치 |
CN109800302A (zh) * | 2018-12-14 | 2019-05-24 | 深圳壹账通智能科技有限公司 | 基于循环神经网络算法的舆情预警方法、装置、终端及介质 |
CN109783815B (zh) * | 2018-12-28 | 2020-10-23 | 华南理工大学 | 一种多维度网络舆情大数据对比分析方法 |
CN110175733B (zh) * | 2019-04-01 | 2023-07-11 | 创新先进技术有限公司 | 一种舆论信息处理方法和服务器 |
CN113220823B (zh) * | 2020-01-21 | 2024-03-01 | 北京中科闻歌科技股份有限公司 | 一种面向社交媒体公共言论的情感、话题及观点分析方法和装置 |
KR102545924B1 (ko) | 2020-11-25 | 2023-06-20 | 한국수력원자력 주식회사 | 설문응답의 분석 방법 |
KR102502841B1 (ko) * | 2020-12-31 | 2023-02-24 | 이영애 | 인터넷 미디어의 댓글 분석을 통한 긍정/부정 선호도 평가 시스템 및 그 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219929A (ja) | 2006-02-17 | 2007-08-30 | Nec Corp | 感性評価システム及び方法 |
-
2009
- 2009-02-27 KR KR1020090016968A patent/KR101074215B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219929A (ja) | 2006-02-17 | 2007-08-30 | Nec Corp | 感性評価システム及び方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180117944A (ko) * | 2017-04-20 | 2018-10-30 | 군산대학교산학협력단 | 객체 평판 마이닝 방법 및 장치 |
KR101961012B1 (ko) * | 2017-04-20 | 2019-03-21 | 군산대학교산학협력단 | 객체 평판 마이닝 방법 및 장치 |
KR102020756B1 (ko) | 2018-10-23 | 2019-11-04 | 주식회사 리나소프트 | 머신러닝을 이용한 리뷰 분석 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20100098014A (ko) | 2010-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101074215B1 (ko) | 여론 분석 장치 및 문서 분석을 통한 여론 평가 방법 | |
US11048882B2 (en) | Automatic semantic rating and abstraction of literature | |
Kang et al. | Identifying depressive users in Twitter using multimodal analysis | |
Yamamoto et al. | Role of emoticons for multidimensional sentiment analysis of Twitter | |
Chatzakou et al. | Harvesting opinions and emotions from social media textual resources | |
KR101613259B1 (ko) | 소셜 네트워크 서비스 사용자의 감성 분석 시스템 및 그 방법 | |
Al-Kabi et al. | Arabic/English sentiment analysis: an empirical study | |
Otto et al. | Understanding, categorizing and predicting semantic image-text relations | |
CN103995853A (zh) | 基于关键句的多语言情感数据处理分类方法及系统 | |
CN111538828A (zh) | 文本情感分析方法、装置、计算机装置及可读存储介质 | |
Iyer et al. | An unsupervised domain-independent framework for automated detection of persuasion tactics in text | |
CN114896305A (zh) | 一种基于大数据技术的智慧互联网安全平台 | |
Yamamoto et al. | Multidimensional sentiment calculation method for Twitter based on emoticons | |
CN113761377B (zh) | 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质 | |
Kaur et al. | Sentiment detection from Punjabi text using support vector machine | |
Cindo et al. | Sentiment Analysis on Twitter By Using Maximum Entropy And Support Vector Machine Method | |
Choudhury et al. | User sentiment detection: a YouTube use case | |
KR102275095B1 (ko) | 개인 미디어 제작을 위한 유튜브 동영상 메타데이터 취득 및 정보화 방법 | |
Ahmad et al. | Deriving emotions and sentiments from visual content: A disaster analysis use case | |
CN113688623A (zh) | 一种基于深度学习的方面级情感分析方法 | |
KR101712507B1 (ko) | 마이크로블로그의 개체명 링킹 시스템. | |
Mini | Opinion Mining for monitoring social media communications for Brand Promotion. | |
Tachicart et al. | An empirical analysis of Moroccan dialectal user-generated text | |
Al Azani et al. | Multimodal age-group recognition for opinion video logs using ensemble of neural networks | |
Yadav et al. | Sentimental analysis on audio and video using Vader algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140926 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151001 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161005 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171012 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20181004 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20191002 Year of fee payment: 9 |