KR20100129033A - 댓글에 대한 평판도 분석 방법 - Google Patents

댓글에 대한 평판도 분석 방법 Download PDF

Info

Publication number
KR20100129033A
KR20100129033A KR1020090047767A KR20090047767A KR20100129033A KR 20100129033 A KR20100129033 A KR 20100129033A KR 1020090047767 A KR1020090047767 A KR 1020090047767A KR 20090047767 A KR20090047767 A KR 20090047767A KR 20100129033 A KR20100129033 A KR 20100129033A
Authority
KR
South Korea
Prior art keywords
comment
reputation
positive
words
word
Prior art date
Application number
KR1020090047767A
Other languages
English (en)
Other versions
KR101110336B1 (ko
Inventor
보식 킴 데이비드
Original Assignee
(주)엠더블유스토리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)엠더블유스토리 filed Critical (주)엠더블유스토리
Priority to KR1020090047767A priority Critical patent/KR101110336B1/ko
Publication of KR20100129033A publication Critical patent/KR20100129033A/ko
Application granted granted Critical
Publication of KR101110336B1 publication Critical patent/KR101110336B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 댓글에 대한 평판도 분석 방법에 관한 것으로, 보다 구체적으로 서포트 벡터 머신(Support Vector Machine : SVM)을 사용하여 사용자에 의해 입력된 댓글의 단어가 긍정적인지 또는 부정적인지의 판단을 수행하고, 긍정적 또는 부정적 판단이 내려진 단어를 이용하여 상기 댓글의 평판도를 분석하는 과정을 포함하는 댓글에 대한 평판도 분석 방법에 관한 것이다.
본 발명에 따르면, 댓글의 평판도를 분석하여 댓글의 건전성을 평가함으로써, 소정 기준 이하의 댓글에 대하여 조치를 취할 수 있도록 하여 올바른 댓글 문화를 유도하는 댓글에 대한 평판도 분석 방법을 제공한다.
댓글, 서포트 벡터 머신, SVM, 평판도

Description

댓글에 대한 평판도 분석 방법 {Analyzing method for reputation of reply}
본 발명은 댓글에 대한 평판도 분석 방법에 관한 것으로, 보다 구체적으로 서포트 벡터 머신을 사용하여 사용자에 의해 입력된 댓글의 단어가 긍정적인지 또는 부정적인지의 판단을 수행하고, 긍정적 또는 부정적 판단이 내려진 단어를 이용하여 상기 댓글의 평판도를 분석하는 과정을 포함하는 댓글에 대한 평판도 분석 방법에 관한 것이다.
인터넷 게시판의 등장은 기사, 개인의 글 또는 사진, 사회 현상 등에 대해 토론하거나 비판할 공간이 없던 많은 사람들에게 자신의 의견이나 주장을 마음껏 펼 수 있는 공간을 제공한다는 점에서 긍정적인 측면이 있다. 그러나, 게시판 이용자들이 늘어나면서 게시판이 자신의 불만을 토로하거나 악의적으로 남을 공격하는 공간으로 여기는 이용자도 늘어나기 시작하였다.
이러한 현상은 인터넷의 익명성을 악용한 것으로, 욕설 또는 음란어 등과 같은 비속어를 사용하여 남을 헐뜯거나 허위 사실을 퍼뜨리는 댓글에 대해 악성 리 플, 즉 '악플'이라는 신조어도 만들어지게 되었다.
댓글 문화는 긍정적인 측면과 부정적인 측면이 모두 존재하며, 자유로운 토론 및 비판의 장이 될 수 있는가 하면, 비난, 공격의 장이 될 수도 있는 것이 댓글 문화가 가지고 있는 특성이다. 따라서 잘못된 댓글 문화를 올바른 방향으로 유도하려는 노력들이 계속되고 있지만, 긍정 및 부정적인 요소가 공존하는 댓글 문화에서 부정적인 댓글들에 대한 문제가 사회문제로 발전되는 경우도 자주 발생한다.
본 발명은 상기와 같은 종래기술의 문제점과 과거로부터 요청되어온 기술적 과제를 해결하는 것을 목적으로 한다.
본 발명의 목적은 댓글의 평판도를 분석하여 댓글의 건전성을 평가할 수 있는 댓글에 대한 평판도 분석 방법을 제공하는 것이다.
또한 본 발명의 목적은 소정 기준 이하의 댓글에 대하여 조치를 취할 수 있도록 하여 올바른 댓글 문화를 유도할 수 있는 댓글에 대한 평판도 분석 방법을 제공하는 것이다.
상기한 목적을 달성하기 위하여 본 발명은, 무작위로 추출된 복수 개의 단어를 준비하는 제 1 단계, 비속어 필터링 모듈을 사용하여 상기 단어 각각에 대해 긍 정적 또는 부정적 판단을 수행하는 제 2 단계, 긍정적 또는 부정적 판단이 내려진 상기 복수 개의 단어를 입력값으로 하여 훈련하고, 단어가 입력되었을 때 긍정적 또는 부정적을 판단하는 서포트 벡터 머신(Support Vector Machin:e SVM) 모듈을 생성하는 제 3 단계, 사용자에 의해 입력된 댓글을 단어 단위로 분리하는 제 4 단계, 상기 서포트 벡터 머신 모듈을 사용하여 상기 제 4 단계에서 분리된 단어 각각에 대해 긍정적 또는 부정적 판단을 수행하는 제 5 단계, 및 긍정적 또는 부정적 판단이 내려진 단어를 분석하여 상기 댓글에 대한 평판도를 분석하는 제 6 단계를 포함하는 것을 특징으로 한다.
바람직한 실시예에 있어서, 상기 부정적 판단이 내려진 단어는 감점하고, 상기 긍정적 판단이 내려진 단어는 가점하여, 상기 감점 및 가점을 계산하여 댓글에 대한 점수를 도출하는 제 6-1 단계, 및 소정의 기준값과 상기 댓글에 대한 점수를 비교를 통하여 상기 댓글에 대한 평판도를 분석하는 제 6-2 단계로 구성되는 것을 특징으로 한다.
바람직한 실시예에 있어서, 상기 무작위로 추출된 복수 개의 단어는 기 작성된 댓글들에서 추출된 복수 개의 단어인 것을 특징으로 한다.
바람직한 실시예에 있어서, 상기 제 2 단계에서 비속어 필터링 모듈에 의해 비속어로 인식된 단어는 부정적 판단을 내리고, 비속어가 아닌 것으로 인식되는 단어는 긍정적 판단을 내리는 것을 특징으로 한다.
본 발명은 다음과 같은 우수한 효과를 가진다.
먼저, 본 발명의 댓글에 대한 평판도 분석 방법을 사용하여 인터넷 게시판 등의 댓글의 평판도를 분석함으로써, 댓글의 건전성을 평가할 수 있는 효과가 있다.
또한, 본 발명의 댓글에 대한 평판도 분석 방법을 사용하여 소정 기준 이하의 댓글에 대하여 조치를 취할 수 있도록 함으로서, 올바른 댓글 문화를 유도할 수 있는 효과가 있다.
본 발명에서 사용되는 용어는 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있는데 이 경우에는 단순한 용어의 명칭이 아닌 발명의 상세한 설명 부분에 기재되거나 사용된 의미를 고려하여 그 의미가 파악되어야 할 것이다.
이하, 첨부한 도면에 도시된 바람직한 실시예들을 참조하여 본 발명의 기술적 구성을 상세하게 설명한다.
그러나, 본 발명은 여기서 설명되는 실시예에 한정되지 않고 다른 형태로 구체화 될 수도 있다. 명세서 전체에 걸쳐 동일한 참조번호는 동일한 구성요소를 나타낸다.
도 1에는 본 발명의 바람직한 실시예에 따른 댓글에 대한 평판도 분석 방법에 관한 과정의 흐름도가 도시되어 있다.
도 1을 참조하면, 먼저 무작위로 추출된 복수 개의 단어를 준비(S110)하고, 비속어 필터링 모듈을 사용하여 상기 단어 각각에 대해 긍정적 또는 부정적 판단을 수행(S120)한다.
상기 복수 개의 단어를 준비하는 방법은 다양하며, 예를 들어 웹 사이트에 기 작성된 댓글들을 수집하여 단어를 추출하는 방법을 사용할 수 있다. 이러한 복수 개의 단어는 하기에 기재되는 서포트 벡터 머신 모듈로 훈련시키기 위한 충분한 개수를 준비하는 것이 바람직하다.
또한, 상기 비속어 필터링 모듈은 일반적으로 채팅창, 인터넷 게시판 등에서 두루 사용되거나 개발된 모듈로서, 입력된 텍스트에 대하여 욕설, 음란어 등의 비속어를 인식하는 기능을 포함하는 모듈이라면 특별히 한정되지 않고 다양한 비속어 필터링 모듈이 사용될 수 있다. 이러한 비속어 필터링 모듈을 사용하여 상기 무작위로 추출된 복수 개의 단어를 검사하고, 비속어로 인식된 단어는 부정적 판단을 내리고, 비속어가 아닌 것으로 인식되는 단어는 긍정적 판단을 내린다.
상기 비속어 필터링 모듈에 관한 기술은 다양하게 개발되어 공지되어 있으므로, 이러한 비속어 필터링 모듈에 의해 비속어를 인식하는 과정은 본 명세서에서 생략한다.
다시, 상기와 같이 긍정적 또는 부정적 판단이 각각 수행된 복수 개의 단어들은 서포트 벡터 머신의 특성 훈련을 하는 용도로 사용된다. 즉, 상기 복수 개의 단어들을 입력값으로 하여 훈련시켜, 소정의 단어가 입력되었을 때 긍정적 또는 부정적을 판단하는 서포트 벡터 머신 모듈을 생성(S130)시킨다.
그 후, 사용자에 의해 입력된 댓글을 단어 단위로 분리(S140)하고, 상기 서포트 벡터 머신 모듈을 사용하여 상기에서 분리된 단어에 대해 각각 긍정적 또는 부정적 판단을 수행(S150)한다.
마지막으로, 상기 과정에 따라 긍정적 또는 부정적 판단이 내려진 단어를 분석하여 상기 사용자에 의해 입력된 댓글에 대한 평판도를 분석(S160)한다.
도 2에는 도 1의 평판도 분석 과정에 관한 흐름도가 도시되어 있다.
도 2를 도 1과 함께 참조하면, 사용자에 의해 입력된 댓글의 단어들이 도 1의 과정을 통해 각각 긍정적 또는 부정적 판단이 수행되고, 이러한 긍정적 또는 부정적 판단이 수행된 단어들에 점수를 부여(S162)한다. 즉, 긍정적 판단이 내려진 단어는 가점하고, 부정적 판단이 내려진 단어는 감점하여 (S162), 상기 단어들에 대한 가점 및 가점을 이용하여 댓글 점수를 계산(S164)한다. 예를 들어, 긍정적 판단이 내려진 단어는 +1 점을 부여하고, 부정적 판단이 내려진 단어는 -1 점을 부여하여, 이들 단어의 점수의 합을 구하여 댓글 점수를 도출할 수 있다.
그 후, 상기 댓글 점수를 소정의 기준값과 비교(S166)하여 상기 기준값 보다 높거나 낮은 정도를 확인하여 평판도를 분석한다.
한편, 상기 기준값은 사용자의 댓글이 입력된 게시판의 관리자에 의해 정해질 수 있으며, 평판도 등급을 나누기 위해 복수 개의 기준값을 사용할 수 도 있다. 또한, 상기 기준값은 범위의 형태로도 사용될 수 있다. 즉, 상기 기준값은 게시판 관리자에 따라서 다양하게 설정되어 사용될 수 있다.
또한, 상기 게시판 관리자는 상기 평판도를 이용하여 소정 기준 이하의 댓글에 대하여 조치를 취하거나, 또는 그 댓글을 입력한 사용자에 대해 게시판 상에서의 제제를 가할 수 있다.
본 명세서에서 서포트 벡터 머신(Support Vector Machin:e SVM)은 구조적 위험 최소화(Structural Risk Minimization; SRM) 이론으로부터 발전한 이진 패턴 분류기로서, 분류 문제를 해결하기 위한 최적의 분리 경계면(hyperplane; "초평면" 이라고도 함)을 제공한다. SVM이 주목받는 이유는, 명백한 이론적 근거에 기초하므로 결과 해석이 용이하고, 실제 응용에 있어서 인공신경망 수준의 높은 성과를 나타내며, 적은 학습 자료만으로 신속하게 분별 학습을 수행할 수 있기 때문이다. SVM은 본래 이진 분류(binary classification)를 위하여 개발되었으나, 현재에는 생물정보학(bioinformatics), 문자인식, 필기인식, 얼굴 및 물체인식 등 다양한 분야에서 성공적으로 적용되고 있다. 이러한 서포트 벡터 머신의 구조와 원리는 당 업계에 널리 공지되어 있으므로 본 명세서에서는 그에 대한 자세한 설명은 생략한다.
이상에서 살펴본 바와 같이 본 발명은 바람직한 실시예를 들어 도시하고 설명하였으나, 상기한 실시예에 한정되지 아니하며 본 발명의 정신을 벗어나지 않는 범위 내에서 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변경과 수정이 가능할 것이다.
도 1은 본 발명의 바람직한 실시예에 따른 댓글에 대한 평판도 분석 방법에 관한 과정의 흐름도이다;
도 2는 도 1의 평판도 분석 과정에 관한 흐름도이다.

Claims (4)

  1. 무작위로 추출된 복수 개의 단어를 준비하는 제 1 단계;
    비속어 필터링 모듈을 사용하여 상기 단어 각각에 대해 긍정적 또는 부정적 판단을 수행하는 제 2 단계;
    긍정적 또는 부정적 판단이 내려진 상기 복수 개의 단어를 입력값으로 하여 훈련하고, 단어가 입력되었을 때 긍정적 또는 부정적을 판단하는 서포트 벡터 머신(Support Vector Machin : SVM) 모듈을 생성하는 제 3 단계;
    사용자에 의해 입력된 댓글을 단어 단위로 분리하는 제 4 단계;
    상기 서포트 벡터 머신 모듈을 사용하여 상기 제 4 단계에서 분리된 단어 각각에 대해 긍정적 또는 부정적 판단을 수행하는 제 5 단계; 및
    상기 긍정적 또는 부정적 판단이 내려진 단어를 분석하여 상기 댓글에 대한 평판도를 분석하는 제 6 단계;
    를 포함하는 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
  2. 제 1 항에 있어서,
    상기 제 6 단계는,
    상기 부정적 판단이 내려진 단어는 감점하고, 상기 긍정적 판단이 내려진 단어는 가점하여, 상기 감점 및 가점을 계산하여 댓글에 대한 점수를 도출하는 제 6- 1 단계; 및
    소정의 기준값과 상기 댓글에 대한 점수를 비교를 통하여 상기 댓글에 대한 평판도를 분석하는 제 6-2 단계;
    로 구성되는 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
  3. 제 1 항에 있어서,
    상기 무작위로 추출된 복수 개의 단어는 기 작성된 댓글들에서 추출된 복수 개의 단어인 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
  4. 제 1 항에 있어서,
    상기 제 2 단계에서 비속어 필터링 모듈에 의해 비속어로 인식된 단어는 부정적 판단을 내리고, 비속어가 아닌 것으로 인식되는 단어는 긍정적 판단을 내리는 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
KR1020090047767A 2009-05-29 2009-05-29 댓글에 대한 평판도 분석 방법 KR101110336B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090047767A KR101110336B1 (ko) 2009-05-29 2009-05-29 댓글에 대한 평판도 분석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090047767A KR101110336B1 (ko) 2009-05-29 2009-05-29 댓글에 대한 평판도 분석 방법

Publications (2)

Publication Number Publication Date
KR20100129033A true KR20100129033A (ko) 2010-12-08
KR101110336B1 KR101110336B1 (ko) 2012-02-15

Family

ID=43505835

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090047767A KR101110336B1 (ko) 2009-05-29 2009-05-29 댓글에 대한 평판도 분석 방법

Country Status (1)

Country Link
KR (1) KR101110336B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170016178A (ko) * 2015-08-03 2017-02-13 주식회사 넥슨코리아 게임 이용자의 평판도 공유 시스템 및 방법
KR20180036074A (ko) * 2016-09-30 2018-04-09 주식회사 넥슨코리아 텍스트 필터링 장치 및 방법
KR20180131744A (ko) * 2017-06-01 2018-12-11 주식회사 넥슨코리아 메시지 출력 방법 및 장치
KR102218358B1 (ko) * 2020-08-19 2021-02-22 포항공과대학교 산학협력단 블록체인에 기반한 악성 댓글의 검증 시스템, 방법 및 컴퓨터로 독출 가능한 기록 매체
KR20220142705A (ko) * 2021-04-15 2022-10-24 연세대학교 원주산학협력단 초고속 분석 인공지능을 이용한 실시간 댓글 판단 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102020756B1 (ko) 2018-10-23 2019-11-04 주식회사 리나소프트 머신러닝을 이용한 리뷰 분석 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001022727A (ja) 1999-07-05 2001-01-26 Nippon Telegr & Teleph Corp <Ntt> テキスト分類学習方法及び装置及びテキスト分類学習プログラムを格納した記憶媒体
JP4513098B2 (ja) 2005-03-10 2010-07-28 日本電信電話株式会社 評判情報取得装置、評判情報取得方法、プログラムおよび記憶媒体
JP2006331246A (ja) 2005-05-30 2006-12-07 Nippon Telegr & Teleph Corp <Ntt> 意見分析処理方法、意見分析処理装置およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170016178A (ko) * 2015-08-03 2017-02-13 주식회사 넥슨코리아 게임 이용자의 평판도 공유 시스템 및 방법
KR20180036074A (ko) * 2016-09-30 2018-04-09 주식회사 넥슨코리아 텍스트 필터링 장치 및 방법
KR20180131744A (ko) * 2017-06-01 2018-12-11 주식회사 넥슨코리아 메시지 출력 방법 및 장치
KR102218358B1 (ko) * 2020-08-19 2021-02-22 포항공과대학교 산학협력단 블록체인에 기반한 악성 댓글의 검증 시스템, 방법 및 컴퓨터로 독출 가능한 기록 매체
KR20220142705A (ko) * 2021-04-15 2022-10-24 연세대학교 원주산학협력단 초고속 분석 인공지능을 이용한 실시간 댓글 판단 방법

Also Published As

Publication number Publication date
KR101110336B1 (ko) 2012-02-15

Similar Documents

Publication Publication Date Title
Aroyo et al. Crowdsourcing subjective tasks: the case study of understanding toxicity in online discussions
KR101110336B1 (ko) 댓글에 대한 평판도 분석 방법
CN103778186B (zh) 一种“网络马甲”的检测方法
Gao et al. Modeling user leniency and product popularity for sentiment classification
Bouazizi et al. Sentiment analysis in twitter: From classification to quantification of sentiments within tweets
US20150134663A1 (en) Method, apparatus, and computer-readable storage medium for grouping social network nodes
CN102360435A (zh) 基于隐含主题分析的不良图像检测方法
Schneider et al. Towards the automatic classification of offensive language and related phenomena in German tweets
CN105912525A (zh) 基于主题特征的半监督学习情感分类方法
Jameel et al. Detection of phishing emails using feed forward neural network
Mestry et al. Automation in social networking comments with the help of robust fasttext and cnn
CN109783805A (zh) 一种网络社区用户识别方法及装置
KR101655948B1 (ko) 관계 써클 프로세싱 방법 및 시스템, 그리고 컴퓨터 저장 매체
Roller et al. The (un) expected effects of applying standard cleansing models to human ratings on compositionality
Rajesh et al. Fraudulent news detection using machine learning approaches
Ansell et al. An ELMo-inspired approach to SemDeep-5’s Word-in-Context task
Saeed et al. The impact of spam reviews on feature-based sentiment analysis
Potha et al. Time series forecasting in cyberbullying data
Rathore et al. Cognitive science-based security framework in consumer electronics
CN113657808A (zh) 一种人员评定方法、装置、设备及存储介质
Manek et al. Sentrep: Sentiment classification of movie reviews using efficient repetitive pre-processing
Coelho et al. Veterans, PTSD and Social Media: Towards Identifying Trauma Text Categories using Grounded Theory
Nisha et al. A framework to detect crime through twitter data in cyberbullying with effdt model
CN111078820A (zh) 基于权重符号社交网络嵌入的边权预测方法
Mujitapha et al. Unemployment and Economic Growth: An Empirical Verification of Okun's Law in Malaysia

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150108

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160119

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170117

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171125

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190321

Year of fee payment: 8