KR20100129033A

KR20100129033A - 댓글에 대한 평판도 분석 방법

Info

Publication number: KR20100129033A
Application number: KR1020090047767A
Authority: KR
Inventors: 보식 킴 데이비드
Original assignee: (주)엠더블유스토리
Priority date: 2009-05-29
Filing date: 2009-05-29
Publication date: 2010-12-08
Also published as: KR101110336B1

Abstract

본 발명은 댓글에 대한 평판도 분석 방법에 관한 것으로, 보다 구체적으로 서포트 벡터 머신(Support Vector Machine : SVM)을 사용하여 사용자에 의해 입력된 댓글의 단어가 긍정적인지 또는 부정적인지의 판단을 수행하고, 긍정적 또는 부정적 판단이 내려진 단어를 이용하여 상기 댓글의 평판도를 분석하는 과정을 포함하는 댓글에 대한 평판도 분석 방법에 관한 것이다.

본 발명에 따르면, 댓글의 평판도를 분석하여 댓글의 건전성을 평가함으로써, 소정 기준 이하의 댓글에 대하여 조치를 취할 수 있도록 하여 올바른 댓글 문화를 유도하는 댓글에 대한 평판도 분석 방법을 제공한다.

댓글, 서포트 벡터 머신, SVM, 평판도

Description

댓글에 대한 평판도 분석 방법 {Analyzing method for reputation of reply}

본 발명은 댓글에 대한 평판도 분석 방법에 관한 것으로, 보다 구체적으로 서포트 벡터 머신을 사용하여 사용자에 의해 입력된 댓글의 단어가 긍정적인지 또는 부정적인지의 판단을 수행하고, 긍정적 또는 부정적 판단이 내려진 단어를 이용하여 상기 댓글의 평판도를 분석하는 과정을 포함하는 댓글에 대한 평판도 분석 방법에 관한 것이다.

인터넷 게시판의 등장은 기사, 개인의 글 또는 사진, 사회 현상 등에 대해 토론하거나 비판할 공간이 없던 많은 사람들에게 자신의 의견이나 주장을 마음껏 펼 수 있는 공간을 제공한다는 점에서 긍정적인 측면이 있다. 그러나, 게시판 이용자들이 늘어나면서 게시판이 자신의 불만을 토로하거나 악의적으로 남을 공격하는 공간으로 여기는 이용자도 늘어나기 시작하였다.

이러한 현상은 인터넷의 익명성을 악용한 것으로, 욕설 또는 음란어 등과 같은 비속어를 사용하여 남을 헐뜯거나 허위 사실을 퍼뜨리는 댓글에 대해 악성 리 플, 즉 '악플'이라는 신조어도 만들어지게 되었다.

댓글 문화는 긍정적인 측면과 부정적인 측면이 모두 존재하며, 자유로운 토론 및 비판의 장이 될 수 있는가 하면, 비난, 공격의 장이 될 수도 있는 것이 댓글 문화가 가지고 있는 특성이다. 따라서 잘못된 댓글 문화를 올바른 방향으로 유도하려는 노력들이 계속되고 있지만, 긍정 및 부정적인 요소가 공존하는 댓글 문화에서 부정적인 댓글들에 대한 문제가 사회문제로 발전되는 경우도 자주 발생한다.

본 발명은 상기와 같은 종래기술의 문제점과 과거로부터 요청되어온 기술적 과제를 해결하는 것을 목적으로 한다.

본 발명의 목적은 댓글의 평판도를 분석하여 댓글의 건전성을 평가할 수 있는 댓글에 대한 평판도 분석 방법을 제공하는 것이다.

또한 본 발명의 목적은 소정 기준 이하의 댓글에 대하여 조치를 취할 수 있도록 하여 올바른 댓글 문화를 유도할 수 있는 댓글에 대한 평판도 분석 방법을 제공하는 것이다.

상기한 목적을 달성하기 위하여 본 발명은, 무작위로 추출된 복수 개의 단어를 준비하는 제 1 단계, 비속어 필터링 모듈을 사용하여 상기 단어 각각에 대해 긍 정적 또는 부정적 판단을 수행하는 제 2 단계, 긍정적 또는 부정적 판단이 내려진 상기 복수 개의 단어를 입력값으로 하여 훈련하고, 단어가 입력되었을 때 긍정적 또는 부정적을 판단하는 서포트 벡터 머신(Support Vector Machin:e SVM) 모듈을 생성하는 제 3 단계, 사용자에 의해 입력된 댓글을 단어 단위로 분리하는 제 4 단계, 상기 서포트 벡터 머신 모듈을 사용하여 상기 제 4 단계에서 분리된 단어 각각에 대해 긍정적 또는 부정적 판단을 수행하는 제 5 단계, 및 긍정적 또는 부정적 판단이 내려진 단어를 분석하여 상기 댓글에 대한 평판도를 분석하는 제 6 단계를 포함하는 것을 특징으로 한다.

바람직한 실시예에 있어서, 상기 부정적 판단이 내려진 단어는 감점하고, 상기 긍정적 판단이 내려진 단어는 가점하여, 상기 감점 및 가점을 계산하여 댓글에 대한 점수를 도출하는 제 6-1 단계, 및 소정의 기준값과 상기 댓글에 대한 점수를 비교를 통하여 상기 댓글에 대한 평판도를 분석하는 제 6-2 단계로 구성되는 것을 특징으로 한다.

바람직한 실시예에 있어서, 상기 무작위로 추출된 복수 개의 단어는 기 작성된 댓글들에서 추출된 복수 개의 단어인 것을 특징으로 한다.

바람직한 실시예에 있어서, 상기 제 2 단계에서 비속어 필터링 모듈에 의해 비속어로 인식된 단어는 부정적 판단을 내리고, 비속어가 아닌 것으로 인식되는 단어는 긍정적 판단을 내리는 것을 특징으로 한다.

본 발명은 다음과 같은 우수한 효과를 가진다.

먼저, 본 발명의 댓글에 대한 평판도 분석 방법을 사용하여 인터넷 게시판 등의 댓글의 평판도를 분석함으로써, 댓글의 건전성을 평가할 수 있는 효과가 있다.

또한, 본 발명의 댓글에 대한 평판도 분석 방법을 사용하여 소정 기준 이하의 댓글에 대하여 조치를 취할 수 있도록 함으로서, 올바른 댓글 문화를 유도할 수 있는 효과가 있다.

본 발명에서 사용되는 용어는 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있는데 이 경우에는 단순한 용어의 명칭이 아닌 발명의 상세한 설명 부분에 기재되거나 사용된 의미를 고려하여 그 의미가 파악되어야 할 것이다.

이하, 첨부한 도면에 도시된 바람직한 실시예들을 참조하여 본 발명의 기술적 구성을 상세하게 설명한다.

그러나, 본 발명은 여기서 설명되는 실시예에 한정되지 않고 다른 형태로 구체화 될 수도 있다. 명세서 전체에 걸쳐 동일한 참조번호는 동일한 구성요소를 나타낸다.

도 1에는 본 발명의 바람직한 실시예에 따른 댓글에 대한 평판도 분석 방법에 관한 과정의 흐름도가 도시되어 있다.

도 1을 참조하면, 먼저 무작위로 추출된 복수 개의 단어를 준비(S110)하고, 비속어 필터링 모듈을 사용하여 상기 단어 각각에 대해 긍정적 또는 부정적 판단을 수행(S120)한다.

상기 복수 개의 단어를 준비하는 방법은 다양하며, 예를 들어 웹 사이트에 기 작성된 댓글들을 수집하여 단어를 추출하는 방법을 사용할 수 있다. 이러한 복수 개의 단어는 하기에 기재되는 서포트 벡터 머신 모듈로 훈련시키기 위한 충분한 개수를 준비하는 것이 바람직하다.

또한, 상기 비속어 필터링 모듈은 일반적으로 채팅창, 인터넷 게시판 등에서 두루 사용되거나 개발된 모듈로서, 입력된 텍스트에 대하여 욕설, 음란어 등의 비속어를 인식하는 기능을 포함하는 모듈이라면 특별히 한정되지 않고 다양한 비속어 필터링 모듈이 사용될 수 있다. 이러한 비속어 필터링 모듈을 사용하여 상기 무작위로 추출된 복수 개의 단어를 검사하고, 비속어로 인식된 단어는 부정적 판단을 내리고, 비속어가 아닌 것으로 인식되는 단어는 긍정적 판단을 내린다.

상기 비속어 필터링 모듈에 관한 기술은 다양하게 개발되어 공지되어 있으므로, 이러한 비속어 필터링 모듈에 의해 비속어를 인식하는 과정은 본 명세서에서 생략한다.

다시, 상기와 같이 긍정적 또는 부정적 판단이 각각 수행된 복수 개의 단어들은 서포트 벡터 머신의 특성 훈련을 하는 용도로 사용된다. 즉, 상기 복수 개의 단어들을 입력값으로 하여 훈련시켜, 소정의 단어가 입력되었을 때 긍정적 또는 부정적을 판단하는 서포트 벡터 머신 모듈을 생성(S130)시킨다.

그 후, 사용자에 의해 입력된 댓글을 단어 단위로 분리(S140)하고, 상기 서포트 벡터 머신 모듈을 사용하여 상기에서 분리된 단어에 대해 각각 긍정적 또는 부정적 판단을 수행(S150)한다.

마지막으로, 상기 과정에 따라 긍정적 또는 부정적 판단이 내려진 단어를 분석하여 상기 사용자에 의해 입력된 댓글에 대한 평판도를 분석(S160)한다.

도 2에는 도 1의 평판도 분석 과정에 관한 흐름도가 도시되어 있다.

도 2를 도 1과 함께 참조하면, 사용자에 의해 입력된 댓글의 단어들이 도 1의 과정을 통해 각각 긍정적 또는 부정적 판단이 수행되고, 이러한 긍정적 또는 부정적 판단이 수행된 단어들에 점수를 부여(S162)한다. 즉, 긍정적 판단이 내려진 단어는 가점하고, 부정적 판단이 내려진 단어는 감점하여 (S162), 상기 단어들에 대한 가점 및 가점을 이용하여 댓글 점수를 계산(S164)한다. 예를 들어, 긍정적 판단이 내려진 단어는 +1 점을 부여하고, 부정적 판단이 내려진 단어는 -1 점을 부여하여, 이들 단어의 점수의 합을 구하여 댓글 점수를 도출할 수 있다.

그 후, 상기 댓글 점수를 소정의 기준값과 비교(S166)하여 상기 기준값 보다 높거나 낮은 정도를 확인하여 평판도를 분석한다.

한편, 상기 기준값은 사용자의 댓글이 입력된 게시판의 관리자에 의해 정해질 수 있으며, 평판도 등급을 나누기 위해 복수 개의 기준값을 사용할 수 도 있다. 또한, 상기 기준값은 범위의 형태로도 사용될 수 있다. 즉, 상기 기준값은 게시판 관리자에 따라서 다양하게 설정되어 사용될 수 있다.

또한, 상기 게시판 관리자는 상기 평판도를 이용하여 소정 기준 이하의 댓글에 대하여 조치를 취하거나, 또는 그 댓글을 입력한 사용자에 대해 게시판 상에서의 제제를 가할 수 있다.

본 명세서에서 서포트 벡터 머신(Support Vector Machin:e SVM)은 구조적 위험 최소화(Structural Risk Minimization; SRM) 이론으로부터 발전한 이진 패턴 분류기로서, 분류 문제를 해결하기 위한 최적의 분리 경계면(hyperplane; "초평면" 이라고도 함)을 제공한다. SVM이 주목받는 이유는, 명백한 이론적 근거에 기초하므로 결과 해석이 용이하고, 실제 응용에 있어서 인공신경망 수준의 높은 성과를 나타내며, 적은 학습 자료만으로 신속하게 분별 학습을 수행할 수 있기 때문이다. SVM은 본래 이진 분류(binary classification)를 위하여 개발되었으나, 현재에는 생물정보학(bioinformatics), 문자인식, 필기인식, 얼굴 및 물체인식 등 다양한 분야에서 성공적으로 적용되고 있다. 이러한 서포트 벡터 머신의 구조와 원리는 당 업계에 널리 공지되어 있으므로 본 명세서에서는 그에 대한 자세한 설명은 생략한다.

이상에서 살펴본 바와 같이 본 발명은 바람직한 실시예를 들어 도시하고 설명하였으나, 상기한 실시예에 한정되지 아니하며 본 발명의 정신을 벗어나지 않는 범위 내에서 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변경과 수정이 가능할 것이다.

도 1은 본 발명의 바람직한 실시예에 따른 댓글에 대한 평판도 분석 방법에 관한 과정의 흐름도이다;

도 2는 도 1의 평판도 분석 과정에 관한 흐름도이다.

Claims

무작위로 추출된 복수 개의 단어를 준비하는 제 1 단계;

비속어 필터링 모듈을 사용하여 상기 단어 각각에 대해 긍정적 또는 부정적 판단을 수행하는 제 2 단계;

긍정적 또는 부정적 판단이 내려진 상기 복수 개의 단어를 입력값으로 하여 훈련하고, 단어가 입력되었을 때 긍정적 또는 부정적을 판단하는 서포트 벡터 머신(Support Vector Machin : SVM) 모듈을 생성하는 제 3 단계;

사용자에 의해 입력된 댓글을 단어 단위로 분리하는 제 4 단계;

상기 서포트 벡터 머신 모듈을 사용하여 상기 제 4 단계에서 분리된 단어 각각에 대해 긍정적 또는 부정적 판단을 수행하는 제 5 단계; 및

상기 긍정적 또는 부정적 판단이 내려진 단어를 분석하여 상기 댓글에 대한 평판도를 분석하는 제 6 단계;

를 포함하는 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
제 1 항에 있어서,

상기 제 6 단계는,

상기 부정적 판단이 내려진 단어는 감점하고, 상기 긍정적 판단이 내려진 단어는 가점하여, 상기 감점 및 가점을 계산하여 댓글에 대한 점수를 도출하는 제 6- 1 단계; 및

소정의 기준값과 상기 댓글에 대한 점수를 비교를 통하여 상기 댓글에 대한 평판도를 분석하는 제 6-2 단계;

로 구성되는 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
제 1 항에 있어서,

상기 무작위로 추출된 복수 개의 단어는 기 작성된 댓글들에서 추출된 복수 개의 단어인 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.
제 1 항에 있어서,

상기 제 2 단계에서 비속어 필터링 모듈에 의해 비속어로 인식된 단어는 부정적 판단을 내리고, 비속어가 아닌 것으로 인식되는 단어는 긍정적 판단을 내리는 것을 특징으로 하는 댓글에 대한 평판도 분석 방법.