KR20090126862A - 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 - Google Patents

자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 Download PDF

Info

Publication number
KR20090126862A
KR20090126862A KR1020080053195A KR20080053195A KR20090126862A KR 20090126862 A KR20090126862 A KR 20090126862A KR 1020080053195 A KR1020080053195 A KR 1020080053195A KR 20080053195 A KR20080053195 A KR 20080053195A KR 20090126862 A KR20090126862 A KR 20090126862A
Authority
KR
South Korea
Prior art keywords
natural language
morpheme
sentence
emotion
speaker
Prior art date
Application number
KR1020080053195A
Other languages
English (en)
Inventor
김경선
박진우
박준형
Original Assignee
주식회사 다이퀘스트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 다이퀘스트 filed Critical 주식회사 다이퀘스트
Priority to KR1020080053195A priority Critical patent/KR20090126862A/ko
Publication of KR20090126862A publication Critical patent/KR20090126862A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 자연어 처리를 이용한 감성 정보 분석 시스템을 제공한다. 이러한 시스템에서, 분석 대상 문서 저장 수단은 평가 대상에 대한 화자의 감성을 내포하는 복수의 자연어 문장을 유지한다. 또한, 감성 정보 분석 서버는 상기 자연어 문장을 형태소 단위로 분석하는 형태소 분석기와, 상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 의미 추출기와, 유지하고 있는 복수의 패턴 규칙(LSP) 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하고 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 규칙 처리기를 포함한다.
자연어, 평가 대상, 감성 정보, 감성 분석, 평판 분석

Description

자연어 처리를 이용한 감성 정보 분석 시스템 및 방법, 자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서 실행하기 위한 프로그램을 저장한 기록매체{SYSTEM AND METHOD FOR ANALYZING EMOTIONAL INFORMATION FROM NATURAL LANGUAGE SENTENCE, AND MEDIUM FOR STORAGING PROGRAM FOR THE SAME}
본 발명은 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법 그리고 자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서 실행하기 위한 프로그램을 저장한 기록매체에 관한 것으로서, 더욱 상세하게는, 다양한 저장 매체로부터 입력된 자연어 문장을 처리하여 자연어에 내포되어 있는 소정의 평가 대상에 대한 화자의 감성을 분석하는 시스템 및 방법, 그리고 이를 저장한 기록 매체에 관한 것이다.
최근 인터넷이 널리 보급되면서, 어떠한 제품이 출시되면, 사람들은 인터넷에 그 제품을 사용하거나 그 제품에 관심 있는 사람들로 이루어진 모임을 생성하고, 자기가 사용해 본 느낌, 주변에서 들을 수 있는 평가 등에 대하여 여러 가지 의견을 기록하고, 정보를 얻는다.
이러한 정보는 제품을 출시한 업체측에 있어서는, 제품의 마케팅 전략이나 추후 제품의 개선 방향을 결정하는 데에 중요한 자료가 된다.
한편, 이러한 의견을 수렴하기 위해서는, 아직까지는, 리서치 회사에서 온라인 또는 오프라인을 통한 설문을 행함으로써 각 개인들에게 일일이 각 제품에 대한 평가를 의뢰하여 평가데이터를 얻는 방식과 온라인 쇼핑몰이나 포털 사이트 등에 제품에 대한 평가를 할 수 있는 웹페이지를 만들어두고 각 개인의 참여를 유도하여 수치화된 평가 데이터를 얻는 방식이 사용되었다.
그러나 이러한 방법들은 개인의 참여를 유도하기 위해 많은 노력과 시간이 들고, 또 개인들이 고의로 잘못된 평가들을 내놓는 등의 문제가 발생한다.
따라서, 각 개인들이 자발적으로 솔직한 이야기를 나누는 인터넷상의 뉴스, 블로그, 사용기 게시판 등으로부터 평가 데이터를 자동으로 획득하는 방법의 필요성이 대두하였다.
본 발명은 온라인 또는 오프라인상에 존재하는 특정의 평가 대상에 대한 다양한 자연어 문장들로부터, 해당 평가 대상에 대한 화자의 선호 또는 비선호를 나타내는 감성을 분석하고, 이를 이용하여 평가 대상에 대한 종합적인 평판을 분석하는 시스템 및 방법을 제공하고자 한다.
또한, 본 발명은 다양한 자연어 문장들로부터 화자의 감성을 정확하게 분석해낼 수 있는 시스템 및 방법을 제공하고자 한다.
상술한 목적을 달성하기 위한 본 발명은, 평가 대상에 대한 화자의 감성을 내포하는 복수의 자연어 문장을 유지하고 있는 분석 대상 문서 저장 수단; 상기 자연어 문장을 형태소 단위로 분석하는 형태소 분석기와, 상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고, 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 의미 추출기와, 유지하고 있는 복수의 패턴 규칙(LSP) 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하고, 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 규칙 처리기를 구비하는 감성 정보 분석 서버;를 포함하는, 자연어 처리를 이용한 감성 정보 분석 시스템을 제공한다.
또한, 상기 감성 정보 분석 서버는, 복수의 상기 자연어 문장에 대하여 산출 된 상기 감성 정보의 각각에 기초하여 상기 평가 대상에 대한 평판을 분석하는 평판분석기를 더 포함한다.
또한, 상기 감성 정보 분석 서버는, 유지하고 있는 복수의 상기 패턴 규칙 중에 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙이 없는 경우, 상기 자연어 문장 또는 상기 추상 문장을 운영자에게 통보한다.
또한, 본 발명은, 평가 대상에 대한 화자의 감성을 내포하는 자연어 문장을 준비하는 단계; 상기 자연어 문장을 형태소 단위로 분석하는 단계; 상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고, 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 단계; 복수의 패턴 규칙(LSP) 중에서 상기 추상 문장과 일치하는 적어도 하나의 패턴 규칙을 선택하고, 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 단계를 포함하는 자연어 처리를 이용한 감성 정보 분석 방법을 제공한다.
또한, 상기의 방법은, 복수의 자연어 문장에 대하여 상기 감성 정보를 산출하고, 상기 산출된 감성 정보를 이용하여 평가 대상에 대한 평판을 분석하는 단계를 더 포함한다.
또한, 복수의 패턴 규칙 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하는 단계에 있어서, 상기 추상 문장에 대응하는 패턴 규칙을 선택할 수 없는 경우, 상기 자연어 문장 또는 상기 추상 문장을 운영자에게 통보하는 단계를 더 포함한다.
또한, 본 발명은, 평가 대상에 대한 화자의 감성을 내포하는 자연어 문장을 준비하는 단계; 상기 자연어 문장을 형태소 단위로 분석하는 단계; 상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고, 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 단계; 복수의 패턴 규칙(LSP) 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하고, 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 단계를 포함하는 자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서 실행하기 위한 프로그램을 저장하는 기록매체를 제공한다.
또한, 복수의 자연어 문장에 대하여 상기 감성 정보를 산출하고, 상기 산출된 감성 정보를 이용하여 평가 대상에 대한 평판을 분석하는 단계를 포함하는 자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서 실행하기 위한 프로그램을 저장하는 기록매체를 제공한다.
상기한 바와 같은 본 발명은, 온라인 또는 오프라인상에 존재하는 특정의 평가 대상에 대한 다양한 자연어 문장들로부터, 해당 평가 대상에 대한 화자의 선호 또는 비선호를 나타내는 감성을 분석하고, 이를 이용하여 평가 대상에 대한 종합적인 평판을 분석하는 시스템 및 방법을 제공할 수 있다.
또한, 본 발명은 다양한 자연어 문장들로부터 화자의 감성을 정확하게 분석해낼 수 있는 시스템 및 방법을 제공한다.
이하, 첨부한 도면을 참조하여 본 발명을 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 자연어 처리를 이용한 감성 정보 분석 시스템의 구성을 간략한 블록으로 나타낸 도면이다. 도 1에 의하면, 감성 정보 분석 시스템은 분석 대상 문서 저장 수단과 감성 정보 분석 서버로 이루어진다.
분석 대상 문서 저장 수단은, 복수의 자연어 문장을 유지하고, 필요에 따라, 자연어 문장을 입력하여 추가하거나 또는 자연어 문장을 독출하여 감성 정보 분석 서버측으로 출력할 수 있는 구성으로 이루어진다.
감성 정보 분석 서버는, 분석 대상 문서 저장 수단에 유지된 복수의 자연어 문장으로부터 화자의 감성을 분석하기 위한 것으로서, 형태소 분석기, 의미 추출기, 규칙 처리기 및 평판 분석기를 포함하여 이루어진다.
감성 정보 분석 서버의 간략한 동작에 있어서, 감성 정보 분석 서버가 분석 대상 문서 저장 수단으로부터 분석하고자 하는 하나 또는 복수의 자연어 문장을 추출하면, 형태소 분석기는 이 자연어 문장을 개별적인 형태소로 분리한다. 그리고 의미 추출기에서 각 형태소들이 의미하는 바를 인식하고 그 의미에 해당하는 의미 태그를 추출한 후, 분리된 형태소와 각 형태소에 대해 추출된 의미 태그를 결합함으로써 추상문장을 생성한다. 생성된 추상 문장은, 규칙 처리기에 의해 미리 유지되어 있는 복수의 패턴 규칙(Lexico-Semantic Pattern; LSP) 중에서 패턴 규칙이 서로 일치하는 패턴 규칙이 선택되고, 선택된 패턴 규칙을 기초로 하여 추상문장이 내포하고 있는 평가 대상에 대한 화자의 감성을 분석한다.
이후, 이와 같은 감성 정보 분석 시스템의 운영자는, 분석된 감성 정보 또는 다수의 감성 정보에 대한 통계인 평판을 평가 대상에 대한 마케팅 전략 작성 또는 신제품 개발에 대한 참고로서 이용할 수 있게 된다.
다음으로, 도 2를 참조하여, 본 발명의 일 실시예에 따른 자연어 처리를 이용한 감성 정보 분석 시스템의 상세한 구성을 설명한다. 도 2를 참조하면, 감성 정보 분석 시스템은, 도 1에 도시된 바와 같은 분석 대상 문서 저장 수단과 감성 정보 분석 서버 외에도, 평가 정보 저장 수단 및 참조 정보 저장 수단을 더 포함한다. 평가 정보 저장 수단은 감성 정보 분석 서버에서 감성 정보를 분석하고자 하는 평가 대상이 되는 항목들을 유지하고 있으며, 참조 정보 저장 수단은 감성 정보 분석 서버에서 분석 대상 문서 저장 수단으로부터 입력받은 자연어 문장을 분석하는 데에 있어서 참조해야할 다양한 정보들을 유지한다.
먼저, 분석 대상 문서 저장 수단은 인터넷과 같은 다양한 유무선 통신망에 연결되어 있으며, 감성 정보 분석의 대상이 될 복수의 자연어 문장을 인터넷상의 다양한 정보로부터 자동으로 선별하여 추가하거나 분석 대상 문서 저장 수단의 운영자에 의해 분석대상이 될 자연어 문장이 직접 입력될 수도 있다.
이때 입력 및 유지되는 자연어 문장은, 평가 대상에 대해 작성된 디지털 문서, 평가 대상에 대한 프리뷰 또는 리뷰가 게시되는 웹페이지 등으로부터 추출될 수 있다.
평가 정보 저장 수단은, 본 발명의 일 실시예에 따른 감성 정보 분석 시스템에서 감성 정보의 분석 대상이 되는 평가 대상에 대한 항목을 나타내는 정보(평가 대상 정보)와, 각각의 평가 대상 항목에 대하여 분석의 기준이 되는 항목을 나타내는 정보(평가 속성 정보) 등이 구체적으로 결정되어 유지되어 있다. 즉, 평가 대상 정보로는, "회사명 A" 또는 "회사명 B" 등의 회사명, "휴대폰 모델 M" 또는 "휴대폰 모델 N" 또는 "자동차 모델명 S" 또는 "자동차 모델명 T" 또는 "디지털카메라 모델명 Z" 등과 같은 각종 제품명 등이 있을 수 있다. 또한, 평가 속성 정보로는, "디자인", "색상", "통화품질", "승차감", "안전성", "촬영 해상도" 등의 다양한 세부 항목들이 있을 수 있다.
한편, 평가 정보 저장 수단에는, 이후 감성 정보 분석 서버에서 분석된 결과인, 감성 정보 분석 결과 및 평판 분석 결과가 유지될 수도 있다.
다음, 참조 정보 저장 수단은, 형태소 사전, 의미 사전, 패턴 규칙 사전을 포함하여 이루어진다.
형태소 사전은, 자연어 문장을 의미를 갖는 언어의 최소 단위인 형태소로 분해할 때 참조하는 것으로서, 현존하는 모든 형태소와 이에 해당하는 품사 정보를 저장하고 있다.
의미 사전은, 형태소들이 의미하는 바를 추출하기 위해 형태소들과 의미하는 바를 나타내기 위한 태그들 간의 관계를 정의한 사전이다. 이러한 태그에는 개체명 태그, 평가 대상 태그, 평가 속성 태그, 감성 태그가 포함된다.
개체명 태그는 "장소", "위치", "기관", "회사명", "모델명" 등이 있을 수 있으며, 이 중 평가 대상 및 평가 속성으로 정의되는 개체명 태그들에 대하여 각각 평가 대상 태그 및 평가 속성 태그가 부여된다.
여기에서, 평가대상 태그로는 "회사명", "자동차 모델명", "휴대폰 모델명" 등이 있을 수 있으며, 평가 속성 태그로는 "품질", "디자인", "승차감" 등이 있을 수 있다. 또한, 감성 태그로는 자연어 문장에서 화자가 평가 대상에 대해 표현하고 싶어한 감성을 판단하기 위한, "좋", "기쁘", "바람직", "나쁘", "슬프", "화", "짜증", "웃음" 등과 같이 자연어 문장에서 화자가 평가 대상에 대해 표현하고 싶어한 감성을 나타내는 형태소에 부여되는 긍정 태그 또는 부정 태그와, 문장의 의미를 반전시키기 위한 "않", "아니", "못" 등의 의미 반전 태그가 포함될 수 있다.
패턴 규칙 사전은, 분석대상이 되는 자연어 문장을 언어 분석하였을 때 나타날 수 있는 다양한 문장 구조를 정의한 패턴 규칙(LSP)과 이에 해당하는 감성 정보들의 관계를 정의한 것이다. 이러한 패턴들은, 형태소 및 의미 태그들의 조합으로 이루어져 있으며, 보통 하나의 평가 대상과 0 또는 하나의 평가 속성과 긍정/부정을 나타내는 감성 표현으로 이루어지는 단문 형태로 이루어진다.
하지만, 일반적인 자연어 문장은 단문의 형태뿐만 아니라 복문의 형태로 작성되는 경우도 많기 때문에, 감성 정보 분석 서버에서는 자연어 문장을 단문의 형태로 분리하는 기능과, 문장 내에 평가 대상이 존재하지 않는 경우에 문맥상의 주어를 이용하여 평가 대상을 복원하는 기능을 더 포함하도록 할 수도 있다.
여기에서, 감성 정보는 각 문장이 내포하는 화자의 감성을 수치화한 감성 정보를 포함하는 것으로, 감성 정보 분석 서버는 패턴 규칙 사전을 이용하여 자연어 문장을 분석하여 화자의 감성을 수치로 정량화하고 통계화하는 것이 가능하게 된다.
다음으로, 감성 정보 분석 서버를 살펴본다. 감성 정보 분석 서버는, 먼저, 분석 대상 문서 저장 수단으로부터 분석하고자 하는 자연어 문장을 추출하여 이후 형태소 분석기에 제공하는 분석대상 추출기를 구비한다.
형태소 분석기는, 형태소 사전에 유지된 자료를 참조하여, 분석대상이 되는 자연어 문장을 최소 의미 단위인 형태소로 분해한다. 이때 이용되는 형태소 사전은 특별한 형태로 한정되는 것은 아니며 공지의 것을 이용할 수 있다.
의미 추출기는 의미 사전에 유지된 의미 태그를 참조하여, 분리된 형태소들의 각각에 내포된 의미를 추출한다. 즉, 분리된 형태소들의 각각을 분석하여, 평가 대상을 나타내는 형태소에 대하여 이 형태소가 나타내는 평가 대상을 가리키는 평가 대상 태그를 추출하고, 평가 속성을 의미하는 형태소에 대하여 이 형태소가 의미하는 평가 속성을 가리키는 평가 속성 태그를 추출한다.
또한, 문장의 긍정 또는 부정을 나타내는 형태소들에 대해서는 그 형태소가 나타내는 긍정 또는 부정을 가리키는 감성 태그를 추출한다. 이때, 감성 태그의 추출에 있어서, 자연어 문장들은 단순히 형태소만으로 긍정 또는 부정을 나타내지 않고 복수의 형태소를 조합한 서술어 전체에 의해 긍정 또는 부정의 의미의 감성 표현을 행할 수도 있으므로, 이에 대해서는 다양한 형태소의 조합을 미리 설정해 두고 적절한 감성 태그를 추출할 수도 있다.
이와 같이 각각의 형태소들에 대하여 의미 태그가 추출되면, 의미 추출기에 서는 각 형태소에 의미 태그를 결합시킨 형태의 추상문장을 생성하게 된다.
추상문장이 생성되면, 규칙 처리기에서는, 이 추상문장을 패턴 규칙 사전에 저장되어 있는 복수의 패턴 규칙들과 비교함으로써, 서로 일치하는 패턴 규칙을 찾아낸다. 그리고 일치하는 패턴 규칙에 부여되어 있는 감성 정보를 확인하여, 해당 추상문장 즉, 분석 대상이 된 자연어 문장에 대해 감성 정보를 부여한다.
이와 같이 부여된 감성 정보는 이후 평가 정보 저장 수단에 저장될 수 있다.
이때, 패턴 규칙 사전에서 유지하고 있는 패턴 규칙과 일치하는 패턴이 추상 문장에 나타나지 않는 경우는 평가 대상에 대한 감성 정보가 없는 문장이거나 패턴 규칙이 만들어지지 않은 경우이다. 감성 정보를 추출하기 위해서는 감성을 나타내는 용언이 필수적이므로, 유지하고 있는 패턴 규칙과 일치하는 패턴 규칙이 나타나지 않은 문장 중 화자의 감성이 표현된 용언이 있는 문장은 운영자에게 통보된 후 새로운 패턴이 작성되어 패턴 규칙에 추가될 수 있도록 한다.
한편, 감성 정보 분석 서버는, 복수의 자연어 문장에 대하여 분석을 행하고, 이에 의해 생성된 감성 정보를 통계하는 평판 분석기를 구비한다. 일반적으로, 평가의 대상에 대해서 복수 개의 디지털 문서가 사용되며, 문서들은 감성 정보가 표현된 복수 개의 문장으로 이루어진다.
따라서, 하나의 평가 대상에 대해서 복수 개의 자연어 문장에 대한 감성 정보의 종합적인 평가가 필요하게 된다. 또한, 복문을 분석하는 경우에도, 평가 대상에 해당하는 복수 개의 감성 정보를 종합하여 평가 대상에 대한 평판을 산출해야 할 필요가 있다.
평판 분석기는 이러한 기능을 행하기 위하여, 규칙 처리기에 의해 산출되어 평가 정보 저장 수단에 저장되어 있는 감성 정보들을 분석하고 통계를 산출한다. 그리고 이와 같이 산출된 통계는 해당 평가 대상에 대한 평판으로 설정되어, 다시 평가 정보 저장 수단에 저장된다.
다음으로, 이와 같은 구성으로 이루어지는 본 발명의 일 실시예에 따른 자연어 처리를 이용한 감성 정보 분석 시스템을 이용하여 화자의 감성 정보를 분석하는 방법에 대하여 설명한다. 도 3은, 본 발명에 따른 감성 정보 분석 방법을 나타낸 흐름도이다.
이하에서는, (1)"모하비는 디자인이 좋아요", (2)"모하비는 너무 좋아^^;", (3)"모하비는 디자인이 꽝이에요", (4)"모하비는 디자인과 가속력이 모두 좋네요"의 네 개의 문장을 자연어 문장의 예시로서 사용하여 설명하도록 한다.
(S10) 단계: 어떠한 평가 대상에 대한 평판을 분석하고자 하면, 감성 정보 분석 시스템의 운영자는 분석대상 추출기를 이용하여 분석 대상 문서 저장 수단으로부터 해당 평가 대상에 대해 작성된 다양한 자연어 문장을 하나 또는 복수 개 추출한다.
즉, 자동차 모델 중의 하나인 "모하비"에 대한 평판을 분석하고자 하면, 운영자는 모하비에 관련한 데이터를 웹, 데이터베이스 또는 로컬 하드 디스크 등의 다양한 정보원으로부터 수집하여 분석 대상 문서 저장 수단에 유지한다. 즉, 웹크롤러와 같은 수단을 이용하여 문서를 웹상에서 임의로 수집할 수 있으며, 운영자의 로컬 또는 데이터베이스에 저장된 문서를 이용할 수도 있다.
이후 감성 정보 분석 서버는 분석 대상 문서 저장 수단으로부터 해당 평가 대상에 대해 복수 개의 감성 정보를 종합하여 평가 대상에 대한 평판을 산출한다.
(S20) 단계: 추출된 자연어 문장은 형태소 분석기에 제공되고, 형태소 분석기는 제공된 자연어 문장을 형태소 사전을 참조하여 개별적인 형태소 단위로 분해한다.
즉, (1) 내지 (4)의 문장은 다음과 같이 분해될 수 있다.
(1)모하비/!명사 + 는/!조사 + 디자인/!명사 + 이/!조사 + 좋/!형용사 + 아요/!어미
(2)모하비/!명사 + 는/!조사 + 너무/!부사 + 좋/!형용사 + 아/!어미 + ^^;/!기호
(3)모하비/!명사 + 디자인/!명사 + 은/!조사 + 꽝/!명사 + 이/!조사 + 에요/!어미
(4)모하비/!명사 + 는/!조사 + 디자인/!명사 + 과/!조사 + 가속력/!명사 + 모두/!부사 + 좋/!형용사 + 네요/!어미
(S30) 단계: 자연어 문장이 형태소 단위로 분해되면, 의미 추출기에서는 평가 정보 저장 수단의 평가대상 정보 및 평가 속성 정보를 참조하여 분해된 형태소 각각이 내포하는 의미를 인식한다. 그리고 인식된 의미가 평가 대상에 대한 것이면 해당 형태소에 평가대상 태그를 부여하고, 인식된 의미가 평가 속성에 대한 것이면 해당 형태소에 평가 속성 태그를 부여한다. 또한, 감성 표현을 이루는 형태소들의 의미를 인식하고 각각 감성 태그를 부여한다.
이와 같이 태그를 부여한 후, 의미 태그가 부여된 각 형태소로 이루어진 추상문장을 작성한다.
즉, (1) 내지 (4)의 문장에 의해 다음과 같은 추상문장이 작성된다.
(1)모하비/@자동차명 + 는/!조사 + 디자인/@속성 + 이/!조사 + 좋/@긍정 + 아요/!어미
(2)모하비/@자동차명 + 는/!조사 + 너무/@강조 + 좋/@긍정 + 아/!어미 + ^^;/!기호
(3)모하비/@자동차명 + 디자인/@속성 + 은/!조사 + 꽝/@부정 + 이/!서술격조사 + 에요/!어미
(4)모하비/@자동차명 + 는/!조사 + 디자인/@속성 + 과/!조사 + 가속력/!명사 + 모두/!부사 + 좋/@긍정 + 네요/!어미
(S40) 단계: 한편, 의미 추출기에서 추상 문장이 생성되면, 규칙 처리기에서는 이 추상문장을 패턴 규칙 사전에 저장되어 있는 복수의 패턴 규칙들과 비교함으로써, 서로 일치하는 패턴 규칙을 찾아낸다. 그리고 일치하는 패턴 규칙에 부여되어 있는 감성 정보를 확인하여, 해당 추상문장 즉, 분석 대상이 된 자연어 문장에 대한 감성 정보 분석 결과를 생성한다.
즉, (1) 내지 (4)의 문장에 대하여 생성된 패턴 규칙 및 감성 정보 분석 결 과는 다음과 같은 형태가 된다. 여기에서, (4)번 문장은 복문으로 작성되었기 때문에, 이를 두 개의 단문으로 분해하여 분석하도록 할 수 있다.
(1)Product/@자동차명 + Feature/@속성 + @긍정 -> [제품명 : Product, 속성 : Feature, 감성 정보 : 4]
(2)Product/@자동차명 + @강조 + @긍정 -> [제품명 : Product, 속성 : NONE, 감성 정보 : 5]
(3)Product/@자동차명 + Feature/@속성 + @부정 -> [제품명 : Product, 속성 : Feature, 감성 정보 : 2]
(4)①Product/@자동차명 + Feature1/@속성 + 과!/조사 + Feature2/@속성 + @긍정 -> [제품명 : Product, 속성 : Feature2, 감성 정보 : 4], ②[제품명 : Product, 속성 : Feature2, 감성 정보 : 4]
그리고 위와 같이 생성된 감성 정보 분석 결과는 소정의 저장 수단, 예를 들면 평가 정보 저장 수단에 저장된다. 즉, (1) 내지 (4)의 문장에 대한 감성 정보 분석 결과는 다음과 같은 형태로 나타난다.
(1)[제품명 : 모하비, 속성 : 디자인, 감성 정보 : 4]
(2)[제품명 : 모하비, 속성 : NONE, 감성 정보 : 5]
(3)[제품명 : 모하비, 속성 : 디자인, 감성 정보 : 2]
(4)①[제품명 : 모하비, 속성 : 디자인, 감성 정보 : 4], ②[제품명 : 모하비, 속성 : 가속력, 감성 정보 : 4]
이와 같이 감성 정보가 획득되고, 평가 정보 저장 수단에 복수의 평가 대상 및/또는 복수의 평가 속성에 대한 감성 정보들이 저장되면, 추후 운영자에 의해 평가대상별 또는 평가 속성별 또는 분석 대상 문서별로 감성 정보를 통계할 수 있고, 이를 이용하여 각 항목에 대한 평판을 분석할 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 자연어 처리를 이용한 감성 정보 분석 시스템의 구성을 간략한 블록으로 나타낸 도면이다.
도 2를 참조하여, 본 발명의 일 실시예에 따른 자연어 처리를 이용한 감성 정보 분석 시스템의 상세한 구성을 설명한다.
도 3은, 본 발명의 일 실시예에 따른 감성 정보 분석 방법을 나타낸 흐름도이다.

Claims (8)

  1. 평가 대상에 대한 화자의 감성을 내포하는 복수의 자연어 문장을 유지하고 있는 분석 대상 문서 저장 수단;
    상기 자연어 문장을 형태소 단위로 분석하는 형태소 분석기와, 상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고, 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 의미 추출기와, 유지하고 있는 복수의 패턴 규칙(LSP) 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하고, 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 규칙 처리기를 구비하는 감성 정보 분석 서버;를 포함하는, 자연어 처리를 이용한 감성 정보 분석 시스템.
  2. 제1항에 있어서,
    상기 감성 정보 분석 서버는,
    복수의 상기 자연어 문장에 대하여 산출된 상기 감성 정보의 각각에 기초하여 상기 평가 대상에 대한 평판을 분석하는 평판분석기를 더 포함하는 것을 특징으로 하는 자연어 처리를 이용한 감성 정보 분석 시스템.
  3. 제1항 또는 제2항에 있어서,
    상기 감성 정보 분석 서버는, 유지하고 있는 복수의 상기 패턴 규칙 중에 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙이 없는 경우, 상기 자연어 문장 또는 상기 추상 문장을 운영자에게 통보하는 것을 특징으로 하는 자연어 처리를 이용한 감성 정보 분석 시스템.
  4. 평가 대상에 대한 화자의 감성을 내포하는 자연어 문장을 준비하는 단계;
    상기 자연어 문장을 형태소 단위로 분석하는 단계;
    상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고, 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 단계;
    복수의 패턴 규칙(LSP) 중에서 상기 추상 문장과 일치하는 적어도 하나의 패턴 규칙을 선택하고, 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 단계를 포함하는 자연어 처리를 이용한 감성 정보 분석 방법.
  5. 제4항에 있어서,
    복수의 자연어 문장에 대하여 상기 감성 정보를 산출하고, 상기 산출된 감성 정보를 이용하여 평가 대상에 대한 평판을 분석하는 단계를 더 포함하는 것을 특징으로 하는 자연어 처리를 이용한 감성 정보 분석 방법.
  6. 제4항 또는 제5항에 있어서,
    복수의 패턴 규칙 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하는 단계에 있어서, 상기 추상 문장에 대응하는 패턴 규칙을 선택할 수 없는 경우, 상기 자연어 문장 또는 상기 추상 문장을 운영자에게 통보하는 단계를 더 포함하는 것을 특징으로 하는 자연어 처리를 이용한 감성 정보 분석 방법.
  7. 평가 대상에 대한 화자의 감성을 내포하는 자연어 문장을 준비하는 단계;
    상기 자연어 문장을 형태소 단위로 분석하는 단계;
    상기 분석된 형태소로부터 상기 형태소가 의미하는 바를 나타내는 의미 태그를 추출하고, 상기 형태소와 상기 의미 태그의 조합으로 이루어지는 추상 문장을 생성하는 단계;
    복수의 패턴 규칙(LSP) 중에서 상기 추상 문장에 대응하는 적어도 하나의 패턴 규칙을 선택하고, 상기 선택된 패턴 규칙을 참조하여 상기 추상 문장이 내포하는 평가 대상에 대한 화자의 감성을 나타내는 감성 정보를 산출하는 단계를 포함하는 자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서 실행하기 위한 프로그램을 저장하는 기록매체.
  8. 제7항에 있어서,
    복수의 자연어 문장에 대하여 상기 감성 정보를 산출하고, 상기 산출된 감성 정보를 이용하여 평가 대상에 대한 평판을 분석하는 단계를 포함하는 자연어 처리 를 이용한 감성 정보 분석 방법을 컴퓨터에서 실행하기 위한 프로그램을 저장하는 기록매체.
KR1020080053195A 2008-06-05 2008-06-05 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체 KR20090126862A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080053195A KR20090126862A (ko) 2008-06-05 2008-06-05 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080053195A KR20090126862A (ko) 2008-06-05 2008-06-05 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체

Publications (1)

Publication Number Publication Date
KR20090126862A true KR20090126862A (ko) 2009-12-09

Family

ID=41687908

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080053195A KR20090126862A (ko) 2008-06-05 2008-06-05 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체

Country Status (1)

Country Link
KR (1) KR20090126862A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101136007B1 (ko) * 2010-06-29 2012-04-20 (주)워드워즈 문서 감성 분석 시스템 및 그 방법
WO2012057563A2 (ko) * 2010-10-28 2012-05-03 (주)엠씨에스로직 감성 기반의 커뮤니티 형성 시스템, 커뮤니티 형성이 가능한 통신 단말기 및 그 커뮤니티 형성방법
KR101291755B1 (ko) * 2011-02-25 2013-07-31 성균관대학교산학협력단 감성 진단 장치 및 방법
CN110826317A (zh) * 2019-11-07 2020-02-21 成都国腾实业集团有限公司 基于词典与规则的文本情感分析方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101136007B1 (ko) * 2010-06-29 2012-04-20 (주)워드워즈 문서 감성 분석 시스템 및 그 방법
WO2012057563A2 (ko) * 2010-10-28 2012-05-03 (주)엠씨에스로직 감성 기반의 커뮤니티 형성 시스템, 커뮤니티 형성이 가능한 통신 단말기 및 그 커뮤니티 형성방법
WO2012057563A3 (ko) * 2010-10-28 2012-07-26 (주)엠씨에스로직 감성 기반의 커뮤니티 형성 시스템, 커뮤니티 형성이 가능한 통신 단말기 및 그 커뮤니티 형성방법
KR101291755B1 (ko) * 2011-02-25 2013-07-31 성균관대학교산학협력단 감성 진단 장치 및 방법
CN110826317A (zh) * 2019-11-07 2020-02-21 成都国腾实业集团有限公司 基于词典与规则的文本情感分析方法

Similar Documents

Publication Publication Date Title
Haselmayer et al. Sentiment analysis of political communication: Combining a dictionary approach with crowdcoding
Martínez-Cámara et al. Sentiment analysis in Twitter
Wang et al. A system for real-time twitter sentiment analysis of 2012 us presidential election cycle
Smeureanu et al. Applying supervised opinion mining techniques on online user reviews
US8781989B2 (en) Method and system to predict a data value
US20170308523A1 (en) A method and system for sentiment classification and emotion classification
Shi et al. Sentiment analysis of Chinese microblogging based on sentiment ontology: a case study of ‘7.23 Wenzhou Train Collision’
WO2012011092A1 (en) System, method and device for intelligent textual conversation system
Bellot et al. INEX Tweet Contextualization task: Evaluation, results and lesson learned
KR20120108095A (ko) 소셜 데이터 분석 시스템
Al Qundus et al. Exploring the impact of short-text complexity and structure on its quality in social media
Onyenwe et al. The impact of political party/candidate on the election results from a sentiment analysis perspective using# AnambraDecides2017 tweets
Shekhawat Sentiment classification of current public opinion on brexit: Naïve Bayes classifier model vs Python’s Textblob approach
CN114238573A (zh) 基于文本对抗样例的信息推送方法及装置
Tumitan et al. Tracking Sentiment Evolution on User-Generated Content: A Case Study on the Brazilian Political Scene.
Kucher et al. Visual Analysis of Sentiment and Stance in Social Media Texts.
Gottipati et al. Analyzing tweets on new norm: work from home during COVID-19 outbreak
US20140019464A1 (en) Preference visualization system and censorship system
KR20090126862A (ko) 자연어 처리를 이용한 감성 정보 분석 시스템 및 방법,자연어 처리를 이용한 감성 정보 분석 방법을 컴퓨터에서실행하기 위한 프로그램을 저장한 기록매체
KR20110052114A (ko) 인터넷을 활용한 추천 검색 시스템 및 그 방법
Mahboob et al. Sentiment analysis of RSS feeds on sports news–a case study
Wang et al. Sentiment analysis of tweets and government translations: Assessing China’s post-COVID-19 landscape for signs of withering or booming
Hashfi et al. Sentiment Analysis of An Internet Provider Company Based on Twitter Using Support Vector Machine and Naïve Bayes Method
JP6663944B2 (ja) ユーザに対するコンテンツの共感影響力を推定するプログラム、装置及び方法
JP4539616B2 (ja) 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application