KR101315734B1 - 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체 - Google Patents

텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체 Download PDF

Info

Publication number
KR101315734B1
KR101315734B1 KR1020110143348A KR20110143348A KR101315734B1 KR 101315734 B1 KR101315734 B1 KR 101315734B1 KR 1020110143348 A KR1020110143348 A KR 1020110143348A KR 20110143348 A KR20110143348 A KR 20110143348A KR 101315734 B1 KR101315734 B1 KR 101315734B1
Authority
KR
South Korea
Prior art keywords
emotional
emotion
text
words
word
Prior art date
Application number
KR1020110143348A
Other languages
English (en)
Other versions
KR20130075124A (ko
Inventor
고일주
이신영
함준석
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020110143348A priority Critical patent/KR101315734B1/ko
Publication of KR20130075124A publication Critical patent/KR20130075124A/ko
Application granted granted Critical
Publication of KR101315734B1 publication Critical patent/KR101315734B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

텍스트로부터 정서 단어를 추출하여 텍스트에 내지된 지배적인 정서 상태를 분석하는 정서 분석 장치가 개시된다. 정서 단어 추출부는 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 추출한다. 정서 차원 공간 매핑부는 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 정서 차원 공간상 수치화된 값으로 매핑한다. 정서 원형 모형 매핑부는 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑한다. 정서 선택부는 정서 원형 모형 상에 설정된 기본 정서 중에서 정서 원형 모형 상에 매핑된 정서 단어와 최단거리에 위치한 기본 정서를 텍스트의 특정 정서 상태로 선택한다. 본 발명에 따르면, 텍스트의 정서 단어를 2차원 상(쾌-불쾌 및 활성화-비활성화)에서 분석한 데이터베이스를 이용하여 텍스트로부터 정서 단어를 추출하고 텍스트의 정서 및 지배적인 정서를 분석하고, 나아가 정서의 흐름을 분석할 수 있다. 또한, 텍스트로부터 지배적인 정서를 분석하여 서로 다른 문서 간 유사도를 파악하여 문서를 종류별로 분류할 수 있다.

Description

텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체{Apparatus and method for analyzing emotion by extracting emotional word of text, and recording medium storing program for executing method of the same in computer}
본 발명은 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체에 관한 것으로, 더욱 상세하게는, 텍스트로부터 정서 단어를 추출하여 텍스트의 지배 정서(dominant emotion) 및 정서 흐름을 분석하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체에 관한 것이다.
소설, 블로그, 채팅 메시지, 상품평 등의 텍스트는 전반적인 정서의 흐름을 가지고 있다. 또한 텍스트 간 정서 흐름의 유사도를 비교하면 유사한 정서 흐름을 갖는 텍스트를 분류할 수 있고, 상품 추천이나 의견 수집 등에 활용할 수 있다. 이와 관련되어 기계가 정서를 인식하고 표현하고자 진행된 연구는 주로 기계가 인간의 표정, 몸동작, 위협적인 장면, 음성 등을 인식해서 정서를 분석하고 다시 기계의 얼굴 표정, 몸동작, 소리, 모니터 등을 통해서 정서를 전달하는 식이었다. 그러나 이러한 연구방법은 주로 컴퓨터 비전, 음성 인식 기술을 사용하는데 컴퓨터 비전, 음성 인식의 어려움 때문에 정서를 인식하기가 쉽지 않았다. 한편 인간은 얼굴 표정이나 목소리뿐만 아니라 일기, 블로그, 소셜 네트워크 서비스, 채팅 메시지, 휴대 전화 단문 메시지 등을 통해서도 자신의 정서를 나타내고 의사소통을 한다. 더 나아가서 신문사설, 소설, 쇼핑몰 상품평, 게시판 댓글 등을 통해서 의견을 표명하면서 정서를 표현하기도 한다. 이러한 일반적인 텍스트에는 정서를 나타내는 단어가 포함되어 있고, 정서 단어를 분석하면 텍스트가 나타내는 정서를 알 수 있다.
이러한 방법은 컴퓨터 비전이나 음성 인식으로 정서를 인식하는 것보다 텍스트에 포함된 정서 단어의 추출이 쉽고, 구체적인 정서를 나타내는 정서 단어가 직접 포함되어 있기 때문에 글쓴이의 정서적 의도를 파악할 수 있다. 또한 최근에는 트위터, 페이스북, 상품평 등의 폭발적인 데이터 증가에 따라 대량의 텍스트를 처리해야 할 필요성이 있는데, 컴퓨터 비전, 음성 인식보다 계산량이 적기 때문에 대량의 텍스트를 빠른 시간 안에 분석할 수 있다. 또한 유사한 정서를 가지는 텍스트를 분류해 낸다면, 상품 추천이나 댓글의 의견 파악 등 오피니언 마이닝(opinion mining)에 적용하여 활용할 수 있다.
이와 관련된 선행기술을 구체적으로 살펴보면, 한국등록공보 제10-0935828호(발명의 명칭 : 감정정보 추출 장치 및 방법)에는 문서 내의 텍스트 문자를 분석하여 해당 문서를 대표하는 감정정보를 산출하여 이를 기초로 복수 개의 문서 간 유사도 여부를 판단하여 문서를 종류별로 분류하는 장치 및 방법을 개시하고 있다. 이는 문서에서 산출된 감정용어가 속한 감정종류 및 감정 정도에 따라 가중치(감정벡터 이용)를 계산하여 감정정보를 추출하는 것인 반면, 본 발명은 정서 단어들을 쾌-불쾌, 활성화-비활성화의 두 개의 차원으로 분석하여 정서 단어들을 시간 순서에 따라 정규화하고 정서 원형 모형에 매핑 하여 기본 정서를 분류하는 것인바, 그 감정정보를 도출해내는 알고리즘이 서로 상이하다.
한국공개공보 제10-2009-0126862호(발명의 명칭 : 자연어 처리를 이용한 감성정보 분석 시스템 및 방법, 자연어 처리를 이용한 감성정보 분석방법을 컴퓨터에서 실행시키기 위한 프로그램을 저장한 기록매체)에는 자연어 문장을 형태소 단위로 분석하여 상기 형태소가 의미하는 바를 의미 태그로 추출하여 추상 문장을 생성하고 이를 통해 하나의 패턴 규칙을 선택하여 자연어에 내포된 화자의 감성을 분석하는 시스템 및 방법을 개시하고 있다. 이는 정서 단어들을 쾌-불쾌, 활성화-비활성화의 두 개의 차원으로 분석하여 정서 단어들을 시간 순서에 따라 정규화하고 정서 원형 모형에 매핑 하여 기본 정서를 분류하는 본 발명과 감정 정보를 도출해내는 알고리즘이 서로 상이하다.
본 발명이 이루고자 하는 기술적 과제는, 텍스트의 정서 단어를 2차원 상(쾌-불쾌 및 활성화-비활성화)에서 분석한 데이터베이스를 이용하여 텍스트로부터 정서 단어를 추출하여 텍스트의 정서 및 지배적인 정서를 분석하고, 나아가 정서의 흐름을 분석할 수 있는 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 텍스트로부터 지배적인 정서를 분석하여 서로 다른 문서 간 유사도를 파악하여 문서를 종류별로 분류할 수 있는 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법을 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치는, 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 추출하는 정서 단어 추출부; 상기 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 정서 차원 공간상 수치화된 값으로 매핑하는 정서 차원 공간 매핑부; 상기 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 상기 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 정서 원형 모형 매핑부; 및 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 정서 단어와 최단거리에 위치한 기본 정서를 상기 텍스트의 특정 정서 상태로 선택하는 정서 선택부;를 구비한다.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치는, 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 정서 단어 추출부; 상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하는 정서 차원 공간 매핑부; 상기 매핑된 각각의 정서 단어를 통해 상기 텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 정서 원형 모형 매핑부; 및 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로서 상기 텍스트의 정서 흐름을 분석하는 정서 분석부;를 구비한다.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치는, 입력된 제1텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 정서 단어 추출부; 상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하고 정서 차원 공간 매핑부; 상기 시간 차원을 동일한 단위 시간으로 나누어 상기 단위 시간 내에 포함된 하나 이상의 정서 단어의 수치화된 값을 평균내어 3차원 정서 차원 공간상 재매핑하는 정규화부; 상기 매핑된 각각의 정서 단어를 통해 상기 제1텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 정서 원형 모형 매핑부; 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로서 상기 제1텍스트의 정서 흐름을 분석하는 정서 분석부; 및 상기 제1텍스트와 다른 텍스트인 제2텍스트에 대해 분석된 정서 흐름을 토대로 상기 제1텍스트와 상기 제2텍스트 사이의 동일한 단위 시간에 속하는 정서 단어의 정서 차원 공간상의 거리를 계산하여 서로 다른 텍스트 간의 정서 흐름의 유사도를 판단하는 유사도 판단부;를 구비한다.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법은, (a) 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 추출하는 단계; (b) 상기 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 정서 차원 공간상 수치화된 값으로 매핑하는 단계; (c) 상기 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 상기 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 단계; 및 (d) 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 정서 단어와 최단거리에 위치한 기본 정서를 상기 텍스트의 특정 정서 상태로 선택하는 단계;를 갖는다.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법은, (a) 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 단계; (b) 상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하는 단계; (c) 상기 매핑된 각각의 정서 단어를 통해 상기 텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 단계; 및 (d) 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로써 상기 텍스트의 정서 흐름을 분석하는 단계;를 갖는다.
상기의 다른 기술적 과제를 달성하기 위한 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법은, (a) 입력된 제1텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 단계; (b) 상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하는 단계; (c) 상기 시간 차원을 동일한 단위 시간으로 나누어 상기 단위 시간 내에 포함된 하나 이상의 정서 단어의 수치화된 값을 평균내어 3차원 정서 차원 공간상 재매핑하는 단계; (d) 상기 매핑된 각각의 정서 단어를 통해 상기 제1텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 단계; (e) 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로써 상기 제1텍스트의 정서 흐름을 분석하는 단계; 및 (f) 상기 제1텍스트와 다른 제2텍스트에 대해 분석된 정서 흐름을 토대로 상기 제1텍스트와 상기 제2텍스트 사이의 동일한 단위 시간에 속하는 정서 단어의 정서 차원 공간상의 거리를 계산하여 서로 다른 텍스트간의 정서 흐름의 유사도를 판단하는 단계;를 갖는다.
본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법에 의하면, 텍스트의 정서 단어를 2차원 상(쾌-불쾌 및 활성화-비활성화)에서 분석한 데이터베이스를 이용하여 텍스트로부터 정서 단어를 추출하고 텍스트의 정서 및 정서의 흐름인 지배적인 정서를 분석할 수 있다. 또한, 텍스트로부터 지배적인 정서를 분석하여 서로 다른 문서 간 유사도를 파악하여 문서를 종류별로 분류할 수 있다.
도 1은 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치의 구성을 도시한 블록도,
도 2는 본 발명에 따른 정서 단어 추출부의 구성을 도시한 블록도,
도 3은 본 발명의 제1실시예에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 도시한 흐름도,
도 4는 본 발명의 제2실시예에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 도시한 흐름도,
도 5는 본 발명의 제3실시예에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 도시한 흐름도,
도 6은 텍스트로부터 추출된 정서 단어(놀라다)를 쾌-불쾌 및 활성화-비활성화를 각각의 축으로 하여 2차원의 정서 차원 공간상 수치화된 값을 토대로 매핑한 그래프,
도 7은 쾌-불쾌, 활성화-비활성화, 시간을 각각의 축으로 하여 3차원의 정서 차원 공간상 수치화된 값을 토대로 매핑한 그래프,
도 8은 본 발명에 사용되는 정서 원형 모형(Russel과 Barrett, 1999)을 도시한 도면,
도 9는 본 발명에 사용되는 정서 원형 모형 상에 추출된 정서 단어(겁나다, 매료되다)를 매핑한 도면,
도 10은 텍스트로부터 추출된 각각의 정서 단어를 3차원의 정서 차원 공간 상에 순서대로 매핑한 도면,
도 11은 상기 도 10에 도시된 3차원의 정서 차원 공간 값을 정서 원형 모형에 매핑하여 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로서 텍스트의 정서 흐름을 도시한 도면,
도 12는 쾌-불쾌, 활성화-비활성화, 시간을 각각의 축으로 하여 3차원의 정서 차원 공간상 수치화된 값을 단위 시간에 따라 평균(정규화)한 정서 상태를 매핑한 그래프,
도 13은 서로 다른 두 텍스트 간 정서 상태의 거리를 도시한 그래프,
도 14는 텍스트 간 정서 흐름의 유사도를 분석하기 위해 비교 기준이 되는 소설 '감자'와 42개 소설의 유사도를 높은 순서로 정렬한 그래프,
도 15는 소설 '감자'와 가장 유사도가 높은 소설 '비오는 길'의 정서 흐름을 비교하여 도시한 도면, 그리고,
도 16은 소설 '감자'와 가장 유사도가 낮은 소설'탈출기'의 정서 흐름을 비교하여 도시한 도면이다.
이하에서 첨부의 도면들을 참조하여 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.
도 1은 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치(100)의 구성을 도시한 블록도이고, 도 2는 정서 단어 추출부(110)의 구성을 도시한 블록도이다.
도 1을 참조하면, 본 발명에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 장치(100)는 정서 단어 추출부(110), 정서 차원 공간 매핑부(120), 정서 원형 모형 매핑부(130), 정서 선택부(140), 정규화부(150) 및 유사도 판단부(160)를 구비한다.
정서 단어 추출부(110)는 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 추출한다. 정서 단어 추출부(110)는 형태소 분석부(210), 정서 단어 데이터베이스부(220) 및 정서 단어 분류부(230)로 이루어진다.
형태소 분석부(210)는 텍스트에서 형태소를 추출하여 분석한다. 입력된 텍스트는 형태소 분석이 가능하도록 단문일 수 있고, 복수의 문장으로 이루어질 수 있다. 형태소 분석부(210)는 텍스트에서 형태소를 추출하는데, 예를 들어, 표준 용어 사전을 이용하여 텍스트에서 형태소를 추출할 수 있다. 그러나 이에 한정되지 않고 다양한 분석 방법을 이용하여 형태소가 추출될 수 있다.
정서 단어 데이터베이스부(220)는 형태소 분석부(210)를 통해 추출/분석된 형태소가 정서 단어에 해당하는지 판단하기 위해 사전에 설정된 정서 단어 목록을 가지고 있다. 또한 정서 단어별로 쾌-불쾌 값과 활성화-비활성화 값이 정해져 있다. 따라서 정서 단어 데이터베이스부(220)에 사전에 설정된 정서 단어 목록과 추출/분석된 형태소를 상호 매칭하여 추출/분석된 형태소가 정서 단어에 해당하는지 판단할 수 있다. 참고로 정서 단어 데이터베이스부(220)는 표 1과 같이 박인조와 민경환(2005)의 연구 결과물인 한국어 정서 단어 목록에서 쾌-불쾌와 활성화-비활성화 차원을 사용하여 총 434개의 정서 단어 데이터베이스를 구축할 수 있다. 표 1의 정서 단어 목록의 각 차원 값은 1에서 7점 사이의 값으로부터 + 1에서 - 1 사이의 연속된 값으로 정규화한 값이다.
정서 단어 목록 쾌(+)-불쾌(-) 값 활성화(+)-비활성화(-) 값
가뜬하다 + 0.17 - 0.07
가련하다 - 0.30 - 0.28
가소롭다 - 0.51 - 0.03
... ... ...
놀라다 + 0.04 + 0.56
정서 단어 분류부(230)는 형태소 분석부(210)로부터 분석된 형태소를 토대로 정서 단어 데이터베이스부(220)에 저장된 정서 단어 목록과 매칭하여 정서 단어를 분류한다.
예를 들어, 입력된 텍스트가 "신랑 신부는 놀라서 그를 쳐다보았다"일 경우, 형태소 분석부(210)를 통해 형태소 분석을 하여 체언과 용언의 기본형을 추출하면 '신랑', '신부', '놀라다', '그', '쳐다보다'와 같이 텍스트가 분리된다. 그 뒤 정서 단어를 추출하기 위해 정서 단어 데이터베이스부(220)에 저장된 정서 단어 목록과 매칭하면 '놀라다'가 추출된다. 이때 '놀라다'라는 정서 단어의 쾌-불쾌 및 활성화-비활성화 값은 표 1에 기재된 바와 같이 각각 + 0.04, + 0.56 에 해당함을 알 수 있다.
정서 차원 공간 매핑부(120)는 텍스트로부터 추출된 정서 단어(놀라다)를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 정서 차원 공간상 수치화된 값으로 매핑한다. 즉, 도 6에 도시된 바와 같이, 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화를 각각의 축으로 하여 정서 단어에 해당하는 수치화된 값을 토대로 2차원 공간상 매핑한다.
이때 복수의 문장으로 이루어진 텍스트가 입력된 경우(가령, 단편 소설), 상술한 기준에 따라 추출되는 정서 단어가 복수일 수 있다. 정서 단어 데이터베이스부(220)와 매칭되는 정서 단어들은 시간 순서에 따라 나열된다. 따라서 이 경우, 전체 텍스트의 정서의 흐름(변화) 상태를 얻기 위해 정서 차원 공간 매핑부(120)는 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 3차원의 정서 차원 공간상 매핑할 수 있다. 즉, 도 7에 도시된 바와 같이, 쾌-불쾌 및 활성화-비활성화를 축으로 하는 2차원 정서 차원 공간상에 시간 축을 추가하여 추출된 각각의 정서 단어를 순차적으로 3차원 공간상 매핑한다.
정서 원형 모형 매핑부(130)는 정서 차원 공간 매핑부(120)로부터 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형 상에 매핑한다. 도 8은 본 발명에 사용되는 정서 원형 모형을 나타내고 있는데 이는 Russel과 Barrett(1999)이 제안한 모형이다. 즉, 도 8에 도시된 바와 같이, 정서 원형 모형은 쾌-불쾌 및 활성화-비활성화를 각각의 지름 축으로 하는 원형 모형을 하고 있으며, 원형 모형 내부에는 정서 상태를 언어적으로 분류하기 위한 정서(긴장한, 겁내는, 긴박한, 걱정 등)를 다수 포함하고 있으며, 원형 모형 경계상에는 기본적인 정서를 나타내는 기본 정서를 포함하고 있어 기본 정서가 정서 원형 모형 상에 어느 곳에 위치하는 지를 나타낸다. 기본 정서는 놀람, 공포, 화남, 혐오, 슬픔, 행복의 6가지 정서를 나타낼 수 있다.
도 9를 참조하면, 정서 원형 모형 상에 추출된 정서 단어(겁나다, 매료되다)가 매핑되어 있다. 정서 선택부(140, 정서 분석부)는 정서 원형 모형 상에 설정된 기본 정서 중에서 정서 원형 모형 상에 매핑된 정서 단어와 최단 거리에 위치한 기본 정서를 텍스트의 특정 정서 상태로 선택한다. 따라서 도 9에 도시된 바와 같이, 정서 단어 '겁나다'와 가장 가까운 정서는 '공포'이고, 정서 단어 '매료되다'와 가장 가까운 정서는 '행복'임을 알 수 있다.
또한, 텍스트의 정서 흐름을 파악하기 위해 시간 차원을 추가한 경우 추출된 각각의 정서 단어가 3차원 정서 차원 공간상에 순서대로 매핑된다(도 10 참조). 나아가 도 11을 참조하면, 도 10에 도시된 3차원의 정서 차원 공간의 값을 정서 원형 모형에 매핑하여 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로서 텍스트의 정서 흐름을 나타낼 수 있다. 도 10에 도시된 지배 정서의 흐름은 화남, 놀람, 놀람, 놀람, 행복, 행복, 행복, 놀람, 공포의 순서로 나타났다.
정규화부(150)는 추가된 시간 차원을 동일한 시간 단위로 나누어 단위 시간 내에 포함된 하나 이상의 정서 단어의 수치화된 값을 평균 내어 3차원 정서 차원 공간상 재매핑한다. 시간 차원을 확장하면 순차적으로 발생하는 정서의 변화를 알 수 있고, 텍스트의 흐름에 따라 정서 변화의 흐름을 알 수 있다. 도 7을 참조하면, 정서 단어 데이터베이스부(220)와 매칭된 각 정서 단어가 쾌-불쾌 및 활성화-비활성화 차원상에서 점으로 표현되고 매칭된 순서에 따라 시간 차원에 나열되었다. 도 12를 참조하면, t1, t2,...,tn은 n개의 일정한 단위 시간을 나타내고, S1, S2,...,Sn은 n개의 지배적인 정서 상태로서 한 단위 시간 평면에서 매칭된 정서 단어의 평균값을 나타낸다. 따라서 이를 통해 지배적인 정서 상태를 관찰함으로써 텍스트의 정서 상태 변화(흐름)을 알 수 있다.
유사도 판단부(160)는 텍스트의 정서 흐름을 토대로 동일한 단위 시간에 속하는 정서 단어의 정서 차원 공간상의 거리를 계산하여 서로 다른 텍스트 간의 정서 흐름의 유사도를 판단한다. 즉, 서로 다른 텍스트를 정서 차원 공간 안에서 정서 상태 변화(흐름)를 비교함으로써 텍스트들의 정서적 유사성을 계산할 수 있다.
도 13을 참조하면, 서로 다른 두 텍스트 문서가 di, dj 이고 두 텍스트 문서의 시간 {tk|k=1,2,...,n}에서의 정서 상태가 Sik, Sjk일 때, 두 정서 상태 사이의 거리 d(Sik, Sjk)는 유클리드 거리를 사용하며 수학식 1에 의해 구할 수 있다.
Figure 112011103903114-pat00001
여기서 i≠j이며, Sikp, Sjkp는 쾌-불쾌 차원 값, Sika, Sjka는 활성화-비활성화 차원 값으로 + 1부터 - 1 사이의 값을 갖는다.
두 텍스트 문서 di, dj는 n개의 단위 시간으로 이루어져 있어 정서 상태도 각각 n개씩 있기 때문에, 두 텍스트 문서의 정서 흐름의 거리는 수학식 2에 의해 구할 수 있다.
Figure 112011103903114-pat00002
두 텍스트 문서의 정서 흐름의 거리가 가장 짧은 것은 두 텍스트 문서의 정서 흐름의 유사도가 가장 높다는 의미이므로, di와 dj의 유사도는 수학식 3에 의해 구해질 수 있으며 유사도가 높을수록 두 텍스트 문서는 유사하다는 것을 의미한다.
Figure 112011103903114-pat00003
즉, 정서 차원 공간상의 거리의 합이 짧을수록 서로 다른 텍스트 간 정서 흐름이 유사함을 알 수 있다.
텍스트 간 정서 흐름의 유사도를 분류하기 위해 소설 '감자'와 42편의 소설을 비교하였다. 텍스트 간의 비교를 위하여 단위 시간은 모두 9로 정규화하였다. 도 14는 비교 기준이 되는 텍스트를 소설 '감자'로 하였을 때, 유사도가 높은 순서로 텍스트를 정렬한 그래프이다. '감자'와 지배적인 정서가 가장 유사한 텍스트는 최명익의 '비오는 길'로서 수학식 3에 의한 두 텍스트의 유사도는 2.799이다.
도 15는 소설 '감자'와 '비오는 길'의 정서 흐름을 비교하여 도시한 도면이다. 도 15a 내지 도 15c에서 굵은 점선은 '감자'의 정서 차원 공간상의 정서 흐름을 나타내고, 얇은 점선은 '비오는 길'의 정서 차원 공간상의 정서 흐름을 나타낸다. 도 15b를 참조하면, 쾌-불쾌 및 시간 차원을 중심으로 보면 두 텍스트가 유사하게 불쾌, 쾌, 불쾌의 순서로 변화함을 알 수 있다. 도 15c를 참조하면, 활성화, 시간 차원을 중심으로 보면 '비오는 길'이 '감자'보다 전반적으로 활성화가 조금 낮으나, 두 텍스트가 유사한 흐름을 보이고 있음을 알 수 있다. 도 15d는 두 텍스트를 정서 원형 모형에 매핑하여 정서 원형 모형 상 기본 정서를 특정 정서 상태로 선택한 결과를 나타낸 도면인데, 굵은 실선은 '감자'의 지배적인 정서 흐름이고, 얇은 실선은 '비오는 길'의 지배적인 정서 흐름이다. '비오는 길'의 지배적인 정서는 {공포, 화남, 행복, 슬픔, 행복, 놀람, 슬픔}의 순서이고, '감자'의 지배적인 정서와 유사함을 알 수 있다.
도 16은 소설 '감자'와 가장 유사하지 않은 텍스트인 최서해의 '탈출기'의 정서 흐름을 비교하여 도시한 도면이다. 두 텍스트의 유사도는 1.549로 두 텍스트 간 정서 흐름의 거리가 가장 멀었다. 도 16a는 정서 차원 공간에서 쾌-불쾌, 활성화, 시간 차원을 중심으로 본 도면이고, 도 16b는 정서 차원 공간에서 쾌-불쾌, 시간 차원을 중심으로 본 도면이다. 굵은 점선은 '감자'의 정서 차원 공간상에서 정서 흐름을 나타내고, 얇은 점선은 '탈출기'의 정서 차원 공간상에서 정서 흐름을 나타낸다. 도 16b를 참조하면 '탈출기'는 초반에 쾌 정서였다가 이후 끝까지 불쾌 정서를 보여주고 있는데 이것은 '감자'의 정서 흐름과 매우 다르다. 도 16c는 두 텍스트를 정서 원형 모형에 매핑하여 정서 원형 모형 상 기본 정서를 특정 정서 상태로 선택한 결과를 나타낸 도면인데, '탈출기'의 지배적인 정서는 {행복, 화남, 화남, 혐오, 혐오, 혐오, 혐오, 화남, 화남}의 순서를 보여주고 있다. '탈출기'는 초반부터 후반까지 일관적으로 화남, 혐오, 슬픔의 높은 불쾌의 정서를 나타내고 있으며, 이는 '감자'의 지배적인 정서와는 매우 다름을 알 수 있다.
도 3은 본 발명의 제1실시예에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 도시한 흐름도이다.
도 3을 참조하면 텍스트가 입력되면(S310), 입력된 텍스트로부터 형태소를 추출하여 분석한다(S320). 추출/분석된 다수의 형태소 중에 정서 단어를 추출하기 위해 사전에 설정된 정서 단어 목록을 가지고 있는 정서 단어 데이터베이스부(220)와 상호 매칭한다. 이러한 과정을 통해 추출/분석된 다수의 형태소 중에 정서 단어를 추출한다(S330). 추출된 정서 단어는 정서 단어 데이터베이스부(220)에 사전에 설정된 쾌-불쾌 값과 활성화-비활성화 값을 토대로(표 1 참조) 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원 정서 차원 공간상 수치화된 값으로 매핑한다(S340). 그리고 나서 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑한다(S350). 정서 원형 모형의 예는 도 8에 도시되어 있다. 정서 원형 모형 상에 사전에 설정된 기본 정서 중에서 정서 원형 모형 상에 매핑된 정서 단어와 최단 거리에 위치한 기본 정서를 텍스트의 특정 정서 상태로 선택한다(S360). 선택된 특정 정서 상태는 정서 원형 모형 상에 도시된 기본 정서인 놀람, 공포, 화남, 혐오, 슬픔, 행복의 6가지 중 어느 하나일 수 있다.
입력된 텍스트가 복수의 문장으로 이루어진 경우(가령, 단편 소설)에는 특정 정서 상태를 1개로 선택하기보다 전체적인 정서 상태의 흐름을 파악해볼 수 있다. 도 4는 본 발명의 제2실시예에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 도시한 흐름도이다.
도 4를 참조하면 텍스트가 입력되면(S410), 입력된 텍스트로부터 형태소를 추출하여 분석한다(S420). 추출/분석된 다수의 형태소 중에 정서 단어를 추출하기 위해 사전에 설정된 정서 단어 목록을 가지고 있는 정서 단어 데이터베이스부(220)와 상호 매칭한다. 이러한 과정을 통해 추출/분석된 다수의 형태소 중에 정서 단어를 순차적으로 추출한다(S430). 추출된 각각의 정서 단어는 정서 단어 데이터베이스부(220)에 사전에 설정된 쾌-불쾌 값과 활성화-비활성화 값을 토대로(표 1 참조) 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원 정서 차원 공간상 수치화된 값으로 매핑하고, 나아가 시간 차원을 추가하여 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑한다(S440). 그리고 나서 수치화되어 매핑된 각각의 정서 단어를 통해 텍스트의 정서 흐름 상태를 얻기 위해 3차원의 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑한다(S450). 정서 원형 모형의 예는 도 8에 도시되어 있다. 정서 원형 모형 상에 설정된 기본 정서 중에서 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단 거리에 위치한 기본 정서를 텍스트의 특정 정서 상태로 선택하여 텍스트의 정서 흐름을 분석한다(S460).
이러한 방법으로 복수의 문장으로 이루어진 텍스트의 정서 흐름을 분석한 경우, 분석한 텍스트와 유사한 정서 흐름을 가지는 다른 텍스트를 검색할 수 있다. 도 5는 본 발명의 제3실시예에 따른 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 토대로 서로 다른 텍스트간 정서 흐름의 유사도를 파악하는 방법을 도시한 흐름도이다.
도 5를 참조하면, 제1텍스트가 입력되면(S510), 입력된 제1텍스트로부터 형태소를 추출하여 분석한다(S520). 추출/분석된 다수의 형태소 중에 정서 단어를 추출하기 위해 사전에 설정된 정서 단어 목록을 가지고 있는 정서 단어 데이터베이스부(220)와 상호 매칭한다. 이러한 과정을 통해 추출/분석된 다수의 형태소 중에 정서 단어를 순차적으로 추출한다(S530). 추출된 각각의 정서 단어는 정서 단어 데이터베이스부(220)에 사전에 설정된 쾌-불쾌 값과 활성화-비활성화 값을 토대로(표 1 참조) 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원 정서 차원 공간상 수치화된 값으로 매핑하고, 나아가 시간 차원을 추가하여 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑한다(S550). 그리고 나서 추가된 시간 차원을 동일한 단위 시간으로 나누어 단위 시간 내에 포함된 하나 이상의 정서 단어의 수치화된 값을 평균 내어 3차원 정서 차원 공간상 재매핑한다(S550). 재매핑된 각각의 정서 단어를 통해 제1텍스트의 정서 흐름 상태를 얻기 위해 3차원의 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑한다(S560). 정서 원형 모형의 예는 도 8에 도시되어 있다. 정서 원형 모형 상에 설정된 기본 정서 중에서 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단 거리에 위치한 기본 정서를 제1텍스트의 특정 정서 상태로 선택하여 텍스트의 정서 흐름을 분석한다(S570). 즉 상술한 과정을 통해 제1텍스트의 정서 흐름을 분석하고, 역시 동일한 과정을 통해 제2텍스트의 정서 흐름을 분석할 수 있다. 서로 다른 제1텍스트와 제2텍스트에 대해 분석된 정서 흐름을 토대로 제1텍스트와 제2텍스트 사이의 동일한 단위 시간에 속하는 정서 단어의 정서 차원 공간상의 거리를 계산하여 서로 다른 텍스트간의 정서 흐름의 유사도를 판단할 수 있다(S580). 즉, 제1텍스트와 제2텍스트 사이의 정서 차원 공간상의 거리의 합이 짧을수록 서로 다른 텍스트 간 정서 흐름이 유사함을 알 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 유무선 통신망으로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
100 : 정서 분석 장치 110 : 정서 단어 추출부
120 : 정서 차원 공간 매핑부 130 : 정서 원형 모형 매핑부
140 : 정서 선택부 150 : 정규화부
160 : 유사도 판단부 210 : 형태소 분석부
220 : 정서 단어 데이터베이스부 230 : 정서 단어 분류부

Claims (19)

  1. 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 추출하는 정서 단어 추출부;
    상기 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 정서 차원 공간상 수치화된 값으로 매핑하는 정서 차원 공간 매핑부;
    상기 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 상기 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 정서 원형 모형 매핑부; 및
    상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 정서 단어와 최단거리에 위치한 기본 정서를 상기 텍스트의 특정 정서 상태로 선택하는 정서 선택부;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  2. 제 1항에 있어서,
    상기 정서 차원 공간 매핑부는 상기 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화를 각각의 축으로 하여 상기 정서 단어에 해당하는 수치화된 값을 토대로 2차원 공간상 매핑하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  3. 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 정서 단어 추출부;
    상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하는 정서 차원 공간 매핑부;
    상기 매핑된 각각의 정서 단어를 통해 상기 텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 정서 원형 모형 매핑부; 및
    상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로서 상기 텍스트의 정서 흐름을 분석하는 정서 분석부;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  4. 입력된 제1텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 정서 단어 추출부;
    상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하고 정서 차원 공간 매핑부;
    상기 시간 차원을 동일한 단위 시간으로 나누어 상기 단위 시간 내에 포함된 하나 이상의 정서 단어의 수치화된 값을 평균내어 3차원 정서 차원 공간상 재매핑하는 정규화부;
    상기 매핑된 각각의 정서 단어를 통해 상기 제1텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 복수의 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 정서 원형 모형 매핑부;
    상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로서 상기 제1텍스트의 정서 흐름을 분석하는 정서 분석부; 및
    상기 제1텍스트와 다른 텍스트인 제2텍스트에 대해 분석된 정서 흐름을 토대로 상기 제1텍스트와 상기 제2텍스트 사이의 동일한 단위 시간에 속하는 정서 단어의 정서 차원 공간상의 거리를 계산하여 서로 다른 텍스트 간의 정서 흐름의 유사도를 판단하는 유사도 판단부;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  5. 제 4항에 있어서,
    상기 유사도 판단부는 상기 제1텍스트와 상기 제2텍스트 사이의 정서 차원 공간상의 거리의 합이 짧을수록 서로 다른 텍스트 간 정서 흐름이 유사한 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  6. 제 3항 또는 제 4항에 있어서,
    상기 정서 차원 공간 매핑부는 쾌-불쾌 및 활성화-비활성화를 축으로 하는 2차원 정서 차원 공간상에 시간 축을 추가하여 상기 추출된 각각의 정서 단어를 순차적으로 3차원 공간상 매핑하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  7. 청구항 7은(는) 설정등록료 납부시 포기되었습니다.
    제 1항, 제 3항 또는 제 4항 중 어느 한 항에 있어서,
    상기 정서 단어 추출부는,
    상기 텍스트에서 형태소를 추출하여 분석하는 형태소 분석부;
    사전에 설정된 정서 단어 목록이 저장되어 있으며, 상기 정서 단어별로 쾌-불쾌 값과 활성화-비활성화 값이 정해져 있는 정서 단어 데이터베이스부; 및
    상기 분석된 형태소를 토대로 상기 정서 단어 데이터베이스부와 매칭하여 정서 단어를 분류하는 정서 단어 분류부;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  8. 청구항 8은(는) 설정등록료 납부시 포기되었습니다.
    제 1항, 제 3항 또는 제 4항 중 어느 한 항에 있어서,
    상기 정서 원형 모형은 쾌-불쾌 및 활성화-비활성화를 각각의 지름축으로 하는 원형 모형을 하고 있으며, 상기 원형 모형 내부에 정서 상태를 언어적으로 분류하기 위한 정서를 다수 포함하고 있으며, 상기 원형 모형 경계상에 기본적인 정서 상태를 나타내는 기본 정서를 포함하고 있어 상기 기본 정서가 정서 원형 모형 상에 어느 곳에 위치하는지를 나타내는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  9. 청구항 9은(는) 설정등록료 납부시 포기되었습니다.
    제 1항, 제 3항 또는 제 4항 중 어느 한 항에 있어서,
    상기 기본 정서는 놀람, 공포, 화남, 혐오, 슬픔, 행복인 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 장치.
  10. (a) 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 추출하는 단계;
    (b) 상기 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 정서 차원 공간상 수치화된 값으로 매핑하는 단계;
    (c) 상기 수치화되어 매핑된 정서 단어에 대한 특정 정서 상태를 얻기 위해 상기 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 단계; 및
    (d) 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 정서 단어와 최단거리에 위치한 기본 정서를 상기 텍스트의 특정 정서 상태로 선택하는 단계;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  11. 청구항 11은(는) 설정등록료 납부시 포기되었습니다.
    제 10항에 있어서,
    상기 (b) 단계는 상기 추출된 정서 단어를 쾌-불쾌 및 활성화-비활성화를 각각의 축으로 하여 상기 정서 단어에 해당하는 수치화된 값을 토대로 2차원 공간상 매핑하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  12. (a) 입력된 텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 단계;
    (b) 상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하는 단계;
    (c) 상기 매핑된 각각의 정서 단어를 통해 상기 텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 단계; 및
    (d) 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로써 상기 텍스트의 정서 흐름을 분석하는 단계;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  13. (a) 입력된 제1텍스트로부터 소정의 기준에 따라 정서 단어를 순차적으로 추출하는 단계;
    (b) 상기 추출된 각각의 정서 단어를 쾌-불쾌 및 활성화-비활성화 차원으로 분리하여 2차원의 정서 차원 공간상 수치화된 값으로 매핑하고, 시간 차원을 추가하여 순차적으로 추출된 각각의 정서 단어를 순서대로 3차원의 정서 차원 공간상 매핑하는 단계;
    (c) 상기 시간 차원을 동일한 단위 시간으로 나누어 상기 단위 시간 내에 포함된 하나 이상의 정서 단어의 수치화된 값을 평균내어 3차원 정서 차원 공간상 재매핑하는 단계;
    (d) 상기 재매핑된 각각의 정서 단어를 통해 상기 제1텍스트의 정서 흐름 상태를 얻기 위해 상기 3차원의 정서 차원 공간의 값을 기본 정서가 설정되어 있는 정서 원형 모형에 매핑하는 단계;
    (e) 상기 정서 원형 모형 상에 설정된 기본 정서 중에서 상기 정서 원형 모형 상에 매핑된 각각의 정서 단어와 최단거리에 위치한 기본 정서를 특정 정서 상태로 선택함으로써 상기 제1텍스트의 정서 흐름을 분석하는 단계; 및
    (f) 상기 제1텍스트와 다른 제2텍스트에 대해 분석된 정서 흐름을 토대로 상기 제1텍스트와 상기 제2텍스트 사이의 동일한 단위 시간에 속하는 정서 단어의 정서 차원 공간상의 거리를 계산하여 서로 다른 텍스트간의 정서 흐름의 유사도를 판단하는 단계;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  14. 청구항 14은(는) 설정등록료 납부시 포기되었습니다.
    제 13항에 있어서,
    상기 (f) 단계는 상기 제1텍스트와 상기 제2텍스트 사이의 정서 차원 공간상의 거리의 합이 짧을수록 서로 다른 텍스트 간 정서 흐름이 유사한 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  15. 청구항 15은(는) 설정등록료 납부시 포기되었습니다.
    제 12항 또는 제 13항에 있어서,
    상기 (b) 단계는 쾌-불쾌 및 활성화-비활성화를 축으로 하는 2차원 정서 차원 공간상에 시간 축을 추가하여 상기 추출된 각각의 정서 단어를 순차적으로 3차원 공간상 매핑하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  16. 청구항 16은(는) 설정등록료 납부시 포기되었습니다.
    제 10항, 제 12항 또는 제 13항 중 어느 한 항에 있어서,
    상기 (a) 단계는,
    (a1) 상기 텍스트에서 형태소를 추출하여 분석하는 단계; 및
    (a2) 상기 분석된 형태소를 토대로 사전에 설정된 정서 단어 목록과 상기 정서 단어별로 쾌-불쾌 값과 활성화-비활성화 값이 저장되어 있는 정서 단어 데이터베이스부를 매칭하여 정서 단어를 분류하는 단계;를 포함하는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  17. 청구항 17은(는) 설정등록료 납부시 포기되었습니다.
    제 10항, 제 12항 또는 제 13항 중 어느 한 항에 있어서,
    상기 정서 원형 모형은 쾌-불쾌 및 활성화-비활성화를 각각의 지름축으로 하는 원형 모형을 하고 있으며, 상기 원형 모형 내부에 정서 상태를 언어적으로 분류하기 위한 정서를 다수 포함하고 있으며, 상기 원형 모형 경계상에 기본적인 정서 상태를 나타내는 기본 정서를 포함하고 있어 상기 기본 정서가 정서 원형 모형 상에 어느 곳에 위치하는지를 나타내는 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  18. 청구항 18은(는) 설정등록료 납부시 포기되었습니다.
    제 10항, 제 12항 또는 제 13항 중 어느 한 항에 있어서,
    상기 기본 정서는 놀람, 공포, 화남, 혐오, 슬픔, 행복인 것을 특징으로 하는 텍스트의 정서 단어 추출을 통한 정서 분석 방법.
  19. 청구항 19은(는) 설정등록료 납부시 포기되었습니다.
    제 10항 내지 제 14항 중 어느 한 항에 기재된 텍스트의 정서 단어 추출을 통한 정서 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020110143348A 2011-12-27 2011-12-27 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체 KR101315734B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110143348A KR101315734B1 (ko) 2011-12-27 2011-12-27 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110143348A KR101315734B1 (ko) 2011-12-27 2011-12-27 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체

Publications (2)

Publication Number Publication Date
KR20130075124A KR20130075124A (ko) 2013-07-05
KR101315734B1 true KR101315734B1 (ko) 2013-10-10

Family

ID=48989072

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110143348A KR101315734B1 (ko) 2011-12-27 2011-12-27 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체

Country Status (1)

Country Link
KR (1) KR101315734B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016186362A1 (ko) * 2015-05-19 2016-11-24 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
KR101712291B1 (ko) 2015-12-14 2017-03-13 강원대학교산학협력단 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101330158B1 (ko) * 2013-07-12 2013-11-15 주식회사 메조미디어 텍스트의 감정지수 분석 방법 및 컴퓨터 판독 가능한 기록 매체
KR102238971B1 (ko) 2014-02-21 2021-04-12 엘에스전선 주식회사 Dc용 케이블의 종단접속함
CN109471930B (zh) * 2018-11-08 2021-09-14 浙江大学城市学院 一种面向用户情感的情绪板界面设计方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090034052A (ko) * 2007-10-02 2009-04-07 동국대학교 산학협력단 감정정보 추출 장치 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090034052A (ko) * 2007-10-02 2009-04-07 동국대학교 산학협력단 감정정보 추출 장치 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
저용웅 외1 명,'Fuzzy-Weighted Score를 이용한 쾌적 감성 평가 모형', IE Interface, vol.18, No.2, pp.158-166, 2005.6 *
저용웅 외1 명,'Fuzzy-Weighted Score를 이용한 쾌적 감성 평가 모형', IE Interface, vol.18, No.2, pp.158-166, 2005.6*

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016186362A1 (ko) * 2015-05-19 2016-11-24 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
KR20160136054A (ko) * 2015-05-19 2016-11-29 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
KR101713258B1 (ko) * 2015-05-19 2017-03-09 트윈워드 주식회사 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
KR101712291B1 (ko) 2015-12-14 2017-03-13 강원대학교산학협력단 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Also Published As

Publication number Publication date
KR20130075124A (ko) 2013-07-05

Similar Documents

Publication Publication Date Title
Rangel et al. Overview of the 6th author profiling task at pan 2018: multimodal gender identification in twitter
Chandrasekaran et al. Multimodal sentimental analysis for social media applications: A comprehensive review
Poria et al. A review of affective computing: From unimodal analysis to multimodal fusion
CN106503192B (zh) 基于人工智能的命名实体识别方法及装置
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
Ombabi et al. Deep learning framework based on Word2Vec and CNNfor users interests classification
CN108197282B (zh) 文件数据的分类方法、装置及终端、服务器、存储介质
KR101613259B1 (ko) 소셜 네트워크 서비스 사용자의 감성 분석 시스템 및 그 방법
KR102073979B1 (ko) 음성신호 기반 인공지능을 이용한 감정분석을 제공하는 감성일기 서비스 제공 서버 및 방법
Rozgic et al. Emotion Recognition using Acoustic and Lexical Features.
KR101315734B1 (ko) 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
Al Marouf et al. Recognizing language and emotional tone from music lyrics using IBM Watson Tone Analyzer
Boishakhi et al. Multi-modal hate speech detection using machine learning
Chauhan et al. M2h2: A multimodal multiparty hindi dataset for humor recognition in conversations
JP6649318B2 (ja) 言語情報分析装置および方法
CN108810625A (zh) 一种多媒体数据的播放控制方法、装置及终端
Malandrakis et al. Sail: Sentiment analysis using semantic similarity and contrast features
Tiwari et al. A novel approach for detecting emotion in text
CN109727091A (zh) 基于对话机器人的产品推荐方法、装置、介质及服务器
Rozental et al. Amobee at SemEval-2017 Task 4: deep learning system for sentiment detection on Twitter
Wei et al. Improving speech emotion recognition based on acoustic words emotion dictionary
Hegde et al. Do Images really do the Talking? Analysing the significance of Images in Tamil Troll meme classification
Marukatat et al. Authorship attribution analysis of thai online messages
Walha et al. A Lexicon approach to multidimensional analysis of tweets opinion
Guellil et al. Sexism detection: The first corpus in Algerian dialect with a code-switching in Arabic/French and English

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161004

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181001

Year of fee payment: 6