KR101334196B1 - 지능형 감성 추론장치 및 그 추론방법 - Google Patents

지능형 감성 추론장치 및 그 추론방법 Download PDF

Info

Publication number
KR101334196B1
KR101334196B1 KR1020110110687A KR20110110687A KR101334196B1 KR 101334196 B1 KR101334196 B1 KR 101334196B1 KR 1020110110687 A KR1020110110687 A KR 1020110110687A KR 20110110687 A KR20110110687 A KR 20110110687A KR 101334196 B1 KR101334196 B1 KR 101334196B1
Authority
KR
South Korea
Prior art keywords
emotional
word
phrase
emotion
words
Prior art date
Application number
KR1020110110687A
Other languages
English (en)
Other versions
KR20120047802A (ko
Inventor
박외진
이세화
고의열
염익준
황승원
Original Assignee
(주)아크릴
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)아크릴 filed Critical (주)아크릴
Priority to US13/882,066 priority Critical patent/US20130226561A1/en
Priority to EP11836651.7A priority patent/EP2634712A2/en
Priority to PCT/KR2011/008120 priority patent/WO2012057559A2/ko
Priority to JP2013536522A priority patent/JP2013541787A/ja
Publication of KR20120047802A publication Critical patent/KR20120047802A/ko
Application granted granted Critical
Publication of KR101334196B1 publication Critical patent/KR101334196B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

지능형 감성 추론장치 및 그 추론방법이 개시된다. 본 실시예에 따른 인간의 감성을 구분한 기본 감성군과 상기 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 감성단어 저장부; 사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 문장 변환부; 상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 매칭 확인부; 및 상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 감성 추론부를 포함하는 것을 특징으로 하는 지능형 감성 추론장치를 포함하는 것을 특징으로 한다.

Description

지능형 감성 추론장치 및 그 추론방법{Intelligent Affect Deducing Apparatus and Method therefor}
본 실시예는 지능형 감성 추론장치 및 그 추론방법에 관한 것이다. 보다 상세하게는, 확률모델 방법을 이용하여 사용자의 감성상태를 추론하고 추론된 결과에 따라 적응적으로 감성을 표출할 수 있는 지능형 감성 추론장치 및 그 추론방법에 관한 것이다.
최근, 인터넷의 보급은 무선 인터넷으로까지 널리 확장되어 보급되고 있으며, 그에 따라 사용자들은 유선 컴퓨터를 통해서뿐만 아니라, PDA(Personal Digital Assistant), 노트북, 휴대폰, 스마트폰 등과 같은 이동통신 단말기를 이용하여 이동하는 중에도 다른 유선 또는 무선 통신 단말기의 사용자와 통신이 가능하게 되었다. 이와 같은 유선 및 무선 통신은 단순히 음성 신호나 데이터 파일의 교환에 그치지 않고, 메신저를 이용하여 문자로 다른 사용자와 대화를 하거나 자신 또는 다른 통신 사용자의 블로그(Blog)를 방문하여 문자기록 작성, 이미지 또는 동영상 업로드 등의 활동을 통해 온라인상의 새로운 커뮤니티(Community)를 형성하기도 한다.
이와 같이 온라인상에 형성된 커뮤니티 내의 커뮤니케이션 활동 중에는 오프라인에서와 마찬가지로 자신의 감정상태를 다른 사용자에게 표현하거나 다른 사용자의 감정 상태를 추측할 필요가 종종 있다. 이를 위해 온라인상의 커뮤니티 서비스 제공업자들은 다양한 방법으로 사용자의 감정상태를 표현하거나 추측할 수 있도록 하고 있다. 예를 들어, 메신저를 이용한 커뮤니티 서비스 제공업자는 감정상태에 대응하는 다양한 이모티콘 선택메뉴를 제공하며, 사용자가 자신의 감정상태에 따라 이모티콘을 선택할 수 있도록 함으로써 대화창을 통해 사용자의 감정상태가 표시되도록 한다. 또한, 대화창 또는 게시판을 통해 사용자가 입력하는 문장 중에 특정 단어가 있는지를 검색하며 그 특정 단어가 검색되는 경우에는 그에 대응하는 아이콘이 표시되도록 함으로써 문장의 입력에 따른 감정표현이 자동으로 이루어지도록 하기도 한다.
그런데, 인간의 감정은 항상 고정되어 있는 것이 아니라, 상황이나 장소, 분위기 등에 따라 시시각각 변화되는 것이 일반적이며, 이와 같이 상황 또는 환경에 따라 변화되는 감정을 사용자가 매번 이모티콘을 선택하여 변경하기란 상당히 번거로운 일이다.
또한, 감정 또는 느낌은 다분히 개인적인 속성을 가지는데, 이러한 인간의 감정을 좌우하는 심리적인 요인은 크게 놀람, 공포, 혐오, 노여움, 기쁨, 행복, 슬픔 등으로 나누어질 수 있다. 그런데, 동일한 상황에 대해서도 개개인이 느끼는 심리적인 요인은 다를 수 있으며, 표출되는 감성의 강도도 개인에 따라 다양한 차이를 나타낼 수 있다. 그럼에도 불구하고, 사용자가 입력하는 문장에서 특정 단어를 검색하여 획일적으로 표현하는 것은 해당 개인의 현재의 감정상태에 대한 정확한 표현이 되지 못하는 문제점이 있다.
본 실시예는 전술한 문제점을 해결하기 위하여 창안된 것으로서, 확률모델 방법을 이용하여 사용자의 감성상태를 추론하고 추론된 결과에 따라 적응적으로 감성을 표출할 수 있는 지능형 감성 추론장치 및 그 추론방법을 제공하는 것을 목적으로 한다.
전술한 목적을 달성하기 위해 본 실시예의 일 측면에 의하면, 인간의 감성을 구분한 기본 감성군과 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 감성단어 저장부; 사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 문장 변환부; 변환된 단어 및 구문 중 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 매칭 확인부; 및 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 확률 모델에 따라 감성을 추론하는 감성 추론부를 포함하는 것을 특징으로 하는 지능형 감성 추론장치를 제공한다.
또한, 지능형 감성 추론장치는 매칭 확인부에 의해 확인된 단어 또는 구문에 기초하여 단어 및 단어, 단어 및 구문, 구문 및 구문을 포함하는 형태의 감성 로그를 저장하는 감성로그 저장부를 더 포함할 수 있다.
또한, 지능형 감성 추론장치는 사용자로부터 선택된 단어 또는 구문에 대한 감성 유추 요청신호를 수신하는 요청신호 수신부를 더 포함하며, 감성 추론부는 선택된 단어 또는 구문에 대하여 감성을 추론할 수 있다.
또한, 지능형 감성 추론장치는 단어 또는 구문에 대한 중립성 여부를 판단하는 중립성 판단부; 및 판단된 단어 또는 구문이 중립성 단어 또는 구문이 아닌 경우에 감성로그 저장부에 설정된 값 이상의 로그정보가 저장되어 있는지를 검색하는 로그정보 검색부를 더 포함하며, 감성 추론부는 설정된 값 이상의 로그정보가 저장된 경우에 판단된 단어 또는 구문에 대한 감성을 추론할 수 있다.
또한, 지능형 감성 추론장치는 감성로그 저장부에 설정된 값 이상의 로그정보가 없는 경우, 웹 탐색 함수를 호출하여 기 설정된 웹을 탐색하는 웹 탐색부를 더 포함하며, 감성로그 저장부는 기 설정된 웹으로부터 판단된 단어 또는 구문에 대한 로그정보를 획득하여 저장할 수 있다.
또한, 지능형 감성 추론장치는 판단된 단어 또는 구문에 대하여 감성 추론부에 의해 추론된 감성의 관련성을 측정하는 관련성 측정부; 및 측정된 관련성이 설정된 임계값을 초과하는 경우, 판단된 단어 또는 구문, 추론한 감성, 및 감성지수를 감성 단어사전에 추가하여 저장하는 감성단어 추가부를 더 포함할 수 있다.
또한, 감성단어 저장부는 동일한 감성 단어에 대하여 복수의 감성 클래스를 분류하며, 분류된 각각의 감성 클래스에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 분류하여 감성 단어사전으로 저장할 수 있다.
또한, 확률 모델은 전체 코퍼스(corpus)에서 특정 단어 또는 구문의 빈도수를 이용하여 특정 감성에 속할 확률을 계산하는 알고리즘이다.
또한, 감성단어 저장부는 사용자별로 로그되는 문장의 입력시간, 장소, 날씨 중 적어도 하나를 포함하는 환경정보, 사용자별 성별, 나이, 성격, 직업을 포함하는 프로파일 정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나가 다르게 추론되는 경우, 해당 사용자별로 감성 단어사전을 저장할 수 있다.
또한, 감성 추론부는 변환된 단어 및 구문 중 감성 단어사전에 존재하지 않는 단어와 구문을 N-그램(N-Gram)으로 분할 또는 병합한 단어 집합 정보를 생성하는 웹검색 준비부; 및 단어 집합 정보가 포함된 단어와 구문을 웹(Web)에서 수집하는 웹 검색을 수행한 수집 정보를 생성하는 웹 마이닝부를 포함하되, 수집 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다.
또한, 매칭 확인부는 변환된 단어 및 구문에 해당하는 언어에 대한 문법의 품사를 구분하고, 품사에 따른 기 설정된 가중치(Weight)를 변환된 단어 및 구문에 부여한 가중치 반영 정보를 생성하며, 감성 추론부는 가중치 반영 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다.
본 실시에의 다른 측면에 의하면, 인간의 감성을 구분한 기본 감성군과 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 단계; 사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 단계; 변환된 단어 및 구문 중 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 단계; 및 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 확률 모델에 따라 감성을 추론하는 단계를 포함하는 것을 특징으로 하는 지능형 감성 추론방법을 제공한다.
또한, 지능형 감성 추론방법은 확인된 단어 또는 구문에 기초하여 단어 및 단어, 단어 및 구문, 구문 및 구문을 포함하는 형태의 감성 로그를 저장하는 단계를 더 포함할 수 있다.
또한, 지능형 감성 추론방법은 사용자로부터 선택된 단어 또는 구문에 대한 감성 유추 요청신호를 수신하는 단계를 더 포함하며, 감성을 추론하는 단계는 선택된 단어 또는 구문에 대하여 감성을 추론할 수 있다.
또한, 지능형 감성 추론방법은 단어 또는 구문에 대한 중립성 여부를 판단하는 단계; 및 판단된 단어 또는 구문이 중립성 단어 또는 구문이 아닌 경우에 감성 로그에 설정된 값 이상의 로그정보가 저장되어 있는지를 검색하는 단계를 더 포함하며, 감성을 추론하는 단계는 설정된 값 이상의 로그정보가 저장된 경우에 판단된 단어 또는 구문에 대한 감성을 추론할 수 있다.
또한, 지능형 감성 추론방법은 감성 로그에 설정된 값 이상의 로그정보가 없는 경우, 웹 탐색 함수를 호출하여 기 설정된 웹을 탐색하는 단계; 및 기 설정된 웹으로부터 판단된 단어 또는 구문에 대한 로그정보를 획득하여 감성 정보로 저장하는 단계를 더 포함할 수 있다.
또한, 지능형 감성 추론방법은 판단된 단어 또는 구문에 대하여 감성 추론부에 의해 추론된 감성의 관련성을 측정하는 단계; 및 측정된 관련성이 설정된 임계값을 초과하는 경우, 판단된 단어 또는 구문, 추론한 감성, 및 감성지수를 감성 단어사전에 추가하여 저장하는 단계를 더 포함할 수 있다.
또한, 감성 단어사전으로 저장하는 단계는, 동일한 감성 단어에 대하여 복수의 감성 클래스를 분류하며, 분류된 각각의 감성 클래스에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 분류하여 감성 단어사전으로 저장할 수 있다.
또한, 확률 모델은 전체 코퍼스(corpus)에서 특정 단어 또는 구문의 빈도수를 이용하여 특정 감성에 속할 확률을 계산하는 알고리즘이다.
또한, 감성 단어사전으로 저장하는 단계는 사용자별로 로그되는 문장의 입력시간, 장소, 날씨 중 적어도 하나를 포함하는 환경정보, 사용자별 성별, 나이, 성격, 직업을 포함하는 프로파일 정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나가 다르게 설정되는 경우, 해당 사용자별로 감성 단어사전을 저장할 수 있다.
또한, 감성을 추론하는 단계는, 변환된 단어 및 구문 중 감성 단어사전에 존재하지 않는 단어와 구문을 N-그램(N-Gram)으로 분할 또는 병합한 단어 집합 정보를 생성하는 웹검색 준비 단계; 및 단어 집합 정보가 포함된 단어와 구문을 웹(Web)에서 수집하는 웹 검색을 수행한 수집 정보를 생성하는 웹 마이닝 단계를 포함하되, 수집 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다.
또한, 매칭되는 단어 또는 구문을 확인하는 단계는, 변환된 단어 및 구문에 해당하는 언어에 대한 문법의 품사를 구분하고, 품사에 따른 기 설정된 가중치(Weight)를 변환된 단어 및 구문에 부여한 가중치 반영 정보를 생성하되, 감성을 추론하는 단계에서 가중치 반영 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다.
본 실시예에 따르면, 확률모델 방법을 이용하여 사용자의 감성상태를 추론하고 추론된 결과에 따라 대응하는 감성을 자동으로 표출할 수 있도록 함으로써, 경험적으로 취득되는 감성 정보에 따라 사용자의 감성을 적응적으로 표현하는 것이 가능하게 된다.
또한, 본 실시예에 따르면, 장소, 날씨, 시간 등과 같은 사용자의 주변 환경을 고려하여 그에 따라 감성 강도, 긍정 또는 부정 여부 등을 다르게 함으로써 주변 환경에 따른 적응적인 감성 표현을 할 수 있게 된다.
도 1은 본 실시예에 따른 지능형 감성 추론장치를 개략적으로 도시한 도면이다.
도 2는 본 실시예에 따른 감성 단어사전의 예를 나타낸 도면이다.
도 3은 저장되는 감성 로그정보의 예를 나타낸 도면이다.
도 4는 웹 탐색부에 의한 로그정보 획득의 예를 나타낸 도면이다.
도 5는 본 실시예에 따른 지능형 감성 추론방법을 나타낸 흐름도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
도 1은 본 실시예에 따른 지능형 감성 추론장치를 개략적으로 도시한 도면이다. 도 1을 참조하면, 본 실시예에 따른 감성 추론장치(100)는 감성단어 저장부(102), 문장 변환부(104), 매칭 확인부(106), 감성 추론부(107), 감성로그 저장부(110), 요청신호 수신부(112), 중립성 판단부(114), 로그정보 검색부(116), 웹 탐색부(118), 관련성 측정부(120) 및 감성단어 추가부(122)를 포함할 수 있다. 여기서, 지능형 감성 추론장치(100)는 사용자에 의해 입력되는 문장에 기초하여 감성을 추론하는 것으로 설명하지만, 본 실시예는 문장 이외에도 사용자에 의해 입력되는 음성에 기초하여 감성을 추론할 수도 있다. 이 경우, 사용자의 음성에 대한 음색, 음톤 등에 기초하여 감성을 추론할 수 있으며, 음색 또는 음톤을 분류하는 방법은 공지의 기술을 따르므로 이에 대한 설명은 생략한다.
감성단어 저장부(102)는 인간의 감성을 구분한 기본 감성군과 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장한다. 여기서, 기본 감성군은 약 8개의 군으로 형성될 수 있으며, 세부 감성군은 약 33개의 군으로 형성될 수 있으나 반드시 이에 한정되는 것은 아니다. 또한, 기본 감성군과 세부 감성군의 조합된 합성 감성군을 형성할 수도 있다. 이러한, 기본 감성군, 세부 감성군 및 세부 감성군은 감성 클래스에 포함되며, 감성 클래스는 감성 모듈로 적용될 수 있을 것이다. 감성은 자극이나 자극의 변화를 느끼는 성질로서, 놀람, 공포, 혐오, 노여움, 기쁨, 행복, 슬픔 등과 같은 심리적인 요인에 의해 좌우된다. 그런데, 동일한 자극에 대해서도 개인마다 느끼는 감성이 다를 수 있으며, 감성의 강도 또한 다를 수 있다. 이와 같은 성질을 감안하여 감성단어 저장부(102)는 행복하다, 창피하다, 허탈하다 등과 같은 감성단어에 대하여 각각의 감성 클래스를 분류하며, 분류된 감성 클래스에 대한 유사성, 긍정 또는 부정도, 감성 강도 등을 분류하여 감성 단어사전으로 저장한다. 여기서, 감성 클래스는 만족, 그리움, 행복 등과 같은 인간의 내적 감정상태들을 분류한 것으로서 본 실시예에서는 전체를 약 77개의 감성 클래스로 분류하고 그 중, 해당 단어가 속하는 감성 클래스를 매칭시킬 수 있다. 여기서, 감성 클래스의 개수는 분류 가능한 감성의 종류의 예시일 뿐이며, 이에 한정하는 것은 아니다. 유사성은 해당 단어와 감성 클래스 내의 항목 간의 유사도를 나타내는 것으로서 일정한 범위 내의 수치로 표현할 수 있다. 긍정 또는 부정도는 해당 단어의 속성이 긍정적인 감성인지 또는 부정적인 감성인지를 나타내는 정도로서 0을 기준으로 일정한 범위 내의 음의 수 또는 양의 수로 표현할 수 있다. 감성 강도는 해당 단어의 속성 중 감성에 대한 세기를 나타내며, 일정한 범위 내의 수치로 표현할 수 있다. 도 2는 본 실시예에 따른 감성 단어사전의 예를 나타낸 도면으로서, 여기서는 유사성은 0 내지 10의 범위 내의 수치로 표현하였으며, 긍정 또는 부정도는 0, 1 또는 -1로 표현하였고, 감성 강도는 0 내지 10의 수치로 표현하였다. 그러나, 이와 같은 수치는 도시한 범위에 한정되는 것이 아니며 다양한 변형이 가능하다. 예를 들어, 긍정 또는 부정도는 -1 내지 1의 범위 내에서 0.1 단위의 수치로 표현될 수 있으며, 유사성이나 감성 강도 또한 0 내지 1의 범위 내에서 0.1 단위의 수치로 표현될 수도 있다. 또한, 도 2의 간지럽다, 따뜻하다, 뭉클하다 등과 같이 감성단어 저장부(102)는 동일한 감성 단어에 대하여 복수의 감성 클래스를 분류할 수 있으며, 이 경우 분류된 각각의 감성 클래스에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 분류하여 감성 단어사전으로 저장할 수 있다. 또한, 동일한 감성단어라고 하더라도 사용자별로 로그되는 문장의 입력시간, 장소, 날씨 중 적어도 하나를 포함하는 환경정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도가 달라지거나, 사용자별 성별, 나이, 성격, 직업을 포함하는 프로파일 정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도가 달라질 수 있는데, 감성단어 저장부(102)는 사용자별 환경정보 및 프로파일 정보를 고려하여 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나가 다르게 추론되는 경우에는 사용자별 감성 로그정보에 기초하여 사용자별 감성 단어사전을 설정하여 저장할 수도 있다.
문장 변환부(104)는 사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환한다. 즉, 문장 변환부(104)는 사용자에 의해 로그되는 문장에 대하여 1차적으로 복수의 단어로 분절한 후 기본형으로 변환할 수 있으며, 분절된 단어들 중 관용적으로 사용되는 단어와 단어의 조합을 통해 구문을 파악한 후 기본형으로 변환할 수 있다.
매칭 확인부(106)는 문장 변환부(104)에 의해 변환된 각각의 단어 및 구문을 감성단어 저장부(102)에 저장된 감성 단어사전과 비교하여 매칭되는 단어 또는 구문을 확인한다.
한편, 매칭 확인부(106)는 문장 변환부(104)에 의해 변환된 단어 및 구문에 해당하는 언어에 대한 문법의 품사를 구분하고, 품사에 따른 기 설정된 가중치(Weight)를 변환된 단어 및 구문에 부여한 가중치 반영 정보를 생성한다. 매칭 확인부(106)가 가중치 반영 정보를 생성한 경우, 감성 추론부(107)는 가중치 반영 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다. 즉, 매칭 확인부(106)는 문장 변환부(104)에 의해 변환된 단어 및 구문에서 각 품사의 역할을 확인하고, 해당 역할에 따른 가중치를 부여할 수 있는 것이다. 여기서, 가중치는 경험적 수치로도 표현될 수 있다.
감성 추론부(107)는 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 확률 모델에 따라 감성을 추론할 수 있다. 예를 들어, 문장 변환부(104)에 의해 기본형으로 변환된 단어 중 '벅차다'라는 단어가 감성 단어사전의 '감동'의 감성 클래스와 매칭된다고 가정하면, 감성 추론부(107)는 '벅차다'라는 단어와 기본형으로 변환된 다른 단어 또는 구문의 조합에 기초하여 확률 모델을 적용하고, 적용된 확률 모델에 따라 감성을 추론할 수 있다. 여기서, 확률 모델은 전체 코퍼스(corpus)에서 특정 단어 또는 구문의 빈도수를 이용하여 특정 감성에 속할 확률을 계산하는 알고리즘으로서, 이를 바탕으로 새로운 단어가 특정 감성에 속할 확률을 계산할 수 있다. 예를 들어, 수학식 1에 나타낸 바와 같이 코퍼스 내에서 새로운 단어 W의 전체 빈도수에 대한 코퍼스 내의 문장에서 새로운 단어 W와 특정 감성 C가 조합으로 사용된 빈도수를 계산하여 새로운 단어에 대한 감성 유사도를 유추할 수 있다.
Figure 112011084501789-pat00001
또한, 단어 유사도(Co-occurrence similarity)를 구하기 위하여 PMI(Pointwise Mutual Information)를 이용할 수 있다. 이때, PMI는 수학식 2와 같이 계산될 수 있다.
Figure 112011084501789-pat00002
PMI와 유사한 식으로 Dice 계수 Dice(W,C)를 이용할 수도 있다.
Figure 112011084501789-pat00003
감성 유사도를 유추하는 계산식은 제시된 식에 한정되는 것은 아니며, 다양한 변형이 가능하다.
감성 추론부(107)는 이와 같은 방식으로 < 단어 + 단어 >, < 단어 + 구문 > 및 < 구문 + 구문 >에 대한 감성을 추론한 후, 추론한 각각의 감성을 조합하여 문장 전체에 대한 감성을 추론할 수도 있다.
한편, 감성 추론부(107)는 웹검색 준비부(108) 및 웹 마이닝부(109)를 포함한다. 웹검색 준비부(108)는 변환된 단어 및 구문 중 감성 단어사전에 존재하지 않는 단어와 구문을 N-그램(N-Gram)으로 분할 또는 병합한 단어 집합 정보를 생성한다. 웹 마이닝부(109)는 웹검색 준비부(108)의 단어 집합 정보가 포함된 단어와 구문을 웹(Web)에서 수집하는 웹 검색을 수행한 수집 정보를 생성한다. 즉, 감성 추론부(107)는 웹 마이닝부(109)의 의한 수집 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다. 여기서, N-그램은 바이그램(Bigram), 모노그램(Monogram) 및 트라이그램(Trigram) 중 적어도 하나 이상을 포함한다. 즉, N-그램이란 언어모델 추정 시 N개의 단어쌍으로 이루어지는 단어열을 말하며, 모노그램은 한 개의 단어쌍으로 이루어지는 단어열을 말하며, 바이그램은 두 개의 단어쌍으로 이루어지는 단어열을 말하며, 트라이그램은 세 개의 단어들로 이루어진 단어열을 말한다. 한편, 웹 마이닝이란, 웹자원으로부터 의미있는 패턴, 프로파일, 추세 등을 발견하기 위하여 데이터마이닝 기술(많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여 실행 가능한 정보를 추출하고 의사결정에 이용하는 과정)을 말한다. 이러한 웹 마이닝의 활용분야에는 정보 필터링, 경쟁자 기술개발 감시, 이용도 분석을 위한 웹 액세스 로그의 마이닝, 브라우징(고객의 웹에서의 이동경로 탐색) 지원 등이 있을 수 있다.
감성로그 저장부(110)는 매칭 확인부(106)에 의해 확인된 단어 또는 구문에 기초하여 단어 및 단어, 단어 및 구문, 구문 및 구문을 포함하는 형태의 감성 로그를 저장한다. 즉, 감성로그 저장부(110)는 새로운 단어에 대한 감성 유추를 위해 사용자에 의해 로그되는 문장들을 의미있는 단어 및 단어, 단어 및 구문, 구문 및 구문의 조합으로 저장한다. 예를 들어, 감성로그 저장부(110)는 매칭 확인부(106)에 의해 "사랑함"이라는 감성을 가지는 것으로 확인된 "사랑하다"라는 기본형의 단어를, 문장 내의 감성이 없는 단어인 "완소" 및 "친구"와 각각 결합하여 <완소-사랑하다>, <친구-사랑하다>의 2개의 감성 로그를 생성하여 저장할 수 있다. 이때, 감성 로그는 도 3에 도시한 바와 같이, 시간정보를 함께 저장할 수 있다. 이때, 감성 로그정보와 함께 저장되는 정보는 시간정보에 한정되지 않으며, 날씨정보, 사용자의 위치정보 등이 함께 저장될 수도 있다.
요청신호 수신부(112)는 사용자로부터 선택된 단어 또는 구문에 대한 감성 유추 요청신호를 수신할 수 있다. 즉, 사용자는 로그한 문장 중의 특정 단어 또는 구문에 대하여 감성 유추를 요청할 수 있으며, 요청신호 수신부(112)를 그에 대한 감성유추 요청신호를 수신한다. 이 경우, 감성 추론부(107)는 요청신호 수신부(112)를 통해 수신된 감성유추 요청신호에 대응하여 사용자에 의해 선택된 단어 또는 구문에 대해서만 감성을 추론할 수 있다.
중립성 판단부(114)는 단어 또는 구문에 대한 중립성 여부를 판단한다. 여기서, 중립성은 단어 또는 구문에 대한 감성이 존재하지 않음을 의미한다. 일반적으로 강아지, 책상 등과 같은 동물이나 사물의 명칭, 나, 너, 우리 등과 같은 지칭어, 사람의 이름 등이 중립성인 단어로 판단될 수 있다. 이때, 중성의 단어 또는 구문을 사전으로 저장하는 중성 단어사전이 따로 마련될 수 있으며, 이 경우 중립성 판단부(114)는 중립으로 판단된 단어 또는 구문에 대하여 전체 코퍼스 내에서의 빈도수를 측정하고 해당 단어 또는 구문과 함께 중성 단어사전에 추가할 수 있다.
로그정보 검색부(116)는 중립성 판단부(114)에 의해 해당 단어 또는 구문이 중립성이 아닌 것으로 판단된 경우, 감성로그 저장부(110)에 설정된 값 이상의 로그정보가 저장되어 있는지를 검색한다. 즉, 로그정보 검색부(116)는 해당 단어 또는 구문이 중립성이 아닌 경우에, 감성로그 저장부(110)에 해당 단어 또는 구문이 설정된 횟수 이상으로 저장되어 있는지를 검색한다. 이때, 감성 추론부(107)는 로그정보 검색부(116)를 통해 해당 단어 또는 구문이 감성로그 저장부(110)에 설정된 횟수 이상으로 저장된 경우에만 해당 단어 또는 구문과 조합된 구문 또는 문장에 대해서 감성을 추론하도록 구현될 수 있다.
만일, 로그정보 검색부(116)에 의해 해당 단어 또는 구문이 감성로그 저장부(110)에 설정된 횟수 미만으로 저장된 것으로 판단된 경우, 감성 추론부(107)는 해당 단어 또는 구문에 대한 감성 추론을 위한 충분한 로그정보가 없는 것으로 판단할 수 있다. 이 경우, 웹 탐색부(118)는 웹 탐색 함수를 호출하여 기 설정된 웹 사이트를 탐색하고, 그 웹 사이트로부터 해당 단어 또는 구문에 대한 로그정보를 획득할 수 있다. 예를 들어, "부부젤라"라는 단어에 대하여 웹 사이트를 탐색하는 경우, 웹 탐색부(118)는 해당 웹 사이트로부터 도 4에 도시한 바와 같이 <부부젤라, 짜증나다>, <부부젤라, 괴롭다> 등과 같은 로그정보를 획득할 수 있다. 획득한 로그정보는 감성로그 저장부(110)에 저장될 수 있다.
관련성 측정부(120)는 웹 탐색부(118)에 의해 웹 사이트로부터 탐색된 로그정보에 기초하여 해당 단어 또는 구문에 대한 감성이 추론되는 경우, 감성 추론부(107)에 의해 추론된 감성과 해당 단어 또는 구문에 대한 관련성을 측정한다. 이와 같은 감성은 전술한 확률 모델에 기초하여 확률을 계산함으로써 측정될 수 있다.
감성단어 추가부(122)는 관련성 측정부(120)에 의해 측정된 관련성이 기 설정된 임계값을 초과하는 경우, 해당 단어 또는 구문, 추론한 감성, 및 감성지수를 감성 단어사전에 추가하여 저장할 수 있다. 예를 들어, 전술한 세 개의 확률 모델을 사용하여 확률을 계산함으로써 관련성을 측정하는 경우, 그 중 어느 하나의 확률 모델에 의해 계산된 값이 기 설정된 임계값을 초과하면 해당 단어 또는 구문, 추론한 감성, 및 감성지수를 감성 단어사전에 추가하여 저장할 수 있다.
도 5는 본 실시예에 따른 지능형 감성 추론방법을 나타낸 흐름도이다. 도 1 및 도 5를 참조하여 본 실시예에 따른 지능형 감성 추론방법을 상세하게 설명한다.
감성단어 저장부(102)는 인간의 감성을 구분한 기본 감성군과 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장한다(S501).
이때, 감성단어 저장부(102)는 동일한 감성 단어에 대하여 복수의 감성 클래스를 분류할 수 있으며, 이 경우 분류된 각각의 감성 클래스에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 분류하여 감성 단어사전으로 저장할 수 있다. 또한, 사용자별로 로그되는 문장의 입력시간, 장소, 날씨 중 적어도 하나를 포함하는 환경정보, 사용자별 나이, 성별, 성격, 직업을 포함하는 프로파일 정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나가 다르게 추론되는 경우에는 사용자별 감성 로그정보에 기초하여 사용자별 감성 단어사전을 설정하여 저장할 수도 있다.
문장 변환부(104)는 사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환한다(S503). 즉, 문장 변환부(104)는 사용자에 의해 로그되는 문장에 대하여 1차적으로 복수의 단어로 분절한 후 기본형으로 변환할 수 있으며, 분절된 단어들 중 관용적으로 사용되는 단어와 단어의 조합을 통해 구문을 파악한 후 기본형으로 변환할 수 있다.
매칭 확인부(106)는 문장 변환부(104)에 의해 변환된 각각의 단어 및 구문을 감성단어 저장부(102)에 저장된 감성 단어사전과 비교하여 매칭되는 단어 또는 구문을 확인한다(S505). 한편, 단계 S505에서 한편, 매칭 확인부(106)는 문장 변환부(104)에 의해 변환된 단어 및 구문에 해당하는 언어에 대한 문법의 품사를 구분하고, 품사에 따른 기 설정된 가중치를 변환된 단어 및 구문에 부여한 가중치 반영 정보를 생성할 수 있다. 즉, 매칭 확인부(106)가 가중치 반영 정보를 생성한 경우, 감성 추론부(107)는 가중치 반영 정보의 상호 존재에 기초하여 확률 모델을 적용할 수 있다. 여기서, 가중치는 경험적 수치로도 표현될 수 있다.
감성로그 저장부(110)는 매칭 확인부(106)에 의해 확인된 단어 또는 구문에 기초하여 단어 및 단어, 단어 및 구문, 구문 및 구문을 포함하는 형태의 감성 로그를 저장한다(S507). 즉, 감성로그 저장부(110)는 새로운 단어에 대한 감성 유추를 위해 사용자에 의해 로그되는 문장들을 의미있는 단어 및 단어, 단어 및 구문, 구문 및 구문의 조합으로 저장한다. 예를 들어, 감성로그 저장부(110)는 매칭 확인부(106)에 의해 "사랑함"이라는 감성을 가지는 것으로 확인된 "사랑하다"라는 기본형의 단어를, 문장 내의 감성이 없는 단어인 "완소" 및 "친구"와 각각 결합하여 <완소-사랑하다>, <친구-사랑하다>의 2개의 감성 로그를 생성하여 저장할 수 있다. 이때, 감성 로그는 도 3에 도시한 바와 같이, 시간정보를 함께 저장할 수 있다. 이때, 감성 로그정보와 함께 저장되는 정보는 시간정보에 한정되지 않으며, 날씨정보, 사용자의 위치정보 등이 함께 저장될 수도 있다.
요청신호 수신부(112)는 사용자로부터 선택된 단어 또는 구문에 대한 감성 유추 요청신호를 수신할 수 있다(S509). 즉, 사용자는 로그한 문장 중의 특정 단어 또는 구문에 대하여 감성 유추를 요청할 수 있으며, 요청신호 수신부(112)를 그에 대한 감성유추 요청신호를 수신할 수 있다.
중립성 판단부(114)는 단어 또는 구문에 대한 중립성 여부를 판단한다(S511). 여기서, 중립성은 단어 또는 구문에 대한 감성이 존재하지 않음을 의미한다. 일반적으로 강아지, 책상 등과 같은 동물이나 사물의 명칭, 나, 너, 우리 등과 같은 지칭어, 사람의 이름 등이 중립성인 단어로 판단될 수 있다.
로그정보 검색부(116)는 중립성 판단부(114)에 의해 해당 단어 또는 구문이 중립성이 아닌 것으로 판단된 경우(S513), 감성로그 저장부(110)에 설정된 값 이상의 로그정보가 저장되어 있는지를 검색한다(S515). 즉, 로그정보 검색부(116)는 해당 단어 또는 구문이 중립성이 아닌 경우에, 감성로그 저장부(110)에 해당 단어 또는 구문이 설정된 횟수 이상으로 저장되어 있는지를 검색한다.
감성로그에 설정된 값 이상의 로그정보가 저장된 경우, 감성 추론부(107)는 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 확률 모델에 따라 감성을 추론할 수 있다(S517). 이때, 감성 추론부(107)는 요청신호 수신부(112)를 통해 수신된 감성유추 요청신호에 대응하여 사용자에 의해 선택된 단어 또는 구문에 대해서만 감성을 추론할 수 있다. 또한, 감성 추론부(107)는 로그정보 검색부(116)를 통해 해당 단어 또는 구문이 감성로그 저장부(110)에 설정된 횟수 이상으로 저장된 경우에만 해당 단어 또는 구문과 조합된 구문 또는 문장에 대해서 감성을 추론하도록 구현될 수도 있다. 한편, 단계 S517에서 감성 추론부(107)는 구비된 웹검색 준비부(108)를 이용하여 변환된 단어 및 구문 중 감성 단어사전에 존재하지 않는 단어와 구문을 N-그램(N-Gram)으로 분할 또는 병합한 단어 집합 정보를 생성할 수 있다. 또한, 감성 추론부(107)는 구비된 웹 마이닝부(109)를 이용하여 웹검색 준비부(108)의 단어 집합 정보가 포함된 단어와 구문을 웹(Web)에서 수집하는 웹 검색을 수행한 수집 정보를 생성할 수 있다. 즉, 웹 마이닝부(109)의 의한 수집 정보가 생성된 경우 감성 추론부(107)는 상호 존재에 기초하여 확률 모델을 적용할 수 있다.
감성로그에 설정된 값 미만의 로그정보가 저정된 경우, 웹 탐색부(118)는 웹 탐색 함수를 호출하여 기 설정된 웹 사이트를 탐색하고(S519), 그 웹 사이트로부터 해당 단어 또는 구문에 대한 로그정보를 획득할 수 있다(S521).
관련성 측정부(120)는 웹 탐색부(118)에 의해 웹 사이트로부터 탐색된 로그정보에 기초하여 해당 단어 또는 구문에 대한 감성이 추론되는 경우, 감성 추론부(107)에 의해 추론된 감성과 해당 단어 또는 구문에 대한 관련성을 측정한다(S523). 이와 같은 감성은 전술한 확률 모델에 기초하여 확률을 계산함으로써 측정될 수 있다.
감성단어 추가부(122)는 관련성 측정부(120)에 의해 측정된 관련성이 기 설정된 임계값을 초과하는 경우(S525), 해당 단어 또는 구문, 추론한 감성, 및 감성지수를 감성 단어사전에 추가하여 저장할 수 있다(S527). 예를 들어, 전술한 세 개의 확률 모델을 사용하여 확률을 계산함으로써 관련성을 측정하는 경우, 그 중 어느 하나의 확률 모델에 의해 계산된 값이 기 설정된 임계값을 초과하면 해당 단어 또는 구문, 추론한 감성, 및 감성지수를 감성 단어사전에 추가하여 저장할 수 있다.
한편, 중립성 판단부(114)에 의해 해당 단어 또는 구문이 중립인 경우에는 해당 단어 또는 구문의 빈도수를 측정하여 해당 단어 또는 구문과 함께 중성 단어사전에 추가할 수 있다(S529). 단어 빈도수를 함께 저장하는 이유는 기존의 중립 단어의 뜻이 변하여 감성을 갖게 되는 경우를 고려한 것으로서, 일정 주기로 빈도수를 확인하여 감성 단어로의 변화를 반영할 수 있다.
이상에서, 본 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 지능형 감성 추론장치 102: 감성단어 저장부
104: 문장 변환부 106: 매칭 확인부
108: 감성 추론부 110: 감성로그 저장부
112: 요청신호 수신부 114: 중립성 판단부
116: 로그정보 검색부 118: 웹 탐색부
120: 관련성 측정부 122: 감성단어 추가부

Claims (22)

  1. 인간의 감성을 구분한 기본 감성군과 상기 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 감성단어 저장부;
    사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 문장 변환부;
    상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 매칭 확인부; 및
    상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 감성 추론부
    를 포함하되, 상기 감성단어 저장부는 상기 사용자별로 로그되는 문장의 입력시간, 장소, 날씨 중 적어도 하나를 포함하는 환경정보, 사용자별 성별, 나이, 성격, 직업을 포함하는 프로파일 정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나가 다르게 추론되는 경우, 해당 사용자별로 감성 단어사전을 저장하는 것을 특징으로 하는 지능형 감성 추론장치.
  2. 제 1항에 있어서,
    상기 매칭 확인부에 의해 확인된 단어 또는 구문에 기초하여 단어 및 단어, 단어 및 구문, 구문 및 구문을 포함하는 형태의 감성 로그를 저장하는 감성로그 저장부
    를 더 포함하는 것을 특징으로 하는 지능형 감성 추론장치.
  3. 제 1항에 있어서,
    상기 사용자로부터 선택된 단어 또는 구문에 대한 감성 유추 요청신호를 수신하는 요청신호 수신부
    를 더 포함하며,
    상기 감성 추론부는 상기 선택된 단어 또는 구문에 대하여 감성을 추론하는 것을 특징으로 하는 지능형 감성 추론장치.
  4. 제 2항에 있어서,
    단어 또는 구문에 대한 중립성 여부를 판단하는 중립성 판단부; 및
    상기 판단된 단어 또는 구문이 중립성 단어 또는 구문이 아닌 경우에 상기 감성로그 저장부에 설정된 값 이상의 로그정보가 저장되어 있는지를 검색하는 로그정보 검색부
    를 더 포함하며,
    상기 감성 추론부는 상기 설정된 값 이상의 로그정보가 저장된 경우에 상기 판단된 단어 또는 구문에 대한 감성을 추론하는 것을 특징으로 하는 지능형 감성 추론장치.
  5. 제 4항에 있어서,
    상기 감성로그 저장부에 설정된 값 이상의 로그정보가 없는 경우, 웹 탐색 함수를 호출하여 기 설정된 웹을 탐색하는 웹 탐색부
    를 더 포함하며,
    상기 감성로그 저장부는 상기 기 설정된 웹으로부터 상기 판단된 단어 또는 구문에 대한 로그정보를 획득하여 저장하는 것을 특징으로 하는 지능형 감성 추론장치.
  6. 제 5항에 있어서,
    상기 판단된 단어 또는 구문에 대하여 상기 감성 추론부에 의해 추론된 감성의 관련성을 측정하는 관련성 측정부; 및
    측정된 상기 관련성이 설정된 임계값을 초과하는 경우, 상기 판단된 단어 또는 구문, 상기 추론한 감성, 및 감성지수를 상기 감성 단어사전에 추가하여 저장하는 감성단어 추가부
    를 더 포함하는 것을 특징으로 하는 지능형 감성 추론장치.
  7. 제 1항에 있어서,
    상기 감성단어 저장부는,
    동일한 감성 단어에 대하여 복수의 감성 클래스를 분류하며, 상기 분류된 각각의 감성 클래스에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 분류하여 상기 감성 단어사전으로 저장하는 것을 특징으로 하는 지능형 감성 추론장치.
  8. 제 1항에 있어서,
    상기 확률 모델은 전체 코퍼스(corpus)에서 특정 단어 또는 구문의 빈도수를 이용하여 특정 감성에 속할 확률을 계산하는 알고리즘인 것을 특징으로 하는 지능형 감성 추론장치.
  9. 삭제
  10. 인간의 감성을 구분한 기본 감성군과 상기 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 감성단어 저장부;
    사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 문장 변환부;
    상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 매칭 확인부; 및
    상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 감성 추론부
    을 포함하되, 상기 감성 추론부는 상기 변환된 단어 및 구문 중 상기 감성 단어사전에 존재하지 않는 단어와 구문을 N-그램(N-Gram)으로 분할 또는 병합한 단어 집합 정보를 생성하는 웹검색 준비부; 및 상기 단어 집합 정보가 포함된 단어와 구문을 웹(Web)에서 수집하는 웹 검색을 수행한 수집 정보를 생성하는 웹 마이닝부를 포함하며, 상기 수집 정보의 상기 상호 존재에 기초하여 상기 확률 모델을 적용하는 것을 특징으로 하는 감성 추론장치.
  11. 제 1항에 있어서,
    상기 매칭 확인부는,
    상기 변환된 단어 및 구문에 해당하는 언어에 대한 문법의 품사를 구분하고, 상기 품사에 따른 기 설정된 가중치(Weight)를 상기 변환된 단어 및 구문에 부여한 가중치 반영 정보를 생성하며,
    상기 감성 추론부는 상기 가중치 반영 정보의 상기 상호 존재에 기초하여 상기 확률 모델을 적용하는 것을 특징으로 하는 감성 추론장치.
  12. 인간의 감성을 구분한 기본 감성군과 상기 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 단계;
    사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 단계;
    상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 단계; 및
    상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 단계
    를 포함하되, 상기 감성 단어사전으로 저장하는 단계는 상기 사용자별로 로그되는 문장의 입력시간, 장소, 날씨 중 적어도 하나를 포함하는 환경정보, 사용자별 성별, 나이, 성격, 직업을 포함하는 프로파일 정보에 따라 감성 클래스, 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나가 다르게 설정되는 경우, 해당 사용자별로 감성 단어사전을 저장하는 것을 특징으로 하는 지능형 감성 추론방법.
  13. 제 12항에 있어서,
    상기 확인된 단어 또는 구문에 기초하여 단어 및 단어, 단어 및 구문, 구문 및 구문을 포함하는 형태의 감성 로그를 저장하는 단계
    를 더 포함하는 것을 특징으로 하는 지능형 감성 추론방법.
  14. 제 12항에 있어서,
    상기 사용자로부터 선택된 단어 또는 구문에 대한 감성 유추 요청신호를 수신하는 단계
    를 더 포함하며,
    상기 감성을 추론하는 단계는 상기 선택된 단어 또는 구문에 대하여 감성을 추론하는 것을 특징으로 하는 지능형 감성 추론방법.
  15. 제 12항에 있어서,
    단어 또는 구문에 대한 중립성 여부를 판단하는 단계; 및
    상기 판단된 단어 또는 구문이 중립성 단어 또는 구문이 아닌 경우에 상기 감성 로그에 설정된 값 이상의 로그정보가 저장되어 있는지를 검색하는 단계
    를 더 포함하며,
    상기 감성을 추론하는 단계는 상기 설정된 값 이상의 로그정보가 저장된 경우에 상기 판단된 단어 또는 구문에 대한 감성을 추론하는 것을 특징으로 하는 지능형 감성 추론방법.
  16. 제 15항에 있어서,
    상기 감성 로그에 설정된 값 이상의 로그정보가 없는 경우, 웹 탐색 함수를 호출하여 기 설정된 웹을 탐색하는 단계; 및
    상기 기 설정된 웹으로부터 상기 판단된 단어 또는 구문에 대한 로그정보를 획득하여 감성 정보로 저장하는 단계
    를 더 포함하는 것을 특징으로 하는 지능형 감성 추론방법.
  17. 제 16항에 있어서,
    상기 판단된 단어 또는 구문에 대하여 상기 감성 추론부에 의해 추론된 감성의 관련성을 측정하는 단계; 및
    측정된 상기 관련성이 설정된 임계값을 초과하는 경우, 상기 판단된 단어 또는 구문, 상기 추론한 감성, 및 감성지수를 상기 감성 단어사전에 추가하여 저장하는 단계
    를 더 포함하는 것을 특징으로 하는 지능형 감성 추론방법.
  18. 제 12항에 있어서,
    상기 감성 단어사전으로 저장하는 단계는,
    동일한 감성 단어에 대하여 복수의 감성 클래스를 분류하며, 상기 분류된 각각의 감성 클래스에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 분류하여 상기 감성 단어사전으로 저장하는 것을 특징으로 하는 지능형 감성 추론방법.
  19. 제 12항에 있어서,
    상기 확률 모델은 전체 코퍼스(corpus)에서 특정 단어 또는 구문의 빈도수를 이용하여 특정 감성에 속할 확률을 계산하는 알고리즘인 것을 특징으로 하는 지능형 감성 추론방법.
  20. 삭제
  21. 인간의 감성을 구분한 기본 감성군과 상기 기본 감성군을 구분한 세부 감성군을 포함하는 감성 클래스를 이용하여 감성 단어에 대하여 유사성, 긍정 또는 부정도, 감성 강도 중 적어도 하나를 포함하는 항목으로 분류하여 감성 단어사전으로 저장하는 단계;
    사용자에 의해 로그(log)되는 문장에 대하여 단어와 구문을 파악하여 기본형으로 변환하는 단계;
    상기 변환된 단어 및 구문 중 상기 감성 단어사전에 매칭되는 단어 또는 구문을 확인하는 단계; 및
    상기 변환된 단어 및 구문의 상호 존재(Co-occurrence)에 기초하여 확률 모델(Probabilistic model)을 적용하며, 적용된 상기 확률 모델에 따라 감성을 추론하는 단계
    를 포함하되, 상기 감성을 추론하는 단계는, 상기 변환된 단어 및 구문 중 상기 감성 단어사전에 존재하지 않는 단어와 구문을 N-그램(N-Gram)으로 분할 또는 병합한 단어 집합 정보를 생성하는 웹검색 준비 단계; 및 상기 단어 집합 정보가 포함된 단어와 구문을 웹(Web)에서 수집하는 웹 검색을 수행한 수집 정보를 생성하는 웹 마이닝 단계를 포함하며, 상기 수집 정보의 상기 상호 존재에 기초하여 상기 확률 모델을 적용하는 것을 특징으로 하는 지능형 감성 추론방법.
  22. 제 12항에 있어서,
    상기 매칭되는 단어 또는 구문을 확인하는 단계는,
    상기 변환된 단어 및 구문에 해당하는 언어에 대한 문법의 품사를 구분하고, 상기 품사에 따른 기 설정된 가중치(Weight)를 상기 변환된 단어 및 구문에 부여한 가중치 반영 정보를 생성하되,
    상기 감성을 추론하는 단계에서 상기 가중치 반영 정보의 상기 상호 존재에 기초하여 상기 확률 모델을 적용하는 것을 특징으로 하는 지능형 감성 추론방법.
KR1020110110687A 2010-10-28 2011-10-27 지능형 감성 추론장치 및 그 추론방법 KR101334196B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US13/882,066 US20130226561A1 (en) 2010-10-28 2011-10-28 Intelligent emotion-inferring apparatus, and inferring method therefor
EP11836651.7A EP2634712A2 (en) 2010-10-28 2011-10-28 Intelligent emotion-inferring apparatus, and inferring method therefor
PCT/KR2011/008120 WO2012057559A2 (ko) 2010-10-28 2011-10-28 지능형 감성 추론장치 및 그 추론방법
JP2013536522A JP2013541787A (ja) 2010-10-28 2011-10-28 知能型感性推論装置及びその推論方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020100106308 2010-10-28
KR20100106308 2010-10-28

Publications (2)

Publication Number Publication Date
KR20120047802A KR20120047802A (ko) 2012-05-14
KR101334196B1 true KR101334196B1 (ko) 2013-11-28

Family

ID=46266424

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110110687A KR101334196B1 (ko) 2010-10-28 2011-10-27 지능형 감성 추론장치 및 그 추론방법

Country Status (5)

Country Link
US (1) US20130226561A1 (ko)
EP (1) EP2634712A2 (ko)
JP (1) JP2013541787A (ko)
KR (1) KR101334196B1 (ko)
WO (1) WO2012057559A2 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180116779A (ko) * 2017-04-17 2018-10-26 가천대학교 산학협력단 인공 지능 기반 영상 및 음성 인식 영양 평가 방법
KR20200117158A (ko) 2019-04-03 2020-10-14 에스케이텔레콤 주식회사 메모리 네트워크 장치 및 이를 이용한 추론 방법
KR20200133609A (ko) 2019-05-20 2020-11-30 에스케이텔레콤 주식회사 메모리 네트워크 장치 및 이를 이용한 추론 방법

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102073102B1 (ko) * 2013-03-21 2020-02-04 삼성전자 주식회사 언어인식을 위한 언어모델 db, 언어인식장치와 언어인식방법, 및 언어인식시스템
JP6109664B2 (ja) * 2013-07-17 2017-04-05 Kddi株式会社 言語体系の間で同義語句に対する特定の感情を推定するプログラム、装置及び方法
US9386110B2 (en) 2014-03-13 2016-07-05 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Communications responsive to recipient sentiment
JP6356055B2 (ja) * 2014-12-08 2018-07-11 Kddi株式会社 心理状態を抽出すべき単語の辞書を更新するプログラム、装置及び方法
CN105206284B (zh) * 2015-09-11 2019-06-18 清华大学 疏导青少年心理压力的虚拟聊天方法与系统
US20170169008A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for sentiment classification
CN106354714A (zh) * 2016-08-29 2017-01-25 广东工业大学 一种基于nlpir中文分词系统的中文分词工具
JP6635004B2 (ja) * 2016-11-04 2020-01-22 トヨタ自動車株式会社 感情推定方法
CN107506349A (zh) * 2017-08-04 2017-12-22 卓智网络科技有限公司 一种基于网络日志的用户负面情绪预测方法和系统
US10783329B2 (en) * 2017-12-07 2020-09-22 Shanghai Xiaoi Robot Technology Co., Ltd. Method, device and computer readable storage medium for presenting emotion
KR102222451B1 (ko) * 2018-04-27 2021-03-03 아토머스 주식회사 텍스트 기반 사용자심리상태예측 및 콘텐츠추천 장치 및 그 방법
US10529116B2 (en) * 2018-05-22 2020-01-07 International Business Machines Corporation Dynamically transforming a typing indicator to reflect a user's tone
KR102382226B1 (ko) * 2019-05-03 2022-04-05 주식회사 자이냅스 뉴스 기사의 감성 정보를 레이블링하는 장치
KR102361598B1 (ko) * 2019-05-03 2022-02-11 주식회사 자이냅스 감성 예측 분석이 필요한 대상의 감성 정보를 레이블링하는 프로그램이 기록된 비휘발성 기록매체
KR102371505B1 (ko) * 2019-05-03 2022-03-08 주식회사 자이냅스 빅데이터를 활용하여 뉴스를 레이블링하는 프로그램
KR102361597B1 (ko) * 2019-05-03 2022-02-11 주식회사 자이냅스 빅데이터를 활용하여 뉴스 기사의 감성 정보를 레이블링하는 프로그램이 기록된 기록매체
CN110209818B (zh) * 2019-06-04 2021-08-10 南京邮电大学 一种面向语义敏感词句的分析方法
CN112487824B (zh) * 2020-11-19 2024-05-14 平安科技(深圳)有限公司 客服语音情感识别方法、装置、设备及存储介质
US11689482B2 (en) 2021-11-10 2023-06-27 International Business Machines Corporation Dynamically generating a typing feedback indicator for recipient to provide context of message to be received by recipient

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018234A (ja) * 2005-07-07 2007-01-25 National Institute Of Information & Communication Technology 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI221574B (en) * 2000-09-13 2004-10-01 Agi Inc Sentiment sensing method, perception generation method and device thereof and software
US6622140B1 (en) * 2000-11-15 2003-09-16 Justsystem Corporation Method and apparatus for analyzing affect and emotion in text
US6850934B2 (en) * 2001-03-26 2005-02-01 International Business Machines Corporation Adaptive search engine query
US7624102B2 (en) * 2005-01-28 2009-11-24 Microsoft Corporation System and method for grouping by attribute
WO2007087349A2 (en) * 2006-01-25 2007-08-02 Fortuna Joseph A Jr Method and system for automatic summarization and digest of celebrity news
US7464003B2 (en) * 2006-08-24 2008-12-09 Skygrid, Inc. System and method for change detection of information or type of data
US7761287B2 (en) * 2006-10-23 2010-07-20 Microsoft Corporation Inferring opinions based on learned probabilities
US8799773B2 (en) * 2008-01-25 2014-08-05 Google Inc. Aspect-based sentiment summarization
US20100121707A1 (en) * 2008-11-13 2010-05-13 Buzzient, Inc. Displaying analytic measurement of online social media content in a graphical user interface
KR20100089310A (ko) * 2009-02-03 2010-08-12 연세대학교 산학협력단 블로그 생성 방법 및 시스템
KR101045659B1 (ko) * 2009-02-19 2011-06-30 강장묵 감성정보 서비스 시스템 및 방법
KR20100100380A (ko) * 2009-03-06 2010-09-15 중앙대학교 산학협력단 상황 정보와 감정 인식을 사용한 유비쿼터스 환경의 최적 서비스 추론 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018234A (ja) * 2005-07-07 2007-01-25 National Institute Of Information & Communication Technology 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
텍스트 문서기반의 감성인식시스템, 김명규 외3인, 감성과학 Vol.12, No.4 *
텍스트 문서기반의 감성인식시스템, 김명규 외3인, 감성과학 Vol.12, No.4*
한국어 특성을 고려한 감성분류, 김정호 외4인, 감성과학 Vol.13, No.4 *
한국어 특성을 고려한 감성분류, 김정호 외4인, 감성과학 Vol.13, No.4*

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180116779A (ko) * 2017-04-17 2018-10-26 가천대학교 산학협력단 인공 지능 기반 영상 및 음성 인식 영양 평가 방법
KR101959762B1 (ko) 2017-04-17 2019-07-05 가천대학교 산학협력단 인공 지능 기반 영상 및 음성 인식 영양 평가 방법
KR20200117158A (ko) 2019-04-03 2020-10-14 에스케이텔레콤 주식회사 메모리 네트워크 장치 및 이를 이용한 추론 방법
KR20200133609A (ko) 2019-05-20 2020-11-30 에스케이텔레콤 주식회사 메모리 네트워크 장치 및 이를 이용한 추론 방법
KR20210134566A (ko) 2019-05-20 2021-11-10 에스케이텔레콤 주식회사 메모리 네트워크 장치 및 이를 이용한 추론 방법

Also Published As

Publication number Publication date
KR20120047802A (ko) 2012-05-14
WO2012057559A3 (ko) 2012-06-21
WO2012057559A2 (ko) 2012-05-03
JP2013541787A (ja) 2013-11-14
EP2634712A2 (en) 2013-09-04
US20130226561A1 (en) 2013-08-29

Similar Documents

Publication Publication Date Title
KR101334196B1 (ko) 지능형 감성 추론장치 및 그 추론방법
KR101310929B1 (ko) 지능형 감성단어 확장장치 및 그 확장방법
WO2019153737A1 (zh) 用于对评论进行评估的方法、装置、设备和存储介质
US10133734B2 (en) Systems, methods and computer program products for building a database associating N-grams with cognitive motivation orientations
KR101634086B1 (ko) 감정 분석을 통한 스티커 추천 방법 및 시스템
US20160210962A1 (en) Methods and systems for analyzing communication situation based on dialogue act information
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
KR101160193B1 (ko) 감성적 음성합성 장치 및 그 방법
KR101330158B1 (ko) 텍스트의 감정지수 분석 방법 및 컴퓨터 판독 가능한 기록 매체
CN107391614A (zh) 一种基于wmd的中文问答匹配方法
CN107480162A (zh) 基于人工智能的搜索方法、装置、设备及计算机可读存储介质
KR101291755B1 (ko) 감성 진단 장치 및 방법
CN109492221A (zh) 一种基于语义分析的信息回复方法及可穿戴设备
KR101250520B1 (ko) 감성 기반의 커뮤니티 형성 시스템, 커뮤니티 형성이 가능한 통신 단말기 및 그 커뮤니티 형성방법
Castro et al. Using network science measures to predict the lexical decision performance of adults who stutter
CN109410935A (zh) 一种基于语音识别的目的地搜索方法及装置
CN113496122A (zh) 命名实体识别方法、装置、设备及介质
CN106528764B (zh) 基于人工智能的提问型检索词的检索方法及装置
KR101191922B1 (ko) 인스턴트 메신저 서비스 제공시스템 및 그 제공방법, 및 통신 단말기 및 그 통신방법
CN112017740A (zh) 一种基于知识图谱的疾病推理方法、装置、设备及储存介质
KR102507809B1 (ko) 공감대 형성을 통한 심리 치료용 인공지능 대화 시스템
Anwar et al. Social relationship analysis using state-of-the-art embeddings
CN113808709B (zh) 一种基于文本分析的心理弹性预测方法及系统
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN113705194A (zh) 简称抽取方法及电子设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161122

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191014

Year of fee payment: 7