KR101695014B1 - 감성 어휘 정보 구축 방법 및 장치 - Google Patents

감성 어휘 정보 구축 방법 및 장치 Download PDF

Info

Publication number
KR101695014B1
KR101695014B1 KR1020110084801A KR20110084801A KR101695014B1 KR 101695014 B1 KR101695014 B1 KR 101695014B1 KR 1020110084801 A KR1020110084801 A KR 1020110084801A KR 20110084801 A KR20110084801 A KR 20110084801A KR 101695014 B1 KR101695014 B1 KR 101695014B1
Authority
KR
South Korea
Prior art keywords
vocabulary
emotional
emotion
new
expression
Prior art date
Application number
KR1020110084801A
Other languages
English (en)
Other versions
KR20130022075A (ko
Inventor
오효정
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020110084801A priority Critical patent/KR101695014B1/ko
Priority to US13/592,871 priority patent/US9652997B2/en
Publication of KR20130022075A publication Critical patent/KR20130022075A/ko
Application granted granted Critical
Publication of KR101695014B1 publication Critical patent/KR101695014B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

본 발명에 따른 감성 어휘 정보 구축 방법 및 장치가 개시된다. 본 발명의 감성 어휘 정보 구축 방법은 특정 감성 표현 어휘를 기준으로 특정 문서들을 검색하여, 상기 감성 표현 어휘가 포함된 문장들로부터 감성 표현 어휘의 감성 근거 어휘들을 도출하는 단계, 상기 도출된 감성 근거 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 근거 어휘를 도출하여 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 근거 어휘 도출 단계를 포함하여 구성된다. 따라서, 본 발명에 따른 감성 어휘 정보 구축 방법 및 장치를 이용하면 초기 감성 표현 어휘를 기준으로 하여 감성 근거 어휘의 확장 및 이를 통한 감성 표현 어휘의 확장이라는 2단계 어휘 확장을 통해 감성 어휘 데이터베이스를 증강하고, 자동 확장할 수 있다. 또한 본 발명에 따른 감성 어휘 정보 구축 방법을 통해 수작업을 최소화하면서 감성 인식의 정확도를 극대화하는 효과를 얻을 수 있다.

Description

감성 어휘 정보 구축 방법 및 장치{METHOD FOR BUILDING EMOTIONAL LEXICAL INFORMATION AND APPARATUS FOR THE SAME}
본 발명은 감성 어휘 정보를 구축하는 방법 및 장치에 관한 것으로, 더욱 상세하게는 웹 문서 등을 통해 제공된 문장에서 감성 표현 어휘와 감성 표현의 근거 어휘를 추출하여 감성 어휘 정보를 구축하는 방법 및 장치에 대한 것이다.
문장에 표현된 감정을 분석하기 위해 사용되는 방식 중 하나는 감성 어휘 사전을 사용하는 것이다. 감성 어휘는 감성 카테고리별로 해당되는 단어 혹은 패턴을 담고 있다. 주어진 텍스트에 등장하는 단어 혹은 패턴이 감성 어휘에 들어있는지 여부를 통해 그 텍스트의 감성 정보를 분석한다(선행특허: 감정정보 추출 장치 및 방법[KR 10-2009-0034052]).
이러한 방식을 사용할 때 감성 어휘를 어떻게 구축할지가 문제가 된다. 또한 단순 단어 혹은 패턴의 출현여부에 대한 판단만으로 감성 어휘를 인식하는 방법은 낮은 정확도를 보인다. 높은 정확도를 요구하는 상용 서비스에서는 종종 수작업으로 감성 어휘를 구축한다. 감성 어휘를 수작업으로 구축할 시에는 인력이 많이 필요하고 시간과 비용이 많이 들어간다는 단점이 있다.
어휘를 (반)자동으로 구축하기 위한 연구가 많이 수행되어 왔다. 감성 어휘 (반)자동 구축 방법론 중에서 본 발명과 관계된 방법은 적은 수의 감성 단어를 자동으로 점차 확장시키는 것인데, 이를 위해 관계어(유의어, 반의어) 혹은 텍스트 상에서 단어들 간의 관계를 이용하기도 한다(선행특허: 감성 어휘 의미 구조를 이용한 대표 감성 어휘 추출 방법[10-2009-0129707]).
그러나 대부분의 방법이 영화 리뷰나 상품평과 같은 한정된 도메인에서만 좋은 성능을 보이는 단점이 있고, 모든 상황에서 효과적인 어휘 구축 방법론은 아직 고안되지 않은 상태이다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 수작업을 최소화하고, 다양한 상황에서 제공되는 문장에 대해 정확한 감성인식을 할 수 있는 감성 어휘 정보 구축방법을 제공하는데 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, 수작업을 최소화하고, 다양한 상황에서 제공되는 문장에 대해 정확한 감성인식을 할 수 있는 감성 어휘 정보 구축장치를 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명의 일 측면은 특정 감성 표현 어휘를 기준으로 특정 문서들을 검색하여, 상기 감성 표현 어휘가 포함된 문장들로부터 감성 표현 어휘의 감성 근거 어휘들을 도출하는 단계, 상기 도출된 감성 근거 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 근거 어휘를 도출하여 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 근거 어휘 도출 단계를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 방법을 제공한다.
여기서, 상기 신규 감성 근거 어휘를 기준으로 특정 문서들을 검색하여, 상기 감성 근거 어휘가 포함된 문장들로부터 상기 감성 근거 어휘와 관련된 감성 표현 어휘들을 도출하는 단계 및 상기 도출된 감성 표현 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 표현 어휘를 도출하여 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 표현 어휘 도출 단계를 더 포함하는 것을 특징으로 한다.
여기서, 상기 도출된 감성 근거 어휘들을 동일 의미를 갖는 감성 근거 어휘별로 그룹화하고, 상기 감성 근거 어휘 그룹들을 상기 적어도 하나의 신규 어휘 기준에 따라 순위화하여, 일정한 순위 내에 속하는 감성 근거 어휘 그룹 내의 감성 근거 어휘를 추출하여, 상기 감성 근거 어휘들을 신규 감성 근거 어휘로서 상기 특정 감정 표현 어휘에 대응되도록 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 한다.
여기서, 상기 신규 감성 표현 어휘 도출단계는, 상기 도출된 감성 표현 어휘들을 동일 의미를 갖는 감성 근거 어휘별로 그룹화하고, 상기 감성 표현 어휘 그룹들을 상기 적어도 하나의 신규 어휘 기준에 따라 순위화하여 일정한 순위 내에 속하는 감성 표현 어휘 그룹 내의 감성 표현 어휘들을 추출하여, 상기 감성 표현 어휘들을 신규 감성 표현 어휘로서 상기 감성 근거 어휘에 대응되도록 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 한다.
여기서, 상기 특정 감성 표현 어휘는 상기 감성 어휘 데이터베이스로부터 추출되는 것을 특징한다.
여기서, 상기 미리 정의된 신규 어휘 기준은 상기 어휘가 포함된 문장의 수, 상기 어휘가 포함된 문서의 수, 상기 어휘가 포함된 문장이 속한 문서의 인기도, 상기 어휘가 포함된 문장이 속한 웹 사이트의 인지도 중의 적어도 하나를 포함하는 것을 특징으로 한다.
상기의 목적을 달성하기 위한 본 발명의 다른 측면은 사용자의 반응을 표현하기 위한 문서에서, 사용자의 감성의 정도가 수치화 가능하도록 정형화되어 표현된 글을 검색하여, 상기 정형화된 감성의 정도에 대응하여 작성된 문장으로부터 감성 표현 어휘를 추출하는 단계 및 상기 정형화된 감성의 정도를 참조하여 상기 추출된 감성 표현 어휘에 감성의 강도를 부여하는 단계를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 방법을 제공한다.
여기서, 상기 감성 표현 어휘에 대한 상기 감성의 강도를 감성 어휘 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 한다.
상기 다른 목적을 달성하기 위한 본 발명은 감성 표현 어휘와 상기 감성 표현 어휘에 대응되는 감성 근거 어휘를 포함하는 속성으로 포함하는 감성 어휘 데이터베이스, 상기 감성 어휘 데이터베이스에 포함된 특정 감성 표현 어휘를 기준으로 웹 상의 특정 문서들을 검색하여, 상기 감성 표현 어휘가 포함된 문장들로부터 상기 감성 표현 어휘의 감성 근거 어휘들을 도출하는 감성 근거 어휘 도출부, 상기 도출된 감성 근거 어휘 중 미리 정의된 신규 어휘 기준에 따라 신규 하다고 판단되는 감성 근거 어휘를 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 근거 어휘 판단부, 상기 신규 하다고 판단되는 감성 근거 어휘를 기준으로 특정 웹 상의 문서를 검색하여, 상기 감성 근거 어휘가 포함된 문장들로부터 상기 감성 근거 어휘와 관련된 감성 표현 어휘들을 도출하는 감성 표현 어휘 도출부 및 상기 도출된 감성 표현 어휘 중 미리 정의된 신규 어휘 기준에 따라 신규 하다고 판단되는 감성 표현 어휘를 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 표현 어휘 판단부를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 장치를 제공한다.
여기서, 상기 신규 감성 근거 어휘 판단부는, 상기 도출된 감성 근거 어휘들을 동일 의미를 갖는 감성 근거 어휘별로 그룹화하고, 상기 감성 근거 어휘 그룹들을 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 순위화하여, 일정한 순위 내에 속하는 감성 근거 어휘 그룹 내의 감성 근거 어휘를 추출하여, 상기 감성 근거 어휘들을 상기 특정 감정 표현 어휘에 대응되도록 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 한다.
여기서, 상기 신규 감성 표현 어휘 판단부는, 상기 도출된 감성 표현 어휘들을 동일 의미를 갖는 감성 근거 어휘별로 그룹화하고, 상기 감성 표현 어휘 그룹들을 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 순위화하여 일정한 순위 내에 속하는 감성 표현 어휘 그룹 내의 감성 표현 어휘들을 추출하여, 상기 감성 표현 어휘들을 상기 감성 근거 어휘에 대응되도록 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 한다.
여기서, 상기 미리 정의된 신규 어휘 기준은 상기 어휘가 포함된 문장의 수, 상기 어휘가 포함된 문서의 수, 상기 어휘가 포함된 문장이 속한 문서의 인기도, 상기 어휘가 포함된 문장이 속한 웹 사이트의 인지도 중의 적어도 하나를 포함하는 것을 특징으로 한다.
여기서, 상기 감성 어휘 데이터베이스는 속성으로 감성 표현 어휘에 대한 감성 강도를 더 포함하고, 상기 감성 어휘 정보 구축장치는 사용자의 감성의 정도가 수치화 가능하도록 정형화되어 표현된 글을 검색하여, 상기 정형화된 감성의 정도에 대응하여 작성된 문장으로부터 감성 표현 어휘를 추출하여, 상기 정형화된 감성의 정도를 참조하여 상기 추출된 감성 표현 어휘에 감성의 강도를 부여하여 상기 감성 어휘 데이터베이스에 저장하는 감성 강도 부여부를 더 포함하는 것을 특징으로 한다.
상기와 같은 본 발명에 따른 감성 어휘 정보 구축방법 및 장치를 이용할 경우에는 사용자가 감성을 표출한 감성 표현 어휘와 감성 근거 어휘로 구성된 감성 어휘 데이터베이스 구축을 통해 보다 정확한 감성 인식이 가능하다. 이때 감성 어휘 데이터베이스 구축 방법으로 기존의 수작업 혹은 단순 통계기반의 방법이 아닌 초기 감성 표현 어휘를 기준으로 하여 감성 근거 어휘의 확장 및 이를 통한 감성 표현 어휘의 확장이라는 2단계 어휘 확장을 통해 감성 어휘 데이터베이스를 증강하고, 자동 확장할 수 있다. 또한 본 발명에 따른 감성 어휘 정보 구축 방법을 통해 수작업을 최소화하면서 감성 인식의 정확도를 극대화하는 효과를 얻을 수 있다.
도 1은 본 발명의 일 실시예에 따른 감성 어휘 정보를 구축하기 위한 과정을 보여주는 시퀀스 차트이다.
도 2는 본 발명의 일 실시예에 따른 감성 어휘 정보를 구축하기 위한 과정을 도식화한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 초기의 감성 어휘 데이터베이스의 예를 보여주는 개념도이다.
도 4는 본 발명의 일 실시예에 따른 감성 근거 어휘의 수집 과정을 도식화한 개념도이다.
도 5는 본 발명의 일 실시예에 따른 감성 표현 어휘의 수집 과정을 도식화한 개념도이다.
도 6은 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도를 부여하는 과정을 보여주는 시퀀스 차트이다.
도 7은 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도가 부여된 예를 보여주는 개념도이다.
도 8은 본 발명의 일 실시예에 따른 감성 어휘 정보 구축 장치를 보여주는 개념도이다.
도 9는 본 발명의 일 실시예에 따른 감성 어휘 데이터베이스를 이용하여 문장에서 감성을 인식하는 과정을 보여주는 개념도이다.
도 10은 본 발명의 일 실시예에 따른 감성 어휘 데이터베이스를 이용하여 문장에서 감성을 인식한 결과를 보여주는 개념도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 발명에 따른 일 실시예는 2단계 감성 어휘 확장의 개념을 개시한다. 즉 검색의 기초가 될 초기 감성 어휘를 포함하는 감성 어휘 데이터베이스로부터 도출한 감성 어휘를 기초로, 웹 상에서 해당 감성 어휘가 포함된 문장을 검색하여, 감성 어휘의 근거가 되는 어휘를 도출하여 데이터베이스에 저장하는 제1단계와, 다시 감성 근거 어휘를 기초로 웹 상의 문장을 검색하여, 검색된 문장에서 해당 감성 근거 어휘와 관련된 감성 어휘를 도출하여 데이터베이스에 저장하는 제2단계 어휘 검색을 통하여 감성 어휘를 증강 확장한다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
먼저 본 발명에 따른 감성 어휘 정보 구축 방법 및 장치에 대하여 설명하고, 본 발명의 일 실시예에 따라 구축된 감성 어휘 정보를 이용하여 문장에서 감성은 인식하는 방법에 대하여 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 감성 어휘 정보를 구축하기 위한 과정을 보여주는 시퀀스 차트이다.
도 1을 참조하면 본 발명의 일 실시예에 따른 감성 어휘 정보를 구축하기 위한 과정은 특정 감성 표현 어휘와 관련된 감성 근거 어휘 도출 단계(S110), 신규 감성 근거 도출 단계(S120), 신규 감성 근거 어휘와 관련된 감성 표현 어휘 도출 단계(S130), 신규 감성 표현 어휘 도출 단계(S140)를 포함하여 구성되는 것을 알 수 있다.
이하, 도 1을 참조하여 본 발명의 일 실시예에 따른 감성 어휘 정보를 구축하기 위한 과정을 좀 더 상세하게 설명하기로 한다.
감성 근거 어휘 도출 단계(S110)는 감성 어휘 데이터베이스에 포함된 특정 감성 표현 어휘를 기준으로 특정 문서들을 검색하여, 감성 표현 어휘가 포함된 문장들로부터 감성 표현 어휘의 감성 근거 어휘들을 도출하는 단계이다. 이때 감성 어휘의 초기 구축 단계인 경우라도, 감성 어휘 데이터베이스에는 초기 검색의 검색어를 제공하기 위한 감성 어휘가 적어도 하나 포함되어 있을 수 있다.
신규 감성 근거 어휘 도출 단계(S120) 도출된 감성 근거 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 근거 어휘를 도출하여 상기 감성 어휘 데이터베이스에 저장하는 단계이다.
이때, 신규 어휘 기준은 감성 근거 어휘가 포함된 문장의 수, 감성 근거 어휘가 포함된 문서의 수, 감성 근거 어휘가 포함된 문장이 속한 문서의 인기도, 감성 근거 어휘가 포함된 문장이 속한 웹 사이트의 인지도 등을 포함할 수 있다. 즉 검색된 모든 감성 근거 어휘를 데이터베이스로 구축할 수도 있지만, 데이터베이스 용량 등을 고려하여, 일정 기준에 부합하는 감성 근거 어휘를 데이터베이스로 구축할 수 도 있다.
신규 어휘 기준에 따라 신규 감성 근거 어휘를 도출하는 방법은 추후 좀 더 상세하게 설명하기로 한다.
한편 신규 감성 근거 어휘를 도출하는 과정을 좀 더 상세하게 살펴 보면, 도출된 감성 근거 어휘들을 일정한 유형별로 그룹화하고, 감성 근거 어휘 그룹들을 적어도 하나의 신규 어휘 기준에 따라 순위화한 후, 일정한 순위 내에 속하는 감성 근거 어휘 그룹 내의 감성 근거 어휘를 추출하여, 감성 근거 어휘들을 신규 감성 근거 어휘로서 상기 특정 감성 표현 어휘에 대응되도록 상기 감성 어휘 데이터베이스에 저장한다.
이때 일정한 유형별 그룹화란, 예를 들면, 동일한 의미를 갖는 감성 근거 어휘를 동일 그룹으로 분류할 수도 있을 것이다. 예를 들어, "짜증난다"에 대한 감성 근거 어휘로 "배터리가 닳아서", "배터리가 빨리 닳아서", "전지가 빨리 소모되어서", "배가 고파서"가 검색되었다면 의미가 유사하다고 판단되는 "배터리가 닳아서", "배터리가 빨리 닳아서", "전지가 빨리 소모되어서"가 동일 그룹에 속할 수 있다.
또한 앞서 설명된 신규 어휘 기준(예를 들면, 검색횟수, 사이트 인기도 등)을 적용하여 순위화된 그룹 중 일정 순위, 예를 들어, 상위 10% 또는 상위 10개 등에 해당하는 그룹에 속하는 어휘들을 신규 감성 근거 어휘로 판단하여 감성 어휘 데이터베이스에 저장한다.
한편, 신규 감성 근거 어휘와 관련된 감성 표현 어휘 도출 단계(S130)는 앞서 도출된 신규 감성 근거 어휘를 기준으로 웹 상의 문서들을 검색하여, 해당 감성 근거 어휘가 포함된 문장들로부터 해당 감성 근거 어휘와 관련된 감성 표현 어휘들을 도출하는 단계이다.
신규 감성 표현 어휘 도출 단계(S140)는 앞서 도출된 감성 표현 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 표현 어휘를 도출하여 감성 어휘 데이터베이스에 저장하는 단계이다.
예를 들면, 도출된 감성 표현 어휘들을 일정한 유형별로 그룹화하고, 감성 표현 어휘 그룹들을 적어도 하나의 신규 어휘 기준에 따라 순위화하여 일정한 순위 내에 속하는 감성 표현 어휘 그룹 내의 감성 표현 어휘들을 추출하여, 감성 표현 어휘들을 신규 감성 표현 어휘로서 감성 근거 어휘에 대응되도록 감성 어휘 데이터베이스에 저장하게 된다.
이하, 본 발명의 일 실시예에 따른 감성 어휘 정보 구축방법을 예를 들어 좀 더 상세하게 설명하기로 한다.
도 2는 본 발명의 일 실시예에 따른 감성 어휘 정보를 구축하기 위한 과정을 도식화한 개념도이다.
도 2를 참조하면 본 발명에 따른 감성 어휘 정보를 구축하는 좀 더 상세한 과정은 다음과 같이 설명될 수 있다.
1) 감성 근거 어휘의 확장 단계
첫 단계는 감성 근거 어휘의 확장 단계로서 초기 감성 어휘 집합(Seed: S)(210)에 나타난 감성 표현 어휘(220)를 기준으로, 해당 감성 표현 어휘(Anchor:ai)(220)가 나타난 웹 문서(블로그, 뉴스, 상품평, 댓글 등) 혹은 소셜웹 문장(트위터 멘션, 메신저 채팅문 등)을 탐색하여, 해당 문장안에 포함된 해당 감성 표현 어휘(220)에 대응하는 감성 근거 어휘(Trigger:ti)를 기준으로 그룹핑하여 순위화한다.
순위화된 감성 근거 어휘 중 새로운 패턴 여부를 판단하는 임계치 이상의 감성 근거 어휘({tnew i}, 230)를 선택하여 감성 근거 어휘 집합(T)(240)에 추가한다. 이때 감성 근거 어휘의 확장이 일어난다. 여기서 임계치는 앞에서 설명된 것과 같이 신규 어휘를 판단하기 위해서 미리 결정된 기준를 적용하여 결정된 임계 순위를 의미할 수 있다.
2) 감성 표현 어휘의 확장 단계
다음은 감성 근거 어휘(230)에 대응하는 감성 표현 어휘의 확장 단계로서, 앞 단계에서 새로 선택된 감성 근거 어휘(230)가 나타난 웹 문서 혹은 소셜웹 문장을 탐색하고, 탐색된 문장내에 포함된 해당 감성 근거 어휘(230)와 관련된 감성 표현 어휘를 도출하여, 이를 기준으로 그룹핑하여 순위화한다.
순위화된 감성 표현 어휘 중 새로운 패턴 여부를 판단하는 임계치 이상의 감성 표현 어휘({anew i}, 250)를 선택하여 감성 표현 어휘 집합(A)(260)에 추가한다. 이때 감성 표현 어휘의 확장이 일어난다.
이러한 과정은 더 이상 새로운 어휘가 나타나지 않아서, 감성 표현 어휘 집합(A)(260)이나 감성 근거 어휘 집합(T)(240)이 확장되지 않을 때까지 반복한다.
다음으로, 본 발명의 일 실시예에 따른 감성 어휘 구축 방법을 통해 구축된 감성 어휘 데이터베이스의 예를 도면을 참조하여 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 초기의 감성 어휘 데이터베이스의 예를 보여준다.
도 3을 참조하면, 도 2의 감성 근거 어휘의 확장 단계를 수행하기 전의 초기 감성 표현 어휘 집합(S)(210), 감성 표현 어휘 집합(A)(260), 및 감성 근거 어휘 집합(T)이 예시되어 있다. 예를 들면, [즐거움]의 감성 분류를 갖는 초기 어휘로 "즐겁다, 행복하다, 기쁘다"를 [불쾌]의 감성 값을 갖는 초기 어휘로는 "슬프다, 우울하다, 짜증나다"를 기준으로 감성 어휘 데이터베이스 구축을 시작하고자 한다.
도 4는 본 발명의 일 실시예에 따른 감성 근거 어휘의 수집 과정을 도식화한 것으로, 도 2의 감성 근거 어휘의 확장 단계를 수행한 결과를 보여준다.
도 4를 참조하면, 초기 감성 표현 어휘 집합(S)(210)의 감성 표현 어휘{ai}(220) 중 불쾌를 의미하는 "짜증나다"가 나타난 문장들(221)을 탐색하여 감성 표현 어휘의 감성 근거 어휘들을 수집한 결과(240')가 예시되어 있다. 문장별 그룹핑을 통해 수집된 감성 근거 어휘들 중 임계치 이상의 표현으로 "배터리 닳다"를 추출하여 신규 감성 근거 어휘(tnew i)(230)로서 감성 근거 어휘 집합(T')(240')에 추가한다.
도 5는 본 발명의 일 실시예에 따른 감성 표현 어휘의 수집 과정을 도식화한 것으로, 도 2의 감성 표현 어휘의 확장 단계를 수행한 결과를 보여준다. 도 5를 참조하면, 신규 추출된 감성 근거 어휘 "배터리, 닳다"(230)를 기준으로, 이 어휘가 나타난 문장들(231)을 탐색하여 감성 근거 어휘에 대응하는 감성 표현 어휘들을 수집한 결과(260')가 예시되어 있다. 문장별 그룹핑을 통해 수집된 감성 표현 어휘들 중 임계치 이상의 표현으로 "화나다"를 추출, 신규 감성 표현 어휘(anew i)(250)로서 감성 표현 어휘 집합(A')(260')에 추가한다.
도 3과 5를 참조하면, 본 발명의 일 실시예에 따른 감성 어휘 정보 구축 방법을 수행한 결과, 감성 표현 어휘 집합이 A->A'로, 감성 근거 어휘 집합이 T-> T'로 확장되었음을 알 수 있다. 이를 통해 보다 정밀하고 정확도 높은 감성 어휘 데이터베이스를 적은 양의 수작업을 통해 구축이 가능해짐으로 감성 인식의 효율성 및 정확성 향상 효과를 얻을 수 있다.
3) 감성 표현 어휘의 감성의 강도 부여 과정
이하, 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도를 부여하는 과정에 대해서 설명하기로 한다.
도 6은 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도를 부여하는 과정을 보여주는 시퀀스 차트이다.
도 6을 참조하면 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도를 부여하는 과정은 정형화된 감성의 정도가 표현된 글을 검색하여 수행하는, 감성 표현 어휘 추출단계(S210), 감성의 강도 부여단계(S220), 수식어 추출 단계(S230) 및 수식어에 가중치 부여단계(S240)를 포함하여 구성되는 것을 알수 있다.
도 6을 참조하면, 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도 부여 과정은 아래와 같이 설명될 수 있다.
감성 표현 어휘 추출단계(S210)는 사용자의 반응을 표현하기 위한 문서에서, 사용자의 감성의 정도가 수치화 가능하도록 정형화되어 표현된 글을 검색하여 상기 정형화된 감성의 정도에 대응하여 작성된 문장으로부터 감성 표현 어휘를 추출하는 단계이다. 이때, 사용자의 감성의 정도가 정형화되어 표현된 글로는, 예를 들면, 사용자의 물품 구매후 만족도 조사를 위하여 "만족", "매우 만족", "보통", "불만", "매우 불만" 등의 문구를 미리 제공하여 사용자가 선택하도록 작성된 글이 포함될 수 있다.
감성의 강도 부여 단계(S220)는 정형화된 감성의 정도를 참조하여 추출된 감성 표현 어휘에 감성의 강도를 부여하고 감성 어휘 데이터베이스에 저장하는 단계이다.
도 7은 본 발명의 일 실시예에 따른 감성 표현 어휘에 감성의 강도가 부여된 예를 보여주는 개념도이다.
도 7의 (a)을 참조하면, 사용자 댓글(710)에 미리 제공된 정형화된 평점(711)과 사용자가 입력한 문장(712)이 구비되어 있는 것을 알 수 있다.
한편 도의 7(b)에는 사용자가 부여한 정형화된 평점을 참조하여, 각 대응되어 작성된 감성 표현 어휘에 대하여 감성 강도값을 부여한 예가 나타나 있다. 이러한 과정을 통해 감성 표현 어휘 사전이 A'(240')->A''(240'')로 확장된다.
또한 감성 표현의 특성상 부사어(아주, 많이, 꽤 등)와 같은 수식어(Modifier: M)(720)를 통해 그 강도가 확장 혹은 축소되는 현상이 발생할 수 있는데, 이를 반영하여 다음의 수식을 적용할 수 있다. 한편, 수식은 다양한 형태로 변형될 수 있다.
[수학식1]
SentScore ( S i ) =(∑ m i )* SentDegree _ of _ Anchor ( S i )
SentScore(Si) = 문서내의 수식어가 포함된 감성 표현의 강도
mi = 수식어 가중치 (예: 아주 = 2)
SentDegree_of_Anchor(Si) = 감성 표현 어휘의 감성 강도 (예: 재미있다 = 7)
즉 도 7을 참조하면 "아주 흥미진진했다"라고 작성된 문장의 경우, "흥미진진했다"라는 감성 표현 어휘의 감성의 강도가 9이지만, 가중치 2를 갖는 "아주"라는 수식어가 부가되어 문장으로 표현된다면 그 문장의 감성의 강도는 가중치 0.5인 "걍"이 부가된 "걍 흥미진진했다"보다 강도가 높게 평가될 것이다.
도 8은 본 발명의 일 실시예에 따른 감성 어휘 정보 구축 장치를 보여주는 개념도이다.
도 8을 참조하면 본 발명의 일 실시예에 따른 감성 어휘 정보 구축 장치는 감성 어휘 데이터베이스(900), 감성 근거 어휘 도출부(910), 신규 감성 근거 어휘 판단부(920), 감성 표현 어휘 도출부(930), 신규 감성 표현 어휘 판단부(940), 감성 표현 어휘 강도 부여부(950)를 포함하여 구성되는 것을 알 수 있다.
도 8을 참조하면, 본 발명의 일 실시예에 따른 감성 어휘 정보 구축 장치는 다음과 같이 설명될 수 있다.
감성 어휘 데이터베이스(900)는 감성 표현 어휘와 상기 감성 표현 어휘에 대응되는 감성 근거 어휘 및 감성 표현 어휘에 대한 감성의 강도를 속성으로 포함하는 데이터베이스로서 본 발명에 따른 감성 어휘 정보 구축 결과가 실제적으로 구현되는 부분이다.
감성 근거 어휘 도출부(910)는 감성 어휘 데이터베이스에 포함된 특정 감성 표현 어휘를 기준으로 웹 상의 문서들을 검색하여, 특정 감성 표현 어휘가 포함된 문장들로부터 감성 표현 어휘의 감성 근거 어휘들을 도출하는 부분이다.
신규 감성 근거 어휘 판단부(920)는 도출된 감성 근거 어휘 중 미리 정의된 신규 어휘 기준에 따라 신규 하다고 판단되는 감성 근거 어휘를 감성 어휘 데이터베이스에 저장하는 부분이다.
이를 위하여 도출된 감성 근거 어휘들을 일정한 유형별로 그룹화하고, 감성 근거 어휘 그룹들을 신규 어휘 기준에 따라 순위화하여, 일정한 순위 내에 속하는 감성 근거 어휘 그룹 내의 감성 근거 어휘를 추출하여, 해당 감성 근거 어휘들을 해당 감정 표현 어휘에 대응되도록 감성 어휘 데이터베이스에 저장한다.
이때, 신규 어휘 기준은 감성 근거 어휘가 포함된 문장의 수, 감성 근거 어휘가 포함된 문서의 수, 상기 감성 근거 어휘가 포함된 문장이 속한 문서의 인기도, 감성 근거 어휘가 포함된 문장이 속한 웹 사이트의 인지도 를 포함할 수 있다.
감성 표현 어휘 도출부(930)는 신규 감성 어휘 판단부(920)에서 신규 하다고 판단한 감성 근거 어휘를 기준으로 웹상의 문서를 검색하여, 해당 감성 근거 어휘가 포함된 문장들로부터 해당 감성 근거 어휘와 관련된 감성 표현 어휘들을 도출하는 부분이다.
신규 감성 표현 어휘 판단부(940)는 도출된 감성 표현 어휘 중 미리 정의된 신규 어휘 기준에 따라 신규 하다고 판단되는 감성 표현 어휘를 감성 어휘 데이터베이스에 저장하는 부분이다.
이를 위해, 도출된 감성 표현 어휘들을 일정한 유형별로 그룹화하고, 해당 감성 표현 어휘 그룹들을 신규 어휘 기준에 따라 순위화하여 일정한 순위 내에 속하는 감성 표현 어휘 그룹 내의 감성 표현 어휘들을 추출하여, 상기 감성 표현 어휘들을 상기 감성 근거 어휘에 대응되도록 감성 어휘 데이터베이스에 저장한다.
이때, 신규 어휘 기준은 감성 표현 어휘가 포함된 문장의 수, 감성 표현 어휘가 포함된 문서의 수, 감성 표현 어휘가 포함된 문장이 속한 문서의 인기도, 감성 표현 어휘가 포함된 문장이 속한 웹 사이트의 인지도 등을 포함할 수 있다.
감성 표현 어휘 강도 부여부(950)는 사용자의 감성의 정도가 수치화 가능하도록 정형화되어 표현된 글을 검색하여, 정형화된 감성의 정도에 대응하여 작성된 문장으로부터 감성 표현 어휘를 추출하여, 해당 정형화된 감성의 정도를 참조하여 추출된 감성 표현 어휘에 감성의 강도를 부여하여 감성 어휘 데이터베이스에 저장하는 부분이다.
다음은 본 발명의 일 실시예에 따라서 구축된 감성 어휘 데이터베이스를 이용하여 문장에서 감성을 인식하는 과정을 설명하기로 한다.
도 9는 본 발명의 일 실시예에 따른 감성 어휘 데이터베이스를 이용하여 문장에서 감성을 인식하는 과정을 보여주는 개념도이다.
도 10은 본 발명의 일 실시예에 따른 감성 어휘 데이터베이스를 이용하여 문장에서 감성을 인식한 결과를 보여주는 개념도이다.
도 9에 나타난 것처럼 본 발명의 일 실시예에 따른 감성 어휘 데이터베이스를 이용하여 문장에서 감성을 인식하여 도 10에 나타난 결과(950)와 같이 수치화 할 수 있는데 그 과정은 다음과 같다.
1) 문장언어 처리
예를 들어, 예제 문장 (S1) = "새로 산 갤스 2 배터리가 넘 잘 닳아서 짜증나"를 선택하여, 문장 언어처리 모듈(910), 즉 형태소 분석, 개체명 인식, 청킹을 포함하는 언어분석을 수행하여 다음과 같은 결과(911)가 나올 수 있다.
새로/adv 산/v <갤스2:HW_PHONE> 배터리/nn가/jc 잘/ad 닳/v아서/jx 넘/ad 짜증나/v
2) 문장-어휘 매칭
다음으로, 위 결과에 대한 문장-어휘 매칭(920), 즉 감성 어휘 데이터베이스내의 감성 표현 어휘(A)와 감성 근거 어휘(T)를 활용한 감성 인식 모듈을 수행하여 다음과 같은 분석 결과(921)가 나올 수 있다.
새로/ 산/ 갤스2/ <배터리, 잘 닳다> "짜증나"
감성 표현 어휘 = "짜증나"
감성 근거 어휘 = <배터리, 닳다>
2) 문장 감성 결정
위 결과에 대한 문장 감성 결정(930), 즉 감성 분류 및 감성 강도를 위에 설명된 수학식 1을 적용하여 계산하여 다음과 같은 결과(931)가 나올 수 있다.
감성분류: "짜증나"-불쾌
감성강도(SentScore(S1))= 가중치("넘")* SentDegree_of_Anchor("짜증나")=
2 * 1 = 2
위와 같은 과정을 통해 주어진 예제문장 S1의 최종 감성 값은 [불쾌, 2] 로 분석된다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (13)

  1. 감성 어휘 데이터베이스에 저장된 감성 표현 어휘를 읽어오는 단계;
    웹 문서들을 검색하여, 읽어온 감성 표현 어휘가 포함된 문장을 탐색하고, 탐색된 문장에 대하여, 형태소 분석, 개체명 인식 및 청킹을 포함하는 언어분석 또는 문장-어휘 매칭을 수행하여 적어도 하나의 감성 근거 어휘를 도출하는 단계;
    상기 도출된 적어도 하나의 감성 근거 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규하다고 판단되는 신규 감성 근거 어휘를 선정하여 상기 감성 어휘 데이터베이스에 저장하는 단계;
    상기 감성 어휘 데이터베이스에 저장된 감성 근거 어휘를 읽어오는 단계;
    웹 문서들을 검색하여, 읽어온 감성 근거 어휘가 포함된 문장을 탐색하고, 탐색된 문장에 대하여, 상기 언어분석 또는 상기 문장-어휘 매칭을 통해 적어도 하나의 감성 표현 어휘를 도출하는 단계;
    도출된 적어도 하나의 감성 표현 어휘 중 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 신규하다고 판단되는 신규 감성 표현 어휘를 선정하여 상기 감성 어휘 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 방법.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 신규 감성 근거 어휘를 선정하여 상기 감성 어휘 데이터베이스에 저장하는 단계는,
    상기 도출된 적어도 하나의 감성 근거 어휘를 동일 의미를 갖는 감성 근거 어휘별로 그룹화하고, 그룹화된 상기 적어도 하나의 감성 근거 어휘를 상기 적어도 하나의 신규 어휘 기준에 따라 순위화하여, 일정한 순위 내에 속하는 감성 근거 어휘 그룹 내의 감성 근거 어휘를 선정하여, 선정된 신규 감성 근거 어휘를 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 하는 감성 어휘 정보 구축 방법.
  4. 청구항 1에 있어서,
    상기 신규 감성 표현 어휘를 선정하여 상기 감성 어휘 데이터베이스에 저장하는 단계는,
    상기 도출된 적어도 하나의 감성 표현 어휘를 동일 의미를 갖는 감성 표현 어휘별로 그룹화하고, 그룹화된 상기 적어도 하나의 감성 표현 어휘를 상기 적어도 하나의 신규 어휘 기준에 따라 순위화하여 일정한 순위 내에 속하는 감성 표현 어휘 그룹 내의 감성 표현 어휘를 선정하여, 선정된 신규 감성 표현 어휘를 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 하는 감성 어휘 정보 구축 방법.
  5. 삭제
  6. 청구항 1에 있어서,
    상기 미리 정의된 신규 어휘 기준은 상기 어휘가 포함된 문장의 수, 상기 어휘가 포함된 문서의 수, 상기 어휘가 포함된 문장이 속한 문서의 인기도, 상기 어휘가 포함된 문장이 속한 웹 사이트의 인지도 중의 적어도 하나를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 방법.
  7. 청구항 1에 있어서,
    상기 감성 어휘 데이터베이스에 저장된 감성 표현 어휘에 감성의 강도를 부여하고 상기 감성의 강도를 상기 감성 어휘 데이터베이스에 저장하는 단계를 더 포함하되,
    상기 감성의 강도는,
    상기 감성 어휘 데이터베이스에서 감성 표현 어휘를 읽어오고, 읽어온 감성 표현 어휘가 포함된 웹 문서들을 탐색하여, 탐색된 웹 문서들에 포함된 정형화된 감성의 정도 중에서 상기 감성 어휘 데이터베이스에 저장된 감성 표현 어휘에 대응되는 감성의 정도를 참조하여 부여되는 것을 특징으로 하는, 감성 어휘 정보 구축 방법.
  8. 삭제
  9. 감성 표현 어휘와, 상기 감성 표현 어휘에 대응되는 감성 근거 어휘를 저장하는 감성 어휘 데이터베이스;
    상기 감성 어휘 데이터베이스에서 읽어온 감성 표현 어휘를 기초로, 웹 문서들을 검색하여, 읽어온 감성 표현 어휘가 포함된 문장을 탐색하고, 탐색된 문장에 대하여, 형태소 분석, 개체명 인식 및 청킹을 포함하는 언어분석 또는 문장-어휘 매칭을 수행하여 적어도 하나의 감성 근거 어휘를 도출하는 감성 근거 어휘 도출부;
    상기 도출된 적어도 하나의 감성 근거 어휘 중 미리 정의된 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 근거 어휘를 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 근거 어휘 판단부;
    상기 감성 어휘 데이터베이스에서 읽어온 감성 근거 어휘를 기초로, 웹 문서들을 검색하여, 읽어온 감성 근거 어휘가 포함된 문장을 탐색하고, 탐색된 문장에 대하여, 상기 언어분석 또는 상기 문장-어휘 매칭을 수행하여 적어도 하나의 감성 표현 어휘를 도출하는 감성 표현 어휘 도출부; 및
    상기 도출된 적어도 하나의 감성 표현 어휘 중 미리 정의된 신규 어휘 기준에 따라 신규 하다고 판단되는 신규 감성 표현 어휘를 상기 감성 어휘 데이터베이스에 저장하는 신규 감성 표현 어휘 판단부를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 장치.
  10. 제 9항에 있어서,
    상기 신규 감성 근거 어휘 판단부는,
    상기 도출된 적어도 하나의 감성 근거 어휘를 동일 의미를 갖는 감성 근거 어휘별로 그룹화하고, 그룹화된 상기 적어도 하나의 감성 근거 어휘를 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 순위화하여, 일정한 순위 내에 속하는 감성 근거 어휘 그룹 내의 감성 근거 어휘를 선정하여, 선정된 신규 감성 근거 어휘를 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 하는 감성 어휘 정보 구축 장치.
  11. 제 9항에 있어서,
    상기 신규 감성 표현 어휘 판단부는,
    상기 도출된 적어도 하나의 감성 표현 어휘를 동일 의미를 갖는 감성 표현 어휘별로 그룹화하고, 그룹화된 상기 적어도 하나의 감성 표현 어휘를 미리 정의된 적어도 하나의 신규 어휘 기준에 따라 순위화하여 일정한 순위 내에 속하는 감성 표현 어휘 그룹 내의 감성 표현 어휘를 선정하여, 선정된 신규 감성 표현 어휘를 상기 감성 어휘 데이터베이스에 저장하는 것을 특징으로 하는 감성 어휘 정보 구축 장치.
  12. 제 9항에 있어서,
    상기 미리 정의된 신규 어휘 기준은 상기 어휘가 포함된 문장의 수, 상기 어휘가 포함된 문서의 수, 상기 어휘가 포함된 문장이 속한 문서의 인기도, 상기 어휘가 포함된 문장이 속한 웹 사이트의 인지도 중의 적어도 하나를 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 장치.
  13. 제 9항에 있어서,
    상기 감성 어휘 데이터베이스는 상기 감성 어휘 데이터베이스에 저장된 감성 표현 어휘에 대한 감성 강도를 더 저장하고,
    상기 감성 어휘 정보 구축장치는 상기 감성 어휘 데이터베이스에서 읽어온 감성 표현 어휘가 포함된 웹 문서들을 탐색하고, 탐색된 웹 문서들에 포함된 정형화된 감성의 정도 중에서 읽어온 감성 표현 어휘에 대응되는 감성의 정도를 참조하여, 읽어온 감성 표현 어휘에 감성의 강도를 부여하여 상기 감성 어휘 데이터베이스에 저장하는 감성 강도 부여부를 더 포함하는 것을 특징으로 하는 감성 어휘 정보 구축 장치.
KR1020110084801A 2011-08-24 2011-08-24 감성 어휘 정보 구축 방법 및 장치 KR101695014B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110084801A KR101695014B1 (ko) 2011-08-24 2011-08-24 감성 어휘 정보 구축 방법 및 장치
US13/592,871 US9652997B2 (en) 2011-08-24 2012-08-23 Method and apparatus for building emotion basis lexeme information on an emotion lexicon comprising calculation of an emotion strength for each lexeme

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110084801A KR101695014B1 (ko) 2011-08-24 2011-08-24 감성 어휘 정보 구축 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20130022075A KR20130022075A (ko) 2013-03-06
KR101695014B1 true KR101695014B1 (ko) 2017-01-10

Family

ID=47744225

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110084801A KR101695014B1 (ko) 2011-08-24 2011-08-24 감성 어휘 정보 구축 방법 및 장치

Country Status (2)

Country Link
US (1) US9652997B2 (ko)
KR (1) KR101695014B1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2631164C2 (ru) * 2011-12-08 2017-09-19 Общество с ограниченной ответственностью "Базелевс-Инновации" Способ анимации sms-сообщений
KR101625787B1 (ko) * 2015-02-02 2016-05-30 숭실대학교산학협력단 단어의 감성 수치 추정 방법 및 서버
CN106610955A (zh) * 2016-12-13 2017-05-03 成都数联铭品科技有限公司 基于词典的多维度情感分析方法
KR102069101B1 (ko) * 2018-03-26 2020-01-22 주식회사 와이즈넛 고객의 소리 데이터로부터 주요 자질 추출 방법 및 이를 이용한 데이터 유형 분류 방법
US10529116B2 (en) * 2018-05-22 2020-01-07 International Business Machines Corporation Dynamically transforming a typing indicator to reflect a user's tone
KR102334018B1 (ko) * 2018-11-27 2021-12-02 연세대학교 산학협력단 자가 증식된 비윤리 텍스트의 유효성 검증 장치 및 방법
KR101987605B1 (ko) * 2018-12-28 2019-06-10 건국대학교 산학협력단 음악 감성 인식 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020199166A1 (en) * 2000-12-20 2002-12-26 Yanon Volcani System and method for determining and controlling the impact of text

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000017788A (ko) 1999-12-08 2000-04-06 서성호 인공지능 감성 데이터베이스 구축 및 활용 방법
US20090234718A1 (en) * 2000-09-05 2009-09-17 Novell, Inc. Predictive service systems using emotion detection
KR100475096B1 (ko) 2002-11-12 2005-03-11 인하대학교 산학협력단 감성어휘를 이용한 텍스타일 패턴 추천시스템 및 방법
KR100935828B1 (ko) 2007-10-02 2010-01-06 동국대학교 산학협력단 감정정보 추출 장치 및 방법
KR100917784B1 (ko) 2007-12-24 2009-09-21 한성주 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템
KR100943962B1 (ko) 2008-01-22 2010-02-26 에스케이커뮤니케이션즈 주식회사 감성 기반의 아이템 검색 서비스 제공 방법, 데이터베이스구축 방법 및 검색 서버
KR20100102515A (ko) * 2009-03-11 2010-09-24 동국대학교 산학협력단 디지털 액터의 감성을 자동으로 표현하는 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020199166A1 (en) * 2000-12-20 2002-12-26 Yanon Volcani System and method for determining and controlling the impact of text

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Neviarouskaya et al., "Generating a Reliable Lexicon for Sentiment Analysis", IEEE 978-1-4244-4799-2009, 2009*

Also Published As

Publication number Publication date
US20130052619A1 (en) 2013-02-28
US9652997B2 (en) 2017-05-16
KR20130022075A (ko) 2013-03-06

Similar Documents

Publication Publication Date Title
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN108647205B (zh) 细粒度情感分析模型构建方法、设备及可读存储介质
US10997370B2 (en) Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
KR101695014B1 (ko) 감성 어휘 정보 구축 방법 및 장치
CN106503192B (zh) 基于人工智能的命名实体识别方法及装置
US9792279B2 (en) Methods and systems for analyzing communication situation based on emotion information
CN111291210B (zh) 图像素材库生成方法、图像素材推荐方法及相关装置
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
JP5403696B2 (ja) 言語モデル生成装置、その方法及びそのプログラム
CN107102993B (zh) 一种用户诉求分析方法和装置
CN109739973A (zh) 文本摘要生成方法、装置、电子设备及存储介质
US9015168B2 (en) Device and method for generating opinion pairs having sentiment orientation based impact relations
CN103744953A (zh) 一种基于中文文本情感识别的网络热点挖掘方法
CN102831184A (zh) 根据对社会事件的文字描述来预测社会情感的方法及系统
CN102279890A (zh) 基于微博的情感词提取收集方法
Kumar et al. Analysis of users’ sentiments from kannada web documents
CN108549697A (zh) 基于语义关联的信息推送方法、装置、设备以及存储介质
CN105069647A (zh) 一种改进的抽取中文商品评论中评价对象的方法
CN106653006B (zh) 基于语音交互的搜索方法和装置
JP2005301856A (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
CN113361252B (zh) 基于多模态特征和情感词典的文本抑郁倾向检测系统
JP5345987B2 (ja) 文書検索装置、文書検索方法および文書検索プログラム
CN107315735B (zh) 用于笔记整理的方法及设备
CN109783612A (zh) 报表数据定位方法及装置、存储介质、终端
KR101614551B1 (ko) 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191223

Year of fee payment: 4