KR20120014277A - 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법 - Google Patents

상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법 Download PDF

Info

Publication number
KR20120014277A
KR20120014277A KR1020100076206A KR20100076206A KR20120014277A KR 20120014277 A KR20120014277 A KR 20120014277A KR 1020100076206 A KR1020100076206 A KR 1020100076206A KR 20100076206 A KR20100076206 A KR 20100076206A KR 20120014277 A KR20120014277 A KR 20120014277A
Authority
KR
South Korea
Prior art keywords
positive
negative
product
domain
dictionary
Prior art date
Application number
KR1020100076206A
Other languages
English (en)
Other versions
KR101134701B1 (ko
Inventor
이수원
송종석
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020100076206A priority Critical patent/KR101134701B1/ko
Publication of KR20120014277A publication Critical patent/KR20120014277A/ko
Application granted granted Critical
Publication of KR101134701B1 publication Critical patent/KR101134701B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Abstract

본 발명은 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법에 관한 것으로, 다양한 도메인에서 평점이 포함된 상품평을 수집하여 상품평 데이터베이스에 저장하는 상품평 수집기(10)와, 상기 상품평 데이터베이스에서 주로 언급되는 주격 명사를 추출하여 제품 특징 데이터베이스에 저장하는 제품 특징 추출기(20)와, 상기 상품평 데이터베이스와 제품 특징 데이터베이스에서 품사 태깅과 제품 특징을 서술하는 서술어 정보를 태깅하는 품사 태깅기(30)와, 상기 상품평 데이터베이스에서 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전 데이터베이스를 구축하는 평점 사전 구축기(40)와, 상기 평점 긍정 및 부정 사전 데이터베이스를 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 데이터베이스를 구축하는 공통 사전 구축기(50)와, 상기 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 긍정 및 부정으로 분류하여 도메인 긍정 및 부정 사전을 구축하는 도메인 사전 구축기(60)로 구성된다. 따라서, 본 발명은 서술어의 긍정 및 부정적인 성향을 자동으로 분류함으로써, 수작업으로 긍정 및 부정 사전을 구축할 때보다 시간과 노력을 최소화시키고, 수작업시 누락될 수 있는 서술어를 실제 데이터를 분석하여 추출할 수 있는 효과가 있다.

Description

상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법{The Method and System for Automatically Constructing Positive/Negative Feature-Predicate Dictionary for Polarity Classification of Product Reviews}
본 발명은 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법에 관한 것으로, 더욱 세부적으로는 상품평 분류 성능 향상을 위해 도메인별 제품 특징을 고려한 긍정 및 부정 사전을 자동으로 구축하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법에 관한 것이다.
전자상거래가 발달하면서 온라인상에서 상품을 구매하는 수요가 증가하고 있으며 이로 인해 자신이 구매한 상품에 대한 의견을 공유하는 커뮤니티 또한 발전하게 되었다.
전자상거래에서 상품평은 상품에 대한 사용 후기로서 제품 특징에 대한 사용자의 의견을 담고 있기 때문에 구매자에게 유용한 정보로 활용되며, 이러한 상품평을 분류해주기 위해 오피니언 마이닝에 관한 연구가 활발히 진행되고 있는데, 오피니언 마이닝에서 상품평 분류 성능은 어휘적 자원에 많은 영향을 받고 있어서 어휘적 자원인 긍정/부정 사전이 중요한 역할을 하고 있다.
현재는 온라인 쇼핑몰의 발달로 구매자들은 장소나 시간에 구애를 받지 않고 원하는 상품을 구매할 수 있게 되었으며, 온라인 쇼핑몰은 오프라인 쇼핑몰과 버금하는 시장 규모를 보이고 있어 전자상거래와 관련된 데이터의 양은 급속히 증가하고 있다.
온라인 쇼핑몰의 경우, 상품 구매 후 상품에 대한 이용 후기를 작성하는데, 다른 사람들은 상기 상품에 대한 이용 후기 평가를 참조하여 상품의 구매 결정에 영향을 받게 되는 것으로, 즉 온라인 쇼핑몰에서는 상품을 직접 확인해 볼 수 없기 때문에 구매자의 상품평이 구매 의사에 많은 영향을 끼치게 된다.
그러나, 상품평을 모두 확인하는 것은 불가능하고 일부만 확인하는 경우에는 한쪽 의견에 편향되는 문제가 존재하게 된다.
오피니언 마이닝은 잠재적 구매자에게 상품에 대한 사용자의 의견을 분류해줌으로써 보다 유용한 상품 정보를 제공할 수 있으며, 기업에게는 자신의 제품에 대한 구매자의 의견을 피드백 받을 수 있어 높은 활용성을 가지고 있다.
오피니언 마이닝에서 상품평을 분류하기 위해서는 긍정/부정 사전과 같은 어휘 사전을 사용하게 되며, 어휘 사전은 도메인마다 수동으로 구축하여 사용할 수도 있다.
그러나, 관리자가 여러 도메인마다 긍정/부정 사전을 수동으로 구축하는 것은 구축비용, 시간적 비용, 유치보수 문제로 비효율적이라고 할 수 있으며, 긍정/부정 사전을 여러 도메인에 공통으로 사용할 때에는 도메인마다 다르게 사용될 수 있는 서술어의 의미 방향을 반영하지 못하는 문제점이 존재하게 된다.
예를 들어, “크다”라는 서술어는 의류 도메인에서 “사이즈가 크다”와 같이 부정적인 의미방향으로 사용되지만, 전자제품 도메인에서는 “화면이 크다”와 같이 긍정적인 의미방향으로 사용되어 도메인별로 서술어가 다른 의미 방향을 갖는다.
상술한 바와 같은 문제점을 해결하기 위하여, 본 발명에서는 상품평에서 제품 특징을 추출한 후, 상품평에서 존재하는 평점을 활용하여 도메인별로 평점 긍정 및 부정 사전을 구축하고, 구축된 평점 긍정 및 부정 사전을 이용하여 여러 도메인에서 공통으로 사용할 수 있는 공통 긍정 및 부정 사전을 구축한 다음, 구축된 공통 긍정 및 부정 사전의 서술어와의 접속정보를 분석함으로써 도메인 긍정 및 부정 사전을 구축하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법을 제공하는데 목적이 있다.
목적을 달성하기 위한 구성으로는 다양한 도메인에서 평점이 포함된 상품평을 수집하여 상품평 데이터베이스에 저장하는 상품평 수집기와; 상기 상품평 데이터베이스에서 주로 언급되는 주격 명사를 추출하여 제품 특징 데이터베이스에 저장하는 제품 특징 추출기와; 상기 상품평 데이터베이스와 제품 특징 데이터베이스에서 품사 태깅과 제품 특징을 서술하는 서술어 정보를 태깅하는 품사 태깅기와; 상기 상품평 데이터베이스에서 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전 데이터베이스를 구축하는 평점 사전 구축기와; 상기 평점 긍정 및 부정 사전 데이터베이스를 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 데이터베이스를 구축하는 공통 사전 구축기와; 상기 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 긍정 및 부정으로 분류하여 도메인 긍정 및 부정 사전을 구축하는 도메인 사전 구축기로 구성된다.
목적을 달성하기 위한 방법으로는 다양한 도메인에서 평점이 포함된 상품평을 수집하는 제10단계와; 상기 상품평에서 주로 언급되는 제품 특징을 추출하는 제20단계와; 상기 상품평의 품사 태깅을 수행하고, 추출된 제품 특징을 서술하는 서술어 정보를 추출하는 제30단계와; 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전을 구축하는 제40단계와; 평점 긍정 및 부정 사전을 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 사전을 구축하는 제50단계와; 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 분류하여, 도메인 긍정 및 부정 사전을 구축하는 제60단계를 포함한다.
상기한 바와 같이, 본 발명은 서술어의 긍정 및 부정적인 성향을 자동으로 분류함으로써, 수작업으로 긍정 및 부정 사전을 구축할 때보다 시간과 노력을 최소화시키고, 수작업시 누락될 수 있는 서술어를 실제 데이터를 분석하여 추출할 수 있으며, 사전 데이터를 활용할 때의 문제점인 확장성 문제를 온라인 어휘를 수용함으로써 해결할 수 있는 효과가 있다.
도 1은 본 발명에 따른 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템의 구성도.
도 2는 본 발명에 따른 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법의 흐름도.
도 3은 본 발명에 따른 제품 특징 추출 방법의 흐름도.
도 4는 본 발명에 따른 평점 긍정 및 부정 사전 구축 방법의 흐름도.
도 5는 본 발명에 따른 평점 긍정 및 부정 사전 중 공통 긍정 및 부정 사전 부분을 나타낸 참고도.
도 6은 본 발명에 따른 도메인별 긍정 및 부정 사전 구축 방법의 흐름도.
도 1은 본 발명에 따른 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템의 구성도이고, 도 2는 본 발명에 따른 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법의 흐름도이고, 도 3은 본 발명에 따른 제품 특징 추출 방법의 흐름도이고, 도 4는 본 발명에 따른 평점 긍정 및 부정 사전 구축 방법의 흐름도이고, 도 5는 본 발명에 따른 평점 긍정 및 부정 사전 중 공통 긍정 및 부정 사전 부분을 나타낸 참고도이고, 도 6은 본 발명에 따른 도메인별 긍정 및 부정 사전 구축 방법의 흐름도이다.
이하, 도면을 참고로 구성요소를 설명하면 다음과 같다.
도 1은 본 발명의 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템의 구성도로서, 다양한 도메인에서 평점이 포함된 상품평을 수집하여 상품평 데이터베이스에 저장하는 상품평 수집기(10)와, 상기 상품평 데이터베이스에서 주로 언급되는 주격 명사를 추출하여 제품 특징 데이터베이스에 저장하는 제품 특징 추출기(20)와, 상기 상품평 데이터베이스와 제품 특징 데이터베이스에서 품사 태깅과 제품 특징을 서술하는 서술어 정보를 태깅하는 품사 태깅기(30)와, 상기 상품평 데이터베이스에서 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전 데이터베이스를 구축하는 평점 사전 구축기(40)와, 상기 평점 긍정 및 부정 사전 데이터베이스를 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 데이터베이스를 구축하는 공통 사전 구축기(50)와, 상기 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 긍정 및 부정으로 분류하여 도메인 긍정 및 부정 사전을 구축하는 도메인 사전 구축기(60)로 구성된다.
도 2는 본 발명의 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법의 흐름도로서, 다양한 도메인에서 평점이 포함된 상품평을 수집하는 제10단계(S10)와, 상기 상품평에서 주로 언급되는 제품 특징을 추출하는 제20단계(S20)와, 상기 상품평의 품사 태깅을 수행하고, 추출된 제품 특징을 서술하는 서술어 정보를 추출하는 제30단계(S30)와, 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전을 구축하는 제40단계(S40)와, 평점 긍정 및 부정 사전을 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 사전을 구축하는 제50단계(S50)와, 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 분류하여, 도메인 긍정 및 부정 사전을 구축하는 제60단계(S60)를 포함한다.
도 3은 상기 제품의 특징을 추출하는 제20단계(S20)의 흐름도로서, 상품평 문장에서 주격 조사를 이용하여 명사를 추출하는 제21단계(S21)와, 불용어 리스트를 활용하여 필요없는 단어를 필터링하는 제22단계(S22)와, 필터링된 단어 빈도를 카운트하는 제23단계(S23)와, 고빈도 단어를 추출하여 후보 제품 특징 데이터베이스에 저장하는 제24단계(S24)와, 상기 후보 제품 특징 데이터베이스에서 선별된 제품 특징이 데이터베이스에 저장되는 제25단계(S25)를 포함한다.
제품 특징은 상품평에서 주격 조사가 존재하는 명사를 대상으로 하는데, 주격 조사는 문장에서 체언이 서술어의 주어임을 표시하는 격조사로서 ‘은’, ‘는’, ‘이’, ‘가’ 등이 있으며, 예를 들면, “디자인이 괜찮고, 가격은 좀 비싼 것 같아요”라는 문장에서 ‘디자인’과 ‘가격’이라는 명사에 주격 조사 ‘이’, ‘은’이 존재하면 ‘디자인’과 ‘가격’을 추출하여 출현 횟수를 누적시킨다.
후보 제품 특징 추출시 ‘이것’, ‘저것’, ‘보다’와 같은 불용어가 고빈도 단어로 출현하는 문제가 존재하는데, 이러한 문제를 해결하기 위해서 후보 제품 특징을 카운트하는 과정에서 불용어 리스트를 활용하여 필요없는 단어를 필터링하지만, 불용어로 모든 단어를 필터링하기에는 어려움이 존재하기 때문에 최종 제품 특징 선택은 관리자에 의해 수동으로 수행된다.
출현한 고빈도 단어들은 후보 제품 특징으로 사용되며, 관리자에 의해 선별된 제품 특징들은 도메인 긍정 및 부정 사전의 구축을 위한 제품 특징으로 사용된다.
본 발명에서는 핸드폰 도메인에서 12개, 영화 도메인에서 10개, 의류 도메인에서 10개의 제품 특징들을 각각 수동으로 선별해 사용하는 실시예를 이용하여 설명한다.
하기의 표 1은 후보 제품 특징이고, 표 2는 선별된 제품 특징을 나타낸다.
Figure pat00001
Figure pat00002
상기 품사 태깅 및 서술어 정보를 추출하는 제30단계(S30)는 긍정 및 부정 사전을 구축하는데 있어서, 단어들의 품사를 태깅한 후 제품 특징과 제품 특징을 서술하는 서술어 및 접속정보를 추출하는 것으로, 긍정 및 부정 사전에 구축한 서술어는 형용사, 동사를 대상으로 하고 제품 특징을 서술하는 서술어를 분석하기 위해서 몇 가지 규칙을 활용한다.
일반적으로 한 대상을 서술하는 서술어는 대상을 앞에서 서술하는 서술어와 뒤에서 서술하는 서술어로 나누어지며, 앞에서 대상을 서술하는 품사로는 관형사형 어미 등이 있고, 하기의 표 3은 제품 특징을 앞에서 서술하는 서술어를 판단하기 위한 규칙을 나타낸다.
Figure pat00003
제품 특징을 뒤에서 서술하는 서술어 정보의 판단은 상기 표 3의 규칙과 동일하거나 새로운 “명사 + 주격 조사”의 형태가 나타나기 전까지 제품 특징을 앞에서 서술하는 서술어로 판단한다.
예를 들면, “슬림한 디자인이 세련되고 깔끔한 색상도 좋습니다.”라는 상품평을 분석하면 “슬림한 디자인”이 “형용사 + 관형사형 어미 + 명사”의 형태로 품사 태깅되며, 표 3의 규칙에 따라 ‘슬림하다’가 ‘디자인’을 앞에서 서술하는 서술어로 추출된다. 또한, ‘디자인’을 뒤에서 서술하는 서술어의 경우에는 “깔끔한 색상”에 대한 품사 “형용사 + 관형형 어미 + 명사”의 형태가 나오기 전의 서술어인 ‘세련되다’가 ‘디자인’을 뒤에서 서술하는 서술어로 추출된다. 접속정보로는 문장 안에 존재하는 ‘나’, ‘고’, ‘지만’, ‘그리고’, ‘그러나’, ‘하지만’과 같은 연결어미 정보와 접속부사를 활용한다. 최종적으로 위 상품평은 “<[AJ]슬림하다, [N]디자인, [AJ]세련되다 > [CN]그리고 <[AJ]깔끔하다, [F]색상, [AJ]좋다>”로 분석된다. 태깅 정보인 [AJ]는 형용사, [N]은 명사, [VV]는 동사, [CN]은 접속정보를 의미한다.
제품 특징이 존재하지 않은 문장의 경우 규칙을 사용하지 않고 전체 문장을 형용사, 동사, 접속정보만으로 품사 태깅하며, 제품 특징이 존재하지 않는 문장의 예로는 “아담하고 세련된게 좋아요”로서, 분석 결과로는 “<[AJ]아담하다, [CN]그리고, [AJ]세련되다, [AJ]좋다>”가 된다.
도 4는 상기 평점 긍정 및 부정 사전을 구축하는 제40단계(S40)의 흐름도로서, 수집된 상품평을 평점에 따라 긍정 및 부정 상품평으로 분리하는 제41단계(S41)와, 분리된 각 상품평에서 서술어를 추출하는 제42단계(S42)와, 평점별 출현 서술어와 빈도를 분석하여 긍정 서술어와 부정 서술어로 분류하는 제43단계(S43)와, 평점별 긍정 및 부정에 따른 비율 값을 계산하여 평점 긍정 및 부정 사전 데이터베이스에 저장하는 제44단계(S44)를 포함한다.
긍정 및 부정 사전을 평점으로 구축하는 이유는 평점이 상품평과 동일한 의미를 지니고 있어서 평점으로 상품평의 의미방향을 추론할 수 있고, 의미방향이 추론된 상품평에는 상품평과 의미방향이 비슷한 서술어들이 존재하여 서술어의 의미방향을 분류할 수 있기 때문으로, 평점이 존재하지 않는 상품평을 이용한다면 수동으로 상품평의 의미방향을 분류하여야 한다.
수집된 상품평은 평점에 따라 긍정 및 부정 상품평으로 분류되는데, 예를 들면 상품평에 1~5점의 평점이 존재할 때 평점이 1~2점인 상품평은 부정적 상품평, 4~5점인 상품평은 긍정적 상품평으로 분류할 수 있다. 긍정적인 상품평에서 출현한 서술어의 출현 빈도 정보와 부정적인 상품평에서 출현한 서술어의 출현 빈도 정보를 비교하면, 긍정적인 상품평과 부정적인 상품평에서 모두 출현한 서술어와 긍정 또는 부정적 상품평 한쪽에서만 출현한 서술어로 나뉘어지게 된다.
Figure pat00004
상기 표 4는 서술어가 긍정 및 부정 상품평에 모두 출현하는 예로서, 예문에서 ‘좋다’, ‘투박하다’는 긍정 및 부정 상품평에 모두 존재할 수 있는 서술어들이다. 하지만 출현 빈도를 누적시켜볼 때 ‘좋다’라는 서술어는 긍정 상품평에 더 많이 존재하게 되고, ‘투박하다’하는 서술어 또한 부정적 상품평에 더 많이 존재하므로 서술어가 긍정 및 부정 상품평에 출현하는 비율 값을 계산하여 긍정 또는 부정 서술어로 분류된다.
Figure pat00005
상기 표 5는 의류 도메인에서 긍정, 부정 상품평에 중복되어 출현한 서술어와 출현 빈도로서, 의류 도메인은 긍정적인 상품평이 부정적인 상품평보다 상대적으로 많은 특징을 가지고 있으며, 이러한 도메인별 특징을 고려하지 않고 서술어의 단순 빈도 차이를 이용하여 서술어를 분류하게 될 경우 분류한 서술어가 긍정적인 성향으로 치우치는 문제가 존재하게 되며, 이 문제를 해결하기 위해 본 발명에서는 서술어의 출현 비율을 고려하여 서술어의 극성을 계산하는 과정을 수행한다.
서술어의 극성을 계산하는 방법은 하기의 수학식 1과 같다.
Figure pat00006
여기서,
Figure pat00007
이면 긍정,
Figure pat00008
이면 부정이고,
Figure pat00009
는 도메인 d에서 서술어 ω의 긍정 및 부정 극성이며,
Figure pat00010
이고,
Figure pat00011
는 도메인 d에서 서술어 ω가 긍정적 상품평에 출현한 수이며,
Figure pat00012
는 도메인 d에서 서술어 ω가 부정적 상품평에 출현한 수이고,
Figure pat00013
는 도메인 d에서의 긍정적 상품평 수이며,
Figure pat00014
는 도메인 d에서의 부정적 상품평 수를 의미한다.
상기 수학식 1의 결과 도메인에서 서술어의 극성인
Figure pat00015
가 기준값 (p1)보다 크면 서술어의 의미방향이 긍정인 1로 태깅되고, (-p1)보다 작으면 부정인 1로 태깅된다. 상기
Figure pat00016
가 (p1)과 (-p1) 사이의 값이면 서술어가 긍정 또는 부정 상품평에 출현한 비율이 비슷하여 긍정 또는 부정이라고 분류할 수 없는 값으로 평점 긍정 및 부정 사전에 추가하지 않는다.
하기의 표 6은 표 5의 결과를 상기 수학식 1을 이용하여 계산한 결과이고, 평가 칼럼에 ()는 서술어의 분류된 결과가 사람이 판단했을 때 바르게 분류되었다고 판단한 것이고, △는 제품 특징에 따라 의미방향이 다르게 사용되어서 의미방향을 판단할 수 없는 경우이고, ×는 서술어의 분류 결과가 사람이 판단했을 때 틀렸다고 판단한 결과이다.
Figure pat00017
하기의 표 7은 영화, 핸드폰, 의류 3개의 도메인에서 도메인별로 구축된 평점 긍정 및 부정 사전의 서술어 수를 나타내는 것으로, 평점 긍정 및 부정 사전만으로도 서술어의 긍정 및 부정의 분류가 가능하지만 본 발명에서 사용한 평점 긍정 및 부정을 구축하는 방법은 상품평에서 다음 의미방향을 가진 서술어들이 평점에 의해 동일한 의미방향으로 분류되는 문제점을 가지므로, 이러한 이유로 평점 긍정 및 부정 사전은 접속정보를 활용하여 긍정 및 부정 사전을 구축하는 단계에서 활용하기 위한 의미방향을 가진 공통 서술어를 찾기 위해서 사용한다.
Figure pat00018
상기 공통 긍정 및 부정 사전을 구축하는 제50단계(S50)는 상기 평점 긍정 및 부정 사전을 활용하여 구축하는데, 공통 긍정 및 부정 사전을 구축하는 이유는 도메인 긍정 및 부정 사전을 구축하는 제60단계(S60)에서 접속 정보를 활용하여 긍정 및 부정 사전을 구축하기 위해서 초기 서술어의 의미방향을 알고 있는 Seed Word가 필요하기 때문이다. 도메인별로 구축한 평점 긍정 및 부정 사전의 서술어를 해당 도메인의 Seed Word로 활용하지 않는 이유는 평점 긍정 및 부정 사전의 서술어들이 모두 바르게 분류된 것이 아니기 때문이며, 여러 도메인에서 공통으로 사용할 수 있는 정확한 Seed Word를 찾기 위해서이다.
Seed Word와의 접속정보를 활용하여 긍정 및 부정 사전을 구축하기 위해서는 의미방향이 정확히 분류된 Seed Word가 필요하며, 접속 정보를 활용하여 긍정 및 부정 사전을 구축할 때에 의미방향이 잘못 분류된 Seed Word를 사용할 경우에는 Seed Word와 접속정보로 연결된 서술어들이 Seed Word의 의미방향에 영향을 받아 문장안의 서술어들이 잘못 분석될 수 있다. 여러 도메인에서 구축한 평점 긍정 및 부정 사전에서 동일한 의미방향으로 사용되는 서술어는 다른 도메인에서도 동일한 의미방향으로 사용될 수 있고, 여러 도메인에서 공통으로 사용되었기 때문에 분류된 서술어의 의미방향이 평점 긍정 및 부정 사전에 구축된 서술어의 의미방향보다 정확하다고 볼 수 있다.
공통 긍정 및 부정 사전은 평점 긍정 및 부정 사전의 교집합 부분 즉, 여러 도메인에서 서술어가 공통적으로 사용되고 그 의미방향까지 동일하게 사용되는 서술어의 집합으로, 예를 들어 각 도메인에서 ‘좋다’라는 서술어가 사용되고 의미방향도 긍정적으로 동일하게 사용되는 경우에 ‘좋다’라는 서술어는 공통 긍정 및 부정 사전으로 추출된다.
도 5는 여러 도메인에서 공통으로 사용되고 의미방향도 동일하게 사용되는 공통 긍정 및 부정 사전을 나타낸 참고도이다.
추출된 공통 서술어는 공통 긍정 및 부정 사전에 삽입되어 도메인 긍정 및 부정 사전을 구축하기 위한 초기 서술어로 사용되는데, 하기의 표 8의 영화, 의류, 핸드폰 3개의 도메인으로부터 구축된 공통 긍정 및 부정 사전에는 43개의 긍정적 의미방향을 가진 서술어 및 23개의 부정적 의미방향을 가진 서술어가 포함됨을 알 수 있다.
Figure pat00019
도 6은 상기 도메인별 긍정 및 부정 사전을 구축하는 제60단계(S60)의 흐름도로서, 일반적인 의미를 가진 서술어의 긍정 및 부정 분류는 공통 긍정 및 부정 사전에 구축된 공통 서술어가 도메인별로 도메인 긍정 및 부정 사전에 초기화되어 Seed Word로 저장되는 제61단계(S61)와, 상기 초기화된 Seed Word와 서술어 사이의 접속부사 및 연결어미 정보를 이용하여 도메인별로 새로운 서술어의 의미방향을 분류하는 제62단계(S62)와, 새롭게 분류된 서술어들이 도메인 긍정 및 부정 사전에 추가되고, 추가된 서술어들은 다시 새로운 Seed Word로 활용되며, 추가된 Seed Word들은 초기 Seed Word가 출현한 상품평보다 더 많은 상품평을 반복 분석하는 과정을 수행하여 도메인 긍정 및 부정 사전이 확장 및 구축되는 제63단계(S63)를 포함한다.
예를 들면, Seed Word가 ‘좋다’라는 한 개의 서술어라면 ‘좋다’라는 서술어가 출현한 상품평만 분석할 수 있지만 ‘좋다’, ‘괜찮다’와 같이 Seed Word가 추가된 경우 두 개의 Seed Word가 존재하는 상품평을 분석할 수 있다.
Figure pat00020
접속정보는 ‘그러나’, ‘그런데’, ‘그렇지만’, ‘하지만’, ‘나’, ‘지만’ 등과 같은 역접관계와 ‘그리고’, ‘그래서’, ‘고’ 등과 같은 순접 관계로 나눌 수 있으며, Seed Word와 서술어 사이의 접속정보가 역접관계일 때 서술어는 Seed Word의 의미방향{1, 1}과 반대 의미방향(× 1)이 부여된다.
상기 표 9는 상품평에서 ‘떨어지다’라는 서술어가 부정적인 의미로 추론되는 과정을 보여주는 것으로, 모든 상품평을 분석하여 ‘떨어지다’라는 서술어가 긍정 또는 부정으로 추론된 수를 이용하여 도메인에서 서술어가 일반적으로 사용되는 의미방향으로 분류하고, 서술어들을 긍정 또는 부정으로 분류해주기 위해 하기의 수학식 2를 사용하여 서술어의 의미방향을 결정한다.
Figure pat00021
여기서,
Figure pat00022
이고,
Figure pat00023
는 긍정이며,
Figure pat00024
는 부정이고,
Figure pat00025
이며,
Figure pat00026
는 도메인 d에서 서술어 ω의 긍정 및 부정 극성이고,
Figure pat00027
는 도메인 d에서 서술어 ω가 긍정적으로 추론된 수이며,
Figure pat00028
는 도메인 d에서 서술어 ω가 부정적으로 추론된 수를 의미한다.
접속정보를 활용할 때에는 상기 수학식 1과 같이 긍정 및 부정 상품평의 비율정보를 고려하지 않으며, 비율 정보를 고려하지 않는 이유는 접속정보를 활용할 때에는 한 문장에서도 서술어의 긍정 및 부정의 의미방향이 분류가 가능하여 긍정 및 부정의 상품평 수의 차이에 영향을 받지 않기 때문이다.
하기의 표 10은 상기 표 9의 방법으로 서술어를 추론하고, 상기 수학식 2로 계산한 결과이다.
Figure pat00029
접속정보를 활용하여 서술어의 의미방향을 분류한 결과인 상기 표 10과 평점을 활용하여 서술어의 의미방향을 분류한 결과인 상기 표 6을 비교해보면 접속정보를 활용하였을 때에 ‘부하다’, ‘탁하다’, ‘세다’의 의미방향이 긍정적에서 부정적으로 바르게 분류된 것을 확인할 수 있으며, ‘부하다’, ‘탁하다’는 접속정보를 활용하였을 때에 바르게 분류되었고, ‘저렴하다’, ‘세다’, ‘싸다’는 제품 특징에 따라 다르게 사용될 수 있는 서술어이다.
상기 수학식 2의 결과 도메인 긍정 및 부정 사전에서
Figure pat00030
는 1과 -1사이 값을 갖으며,
Figure pat00031
가 (p2)보다 크면 긍정적인 서술어로 분류되고, (-p2)보다 작으면 부정적인 서술어로 분류된다. 또한
Figure pat00032
가 (-p2)와 (p2)의 사이 값이면 서술어가 긍정적 상품평과 부정적 상품평에 출현한 횟수가 비슷한 것으로서 서술어의 긍정 및 부정을 명확히 분류하기에는 그 영향력이 떨어진다고 할 수 있다. 긍정 및 부정 분류 영향력이 떨어지는 서술어들은 도메인 긍정 및 부정 사정에 확장되지 않으며, 최종적으로 구축된 도메인 긍정 및 부정 사전은 해당 도메인에서 가장 일반적으로 사용되어지는 의미방향을 갖는다.
또한, 상기 제60단계는 제품 특징별로 서술어의 의미방향이 다르게 사용되는 서술어를 찾아 도메인 긍정 및 부정 사전에 확장하여 구축하는데, 제품 특징별 서술어의 의미방향을 분류하는 방법은 제품 특징이 존재하는 상품평만 사용하는 것과 하기의 수학식 3을 사용하는 것을 제외하고는 상기 일반적인 의미를 가진 서술어의 긍정 및 부정 분류 방법과 동일하다.
하기의 표 11은 ‘좋다’라는 긍정적인 의미방향을 갖는 Seed Word를 활용하여 의류 도메인에서 ‘소재’라는 제품 특징을 서술하는 서술어의 의미방향을 추론하는 예이다.
Figure pat00033
제품 특징을 서술하는 서술어들은 품사 태깅 단계에서 분석되어 있고 분석된 결과를 활용하여 ‘소재’라는 제품 특징을 서술하는 서술어로 ‘부드럽다’를 추론한다. ‘좋다’라는 긍정적인 의미방향을 갖는 Seed Word로부터 ‘그리고’ 순접관계에 의하여 ‘부드럽다’가 긍정으로 추론되고, ‘배송’을 서술하는 ‘빠르다’와 같은 경우는 분석하지 않는다.
하기의 표 12는 상기 표 11의 방법으로 제품 특징 ‘소재’에 대한 서술어의 분석 결과를 하기의 수학식 3을 사용하여 서술어의 의미방향을 분류한 결과이다.
Figure pat00034
여기서, 상기
Figure pat00035
Figure pat00036
으로 도메인 d에서 제품 특징(fi)에 대한 서술어 ω의 긍정 및 부정 극성이고, 상기
Figure pat00037
이면 긍정이며,
Figure pat00038
이면 부정이고, 상기
Figure pat00039
이고, 상기
Figure pat00040
는 도메인 d에서 제품 특징(fi)에 대한 서술어 ω가 긍정적(p) 단어로 추론된 수이며, 상기
Figure pat00041
는 도메인 d에서 제품 특징(fi)에 대한 서술어 ω가 부정적(p) 단어로 추론된 수를 의미한다.
Figure pat00042
상기 표 6과 표 10은 의류 도메인에서 일반적으로 사용되는 서술어의 의미방향을 분류한 결과이지만, 제품 특징에 따라 서술어의 의미방향이 다르게 사용되는 경우가 있다. 표 12는 ‘저렴하다’, ‘싸다’와 같은 서술어들이 제품 특징에 따라 서술어의 의미방향이 다르게 분류된 것이다. ‘소재’에 대해서는 ‘저렴하다’와 ‘싸다’가 “저렴한 소재”, “싸구려 소재”와 같이 부정적으로 사용되지만 ‘가격’을 서술할 때에는 “가격이 저렴하다”, “싼 가격”과 같이 긍정적으로 사용되는 것을 알 수 있다.
본 발명에서는 의미방향을 분류할 서술어와 Seed Word와의 접속정보를 반복적으로 분석하여 제품 특징에 대한 서술어의 의미방향을 도메인 긍정 및 부정 사전에 점진적으로 확장 구축하며, 하기의 표 13은 도메인별로 구축된 도메인 긍정 및 부정 사전의 서술어 수를 나타낸다.
Figure pat00043
따라서, 본 발명은 상품평에서 제품 특징을 추출한 후, 상품평에서 존재하는 평점을 활용하여 도메인별로 평점 긍정 및 부정 사전을 구축하고, 구축된 평점 긍정 및 부정 사전을 이용하여 여러 도메인에서 공통으로 사용할 수 있는 공통 긍정 및 부정 사전을 구축한 다음, 구축된 공통 긍정 및 부정 사전의 서술어와의 접속정보를 분석함으로써 도메인 긍정 및 부정 사전을 구축할 수 있다.
본 발명은 특정의 실시 예와 관련하여 도시 및 설명하였지만, 첨부된 특허청구범위에 의해 나타난 발명의 사상 및 영역으로부터 벗어나지 않는 한도 내에서 다양한 개조 및 변화가 가능하다는 것을 당업계에서 통상의 지식을 가진 자라면 누구나 쉽게 알 수 있을 것이다.
10 : 상품평 수집기 20 : 제품 특징 추출기
30 : 품사 태깅기 40 : 평점 사전 구축기
50 : 공통 사전 구축기 60 : 도메인 사전 구축기

Claims (8)

  1. 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템에 있어서,
    다양한 도메인에서 평점이 포함된 상품평을 수집하여 상품평 데이터베이스에 저장하는 상품평 수집기(10)와;
    상기 상품평 데이터베이스에서 주로 언급되는 주격 명사를 추출하여 제품 특징 데이터베이스에 저장하는 제품 특징 추출기(20)와;
    상기 상품평 데이터베이스와 제품 특징 데이터베이스에서 품사 태깅과 제품 특징을 서술하는 서술어 정보를 태깅하는 품사 태깅기(30)와;
    상기 상품평 데이터베이스에서 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전 데이터베이스를 구축하는 평점 사전 구축기(40)와;
    상기 평점 긍정 및 부정 사전 데이터베이스를 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 데이터베이스를 구축하는 공통 사전 구축기(50)와;
    상기 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 긍정 및 부정으로 분류하여 도메인 긍정 및 부정 사전을 구축하는 도메인 사전 구축기(60)로 구성되는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템.
  2. 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법에 있어서,
    다양한 도메인에서 평점이 포함된 상품평을 수집하는 제10단계(S10)와;
    상기 상품평에서 주로 언급되는 제품 특징을 추출하는 제20단계(S20)와;
    상기 상품평의 품사 태깅을 수행하고, 추출된 제품 특징을 서술하는 서술어 정보를 추출하는 제30단계(S30)와;
    평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전을 구축하는 제40단계(S40)와;
    평점 긍정 및 부정 사전을 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 사전을 구축하는 제50단계(S50)와;
    공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 분류하여, 도메인 긍정 및 부정 사전을 구축하는 제60단계(S60)를 포함하는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
  3. 제 2항에 있어서, 상기 제20단계(S20)는
    상품평 문장에서 주격 조사를 이용하여 명사를 추출하는 제21단계(S21)와;
    불용어 리스트를 활용하여 필요없는 단어를 필터링하는 제22단계(S22)와;
    필터링된 단어 빈도를 카운트하는 제23단계(S23)와;
    고빈도 단어를 추출하여 후보 제품 특징 데이터베이스에 저장하는 제24단계(S24)와;
    상기 후보 제품 특징 데이터베이스에서 선별된 제품 특징이 데이터베이스에 저장되는 제25단계(S25)를 포함하는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
  4. 제 2항에 있어서,
    상기 제30단계(S30)는 단어들의 품사를 태깅한 후 제품 특징과 제품 특징을 서술하는 서술어 및 접속정보를 추출하되, 긍정 및 부정 사전에 구축할 서술어는 형용사와 동사를 대상으로 하며, 대상을 앞에서 서술하는 품사로는 관형사형 어미로 판단하고, 뒤에서 서술하는 서술어 정보는 관형사형 어미로 판단하거나 또는 새로운 “명사 + 주격 조사”의 형태가 나타나기 전까지 제품 특징을 앞에서 서술하는 서술어로 판단하는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
  5. 제 2항에 있어서, 상기 제40단계(S40)는
    수집된 상품평을 평점에 따라 긍정 및 부정 상품평으로 분리하는 제41단계(S41)와;
    분리된 각 상품평에서 서술어를 추출하는 제42단계(S42)와;
    평점별 출현 서술어와 빈도를 분석하여 긍정 서술어와 부정 서술어로 분류하는 제43단계(S43)와;
    평점별 긍정 및 부정에 따른 비율 값을 계산하여 평점 긍정 및 부정 사전 데이터베이스에 저장하는 제44단계(S44)를 포함하는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
  6. 제 2항에 있어서,
    상기 제50단계(S50)는 평점 긍정 및 부정 사전의 교집합 부분 즉, 여러 도메인에서 서술어가 공통으로 사용되고 그 의미방향까지 동일하게 사용되는 서술어의 집합으로 구성되는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
  7. 제 2항에 있어서, 상기 제60단계(S60)는
    공통 긍정 및 부정 사전에 구축된 공통 서술어가 도메인별로 도메인 긍정 및 부정 사전에 초기화되어 Seed Word로 저장되는 제61단계(S61)와;
    상기 초기화된 Seed Word와 서술어 사이의 접속부사 및 연결어미 정보를 이용하여 도메인별로 새로운 서술어의 의미방향을 분류하는 제62단계(S62)와;
    새롭게 분류된 서술어들이 도메인 긍정 및 부정 사전에 추가되고, 추가된 서술어들은 다시 새로운 Seed Word로 활용되며, 추가된 Seed Word들은 초기 Seed Word가 출현한 상품평보다 더 많은 상품평을 반복 분석하는 과정을 수행하여 도메인 긍정 및 부정 사전이 확장 및 구축되는 제63단계(S63)를 포함하는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
  8. 제 2항에 있어서, 상기 제60단계(S60)는
    제품 특징이 존재하는 상품평만 사용하여, 수학식
    Figure pat00044
    에 의해 도메인 긍정 및 부정 사전이 구축되되, 상기
    Figure pat00045
    Figure pat00046
    으로 도메인 d에서 제품 특징(fi)에 대한 서술어 ω의 긍정 및 부정 극성이고, 상기
    Figure pat00047
    이면 긍정이며,
    Figure pat00048
    이면 부정이고, 상기
    Figure pat00049
    이고, 상기
    Figure pat00050
    는 도메인 d에서 제품 특징(fi)에 대한 서술어 ω가 긍정적(p) 단어로 추론된 수이며, 상기
    Figure pat00051
    는 도메인 d에서 제품 특징(fi)에 대한 서술어 ω가 부정적(p) 단어로 추론된 수를 의미하는 것을 특징으로 하는 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 방법.
KR1020100076206A 2010-08-09 2010-08-09 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법 KR101134701B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100076206A KR101134701B1 (ko) 2010-08-09 2010-08-09 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100076206A KR101134701B1 (ko) 2010-08-09 2010-08-09 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20120014277A true KR20120014277A (ko) 2012-02-17
KR101134701B1 KR101134701B1 (ko) 2012-04-13

Family

ID=45837362

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100076206A KR101134701B1 (ko) 2010-08-09 2010-08-09 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101134701B1 (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455562A (zh) * 2013-08-13 2013-12-18 西安建筑科技大学 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
KR20150089723A (ko) * 2014-01-28 2015-08-05 포항공과대학교 산학협력단 자연어 대화 시스템을 위한 다중 도메인 식별 방법 및 장치
CN105787025A (zh) * 2016-02-24 2016-07-20 腾讯科技(深圳)有限公司 网络平台公共账号分类方法及装置
KR101700836B1 (ko) * 2015-12-21 2017-02-13 한국과학기술정보연구원 도서의 코멘트를 이용한 감성어 사전 구축 방법 및 시스템
WO2017026638A1 (ko) * 2015-08-10 2017-02-16 숭실대학교산학협력단 제품 유형 분류 장치 및 방법
KR20180080492A (ko) * 2017-01-04 2018-07-12 (주)프람트테크놀로지 사용자 리뷰를 이용한 상품 평가 시스템 및 방법
WO2019164119A1 (ko) * 2018-02-22 2019-08-29 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20190135584A (ko) * 2018-05-28 2019-12-09 동국대학교 산학협력단 감성어 사전 구축 장치 및 이의 동작 방법
KR20200000897A (ko) * 2018-06-26 2020-01-06 삼육대학교산학협력단 플레이스의 소셜 리뷰 분석 방법 및 시스템
KR102086996B1 (ko) * 2019-08-07 2020-05-29 장현영 소비자 반응을 이용한 브랜드 관리 플랫폼 시스템, 이를 이용한 상품 기획 방법 및 이를 위한 컴퓨터 프로그램
KR20220063483A (ko) * 2020-11-10 2022-05-17 주식회사 데이터캐스트 머신 러닝 기반의 텍스트 데이터의 감성 분석 장치 및 방법
KR20230049822A (ko) * 2021-10-06 2023-04-14 단국대학교 산학협력단 감성 사전을 자동으로 구축하는 방법 및 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069647A (zh) * 2015-07-30 2015-11-18 齐鲁工业大学 一种改进的抽取中文商品评论中评价对象的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020012997A (ko) * 2000-08-10 2002-02-20 박남규 실시간 인기도 평가 및 리포팅 시스템과 그 방법
KR100913049B1 (ko) * 2008-01-29 2009-08-20 엔에이치엔(주) 사용자 선호도를 이용한 긍정/부정 검색 결과 제공 방법 및시스템

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455562A (zh) * 2013-08-13 2013-12-18 西安建筑科技大学 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
KR20150089723A (ko) * 2014-01-28 2015-08-05 포항공과대학교 산학협력단 자연어 대화 시스템을 위한 다중 도메인 식별 방법 및 장치
WO2017026638A1 (ko) * 2015-08-10 2017-02-16 숭실대학교산학협력단 제품 유형 분류 장치 및 방법
KR101700836B1 (ko) * 2015-12-21 2017-02-13 한국과학기술정보연구원 도서의 코멘트를 이용한 감성어 사전 구축 방법 및 시스템
CN105787025B (zh) * 2016-02-24 2021-07-09 腾讯科技(深圳)有限公司 网络平台公共账号分类方法及装置
CN105787025A (zh) * 2016-02-24 2016-07-20 腾讯科技(深圳)有限公司 网络平台公共账号分类方法及装置
KR20180080492A (ko) * 2017-01-04 2018-07-12 (주)프람트테크놀로지 사용자 리뷰를 이용한 상품 평가 시스템 및 방법
WO2019164119A1 (ko) * 2018-02-22 2019-08-29 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20190101156A (ko) * 2018-02-22 2019-08-30 삼성전자주식회사 전자 장치 및 그 제어 방법
US11544469B2 (en) 2018-02-22 2023-01-03 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
KR20190135584A (ko) * 2018-05-28 2019-12-09 동국대학교 산학협력단 감성어 사전 구축 장치 및 이의 동작 방법
KR20200000897A (ko) * 2018-06-26 2020-01-06 삼육대학교산학협력단 플레이스의 소셜 리뷰 분석 방법 및 시스템
KR102086996B1 (ko) * 2019-08-07 2020-05-29 장현영 소비자 반응을 이용한 브랜드 관리 플랫폼 시스템, 이를 이용한 상품 기획 방법 및 이를 위한 컴퓨터 프로그램
KR20220063483A (ko) * 2020-11-10 2022-05-17 주식회사 데이터캐스트 머신 러닝 기반의 텍스트 데이터의 감성 분석 장치 및 방법
KR20230049822A (ko) * 2021-10-06 2023-04-14 단국대학교 산학협력단 감성 사전을 자동으로 구축하는 방법 및 장치

Also Published As

Publication number Publication date
KR101134701B1 (ko) 2012-04-13

Similar Documents

Publication Publication Date Title
KR101134701B1 (ko) 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법
Hoffart et al. Discovering emerging entities with ambiguous names
Phong et al. Mining user opinions in mobile app reviews: A keyword-based approach (t)
US9092789B2 (en) Method and system for semantic analysis of unstructured data
US7523085B2 (en) Topical sentiments in electronically stored communications
US8676730B2 (en) Sentiment classifiers based on feature extraction
US9015168B2 (en) Device and method for generating opinion pairs having sentiment orientation based impact relations
US20190318407A1 (en) Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof
CN107577759A (zh) 用户评论自动推荐方法
US20060089924A1 (en) Document categorisation system
CN104573054A (zh) 一种信息推送方法和设备
US8560518B2 (en) Method and apparatus for building sales tools by mining data from websites
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
Konjengbam et al. Aspect ontology based review exploration
CN110442730A (zh) 一种基于deepdive的知识图谱构建方法
Molina Beltrán et al. Improving the affective analysis in texts: automatic method to detect affective intensity in lexicons based on Plutchik’s wheel of emotions
KR101902460B1 (ko) 문서 분류 장치
Hong et al. Automatic extraction of new words based on Google News corpora for supporting lexicon-based Chinese word segmentation systems
Li et al. Confidence estimation and reputation analysis in aspect extraction
Glance et al. Analyzing online discussion for marketing intelligence
Prathyusha et al. Normalization Methods for Multiple Sources of Data
Yang et al. Research on the Sentiment analysis of customer reviews based on the ontology of phone
Kiomourtzis et al. NOMAD: Linguistic Resources and Tools Aimed at Policy Formulation and Validation.
Kubek et al. Automatic taxonomy extraction through mining social networks
Amira et al. Opinion Analysis of Traveler Based on Tourism Site Review Using Sentiment Analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee