KR101712291B1 - 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법 - Google Patents

오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법 Download PDF

Info

Publication number
KR101712291B1
KR101712291B1 KR1020150178072A KR20150178072A KR101712291B1 KR 101712291 B1 KR101712291 B1 KR 101712291B1 KR 1020150178072 A KR1020150178072 A KR 1020150178072A KR 20150178072 A KR20150178072 A KR 20150178072A KR 101712291 B1 KR101712291 B1 KR 101712291B1
Authority
KR
South Korea
Prior art keywords
value
polarity
user
predicate
positive
Prior art date
Application number
KR1020150178072A
Other languages
English (en)
Inventor
정은희
이병관
사우드 카마라 오리
유슬리나 티파니 아판디
조윤성
심재오
김신미
Original Assignee
강원대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강원대학교산학협력단 filed Critical 강원대학교산학협력단
Priority to KR1020150178072A priority Critical patent/KR101712291B1/ko
Application granted granted Critical
Publication of KR101712291B1 publication Critical patent/KR101712291B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • G06F17/2735
    • G06F17/274
    • G06F17/3087
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q50/30
    • H04L67/18

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법에 관한 것으로서, 더욱 자세하게는 오피니언 마이닝을 이용하여 추출한 특징 명사와 사용자의 위치 정보를 매칭시켜 그에 따른 명소를 추천하는 것이다.
이러한 본 발명의 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템은 유무선 통신망을 통하여 사용자 단말기에 의해 선정된 주제어에 대한 다른 사용자 단말기의 의견 데이터를 수집하여 평가한다.

Description

오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법{System for recommending a user-customized famous place based on opinion mining and Method of the Same}
본 발명은 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법에 관한 것으로서, 더욱 자세하게는 오피니언 마이닝을 이용하여 추출한 특징 명사와 사용자의 위치 정보를 매칭시켜 그에 따른 명소를 추천하는 것이다.
통상적으로 글이란 단어가 모여서 문장을 이루고, 문장이 모여서 한 덩이의 완성된 글이 되는데, 글을 이루는 문장의 기초 단위인 단어는 하나의 단어가 다른 단어와 어떤 관계를 맺는가의 문제와 글을 쓰기 위해서 내용상으로 어떠한 단어를 선정하는가의 문제를 내포하고 있다. 이 두 가지의 문제를 해결하는 과정이 통상적으로 글을 집필하는 과정에 일어나는 현상이라고 볼 수 있으며, 이 두 가지의 과정 중에서 두 번째의 문제, 즉 어떠한 단어를 선정하느냐의 문제를 집중적으로 분석하면, 이로부터 글쓴이의 감정을 도출할 수 있다.
즉, 각각의 단어는 문장에서 변용되고 상황에 따라 다른 뜻을 함축하기도 하지만, 기본적으로 내재하고 있는 단어 자체의 성향이 있다는 것을 알 수 있다. 따라서 글을 쓴 이가 어떤 성향이 내재된 단어를 집중적으로 사용할 수 있으며, 문학적, 인지언어학적, 정신분석학적으로 접근했을 때, 인간 보편의 성향에 맞춘 단어의 분석을 통해 단어를 분류할 수 있는 기준을 설정할 수 있고, 그 기준에 따라 단어를 분류하여 글쓴이의 감정을 분류할 수 있게 된다.
또한, 전자상거래가 발달하면서 온라인상에서 상품을 구매하는 수요가 증가하고 있으며 이로 인해 자신이 구매한 상품에 대한 의견을 공유하는 커뮤니티 또한 발전하게 되었다.
전자상거래에서 상품평은 상품에 대한 사용 후기로서 제품 특징에 대한 사용자의 의견을 담고 있기 때문에 구매자에게 유용한 정보로 활용되며, 이러한 상품평을 분류해주기 위해 오피니언 마이닝에 관한 연구가 활발히 진행되고 있는데, 오피니언 마이닝에서 상품평 분류 성능은 어휘적 자원에 많은 영향을 받고 있어서 어휘적 자원인 긍정/부정 사전이 중요한 역할을 하고 있다.
기존의 오피니언 마이닝(Opinion mining)의 극성 분류 기법 중에서 SO-PMI(Sementic Orientation Point-wise Mutual Information)를 사용하여 SNS 문장의 극성값을 산출하는데, SO-PMI는 긍정 단어와 부정 단어에 대한 횟수만으로 문장 전체의 극성값을 산출하는 단점을 가지고 있다.
그로 인해, 전체 문장에 대한 반의어가 포함되어 문장 전체의 극성값이 부정적인 문장으로 반전되어야 하는데, 긍정 또는 부정의 횟수만을 고려하여 좋은 의미의 문장으로 결과를 도출하게 되는 문제점을 갖고 있다.
최근에는, 스마트폰의 사용자가 급증함에 따라 트위터, 페이스북과 같은 소셜 네트워크 서비스가 활성화되면서 온라인상에서 간단한 문장으로 자신의 감정을 표현하는 경우가 많아졌고, 각종 상품평, 영화 감상평, 맛집 평가 등 온라인상에서 짧은 문장으로 다양한 상품에 대해 각종 평가를 하는 경우도 많아졌다. 이러한 문장들은 다른 사람들의 감정이나 구매 성향에 큰 영향을 주기 때문에, 오피니언 마이닝이나 마케팅 측면에서, 이러한 온라인 상의 각종 문장에 내재된 감정의 분석 및 분류가 어느 때보다 중요해지고 있는 실정이다.
따라서, 이렇게 실제의 감성과 다르게 평가된 오피니언 마이닝의 결과값을 비지니스 및 마케팅 분야에 사용한다면 경제적으로 큰 손실을 초래할 수 있다.
한국특허 등록번호 : 10-1591297-0000 한국특허 공개번호 : 10-2015-0104882 한국특허 공개번호 : 10-2016-0055930 한국특허 등록번호 : 10-1315734-0000
본 발명의 목적은 상술한 문제점을 해결하기 위해 안출된 것으로 오피니언 마이닝에 기초한 특정 키워드에 대한 특징 명사를 추출하고 수집된 SNS의 문장에 대한 감성 정보를 추출하고 이 특징 명사와 사용자의 특성에 대한 상관 계수를 산출하여 사용자와 연관성이 높은 데이터만을 추천하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법을 제공하는 것이다.
본 발명의 다른 목적은 SNS 문장을 토큰으로 분할하고, 접속사의 반의어에 대한 가중치, 부사에 대한 가중치를 부여하여 SNS 문장의 극성값을 더 정확하게 산출하도록 설계하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법을 제공하는 것이다.
이러한 목적을 달성하기 위해 본 발명의 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템은 유무선 통신망을 통하여 사용자 단말기에 의해 선정된 주제어에 대한 다른 사용자 단말기의 의견 데이터를 수집하여 평가하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템에 있어서, 상기 의견 데이터에 대한 긍정적 평가 또는 부정적 평가를 표현하는 극성값을 분류하고, 일반 단어를 저장하는 일반 단어 사전 DB와 함축된 단어를 저장하는 함축 단어 사전 DB를 포함하는 감성 사전 DB; 및 상기 선정된 주제어에 대응하는 의견 데이터를 수집하여 토큰으로 생성한 후 상기 의견 데이터 중에서 명사를 추출하고 상기 감성 사전 DB를 이용하여 상기 명사에 대한 누적 빈도수를 산출하며, 기설정해진 누적 빈도수보다 크면 상기 명사를 특징 명사로 정의한 후 상기 특징 명사를 특징 명사 테이블에 저장하고, 상기 특징 명사와 상기 사용자 단말기의 위치 정보를 매칭시켜 상기 특징 명사와 위치 정보 간의 연관성 또는 상관성을 갖는 명소 정보를 검출하는 제어부를 포함한다.
여기서, 상기 제어부는, 상기 의견 데이터를 수집하여 상기 의견 데이터에 포함된 서술어, 접속사 또는 부사 중 상기 서술어의 극성값을 도출하고, 상기 서술어의 극성값과 상기 서술어와 인접한 단어의 의미에 따라 정해진 상기 접속사의 극성 가중치를 곱한 제 1 값을 도출하며, 상기 서술어의 극성값과 상기 서술어의 극성값에 따라 정해진 상기 부사의 극성 가중치를 덧셈한 제 2 값을 도출한 후, 상기 서술어의 극성값과 상기 제 1, 2 값을 합한 값인 상기 선정된 주제어에 대해 극성총계를 결과 평가한다.
상기 극성총계(o.value)는, o.value = v.value + c.value* + ad.value*인 것을 특징으로 하며, 여기서, v.value는 [(+1), if 긍정], [(0), if 중립] 및 [(-1), if 부정] 중 선택된 어느 하나로 결정되며, c.value*는 v.value와, [(+1), if 서술어 : 긍정, and 등위 접속사], [(-1), if 서술어이전 : 긍정, and 반의어] 및 [(+1), if 서술어이전 : 부정 and 반의어] 중 선택된 하나를 곱한 값이며, ad.value*는 v.value와, [(+3), if 긍정] 및 [(-3), if 부정] 중 선택된 하나를 더한 값이며, 즉, 상기 o.value > 0이면 긍정이고, o.value = 0이면 중립이며, o.value < 0, 부정이다.
또한 이러한 목적을 달성하기 위해 본 발명의 오피니언 마이닝 기반 사용자 맞춤형 추천 시스템의 구동 방법은 유무선 통신망을 통하여 사용자 단말기에 의해 선정된 주제어에 대한 다른 사용자 단말기의 의견 데이터를 수집하여 평가하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템의 구동 방법에 있어서, 제어부가 상기 다른 사용자 단말기의 상기 의견 데이터를 수집하고 수집된 상기 의견 데이터를 명사, 서술어, 접속사 또는 부사 중 어느 하나 이상의 품사로 구분하기 위해 토큰을 생성하는 단계; 상기 제어부가 상기 토큰을 생성하여 명사를 추출하고 추출된 상기 명사의 누적 빈도수를 산출하여 특정한 누적 빈도수 이상이면 특징 명사로 미리 구비된 특징 명사 테이블에 상기 명사를 저장하는 단계; 상기 제어부가 일반 단어와 함축된 단어가 저장된 감성 사전 DB로부터 상기 글 데이터를 검색하여 상기 서술어의 극성값을 설정하고, 상기 제어부가 상기 의견 데이터에 접속사가 존재하면 상기 서술어 전후 단어의 등위 접속 또는 반의 접속에 따라 정해진 상기 접속사의 극성 가중치를 곱한 제 1 값을 도출하며, 상기 의견 데이터에 부사가 존재하면 상기 서술어의 극성값에 따라 정해진 상기 부사의 극성 가중치를 덧셈한 제 2 값을 도출하는 단계; 상기 제어부가 상기 서술어의 극성값과 상기 제 1, 2 값을 합한 값인 상기 선정된 주제어에 대해 극성 총계를 연산하고 상기 주제어에 대한 긍정, 부정 또는 중립 중 어느 하나의 평가 결과를 도출하는 단계; 및 상기 제어부가 상기 특징 명사와 상기 사용자 단말기의 위치 정보를 매칭시켜 상기 특징 명사와 위치 정보 간의 연관성 또는 상관성을 갖는 명소 정보를 검출하는 단계;를 포함한다.
상기 평가 결과를 도출하는 단계에서, 상기 극성 총계(o.value)는, o.value = v.value + c.value* + ad.value*인 것을 특징으로 하며, 여기서, v.value는 [(+1), if 긍정], [(0), if 중립] 및 [(-1), if 부정] 중 선택된 어느 하나로 결정되며, c.value*는 v.value와, [(+1), if 서술어이전 : 긍정, and 등위 접속사], [(-1), if 서술어이전 : 긍정, and 반의어] 및 [(+1), if 서술어이전 : 부정 and 반의어] 중 선택된 하나를 곱한 값이며, ad.value*는 v.value와, [(+3), if 긍정] 및 [(-3), if 부정] 중 선택된 하나를 덧셈한 값이며, 즉, 상기 o.value > 0이면 긍정이고, o.value = 0이면 중립이며, o.value < 0, 부정이다.
본 발명에 따른 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법에 의하면, 사용자와 연관성이 높은 데이터를 추천함으로 기업에서는 SNS로부터 추출한 감성 정보를 이용하여 제품에 대한 평가와 소비자의 선호도를 더 정확하게 측정할 수 있으며 이렇게 도출된 감성 정보를 활용하여 신제품 개발 및 마케팅에 활용할 수 있다.
또한, 본 발명에 따른 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법에 의하면, 오피니언 마이닝을 기반한 고객 관리 및 상품에 대한 선호도를 조사하는데 있어서 사용자의 상품평과 댓글에 제시된 선호도와 긍정 및 부정을 분석하여 비지니스와 마케팅을 수행하는 방법으로 기업의 선호도 조사 및 마케팅 전략 등에서 활용할 수 있는 솔루션, 고객 관리 프로그램 개발 업체 또는 기업의 컨설팅 업체 등에 기술 이전이 가능할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 추천 시스템의 구성 블록도;
도 2는 도 1에 따른 추천 시스템의 전반적인 절차를 도시한 개념적인 순서도;
도 3a는 도 2에 따른 추천 방법에서 특징 명사를 추출하는 방법을 도시한 순서도;
도 3b는 도 3a에 따라 추출된 특징 명사가 저장된 테이블의 예시도;
도 4는 도 2에 따른 추천 방법에서 접속사 및 부사에 가중치를 적용하고 연산하여 주제어에 대한 최종 평가를 획득하는 구체적인 작업 순서도;
이하 본 발명의 일 실시 예에 대해서 설명하도록 한다.
도 1은 본 발명의 일 실시 예에 따른 추천 시스템의 구성 블록도이고, 도 2는 도 1에 따른 추천 시스템의 전반적인 절차를 도시한 개념적인 순서도이고, 도 3a는 도 2에 따른 추천 방법에서 특징 명사를 추출하는 방법을 도시한 순서도이고, 도 3b는 도 3a에 따라 추출된 특징 명사가 저장된 테이블의 예시도이고, 도 4는 도 2에 따른 추천 방법에서 접속사 및 부사에 가중치를 적용하고 연산하여 주제어에 대한 최종 평가를 획득하는 구체적인 작업 순서도이다.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 추천 시스템(100)은 일반 단어 사전 DB(Database:110), 함축 단어 사전 DB(130) 및 제어부(120)를 포함하여 구성되며, 일반 단어 사전 DB(110)와 함축 단어 사전 DB(130)는 감성 사전 DB(미도시) 내부에 일체화 되어 구비된다.
본 발명의 사용자 단말기는 유무선 통신망을 통하여 외부 서버인 추천 시스템(100)에 연결되어 사용자 맞춤형 명소 정보 추천 받을 수 있으며 또한 추천 시스템(100)에 하나 이상의 다른 사용자 단말기가 연결되어 데이터를 송수신 할 수 있다.
또한 사용자 단말기는 추천 시스템(100)에 일체화 되어 구비되거나 분리되어 위치 가능하다.
여기서 단말기는 유무선 통신망을 경유하여 각종 데이터를 송수신할 수 있는 단말기를 의미하며 태블릿 PC(Tablet PC), 랩톱(Lap top), 개인용 컴퓨터(PC:Personal computer), 스마트폰(Smart phone), 개인용 정보 단말기(PDA:Personal digital assistant) 또는 이동 통신 단말기 중 어느 하나이다.
사용자 맞춤형 명소는 사용자가 위치한 지역과 특정 거리 이내의 가까운 곳에 위치하며 사용자의 특성과 매칭되는 음식점, 영화관, 관광지 또는 서점과 같은 지역의 특징 명소이다.
도 2를 참조하면, 본 발명의 추천 시스템(100)은 첫째, 트위터( Twitter), 페이스북(Facebook) 또는 블로그(Blog)와 같은 SNS(Social network system)등에서 사용하는 일반 단어, 함축 단어에 대한 사전을 생성하고 둘째, 주어진 키워드를 포함하고 있는 SNS 데이터(문장)를 수집하여 키워드와 관련된 특징 명사를 추출하고 셋째, 수집한 SNS를 단어(토큰)로 분리하고 일반 단어 사전 DB(110)와 함축 단어 사전 DB(130)를 이용하여 단어들의 긍정, 부정 그리고 중립으로 분류하여 SNS의 문장에 대한 극성값을 산출하고 넷째, 특징 명사와 사용자의 특성에 대한 피어슨(Pearson) 상관 계수를 산출하여 사용자와 서로 연관성 있는 데이터를 찾아서 사용자에게 추천하도록 설계된다.
감성 정보 분석에서 가장 중요한 것은 단어 사전이며, 본 발명의 추천 시스템(100)에서는 SNS(S100)를 통해 수집된 문장에 대한 감성 정보 분석을 위해 우선적으로 긍정 및 부정으로 명확하게 분류할 수 있는 일반 단어 사전 DB(110)와 SNS에서 보편적으로 사용되는 함축어에 대한 단어를 등록한 함축 단어 사전 DB(130)를 생성하도록 설계된다.
그리고, SNS의 토큰 분석시에 새롭게 등장하는 단어를 긍정 및 부정으로 분류하여(S300) 일반 단어 사전 DB(110)와 함축 단어 사전 DB(130)에 등록하도록 설계된다.
표 1은 본 발명에서 설계한 일반 단어 사전이며, 표 2는 함축 단어 사전 구조를 설명한 것이다.
일반 단어 사전
필드명 설명
c_idx 색인 번호
classification 분류
Word 단어
Status 긍정, 부정, 중립
Frequency 출현 빈도수
함축 단어 사전
필드명 설명
c_idx 색인번호
Word 단어
Meaning 의미
Frequency 출현 빈도수
특히, 일반 단어 사전에 등록되어 있는 단어는 긍정, 부정, 중립의 극성값을 가지지만 함축 단어 사전에 등록되어 있는 단어는 함축 단어 뒤의 단어의 의미에 따라 함축 단어의 긍정, 부정, 중립의 상태가 결정된다.
추천 시스템(100)은 SNS 감성 정보 판단에 있어서 기존의 SO-PMI가 갖는 단점을 보완하기 위해 SNS 문장(S100)을 토큰으로 분할하고(S210), 반의어(S490)에 대한 가중치, 부사(S590)에 대한 가중치를 부여하여(S600,S700) SNS 문장의 극성값을 좀 더 정확하게 산출(S810)하도록 설계한다.
추천 시스템(100)은 하기의 도 3(a)와 같이 사용자의 특성 정보와 피어슨 상관 계수로 계산(S900)할 특징 명사를 추출하도록 설계하고 피어슨 상관 계수가 임계치 보다 크면(S950) 추천 리스트를 제공한다(S960).
도 3a 및 3b를 참조하면, 추천 시스템(100)이 특징 명사를 추출하는 과정은 아래와 같다.
우선, 선정한 주제에 맞는 SNS 데이터(S100)를 수집하며(S205), 수집한 SNS 데이터를 토큰으로 분리(S210)한 후에 명사를 추출하며 추출한 명사에 대한 누적 빈도수를 산출하며(S215), 수집된 SNS로부터 추출한 명사에 대한 누적 빈도수가 임계치 이상인(S220) 명사만을 특징 명사 테이블(도 3b 참조)에 저장한다(S225).
예를 들어, 강릉 관광이라는 키워드를 입력하여 SNS 데이터를 수집하여 명사를 추출할 경우 도 3b와 같이 추출 명사에 대한 출현 빈도수를 카운트한다.
그리고 출현 빈도수가 임계치인 200보다 큰 추출 명사만을 분류하여 특징 명사 테이블에 저장하도록 설계하며 차후에 이 특징 명사와 사용자의 특성 정보와의 피어슨 상관 계수를 계산하여 사용자 맞춤형 명소 정보를 제공한다.
도 4를 참조하면, 도 4는 추천 시스템(100)이 제안하는 감성 정보 추출 절차로 아래에서 설명하도록 한다.
우선 SNS(S100)로부터 수집한 (의견) 데이터(S205)를 토큰으로 분리(생성)하며(S210), 의견 데이터의 서술어를 탐지하고 서술어가 존재하면(S310) 감성 사전 DB를 검색하여 서술어의 극성값을 (식 1)과 같이 산출한다(S320,S330,S340).
여기서, 주제어 추출(S1000)은 토큰 생성(분리) 단계에서 실시하며 단계(S810)이후에 주제어에 대한 평가를 실시한다.
v.value = [(+1, if 긍정), (0, if 중립), (-1, if 부정)] --- (식 1)
예를 들어, "커피가 맛있다"일 경우 "맛있다"는 긍정(+1)이므로 문장의 극성값은 긍정(+1)이 된다.
데이터에 접속사가 존재하는지를 확인하며(S480) 만약 데이터에 접속사가 존재하면 이 접속사가 등위 접속이면(S490) 앞의 서술어가 같은 극성값을 설정하고(S492) 반의어이면(S490) 앞의 서술어와 다른 극성값을 설정한다(S491).
아래의 식(2)로 표현할 수 있다.
c.value(또는 c.value*) = [v.value* (+1), if 서술어이전 = 긍정 and 등위 접속사],
[v.value * (-1), if 서술어이전 = 긍정 and 반의어]
[v.value * (+1), if 서술어이전 = 부정 and 반의어]
--- (식 2)
데이터에 부사가 존재하는지를 확인하며(S580), 만약 부사가 존재하면, 서술어의 극성값에 따라 극성값을 설정한다(S590,S591,S592).
즉, 서술어의 극성값이 긍정이면(S590) 긍정값을 설정하고(S591), 서술어의 극성값이 부정이면(S590) 부정값을 설정한다(S592).
아래의 (식 3)으로 표현할 수 있다.
ad.value(또는, ad.value*) = [(v.value +3, if 긍정)], [(v.value -3, if 부정)]
--- (식 3)
이렇게 계산된 극성값들을 아래의 (식 4)와 같이 주제어에 대한 극성값인 o.value를 산출하고(S810), o.value가 0보다 크면(S820) 긍정적(S830), o.value가 0이면 중립(S840), o.value가 0보다 작으면 부정적(S850)으로 판단한다.
o.value= v.value +c.value(또는 c.value*) + ad.value(또는, ad.value*)
o.value = [(>0, 긍정), (=0, 중립), (<0, 부정)] --- (식 4)
여기서, c.value(또는 c.value*)은 제 1 값으로, ad.value(또는, ad.value*)은 제 2 값으로 지칭함.
이렇게 산출된 극성값을 아래의 (식 5)를 이용해 특정 키워드에 대한 SNS의 데이터들의 감성 평가에 따라 특정 키워드에 대한 전반적인 평가를 도출한다.
Figure 112015122110276-pat00001
o.value : [(>0, 긍정), (=0, 중립), (<0, 부정)] --- (식 5)
본 발명에서는 도 3에서 생성한 특징 명사와 사용자의 성향에 대한 피어슨 상관 계수를 생성하고 피어슨 상관 계수의 값이 큰 항목에 대해서만 추천 리스트를 생성하여 사용자에게 제공함으로써 사용자의 성향에 맞는 맞춤형 명소 정보를 제공할 수 있도록 설계되도록 한다.
본 발명의 추천 시스템(100)이 도 1의 단계(S900)~(S960)을 수행하는 절차는 아래와 같다.
첫째 사용자가 사용한 검색 키워드 목록을 생성하고 이 때 반복적으로 사용한 검색 키워드를 사용자의 특성으로 아래와 같이 정의한다.
U = {u1,u2,---,un}
둘째 사용자가 위치하고 있는 지역의 특징 명소를 가져온다.
C = {c1,c2,---,cn}
셋째 사용자의 특성과 지역의 특징 명소에 대한 피어슨 상관 계수를 아래의 (식 6)을 이용하여 연산한다.
Figure 112015122110276-pat00002
--- (식 6)
여기서,
Figure 112015122110276-pat00003
이며,
이때 cov(U,C)는 U와 C가 열 벡터값을 가지는 확률 변수 일때의 공분산을 나타내며 var(U)와 var(C)는 각각 U와 C의 분산이다.
넷째 사용자의 특성과 지역 명소에 대한 상관 계수 값 r이 0.5보다 큰 값을 갖는 항목에 대한 추천 리스트를 작성하여 사용자에게 제공한다.
여기서 사용자가 반복적으로 사용한 검색 키워드의 사용 갯수가 상관 계수 적용에 작을 경우에는 도 3의 특징 명사로 대체 가능할 수도 있다.
본 발명의 추천 시스템(100)의 제어부(120)는 메모리를 구비하며 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템(100)의 구동 방법의 각각의 단계에서 수행되는 제어 명령을 저장하고 해당 단계에 대응하는 기능을 수행하도록 제어하는 기능을 수행한다.
110 : 일반 단어 사전 DB
120 : 제어부
130 : 함축 단어 사전 DB

Claims (5)

  1. 유무선 통신망을 통한 사용자 단말기의 키워드 입력에 따라, 선정된 주제어를 대상으로 다른 사용자 단말기의 의견 데이터를 수집하여 평가하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천시스템으로,
    상기 의견 데이터에 내포된 긍정적 표현, 중립적 표현 또는 부정적 표현을 극성값 +1, 0, -1로 평가하고, SNS(Social network system)에서 사용하는 일반 단어를 저장하는 일반 단어 사전 DB와 상기 SNS에서 보편적으로 사용되는 함축된 단어를 저장하는 함축 단어 사전 DB를 포함하는 감성 사전 DB; 및
    상기 선정된 주제어에 대응하는 의견 데이터를 수집하고 상기 수집된 의견 데이터를 명사, 서술어, 접속사 또는 부사 중 어느 하나 이상의 품사로 구분해 각기 다른 토큰을 생성시킨 후,
    상기 각기 다른 토큰 중 상기 서술어의 긍정적 표현, 중립적 표현 또는 부정적 표현 여부에 따라 상기 서술어를 상기 극성값으로 설정하고,
    상기 서술어 전후의 등위 접속 또는 반의 접속에 따라 상기 접속사의 극성 가중치(+1, -1 중 어느 하나)를 정한 다음, 상기 기설정된 서술어의 극성값과 상기 접속사의 극성 가중치를 곱한 제 1 값을 도출하며,
    상기 서술어의 극성값에 따라 상기 부사의 극성 가중치(+3, -3 중 어느 하나)를 정한 다음, 상기 서술어의 극성값과 상기 부사의 극성 가중치를 덧셈한 제 2 값을 도출하고,
    상기 서술어의 극성값과 상기 제 1, 2 값을 합해 o.value를 구한 후, 상기 선정된 주제어에 대해 극성 총계(Opinionkeyword)를 계산해 상기 선정된 주제어에 대한 감성 평가 결과를 긍정, 부정 또는 중립 중 어느 하나로 도출하는 제어부를 포함하며,
    상기 제어부는,
    상기 키워드에 대한 누적 빈도수를 산출하며, 상기 키워드에 대한 누적 빈도수가 기설정된 누적 빈도수보다 크면 상기 키워드를 특징 명사로 정의하고, 상기 특징 명사를 기구비된 특징 명사 테이블에 저장하며,
    상기 특징 명사와 상기 사용자 단말기를 소지한 사용자의 특성 정보 간의 피어슨 상관 계수를 계산해 상기 피어슨 상관 계수의 값(r)이 0.5보다 큰 항목만을 대상으로 한 추천 리스트 및, 사용자 맞춤형 명소 정보인 상기 선정된 주제어를 정하는 것을 특징으로 하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천시스템.
  2. 제 1 항에 있어서, 상기 제어부는,
    상기 특징 명사와 상기 사용자 단말기의 위치 정보를 매칭시켜 상기 특징 명사와 위치 정보 간의 연관성 또는 상관성을 갖는 상기 사용자 맞춤형 명소 정보를 검출하는 것을 특징으로 하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천시스템.
  3. 제 1 항에 있어서, 상기 o.value는,
    o.value = v.value + c.value* + ad.value*인 것을 특징으로 하며,
    여기서, v.value는 [(+1), if 긍정], [(0), if 중립] 및 [(-1), if 부정] 중 선택된 어느 하나로 결정되며,
    c.value*는 v.value와, [(+1), if 서술어이전 : 긍정, and 등위 접속사], [(-1), if 서술어이전 : 긍정, and 반의어] 및 [(+1), if 서술어이전 : 부정 and 반의어] 중 선택된 하나를 곱한 값이며,
    ad.value*는 v.value와, [(+3), if 긍정] 및 [(-3), if 부정] 중 선택된 하나를 덧셈한 값이며,
    즉, 상기 o.value > 0이면 긍정이고, o.value = 0이면 중립이며, o.value < 0, 부정인 것을 특징으로 하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천시스템.
  4. 유무선 통신망을 통한 사용자 단말기의 키워드 입력에 따라, 선정된 주제어를 대상으로 다른 사용자 단말기의 의견 데이터를 수집하여 평가하는 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템의 구동 방법으로,
    감성 사전 DB가 상기 의견 데이터에 내포된 긍정적 표현, 중립적 표현 또는 부정적 표현을 극성값 +1, 0, -1로 평가하고, 일반 단어 사전 DB를 이용해 SNS(Social network system)에서 사용하는 일반 단어를 저장하고 함축 단어 사전 DB를 이용해 상기 SNS에서 보편적으로 사용되는 함축된 단어를 저장하는 단계;
    제어부가 상기 키워드에 대한 누적 빈도수를 산출하며, 상기 키워드에 대한 누적 빈도수가 기설정된 누적 빈도수보다 크면 상기 키워드를 특징 명사로 정의하고, 기구비된 특징 명사 테이블에 상기 특징 명사를 저장하는 단계;
    상기 제어부가 상기 선정된 주제어에 대응하는 상기 의견 데이터를 수집하고 상기 수집된 의견 데이터를 명사, 서술어, 접속사 또는 부사 중 어느 하나 이상의 품사로 구분해 각기 다른 토큰을 생성시키는 단계;
    상기 제어부가 상기 각기 다른 토큰 중 상기 서술어의 긍정적 표현, 중립적 표현 또는 부정적 표현 여부에 따라 상기 서술어를 상기 극성값으로 설정하는 단계;
    상기 제어부가 상기 서술어 전후의 등위 접속 또는 반의 접속에 따라 상기 접속사의 극성 가중치(+1, -1 중 어느 하나)를 정한 다음, 상기 기설정된 서술어의 극성값과 상기 접속사의 극성 가중치를 곱한 제 1 값을 도출하는 단계;
    상기 제어부가 상기 서술어의 극성값에 따라 상기 부사의 극성 가중치(+3, -3 중 어느 하나)를 정한 다음, 상기 서술어의 극성값과 상기 부사의 극성 가중치를 덧셈한 제 2 값을 도출하는 단계; 및
    상기 제어부가 상기 서술어의 극성값과 상기 제 1, 2 값을 합한 값인 o.value를 구한 후, 상기 산정된 주제어에 대해 극성 총계(Opinionkeyword)를 계산해 상기 선정된 주제어에 대한 감성 평가 결과를 긍정, 부정 또는 중립 중 어느 하나로 도출하는 단계를 포함하며,
    상기 제어부는 상기 특징 명사와 상기 사용자 단말기를 소지한 사용자의 특성 정보 간의 피어슨 상관 계수를 계산해 상기 피어슨 상관 계수의 값(r)이 0.5보다 큰 항목만을 대상으로 한 추천 리스트 및, 사용자 맞춤형 명소 정보인 상기 선정된 주제어를 정하는 것을 특징으로 하는 오피니언 마이닝 기반 사용자 맞춤형 추천 시스템의 구동 방법.
  5. 제 4 항에 있어서, 상기 o.value는,
    o.value = v.value + c.value* + ad.value*인 것을 특징으로 하며, 여기서, v.value는 [(+1), if 긍정], [(0), if 중립] 및 [(-1), if 부정] 중 선택된 어느 하나로 결정되며,
    c.value*는 v.value와, [(+1), if 서술어이전 : 긍정, and 등위 접속사], [(-1), if 서술어이전 : 긍정, and 반의어] 및 [(+1), if 서술어이전 : 부정 and 반의어] 중 선택된 하나를 곱한 값이며,
    ad.value*는 v.value와, [(+3), if 긍정] 및 [(-3), if 부정] 중 선택된 하나를 덧셈한 값이며,
    즉, 상기 o.value > 0이면 긍정이고, o.value = 0이면 중립이며, o.value < 0, 부정인 것을 특징으로 하는 오피니언 마이닝 기반 사용자 맞춤형 추천 시스템의 구동 방법.
KR1020150178072A 2015-12-14 2015-12-14 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법 KR101712291B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150178072A KR101712291B1 (ko) 2015-12-14 2015-12-14 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150178072A KR101712291B1 (ko) 2015-12-14 2015-12-14 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Publications (1)

Publication Number Publication Date
KR101712291B1 true KR101712291B1 (ko) 2017-03-13

Family

ID=58411791

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150178072A KR101712291B1 (ko) 2015-12-14 2015-12-14 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Country Status (1)

Country Link
KR (1) KR101712291B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101935937B1 (ko) * 2017-12-05 2019-01-07 설형수 오피니언 마이닝을 이용한 광고 정보 제공 시스템 및 그 방법
KR20190023723A (ko) * 2017-08-30 2019-03-08 주식회사 플렉싱크 빅데이터와 웰니스 관광지표를 활용한 관광상품 추천 시스템
KR20190094094A (ko) * 2018-01-15 2019-08-12 이다커뮤니케이션즈(주) 영유아 퍼소나 기반의 맞춤형 콘텐츠 제공 시스템 및 그 동작 방법
KR102029916B1 (ko) * 2018-03-30 2019-10-08 주식회사 디 파트너스 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법
KR102020756B1 (ko) * 2018-10-23 2019-11-04 주식회사 리나소프트 머신러닝을 이용한 리뷰 분석 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120108095A (ko) * 2011-03-23 2012-10-05 김병훈 소셜 데이터 분석 시스템
KR101315734B1 (ko) 2011-12-27 2013-10-10 숭실대학교산학협력단 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
KR20140010679A (ko) * 2012-07-16 2014-01-27 주식회사 다음커뮤니케이션 추천 시스템 및 추천 방법
KR20150104882A (ko) 2014-03-06 2015-09-16 한국전자통신연구원 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법
KR101591297B1 (ko) 2014-09-24 2016-02-04 숭실대학교산학협력단 코스 추천 시스템 및 그 방법, 이를 수행하기 위한 기록매체
KR20160055930A (ko) 2013-09-19 2016-05-18 시소모스 엘.피. 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120108095A (ko) * 2011-03-23 2012-10-05 김병훈 소셜 데이터 분석 시스템
KR101315734B1 (ko) 2011-12-27 2013-10-10 숭실대학교산학협력단 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
KR20140010679A (ko) * 2012-07-16 2014-01-27 주식회사 다음커뮤니케이션 추천 시스템 및 추천 방법
KR20160055930A (ko) 2013-09-19 2016-05-18 시소모스 엘.피. 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
KR20150104882A (ko) 2014-03-06 2015-09-16 한국전자통신연구원 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법
KR101591297B1 (ko) 2014-09-24 2016-02-04 숭실대학교산학협력단 코스 추천 시스템 및 그 방법, 이를 수행하기 위한 기록매체

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190023723A (ko) * 2017-08-30 2019-03-08 주식회사 플렉싱크 빅데이터와 웰니스 관광지표를 활용한 관광상품 추천 시스템
KR102051567B1 (ko) * 2017-08-30 2019-12-05 주식회사 플렉싱크 빅데이터와 웰니스 관광지표를 활용한 관광상품 추천 시스템
KR101935937B1 (ko) * 2017-12-05 2019-01-07 설형수 오피니언 마이닝을 이용한 광고 정보 제공 시스템 및 그 방법
KR20190094094A (ko) * 2018-01-15 2019-08-12 이다커뮤니케이션즈(주) 영유아 퍼소나 기반의 맞춤형 콘텐츠 제공 시스템 및 그 동작 방법
KR102188519B1 (ko) * 2018-01-15 2020-12-08 이다커뮤니케이션즈(주) 영유아 퍼소나 기반의 맞춤형 콘텐츠 제공 시스템 및 그 동작 방법
KR102029916B1 (ko) * 2018-03-30 2019-10-08 주식회사 디 파트너스 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법
KR102020756B1 (ko) * 2018-10-23 2019-11-04 주식회사 리나소프트 머신러닝을 이용한 리뷰 분석 방법

Similar Documents

Publication Publication Date Title
Riaz et al. Opinion mining on large scale data using sentiment analysis and k-means clustering
Serrano-Guerrero et al. Sentiment analysis: A review and comparative analysis of web services
Alahmadi et al. ISTS: Implicit social trust and sentiment based approach to recommender systems
Li et al. Contextual recommendation based on text mining
US10685181B2 (en) Linguistic expression of preferences in social media for prediction and recommendation
KR101712291B1 (ko) 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법
US9135255B2 (en) System and method for making gift recommendations using social media data
US9171326B2 (en) System and method for making gift recommendations using social media data
KR101330158B1 (ko) 텍스트의 감정지수 분석 방법 및 컴퓨터 판독 가능한 기록 매체
Pham et al. Preference-based user rating correction process for interactive recommendation systems
JP2009099088A (ja) Snsユーザプロファイル摘出装置、摘出方法並びに摘出プログラム、及び該ユーザプロファイルを利用する装置
Lee et al. A difference of multimedia consumer’s rating and review through sentiment analysis
Zou et al. Exploring user engagement strategies and their impacts with social media mining: the case of public libraries
Prando et al. Content-based Recommender System using Social Networks for Cold-start Users.
Neve et al. Hybrid reciprocal recommender systems: Integrating item-to-user principles in reciprocal recommendation
Grljević et al. Sentiment analysis of customer data
US20140089130A1 (en) System and method for making gift recommendations using social media data
KR101074820B1 (ko) 인터넷을 활용한 추천 검색 시스템 및 그 방법
Ashraf et al. Personalized news recommendation based on multi-agent framework using social media preferences
US20140089131A1 (en) System and method for making gift recommendations using social media data
Cai et al. An extension of social network group decision-making based on trustrank and personas
Kim et al. Product recommendation system based user purchase criteria and product reviews
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
KR101958555B1 (ko) 검색 결과 제공 장치 및 방법
Kim et al. Rating and comments mining using TF-IDF and SO-PMI for improved priority ratings

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant