KR101542417B1

KR101542417B1 - 사용자 선호도 학습 방법 및 장치

Info

Publication number: KR101542417B1
Application number: KR1020130099140A
Authority: KR
Inventors: 이수원; 이강복; 강영길
Original assignee: 숭실대학교산학협력단
Priority date: 2013-06-26
Filing date: 2013-08-21
Publication date: 2015-08-07
Also published as: KR20150002409A

Abstract

사용자 선호도 학습 방법 및 장치가 제공된다. 본 발명에 따른 사용자 선호도 학습 장치가 사용자 선호도를 학습하는 방법은 (a) 사용자의 소셜 네트워크 서비스(Social Network Service;SNS)의 사용 이력으로부터 관심 개체(entity)를 추출하는 단계, (b) 상기 추출된 관심 개체에 대한 감성 분석을 수행하여 상기 관심 개체에 대한 상기 사용자의 관심도(interest)를 산출하는 단계 및 (c) 상기 산출된 관심도에 근거하여 상기 관심 객체에 대한 상기 사용자의 선호도(preference)를 산출하는 단계를 포함한다.

Description

사용자 선호도 학습 방법 및 장치{METHOD AND APPARATUS FOR LEARNING USER PREFERENCE}

본 발명은 사용자 선호도 학습 방법 및 장치에 관한 것으로, 더욱 상세하게는 소셜 네트워크 서비스(Social Network Service;SNS) 사용자의 선호도를 학습하는 방법 및 장치에 관한 것이다.

정보 기술의 발달과 함께 사용자가 일상 생활에서 접할 수 있는 다양한 정보의 양이 폭발적으로 증가하게 되면서 1990년대 중반 이후 사용자가 필요로 하거나 관심을 가질만한 정보를 선별하여 제공해 주는 추천 시스템에 관한 다양한 연구가 진행되고 있다.

정보 여과 시스템(Information Filtering System)이라고도 불리는 추천 시스템은 주로 웹 문서, 뉴스, 영화, 서적 등의 분야에 적용되어 왔으며, 최근 들어 전자상거래, 금융 서비스, 전자 정부 등 좀 더 복잡한 분야에 적용되고 있다.

특히 최근 들어 스마트 폰, 스마트TV 등과 같은 각종 스마트 디바이스의 보급이 일반화되면서 이러한 개인화된 추천 시스템에 관한 요구가 증가하고 있다.

이에, 사용자의 콘텐츠 이용 이력을 수집하여 아이템들의 출현 빈도를 기반으로 사용자의 선호도를 학습하는 기술이 제안되었으나, 이러한 종래의 개인화 기술은 단일 도메인에만 활용이 가능하다는 한계점과 사용자가 선택한 콘텐츠에 대한 사용자의 긍부정 반응을 고려하지 않기 때문에 추천의 정확도가 낮은 문제점이 있다.

본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로, 다양한 도메인에 활용이 가능하며, 특정 대상에 대한 사용자의 긍정 또는 부정 성향을 분석하여 보다 정확한 선호도를 학습하는 방안을 제공하고자 한다.

상기와 같은 목적을 달성하기 위해, 본 발명의 일 실시예에 따른 사용자 선호도 학습 장치가 사용자 선호도를 학습하는 방법은 (a) 사용자의 소셜 네트워크 서비스(Social Network Service;SNS)의 사용 이력으로부터 관심 개체(entity)를 추출하는 단계, (b) 상기 추출된 관심 개체에 대한 감성 분석을 수행하여 상기 관심 개체에 대한 상기 사용자의 관심도(interest)를 산출하는 단계 및 (c) 상기 산출된 관심도에 근거하여 상기 관심 객체에 대한 상기 사용자의 선호도(preference)를 산출하는 단계를 포함한다.

본 발명의 일 측면에서, 상기 사용자 선호도 학습 방법은 상기 (a) 단계 이전에, 복수의 사용자가 상기 소셜 네트워크 서비스에 게재한 글을 포함하는 상기 사용 이력 중 특정 수 이상의 사용자가 사용한 개체를 상기 관심 개체로 선정하고, 상기 선정된 관심 개체 및 상기 선정된 관심 개체가 속한 카테고리에 대한 정보를 저장하는 단계를 더 포함한다.

또한, 본 발명의 일 측면에서, 상기 (b) 단계는 (b-1) 상기 사용자의 사용 이력으로부터 형태소를 분석하여 상기 관심 개체를 추출하는 단계, (b-2) 상기 분석된 형태소로부터 상기 관심 개체에 대한 감성 단어를 추출하는 단계 및 (b-3) 상기 추출된 감성 단어의 감성을 판단하고, 상기 판단 결과에 대응하는 관심도를 산출하는 단계를 포함한다.

또한, 본 발명의 일 측면에서, 상기 (b-3) 단계는 상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체의 출현 빈도를 산출하는 단계, 상기 특정일의 사용 이력에서 출현 빈도가 가장 높은 관심 객체의 출현 빈도인 최대 출현 빈도를 산출하는 단계 및 상기 출현 빈도 및 최대 출현 빈도의 상대적 비율에 근거하여 상기 특정일에서 상기 관심 객체의 관심도를 산출하는 단계를 포함하되, 상기 관심 객체의 관심도를 산출하는 단계는 일자별 가중치를 반영하여 상기 관심 객체의 관심도를 산출한다.

또한, 본 발명의 일 측면에서, 상기 (b-3) 단계는 상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체에 대한 긍정 관심도와 부정 관심도를 산출하되, 상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체의 감성 분석값을 산출하는 단계, 상기 특정일의 사용 이력에서 감성 분석값이 가장 큰 관심 개체의 감성 분석 값인 최대 감성 분석값을 산출하는 단계 및 상기 감성 분석값 및 최대 감성 분석값의 상대적 비율에 근거하여 상기 특정일에서 상기 관심 객체의 긍정 관심도와 부정 관심도를 산출하는 단계를 포함하되, 상기 긍정 관심도는 상기 산출된 감성 분석값이 0보다 크고, 상기 부정 관심도는 상기 산출된 감성 분석값이 0보다 작으며, 상기 관심 객체의 긍정 관심도와 부정 관심도를 산출하는 단계는 일자별 가중치를 반영한다.

또한, 본 발명의 일 측면에서, 상기 (c) 단계는 상기 관심 개체의 관심도, 긍정 관심도 및 부정 관심도에 근거하여 상기 관심 개체에 대한 상기 사용자의 선호도를 산출한다.

또한, 본 발명의 일 측면에서, 상기 사용자 선호도 학습 방법은 (d) 상기 산출된 관심 개체에 대한 선호도에 근거하여 상기 사용자가 선호하는 것으로 예측되는 콘텐츠를 추천하는 단계를 더 포함하되, 상기 (d) 단계는 카테고리에 대한 선호도를 반영하여 상기 콘텐츠를 추천한다.

또한, 본 발명의 일 측면에서, 상기 (d) 단계는 상기 사용자의 사용 이력 중 상기 카테고리에 대한 제 1 기간 동안의 선호도인 장기간 선호도(long-term preference) 및 제 2 기간 동안의 선호도인 단기간 선호도(short-term preference)를 포함하여 상기 카테고리에 대한 선호도를 산출한다.

또한, 본 발명의 일 측면에서, 상기 (d) 단계는 상기 사용 이력 중 상기 제 1 기간의 사용 이력에서 상기 카테고리의 출현 빈도를 산출하는 단계, 상기 제 1 기간의 사용 이력에서 출현했던 모든 카테고리의 출현 빈도의 합을 산출하는 단계 및 상기 출현 빈도 및 출현 빈도의 합의 상대적 비율에 근거하여 상기 장기간 선호도를 산출하는 단계를 포함한다.

또한, 본 발명의 일 측면에서, 상기 (d) 단계는 상기 사용 이력 중 상기 제 2 기간의 사용 이력에서 상기 카테고리의 출현 빈도를 산출하는 단계, 상기 제 2 기간의 사용 이력에서 출현했던 모든 카테고리의 출현 빈도의 합을 산출하는 단계 및 상기 출현 빈도 및 출현 빈도의 합의 상대적 비율에 근거하여 상기 단기간 선호도를 산출하는 단계를 포함한다.

상기와 같은 목적을 달성하기 위해, 본 발명의 일 실시예에 따른 사용자 선호도 학습 장치는, 사용자의 소셜 네트워크 서비스(Social Network Service;SNS)의 사용 이력으로부터 관심 개체(entity)를 추출하는 개체 추출부, 상기 추출된 관심 개체에 대한 감성 분석을 수행하여 상기 관심 개체에 대한 상기 사용자의 관심도(interest)를 산출하는 관심도 산출부 및 상기 산출된 관심도에 근거하여 상기 관심 객체에 대한 상기 사용자의 선호도(preference)를 산출하는 선호도 산출부를 포함한다.

본 발명의 일 측면에서, 상기 사용자 선호도 학습 장치는, 복수의 사용자가 상기 소셜 네트워크 서비스에 게재한 글을 포함하는 상기 사용 이력 중 특정 수 이상의 사용자가 사용한 개체를 상기 관심 개체로 선정하고, 상기 선정된 관심 개체 및 상기 선정된 관심 개체가 속한 카테고리에 대한 정보를 저장하는 관심 개체 선정부를 더 포함한다.

또한, 본 발명의 일 측면에서, 상기 사용자 선호도 학습 장치는, 상기 산출된 관심 개체에 대한 선호도에 근거하여 상기 사용자가 선호하는 것으로 예측되는 콘텐츠를 추천하는 콘텐츠 추천부를 더 포함하되, 상기 콘텐츠 추천부는 카테고리에 대한 선호도를 반영하여 상기 콘텐츠를 추천한다.

본 발명의 일 실시예에 따르면, 개체명(named-entity)을 추출하여 선호도 모델을 구성하기 때문에 다양한 도메인에 활용이 가능하다.

또한, 개체명에 대한 사용자의 긍정 또는 부정 성향을 반영하여 보다 정확한 선호도 학습이 가능하다.

또한, 소셜 네트워크 서비스(Social Network Service;SNS)를 이용한 개인 사용자의 선호도를 학습하기 때문에 완성도가 높고 새로운 방식의 개인 선호도 학습이 가능하다.

본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론가능한 모든 효과를 포함하는 것으로 이해되어야 한다.

도 1은 본 발명의 일 실시예에 따른 사용자 선호도 학습 장치의 구성을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 사용자 선호도 학습 과정을 도시한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 관심 개체 선정 결과를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 사용자 선호도 모델을 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 사용자 선호도 시각화 화면을 도시한 도면이다.

이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다.

그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다.

또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.

이하 첨부된 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 사용자 선호도 학습 장치의 구성을 도시한 도면이다.

본 발명의 일 실시예에 따른 사용자 선호도 학습 장치(100)는 관심 개체 선정부(110), 관심 개체 추출부(120), 관심도 산출부(130), 선호도 산출부(140) 및 콘텐츠 추천부(150)를 포함할 수 있다.

각 구성 요소를 설명하면 관심 개체 선정부(110)는 복수의 사용자가 소셜 네트워크 서비스(Social Network Service, 이하 'SNS'라 칭함)에 게재한 글을 포함하는 사용 이력(예를 들어, Facebook의 게시글 등) 중 특정 수 이상의 사용자가 사용한 개체를 '관심 개체'로 선정하고, 선정된 관심 개체 및 선정된 관심 개체가 속한 카테고리에 대한 정보를 관심 개체 DB(미도시)에 저장할 수 있다.

이때, 관심 개체 선정부(110)는 스포츠, 영화, 음악, TV 방송 등 특정 카테고리 별로 관심 개체를 추출할 수 있으며, 추출된 관심 개체가 다양한 형태로 표기 가능한 경우 관심 개체의 표기를 통일할 수 있다.

관심 개체 선정부(110)에 의해 선정된 관심 개체에 대한 설명은 도 3을 참조하여 후술하도록 한다.

한편, 관심 개체 추출부(120)는 SNS를 사용하고 있는 특정 사용자의 사용 이력으로부터 상기 관심 개체를 추출할 수 있다.

이를 위해 관심 개체 추출부(120)는 관심 개체와 관심 개체가 속한 카테고리에 대한 정보를 저장하고 있는 관심 개체 DB(미도시)와 연동될 수 있으며, 특정 사용자의 사용 이력으로부터 추출된 관심 개체를 관심 개체 DB(미도시)와 비교함으로써 관심 개체와 해당 카테고리를 확정할 수 있다.

참고로, 관심 개체 추출부(120)는 하나의 사용 이력으로부터 하나 이상의 개체명을 추출할 수 있다.

이를 위해, 괌심 개체 추출부(120)는 특정 사용자의 사용 이력에 대하여 형태소 분석을 수행할 수 있으며, 형태소 분석이 수행된 사용 이력으로부터 관심 개체를 추출(일반적으로 명사)할 수 있다.

한편, 관심도 산출부(130)는 개체 추출부(120)로부터 추출된 관심 개체에 대한 감성 분석을 수행하여 사용자의 관심도(interest)를 산출할 수 있다.

구체적으로, 관심도 산출부(130)는 형태소 분석이 수행된 사용 이력으로부터 개체 추출부(120)가 확정한 관심 개체에 대한 감성 표현(감성 단어)을 추출할 수 있으며, 추출된 감성 표현의 긍정 또는 부정 여부를 판단할 수 있다.

이를 위해, 관심도 산출부(130)는 각 감성 표현과 해당 감성 표현의 긍정 또는 부정 여부를 저장하고 있는 감성 표현 DB(미도시)와 연동될 수 있으며, 형태소 분석이 수행된 사용 이력으로부터 관심 개체 추출부(120)가 확정한 관심 개체에 대한 하나 이상의 감성 표현을 추출할 수 있다.

이후, 관심도 산출부(130)는 아래의 식과 같이 특정 관심 개체에 대한 사용자의 관심도를 산출할 수 있으며, 관심도는 다시 긍정 관심도와 부정 관심도로 구분되어 산출될 수 있다.

관심도 산출부(120)는 아래의 <식 1>을 이용하여 특정일 d0에서 특정 관심 개체 v에 대한 사용자 u의 관심도 I(u, v, d₀)를 산출할 수 있다.

<식 1>

여기서, freq(u, v, d')는 사용자 u의 사용 이력 중 특정일 d'에서 특정 관심 개체 v의 feed 출현 빈도이며, max(freq(u, v', d'))는 특정일 d'에서 출현하는 특정 관심 개체 중에서 출현 빈도가 가장 높은 v'의 출현 빈도이다.

참고로, v'는 사용자 u의 사용 이력 중 특정일 d'에서 가장 많이 출현하는 관심 개체이다.

관심도 산출부(130)는 max(freq(u, v', d'))와 freq(u, v, d')의 상대적 비율을 계산하고 로그(log₂)를 취함으로써, 특정 관심 개체에 대한 일자별 관심도를 산출할 수 있다.

이후, 관심도 산출부(130)는 일자별 관심도와 일자별 가중치를 적용하여 특정 관심 개체 v의 관심도를 산출할 수 있다.

또한, 관심도 산출부(130)는 아래의 <식 2>를 이용하여 특정일 d₀에서 특정 관심 개체 v에 대한 사용자 u의 긍정 관심도 Positive_I(u, v, d₀)를 산출할 수 있다.

<식 2>

여기서, Sentiment(u, v, d')는 사용자 u의 사용 이력 중 특정일 d'에서 특정 관심 개체 v에 대한 감성 분석 값이며, 관심도 산출부(130)는 Sentiment(u, v, d')가 0보다 큰 긍정일 경우, max(Sentiment(u, v', d'))와 Sentiment(u, v, d')의 상대적 비율을 계산하여 로그(log₂)를 취함으로써 특정 관심 개체에 대한 일자별 긍정 관심도를 산출할 수 있다.

참고로, max(Sentiment(u, v', d'))는 사용자 u의 사용 이력 중 특정일 d'에서 출현하는 특정 관심 개체 중에서 감성 분석 값이 가장 큰 v'의 감성 분석 값이다.

관심도 산출부(130)는 일자별 가중치(w)를 적용하여 긍정 관심도를 산출할 수도 있다.

또한, 관심도 산출부(130)는 아래의 <식 3>을 이용하여 특정일 d₀에서 특정 관심 개체 v에 대한 사용자 u의 부정 관심도 Negative_I(u, v, d₀)를 산출할 수 있다.

<식 3>

한편, 선호도 산출부(140)는 관심도 산출부(130)로부터 산출된 관심도에 근거하여 사용자의 선호도(preference)를 산출할 수 있다.

이때, 선호도 산출부(140)는 사용자의 카테고리 선호도를 반영하여 사용자의 특정 관심 개체에 대한 선호도를 산출할 수 있으며, 기간에 따른 사용자의 카테고리에 대한 변화를 반영하기 위해 카테고리 선호도를 장기간 선호도(Long-term Preference)와 단기간 선호도(Short-term Preference)로 구분하여 산출하고, 이 두 가지 선호도를 결합함으로써 최종적인 카테고리 선호도를 산출할 수 있다.

구체적인 산출 방법은 아래와 같다.

먼저, 선호도 산출부(140)는 아래의 <식 4>를 이용하여 사용자 u의 특정 카테고리 c에 대한 사용 이력 전체 기간 p_l에서의 장기간 선호도 CategoryPreference(u, c, p_l)를 산출할 수 있다.

구체적으로, 선호도 산출부(140)는 사용자 u 의 사용 이력 전체 기간 p_l에서의 특정 카테고리 c의 출현 빈도를 산출하고, 기간 pl에 출현했던 모든 카테고리들의 출현 빈도의 합을 산출한다.

이후, 선호도 산출부(140)는 카테고리 c의 출현 빈도 및 카테고리 c'의 출현 빈도의 합의 상대적 비율에 근거하여 장기간 선호도를 산출할 수 있다.

<식 4>

또한, 선호도 산출부(140)는 상기 <식 4>를 이용(단, pl 은 ps로 치환됨)하여 사용자 u의 카테고리 c에 대한 특정 기간(예를 들어, 학습 시점으로부터 1달 이내의 기간) p_s에서의 단기간 선호도 CategoryPreference(u, c, p_s)를 산출할 수 있다.

이후, 선호도 산출부(140)는 아래의 <식 5>와 같이 상기 장기간 선호도와 단기간 선호도에 가중치 α, β를 각각 적용하여 결합함으로써 사용자 u의 카테고리 c에 대한 선호도를 산출할 수 있다.

<식 5>

이후, 선호도 산출부(140)는 아래의 <식 6>을 이용하여 특정 관심 개체 entity(i)에 대한 관심 개체 선호도(Entity Preference)를 산출할 수 있다.

<식 6>

여기서, 특정 관심 개체 entity(i)는 특정 콘텐츠 i에 출현하는 관심 개체를 의미하며 선호도 산출부(140)는 최대 값 정규화를 통해 관심 개체 선호도를 0과 1사이의 값으로 조절할 수 있다.

한편, 콘텐츠 추천부(150)는 선호도 산출부(140)로부터 산출된 관심 개채 선호도에 근거하여 상위 N개의 콘텐츠를 사용자에게 추천 리스트로 제공할 수 있다.

이를 위해 콘텐츠 추천부(150)는 아래의 <식 7>을 이용하여 추천 후보 콘텐츠 I에 대한 관심 개체 선호도와 카테고리 선호도를 결합함으로써 콘텐츠 선호도를 산출할 수 있다.

<식 7>

도 2는 본 발명의 일 실시예에 사용자 선호도 학습 과정을 도시한 흐름도이다.

참고로, 사용자 선호도 학습 장치(100)는 복수의 사용자가 SNS에 게재한 글을 포함하는 사용 이력 중 특정 수 이상의 사용자가 사용한 관심 개체를 선정하고, 선정된 관심 개체 및 선정된 관심 개체가 속한 카테고리에 대한 정보를 관심 개체 DB(미도시)에 저장하였다.

먼저, 사용자 선호도 학습 장치(100)는 SNS를 사용하고 있는 특정 사용자의 사용 이력으로부터 관심 개체를 추출한다(S201).

참고로, 사용자 선호도 학습 장치(100)는 사용자의 사용 이력에 대한 형태소 분석을 수행하여 형태소 분석이 수행된 사용 이력으로부터 관심 개체를 추출할 수 있으며, 추출된 관심 개체를 개체명 DB(미도시)와 비교함으로써 관심 개체와 관심 개체가 속한 카테고리를 확정할 수 있다.

S201 후, 사용자 선호도 학습 장치(100)는 형태소 분석이 수행된 사용 이력으로부터 관심 개체에 대한 감성 표현을 추출한다(S202).

S202 후, 사용자 선호도 학습 장치(100)는 추출된 감성 표현의 긍정 또는 부정 여부를 판단하여 관심 개체에 대한 사용자의 긍정 관심도와 부정 관심도를 산출한다(S203).

S203 후, 사용자 선호도 학습 장치(100)는 S203에서 산출된 결과에 근거하여 관심 개체 선호도 및 카테고리 선호도를 산출한다(S204).

S204 후, 사용자 선호도 학습 장치(100)는 S204의 결과에 근거하여 사용자가 선호할 것으로 예측되는 콘텐츠를 추천할 수 있다(S205).

도 3은 본 발명의 일 실시예에 따른 관심 개체 선정 결과를 도시한 도면이다.

사용자 선호도 학습 장치(100)는 복수의 사용자가 SNS에 게재한 글을 포함하는 사용 이력 중 특정 수 이상의 사용자가 사용한 개체를 도 3에 도시된 바와 같이 관심 개체로 선정하여 관심 개체 DB(미도시)에 저장할 수 있으며, 이때, 선정된 관심 개체가 속한 카테고리에 대한 정보를 함께 저장할 수 있다.

만일, 추출된 관심 개체가 다양한 형태로 표기 가능한 경우, 사용자 선호도 학습 장치(100)는 관심 개체의 표기를 하나의 형태로 통일하여 저장할 수 있으며, 해당 관심 개체의 다양한 표기 형태를 함께 저장하여 관리할 수 있다.

도 4는 본 발명의 일 실시예에 따른 사용자 선호도 모델을 도시한 도면이다.

본 발명의 일 실시예에 따른 사용자 선호도 모델은 선호도 모델 대상 사용자의 아이디와 나이 및 성별을 포함할 수 있으며, 해당 사용자의 카테고리 선호도와 개체 선호도를 포함할 수 있다.

카테고리 선호도에는 각 카테고리별 선호도가 장기간 선호도와 단기간 선호도로 구분되어 표시될 수 있으며, 개체 선호도에는 각 개체별로 해당 개체가 속하는 카테고리, 관심도, 긍정 관심도 및 부정 관심도가 표시될 수 있다.

도 4에 도시된 바와 같은 사용자 선호도 모델을 이용하여, 사용자 선호도 학습 장치(100)는 사용자가 선호할 것으로 예측되는 콘텐츠를 추천할 수 있다.

도 5는 본 발명의 일 실시예에 따른 사용자 선호도 시각화 화면을 도시한 도면이다.

도 5의 (a)는 본 발명의 일 실시예에 따른 개체 감성 히스토리 테이블로서 사용자 아이디와 해당 사용자가 SNS에 게재한 글(post)의 아이디 그리고 해당 글에 포함된 개체, 개체의 감성 분석값 및 해당 글의 게재 일자를 포함할 수 있다.

도 5의 (b)는 개체 감성 히스토리 테이블을 참조한 사용자 선호도 시각화 화면으로서, 사용자의 아이디와 분석하고자 하는 기간을 입력하면, 도 4의 (b)에 도시된 바와 같이 해당 분석 기간 동안의 관심 개체와 각 관심 개체의 트렌드 분석 결과를 포함할 수 있다.

또한, 해당 사용자가 SNS에 게재한 포스트의 리스트를 포함할 수 있으며, 각 포스트에 등장하는 개체와 해당에 객체에 대한 사용자의 긍정 또는 부정 여부 분석 결과를 포함할 수 있다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다.

그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

100 : 사용자 선호도 학습 장치
110 : 관심 개체 선정부
120 : 관심 개체 추출부
130 : 관심도 산출부
140 : 선호도 산출부
150 : 콘텐츠 추천부

Claims

사용자 선호도 학습 장치가 사용자 선호도를 학습하는 방법에 있어서,
(a) 사용자의 소셜 네트워크 서비스(Social Network Service;SNS)의 사용 이력으로부터 형태소를 분석하여 관심 개체(entity)를 추출하는 단계;
(b) 상기 추출된 관심 개체에 대한 감성 분석을 수행하여 상기 관심 개체에 대한 상기 사용자의 관심도(interest)를 산출하는 단계; 및
(c) 상기 산출된 관심도에 근거하여 상기 관심 객체에 대한 상기 사용자의 선호도(preference)를 산출하는 단계;
를 포함하되,
상기 (b) 단계는
상기 분석된 형태소로부터 상기 관심 개체에 대한 감성 단어를 추출하여 감성을 판단하고, 상기 판단 결과에 대응하는 사용자의 관심도를 산출하는 단계;
상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체의 출현 빈도를 산출하는 단계;
상기 특정일의 사용 이력에서 출현 빈도가 가장 높은 관심 객체의 출현 빈도인 최대 출현 빈도를 산출하는 단계; 및
상기 출현 빈도 및 최대 출현 빈도의 상대적 비율과 일자별로 반영된 가중치에 근거하여 상기 특정일에서 상기 사용자의 관심도를 산출하는 단계;
를 포함하는, 사용자 선호도 학습 방법.
제 1 항에 있어서,
상기 (a) 단계 이전에,
복수의 사용자가 상기 소셜 네트워크 서비스에 게재한 글을 포함하는 상기 사용 이력 중 특정 수 이상의 사용자가 사용한 개체를 상기 관심 개체로 선정하고, 상기 선정된 관심 개체 및 상기 선정된 관심 개체가 속한 카테고리에 대한 정보를 저장하는 단계;
를 더 포함하는, 사용자 선호도 학습 방법.
삭제
삭제
제 1 항에 있어서,
상기 (b) 단계는
상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체에 대한 긍정 관심도와 부정 관심도를 산출하되,
상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체의 감성 분석값을 산출하는 단계;
상기 특정일의 사용 이력에서 감성 분석값이 가장 큰 관심 개체의 감성 분석 값인 최대 감성 분석값을 산출하는 단계; 및
상기 감성 분석값 및 최대 감성 분석값의 상대적 비율에 근거하여 상기 특정일에서 상기 관심 객체의 긍정 관심도와 부정 관심도를 산출하는 단계;
를 포함하되,
상기 긍정 관심도는 상기 산출된 감성 분석값이 0보다 크고,
상기 부정 관심도는 상기 산출된 감성 분석값이 0보다 작으며,
상기 관심 객체의 긍정 관심도와 부정 관심도를 산출하는 단계는 일자별 가중치를 반영하는, 사용자 선호도 학습 방법.
청구항 6은(는) 설정등록료 납부시 포기되었습니다.

제 5 항에 있어서,
상기 (c) 단계는
상기 관심 개체의 관심도, 긍정 관심도 및 부정 관심도에 근거하여 상기 관심 개체에 대한 상기 사용자의 선호도를 산출하는, 사용자 선호도 학습 방법.
청구항 7은(는) 설정등록료 납부시 포기되었습니다.

제 6 항에 있어서,
(d) 상기 산출된 관심 개체에 대한 선호도에 근거하여 상기 사용자가 선호하는 것으로 예측되는 콘텐츠를 추천하는 단계;
를 더 포함하되,
상기 (d) 단계는
카테고리에 대한 선호도를 반영하여 상기 콘텐츠를 추천하는, 사용자 선호도 학습 방법.
청구항 8은(는) 설정등록료 납부시 포기되었습니다.

제 7 항에 있어서,
상기 (d) 단계는
상기 사용자의 사용 이력 중 상기 카테고리에 대한 제 1 기간 동안의 선호도인 장기간 선호도(long-term preference) 및 제 2 기간 동안의 선호도인 단기간 선호도(short-term preference)를 포함하여 상기 카테고리에 대한 선호도를 산출하는, 사용자 선호도 학습 방법.
청구항 9은(는) 설정등록료 납부시 포기되었습니다.

제 8 항에 있어서,
상기 (d) 단계는
상기 사용 이력 중 상기 제 1 기간의 사용 이력에서 상기 카테고리의 출현 빈도를 산출하는 단계;
상기 제 1 기간의 사용 이력에서 출현했던 모든 카테고리의 출현 빈도의 합을 산출하는 단계; 및
상기 출현 빈도 및 출현 빈도의 합의 상대적 비율에 근거하여 상기 장기간 선호도를 산출하는 단계;
를 포함하는, 사용자 선호도 학습 방법.
청구항 10은(는) 설정등록료 납부시 포기되었습니다.

제 8 항에 있어서,
상기 (d) 단계는
상기 사용 이력 중 상기 제 2 기간의 사용 이력에서 상기 카테고리의 출현 빈도를 산출하는 단계;
상기 제 2 기간의 사용 이력에서 출현했던 모든 카테고리의 출현 빈도의 합을 산출하는 단계; 및
상기 출현 빈도 및 출현 빈도의 합의 상대적 비율에 근거하여 상기 단기간 선호도를 산출하는 단계;
를 포함하는, 사용자 선호도 학습 방법.
사용자 선호도 학습 장치에 있어서,
사용자의 소셜 네트워크 서비스(Social Network Service;SNS)의 사용 이력으로부터 형태소를 분석하여 관심 개체(entity)를 추출하는 개체 추출부;
상기 추출된 관심 개체에 대한 감성 분석을 수행하여 상기 관심 개체에 대한 상기 사용자의 관심도(interest)를 산출하는 관심도 산출부; 및
상기 산출된 관심도에 근거하여 상기 관심 객체에 대한 상기 사용자의 선호도(preference)를 산출하는 선호도 산출부;
를 포함하되,
상기 관심도 산출부는
상기 분석된 형태소로부터 상기 관심 개체에 대한 감성 단어를 추출하여 감성을 판단하고, 상기 판단 결과에 대응하는 사용자의 관심도를 산출하며,
상기 사용 이력 중 특정일의 사용 이력에서 상기 관심 개체의 출현 빈도를 산출하고,
상기 특정일의 사용 이력에서 출현 빈도가 가장 높은 관심 객체의 출현 빈도인 최대 출현 빈도를 산출하고,
상기 출현 빈도 및 최대 출현 빈도의 상대적 비율과 일자별로 반영된 가중치에 근거하여 상기 특정일에서 상기 사용자의 관심도를 산출하는, 사용자 선호도 학습 장치.
제 11 항에 있어서,
복수의 사용자가 상기 소셜 네트워크 서비스에 게재한 글을 포함하는 상기 사용 이력 중 특정 수 이상의 사용자가 사용한 개체를 상기 관심 개체로 선정하고, 상기 선정된 관심 개체 및 상기 선정된 관심 개체가 속한 카테고리에 대한 정보를 저장하는 관심 개체 선정부;
를 더 포함하는, 사용자 선호도 학습 장치.
제 11 항에 있어서,
상기 산출된 관심 개체에 대한 선호도에 근거하여 상기 사용자가 선호하는 것으로 예측되는 콘텐츠를 추천하는 콘텐츠 추천부;
를 더 포함하되,
상기 콘텐츠 추천부는 카테고리에 대한 선호도를 반영하여 상기 콘텐츠를 추천하는, 사용자 선호도 학습 장치.