KR20150105830A

KR20150105830A - 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법

Info

Publication number: KR20150105830A
Application number: KR1020140027866A
Authority: KR
Inventors: 이오준; 이재동; 이원진; 박승보; 홍민성; 임규찬
Original assignee: 단국대학교 산학협력단
Priority date: 2014-03-10
Filing date: 2014-03-10
Publication date: 2015-09-18
Also published as: KR101573601B1

Abstract

사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법이 개시된다. 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치는, 콘텐츠를 추천하는 장치에 있어서, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부 및 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부를 포함한다.

Description

사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법{APPARATUS AND METHOD FOR HYBRID FILTERING CONTENT RECOMMENDATION USING USER PROFILE AND CONTEXT INFORMATION BASED ON PREFERENCE}

본 발명은, 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법에 관한 것이다. 더욱 상세하게는 본 발명은 비교적 높은 정확도를 보이는 협업 필터링 기반 추천 시스템의 근본적인 문제점들을 내용 기반 필터링과 규칙 기반 필터링을 통해 보완하여 추천의 정확도와 시간 효율을 높인 추천 장치 및 방법에 관한 것이다.

인터넷의 진화는 결과적으로 사용자가 접하는 상품과 콘텐츠의 폭발적인 증가를 가져왔다. 방대한 양의 상품과 콘텐츠로 인해, 사용자들은 오히려 원하는 상품이나 콘텐츠를 찾거나 구매하기가 더욱 어려워졌다.

이에 따라 사용자들에게 적절한 상품을 제공하고 사용자들의 의사 결정을 지원하는 추천 시스템의 중요성은 점점 더 높아지고 있다. 사용자의 입맛에 맞는 상품을 제공하는 개인화된 맞춤형 추천 시스템은 사용자의 만족도와 고객 충성도를 향상 시킬 수 있을 뿐만 아니라, 전자 소매상들의 이윤을 크게 증가시킨다.

아마존, 구글, 넷플릭스, 티보, 그리고 야후와 같은 인터넷 시장의 선도 기업들은 개인화된 추천이 가능한 맞춤형 상품 추천 엔진을 이미 운용하고 있다.

추천 시스템은 '사람들이 추천을 제공하며 시스템이 통합하여 적당한 사람에게 보여준다.' 고 정의되어 있다. 추천 시스템은 사용자에게 사용자가 선호하는 콘텐츠 또는 정보를 제공해주는 시스템으로써, 인터넷의 음악, 영화 사이트의 콘텐츠 추천, 인터넷 쇼핑몰에서의 상품 추천 등에 널리 이용되고 있다.

종래의 콘텐츠 추천 시스템은 각 추천 방법을 독립적으로 사용하거나 하이브리드 추천 시스템을 제안하거나 구축하더라도 사용자의 인구 통계적 정보나 콘텐츠의 메타데이터 등의 추가적인 정보를 규칙의 형태로 가미하거나 단순히 콘텐츠의 군집화에 활용하는 정도에 그쳐 정확도에 한계가 있었다.

또한, 협업 필터링과 내용 기반 필터링을 조합한 하이브리드 필터링 추천 기법의 경우에도 협업 필터링의 초기 데이터 희소성 문제를 내용 기반 필터링을 이용하여 보정하는 정도에 그쳤다.

또한, 규칙 기반 필터링 기법과 협업 필터링 기법을 병용하는 기법 또한 제안 되었으나 협업 필터링의 결과를 규칙 기반 필터링을 이용하여 보정하는 정도에 그쳤다.

또한, 각 추천 방법들이 갖는 근본적인 한계점인 내용 기반 필터링의 사용자와 콘텐츠의 특성 벡터의 정확도의 한계 문제와 초기 평가자 문제, 협업 필터링의 데이터 희소성 문제 등을 극복하기 위한 대책을 필터링 알고리즘의 개선이나 보정을 위한 알고리즘을 추가하는 형태로 제시하여 근본적인 해결책을 제시하지 못할 뿐만 아니라, 알고리즘이 복잡해짐에 따라 시간 복잡도가 높아지고 상용화에 어려움이 발생하는 문제점이 있었다.

따라서, 기존 콘텐츠 추천 시스템의 문제점을 해결하기 위하여 종래의 콘텐츠 추천 시스템보다 정확한 콘텐츠를 추천할 수 있게 하며 추천 서비스의 규모의 변화에 따른 추천 성능의 변화의 폭을 최대한 줄이는 것이 필요한 실정이다.

따라서, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법을 통하여 첫째, 사용자 특성과 콘텐츠 특성을 바탕으로 사용자와 콘텐츠를 군집화하고 둘째, 이 군집을 바탕으로 사용자의 선호도를 예측하며 셋째, 사용자 선호도 정보와 군집을 이용해 추천을 수행하고 넷째, 사용자 상황 정보와 사용자의 콘텐츠 이용 내역을 통해 학습된 연관 규칙을 이용하여 사용자에게 추천될 콘텐츠들에 순위를 부여하며 다섯째, 추천에 대한 사용자 피드백을 사용자와 콘텐츠의 특성 벡터에 반영함으로써 종래 문제점을 개선할 수 있을 것이다. 관련 기술로는 관련 기술로는 한국공개특허 제2014-0010679호가 존재한다.

본 발명의 목적은, 상기 문제점을 해결하기 위한 것으로, 비교적 높은 정확도를 보이는 협업 필터링 기반 추천 시스템의 근본적인 문제점들을 내용 기반 필터링과 규칙 기반 필터링을 통해 보완하여 추천의 정확도와 시간 효율을 높이는 것을 가능케 하는 것이다.

상기한 목적을 달성하기 위한 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치는, 콘텐츠를 추천하는 장치에 있어서, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부 및 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부를 포함한다.

이 때, 상기 특성 벡터 관리 생성부는, 상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 할 수 있다.

이 때, 상기 군집 생성부는, 군집의 수를 결정하는 군집 수 결정부, 군집화를 수행하는 군집화 수행부 및 군집 간의 선호도를 추정하는 군집 간 선호도 추정부를 포함할 수 있다.

이 때, 상기 군집 수 결정부는, 베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정할 수 있다.

이 때, 상기 군집화 수행부는, 기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행할 수 있다.

이 때, 상기 군집 간 선호도 추정부는, 상기 사용자 군집의 원소의 사용자 군집에 대한 우도와, 상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와, 상기 사용자 군집의 원소와 상기 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출할 수 있다.

이 때, 상기 사용자 피드백 예측부는, 특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성부, 상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성부 및 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측부를 포함할 수 있다.

이 때, 상기 유사 아이템 집합 생성부는, 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성부, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택부 및 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측부를 포함할 수 있다.

이 때, 상기 유사 사용자 집합 생성부는, 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성부, 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부 및 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측부를 포함할 수 있다.

이 때, 상기 피드백 예측부는,

을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되, 상기

는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기

는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기

는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기

는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미할 수 있다.

이 때, 상기 콘텐츠 추천부는, 사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천부를 포함할 수 있다.

이 때, 상기 콘텐츠 추천부는, 상기 사용자의 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천부를 더 포함할 수 있다.

또한, 상기한 목적을 달성하기 위한 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법은, 콘텐츠를 추천하는 방법에 있어서, 특성 벡터 관리 생성부에 의하여, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성 단계, 군집 생성부에 의하여, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성 단계, 사용자 피드백 예측부에 의하여, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측 단계 및 콘텐츠 추천부에 의하여, 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천 단계를 포함한다.

이 때, 상기 특성 벡터 관리 생성 단계는, 상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 할 수 있다.

이 때, 상기 군집 생성 단계는, 군집 수 결정부에 의하여, 군집의 수를 결정하는 군집 수 결정 단계, 군집화 수행부에 의하여, 군집화를 수행하는 군집화 수행 단계 및 선호도 추정부에 의하여, 군집 간의 선호도를 추정하는 군집 간 선호도 추정 단계를 포함할 수 있다.

이 때, 상기 군집 수 결정 단계는, 베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정할 수 있다.

이 때, 상기 군집화 수행 단계는, 기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행할 수 있다.

이 때, 상기 군집 간 선호도 추정 단계는, 상기 사용자 군집의 원소의 사용자 군집에 대한 우도와, 상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와, 상기 사용자 군집의 원소와 상기 콘텐츠 쿤집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출할 수 있다.

이 때, 상기 사용자 피드백 예측 단계는, 유사 아이템 집합 생성부에 의하여, 특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성 단계, 유사 사용자 집합 생성부에 의하여, 상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성 단계 및 피드백 예측부에 의하여, 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측 단계를 포함할 수 있다.

이 때, 상기 유사 아이템 집합 생성부는, 아이템 유사도 데이터 생성부에 의하여, 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성 단계, 유사 아이템 선택부에 의하여, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택 단계 및 유사 아이템 기반 평가 점수 예측부에 의하여, 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측 단계를 포함할 수 있따.

이 때, 상기 유사 사용자 집합 생성 단계는, 사용자 유사도 데이터 생성부에 의하여, 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성 단계, 유사 사용자 선택부에 의하여, 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부 및 유사 사용자 기반 평가 점수 예측부에 의하여, 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측 단계를 포함할 수 있다.

이 때, 상기 피드백 예측 단계는,

이 때, 상기 콘텐츠 추천 단계는, 사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천 단계를 포함할 수 있다.

이 때, 상기 콘텐츠 추천 단계는, 상기 사용자의 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천 단계를 더 포함할 수 있다.

본 발명에 의하면, 비교적 높은 정확도를 보이는 협업 필터링 기반 추천 시스템의 근본적인 문제점들을 내용 기반 필터링과 규칙 기반 필터링을 통해 보완하여 추천의 정확도와 시간 효율을 높일 수 있는 효과가 있다.

도 1은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 블록도이다.
도 2는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 군집 생성부의 실시예를 설명하기 위한 도면이다.
도 3은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 사용자 피드백 예측부의 실시예를 설명하기 위한 도면이다.
도 4는 사용자 피드백 예측부의 구성인 유사 아이템 집합 생성부의 실시예를 설명하기 위한 도면이다.
도 5는 사용자 피드백 예측부의 구성인 유사 사용자 집합 생성부의 실시예를 설명하기 위한 도면이다.
도 6은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 콘텐츠 추천부의 실시예를 설명하기 위한 도면이다.
도 7은 사용자 특성 벡터의 실시예를 설명하기 위한 도면이다.
도 8은 콘텐츠 특성 벡터의 실시예를 설명하기 위한 도면이다.
도 9는 사용자 프로파일의 실시예를 설명하기 위한 도면이다.
도 10은 이용 내역의 실시예를 설명하기 위한 도면이다.
도 11은 콘텐츠 특성의 실시예를 설명하기 위한 도면이다.
도 12 및 도 13은 종래 기술과 본 발명의 성능을 비교한 그래프를 나타낸 도면이다.
도 14는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법의 플로우챠트이다.
도 15는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 군집을 생성하는 과정의 실시예를 설명하기 위한 도면이다.
도 16은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 사용자 피드백을 예측하는 과정의 실시예를 설명하기 위한 도면이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다.

그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.

이하, 도면을 참조하여 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치에 대하여 설명하도록 한다.

도 1은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 블록도이다. 도 2는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 군집 생성부의 실시예를 설명하기 위한 도면이다. 도 3은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 사용자 피드백 예측부의 실시예를 설명하기 위한 도면이다.

도 1을 참조하여 설명하면, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치(100)는 특성 벡터 관리 생성부(110), 군집 생성부(120), 사용자 피드백 예측부(130) 및 콘텐츠 추천부(140)를 포함하여 구성됨을 확인할 수 있다.

보다 구체적으로, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치(100)는, 콘텐츠를 추천하는 장치에 있어서, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부(110), 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부(120), 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부(130) 및 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부(140)를 포함한다.

상기 특성 벡터 관리 생성부(110)는 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 기능을 수행한다.

도 7은 사용자 특성 벡터의 실시예를 설명하기 위한 도면이다. 도 8은 콘텐츠 특성 벡터의 실시예를 설명하기 위한 도면이다.

도 7 및 도 8을 참조하면, 상기 사용자 특성 벡터 및 상기 콘텐츠 특성 벡터의 실시예를 확인할 수 있다.

상기 특석 벡터 관리 생성부(110)는, 상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 할 수 있다.

구체적으로, 도 7 및 도 8을 참조하면, 상기 사용자 특성 벡터는 콘텐츠의 각 요소에 대한 사용자의 선호도를 나타내고, 상기 콘텐츠 특성 벡터는 콘텐츠가 가진 각 요소를 지수의 형태로 수치화한 것을 의미한다.

본 발명에서는 실험을 위해 문화재, 관광지, 레저 콘텐츠를 이용하였으며, 콘텐츠의 특성을 신체적, 정서적, 사회적, 지적, 정신적 다섯 가지 요소를 분류하고 있다. 상기와 같은 사용자 피드백 반영 방법에 대한 자세한 알고리즘은 아래와 같다.

사용자

의 콘텐츠

에 대한 피드백을

, 사용자

의 피드백의 평균을

이라 하고, 사용자

의 특성 벡터를

, 콘텐츠

의 특성 벡터를

이라 할 때, 아래의 수학식들과 같이 정의된다.

이 때, 상기

이 10보다 크면, 아래의 수학식 2와 같이 정의된다.

이 때, 상기

이 -10보다 작으면, 아래의 수학식 3과 같이 정의된다.

상기 수학식 4에서

은 사용자 a의 아이템 m에 대한 평가를 의미한다.

이 때, 상기 수학식 1 내지 수학식 3은 사용자의 피드백을 전처리하기 위한 과정이다. 이 과정이 필요한 이유는 사용자 마다 점수를 부여하는 기준점과 만족도의 정도에 따라 부가하는 점수의 크기가 다르기 때문이다.

따라서, 본 발명에서는 사용자의 과거 피드백의 평균으로 점수의 기준점을 추정하고 과거 피드백의 표준 편차로 사용자의 피드백을 정규화한다.

또한,

의 절대값이 10보다 클 경우 확률적으로 의미가 없으므로 이 값들에는 -10 또는 10의 값을 부여한다.

마지막으로 상기 수학식 4의 과정을 거쳐 이 값의 표현 범위를 0부터 1까지가 되게 하여 상기 수학식 5 및 상기 수학식 6에 용이하게 적용할 수 있도록 한다. 상기 수학식 5 및 상기 수학식 6은

의 값에 따라, 상대 원소의 특성 벡터를 자신의 특성 벡터에 적용하여 특성 벡터를 학습화는 과정이다. 이러한 과정을 거쳐 사용자 프로파일이나 콘텐츠 특성을 활용한 추천 시스템에서 문제가 되는 정성적 특성의 정량화의 어려움을 극복할 수 있는 장점이 있다.

상기 군집 생성부(120)는 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 기능을 수행한다.

도 2를 참조하여 설명하면, 상기 군집 생성부(120)는, 군집 수 결정부(121), 군집화 수행부(122) 및 군집 간 선호도 추정부(123)을 포함하여 구성된다.

보다 구체적으로, 상기 군집 수 결정부(121)는 군집의 수를 결정하는 기능을 수행하고, 상기 군집화 수행부(122)는 군집화를 수행하며, 상기 군집 간 선호도 추정부(123)는 군집 간의 선호도를 추정하는 기능을 수행한다.

상기 군집 수 결정부(121)에서 적합한 군집의 수 K를 결정하는 알고리즘은 아래의 표1과 같다.

For i에 대하여,
사용자 또는 콘텐츠를 i개의 군집으로 군집화 한다.
I에 따른 베이지안 정보 기준(Bayesian Information Criterion) 점수를 구한다.
End For
베이지안 정보 기준 점수를 최대로 하는 i를 군집의 수 K로 결정한다.

또한, 상기 군집화 수행부(122)에서 군집화를 수행하는 과정은 아래와 같다.
사용자의 군집의 수를

라 하고, 콘텐츠의 군집의 수를

라 할 때,
사용자를

개의 군집으로 군집화 한다. 콘텐츠를

개의 군집으로 군집화 한다.

또한, 상기 군집 간 선호도 추정부(123)에서의 군집 간 선호도를 추정하는 과정은 아래의 수학식 7과 같다.

상기 수학식 7에서 상기

는 사용자 군집 i의 콘텐츠 군집 j에 대한 선호도를 의미한다.

또한, 상기 수학식 7에서,

은 사용자

의 사용자 군집

에 대한 우도를 나타내며,

은 콘텐츠

의 콘텐츠 군집

에 대한 우도를 나타내고,

은 사용자

의 콘텐츠

에 대한 선호도를 나타낸다.

는

번째 사용자 군집의

번째 콘텐츠 군집에 대한 선호도를 나타낸다.

사용자 군집의 콘텐츠 군집에 대한 선호도는 사용자 군집의 원소의 사용자 군집에 대한 우도와 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도, 사용자 군집의 원소와 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총 합으로 구한다.

군집 간 선호도 추정은 학습하는 협업 필터링 추천 기법에서 서비스 규모 변화에 따른 과부하를 막는데 가장 주요한 역할을 하는 부분이다.

이 방법을 통해 특정 사용자 군집에 대해 추천할 콘텐츠 군집의 순위를 얻을 수 있다. 따라서, 사용자로 부터 서비스 요청이 들어올 경우, 사용자의 군집에 따라 추천할 콘텐츠의 군집이 순위화 되어 있기 때문에 단순한 내용 기반 필터링 기법을 활용하여 사용자의 선호도가 낮은 콘텐츠를 필터링하는 것만으로도 신뢰도 높은 서비스를 원활하게 제공할 수 있다.

이 방법은 데이터베이스에 대한 접근을 크게 줄이며 종래의 협업 필터링 추천 기법에서의 유사 사용자 군집이나 유사 콘텐츠 군집을 형성하는데 소요했던 자원을 절약할 수 있다. 또한 콘텐츠나 사용자의 수가 증가하더라도 서비스 제공 시에 소요되는 자원은 크게 늘어나지 않아, 대규모 서비스에서도 동일한 추천 서비스 품질을 유지할 수 있다.

보다 구체적으로, 본 발명에서 개시되는 협업 필터링 추천 기법의 추천 모델은 크게 사용자와 콘텐츠의 군집 그리고 콘텐츠 군집 간의 선호도 두 가지 부분으로 이루어진다. 사용자와 콘텐츠를 군집화 하는 부분 또한 군집 수를 결정하는 부분과 군집화를 수행하는 두 부분으로 나뉜다.

이 때, 군집 수의 결정은 베이지안 정보 기준 점수를 이용하게 되며 구체적인 방법은 아래의 수학식 8과 같다.

상기 수학식 8에서,

는 군집의 수가 K인 군집 모델을 나타내며, X는 모델이 갖는 전체 원소를 가리킨다.

또, N은 모델이 갖는 전체 원소의 수를, N_p는 각 원소가 갖는 파라미터의 수를, 마지막으로,

은 현재 모델의 log-우도 값을 나타낸다.

`상기 log-우도는 주어진 원소들을 가장 잘 표현하는 모델에서 최댓값을 갖게 되는데, 이 값은 집단의 개수에 비례하며 N개의 집단으로 구성된 모델이

개의 원소를 나타내는 경우 log-우도는 최댓값 0을 갖게 된다.

따라서 과적합화를 막기 위해 상기 수학식 8의 두 번째 항과 같은 벌칙항이 필요하다. 이 항은 모델의 복잡도를 나타내는 항으로 모델의 복잡도가 증가함에 따라 그 값이 증가한다. 따라, 베이지안 정보 기준은 우도와 모델 복잡도를 고려하여 최적의 모델을 찾게 된다. 이 때, 상기 log-우도는 아래의 수학식 9와 같이 구할 수 있다.

상기 수학식 9에서, N_i는 i번째 군집에 속하는 원소의 개수를 나타내며,C_i는 i번째 군집을 나타내고, u_j와

는 각각 원소 j가 속한 군집의 평균과 분산을 나타낸다.

군집화는 기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안-베이지안 확률 모델과 사용자간 유사도를 이용한다. 기대치 최대화 알고리즘은 k-평균 알고리즘이나 k-최근접이웃 알고리즘 보다 실제 군집의 중심을 정확하게 찾아낸다.

또한 기대치최대화 알고리즘은 원소가 속한 군집을 지역적으로 판단하는 k-평균 알고리즘과 달리 전역적으로 판단하기 때문에 원소가 속한 군집을 더욱 정확히 판별할 수 있다. 이는 인접한 군집들에 대한 원소의 군집 판별에서 더욱 명확히 드러난다. 세부 알고리즘은 아래와 같다.

초기화: 각 군집에 임의의 중심 C_i와 임의의 평균 U_i, 임의의 분산

부여한다.

While 군집 내부 편차의 평균이

이하일 때까지,

For j에 대하여,

For i에 대하여,

For C_i의 원소 x_l에 대하여,

End For

가 최대가 되게 하는 C_i를

의 군집으로 한다.

End For

변경된 모델에 따라, 각 군집의 C_i, U_i,

,

을 계산한다.

End For

End While

상기 수학식 10 및 상기 수학식 11이 포함된 상기와 같은 알고리즘에서, U_i는 i번째 군집

의 평균을,

는 군집의 중심을,

는 군집의 표준 편차를,

는 원소가 해당 군집에 속할 확률을 나타낸다. R_j는 원소 j의 선호도 벡터를 나타내며, R_j _,i는 원소 j의 i에 대한 선호도를 나타낸다.

상기 수학식 10은 가우시안-베이지안 확률 모델을 통해 원소

가 군집

에 속할 확률을 추청하는 과정이며, 이 수식의 결과 값인

는 위 확률의 근사치이다. 또한, 상기 수학식 11은 위 알고리즘에서 사용하는 기대치 최대화 알고리즘의 최대 우도 추정치를 구하는 과정으로

에 원소 x_j와 군집

내부의 원소들 간의 유사도의 합을 곱하여 최대 우도 추정치로 사용한다.

이러한 방법을 사용하는 것은 정확도를 사용자 프로파일링 과정이나 아이템 특성 추출 과정에 의존하는 특성 벡터에 비해 사용자의 서비스 이용에 따라 지속적으로 정보를 축적하고 변화하는 선호도 정보가 원소의 특성을 더 정확히 표현할 수 있기 때문이다.

상기 사용자 피드백 예측부(130)는 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 기능을 수행한다.

도 3은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 사용자 피드백 예측부의 실시예를 설명하기 위한 도면이다. 도 4는 사용자 피드백 예측부의 구성인 유사 아이템 집합 생성부의 실시예를 설명하기 위한 도면이다. 도 5는 사용자 피드백 예측부의 구성인 유사 사용자 집합 생성부의 실시예를 설명하기 위한 도면이다.

도 3을 참조하여 설명하면, 상기 사용자 피드백 예측부(130)는, 유사 아이템 집합 생성부(131), 유사 사용자 집합 생성부(132) 및 피드백 예측부(133)를 포함하여 구성된다.

보다 구체적으로, 도 4를 참조하여 설명하면, 상기 유사 아이템 집합 생성부(131)는 아이템 유사도 데이터 생성부(131a), 유사 아이템 선택부(131b) 및 유사 아이템 기반 평가 점수 예측부(131c)를 포함하여 구성된다.

상기 아이템 유사도 데이터 생성부(131a)는 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 기능을 수행한다.

즉, 서로 다른 두 아이템 사이의 유사도를 계산하고 아이템 유사도에 관한 데이터(표)를 생성할 수 있는 것이다

이 때, 상기 아이템 유사도 데이터 생성부(131a)는 아래와 같은 수학식 12를 통하여 상기 아이템 간의 유사도에 대한 가중치를 산출할 수 있다.

상기 수학식 12에서 상기

는 상기 아이템 간의 유사도에 대한 가중치를 의미하고, 상기 i 및 상기 j는 각각 아이템을 의미하고, 상기 U는 상기 i 및 상기 j에 대하여 평가한 경험이 있는 사용자 집합을 의미하고, 상기

는 사용자 u의 아이템 i에 대한 평가이고, 상기

는 사용자 u의 아이템 j에 대한 평가이며, 상기

는 사용자 집합 U의 아이템 i에 대한 평가의 평균이며, 상기

는 사용자 집합 U의 아이템 j에 대한 평가의 평균을 의미한다.

본 명세서에서 평가 또는 평가 점수라는 의미는 사용자의 피드백에 대한 의미를 통칭하는 개념으로 이해되어야 한다.

또한, 상기 유사 아이템 선택부(131b)는, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 기능을 수행한다.

예컨대 만약 사용자a의 아이템 m에 대한 평가가 빠져 있는 경우에 있어서, 아이템 m과 가장 유사도가 높은 K개의 아이템을 상기 아이템 유사도 데이터를 기반으로 선택하게 되는 것이다.

상기 유사 아이템 기반 평가 점수 예측부(131c)는, 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 기능을 수행한다.

즉, 상기 유사 아이템 선택부(131b)에 의하여 선택된 유사 아이템의 평가 점수의 가중치 조합으로 누락된 아이템에 대한 평가 점수를 예측하는 것으로서 유사 아이템 기반의 예측 방법이다.

구체적으로, 상기 유사 아이템 기반 평가 점수 예측부(131c)는 아래와 같은 수학식 13을 통하여 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하게 된다.

상기 수학식 13에서, 상기

은 상기 누락된 상기 사용자 a의 아이템 m에 대한 평가 점수를 의미하고, 상기

는 상기 아이템 m과 아이템 k 간의 유사도에 대한 가중치를 의미하고, 상기

는 상기 사용자 a의 상기 아이템 k에 대한 평가를 의미한다.

상기 유사 사용자 집합 생성부(132)는, 상기 사용자와 유사한 사용자의 집합을 생성하는 기능을 수행한다.

도 5를 참조하면, 상기 유사 사용자 집합 생성부(132)는, 사용자 유사도 데이터 생성부(132a), 유사 사용자 선택부(132b) 및 유사 사용자 기반 평가 점수 예측부(132c)을 포함하여 구성된다.

구체적으로, 상기 사용자 유사도 데이터 생성부(132a)는 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 기능을 수행한다. 즉, 서로 다른 두 사용자 사이의 유사도를 계산하고 아이템 유사도에 관한 데이터(표)를 생성할 수 있는 것이다.

이 때, 상기 사용자 유사도 데이터 생성부(132a)는 아래와 같은 수학식 14를 통하여 상기 사용자 간의 유사도에 대한 가중치를 산출할 수 있다.

상기 수학식 14에서, 상기

는 상기 사용자 간의 유사도에 대한 가중치를 의미하고, 상기 a 및 상기 u는 각각 사용자를 의미하고, 상기 I는 사용자 a와 사용자 u 모두에 의해 평가된 이력이 있는 아이템들의 집합을 의미하고, 상기

는 사용자 u의 아이템 i에 대한 평가이며, 상기

는 사용자 a의 아이템 i에 대한 평가이며,

는 사용자 a의 아이템 집합 I에 대한 평가의 평균이며,

는 사용자 u의 아이템 집합 I에 대한 평가의 평균을 의미한다.

또한, 상기 유사 사용자 선택부(132b)는 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 기능을 수행한다.

예컨대 사용자 a의 아이템 m에 대한 평가가 빠져있는 경우에 있어서, 사용자 a와 가장 유사도가 높은 K개의 사용자를 상기 사용자 유사도 데이터를 기반으로 선택하게 되는 것이다.

상기 유사 사용자 기반 평가 점수 예측부(132c)는, 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 기능을 수행한다.

즉, 상기 유사 사용자 선택부(132b)에 의하여 선택된 유사 사용자의 평가 점수의 가중치 조합으로 누락된 아이템에 대한 평가 점수를 예측하는 것으로서 유사 사용자 기반의 예측 방법이다.

구체적으로, 상기 유사 사용자 기반 평가 점수 예측부(132c)는 아래와 같은 수학식 4를 통하여 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하게 된다.

상기 수학식 15에서, 상기

는 상기 사용자 a와 사용자 k 간의 유사도에 대한 가중치를 의미하고, 상기

는 상기 사용자 k의 상기 아이템 m에 대한 평가를 의미하고, 상기

는 사용자 a의 아이템 집합 I에 대한 평가의 평균을 의미한다.

상기 피드백 예측부(133)는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 기능을 수행한다.

구체적으로, 상기 피드백 예측부(133)에서는 아래의 수학식 16을 통하여 상기 사용자의 특정 아이템에 대한 최종적인 피드백을 예측할 수 있게 된다.

상기 수학식 16에서, 상기

는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미한다.

이 때, 상기

는, 아래의 수학식 17을 통하여 산출할 수 있다.

상기 수학식 17에서, 상기

는 사용자 a에 대한 유사 사용자 집합을 의미하고, 상기

는 아이템 m에 대한 유사 아이템 집합을 의미하고, 상기

는 상기 유사 사용자 집합의 표준 편차를 의미하고, 상기

는 상기 유사 아이템 집합의 표준 편차를 의미한다.

결과적으로, 사용자 a가 속한 군집을

, 콘텐츠

이 속한 군집을

이라고 할 때, 사용자 a의 콘텐츠 m에 대한 선호도의 예측은 아래의 수학식 18과 같이 정리될 수 있다.

상기 수학식 18에서

과

은 각각 사용자 a와 n의, 아이템 m과 l의 유사도 가중치를 의미하며, 상기 수학식 12와 상기 수학식 14를 통하여 구할 수 있다.

사용자 피드백을 예측하는 방법과 관련하여, 종래의 기술로는 유사 아이템 또는 유사 사용자 중 하나만을 채택하여 누락된 사용자의 아이템에 대한 평가를 예측하거나, 유사 아이템 및 유사 사용자 모두를 기반으로 하여 누락된 사용자의 아이템에 대한 평가를 하되, 기정해진 가중치로 획일적으로 병합하는 기술이었는바 신뢰도가 떨어지는 문제가 있었다.

다만, 본 발명에서는 상기 살펴본 바와 같이 유사 아이템 및 유사 사용자 기반에 있어서 신뢰도를 기반으로 산정되는 서로 다른 가중치를 부여하여 조합함으로써 보다 정확하고 신뢰성이 있는 아이템 평가 예측을 수행할 수 있는 것이다.

상기 콘텐츠 추천부(140)는 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 기능을 수행한다.

도 6은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 콘텐츠 추천부의 실시예를 설명하기 위한 도면이다. 도 9는 사용자 프로파일의 실시예를 설명하기 위한 도면이다. 도 10은 이용 내역의 실시예를 설명하기 위한 도면이다. 도 11은 콘텐츠 특성의 실시예를 설명하기 위한 도면이다.

도 6을 참조하여 설명하면, 상기 콘텐츠 추천부(140)는 규칙 기반 필터링 추천부(141) 및 하이브리드 필터링 추천부(142)를 포함하여 구성될 수 있다.

보다 구체적으로, 상기 규칙 기반 필터링 추천부(141)는 사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 기능을 수행한다.

또한, 상기 하이브리드 필터링 추천부(142)는 상기 사용자 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 기능을 수행한다.

상기 콘텐츠 추천부(140)에서의 알고리즘은 아래의 표2와 같다.

사용자

가 속한 군집을

, 콘텐츠 군집의 배열을

,

의

번째 원소를

, 추천할 콘텐츠의 배열을

라고 할 때,

을

에 따라 내림차순으로 정렬한다.

For

에 대하여,
For

에 대하여, 1부터

까지,
If

가 누락되었을 경우,

End If
If

보다

가 클 경우,

에 콘텐츠

추가.
End If
If

에

개의 콘텐츠가 추가된 경우,
For문 종료.
End If
End For
End For

을 사용자

의 각 콘텐츠에 대한 선호도에 따라, 내림차순으로 정렬.

상기 규칙 기반 필터링 추천부(141)와 관련하여 본 발명에서의 규칙 기반 필터링 추천 기법은 연구의 실험 및 검증을 위해 사용자 프로파일과 이용 내역 및 콘텐츠 특성은 도 9 내지 도 11에 도시된 바와 같다.

구체적으로, 사용자 프로파일은 사용자의 인구통계학적 정보와 콘텐츠의 각 요소에 대한 선호도를 포함하고 있으며 이용내역은 콘텐츠 이용 당시 사용자의 상황정보와 콘텐츠에 대한 피드백을 포함하고 있고, 콘텐츠 특성은 콘텐츠의 요소를 추정할 수 있는 정보들과 그 외 다양한 정보들을 포함하고 있다.

또한, 상기 하이브리드 필터링 추천부(142)는 상기 설명한 바와 같이 기술한 학습하는 협업 필터링 추천 기법과 규칙 기반 추천 기법을 통합한 사용자 프로파일과 상황 정보를 이용하게 된다.

이러한 기술은 학습하는 협업 필터링 추천 기법을 통해 생성된 추천 콘텐츠 리스트에 규칙 기반 필터링 추천 기법을 적용하여 사용자의 상황 정보를 반영한다.

이와 같은 과정은 사용자에게 맞춤화된 서비스를 요구하는 모바일 환경에서 추천 시스템이 사용자의 상황 변화에 더 능동적으로 대처할 수 있도록 한다. 또한, 시스템의 부하를 줄이기 위해 유사 사용자 군집 대신 사용자 프로파일을 기반으로 한 사용자 군집을 이용함으로써 생기는 추천 신뢰도의 저하를 보완할 수 있다.

이하, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법의 실험 및 검증에 대하여 설명하도록 한다.

본 발명의 실험 및 검증은 다음 두 가지 기준을 통해 이루어진다. 첫째는 추천 시스템의 성능 평가를 위해 가장 많이 사용되는

[J. L. Herlocker, J. A. Konstan, L. G. Terveen, and J. T. Riedl, "Evaluating collaborative filtering recommender systems," ACM Transactions on Information Systems, Vol.22, No.1, 2004 pp. 5-53.], [K. Goldberg, T. Roeder, D. Gupta, and C. Perkins, "Eigentaste: a constant time collaborative filtering algorithm," Information Retrieval, Vol.4, No.2, 2001, pp. 133-151]방법이다.

이 측정법은 예측한 순위와 실제 순위의 차이를 보여준다. 둘째는 응답 시간이다. 이는 추천 서비스 규모의 변화에 따른 시스템 부하의 변화를 보여준다.

를 구하는 방법은 아래의 수학식 19와 같다.

[수학식 19]

상기 수학식 19에서,N은 예측한 콘텐츠의 개수이고, p_i는 i번째 콘텐츠의 예측한 순위, r_i는 i번째 콘텐츠의 실제 순위이다.

실험은 다음과 같은 환경에서 진행되었다. 서버는 Windows 7기반의 Apache Tomcat 7.0을 사용하였으며, 데이터베이스는 MySQL5.5를 사용하였다. 서버 측 통합개발환경은 VisualStudio 2010를 사용하였으며, 사용된 서버 측 언어는 VC++이고, 클라이언트는 안드로이드 응용프로그램으로 구현되었고, 클라이언트 측 통합개발환경은 Eclipse Indigo, 개발언어는 Android SDK를 이용한 JAVA이다.

실험 데이터는 다음과 같다. 콘텐츠의 경우, 종로구 인근의 100여 개의 문화재, 관광지, 레저 콘텐츠를 이용하였고, 사용자 프로파일의 경우, 실험에 참여한 사용자들이 직접 입력하였다.

콘텐츠 제공 및 추천 방법은 다음과 같다. 콘텐츠는 사용자가 지정한 거리 내의 인근 콘텐츠를 사용자의 프로파일과, 상황정보에 따라 추천하여 지도상에 표시해주거나, 증강현실, 리스트의 형태를 통해 제공하였다. 사용자는 콘텐츠를 사용하기 위해 선택하며, 콘텐츠에 대한 자세한 정보를 볼 수 있고, 콘텐츠의 이용이 끝나면 0점에서 10점까지의 점수를 입력하여, 이용한 콘텐츠에 대해 평가한다.

실험은 [Kyusik Park, Jongmoo Choi, and Donghee Lee, "A Single-Scaled Hybrid Filtering Method for IPTV Program Recommendation," 2010], [Yong Kim and Sung-Been Moon, "A Study on Hybrid Recommendation System Based on Usage frequency for Multimedia Contents," Journal of the Korean society for information management, Vol.23 No.3, 2006, pp.91-125], [Yan Shen, Hak-Chul Shin, Daegi Kim, Yo-Hoon Hong, and Phill-Kyu Rhee, "Reinforcement Learning Algorithm Based Hybrid Filtering Image Recommender System," The journal of the Institute of Internet Broadcasting and Communication, Vol.12, No.3, 2012, pp. 75-81]에서 각기 제안하고 검증한 추천 기법들을 본 연구에서 제안한 추천 기법과 같은 환경에서 구현하여

와 응답 시간을 비교하는 방식으로 진행되었다. 도 12 및 도 13은 각 기법을 적용한 추천 시스템에서 사용자 수의 변화에 따른

와 응답 시간의 변화를 나타낸 그래프이다. 본 연구에서 제안하는 하이브리드 필터링 추천 기법은 PHFPC(user Preference based Hybrid Filtering recommendation technique using user Profile and Context information)라 표기한다.

도 12을 참조하면 사용자 수가 늘어날수록 점차 추천 성능이 높아지는 것을 볼 수 있으며, 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 추천 시스템의 경우 서비스 규모 변화에 비해 비교적 안정적인 성능을 보이는 것을 알 수 있다.

또한, 도 13을 보면, 다른 추천 기법들을 사용한 시스템의 경우 사용자 수의 증가에 따라 시스템의 응답 시간이 급격히 증가하는 것을 볼 수 있지만, 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 추천 시스템의 경우 사용자 수의 증가에도 확연히 안정적인 응답 시간을 보여주고 있음을 알 수 있다.

상기 살펴본 바와 같이 본 발명에 따른 연구에서는 서비스의 규모 변화에도 안정적인 성능을 보이는 추천 시스템을 구현하기 위하여, 학습하는 협업 필터링 추천 기법과 여기에 상황 정보를 반영하기 위한 기법을 제안하여 구현하였으며, 이를 실제 문화재, 관광지, 레저 콘텐츠 추천 시스템에 적용하여 그 성능을 평가함으로서 시스템의 유효성을 검증하였다.

제안하는 하이브리드 추천 시스템은 협업 필터링 추천 기법에서 나타나는 서비스 대규모화에 따른 시스템 부하 증가를 해결하기 위하여 사용자 프로파일과 콘텐츠 특성 정보를 이용하고 사용자와 콘텐츠 각각을 군집화하였다.

또한 이로 인해 저하되는 추천 시스템의 성능을 제고하기 위하여 사용자 선호도 예측 기법을 사용하였고 사용자의 피드백을 사용자와 콘텐츠 특성 벡터에 적용하였다. 또한 협업 필터링의 고질적인 문제인 초기 평가 문제와 초기 이용자 문제를 해결하기 위하여, 규칙 기반 필터링 기법을 이용하였다.

평균 절대 오차(

)를 이용한 추천 정확도 실험은 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 추천 시스템의 우수성을 나타내고 있다.

이하, 본 발명에 따른 이하, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에 대하여 설명하도록 한다. 상기 살펴본 바와 같이 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치와 중복되는 기술 내용에 대한 설명은 생략하도록 한다. 도 14는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법의 플로우챠트이다. 도 15는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 군집을 생성하는 과정의 실시예를 설명하기 위한 도면이다. 도 16은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 사용자 피드백을 예측하는 과정의 실시예를 설명하기 위한 도면이다.

도 14를 참조하면, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법은, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리(S100)하고, 사용자의 특석 벡터 및 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성한다(S110). 이 후, 사용자 군집 및 콘텐츠 군집을 기반으로 사용자의 피드백을 예측한다(S120). 그리고, 사용자의 피드백, 사용자 군집 및 콘텐츠 군집을 기반으로 콘텐츠를 추천(S130)함으로써 종료된다.

도 15를 참조하여 설명하면, 상기 S110 단계는, 군집수 결정 단계(S111), 군집화 수행 단계(S112) 및 군집 간 선호도 추정 단계(S113)를 포함한다.

또한, 도 16을 참조하여 설명하면, 상기 S120 단계는, 유사 아이템 집합 생성 단계(S121), 유사 사용자 집합 생성 단계(S122) 및 피드백 예측 단계(S123)를 포함한다.

이상에서와 같이 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치(100) 및 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

100: 하이브리드 필터링 콘텐츠 추천 장치
110: 특성 벡터 관리 생성부
120: 군집 생성부
130: 사용자 피드백 예측부
140: 콘텐츠 추천부

Claims

콘텐츠를 추천하는 장치에 있어서,
사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부;
상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부;
상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부; 및
상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 1에 있어서,
상기 특성 벡터 관리 생성부는,
상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 1에 있어서,
상기 군집 생성부는,
군집의 수를 결정하는 군집 수 결정부;
군집화를 수행하는 군집화 수행부; 및
군집 간의 선호도를 추정하는 군집 간 선호도 추정부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 3에 있어서,
상기 군집 수 결정부는,
베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 3에 있어서,
상기 군집화 수행부는,
기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 3에 있어서,
상기 군집 간 선호도 추정부는,
상기 사용자 군집의 원소의 사용자 군집에 대한 우도와,
상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와,
상기 사용자 군집의 원소와 상기 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 1에 있어서,
상기 사용자 피드백 예측부는,
특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성부;
상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성부; 및
상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 7에 있어서,
상기 유사 아이템 집합 생성부는,
아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성부;
상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택부; 및
선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 7에 있어서,
상기 유사 사용자 집합 생성부는,
사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성부;
상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부; 및
선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 7에 있어서,
상기 피드백 예측부는,

을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되,
상기
는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 1에 있어서,
상기 콘텐츠 추천부는,
사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
청구항 11에 있어서,
상기 콘텐츠 추천부는,
상기 사용자 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천부를 더 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
콘텐츠를 추천하는 방법에 있어서,
특성 벡터 관리 생성부에 의하여, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성 단계;
군집 생성부에 의하여, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성 단계;
사용자 피드백 예측부에 의하여, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측 단계; 및
콘텐츠 추천부에 의하여, 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 13에 있어서,
상기 특성 벡터 관리 생성 단계는,
상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 13에 있어서,
상기 군집 생성 단계는,
군집 수 결정부에 의하여, 군집의 수를 결정하는 군집 수 결정 단계;
군집화 수행부에 의하여, 군집화를 수행하는 군집화 수행 단계; 및
선호도 추정부에 의하여, 군집 간의 선호도를 추정하는 군집 간 선호도 추정 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 15에 있어서,
상기 군집 수 결정 단계는,
베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 15에 있어서,
상기 군집화 수행 단계는,
기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 15에 있어서,
상기 군집 간 선호도 추정 단계는,
상기 사용자 군집의 원소의 사용자 군집에 대한 우도와,
상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와,
상기 사용자 군집의 원소와 상기 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 13에 있어서,
상기 사용자 피드백 예측 단계는,
유사 아이템 집합 생성부에 의하여, 특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성 단계;
유사 사용자 집합 생성부에 의하여, 상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성 단계; 및
피드백 예측부에 의하여, 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 19에 있어서,
상기 유사 아이템 집합 생성부는,
아이템 유사도 데이터 생성부에 의하여, 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성 단계;
유사 아이템 선택부에 의하여, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택 단계; 및
유사 아이템 기반 평가 점수 예측부에 의하여, 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 19에 있어서,
상기 유사 사용자 집합 생성 단계는,
사용자 유사도 데이터 생성부에 의하여, 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성 단계;
유사 사용자 선택부에 의하여, 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부; 및
유사 사용자 기반 평가 점수 예측부에 의하여, 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 19에 있어서,
상기 피드백 예측 단계는,

을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되,
상기
는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 13에 있어서,
상기 콘텐츠 추천 단계는,
사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
청구항 23에 있어서,
상기 콘텐츠 추천 단계는,
상기 사용자 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천 단계를 더 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.