KR20150105830A - 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법 - Google Patents

사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법 Download PDF

Info

Publication number
KR20150105830A
KR20150105830A KR1020140027866A KR20140027866A KR20150105830A KR 20150105830 A KR20150105830 A KR 20150105830A KR 1020140027866 A KR1020140027866 A KR 1020140027866A KR 20140027866 A KR20140027866 A KR 20140027866A KR 20150105830 A KR20150105830 A KR 20150105830A
Authority
KR
South Korea
Prior art keywords
user
content
similar
unit
community
Prior art date
Application number
KR1020140027866A
Other languages
English (en)
Other versions
KR101573601B1 (ko
Inventor
이오준
이재동
이원진
박승보
홍민성
임규찬
Original Assignee
단국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 단국대학교 산학협력단 filed Critical 단국대학교 산학협력단
Priority to KR1020140027866A priority Critical patent/KR101573601B1/ko
Publication of KR20150105830A publication Critical patent/KR20150105830A/ko
Application granted granted Critical
Publication of KR101573601B1 publication Critical patent/KR101573601B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Strategic Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법이 개시된다. 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치는, 콘텐츠를 추천하는 장치에 있어서, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부 및 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부를 포함한다.

Description

사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법{APPARATUS AND METHOD FOR HYBRID FILTERING CONTENT RECOMMENDATION USING USER PROFILE AND CONTEXT INFORMATION BASED ON PREFERENCE}
본 발명은, 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법에 관한 것이다. 더욱 상세하게는 본 발명은 비교적 높은 정확도를 보이는 협업 필터링 기반 추천 시스템의 근본적인 문제점들을 내용 기반 필터링과 규칙 기반 필터링을 통해 보완하여 추천의 정확도와 시간 효율을 높인 추천 장치 및 방법에 관한 것이다.
인터넷의 진화는 결과적으로 사용자가 접하는 상품과 콘텐츠의 폭발적인 증가를 가져왔다. 방대한 양의 상품과 콘텐츠로 인해, 사용자들은 오히려 원하는 상품이나 콘텐츠를 찾거나 구매하기가 더욱 어려워졌다.
이에 따라 사용자들에게 적절한 상품을 제공하고 사용자들의 의사 결정을 지원하는 추천 시스템의 중요성은 점점 더 높아지고 있다. 사용자의 입맛에 맞는 상품을 제공하는 개인화된 맞춤형 추천 시스템은 사용자의 만족도와 고객 충성도를 향상 시킬 수 있을 뿐만 아니라, 전자 소매상들의 이윤을 크게 증가시킨다.
아마존, 구글, 넷플릭스, 티보, 그리고 야후와 같은 인터넷 시장의 선도 기업들은 개인화된 추천이 가능한 맞춤형 상품 추천 엔진을 이미 운용하고 있다.
추천 시스템은 '사람들이 추천을 제공하며 시스템이 통합하여 적당한 사람에게 보여준다.' 고 정의되어 있다. 추천 시스템은 사용자에게 사용자가 선호하는 콘텐츠 또는 정보를 제공해주는 시스템으로써, 인터넷의 음악, 영화 사이트의 콘텐츠 추천, 인터넷 쇼핑몰에서의 상품 추천 등에 널리 이용되고 있다.
종래의 콘텐츠 추천 시스템은 각 추천 방법을 독립적으로 사용하거나 하이브리드 추천 시스템을 제안하거나 구축하더라도 사용자의 인구 통계적 정보나 콘텐츠의 메타데이터 등의 추가적인 정보를 규칙의 형태로 가미하거나 단순히 콘텐츠의 군집화에 활용하는 정도에 그쳐 정확도에 한계가 있었다.
또한, 협업 필터링과 내용 기반 필터링을 조합한 하이브리드 필터링 추천 기법의 경우에도 협업 필터링의 초기 데이터 희소성 문제를 내용 기반 필터링을 이용하여 보정하는 정도에 그쳤다.
또한, 규칙 기반 필터링 기법과 협업 필터링 기법을 병용하는 기법 또한 제안 되었으나 협업 필터링의 결과를 규칙 기반 필터링을 이용하여 보정하는 정도에 그쳤다.
또한, 각 추천 방법들이 갖는 근본적인 한계점인 내용 기반 필터링의 사용자와 콘텐츠의 특성 벡터의 정확도의 한계 문제와 초기 평가자 문제, 협업 필터링의 데이터 희소성 문제 등을 극복하기 위한 대책을 필터링 알고리즘의 개선이나 보정을 위한 알고리즘을 추가하는 형태로 제시하여 근본적인 해결책을 제시하지 못할 뿐만 아니라, 알고리즘이 복잡해짐에 따라 시간 복잡도가 높아지고 상용화에 어려움이 발생하는 문제점이 있었다.
따라서, 기존 콘텐츠 추천 시스템의 문제점을 해결하기 위하여 종래의 콘텐츠 추천 시스템보다 정확한 콘텐츠를 추천할 수 있게 하며 추천 서비스의 규모의 변화에 따른 추천 성능의 변화의 폭을 최대한 줄이는 것이 필요한 실정이다.
따라서, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법을 통하여 첫째, 사용자 특성과 콘텐츠 특성을 바탕으로 사용자와 콘텐츠를 군집화하고 둘째, 이 군집을 바탕으로 사용자의 선호도를 예측하며 셋째, 사용자 선호도 정보와 군집을 이용해 추천을 수행하고 넷째, 사용자 상황 정보와 사용자의 콘텐츠 이용 내역을 통해 학습된 연관 규칙을 이용하여 사용자에게 추천될 콘텐츠들에 순위를 부여하며 다섯째, 추천에 대한 사용자 피드백을 사용자와 콘텐츠의 특성 벡터에 반영함으로써 종래 문제점을 개선할 수 있을 것이다. 관련 기술로는 관련 기술로는 한국공개특허 제2014-0010679호가 존재한다.
본 발명의 목적은, 상기 문제점을 해결하기 위한 것으로, 비교적 높은 정확도를 보이는 협업 필터링 기반 추천 시스템의 근본적인 문제점들을 내용 기반 필터링과 규칙 기반 필터링을 통해 보완하여 추천의 정확도와 시간 효율을 높이는 것을 가능케 하는 것이다.
상기한 목적을 달성하기 위한 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치는, 콘텐츠를 추천하는 장치에 있어서, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부 및 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부를 포함한다.
이 때, 상기 특성 벡터 관리 생성부는, 상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 할 수 있다.
이 때, 상기 군집 생성부는, 군집의 수를 결정하는 군집 수 결정부, 군집화를 수행하는 군집화 수행부 및 군집 간의 선호도를 추정하는 군집 간 선호도 추정부를 포함할 수 있다.
이 때, 상기 군집 수 결정부는, 베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정할 수 있다.
이 때, 상기 군집화 수행부는, 기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행할 수 있다.
이 때, 상기 군집 간 선호도 추정부는, 상기 사용자 군집의 원소의 사용자 군집에 대한 우도와, 상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와, 상기 사용자 군집의 원소와 상기 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출할 수 있다.
이 때, 상기 사용자 피드백 예측부는, 특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성부, 상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성부 및 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측부를 포함할 수 있다.
이 때, 상기 유사 아이템 집합 생성부는, 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성부, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택부 및 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측부를 포함할 수 있다.
이 때, 상기 유사 사용자 집합 생성부는, 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성부, 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부 및 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측부를 포함할 수 있다.
이 때, 상기 피드백 예측부는,
Figure pat00001
을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되, 상기
Figure pat00002
는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
Figure pat00003
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
Figure pat00004
는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
Figure pat00005
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미할 수 있다.
이 때, 상기 콘텐츠 추천부는, 사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천부를 포함할 수 있다.
이 때, 상기 콘텐츠 추천부는, 상기 사용자의 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천부를 더 포함할 수 있다.
또한, 상기한 목적을 달성하기 위한 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법은, 콘텐츠를 추천하는 방법에 있어서, 특성 벡터 관리 생성부에 의하여, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성 단계, 군집 생성부에 의하여, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성 단계, 사용자 피드백 예측부에 의하여, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측 단계 및 콘텐츠 추천부에 의하여, 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천 단계를 포함한다.
이 때, 상기 특성 벡터 관리 생성 단계는, 상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 할 수 있다.
이 때, 상기 군집 생성 단계는, 군집 수 결정부에 의하여, 군집의 수를 결정하는 군집 수 결정 단계, 군집화 수행부에 의하여, 군집화를 수행하는 군집화 수행 단계 및 선호도 추정부에 의하여, 군집 간의 선호도를 추정하는 군집 간 선호도 추정 단계를 포함할 수 있다.
이 때, 상기 군집 수 결정 단계는, 베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정할 수 있다.
이 때, 상기 군집화 수행 단계는, 기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행할 수 있다.
이 때, 상기 군집 간 선호도 추정 단계는, 상기 사용자 군집의 원소의 사용자 군집에 대한 우도와, 상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와, 상기 사용자 군집의 원소와 상기 콘텐츠 쿤집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출할 수 있다.
이 때, 상기 사용자 피드백 예측 단계는, 유사 아이템 집합 생성부에 의하여, 특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성 단계, 유사 사용자 집합 생성부에 의하여, 상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성 단계 및 피드백 예측부에 의하여, 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측 단계를 포함할 수 있다.
이 때, 상기 유사 아이템 집합 생성부는, 아이템 유사도 데이터 생성부에 의하여, 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성 단계, 유사 아이템 선택부에 의하여, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택 단계 및 유사 아이템 기반 평가 점수 예측부에 의하여, 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측 단계를 포함할 수 있따.
이 때, 상기 유사 사용자 집합 생성 단계는, 사용자 유사도 데이터 생성부에 의하여, 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성 단계, 유사 사용자 선택부에 의하여, 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부 및 유사 사용자 기반 평가 점수 예측부에 의하여, 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측 단계를 포함할 수 있다.
이 때, 상기 피드백 예측 단계는,
Figure pat00006
을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되, 상기
Figure pat00007
는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
Figure pat00008
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
Figure pat00009
는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
Figure pat00010
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미할 수 있다.
이 때, 상기 콘텐츠 추천 단계는, 사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천 단계를 포함할 수 있다.
이 때, 상기 콘텐츠 추천 단계는, 상기 사용자의 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천 단계를 더 포함할 수 있다.
본 발명에 의하면, 비교적 높은 정확도를 보이는 협업 필터링 기반 추천 시스템의 근본적인 문제점들을 내용 기반 필터링과 규칙 기반 필터링을 통해 보완하여 추천의 정확도와 시간 효율을 높일 수 있는 효과가 있다.
도 1은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 블록도이다.
도 2는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 군집 생성부의 실시예를 설명하기 위한 도면이다.
도 3은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 사용자 피드백 예측부의 실시예를 설명하기 위한 도면이다.
도 4는 사용자 피드백 예측부의 구성인 유사 아이템 집합 생성부의 실시예를 설명하기 위한 도면이다.
도 5는 사용자 피드백 예측부의 구성인 유사 사용자 집합 생성부의 실시예를 설명하기 위한 도면이다.
도 6은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 콘텐츠 추천부의 실시예를 설명하기 위한 도면이다.
도 7은 사용자 특성 벡터의 실시예를 설명하기 위한 도면이다.
도 8은 콘텐츠 특성 벡터의 실시예를 설명하기 위한 도면이다.
도 9는 사용자 프로파일의 실시예를 설명하기 위한 도면이다.
도 10은 이용 내역의 실시예를 설명하기 위한 도면이다.
도 11은 콘텐츠 특성의 실시예를 설명하기 위한 도면이다.
도 12 및 도 13은 종래 기술과 본 발명의 성능을 비교한 그래프를 나타낸 도면이다.
도 14는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법의 플로우챠트이다.
도 15는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 군집을 생성하는 과정의 실시예를 설명하기 위한 도면이다.
도 16은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 사용자 피드백을 예측하는 과정의 실시예를 설명하기 위한 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
이하, 도면을 참조하여 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치에 대하여 설명하도록 한다.
도 1은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 블록도이다. 도 2는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 군집 생성부의 실시예를 설명하기 위한 도면이다. 도 3은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 사용자 피드백 예측부의 실시예를 설명하기 위한 도면이다.
도 1을 참조하여 설명하면, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치(100)는 특성 벡터 관리 생성부(110), 군집 생성부(120), 사용자 피드백 예측부(130) 및 콘텐츠 추천부(140)를 포함하여 구성됨을 확인할 수 있다.
보다 구체적으로, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치(100)는, 콘텐츠를 추천하는 장치에 있어서, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부(110), 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부(120), 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부(130) 및 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부(140)를 포함한다.
상기 특성 벡터 관리 생성부(110)는 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 기능을 수행한다.
도 7은 사용자 특성 벡터의 실시예를 설명하기 위한 도면이다. 도 8은 콘텐츠 특성 벡터의 실시예를 설명하기 위한 도면이다.
도 7 및 도 8을 참조하면, 상기 사용자 특성 벡터 및 상기 콘텐츠 특성 벡터의 실시예를 확인할 수 있다.
상기 특석 벡터 관리 생성부(110)는, 상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 할 수 있다.
구체적으로, 도 7 및 도 8을 참조하면, 상기 사용자 특성 벡터는 콘텐츠의 각 요소에 대한 사용자의 선호도를 나타내고, 상기 콘텐츠 특성 벡터는 콘텐츠가 가진 각 요소를 지수의 형태로 수치화한 것을 의미한다.
본 발명에서는 실험을 위해 문화재, 관광지, 레저 콘텐츠를 이용하였으며, 콘텐츠의 특성을 신체적, 정서적, 사회적, 지적, 정신적 다섯 가지 요소를 분류하고 있다. 상기와 같은 사용자 피드백 반영 방법에 대한 자세한 알고리즘은 아래와 같다.
사용자
Figure pat00011
의 콘텐츠
Figure pat00012
에 대한 피드백을
Figure pat00013
, 사용자
Figure pat00014
의 피드백의 평균을
Figure pat00015
이라 하고, 사용자
Figure pat00016
의 특성 벡터를
Figure pat00017
, 콘텐츠
Figure pat00018
의 특성 벡터를
Figure pat00019
이라 할 때, 아래의 수학식들과 같이 정의된다.
Figure pat00020
이 때, 상기
Figure pat00021
이 10보다 크면, 아래의 수학식 2와 같이 정의된다.
Figure pat00022
이 때, 상기
Figure pat00023
이 -10보다 작으면, 아래의 수학식 3과 같이 정의된다.
Figure pat00024
Figure pat00025
상기 수학식 4에서
Figure pat00026
은 사용자 a의 아이템 m에 대한 평가를 의미한다.
Figure pat00027
Figure pat00028
이 때, 상기 수학식 1 내지 수학식 3은 사용자의 피드백을 전처리하기 위한 과정이다. 이 과정이 필요한 이유는 사용자 마다 점수를 부여하는 기준점과 만족도의 정도에 따라 부가하는 점수의 크기가 다르기 때문이다.
따라서, 본 발명에서는 사용자의 과거 피드백의 평균으로 점수의 기준점을 추정하고 과거 피드백의 표준 편차로 사용자의 피드백을 정규화한다.
또한,
Figure pat00029
의 절대값이 10보다 클 경우 확률적으로 의미가 없으므로 이 값들에는 -10 또는 10의 값을 부여한다.
마지막으로 상기 수학식 4의 과정을 거쳐 이 값의 표현 범위를 0부터 1까지가 되게 하여 상기 수학식 5 및 상기 수학식 6에 용이하게 적용할 수 있도록 한다. 상기 수학식 5 및 상기 수학식 6은
Figure pat00030
의 값에 따라, 상대 원소의 특성 벡터를 자신의 특성 벡터에 적용하여 특성 벡터를 학습화는 과정이다. 이러한 과정을 거쳐 사용자 프로파일이나 콘텐츠 특성을 활용한 추천 시스템에서 문제가 되는 정성적 특성의 정량화의 어려움을 극복할 수 있는 장점이 있다.
상기 군집 생성부(120)는 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 기능을 수행한다.
도 2를 참조하여 설명하면, 상기 군집 생성부(120)는, 군집 수 결정부(121), 군집화 수행부(122) 및 군집 간 선호도 추정부(123)을 포함하여 구성된다.
보다 구체적으로, 상기 군집 수 결정부(121)는 군집의 수를 결정하는 기능을 수행하고, 상기 군집화 수행부(122)는 군집화를 수행하며, 상기 군집 간 선호도 추정부(123)는 군집 간의 선호도를 추정하는 기능을 수행한다.
상기 군집 수 결정부(121)에서 적합한 군집의 수 K를 결정하는 알고리즘은 아래의 표1과 같다.
For i에 대하여,
사용자 또는 콘텐츠를 i개의 군집으로 군집화 한다.
I에 따른 베이지안 정보 기준(Bayesian Information Criterion) 점수를 구한다.
End For
베이지안 정보 기준 점수를 최대로 하는 i를 군집의 수 K로 결정한다.

또한, 상기 군집화 수행부(122)에서 군집화를 수행하는 과정은 아래와 같다.
사용자의 군집의 수를
Figure pat00031
라 하고, 콘텐츠의 군집의 수를
Figure pat00032
라 할 때,
사용자를
Figure pat00033
개의 군집으로 군집화 한다. 콘텐츠를
Figure pat00034
개의 군집으로 군집화 한다.
또한, 상기 군집 간 선호도 추정부(123)에서의 군집 간 선호도를 추정하는 과정은 아래의 수학식 7과 같다.
Figure pat00035
상기 수학식 7에서 상기
Figure pat00036
는 사용자 군집 i의 콘텐츠 군집 j에 대한 선호도를 의미한다.
또한, 상기 수학식 7에서,
Figure pat00037
은 사용자
Figure pat00038
의 사용자 군집
Figure pat00039
에 대한 우도를 나타내며,
Figure pat00040
은 콘텐츠
Figure pat00041
의 콘텐츠 군집
Figure pat00042
에 대한 우도를 나타내고,
Figure pat00043
은 사용자
Figure pat00044
의 콘텐츠
Figure pat00045
에 대한 선호도를 나타낸다.
Figure pat00046
Figure pat00047
번째 사용자 군집의
Figure pat00048
번째 콘텐츠 군집에 대한 선호도를 나타낸다.
사용자 군집의 콘텐츠 군집에 대한 선호도는 사용자 군집의 원소의 사용자 군집에 대한 우도와 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도, 사용자 군집의 원소와 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총 합으로 구한다.
군집 간 선호도 추정은 학습하는 협업 필터링 추천 기법에서 서비스 규모 변화에 따른 과부하를 막는데 가장 주요한 역할을 하는 부분이다.
이 방법을 통해 특정 사용자 군집에 대해 추천할 콘텐츠 군집의 순위를 얻을 수 있다. 따라서, 사용자로 부터 서비스 요청이 들어올 경우, 사용자의 군집에 따라 추천할 콘텐츠의 군집이 순위화 되어 있기 때문에 단순한 내용 기반 필터링 기법을 활용하여 사용자의 선호도가 낮은 콘텐츠를 필터링하는 것만으로도 신뢰도 높은 서비스를 원활하게 제공할 수 있다.
이 방법은 데이터베이스에 대한 접근을 크게 줄이며 종래의 협업 필터링 추천 기법에서의 유사 사용자 군집이나 유사 콘텐츠 군집을 형성하는데 소요했던 자원을 절약할 수 있다. 또한 콘텐츠나 사용자의 수가 증가하더라도 서비스 제공 시에 소요되는 자원은 크게 늘어나지 않아, 대규모 서비스에서도 동일한 추천 서비스 품질을 유지할 수 있다.
보다 구체적으로, 본 발명에서 개시되는 협업 필터링 추천 기법의 추천 모델은 크게 사용자와 콘텐츠의 군집 그리고 콘텐츠 군집 간의 선호도 두 가지 부분으로 이루어진다. 사용자와 콘텐츠를 군집화 하는 부분 또한 군집 수를 결정하는 부분과 군집화를 수행하는 두 부분으로 나뉜다.
이 때, 군집 수의 결정은 베이지안 정보 기준 점수를 이용하게 되며 구체적인 방법은 아래의 수학식 8과 같다.
Figure pat00049
상기 수학식 8에서,
Figure pat00050
는 군집의 수가 K인 군집 모델을 나타내며, X는 모델이 갖는 전체 원소를 가리킨다.
또, N은 모델이 갖는 전체 원소의 수를, Np는 각 원소가 갖는 파라미터의 수를, 마지막으로,
Figure pat00051
은 현재 모델의 log-우도 값을 나타낸다.
`상기 log-우도는 주어진 원소들을 가장 잘 표현하는 모델에서 최댓값을 갖게 되는데, 이 값은 집단의 개수에 비례하며 N개의 집단으로 구성된 모델이
Figure pat00052
개의 원소를 나타내는 경우 log-우도는 최댓값 0을 갖게 된다.
따라서 과적합화를 막기 위해 상기 수학식 8의 두 번째 항과 같은 벌칙항이 필요하다. 이 항은 모델의 복잡도를 나타내는 항으로 모델의 복잡도가 증가함에 따라 그 값이 증가한다. 따라, 베이지안 정보 기준은 우도와 모델 복잡도를 고려하여 최적의 모델을 찾게 된다. 이 때, 상기 log-우도는 아래의 수학식 9와 같이 구할 수 있다.
Figure pat00053
상기 수학식 9에서, Ni는 i번째 군집에 속하는 원소의 개수를 나타내며,Ci는 i번째 군집을 나타내고, uj
Figure pat00054
는 각각 원소 j가 속한 군집의 평균과 분산을 나타낸다.
군집화는 기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안-베이지안 확률 모델과 사용자간 유사도를 이용한다. 기대치 최대화 알고리즘은 k-평균 알고리즘이나 k-최근접이웃 알고리즘 보다 실제 군집의 중심을 정확하게 찾아낸다.
또한 기대치최대화 알고리즘은 원소가 속한 군집을 지역적으로 판단하는 k-평균 알고리즘과 달리 전역적으로 판단하기 때문에 원소가 속한 군집을 더욱 정확히 판별할 수 있다. 이는 인접한 군집들에 대한 원소의 군집 판별에서 더욱 명확히 드러난다. 세부 알고리즘은 아래와 같다.
초기화: 각 군집에 임의의 중심 Ci와 임의의 평균 Ui, 임의의 분산
Figure pat00055
부여한다.
While 군집 내부 편차의 평균이
Figure pat00056
이하일 때까지,
For j에 대하여,
For i에 대하여,
Figure pat00057
For Ci의 원소 xl에 대하여,
Figure pat00058
End For
Figure pat00059
가 최대가 되게 하는 Ci
Figure pat00060
의 군집으로 한다.
End For
변경된 모델에 따라, 각 군집의 Ci, Ui,
Figure pat00061
,
Figure pat00062
을 계산한다.
End For
End While
상기 수학식 10 및 상기 수학식 11이 포함된 상기와 같은 알고리즘에서, Ui는 i번째 군집
Figure pat00063
의 평균을,
Figure pat00064
는 군집의 중심을,
Figure pat00065
는 군집의 표준 편차를,
Figure pat00066
는 원소가 해당 군집에 속할 확률을 나타낸다. Rj는 원소 j의 선호도 벡터를 나타내며, Rj ,i는 원소 j의 i에 대한 선호도를 나타낸다.
상기 수학식 10은 가우시안-베이지안 확률 모델을 통해 원소
Figure pat00067
가 군집
Figure pat00068
에 속할 확률을 추청하는 과정이며, 이 수식의 결과 값인
Figure pat00069
는 위 확률의 근사치이다. 또한, 상기 수학식 11은 위 알고리즘에서 사용하는 기대치 최대화 알고리즘의 최대 우도 추정치를 구하는 과정으로
Figure pat00070
에 원소 xj와 군집
Figure pat00071
내부의 원소들 간의 유사도의 합을 곱하여 최대 우도 추정치로 사용한다.
이러한 방법을 사용하는 것은 정확도를 사용자 프로파일링 과정이나 아이템 특성 추출 과정에 의존하는 특성 벡터에 비해 사용자의 서비스 이용에 따라 지속적으로 정보를 축적하고 변화하는 선호도 정보가 원소의 특성을 더 정확히 표현할 수 있기 때문이다.
상기 사용자 피드백 예측부(130)는 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 기능을 수행한다.
도 3은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 사용자 피드백 예측부의 실시예를 설명하기 위한 도면이다. 도 4는 사용자 피드백 예측부의 구성인 유사 아이템 집합 생성부의 실시예를 설명하기 위한 도면이다. 도 5는 사용자 피드백 예측부의 구성인 유사 사용자 집합 생성부의 실시예를 설명하기 위한 도면이다.
도 3을 참조하여 설명하면, 상기 사용자 피드백 예측부(130)는, 유사 아이템 집합 생성부(131), 유사 사용자 집합 생성부(132) 및 피드백 예측부(133)를 포함하여 구성된다.
보다 구체적으로, 도 4를 참조하여 설명하면, 상기 유사 아이템 집합 생성부(131)는 아이템 유사도 데이터 생성부(131a), 유사 아이템 선택부(131b) 및 유사 아이템 기반 평가 점수 예측부(131c)를 포함하여 구성된다.
상기 아이템 유사도 데이터 생성부(131a)는 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 기능을 수행한다.
즉, 서로 다른 두 아이템 사이의 유사도를 계산하고 아이템 유사도에 관한 데이터(표)를 생성할 수 있는 것이다
이 때, 상기 아이템 유사도 데이터 생성부(131a)는 아래와 같은 수학식 12를 통하여 상기 아이템 간의 유사도에 대한 가중치를 산출할 수 있다.
Figure pat00072
상기 수학식 12에서 상기
Figure pat00073
는 상기 아이템 간의 유사도에 대한 가중치를 의미하고, 상기 i 및 상기 j는 각각 아이템을 의미하고, 상기 U는 상기 i 및 상기 j에 대하여 평가한 경험이 있는 사용자 집합을 의미하고, 상기
Figure pat00074
는 사용자 u의 아이템 i에 대한 평가이고, 상기
Figure pat00075
는 사용자 u의 아이템 j에 대한 평가이며, 상기
Figure pat00076
는 사용자 집합 U의 아이템 i에 대한 평가의 평균이며, 상기
Figure pat00077
는 사용자 집합 U의 아이템 j에 대한 평가의 평균을 의미한다.
본 명세서에서 평가 또는 평가 점수라는 의미는 사용자의 피드백에 대한 의미를 통칭하는 개념으로 이해되어야 한다.
또한, 상기 유사 아이템 선택부(131b)는, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 기능을 수행한다.
예컨대 만약 사용자a의 아이템 m에 대한 평가가 빠져 있는 경우에 있어서, 아이템 m과 가장 유사도가 높은 K개의 아이템을 상기 아이템 유사도 데이터를 기반으로 선택하게 되는 것이다.
상기 유사 아이템 기반 평가 점수 예측부(131c)는, 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 기능을 수행한다.
즉, 상기 유사 아이템 선택부(131b)에 의하여 선택된 유사 아이템의 평가 점수의 가중치 조합으로 누락된 아이템에 대한 평가 점수를 예측하는 것으로서 유사 아이템 기반의 예측 방법이다.
구체적으로, 상기 유사 아이템 기반 평가 점수 예측부(131c)는 아래와 같은 수학식 13을 통하여 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하게 된다.
Figure pat00078
상기 수학식 13에서, 상기
Figure pat00079
은 상기 누락된 상기 사용자 a의 아이템 m에 대한 평가 점수를 의미하고, 상기
Figure pat00080
는 상기 아이템 m과 아이템 k 간의 유사도에 대한 가중치를 의미하고, 상기
Figure pat00081
는 상기 사용자 a의 상기 아이템 k에 대한 평가를 의미한다.
상기 유사 사용자 집합 생성부(132)는, 상기 사용자와 유사한 사용자의 집합을 생성하는 기능을 수행한다.
도 5를 참조하면, 상기 유사 사용자 집합 생성부(132)는, 사용자 유사도 데이터 생성부(132a), 유사 사용자 선택부(132b) 및 유사 사용자 기반 평가 점수 예측부(132c)을 포함하여 구성된다.
구체적으로, 상기 사용자 유사도 데이터 생성부(132a)는 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 기능을 수행한다. 즉, 서로 다른 두 사용자 사이의 유사도를 계산하고 아이템 유사도에 관한 데이터(표)를 생성할 수 있는 것이다.
이 때, 상기 사용자 유사도 데이터 생성부(132a)는 아래와 같은 수학식 14를 통하여 상기 사용자 간의 유사도에 대한 가중치를 산출할 수 있다.
Figure pat00082
상기 수학식 14에서, 상기
Figure pat00083
는 상기 사용자 간의 유사도에 대한 가중치를 의미하고, 상기 a 및 상기 u는 각각 사용자를 의미하고, 상기 I는 사용자 a와 사용자 u 모두에 의해 평가된 이력이 있는 아이템들의 집합을 의미하고, 상기
Figure pat00084
는 사용자 u의 아이템 i에 대한 평가이며, 상기
Figure pat00085
는 사용자 a의 아이템 i에 대한 평가이며,
Figure pat00086
는 사용자 a의 아이템 집합 I에 대한 평가의 평균이며,
Figure pat00087
는 사용자 u의 아이템 집합 I에 대한 평가의 평균을 의미한다.
또한, 상기 유사 사용자 선택부(132b)는 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 기능을 수행한다.
예컨대 사용자 a의 아이템 m에 대한 평가가 빠져있는 경우에 있어서, 사용자 a와 가장 유사도가 높은 K개의 사용자를 상기 사용자 유사도 데이터를 기반으로 선택하게 되는 것이다.
상기 유사 사용자 기반 평가 점수 예측부(132c)는, 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 기능을 수행한다.
즉, 상기 유사 사용자 선택부(132b)에 의하여 선택된 유사 사용자의 평가 점수의 가중치 조합으로 누락된 아이템에 대한 평가 점수를 예측하는 것으로서 유사 사용자 기반의 예측 방법이다.
구체적으로, 상기 유사 사용자 기반 평가 점수 예측부(132c)는 아래와 같은 수학식 4를 통하여 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하게 된다.
Figure pat00088
상기 수학식 15에서, 상기
Figure pat00089
은 상기 누락된 상기 사용자 a의 아이템 m에 대한 평가 점수를 의미하고, 상기
Figure pat00090
는 상기 사용자 a와 사용자 k 간의 유사도에 대한 가중치를 의미하고, 상기
Figure pat00091
는 상기 사용자 k의 상기 아이템 m에 대한 평가를 의미하고, 상기
Figure pat00092
는 사용자 a의 아이템 집합 I에 대한 평가의 평균을 의미한다.
상기 피드백 예측부(133)는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 기능을 수행한다.
구체적으로, 상기 피드백 예측부(133)에서는 아래의 수학식 16을 통하여 상기 사용자의 특정 아이템에 대한 최종적인 피드백을 예측할 수 있게 된다.
Figure pat00093
상기 수학식 16에서, 상기
Figure pat00094
는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
Figure pat00095
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
Figure pat00096
는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
Figure pat00097
는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미한다.
이 때, 상기
Figure pat00098
는, 아래의 수학식 17을 통하여 산출할 수 있다.
Figure pat00099
상기 수학식 17에서, 상기
Figure pat00100
는 사용자 a에 대한 유사 사용자 집합을 의미하고, 상기
Figure pat00101
는 아이템 m에 대한 유사 아이템 집합을 의미하고, 상기
Figure pat00102
는 상기 유사 사용자 집합의 표준 편차를 의미하고, 상기
Figure pat00103
는 상기 유사 아이템 집합의 표준 편차를 의미한다.
결과적으로, 사용자 a가 속한 군집을
Figure pat00104
, 콘텐츠
Figure pat00105
이 속한 군집을
Figure pat00106
이라고 할 때, 사용자 a의 콘텐츠 m에 대한 선호도의 예측은 아래의 수학식 18과 같이 정리될 수 있다.
Figure pat00107
상기 수학식 18에서
Figure pat00108
Figure pat00109
은 각각 사용자 a와 n의, 아이템 m과 l의 유사도 가중치를 의미하며, 상기 수학식 12와 상기 수학식 14를 통하여 구할 수 있다.
사용자 피드백을 예측하는 방법과 관련하여, 종래의 기술로는 유사 아이템 또는 유사 사용자 중 하나만을 채택하여 누락된 사용자의 아이템에 대한 평가를 예측하거나, 유사 아이템 및 유사 사용자 모두를 기반으로 하여 누락된 사용자의 아이템에 대한 평가를 하되, 기정해진 가중치로 획일적으로 병합하는 기술이었는바 신뢰도가 떨어지는 문제가 있었다.
다만, 본 발명에서는 상기 살펴본 바와 같이 유사 아이템 및 유사 사용자 기반에 있어서 신뢰도를 기반으로 산정되는 서로 다른 가중치를 부여하여 조합함으로써 보다 정확하고 신뢰성이 있는 아이템 평가 예측을 수행할 수 있는 것이다.
상기 콘텐츠 추천부(140)는 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 기능을 수행한다.
도 6은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치의 콘텐츠 추천부의 실시예를 설명하기 위한 도면이다. 도 9는 사용자 프로파일의 실시예를 설명하기 위한 도면이다. 도 10은 이용 내역의 실시예를 설명하기 위한 도면이다. 도 11은 콘텐츠 특성의 실시예를 설명하기 위한 도면이다.
도 6을 참조하여 설명하면, 상기 콘텐츠 추천부(140)는 규칙 기반 필터링 추천부(141) 및 하이브리드 필터링 추천부(142)를 포함하여 구성될 수 있다.
보다 구체적으로, 상기 규칙 기반 필터링 추천부(141)는 사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 기능을 수행한다.
또한, 상기 하이브리드 필터링 추천부(142)는 상기 사용자 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 기능을 수행한다.
상기 콘텐츠 추천부(140)에서의 알고리즘은 아래의 표2와 같다.
사용자
Figure pat00110
가 속한 군집을
Figure pat00111
, 콘텐츠 군집의 배열을
Figure pat00112
,
Figure pat00113
Figure pat00114
번째 원소를
Figure pat00115
, 추천할 콘텐츠의 배열을
Figure pat00116
라고 할 때,
Figure pat00117
Figure pat00118
에 따라 내림차순으로 정렬한다.
For
Figure pat00119
에 대하여,
For
Figure pat00120
에 대하여, 1부터
Figure pat00121
까지,
If
Figure pat00122
가 누락되었을 경우,
Figure pat00123

End If
If
Figure pat00124
보다
Figure pat00125
가 클 경우,
Figure pat00126
에 콘텐츠
Figure pat00127
추가.
End If
If
Figure pat00128
Figure pat00129
개의 콘텐츠가 추가된 경우,
For문 종료.
End If
End For
End For
Figure pat00130
을 사용자
Figure pat00131
의 각 콘텐츠에 대한 선호도에 따라, 내림차순으로 정렬.
상기 규칙 기반 필터링 추천부(141)와 관련하여 본 발명에서의 규칙 기반 필터링 추천 기법은 연구의 실험 및 검증을 위해 사용자 프로파일과 이용 내역 및 콘텐츠 특성은 도 9 내지 도 11에 도시된 바와 같다.
구체적으로, 사용자 프로파일은 사용자의 인구통계학적 정보와 콘텐츠의 각 요소에 대한 선호도를 포함하고 있으며 이용내역은 콘텐츠 이용 당시 사용자의 상황정보와 콘텐츠에 대한 피드백을 포함하고 있고, 콘텐츠 특성은 콘텐츠의 요소를 추정할 수 있는 정보들과 그 외 다양한 정보들을 포함하고 있다.
또한, 상기 하이브리드 필터링 추천부(142)는 상기 설명한 바와 같이 기술한 학습하는 협업 필터링 추천 기법과 규칙 기반 추천 기법을 통합한 사용자 프로파일과 상황 정보를 이용하게 된다.
이러한 기술은 학습하는 협업 필터링 추천 기법을 통해 생성된 추천 콘텐츠 리스트에 규칙 기반 필터링 추천 기법을 적용하여 사용자의 상황 정보를 반영한다.
이와 같은 과정은 사용자에게 맞춤화된 서비스를 요구하는 모바일 환경에서 추천 시스템이 사용자의 상황 변화에 더 능동적으로 대처할 수 있도록 한다. 또한, 시스템의 부하를 줄이기 위해 유사 사용자 군집 대신 사용자 프로파일을 기반으로 한 사용자 군집을 이용함으로써 생기는 추천 신뢰도의 저하를 보완할 수 있다.
이하, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법의 실험 및 검증에 대하여 설명하도록 한다.
본 발명의 실험 및 검증은 다음 두 가지 기준을 통해 이루어진다. 첫째는 추천 시스템의 성능 평가를 위해 가장 많이 사용되는
Figure pat00132
[J. L. Herlocker, J. A. Konstan, L. G. Terveen, and J. T. Riedl, "Evaluating collaborative filtering recommender systems," ACM Transactions on Information Systems, Vol.22, No.1, 2004 pp. 5-53.], [K. Goldberg, T. Roeder, D. Gupta, and C. Perkins, "Eigentaste: a constant time collaborative filtering algorithm," Information Retrieval, Vol.4, No.2, 2001, pp. 133-151]방법이다.
이 측정법은 예측한 순위와 실제 순위의 차이를 보여준다. 둘째는 응답 시간이다. 이는 추천 서비스 규모의 변화에 따른 시스템 부하의 변화를 보여준다.
Figure pat00133
를 구하는 방법은 아래의 수학식 19와 같다.
[수학식 19]
Figure pat00134
상기 수학식 19에서,N은 예측한 콘텐츠의 개수이고, pi는 i번째 콘텐츠의 예측한 순위, ri는 i번째 콘텐츠의 실제 순위이다.
실험은 다음과 같은 환경에서 진행되었다. 서버는 Windows 7기반의 Apache Tomcat 7.0을 사용하였으며, 데이터베이스는 MySQL5.5를 사용하였다. 서버 측 통합개발환경은 VisualStudio 2010를 사용하였으며, 사용된 서버 측 언어는 VC++이고, 클라이언트는 안드로이드 응용프로그램으로 구현되었고, 클라이언트 측 통합개발환경은 Eclipse Indigo, 개발언어는 Android SDK를 이용한 JAVA이다.
실험 데이터는 다음과 같다. 콘텐츠의 경우, 종로구 인근의 100여 개의 문화재, 관광지, 레저 콘텐츠를 이용하였고, 사용자 프로파일의 경우, 실험에 참여한 사용자들이 직접 입력하였다.
콘텐츠 제공 및 추천 방법은 다음과 같다. 콘텐츠는 사용자가 지정한 거리 내의 인근 콘텐츠를 사용자의 프로파일과, 상황정보에 따라 추천하여 지도상에 표시해주거나, 증강현실, 리스트의 형태를 통해 제공하였다. 사용자는 콘텐츠를 사용하기 위해 선택하며, 콘텐츠에 대한 자세한 정보를 볼 수 있고, 콘텐츠의 이용이 끝나면 0점에서 10점까지의 점수를 입력하여, 이용한 콘텐츠에 대해 평가한다.
실험은 [Kyusik Park, Jongmoo Choi, and Donghee Lee, "A Single-Scaled Hybrid Filtering Method for IPTV Program Recommendation," 2010], [Yong Kim and Sung-Been Moon, "A Study on Hybrid Recommendation System Based on Usage frequency for Multimedia Contents," Journal of the Korean society for information management, Vol.23 No.3, 2006, pp.91-125], [Yan Shen, Hak-Chul Shin, Daegi Kim, Yo-Hoon Hong, and Phill-Kyu Rhee, "Reinforcement Learning Algorithm Based Hybrid Filtering Image Recommender System," The journal of the Institute of Internet Broadcasting and Communication, Vol.12, No.3, 2012, pp. 75-81]에서 각기 제안하고 검증한 추천 기법들을 본 연구에서 제안한 추천 기법과 같은 환경에서 구현하여
Figure pat00135
와 응답 시간을 비교하는 방식으로 진행되었다. 도 12 및 도 13은 각 기법을 적용한 추천 시스템에서 사용자 수의 변화에 따른
Figure pat00136
와 응답 시간의 변화를 나타낸 그래프이다. 본 연구에서 제안하는 하이브리드 필터링 추천 기법은 PHFPC(user Preference based Hybrid Filtering recommendation technique using user Profile and Context information)라 표기한다.
도 12을 참조하면 사용자 수가 늘어날수록 점차 추천 성능이 높아지는 것을 볼 수 있으며, 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 추천 시스템의 경우 서비스 규모 변화에 비해 비교적 안정적인 성능을 보이는 것을 알 수 있다.
또한, 도 13을 보면, 다른 추천 기법들을 사용한 시스템의 경우 사용자 수의 증가에 따라 시스템의 응답 시간이 급격히 증가하는 것을 볼 수 있지만, 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 추천 시스템의 경우 사용자 수의 증가에도 확연히 안정적인 응답 시간을 보여주고 있음을 알 수 있다.
상기 살펴본 바와 같이 본 발명에 따른 연구에서는 서비스의 규모 변화에도 안정적인 성능을 보이는 추천 시스템을 구현하기 위하여, 학습하는 협업 필터링 추천 기법과 여기에 상황 정보를 반영하기 위한 기법을 제안하여 구현하였으며, 이를 실제 문화재, 관광지, 레저 콘텐츠 추천 시스템에 적용하여 그 성능을 평가함으로서 시스템의 유효성을 검증하였다.
제안하는 하이브리드 추천 시스템은 협업 필터링 추천 기법에서 나타나는 서비스 대규모화에 따른 시스템 부하 증가를 해결하기 위하여 사용자 프로파일과 콘텐츠 특성 정보를 이용하고 사용자와 콘텐츠 각각을 군집화하였다.
또한 이로 인해 저하되는 추천 시스템의 성능을 제고하기 위하여 사용자 선호도 예측 기법을 사용하였고 사용자의 피드백을 사용자와 콘텐츠 특성 벡터에 적용하였다. 또한 협업 필터링의 고질적인 문제인 초기 평가 문제와 초기 이용자 문제를 해결하기 위하여, 규칙 기반 필터링 기법을 이용하였다.
평균 절대 오차(
Figure pat00137
)를 이용한 추천 정확도 실험은 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 추천 시스템의 우수성을 나타내고 있다.
이하, 본 발명에 따른 이하, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에 대하여 설명하도록 한다. 상기 살펴본 바와 같이 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치와 중복되는 기술 내용에 대한 설명은 생략하도록 한다. 도 14는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법의 플로우챠트이다. 도 15는 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 군집을 생성하는 과정의 실시예를 설명하기 위한 도면이다. 도 16은 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법에서 사용자 피드백을 예측하는 과정의 실시예를 설명하기 위한 도면이다.
도 14를 참조하면, 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법은, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리(S100)하고, 사용자의 특석 벡터 및 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성한다(S110). 이 후, 사용자 군집 및 콘텐츠 군집을 기반으로 사용자의 피드백을 예측한다(S120). 그리고, 사용자의 피드백, 사용자 군집 및 콘텐츠 군집을 기반으로 콘텐츠를 추천(S130)함으로써 종료된다.
도 15를 참조하여 설명하면, 상기 S110 단계는, 군집수 결정 단계(S111), 군집화 수행 단계(S112) 및 군집 간 선호도 추정 단계(S113)를 포함한다.
또한, 도 16을 참조하여 설명하면, 상기 S120 단계는, 유사 아이템 집합 생성 단계(S121), 유사 사용자 집합 생성 단계(S122) 및 피드백 예측 단계(S123)를 포함한다.
이상에서와 같이 본 발명에 따른 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치(100) 및 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
100: 하이브리드 필터링 콘텐츠 추천 장치
110: 특성 벡터 관리 생성부
120: 군집 생성부
130: 사용자 피드백 예측부
140: 콘텐츠 추천부

Claims (24)

  1. 콘텐츠를 추천하는 장치에 있어서,
    사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성부;
    상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성부;
    상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측부; 및
    상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  2. 청구항 1에 있어서,
    상기 특성 벡터 관리 생성부는,
    상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  3. 청구항 1에 있어서,
    상기 군집 생성부는,
    군집의 수를 결정하는 군집 수 결정부;
    군집화를 수행하는 군집화 수행부; 및
    군집 간의 선호도를 추정하는 군집 간 선호도 추정부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  4. 청구항 3에 있어서,
    상기 군집 수 결정부는,
    베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  5. 청구항 3에 있어서,
    상기 군집화 수행부는,
    기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  6. 청구항 3에 있어서,
    상기 군집 간 선호도 추정부는,
    상기 사용자 군집의 원소의 사용자 군집에 대한 우도와,
    상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와,
    상기 사용자 군집의 원소와 상기 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  7. 청구항 1에 있어서,
    상기 사용자 피드백 예측부는,
    특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성부;
    상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성부; 및
    상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  8. 청구항 7에 있어서,
    상기 유사 아이템 집합 생성부는,
    아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성부;
    상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택부; 및
    선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  9. 청구항 7에 있어서,
    상기 유사 사용자 집합 생성부는,
    사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성부;
    상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부; 및
    선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  10. 청구항 7에 있어서,
    상기 피드백 예측부는,
    Figure pat00138
    을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되,
    상기
    Figure pat00139
    는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
    Figure pat00140
    는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
    Figure pat00141
    는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
    Figure pat00142
    는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  11. 청구항 1에 있어서,
    상기 콘텐츠 추천부는,
    사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천부를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  12. 청구항 11에 있어서,
    상기 콘텐츠 추천부는,
    상기 사용자 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천부를 더 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치.
  13. 콘텐츠를 추천하는 방법에 있어서,
    특성 벡터 관리 생성부에 의하여, 사용자의 특성 벡터 및 콘텐츠의 특성 벡터를 학습시키고 관리하는 특성 벡터 관리 생성 단계;
    군집 생성부에 의하여, 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 기반으로 사용자 군집 및 콘텐츠 군집을 생성하는 군집 생성 단계;
    사용자 피드백 예측부에 의하여, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 사용자의 피드백을 예측하는 사용자 피드백 예측 단계; 및
    콘텐츠 추천부에 의하여, 상기 사용자의 피드백, 상기 사용자 군집 및 상기 콘텐츠 군집을 기반으로 콘텐츠를 추천하는 콘텐츠 추천 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  14. 청구항 13에 있어서,
    상기 특성 벡터 관리 생성 단계는,
    상기 사용자의 피드백을 반영하여 상기 사용자의 특성 벡터 및 상기 콘텐츠의 특성 벡터를 업데이트 하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  15. 청구항 13에 있어서,
    상기 군집 생성 단계는,
    군집 수 결정부에 의하여, 군집의 수를 결정하는 군집 수 결정 단계;
    군집화 수행부에 의하여, 군집화를 수행하는 군집화 수행 단계; 및
    선호도 추정부에 의하여, 군집 간의 선호도를 추정하는 군집 간 선호도 추정 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  16. 청구항 15에 있어서,
    상기 군집 수 결정 단계는,
    베이지안 정보 기준(Bayesian Information Criterion)을 기반으로 군집의 수를 결정하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  17. 청구항 15에 있어서,
    상기 군집화 수행 단계는,
    기대치 최대화 알고리즘(EM;Expectation Maximization)을 기반으로 가우시안 베이지안 혼합 확률 모델과 상기 군집의 원소 간 유사도를 이용하여 군집화를 수행하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  18. 청구항 15에 있어서,
    상기 군집 간 선호도 추정 단계는,
    상기 사용자 군집의 원소의 사용자 군집에 대한 우도와,
    상기 콘텐츠 군집의 원소의 콘텐츠 군집에 대한 우도와,
    상기 사용자 군집의 원소와 상기 콘텐츠 군집의 원소 간의 선호도를 곱한 값의 총합으로 상기 사용자 군집의 콘텐츠 군집에 대한 선호도를 산출하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  19. 청구항 13에 있어서,
    상기 사용자 피드백 예측 단계는,
    유사 아이템 집합 생성부에 의하여, 특정 아이템과 유사한 유사 아이템의 집합을 생성하는 유사 아이템 집합 생성 단계;
    유사 사용자 집합 생성부에 의하여, 상기 사용자와 유사한 유사 사용자의 집합을 생성하는 유사 사용자 집합 생성 단계; 및
    피드백 예측부에 의하여, 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수와, 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수에 가중치를 부여하여 조합함으로써 상기 사용자의 특정 아이템에 대한 피드백을 예측하는 피드백 예측 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  20. 청구항 19에 있어서,
    상기 유사 아이템 집합 생성부는,
    아이템 유사도 데이터 생성부에 의하여, 아이템 간의 유사도를 기반으로 아이템 유사도 데이터를 생성하는 아이템 유사도 데이터 생성 단계;
    유사 아이템 선택부에 의하여, 상기 특정 아이템의 이웃들을 대표하기 위한 K개의 유사 아이템을 선택하는 유사 아이템 선택 단계; 및
    유사 아이템 기반 평가 점수 예측부에 의하여, 선택된 유사 아이템의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 아이템 기반 평가 점수를 예측하는 유사 아이템 기반 평가 점수 예측 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  21. 청구항 19에 있어서,
    상기 유사 사용자 집합 생성 단계는,
    사용자 유사도 데이터 생성부에 의하여, 사용자 간의 유사도를 기반으로 사용자 유사도 데이터를 생성하는 사용자 유사도 데이터 생성 단계;
    유사 사용자 선택부에 의하여, 상기 사용자의 이웃들을 대표하기 위한 K개의 유사 사용자를 선택하는 유사 사용자 선택부; 및
    유사 사용자 기반 평가 점수 예측부에 의하여, 선택된 유사 사용자의 평가 점수의 가중치 조합을 기반으로 누락된 평가 점수인 유사 사용자 기반 평가 점수를 예측하는 유사 사용자 기반 평가 점수 예측 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  22. 청구항 19에 있어서,
    상기 피드백 예측 단계는,
    Figure pat00143
    을 통하여 상기 사용자의 특정 아이템에 대한 피드백을 예측하되,
    상기
    Figure pat00144
    는 상기 사용자의 특정 아이템에 대한 피드백을 의미하고, 상기
    Figure pat00145
    는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
    Figure pat00146
    는 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수를 의미하고, 상기
    Figure pat00147
    는 상기 유사 사용자의 집합을 기반으로 산출된 평가 점수와 상기 유사 아이템의 집합을 기반으로 산출된 평가 점수의 가중치를 의미하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  23. 청구항 13에 있어서,
    상기 콘텐츠 추천 단계는,
    사용자 프로파일과 이용 내역 및 콘텐츠 특성 간의 관계를 기반으로 콘텐츠를 추천하는 규칙 기반 필터링 추천 단계를 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
  24. 청구항 23에 있어서,
    상기 콘텐츠 추천 단계는,
    상기 사용자 프로파일과 상황 정보를 기반으로 콘텐츠를 추천하는 하이브리드 필터링 추천 단계를 더 포함하는 것을 특징으로 하는 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 방법.
KR1020140027866A 2014-03-10 2014-03-10 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법 KR101573601B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140027866A KR101573601B1 (ko) 2014-03-10 2014-03-10 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140027866A KR101573601B1 (ko) 2014-03-10 2014-03-10 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20150105830A true KR20150105830A (ko) 2015-09-18
KR101573601B1 KR101573601B1 (ko) 2015-12-04

Family

ID=54244929

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140027866A KR101573601B1 (ko) 2014-03-10 2014-03-10 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101573601B1 (ko)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101963609B1 (ko) * 2018-12-11 2019-07-31 주식회사 마블릭 잠재 변수에 기반하여 사용자의 입맛을 판정하는 장치 및 방법
WO2019151620A1 (ko) * 2018-01-30 2019-08-08 (주)스마일게이트스토브 컨텐츠 정보 제공 장치 및 그 방법
KR20190101718A (ko) * 2018-02-23 2019-09-02 국민대학교산학협력단 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체
KR20190131906A (ko) * 2018-05-18 2019-11-27 한양대학교 산학협력단 표준화된 평점 기반의 아이템 추천 방법 및 장치
KR20200048014A (ko) * 2018-10-29 2020-05-08 세종대학교산학협력단 이동 단말기를 이용한 셋톱박스 사용자 인증과 실제 사용자에게 콘텐츠를 추천하는 시스템 및 방법
KR20200122652A (ko) * 2019-04-18 2020-10-28 주식회사 퍼피팝 영양 성분 프로파일링 기반 사료추천 시스템
KR102180271B1 (ko) * 2020-03-30 2020-11-18 비에이비 주식회사 사용자 활동이력 기반 협업 필터링을 통한 공모전 추천 시스템 및 방법
WO2021049921A1 (en) * 2019-09-12 2021-03-18 Samsung Electronics Co., Ltd. Method, apparatus, electronic device and storage medium for predicting user attribute
CN112785331A (zh) * 2021-01-07 2021-05-11 之江实验室 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统
CN112818238A (zh) * 2021-02-08 2021-05-18 南京邮电大学 一种自适应在线推荐方法及系统
KR20210066674A (ko) * 2019-11-28 2021-06-07 고려대학교 산학협력단 구성원 속성 및 피드백 데이터 기반의 협업 필터링을 통한 조합형 식단 추천 시스템 및 방법
WO2021149890A1 (ko) * 2020-01-23 2021-07-29 삼성전자 주식회사 사용자의 개인 모델을 학습하는 전자 장치 및 그 동작 방법
KR102405828B1 (ko) * 2021-12-03 2022-06-07 주식회사 대교씨엔에스 가우시안 혼합 모델을 이용한 클러스터링과 인공지능을 동시에 활용한 학습량 추천 방법 및 장치
KR102410981B1 (ko) * 2021-03-22 2022-06-22 토이푸딩 주식회사 사용자 반응 정보 기반 인공지능 컨텐츠 추천 큐레이션 시스템
WO2023017942A1 (ko) * 2021-08-11 2023-02-16 삼성전자 주식회사 아이템을 사용자에게 추천하기 위한 전자 장치 및 방법
KR102607449B1 (ko) * 2023-04-10 2023-11-29 주식회사 에이팜건강 개별인정형 원료를 포함하는 건강기능식품의 맞춤형 추천 방법 및 장치
KR102617823B1 (ko) * 2022-09-02 2023-12-27 우송대학교 산학협력단 철도 인프라 bim 교육 컨텐츠 추천 시스템
KR20240039477A (ko) * 2022-09-19 2024-03-26 중앙대학교 산학협력단 개인 맞춤형 추천 장치 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102225795B1 (ko) 2019-05-29 2021-03-10 호서대학교 산학협력단 심층신경망 기반 데이터 보충과 영향요소 결합을 통한 하이브리드 추천 시스템 및 방법
CN111694971A (zh) * 2020-06-10 2020-09-22 三星电子(中国)研发中心 一种内容的推荐方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7937725B1 (en) 2000-07-27 2011-05-03 Koninklijke Philips Electronics N.V. Three-way media recommendation method and system
JP2013109734A (ja) 2011-11-24 2013-06-06 Canon Inc 文書検索装置、文書検索方法及びプログラム

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019151620A1 (ko) * 2018-01-30 2019-08-08 (주)스마일게이트스토브 컨텐츠 정보 제공 장치 및 그 방법
KR20190101718A (ko) * 2018-02-23 2019-09-02 국민대학교산학협력단 사용자 리뷰 기반 평점 재산정 장치 및 방법, 이를 기록한 기록매체
KR20190131906A (ko) * 2018-05-18 2019-11-27 한양대학교 산학협력단 표준화된 평점 기반의 아이템 추천 방법 및 장치
KR20200048014A (ko) * 2018-10-29 2020-05-08 세종대학교산학협력단 이동 단말기를 이용한 셋톱박스 사용자 인증과 실제 사용자에게 콘텐츠를 추천하는 시스템 및 방법
KR101963609B1 (ko) * 2018-12-11 2019-07-31 주식회사 마블릭 잠재 변수에 기반하여 사용자의 입맛을 판정하는 장치 및 방법
KR20200122652A (ko) * 2019-04-18 2020-10-28 주식회사 퍼피팝 영양 성분 프로파일링 기반 사료추천 시스템
WO2021049921A1 (en) * 2019-09-12 2021-03-18 Samsung Electronics Co., Ltd. Method, apparatus, electronic device and storage medium for predicting user attribute
US11694059B2 (en) 2019-09-12 2023-07-04 Samsung Electronics Co., Ltd. Method, apparatus, electronic device and storage medium for predicting user attribute
KR20210066674A (ko) * 2019-11-28 2021-06-07 고려대학교 산학협력단 구성원 속성 및 피드백 데이터 기반의 협업 필터링을 통한 조합형 식단 추천 시스템 및 방법
WO2021149890A1 (ko) * 2020-01-23 2021-07-29 삼성전자 주식회사 사용자의 개인 모델을 학습하는 전자 장치 및 그 동작 방법
KR102180271B1 (ko) * 2020-03-30 2020-11-18 비에이비 주식회사 사용자 활동이력 기반 협업 필터링을 통한 공모전 추천 시스템 및 방법
CN112785331A (zh) * 2021-01-07 2021-05-11 之江实验室 一种结合评价文本的抗注入攻击的鲁棒推荐方法和系统
CN112818238A (zh) * 2021-02-08 2021-05-18 南京邮电大学 一种自适应在线推荐方法及系统
CN112818238B (zh) * 2021-02-08 2024-02-23 南京邮电大学 一种自适应在线推荐方法及系统
KR102429784B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 유사사용자그룹의 반응 관계를 기반으로 하는 큐레이션 시스템
KR102429786B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 사용자 정보의 유사도를 이용한 컨텐츠 추천 큐레이션 방법
KR102429781B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 상대 비중치 정보를 이용한 큐레이션 시스템
KR102429779B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 다차원 객체를 이용한 큐레이션 시스템
KR102429789B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 유사사용자그룹의 반응 관계를 기반으로 하는 큐레이션 방법
KR102429780B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 아이템반응객체를 이용한 컨텐츠 추천 큐레이션 시스템
KR102429776B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 사용자 정보의 유사도를 이용한 컨텐츠 추천 큐레이션 시스템
KR102429788B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 아이템반응객체를 이용한 컨텐츠 추천 큐레이션 방법
KR102429777B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 컨텐츠 추천 및 제공을 위한 큐레이션 시스템
KR102429778B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 사용자 맞춤형 인공지능 추천 큐레이션 시스템
KR102429787B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 다차원 객체를 이용한 큐레이션 방법
KR102429952B1 (ko) * 2021-03-22 2022-08-05 토이푸딩 주식회사 다차원 객체를 이용한 아이템추천풀 큐레이션 시스템
KR102410981B1 (ko) * 2021-03-22 2022-06-22 토이푸딩 주식회사 사용자 반응 정보 기반 인공지능 컨텐츠 추천 큐레이션 시스템
WO2023017942A1 (ko) * 2021-08-11 2023-02-16 삼성전자 주식회사 아이템을 사용자에게 추천하기 위한 전자 장치 및 방법
KR20230101668A (ko) * 2021-12-03 2023-07-06 (주)대교씨엔에스 K-평균 알고리즘을 이용한 클러스터링과 인공지능을 동시에 활용한 학습량 추천 방법 및 장치
KR102405828B1 (ko) * 2021-12-03 2022-06-07 주식회사 대교씨엔에스 가우시안 혼합 모델을 이용한 클러스터링과 인공지능을 동시에 활용한 학습량 추천 방법 및 장치
KR102617823B1 (ko) * 2022-09-02 2023-12-27 우송대학교 산학협력단 철도 인프라 bim 교육 컨텐츠 추천 시스템
KR20240039477A (ko) * 2022-09-19 2024-03-26 중앙대학교 산학협력단 개인 맞춤형 추천 장치 및 방법
KR102607449B1 (ko) * 2023-04-10 2023-11-29 주식회사 에이팜건강 개별인정형 원료를 포함하는 건강기능식품의 맞춤형 추천 방법 및 장치

Also Published As

Publication number Publication date
KR101573601B1 (ko) 2015-12-04

Similar Documents

Publication Publication Date Title
KR101573601B1 (ko) 사용자 프로파일과 상황 정보를 이용한 선호도 기반 하이브리드 필터링 콘텐츠 추천 장치 및 방법
US8572017B2 (en) User-based collaborative filtering recommendation system and method for amending similarity using information entropy
Bakshi et al. Enhancing scalability and accuracy of recommendation systems using unsupervised learning and particle swarm optimization
US20040172267A1 (en) Statistical personalized recommendation system
US20090210246A1 (en) Statistical personalized recommendation system
CN103473291A (zh) 一种基于隐语义概率模型的个性化服务推荐系统及方法
Huang et al. Cost-sensitive three-way recommendations by learning pair-wise preferences
JP2021508395A (ja) パーソナライズされた推奨を生成するために適合されたクライアント、サーバ、およびクライアント−サーバシステム
JPWO2010010654A1 (ja) 使い方推定装置
Cheng et al. Understanding the impact of individual users’ rating characteristics on the predictive accuracy of recommender systems
CN110059257B (zh) 基于评分修正的项目推荐方法
KR101507328B1 (ko) 협업 추천 시스템에서의 사용자 피드백 예측 장치 및 방법
KR102262118B1 (ko) 사용자 맞춤형 추천정보 제공장치 및 제공방법, 이를 실행시키기 위한 프로그램을 기록한 컴퓨터 해독 가능한 기록 매체
CN104462093B (zh) 个人推荐方案
Özsoy et al. Multi-objective optimization based location and social network aware recommendation
CN106055665B (zh) 基于异常值剔除的情境感知Web服务推荐方法和系统
JP2016103107A (ja) クラスタリング装置、情報端末、情報提示システム、及びプログラム
Zou et al. An effective collaborative filtering via enhanced similarity and probability interval prediction
CN117934126B (zh) 一种基于用户情感分析的个性化目标信息推荐系统
Chelliah et al. Location-Aware Collaborative Filtering for Web Service Recommendations Based on User and Service History.
Singh et al. Optimizing approach of recommendation system using web usage mining and social media for E-commerce
KR20190136941A (ko) 관측평점과 유사도 그래프를 활용한 추천 알고리즘의 평점 예측 방법
Ding et al. Exploiting long‐term and short‐term preferences and RFID trajectories in shop recommendation
KR101308279B1 (ko) 카테고리 전문가를 활용하는 추천 방법
Hong et al. A method to maintain item recommendation equality among equivalent items in recommender systems

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20181108

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190925

Year of fee payment: 5