KR101738809B1 - IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템 - Google Patents

IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템 Download PDF

Info

Publication number
KR101738809B1
KR101738809B1 KR1020160017414A KR20160017414A KR101738809B1 KR 101738809 B1 KR101738809 B1 KR 101738809B1 KR 1020160017414 A KR1020160017414 A KR 1020160017414A KR 20160017414 A KR20160017414 A KR 20160017414A KR 101738809 B1 KR101738809 B1 KR 101738809B1
Authority
KR
South Korea
Prior art keywords
item
user
matrix
sub
matrices
Prior art date
Application number
KR1020160017414A
Other languages
English (en)
Inventor
고인영
고한규
손주식
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020160017414A priority Critical patent/KR101738809B1/ko
Application granted granted Critical
Publication of KR101738809B1 publication Critical patent/KR101738809B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/30

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템이 제시된다. 다차원 매트릭스 지역화 방법은 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계, 상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계, 새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계, 및 상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계를 포함할 수 있다.

Description

IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템{Method and System for Multi Aspect Matrix Localization by Social Matching and Communication Service in Smart Home Community based on Internet of Things}
본 발명은 IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위해 개인화된 협업 필터링을 제공하는 다차원(또는 다관점) 매트릭스 지역화 방법 및 시스템에 관한 것이다.
스마트 폰(smart phone), 스마트 시계, 스마트 TV, 스마트 도어(door), 스마트 냉장고 등 컴퓨팅 및 네트워킹 능력을 가진 현실세계(physical world)의 기기들이 점차 증가함에 따라, 스마트 객체(smart object)들이 사람들의 편의를 위해 서로 소통하는 IoT(Internet of Things) 환경이 현실화되고 있다. IoT 기기 및 기반 기술이 사람들의 주거 환경에 접목되어 실현되는 스마트 홈 기술이 최근 각광받고 있다. 예컨대, 스마트 홈 기술은, 스마트 폰 하나로 집안의 모든 가전제품을 통제하고, 사용자의 요구에 맞게 자동으로 동작하게 만드는 기술을 일컫는다.
IoT 기반 스마트 홈 기술은 다양한 스마트 객체에서 생성되는 가족 구성원의 행동 데이터로부터 패턴 학습을 통해 사람들이 원하는 요구 사항에 대해 이해하고, 능동적으로 대처할 수 있게 하는 기술로서, 스마트 객체들을 통해 가능한 상호 작용 기회를 유연하고 적응적으로 제공하는 것을 지향하는 기술이다.
그러나, 스마트 객체의 종류와 수가 폭발적으로 증가함에 따라, 각각의 스마트 객체에 특화된 다양한 어플리케이션들(application)이 개발 및 배포되었으며, 기존의 웹 서비스 형태로 공개된 서비스들, 지식들과의 조합을 통해 제공 가능한 서비스의 수가 기하급수적으로 증가함에 따라, 사용자들이 자신의 필요나 요구사항에 알맞은 서비스를 찾아 선택하는 데, 복잡도가 높아지는 문제가 존재한다. 예를 들어, 웹(web)을 통해 사용자가 필요한 제품이나 컨텐츠를 구매하는 경우, 협업 필터링 기법을 이용한 추천 기술들이 이용되고 있다.
협업 필터링(CF: Collaborative Filtering) 기반의 추천 기법은 자신과 유사한 다른 사용자들의 선행 경험을 바탕으로 해당 사용자가 아직 소비하지 않은 제품이나 컨텐츠에 대한 기대값을 예측하는 방법으로서, 사용자의 관심사에 충실한 기법이다. 즉, 협업 필터링은 두 사용자가 동일한 항목 세트에 비슷한 관심을 보인 경우, 그들이 새로운 아이템 선택에 비슷한 관심 패턴을 표시할 수 있다는 가정에 기반하여 타겟 사용자들의 새로운 아이템에 대한 평가를 예측한다. 협업 필터링 기반의 추천 기법은 사용자와 아이템을 각각 행과 열로 하는 2차원 형태의 사용자-아이템 행렬에 1~5 스케일(scale)로 각각의 사용자에 의해 제품이나 컨텐츠에 부여된 선호도 정보를 바탕으로 유사한 선호도 부여 패턴을 가진 사용자들을 구별하여 사용자의 선호도 값을 예측하기 위해 이용된다. 예를 들어, Amazon.com 이나 Netflix 등의 웹 사이트들에서는 협업 필터링 기반의 추천 기법을 이용하여 컨텐츠나 제품 소비를 촉진시키고 있다.
그러나, IoT 기반의 스마트 홈 도메인(domain)에서의 서비스 제공은 사용자의 위치나 서비스 제공 시간, 함께 있는 다른 사용자들의 타입(type) 등에 따라 가변적이기 때문에 웹에서 원하는 제품이나 컨텐츠를 찾는 것과는 달리, 한 가지의 선호도 값만으로는 제품이나 컨텐츠에 대한 기대값을 예측하는 데 어려움이 존재한다. 즉, IoT 기반의 스마트 홈 도메인에서의 서비스는 서비스 종류와 도메인을 미리 결정할 수 없기 때문에, 기존의 협업 필터링 기반의 추천 기법 이외의 추천 기술이 필요하다. 예컨대, 사용자가 서비스를 수행했던 장소의 사회성 (예를 들어, 쇼핑센터, 회의실, 놀이동산 등), 해당 장소에서 사용자의 사회성(예를 들어, 고객, 발표자, 판매자 등), 서비스 수행 당시의 상황정보 (예를 들어, 평일, 공휴일, 일과시간, 휴식시간, 참석인원, 참석자들의 관계 등) 등과 같이, 사용자의 서비스 수행과 관련된 다양한 관점에서의 서비스 수행 이력을 수집하고 분석하여 서비스를 추천하는 기술이 요구된다.
하기의 비특허 문헌 [1] Manouselis N., Costopoulou C.: Experimental analysis of design choices in multiattribute utility collaborative filtering, International Journal of Pattern Recognition and Artificial Intelligence, 21(2) 311-331, (2007).은 사용자에 의해 입력된 다중 관점의 평가 피드백 정보를 활용하는 방법이 설명되어 있다. 이러한 다중 관점 협업 필터리 기반 추천 기법의 경우, 하나의 아이템(예컨대, 컨텐츠, 상품, 또는 제품 등)에 대해 하나 이상의 평가 피드백 정보를 사용자에게 요구함에 따라, 사용자 부담으로 인한 피드백 정보의 희소성 문제가 존재한다. 예를 들어, 사용자가 구매한 상품에 대해 여러 항목(색상, 모양, 크기, 가격 등) 별로 평가 피드백 정보를 요청함에 따라, 사용자가 귀찮아서 평가 피드백 정보를 입력하지 않아, 결국, 해당 아이템에 대한 평가 피드백 정보가 부족해지는 희소성 문제가 발생한다.
특히, 기존의 단일 평가 피드백 정보에 의존적인 협업 필터링 기반 추천 기법들 역시 피드백 정보의 희소성 문제로 인해 추천 정확도가 저하된다. 예를 들어, 협업 필터링 기반 추천 시스템의 대표적인 성공 사례인 Netflix의 경우 1.28%의 피드백 정보만이 존재하고, MovieLens의 경우 약 4%의 피드백 정보 만이 존재한다. 결국, Netflix, MovieLens 등에서 이용되는 단일 평가 피드백 정보가 둘 이상의 관점 피드백 정보로 확장될 경우, 차원의 저주(Curse of dimensionality)에 의해 데이터 희소성 문제가 더 심각해지게 된다.
따라서, 협업 필터링 기반 추천 기법을 이용함에 있어서, 데이터 희소성 문제를 해결하기 위한 기술이 요구된다.
[1] Manouselis N., Costopoulou C.: Experimental analysis of design choices in multiattribute utility collaborative filtering, International Journal of Pattern Recognition and Artificial Intelligence, 21(2) 311-331, (2007). [2] Saaty T. L.: Decision Making for Leaders: The Analytic Hierarchy Process for Decisions in a Complex World, Pittburgh, Pennsylvania: RWS Publications, (1999).
본 발명이 이루고자 하는 기술적 과제는 단일 또는 다중 관점 협업 필터링 기반의 추천 기법을 사용함에 있어서, 데이터 희소성 문제를 해결하기 위해 다차원매트릭스 지역화 방법 및 시스템을 제공하기 위한 것이다.
또한, 아이템의 외부 정보를 활용하여 사용자에 의해 직접적인 피드백 정보가 없는 관점들에 대한 사용자의 선호도를 암시적(implicitly)으로 예측하고, 예측된 결과를 평가 피드백 정보로 활용하기 위한 것이다.
또한, 추천될 아이템들의 외부 정보로서 아이템들의 의미적인 정보들을 활용하여 단일 평가 피드백 정보만 있는 데이터를 다중 관점으로 차원을 확장하고, 관점 별 평가 피드백 점수 대신 추출된 의미적 정보들로 대체함으로써, 사용자 별 의미적 정보들의 공통성에 기반하여 암시적인 방법으로 각 관점에 대한 사용자의 선호도를 예측하기 위한 것이다.
다차원 매트릭스 지역화 방법은, 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계, 상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계, 새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계, 및 상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계를 포함할 수 있다.
일측면에 따르면, 상기 의미적 컨셉 그룹을 아이템 별로 생성하는 단계는, 상기 아이템에 해당하는 도메인(domain)이 나타내는 정보들을 포함하는 링크 데이터(Linked Data)에 기초하여 상기 아이템이 속하는 키워드와 관련된 연관 키워드를 추출하고, 추출된 키워드를 그룹화하여 상기 의미적 컨셉 그룹을 생성할 수 있다.
다른 측면에 따르면, 상기 의미적 컨셉 그룹을 아이템 별로 생성하는 단계는, 상기 아이템에 해당하는 RFD(Resource Description Framework) 트리플(triple) 중 특성값(property value)을 연관 키워드로 추출할 수 있다.
또 다른 측면에 따르면, 상기 사용자-아이템 서브 행렬로 분할하는 단계는, 상기 사용자-아이템 행렬을 기정의된 아이템의 관점의 개수에 대응하는 개수의 사용자-아이템 서브 행렬들로 분할할 수 있다.
또 다른 측면에 따르면, 상기 사용자-아이템 서브 행렬로 분할하는 단계는, 상기 아이템 별로 생성된 의미적 컨셉 그룹을 대상으로, 각 컨셉 그룹에 속하는 연관 키워드들 중 공통되는 연관 키워드의 수에 기초하여 관점 별 유사도를 계산하고, 계산된 관점 별 유사도에 기초하여 상기 사용자-아이템 행렬을 사용자-아이템 서브 행렬로 분할할 수 있다.
또 다른 측면에 따르면, 상기 사용자-아이템 서브 행렬로 분할하는 단계는, 상기 복수의 사용자들 중에서 대표 사용자를 결정하고, 결정된 대표 사용자와 각 사용자 간의 사용자 선호도를 관점 별로 계산하고, 계산된 사용자 선호도와 기정의된 기준 선호도에 기초하여 관점 별로 연관성을 가진 사용자들로 구성된 사용자 그룹들을 생성하는 사용자 그룹핑을 수행할 수 있다.
또 다른 측면에 따르면, 상기 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계는, 상기 복수의 사용자-아이템 서브 행렬을 대상으로 불완전 특이값 분해(Incomplete Singular Value Decomposition)를 수행함으로써, 상기 매트릭스 완성을 수행할 수 있다.
또 다른 측면에 따르면, 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계는, 사용자가 속하는 서브 행렬의 수에 따라 관점 별로 생성된 예측 결과에 서로 다른 가중치를 부여함으로써, 상기 평가 피드백 정보를 예측할 수 있다.
또 다른 측면에 따르면, 상기 가중치는, 계층분석기법(AHP, Analytic Hierarchy Process) 기반의 대응 비교를 이용하여 상기 관점 별로 계산될 수 있다.
복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 컨셉 그룹 생성부;
다차원 매트릭스 지역화 시스템은, 상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 서브 행렬 분할부, 새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 매트릭스 완성 수행부, 및 상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 평가 피드백 정보 예측부를 포함할 수 있다.
일측면에 따르면, 상기 컨셉 그룹 생성부는, 상기 아이템에 해당하는 도메인(domain)이 나타내는 정보들을 포함하는 링크 데이터(Linked Data)에 기초하여 상기 아이템이 속하는 키워드와 관련된 연관 키워드를 추출하고, 추출된 키워드를 그룹화하여 상기 의미적 컨셉 그룹을 생성할 수 있다.
다른 측면에 따르면, 상기 컨셉 그룹 생성부는, 상기 아이템에 해당하는 RFD(Resource Description Framework) 트리플(triple) 중 특성값(property value)을 연관 키워드로 추출할 수 있다.
또 다른 측면에 따르면, 상기 서브 행렬 분할부는, 상기 사용자-아이템 행렬을 기정의된 아이템의 관점의 개수에 대응하는 개수의 사용자-아이템 서브 행렬들로 분할할 수 있다.
또 다른 측면에 따르면, 상기 서브 행렬 분할부는, 상기 아이템 별로 생성된 의미적 컨셉 그룹을 대상으로, 각 컨셉 그룹에 속하는 연관 키워드들 중 공통되는 연관 키워드의 수에 기초하여 관점 별 유사도를 계산하고, 계산된 관점 별 유사도에 기초하여 상기 사용자-아이템 행렬을 사용자-아이템 서브 행렬로 분할할 수 있다.
또 다른 측면에 따르면, 상기 서브 행렬 분할부는, 상기 복수의 사용자들 중에서 대표 사용자를 결정하고, 결정된 대표 사용자와 각 사용자 간의 사용자 선호도를 관점 별로 계산하고, 계산된 사용자 선호도와 기정의된 기준 선호도에 기초하여 관점 별로 연관성을 가진 사용자들로 구성된 사용자 그룹들을 생성하는 사용자 그룹핑을 수행할 수 있다.
또 다른 측면에 따르면, 상기 매트릭스 완성 수행부는, 상기 복수의 사용자-아이템 서브 행렬을 대상으로 불완전 특이값 분해(Incomplete Singular Value Decomposition)를 수행함으로써, 상기 매트릭스 완성을 수행할 수 있다.
또 다른 측면에 따르면, 상기 평가 피드백 정보 예측부는, 사용자가 속하는 서브 행렬의 수에 따라 관점 별로 생성된 예측 결과에 서로 다른 가중치를 부여함으로써, 상기 평가 피드백 정보를 예측할 수 있다.
본 발명의 일실시예에 따르면, 단일 또는 다중 관점 협업 필터링 기반의 추천 기법을 사용함에 있어서, 아이템의 외부 정보를 활용하여 사용자에 의해 직접적인 피드백 정보가 없는 관점들에 대한 사용자의 선호도를 암시적(implicitly)으로 예측하고, 예측된 결과를 평가 피드백 정보로 활용함으로써, 예측된 관점 별 평가 피드백 정보의 정확도가 떨어지더라도 사용자가 어떤 아이템(item)을 선택하는 데 있어서 중요하게 생각하는 관점들에 대한 우선 순위와 가중치를 이용하여 데이터 희소성 문제를 해결할 수 있다.
또한, 추천될 아이템들의 의미적인 정보들을 활용하여 단일 평가 피드백 정보만 있는 데이터를 다중 관점으로 차원을 확장하고, 사용자 별 의미적 정보들의 공통성에 기반하여 암시적인 방법으로 각 관점에 대한 사용자의 선호도를 예측함으로써, 다중 관점 별 평가 피드백 점수가 없더라도 기존의 다중 관점 협업 필터링 기반 추천 시스템과 유사한 정확도로 사용자의 선호도 예측을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 있어서, 키워드의 의미적 확장을 설명하기 위해 제공되는 도면이다.
도 2는 본 발명의 일실시예에 있어서, 협업 필터링 기반 다중 관점 추천을 위한 전체 프로세스를 설명하기 위해 제공되는 도면이다.
도 3은 본 발명의 일실시예에 있어서, 다중 관점 추천 시스템의 내부 구성을 도시한 블록다이어그램이다.
도 4는 본 발명의 일실시예에 있어서, 협업 필터링 기반 다중 관점 추천 방법을 설명하기 위해 제공되는 흐름도이다.
도 5는 본 발명의 일실시예에 있어서, 사용자-아이템 서브 행렬을 생성하는 동작을 설명하기 위해 제공되는 도면이다.
도 6은 본 발명의 일실시예에 있어서, 매트릭스 완성 프로세스를 수행하는 동작을 설명하기 위해 제공되는 도면이다.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 발명은 다중 관점 협업 필터링 기반 추천 기술에 관한 것으로서, 다차원 행렬을 지역화(Localization)함으로써, 개인화된 협업 필터링(Personalized Collaborative Filtering)에 기반하는 추천 기술에 관한 것이다. 특히, 본 발명은 다중 관점 협업 필터링의 경우 다중 관점 별 평가 피드백 정보가 없는 경우에 적용이 불가능하며, 외부 정보 기반 협업 필터링의 경우 외부 정보의 희소성 및 과적합 문제가 발생하는 것을 해소하기 위한 것으로서, 외부 정보를 활용하여 암시적 관점 별 선호도를 예측 및 측정하는 협업 필터링 기반 추천 기술에 관한 것이다.
본 명세서에서, 다차원(Multi Aspect)는 다중 관점과 동일한 의미로 사용될 수 있다. 그리고, 아이템(item)은, 사용자가 관심을 가지고 소비 또는 구매하거나, 구매하려고 하는 컨텐츠(contents), 제품, 상품 등을 의미할 수 있다. 아이템의 관점(aspect)은 상기 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 속성 별로 분류한 집합을 나타낼 수 있다. 그리고, 의미적 컨셉 그룹은 아이템이 속하는 키워드(예컨대, 에어포스원)와 관련된 연관 키워드들을 조합한 키워드 집합을 나타내며, 컨셉(concept)은 관점에 속하는 연관 키워드들 각각을 나타낼 수 있다. 예를 들어, 아이템이 영화 에어포스원(Air Force One)인 경우, 관점은 출연 배우, 감독, 장르 각각을 나타내며, 의미적 컨셉 그룹은 해리슨 포드, 게리 올드만, 웬디 크로슨, 폴 가일포일, 볼프강 피터젠, 액션 등을 포함하고, 출연배우의 컨셉은 해리슨 포드, 게리 올드만, 웬디 크로슨, 폴 가일포일 각각을 나타내고, 감독의 컨셉은 볼프강 피터젠을 나타내고, 장르의 컨셉은 액션을 나타낼 수 있다.
본 명세서에서, 다차원 매트릭스 지역화 시스템은, 다중 관점 추천 시스템을 의미할 수 있다. 또한, 본 명세서에서, 평가 피드백 정보는, 사용자가 소비한(즉, 구매한) 컨텐츠, 제품 등의 아이템에 대한 사용자의 평가를 입력받은 정보로서, 단일 평가 피드백 정보 및 다중 관점의 평가 피드백 정보를 모두 포함할 수 있다.
다중 관점 협업 필터링 기반의 추천 기법에서 사용되는 용어인 관점 별 피드백 정보의 희소성과 암시적 관점 별 선호도 측정 방법의 과적합(overfitting)에 대해 설명하기로 한다.
● 관점별 피드백 정보의 희소성
협업 필터링 기반 추천 시스템의 경우, 사용자로부터 입력받은 평가 피드백 정보가 사용자에 의해 소비된(구매된) 아이템에 대한 평가 점수이기 때문에 도메인에 상관없는 추천 시스템 개발이 가능하나, 사용자에게 요구하는 피드백 정보의 종류가 다차원화 될수록 차원의 저주 (Curse of Dimensionality)로 인해 데이터 희소성 문제가 심화되어 효율적인 추천 결과의 제공이 어렵다. 예를 들어, 영화에 대한 배우, 감독, 장르 등의 다중 관점 평가 점수가 해당 영화를 소비한(시청)한 사용자로부터 수집될 수 있다. 이때, 평가 항목, 즉, 관점 수의 증가로 인해 사용자의 참여도가 현저하게 저하될 수 있으며, 이는 결국 데이터 희소성 문제를 발생시키므로, 다중 관점 평가 점수가 다시 단일 평가 점수를 피드백으로 요구하는 방향으로 회귀될 수 있다. 따라서, 본 발명은, 다중 관점 추천 시스템의 다양한 도메인으로의 적용 가능성을 높이기 위해서 관점 별 평가 피드백 정보가 없는 상황에서도 적용 가능한 형태의 추천 시스템 기술을 제공하고자 한다.
● 암시적 관점별 선호도 측정 방법의 과적합 (overfitting)
본 발명에서 다중 관점 추천 기법은 다기준 의사결정 (Multi Criteria Decision Making, MCDM) 프레임워크에 기반한다. MCDM 프레임워크는 보통 사람들이 어떤 선택(예컨대, 제품 구매, 투표 등)을 할 때, 대상이 되는 아이템의 다양한 관점을 종합하여 우선순위를 정렬한 뒤 최종 선택을 한다는 사회과학분야의 이론이다. 즉, MCDM의 핵심은 사용자의 관점 별 선호도를 수치화 하는 것이 핵심이며, 다중 관점 협업 필터링 기반 추천 시스템은 관점별 평가 점수를 입력값으로 가정하고 이를 통해 각각의 방법에 따라 사용자들의 관점 별 선호도를 수치화할 수 있다. MCDM 은 사용자들의 관점 별 선호도를 수치화한 것을 명시적 관점별 선호도 측정이라고 분류하며, 수치화된 관점별 선호도 피드백 정보가 없는 경우에 아이템의 특징 정보들을 활용하여 관점 별로 사용자의 선호도 예측하여 측정하는 방식을 암시적 관점별 선호도 측정이라고 분류한다. 특히, 본원발명은 임시적 관점 별 선호도 측정을 제공하는 기술에 관한 것이다. 선호도 측정을 위해 필요한 아이템 정보가 없는 경우, 웹을 활용해 아이템과 관련된 정보를 추출해야 하는 데, 모든 아이템에 대한 정보를 추출해올 수 있다는 보장이 없기 때문에 데이터 희소성 문제가 존재할 수 있으며, 사용자의 관점 별 선호도 예측에 있어서 과적합 문제가 발생할 수 있다. 이때, 아이템 키워드(즉, 아이템이 속하는 키워드)의 의미적 확장을 통한 관점 별 정보를 수집하고, 암시적 관점 별 선호도 예측 시 상대적 다중 선호도를 이용함으로써, 과적합 문제를 해결할 수 있다.
● 아이템 키워드의 의미적 확장을 통한 관점 별 정보 수집
아이템 키워드(예컨대, 영화제목, 상품명 등)를 의미적으로 확장하여 해당 아이템의 특성을 고려한 관점 별 아이템 정보를 수집함으로써, 관점 별 피드백 정보의 희소성을 해결하고 관점 별 평가 점수가 없는 경우에도 적용 가능한 형태의 다중 관점 추천 시스템을 제공할 수 있다. 여기서, 키워드의 의미적 확장이란 해당 키워드를 중심으로 관련성 있는 다른 키워드들의 집합으로 정의될 수 있다.
예를 들어, 도 1을 참고하면, 추천 키워드 프랜즈(friends)를 의미적 확장하여 키워드 프랜즈와 관련이 있는 연관 키워드들(예컨대, NBC, Sitcom, Warner Bros, Jeniffer Aniston 등)이 수집될 수 있다. 이때, 키워드 프랜즈와 상기 연관 키워드들의 연결에 사용된 링크들(link)이 나타내는 의미(즉, 속성)에 따라 상기 연관 키워드들은 관점 별로 분류될 수 있다. 예컨대, 출연 배우, 감독, 장르 등의 관점 별로 분류될 수 있다. 그리고, 관점 별로 분류된 연관 키워드들이 구성하는 연관 키워드 집합인 컨셉 그룹에 기초하여 사용자의 관점 별 선호도가 예측될 수 있다.
즉, 키워드의 의미적 확장이란 아이템이 속하는 키워드가 해당 키워드와 의미적으로 연관성이 있는 연관 키워드들의 집합으로 확장되는 것을 의미할 수 있다. 그러면, 키워드들 간의 매칭이 키워드 집합 간의 매칭 또는 부분적 매칭으로 확장됨으로써 단일 키워드들 간의 매칭 대비 연관성을 발견할 수 있는 확률이 높아질 수 있다. 이때, 키워드들의 연결에 활용된 엣지 링크(edge link)의 의미 별로 매칭되는 정도를 사용자 별로 측정함으로써 관점별 선호도가 측정될 수 있다. 관점 별 선호도가 측정되는 자세한 설명은 도 5 및 하기의 수학식 1을 설명하면서 후술하기로 한다.
● 암시적 관점 별 선호도 예측 시 과적합 회피를 위한 상대적 다중 선호도
아이템 키워드를 활용한 아이템 정보를 추출하는 것이 항상 가능하지 않을 수 있다. 검색 능력 및 정보 부재로 인해 아이템 정보의 추출이 부분적으로 되거나 불가능한 경우가 존재할 수 있다. 예컨대, 부분적인 아이템 정보를 활용하여 사용자의 관점 별 선호도를 측정할 경우, 확보된 아이템 정보의 치우침 정보에 따라 과적합 문제가 발생할 수 있으며, 최종적으로 추천 결과의 정확도가 저해될 수 있다. 이때, 단위 아이템 정보의 믹스쳐(mixture)를 하나의 선호도 패턴의 벡터로 가정하고 복수의 사용자들 중 상대적으로 평가 피드백 정보를 많이 제공한 사용자들을 기준으로 사용자들을 클러스터링 함으로써 특정 아이템 정보가 선호도 측정에 많은 영향을 줄 수 있는 가능성을 제한할 수 있다. 그리고, 사용자 클러스터링 시, 각 사용자들이 하나 이상의 클러스터에 포함될 수 있도록 하여 특정 아이템 정보의 믹스쳐가 사용자의 선호도 측정을 특정짓지 않도록 할 수 있다. 그러면, 완전성이 결여된 아이템 정보를 활용하는 경우에도 과적합 문제를 극복할 수 있다.
도 2는 본 발명의 일실시예에 있어서, 협업 필터링 기반 다중 관점 추천을 위한 전체 프로세스를 설명하기 위해 제공되는 도면이고, 도 3은 본 발명의 일실시예에 있어서, 다중 관점 추천 시스템의 내부 구성을 도시한 블록다이어그램이고, 도 4는 본 발명의 일실시예에 있어서, 협업 필터링 기반 다중 관점 추천 방법을 설명하기 위해 제공되는 흐름도이다.
도 4에서, 협업 필터링 기반 다중 관점 추천 방법은, 다차원 매트릭스 지역화 방법으로 표현될 수 있다.
도 2 및 도 4에 따르면, 다중 관점 추천 시스템(즉, 다차원 매트릭스 지역화 시스템)은 단일 평가 피드백 정보만 존재하는 경우에도 다중 관점 추천의 장점을 살릴 수 있도록 아이템의 외부 정보를 이용하여 사용자의 관점 별 선호도를 예측할 수 있다. 다중 관점 추천 시스템은, 도 2 및 도 4와 같이 4 단계의 프로세스(phase 1 내지 phase 4, 410 내지 440 단계)를 통해 외부 정보를 이용하여 사용자의 관점 별 선호도를 예측할 수 있다. 도 2의 phase 1은 410 단계의 동작, phase 2는 420 단계의 동작, phase 3은 430 단계의 동작, phase 4는 440 단계의 동작에 해당할 수 있다.
도 3에서, 다중 관점 추천 시스템(300)은 컨셉 그룹 생성부(310), 행렬 분할부(320), 매트릭스 완성 수행부(330), 및 평가 피드백 정보 예측부(340)를 포함할 수 있다. 그리고, 도 2의 상기 4단계의 프로세스와 도 4의 각 단계들(410 내지 440 단계)은 도 3이 구성 요소인 컨셉 그룹 생성부(310), 행렬 분할부(320), 매트릭스 완성 수행부(330), 및 평가 피드백 정보 예측부(340)에 의해 수행될 수 있다.
410 단계(phase1)에서, 컨셉 그룹 생성부(310)는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드(즉, 아이템 키워드)로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹(210)을 아이템 별로 생성할 수 있다. 즉, 의미적 컨셉 그룹은 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들의 집합을 나타낼 수 있다. 여기서, 사용자-아이템은 복수의 사용자들과 복수의 아이템들 중 사용자들을 행(row)으로 하고, 아이템들을 열(column)로 구성하는 행렬을 나타낼 수 있다.
예컨대, 컨셉 그룹 생성부(310)는 사용자-아이템 행렬을 구성하는 각각의 아이템 별로 링크 데이터(linked data) 쿼리(query)를 이용하여 의미적으로 관련이 있는 연관 키워드들을 추출하여 의미적 컨셉 그룹을 생성할 수 있다. 이때, 사용자-아이템 행렬은 해당 아이템의 도메인과 관련된 링크 데이터(linked data)로부터 추출된 키워드들에 기초하여 생성되거나, 또는 아이템을 구매한 각 사용자들이 입력한 평가 피드백 정보를 수집하여 생성되는 것으로서, 상기 4단계의 프로세스를 위해 입력으로 미리 주어지는 경우를 가정하여 설명하기로 한다. 이외에, 사용자-아이템 행렬은 링크 데이터로부터 추출된 정보를 외부 정보로 이용하고, 상기 수집된 평가 피드백 정보와 외부 정보를 함께 이용하여 생성될 수도 있다.
아이템이 영화 도메인(domain)인 경우, 영화 도메인에 특화된 관점들이 미리 정의될 수 있다. 예컨대, 출연 배우, 감독, 장르 등의 관점들이 영화 도메인에 특화된 관점으로서 미리 정의될 수 있다. 그러면, 상기 영화 도메인(예컨대, 영화 제목 등)이 아이템 키워드가 되고, 상기 영화 도메인의 출연 배우들의 이름, 감독 이름, 해당 장르 각각이 상기 아이템 키워드와 관련된 연관 키워드가 될 수 있다.
420 단계(phase 2)에서, 행렬 분할부(320)는 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬(220)로 분할할 수 있다.
일례로, 행렬 분할부(320)는 각각의 관점 별로 중복되는 컨셉들을 카운팅하여 각 관점 별 사용자 유사도(즉, 관점 별 사용자의 선호도)를 계산할 수 있다. 여기서, 컨셉은 해당 관점에 속하는 연관 키워드로서, 예컨대, 관점이 출연 배우인 경우, 출연 배우 각각의 이름이 컨셉을 나타낼 수 있다. 그리고, 관점 별 사용자 유사도는 측정 대상이 되는 사용자들이 존재할 때 특정 관점(예컨대, 배우, 장르, 감독 등)에 대한 선호도의 유사 정도를 나타낼 수 있다. 예를 들어, 배우 관점의 경우, 좋아하는 배우가 많이 중복되고 선호도의 차이가 작으면 해당 관점(배우)에 대한 유사도가 높게 측정될 수 있다. 관점 별 유사도를 계산하는 자세한 동작은 도 5 및 하기의 수학식 2를 참고하여 후술하기로 한다.
그리고, 행렬 분할부(320)는 관점 별 유사도(즉, 관점 별 유사 선호도)에 따라 사용자-아이템 행렬을 구성하는 사용자들 간의 연관성을 측정할 수 있다.
행렬 분할부(320)는 의미적 컨셉 그룹 중에서, 상기 측정된 사용자들 간의 연관성을 기반으로 관점 별로 연관성이 있는 사용자-아이템 그룹을 찾을 수 있다. 그리고, 행렬 분할부(320)는 찾은 사용자-아이템 그룹에 기초하여 사용자-아이템 행렬을 관점 별로 다수의 사용자-아이템 서브 행렬로 분할할 수 있다. 즉, 사용자-아이템 그룹이 관점 별로 생성되며, 각각의 사용자-아이템 그룹이 서브 행렬로 저장될 수 있다. 이처럼, 사용자-아이템 그룹이 서브 행렬로 저장됨에 따라, 사용자-아이템 서브 행렬이 생성될 수 있다. 예를 들어, 행렬 분할부(320)는 사용자-아이템 행렬을 관점의 개수에 해당하는 복수의 사용자-아이템 서브 행렬로 분할할 수 있다.
430 단계(phase 3)에서, 매트릭스 완성 수행부(330)는 새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 상기 분할된 각각의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion) 프로세스를 수행할 수 있다,
440 단계(phase 4)에서, 평가 피드백 정보 예측부(340)는 매트릭스 완성 프로세스가 수행된 각각의 사용자-아이템 서브 행렬들의 결과를 관점 별로 취합할 수 있다. 그리고, 평가 피드백 정보 예측부(340)는 사용자 별로 다르게 계산된 가중치에 따라 관점 별로 취합된 하고, 취합된 상기 사용자-아이템 서브 행렬들을 합침으로써 새로운 아이템에 대한 평가 피드백 정보(예컨대, 평가 점수)를 예측할 수 있다. 평가 피드백 정보 예측부(340)는 예측된 평가 점수에 따라 사용자에게 해당 아이템을 추천할 수 있다. 이처럼, 본원발명은 명시적인 관점 별 평가 피드백 정보가 아닌 링크 데이터(linked data)로부터 추출된 아이템의 의미적 정보들(예컨대, 연관 키워드들)을 활용하여 다중 관점 협업 필터링 기반 추천을 제공할 수 있다.
이하에서는 도 2에서 설명한 4 단계의 프로세스 동작(phase 1 내지 phase 4)에 대해 상세히 설명하기로 한다.
아래의 표 1은 링크 데이터에 쿼리를 하여 'Air force One'에 대한 RDF 트리플들을 찾는 동작을 나타내고 있다.
Figure 112016014921413-pat00001
링크 데이터를 활용하여 아이템에 관련된 의미적 정보들을 추출하기 위해서는 먼저 아이템의 메타 데이터로부터 명사 및 명사절을 추출하고, 추출된 명사 및 명사 절을 키워드로 활용하여 링크 데이터에 쿼리(query)를 하여 관련된 정보들을 추출해야 한다. 위의 표 1과 같이, 명사 및 명사절 추출을 위해 RDF 트리플들 중 이름(name), 제목(title) 또는 레이블(label)과 같은 특성 값(property value)과 같은 아이템의 키워드를 포함하고 있는 트리플이 이용될 수 있다.
컨셉 그룹 생성부(310)는 링크 데이터(linked data)를 이용하여 사용자들이 소비한 아이템들에 해당하는 아이템 키워드와 관련된 컨셉(즉, 연관 키워드)를 검색할 수 있다. 이때, 형태소 분석기(morpheme analyzer)를 이용하여 아이템 설명(즉, 아이템의 메타데이터)에서 명사 및 명사절을 추출하고, 메타데이터에서 추출된 상기 명사 및 명사절에서 각 키워드를 갖는 링크 데이터에 쿼리(query)할 수 있다. 이처럼, 키워드에 관련된 컨셉을 식별하기 위해 링크 데이터가 사용될 수 있으며, 형태소 분석기(morpheme analyzer)를 사용함으로써, 먼저 아이템 설명에서 명사 및 명사절이 추출될 수 있다. 그러면, 해당 컨셉을 검색하기 위해 SPARQL(SPARQL Protocol 및 RDF Query Language)을 사용함으로써 명사와 명사절에서 각 키워드를 갖는 링크 데이터에 쿼리할 수 있다. RDF 트리플(triple) 중 이름(name), 제목(title) 또는 레이블(label)과 같은 특성 값(property value)과 같이 아이템의 키워드를 포함하고 있는 것들이 이용될 수 있다. 링크 데이터는 서로 다른 술어(predicates)를 사용하기 때문에, rdf:label 및 skos:prefLabel과 같은 다양한 형태의 술어를 사용한다. 이 후에, 각각의 주제를 설명하는 모든 트리플을 검색하기 위한 링크 데이터에 다시 문의할 수 있고, 일관된 컨셉으로 그룹화할 수 있다.
도 5는 본 발명의 일실시예에 있어서, 사용자-아이템 서브 행렬을 생성하는 동작을 설명하기 위해 제공되는 도면이다.
도 5의 동작은 도 2의 phase 2 및 도 4의 420 단계에 해당하며, 도 3의 행렬 분할부(320)에 의해 수행될 수 있다.
행렬 분할부(320)는 컨셉 그룹 생성부(310)에서 생성된 의미적 컨셉 그룹들(210)을 이용하여 각각의 관점 별로 연관성 있는 사용자-아이템 그룹을 찾을 수 있다. 예컨대, 도 5를 참고하면, 행렬 분할부(320) 영화 도메인이라는 아이템에 대해 기정의된 관점의 만큼 사용자-아이템 서브 행렬을 생성할 수 있다. 영화 도메인의 경우 관점이 출연 배우, 감독, 장르로 기정의된 경우, 3개의 관점이 존재하므로, 행렬 분할부(320)는 사용자-아이템 행렬을 3개의 사용자-아이템 서브 행렬을 분할할 수 있다. 즉, 사용자-배우 서브 행렬, 사용자-감독 서브 행렬, 사용자-장르 서브 행렬이 생성될 수 있으며, 사용자-아이템 행렬에서 행(row)은 사용자들로 그대로 유지하고, 열(column)은 각 관점들로 대체될 수 있다.
이때, 사용자-아이템 행렬을 구성 시 이용된 평가 피드백 정보는 분할된 사용자-관점 행렬에 그대로 상속될 수 있다. 예컨대, 영화 M1과 M2에 배우 A1이 출연했고, 사용자 U1이 영화 M1과 M2에 각각 5점과 3점의 평가 점수를 준 경우를 가정하면, 사용자-배우 서브 행렬의 해당 요소(U1-A1)은 5와 3을 합한 8이 할당될 수 있다. 동일한 방식으로, 각각의 사용자-아이템 서브 행렬이 생성되고, 서브 행렬을 구성하는 각 요소들에 상속된 평가 점수들이 할당될 수 있다. 그러면, 행렬 분할부(320)는 평가 점수들이 할당된 각 사용자-아이템 서브 행렬에서 연관성이 있는 사용자-아이템 그룹을 찾을 수 있다.
이때, 행렬 분할부(320)는 연관성이 있는 사용자-아이템 그룹을 찾기 위해 사용자-아이템 행렬을 구성하는 아이템들 간의 연관성을 나타내는 관점 별 유사도와 사용자-아이템 행렬을 구성하는 사용자들 간의 연관성을 나타내는 관점 별 사용자 유사도를 계산할 수 있다.
Figure 112016014921413-pat00002
수학식 1에서,
Figure 112016014921413-pat00003
는 아이템 i에 의해 생성된 의미적 컨셉 그룹(concept group),
Figure 112016014921413-pat00004
는 아이템 j에 의해 생성된 의미적 컨셉 그룹(concept group),
Figure 112016014921413-pat00005
Figure 112016014921413-pat00006
Figure 112016014921413-pat00007
에 모두 포함되어 있는 컨셉들, acg1
Figure 112016014921413-pat00008
에 속해 있는 컨셉들, acg2
Figure 112016014921413-pat00009
에 속해 있는 컨셉들,
Figure 112016014921413-pat00010
는 아이템 i의 레이팅(rating) 값을 나타낼 수 있다.
수학식 1에 따르면, 관점 별 유사도는 각 관점 별로 생성된 의미적 컨셉 그룹에 포함된 컨셉의 개수로 정규화되는 것으로서, 의미적 컨셉 그룹들 중 겹치는 컨셉들, 즉, 공통되는 컨셉들의 수에 기초하여 계산될 수 있다. 아이템 i와 아이템 j 간의 관점 별 유사도는 아이템 i와 아이템 j에 해당하는 전체 컨셉의 수 대비 아이템 i와 아이템 j 간에 공통된 컨셉의 수의 비율로서 계산될 수 있다.
그리고, 각 관점 별 사용자 유사도는 아래의 수학식 2에 기초하여 계산될 수 있다.
Figure 112016014921413-pat00011
수학식 2에서,
Figure 112016014921413-pat00012
는 사용자
Figure 112016014921413-pat00013
에 의해 레팅된(rating) 아이템들의 컨셉 그룹들,
Figure 112016014921413-pat00014
는 사용자
Figure 112016014921413-pat00015
에 의해 레팅된(rating) 아이템들의 컨셉 그룹들,
Figure 112016014921413-pat00016
는 사용자
Figure 112016014921413-pat00017
를 위해 생성된 컨셉 그룹들의 수,
Figure 112016014921413-pat00018
는 사용자
Figure 112016014921413-pat00019
를 위해 생성된 컨셉 그룹들의 수를 나타낼 수 있다.
수학식 2에 따르면, 행렬 분할부(320)는 사용자가 소비한 아이템의 의미적 컨셉 그룹들 중에서 겹치는 컨셉, 즉, 공통된 컨셉의 수를 합한 값으로서 관점 별 사용자 유사도를 계산할 수 있다. 수학식 2와 같이, 관점 별 사용자 유사도는 해당 사용자들을 위해 생성된 전체 컨셉 그룹의 수로서 정규화될 수 있다.
위의 수학식 1 및 수학식 2에서 계산된 관점 별 유사도와 관점 별 사용자 유사도에 기초하여, 행렬 분할부(320)는 사용자-아이템 행렬을 복수의 사용자-관점 행렬로 분할할 수 있다. 예컨대, 아래의 표 2는 사용자-관점 행렬로 분할하는 프로세스를 나타내고 있다.
Figure 112016014921413-pat00020
표 2에서 설명하고 있는 매트릭스 지역화 알고리즘은 공통 클러스터링(co-clustering)에 기반하며, 공통 클러스터링은 행렬 M에서 연관성이 있는 행들(rows)과 열들(columns)을 클러스터링하는 것이다. 즉, 공통 클러스터링은 매트릭스 M을 다수의 블록으로 분할하는 것이다.
표 2에 따르면, 사용자와 아이템을 위한 의미적 컨셉 그룹들이 생성될 수 있다(Lines 4-7, 표 2). 그리고, 다른 사용자들에 비해 상대적으로 많은 아이템을 소비한 사용자들이 대표 사용자(representative user)로 선택될 수 있다. 예컨대, 다른 사용자들보다 아이템을 많이 소비한 사용자 순서로 순차적으로 대표 사용자가 선택될 수 있다. 대표 사용자 선택을 위해 각 사용자들의 평가 피드백 정보의 수에 기초하여 사용자들이 정렬될 수 있으며(Line 8), 대표 사용자로서 첫 번째 사용자가 선택될 수 있다(Lines 9-12). 제안하는 방법에서, 대표 사용자들은 관점 별 사용자의 선호도를 파악하는 데 있어서, 사용자 그룹의 주요 관심사를 나타내는 핵심 컨셉을 제공하기 때문에 대표 사용자의 식별은 필수적이다. 대표 사용자를 기준으로 해당 관점에 대해 유사한 선호도를 가진 사용자들을 그룹핑할 수 있다(Lines 13-17). 예컨대, 관점 별 사용자 유사도가 기정의된 기준 사용자 유사도(threshold)보다 크면, 해당 관점에 대해 유사한 선호도를 가진 것으로 판단될 수 있다. 이때, 관점 별 사용자 유사도를 계산하기 위해 겹치는 컨셉의 수가 카운트될 수 있으며, 상기 기준 사용자 유사도(threshold)는 0으로 기정의될 수 있다. 그러면, 0 이상의 값을 가지는 모든 사용자들이 연관성이 있는 것으로 간주되어 사용자 그룹핑이 수행될 수 있다.
사용자 그룹핑 후, 사용자 그룹에 의해 소비된 아이템들이 아이템 그룹으로 그룹핑될 수 있다(Lines 18-20). 사용자 그룹핑과 유사한 방법으로 아이템 그룹이 그룹핑될 수 있으며, 아이템 그룹을 그룹핑하는 프로세스는 아래의 표 3에서 설명하고 있다.
Figure 112016014921413-pat00021

Figure 112016014921413-pat00022
표 3에 따르면, 아이템들의 평가 피드백 정보의 수를 기준으로 아이템들이 정렬되며, 첫 번째 아이템이 대표 아이템(representative item)으로 선택될 수 있다(Lines 3-4, 표 3). 이때, 위의 수학식 1에 기초하여 대표 아이템과 아이템 사이의 관점별 유사도가 비교될 수 있다. 아이템 그룹 내의 아이템들은 상기 관점별 유사도에 따라 재정렬될 수 있다(Line 21).
평가 피드백 정보가 없는 아이템들을 위해 피드백 정보가 있는 아이템들과의 관점 별 유사도가 이용될 수 있다. 만약, 유사하다고 판단되는 경우, 아이템 그룹에 포함시킬 수 있다(Lines 6-16). 이후, 아이템 서브 그룹들은 관점 별로 취합될 수 있다(Lines 17-20). 취합된 아이템 서브 그룹들과 사용자 그룹들을 조합하여 사용자-아이템 서브 행렬을 생성할 수 있다(Lines 21). 이때, 모든 사용자들이 하나 이상의 사용자 그룹에 포함될 때까지 대표 사용자가 변경될 수 있으며, 대표 사용자를 변경해 가면서 사용자-아이템 서브 행렬을 생성하는 프로세스가 반복될 수 있다(Line 22).
위의 표 1 및 표 2에 나타낸 매트릭스 지역화 알고리즘에 의해 사용자-아이템 행렬이 복수의 사용자-아이템 서브 행렬로 분할되면, 분할된 서브 행렬을 이용하여 새로운 아이템에 대한 사용자 평가 피드백 점수를 예측할 수 있다.
매트릭스 완성 수행부(330)는 사용자-아이템 행렬 상에서 관찰되지 않은 사용자 평가 피드백 점수들을 예측하기 위해 요소들을 행렬에 추가하는 매트릭스 완성 프로세스를 수행할 수 있다. 일례로, 매트릭스 완성 수행부(330)는 불완전 특이값 분해(Incomplete Singular Value Decomposition, Incomplete SVD)에 기초하여 매트릭스 완성 프로세스를 수행할 수 있다. 여기서, SVD는 아래의 수학식 3과 같이 정의될 수 있다.
Figure 112016014921413-pat00023
수학식 3에서, M은 입력으로 주어진 사용자-아이템 행렬(
Figure 112016014921413-pat00024
, 사용자 m, 아이템 n)을 나타내고, A는 M에서 관측된 레이팅들(rating) 중에서 학습에 사용되는 것들의 집합을 나타내고, u와 i는 각각 A의 사용자와 아이템을 나타낼 수 있다.
Figure 112016014921413-pat00025
,
Figure 112016014921413-pat00026
, r은 m과 n에 비해 기정의된 기준값 이하의 매우 작은 값을 가지는 것을 나타내는 low-rank 가정이 이용될 수 있다.
관찰되지 않은 레이팅(rating) 값은 어떤 값이라도 이용될 수 있으나, 매트릭스 완성 프로세스를 주어진 사용자-아이템 행렬 M과 근사 행렬 M'의 유사도를 비용함수로 구하여 최소화하는 문제로 단순화하기 위해 low-rank 가정이 이용될 수 있다.
매트릭스 완성이 수행된 결과 행렬 M'은 학습 집합 A에 포함되지 않는 사용자-아이템 쌍(pair)(v, j)
Figure 112016014921413-pat00027
A도 포함하여, 사용자 v와 아이템 j 간의 레이팅(rating)을 나타내는 Mvj 를 예측하기 위해 이용될 수 있다. 상기 M'이 완성된 이후, 평가 피드백 정보 예측부(340)는 {M' v , j : (v, j)
Figure 112016014921413-pat00028
A}에서 다른 값들에 비해 높은 값을 가지고 있는 아이템들을 선별하여 사용자 v에게 추천할 수 있다. 예컨대, 기준값 이상에 해당하는 아이템들을 사용자 v에게 추천할 수 있다. 기준값은 미리 정의될 수도 있고, 아이템들의 값들의 평균값이 기준값으로 이용될 수도 있다.
이외에, 다른값들에 비해 높은 값을 가지고 있는 아이템들을 선별하기 위한 기준값이 다양한 방법으로 계산 또는 미리 정의될 수 있다.
도 6은 본 발명의 일실시예에 있어서, 매트릭스 완성 프로세스를 수행하는 동작을 설명하기 위해 제공되는 도면이다.
도 6에서는, 이전 단계에서 생성된 사용자-아이템 서브 행렬들(음영 처리된 부분)을 도시하고 있다. 매트릭스 완성 수행부(330)는 사용자-아이템 서브 행렬의 수에 맞춰 불완전 SVD를 수행할 수 있다. 이때, 하나 이상의 사용자-아이템 서브 행렬에 속하는 요소(element)가 존재하는 경우, 각 사용자-아이템 서브 행렬에서 합산된 값이 해당 요소(element)에 할당될 수 있다.
사용자 v와 아이템 j에 대한 합산 값은 상기 사용자-아이템 서브 행렬의 가중치를 고려하여 계산될 수 있다. 예컨대, 매트릭스 완성 수행부(330)는 아래의 수학식 4에 기초하여 사용자 v와 아이템 j에 대한 합산 값을 계산할 수 있다.
Figure 112016014921413-pat00029
수학식 4에서, n은 생성된 사용자-아이템 서브 행렬의 수,
Figure 112016014921413-pat00030
는 사용자-아이템 서브 행렬 i의 가중치,
Figure 112016014921413-pat00031
는 사용자-아이템 서브 행렬 i의 완성에 의해 (v, j)의 예측된 레이팅(rating) 값을 나타낼 수 있다.
여기서, 가중치는 사용자-아이템 서브 행렬에 포함된 요소(v, j)와 대표 요소 간의 거리를 나타낼 수 있다. 대표 요소는 가장 인기있는 아이템을 나타낼 수 있다. 각 사용자-아이템 서브 행렬의 웨이트(weight) 값이 거리에 반비례하므로, 각 가중치는 거리 비율(distance ratio)을 1에서 차감한 값으로 계산될 수 있다. 예컨대, 도 6을 참고하면, 서브 행렬 A의 요소 (v, j)에 대한 예측 결과가 4, 서브 행렬 B의 예측 결과가 3인 경우, 해당 행렬에서 대표 요소와 상기 요소 (v, j) 간의 거리는 각각 3과 √5일 수 있다.
그러면, 서브 행렬 A와 요소 (v, j)의 거리가 2차원 평면에서 3/(3+√5)로 측정될 수 있기 때문에, 서브 행렬 A의 가중치는 거리에 반비례하는 1-(3/(3+√5))로 계산될 수 있다. 서브 행렬 A와 동일한 방법으로 서브 행렬 B의 가중치가 계산될 수 있다. 결과적으로, 아래의 수학식 5와 같이, 요소 (v, j)의 값은 측정된 가중치에 따라 각각의 서브 행렬 A와 B에 의해 예측된 값의 웨이트 합(weight sum)인 2.85로 계산될 수 있다.
Figure 112016014921413-pat00032
수학식 5를 이용하여, 사용자가 속하는 서브 행렬의 수에 따라 각 관점 별로 예측 결과가 생성되면, 생성된 예측 결과에 서로 다른 가중치를 부여하여 예측 결과가 통합될 수 있다. 가중치 계산을 위해 계층분석기법(Analytic Hierarchy Process, AHP)가 이용될 수 있다. AHP는 복잡한 결정을 내리고 분석하기 위해 사용되는 구조화 방법으로서, 위에서 언급한 비특허 문헌 [2] Saaty T. L.: Decision Making for Leaders: The Analytic Hierarchy Process for Decisions in a Complex World, Pittburgh , Pennsylvania: RWS Publications, (1999).에서 자세히 설명하고 있다. AHP는 복잡한 결정 문제(decision problem)을 더 쉽게 이해하도록 하위 문제(sub-problem)으로 나누고, 하위 문제들은 독립적으로 분석할 수 있도록 하는 기법이다. 이러한 문제 체계의 요소들은 결정 문제의 모든 관점에 대해 정의될 수 있으며, 문제 체계가 구성된 이후에, 각 요소들은 다른 모든 요소와 대응 비교(Paired Comparison)를 수행하게 될 수 있다. 대응 비교는 어떠한 요소가 선호되는지 파악하기 위해 요소들을 한 쌍(pair)로 짝지어 수행될 수 있으며, 행렬 곱 연산으로 아래의 수학식 6과 같이 정의될 수 있다.
Figure 112016014921413-pat00033
수학식 6에서, A와 B는 동일한 크기의 ix j 행렬을 나타낼 수 있다.
대응 비교는 각 사용자의 관점 별 가중치를 예측하기 위해 사용될 수 있다. 이는 수학식 6을 사용하여 상대적인 중요도를 의미하는 수치적 특징을 계산할 수 있기 때문이다. 특정 도메인에 따라 필수 관점들이 주어진다고 가정하고, 타겟 도메인의 필수 관점으로 3가지 관점이 주어진 경우를 가정하면, 각 관점에 대한 대응 비교 기반의 가중치는 아래의 수학식 7을 이용하여 계산될 수 있다.
Figure 112016014921413-pat00034
수학식 7에서,
Figure 112016014921413-pat00035
일 수 있다.
이에 따라, 각 요소 a ij 에 대해 두 개의 독립적인 관점 a i a j 사이의 대응 비교를 위한 수치가 할당될 수 있다고 가정하면, 행렬 곱연산을 통해 각 관점에 대한 가중치가 계산될 수 있다. 이때, 각 요소 a ij 에 대해 적절한 값을 할당하기 위해서, 사용자가 포함된 서브 행렬의 수를 그 사용자가 아이템을 선택하는데 있어서 해당 관점을 얼마나 고려하고 있는지를 측정하는데 사용할 수 있다. 즉, 위에서 이미 설명한 phase 2단계에서 각 관점별로 다른 수의 서브 행렬이 생성될 수 있으며, 아래의 수학식 8과 같이, 사용자가 포함된 서브 행렬의 수를 그 사용자의 관점 별 가중치를 계산하기 위해 이용될 수 있다.
Figure 112016014921413-pat00036
수학식 8에서,
Figure 112016014921413-pat00037
는 사용자 u의 관점 a k 에 대한 가중치,
Figure 112016014921413-pat00038
는 관점 a k 에 대해 생성된 서브 행렬(사용자 그룹)의 수,
Figure 112016014921413-pat00039
는 관점 a k 에 대해 생성된 서브 행렬(사용자 그룹)들 중 사용자 u가 속한 서브 행렬들의 수를 나타낼 수 있다.
수학식 8에 따르면, 서브 행렬의 수가 증가함에 다라 사용자와 관점 사이의 의존도는 저하됨을 알 수 있다. 왜냐하면, 각각의 사용자 그룹은 특정 관심사 패턴을 의미하기 대문에, 어떤 사용자가 특정 관심사에 대해 다양한 사용자 그룹에 포함된다면, 그 사용자는 그 관점에 대한 의존성이 떨어진다고 해석 가능하다. 이러한 해석은 해당 사용자가 해당 도메인의 아이템을 선택하는데 있어서, 상기 관점에 대해 특징적으로 고려하지 않음을 의미할 수 있다.
평가 피드백 정보 예측부(340)는 위의 수학식 8에서 계산된 각 사용자들의 가중치에 기초하여 각 관점 별로 생성된 평가 피드백 정보 예측 결과를 취합함으로써, 사용자 별로 개인화된 예측값을 도출할 수 있다. 그리고, 도출된 예측값을 기반으로 개인화된 아이템을 추천할 수 있다.
제안하는 협업 필터링 기반의 다중 관점 추천 시스템은 링크 데이터를 이용하고, 사용자-아이템 행렬을 복수의 사용자-아이템 서브 행렬로 분할하는 과정을 통해, 기존의 다중 관점 추천의 장점을 유지하면서, 추천 정확도의 성능을 개선할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (16)

  1. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계
    를 포함하고,
    상기 의미적 컨셉 그룹을 아이템 별로 생성하는 단계는,
    상기 아이템에 해당하는 도메인(domain)이 나타내는 정보들을 포함하는 링크 데이터(Linked Data)에 기초하여 상기 아이템이 속하는 키워드와 관련된 연관 키워드를 추출하고, 추출된 키워드를 그룹화하여 상기 의미적 컨셉 그룹을 생성하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  2. 삭제
  3. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계
    를 포함하고,
    상기 의미적 컨셉 그룹을 아이템 별로 생성하는 단계는,
    상기 아이템에 해당하는 RFD(Resource Description Framework) 트리플(triple) 중 특성값(property value)을 연관 키워드로 추출하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  4. 제1항에 있어서,
    상기 사용자-아이템 서브 행렬로 분할하는 단계는,
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점의 개수에 대응하는 개수의 사용자-아이템 서브 행렬들로 분할하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  5. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계
    를 포함하고,
    상기 사용자-아이템 서브 행렬로 분할하는 단계는,
    상기 아이템 별로 생성된 의미적 컨셉 그룹을 대상으로, 각 컨셉 그룹에 속하는 연관 키워드들 중 공통되는 연관 키워드의 수에 기초하여 관점 별 유사도를 계산하고, 계산된 관점 별 유사도에 기초하여 상기 사용자-아이템 행렬을 사용자-아이템 서브 행렬로 분할하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  6. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계
    를 포함하고,
    상기 사용자-아이템 서브 행렬로 분할하는 단계는,
    상기 복수의 사용자들 중에서 대표 사용자를 결정하고, 결정된 대표 사용자와 각 사용자 간의 사용자 선호도를 관점 별로 계산하고, 계산된 사용자 선호도와 기정의된 기준 선호도에 기초하여 관점 별로 연관성을 가진 사용자들로 구성된 사용자 그룹들을 생성하는 사용자 그룹핑을 수행하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  7. 제1항에 있어서,
    상기 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계는,
    상기 복수의 사용자-아이템 서브 행렬을 대상으로 불완전 특이값 분해(Incomplete Singular Value Decomposition)를 수행함으로써, 상기 매트릭스 완성을 수행하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  8. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 단계;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 단계;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 단계; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계
    를 포함하고,
    상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 단계는,
    사용자가 속하는 서브 행렬의 수에 따라 관점 별로 생성된 예측 결과에 서로 다른 가중치를 부여함으로써, 상기 평가 피드백 정보를 예측하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 방법.
  9. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 컨셉 그룹 생성부;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 서브 행렬 분할부;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 매트릭스 완성 수행부; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 평가 피드백 정보 예측부
    를 포함하고,
    상기 컨셉 그룹 생성부는,
    상기 아이템에 해당하는 도메인(domain)이 나타내는 정보들을 포함하는 링크 데이터(Linked Data)에 기초하여 상기 아이템이 속하는 키워드와 관련된 연관 키워드를 추출하고, 추출된 키워드를 그룹화하여 상기 의미적 컨셉 그룹을 생성하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
  10. 삭제
  11. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 컨셉 그룹 생성부;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 서브 행렬 분할부;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 매트릭스 완성 수행부; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 평가 피드백 정보 예측부
    를 포함하고,
    상기 컨셉 그룹 생성부는,
    상기 아이템에 해당하는 RFD(Resource Description Framework) 트리플(triple) 중 특성값(property value)을 연관 키워드로 추출하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
  12. 제9항에 있어서,
    상기 서브 행렬 분할부는,
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점의 개수에 대응하는 개수의 사용자-아이템 서브 행렬들로 분할하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
  13. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 컨셉 그룹 생성부;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 서브 행렬 분할부;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 매트릭스 완성 수행부; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 평가 피드백 정보 예측부
    를 포함하고,
    상기 서브 행렬 분할부는,
    상기 아이템 별로 생성된 의미적 컨셉 그룹을 대상으로, 각 컨셉 그룹에 속하는 연관 키워드들 중 공통되는 연관 키워드의 수에 기초하여 관점 별 유사도를 계산하고, 계산된 관점 별 유사도에 기초하여 상기 사용자-아이템 행렬을 사용자-아이템 서브 행렬로 분할하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
  14. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 컨셉 그룹 생성부;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 서브 행렬 분할부;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 매트릭스 완성 수행부; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 평가 피드백 정보 예측부
    를 포함하고,
    상기 서브 행렬 분할부는,
    상기 복수의 사용자들 중에서 대표 사용자를 결정하고, 결정된 대표 사용자와 각 사용자 간의 사용자 선호도를 관점 별로 계산하고, 계산된 사용자 선호도와 기정의된 기준 선호도에 기초하여 관점 별로 연관성을 가진 사용자들로 구성된 사용자 그룹들을 생성하는 사용자 그룹핑을 수행하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
  15. 제9항에 있어서,
    상기 매트릭스 완성 수행부는,
    상기 복수의 사용자-아이템 서브 행렬을 대상으로 불완전 특이값 분해(Incomplete Singular Value Decomposition)를 수행함으로써, 상기 매트릭스 완성을 수행하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
  16. 복수의 사용자들과 복수의 아이템들 중 어느 하나를 행(row)으로 하고, 나머지 하나를 열(column)로 하는 사용자-아이템 행렬을 대상으로, 각 아이템이 속하는 키워드로부터 추출된 연관 키워드들을 조합하여 의미적 컨셉 그룹을 아이템 별로 생성하는 컨셉 그룹 생성부;
    상기 사용자-아이템 행렬을 기정의된 아이템의 관점에 따라 복수의 사용자-아이템 서브 행렬로 분할하는 서브 행렬 분할부;
    새로운 아이템에 대한 사용자의 평가 피드백 정보를 예측하기 위해, 분할된 복수의 사용자-아이템 서브 행렬을 대상으로 매트릭스 완성(matrix completion)을 수행하는 매트릭스 완성 수행부; 및
    상기 매트릭스 완성이 수행된 복수의 사용자-아이템 서브 행렬 각각의 결과를 관점 별로 취합하여 상기 새로운 아이템에 대한 평가 피드백 정보를 예측하는 평가 피드백 정보 예측부
    를 포함하고,
    상기 평가 피드백 정보 예측부는,
    사용자가 속하는 서브 행렬의 수에 따라 관점 별로 생성된 예측 결과에 서로 다른 가중치를 부여함으로써, 상기 평가 피드백 정보를 예측하는 것
    을 특징으로 하는 다차원 매트릭스 지역화 시스템.
KR1020160017414A 2016-02-15 2016-02-15 IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템 KR101738809B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160017414A KR101738809B1 (ko) 2016-02-15 2016-02-15 IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160017414A KR101738809B1 (ko) 2016-02-15 2016-02-15 IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR101738809B1 true KR101738809B1 (ko) 2017-05-24

Family

ID=59051477

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160017414A KR101738809B1 (ko) 2016-02-15 2016-02-15 IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101738809B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862431A (zh) * 2019-01-23 2019-06-07 重庆第二师范学院 一种基于mcl-hcf算法的电视节目混合推荐方法
CN111402003A (zh) * 2020-03-13 2020-07-10 第四范式(北京)技术有限公司 实现用户相关推荐的系统和方法
KR20210096760A (ko) * 2020-01-29 2021-08-06 주식회사 엘지유플러스 서비스 서버 및 이의 동작 방법
CN113537950A (zh) * 2021-08-20 2021-10-22 支付宝(杭州)信息技术有限公司 项目处理方法以及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862431A (zh) * 2019-01-23 2019-06-07 重庆第二师范学院 一种基于mcl-hcf算法的电视节目混合推荐方法
CN109862431B (zh) * 2019-01-23 2023-09-29 重庆第二师范学院 一种基于mcl-hcf算法的电视节目混合推荐方法
KR20210096760A (ko) * 2020-01-29 2021-08-06 주식회사 엘지유플러스 서비스 서버 및 이의 동작 방법
KR102307070B1 (ko) * 2020-01-29 2021-09-29 주식회사 엘지유플러스 서비스 서버 및 이의 동작 방법
CN111402003A (zh) * 2020-03-13 2020-07-10 第四范式(北京)技术有限公司 实现用户相关推荐的系统和方法
CN111402003B (zh) * 2020-03-13 2023-06-13 第四范式(北京)技术有限公司 实现用户相关推荐的系统和方法
CN113537950A (zh) * 2021-08-20 2021-10-22 支付宝(杭州)信息技术有限公司 项目处理方法以及装置

Similar Documents

Publication Publication Date Title
Phorasim et al. Movies recommendation system using collaborative filtering and k-means
Taneja et al. Cross domain recommendation using multidimensional tensor factorization
Ahmed et al. Movie recommendation system using clustering and pattern recognition network
Jiang et al. A collaborative filtering recommendation algorithm based on information theory and bi-clustering
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
Ismail et al. Collaborative filtering-based recommendation of online social voting
CN110955831B (zh) 物品推荐方法、装置、计算机设备及存储介质
KR101738809B1 (ko) IoT 기반 스마트 홈 커뮤니티에서 소셜 매칭 및 소통 서비스를 위한 다차원매트릭스 지역화 방법 및 시스템
KR101590976B1 (ko) 협업 필터링 기반 추천 성능을 향상 시키기 위한 의미 클러스터 기반 매트릭스 지역화 방법 및 장치
Nasiri et al. Increasing prediction accuracy in collaborative filtering with initialized factor matrices
Sawant et al. Yelp food recommendation system
Gandhi et al. A survey on recommendation system with collaborative filtering using big data
Liu et al. Collaborative prediction for multi-entity interaction with hierarchical representation
Ali et al. Dynamic context management in context-aware recommender systems
Kannikaklang et al. A hybrid recommender system for improving rating prediction of movie recommendation
Lin et al. Association rule mining with a correlation-based interestingness measure for video semantic concept detection
Sang et al. Design and implementation of collaborative filtering approach for movie recommendation system
Işık A hybrid movie recommendation system using graph-based approach
Gandhi et al. Hybrid recommendation system with collaborative filtering and association rule mining using big data
Mirhasani et al. Alleviation of cold start in movie recommendation systems using sentiment analysis of multi-modal social networks
Banouar et al. Enriching SPARQL queries by user preferences for results adaptation
Joseph et al. A Comparative Study of Collaborative Movie Recommendation System
Mngomezulu et al. A Content-Based Collaborative Filtering Movie Recommendation System using Keywords Extractions
Wagavkar et al. Weighted hybrid approach in recommendation method
Harakawa et al. A Web video retrieval method using hierarchical structure of Web video groups

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant