KR20160049401A - 사용자 맞춤형 항목 추천 방법 및 장치 - Google Patents

사용자 맞춤형 항목 추천 방법 및 장치 Download PDF

Info

Publication number
KR20160049401A
KR20160049401A KR1020140146456A KR20140146456A KR20160049401A KR 20160049401 A KR20160049401 A KR 20160049401A KR 1020140146456 A KR1020140146456 A KR 1020140146456A KR 20140146456 A KR20140146456 A KR 20140146456A KR 20160049401 A KR20160049401 A KR 20160049401A
Authority
KR
South Korea
Prior art keywords
item
items
user
neighbor
recommendation
Prior art date
Application number
KR1020140146456A
Other languages
English (en)
Other versions
KR101630642B1 (ko
Inventor
이상구
박영기
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020140146456A priority Critical patent/KR101630642B1/ko
Publication of KR20160049401A publication Critical patent/KR20160049401A/ko
Application granted granted Critical
Publication of KR101630642B1 publication Critical patent/KR101630642B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 사용자가 선호할 것으로 예상되는 항목을 추천하기 위해 k-인접 이웃 그래프를 활용함으로써, 높은 추천 정확도를 유지함과 동시에 추천 속도를 비약적으로 증가시킬 수 있는 방법을 제공하는 데 있다. 상기한 목적을 달성하기 위한 수단으로써 이 발명의 구성은, 빠르게 k-인접 이웃 그래프를 생성하는 단계와, k-인접 이웃 그래프를 활용해 추천하는 단계를 포함한다. 본 발명에 의하면 사용자의 수가 많거나 추천 가능한 항목이 많더라도, 전처리 시간 및 추천 시간이 급속도로 증가하는 것을 방지하는 효과가 있다.

Description

사용자 맞춤형 항목 추천 방법 및 장치{user-tailored item recommendation method and device}
본 발명은 사용자 맞춤형 항목 추천 방법에 관한 것으로서, 보다 구체적으로는 k-인접 이웃 그래프를 활용하여 항목에 대한 사용자 선호도를 추정하여 항목을 추천하는 방법에 관한 것이다.
협업적 필터링은 가장 인기있는 항목 또는 가장 평점이 높은 항목을 추천하는 기본적 알고리즘에 비해서 높은 정확성을 보장한다.
대표적인 협업적 필터링으로는 사용자 기반 협업적 필터링과 항목 기반 협업적 필터링이 있다. 사용자 기반 협업적 필터링은, 어떤 항목을 선호했던 사용자와 현재 사용자가 유사하다면, 그 항목을 현재 사용자에게 추천한다. 항목 기반 협업적 필터링은, 어떤 새 항목과 유사한 항목을 현재 사용자가 선호한다면, 그 새 항목을 현재 사용자에게 추천한다. 위 기술들은 높은 정확성을 보장하면서도 구현이 용이하기 때문에, 더 높은 정확성을 나타내는 기술들이 개발되고 있음에도 불구하고 산업계와 학계에서 여전히 널리 사용되고 있다.
그러나 이러한 종래기술들은 속도가 충분히 빠르지 않다는 문제점이 있다. 그 첫 번째 이유는, 유사한 사용자 또는 유사한 항목을 찾는 데에 오랜 시간이 걸리기 때문이다. 사용자 기반 협업적 필터링의 경우, 어떤 항목을 선호했던 사용자와 현재 사용자가 유사해야 하는데, 그런 사용자를 찾는 데에 오랜 시간이 걸린다. 항목 기반 협업적 필터링의 경우에도, 어떤 새 항목과 유사한 항목을 현재 사용자가 선호해야 하는데, 그런 대상을 찾는 데에 오랜 시간이 걸린다. 두 번째 이유는, 모든 새 항목에 대한 선호도를 계산해야 하기 때문이다. 일반적으로, 현재 사용자에게 추천될 항목은 전체 새 항목에 비해 매우 적은 수이기 때문에, 모든 새 항목에 대한 선호도를 계산하는 것은 비효율적이다.
특허출원공개 제2002-0000179호 특허출원공개 제2007-0015918호 특허출원공개 제2009-0077073호 특허출원공개 제2013-0099240호
따라서, 본 발명은 상기와 같은 문제점을 해결하고자 한 것으로서, 소요시간을 줄인 사용자 맞춤형 항목 추천 방법 및 장치를 제공하는 것이다.
상기와 같은 본 발명이 해결하고자 하는 기술적 과제를 달성하기 위하여, 본 발명의 일실시예에 따른 사용자 맞춤형 항목 추천 방법은,
k-인접 이웃 그래프를 생성하는 단계와,
상기 k-인접 이웃 그래프를 이용하여 사용자 맞춤형 추천 항목을 선정하는 단계
를 포함하며, 상기 k-인접 이웃 그래프는 각 항목과 유사한 k개의 항목에 대한 정보를 나타내는 것이다.
바람직하게는, 상기 k-인접 이웃 그래프를 생성하는 단계는 다수의 사용자를 차원으로 하고 다수의 항목을 벡터로 하는 매트릭스를 이용하며, 각 벡터에 해당하는 각 차원의 평점 유무를 확인하고, 고평점 차원을 가지면서 겹치지 아니하는 벡터 쌍을 필터링하는 단계를 포함한다.
바람직하게는, 상기 필터링하는 단계는 수식
Figure pat00001
을 이용하며,
여기에서, M(i, dj)는 벡터 υi 및 차원 dj에 대응하는 매트릭스의 초기 값이고, D는 차원 세트이며, VF(dj)는 차원 dj에 대응하는 값을 가지는 벡터의 수이다.
바람직하게는, 상기 k-인접 이웃 그래프를 생성하는 단계는 상기 필터링된 벡터 쌍에 대한 유사도를 계산하는 단계를 포함하는 것이다.
바람직하게는, 상기 평점은 가중치를 반영한 평점이다.
바람직하게는, 상기 추천 항목을 선정하는 단계는,
평점이 매겨지지 않은 미평가 항목들 i에 대하여 항목 리스트를 초기화하는 단계와,
평점이 매겨진 평가 항목들 i에 대하여 k2-인접 이웃 리스트 모두에 대하여 i를 더하는 단계와,
상기 미평가 항목들 i에 대하여 그 리스트가 항목의 k1 숫자보다 많은 항목을 가질 경우에 가장 유사한 k1 항목을 제외한 모든 항목을 삭제하는 단계와,
남은 k개의 상기 미평가 항목들에 대하여 평점을 계산하는 단계
를 포함한다.
바람직하게는, 상기 평점을 계산하는 단계는 수식
Figure pat00002
을 이용하여 평점을 계산하며,
여기에서, list(i)는 미평가 항목 i의 리스트이고, sim(i,n)은 i와 n 사이의 코사인 유사도이다.
바람직하게는, 상기 코사인 유사도는 수식
Figure pat00003
이다.
바람직하게는, 상기 k는 1보다 큰 자연수이다.
바람직하게는, 상기 항목은 영화, 음악 또는 도서이다.
본 발명이 해결하고자 하는 기술적 과제를 달성하기 위하여, 본 발명의 다른 실시예에 따른 사용자 맞춤형 항목 추천 장치는 연산부를 포함하며, 상기 연산부는 k-인접 이웃 그래프를 생성하기 위한 알고리즘을 수행하도록 프로그래밍 되며, 상기 연산부는 상기 k-인접 이웃 그래프를 이용하여 사용자 맞춤형 추천 항목을 선정하는 알고리즘을 수행하도록 프로그래밍 되며, 상기 k-인접 이웃 그래프는 각 항목과 유사한 k개의 항목에 대한 정보를 나타낸다.
이상과 같은 본 발명의 구성에 따르면 방대한 양의 사용자 및 항목 데이터를 가지고 있을 경우에도 효과적이고 빠른 추천 서비스를 제공하는 것이 가능하게 된다.
도 1은 본 발명에 따른 방법의 순서도.
도 2는 본 발명에 따른 방법의 상세 순서도.
도 3과 도 4는 k=20으로 설정하였을 때의 실험 결과를 보여주는 도면.
이하, 첨부된 도면을 참조하여 본 발명에 따른 사용자 맞춤형 항목 추천 방법을 보다 상세히 설명한다.
본 발명은 k-인접 이웃 그래프를 이용한 추천 기술에 관한 것이기 때문에, k-인접 이웃 그래프와 추천 기술에 관한 이해가 필요하다. 먼저, 본 발명에 의한 추천 기술을 설명하기 위하여 이하에서 사용되는 용어들을 정의한다.
'항목'이란 영화, 동영상, 문서 등 객체를 의미한다.
'현재 사용자'란 현재 추천 시스템을 사용하고 있는, 항목이 추천될 사용자를 의미한다.
'새 항목'이란 현재 사용자에 대한 로그가 없는 항목을 의미한다.
'기존 항목'이란 현재 사용자에 대한 로그가 있는 항목을 의미한다.
'k-인접 이웃 그래프'란 각 항목과 가장 유사한 k개의 항목에 대한 정보를 나타내는 그래프를 의미한다.
도 1은 본 발명에 따른 방법의 순서도이다. 먼저 사용자 로그가 입력되면, k-인접 이웃(k-NN) 그래프가 생성된다. 다음에, 현재 사용자의 추천 요청이 입력되면, 미리 계산된 k-인접 이웃 그래프를 이용하여 현재 사용자에게 N개의 새 항목이추천된다.
도 2는 본 발명에 따른 방법에서, k-인접 이웃 그래프의 생성과 N개의 새 항목 추천 방법을 보다 상세하게 보여주는 순서도이다. k-인접 이웃 그래프와 현재 사용자의 추천 요청이 입력으로 주어진다고 가정한다. 새 항목마다 항목 리스트를 생성하고, 그 항목이 기존 항목의 k-인접 이웃이라면, 기존 항목 정보를 리스트에 추가한다. 만약 항목 리스트에 충분한 수의 항목이 채워진다면, 그 항목들을 이용하여, 비정규화(non-normalized) 코사인 이웃(cosine neighborhood) 기반 적합도를 계산하고, 가장 적합도가 높은 N개의 추천 항목을 출력한다.
추천 기술은 새 항목 중 일부를 현재 사용자에게 보여주는 기술이다. 대표적인 방법으로, 만약 어떤 새 항목과 유사한 항목들을 현재 사용자가 좋아했다면, 그 대상을 현재 사용자에게 추천한다. 유사한 대상을 찾기 위해 로그 데이터를 활용하며, 유사도 척도로 코사인 유사도를 활용한다.
(k- NN 그래프 생성)
이하 k-인접 이웃 그래프 생성 과정을 상세하게 설명한다.
k-인접 이웃 그래프 생성은 각 노드에 가장 유사한 k개의 노드(node)를 찾아내는 작업을 수반한다. 노드는 예를 들어 영화, 음악, 도서 등이 될 수 있다. 이때 차원(dimension)은 사용자가 된다. k-인접 이웃 그래프를 생성하는 가장 간단한 방법은 모든 노드 사이의 유사도를 계산하고, 각 노드에 가장 유사한 k개의 노드들을 찾아내는 것이다. 하지만, 데이터의 양이 클 경우 각 노드들을 모두 비교하여 가장 유사한 노드들을 찾아내는 작업에는 많은 시간이 소요된다는 문제가 있다.
이를 해결하기 위해, 본 발명에 따른 방법의 일실시예에 따르면, 그리디 필터링(greedy filtering)이라고 하는 기법을 이용하여 축약된 k-NN 그래프를 생성하여 처리 속도를 증진시키는 방법을 사용한다. 그리디 필터링을 이용하면 차원수가 높은 데이터의 경우에도 NN-Descent 또는 k-NN-Overlap과 같은 k-NN 그래프 생성 알고리듬보다 훨씬 속도가 증진되며, 추천 정확성은 그다지 손실되지 않는다.
d1 d2 d3 d4 d5 d6 d7 d8 d9 d10
υ1 0.52 0.37 0.31 0.33 0.23
υ2 0.73 0.55 0.1 0.37 0.05
υ3 0.25 0.4 0.27 0.29 0.1
υ4 0.25 0.27 0.3 0.35 0.8
υ5 0.48 0.32 0.37 0.34 0.2
표 1은 축약된 k-NN 그래프를 생성하는 원리를 설명하는 예를 보여준다. 표 1에서 행은 다섯 개의 벡터(vector)를 가지며, 열은 열 개의 차원(dimension)을 가진다. 벡터는 예를 들어, 영화, 음악, 도서 등 추천 대상이 되는 항목이 될 수 있고, 차원은 사용자이다. 설명의 편의를 위해, 표 1에 나타난 항목들이 영화라고 가정한다.
표 1에서 다섯 개의 영화 항목(υ1, υ2, υ3, υ4, υ5)이 있고, 10명의 사용자가 있다. 매트릭스에 나타난 수치는 각 영화 항목에 대한 각 사용자(d1, d2, d3, d4, d5, d6, d7, d8, d9, d10)의 선호도이다. 즉, 1열 1행에 표시된 수치 0.52는 사용자 d1이 영화 υ1에 대하여 메긴 선호도 등급을 수치화한 값이다. 매트릭스에 표시하는 선호도 수치는 가중치를 반영한 수치일 수도 있고 가중치가 반영되지 않은 수치를 사용할 수도 있다.
그리디 필터링의 기본 개념은 높은 값의 차원을 가지면서 겹치지 아니하는 벡터 쌍을 필터링하는 것이다. 표 1에서, υ1과 υ2는 공통의 값이 높은 차원을 공유하고 있다. 이에 반해, υ2와 υ4는 공통의 값이 높은 차원을 공유하고 있지 않다. 따라서, υ2와 υ4 사이의 유사도는 계산할 필요가 없다. 이러한 방식으로 각 벡터에 대해 값이 높은 차원이 선택된다. 이 방법을 실제로 사용하면, 인접 매트릭스 대신에 인접 리스트를 사용하게 된다. 따라서, 분석에 사용되는 시간은 현저히 줄어들게 되고, 선호도 추정의 품질은 그다지 저하되지 않게 된다.
Figure pat00004
여기에서, M(υi, dj)는 벡터 υi 및 차원 dj에 대응하는 매트릭스의 초기 값,
D는 차원 세트,
VF(dj)는 차원 dj에 대응하는 값을 가지는 벡터의 수.
예를 들어, TF-IDF 가중치 설정을 이용하여 코사인 유사도를 사용하고 영화 추천 데이터 세트에서 두 개의 영화항목 υ1, υ2가 있다고 가정하면, 그리디 필터링을 사용하였을 때 적어도 하나의 다른 특정 사용자에 의해 높게 평가된 영화항목이 있다면 그들의 유사도가 계산된다.
(신속 추천 알고리즘)
이하에서는 k-인접 이웃 그래프를 이용하여 추천 항목을 선정하는 방법을 상세하게 설명한다.
사용자 기반 협업적 필터링과 항목 기반 협업적 필터링의 두 가지 단점은 해당 사용자에 의존하여 상이한 이웃을 찾아내어야 한다는 점과 평가되지 않은 항목 전부를 예측하여야 한다는 점이다. 본 발명에 따른 알고리즘을 사용하면, 역방향 협업적 필터링을 사용하여 이러한 문제점을 해결한다. 사용자 u가 추천을 요청하면 아래와 같은 순서로 역방향 협업적 필터링이 수행된다.
1. 모든 미평가된 항목들 i에 대하여 항목 리스트가 초기화된다.
2. 모든 평가된 항목들 i에 대하여, k2-NN 리스트 전부에 대하여 i가 더해진다.
3. 모든 미평가 항목들 i에 대하여, 그 리스트가 항목의 k1 숫자보다 많은 항목을 가질 경우에, 가장 유사한 k1 항목을 제외한 모든 항목이 삭제된다.
4. 아래 수학식 2와 같이, 항목들의 k 숫자의 리스트를 가지는 미평가 항목들에 대하여 평점을 추정한다.
Figure pat00005
여기에서, list(i)는 미평가 항목 i의 리스트,
sim(i,n)은 i와 n 사이의 코사인 유사도.
sim(i,n)는 아래 수학식 3과 같이 정의된다.
Figure pat00006
미평가된 항목이 k1 숫자의 항목의 리스트를 가지지 않을 경우, 역방향 협업적 필터링은 평점을 추정하지 않는다.
이 알고리즘의 기본 사상은 평가된 항목 i의 최인접 이웃 중 하나가 미평가된 항목 j일 경우에 미평가된 항목 j의 최인접 이웃 중 하나는 평가된 항목 i일 가능성이 매우 크다는 것이다. 이 때문에 본 알고리즘을 역방향 협업적 필터링이라 칭하는 것이다.
역방향 협업적 필터링의 주요 특징 중 하나는 사용자의 미평가된 항목 전부에 대한 선호도 추정을 하지 않는다는 것이다. 이러한 방법을 사용하더라도 추천 품질은 저하되지 않는데, 그 이유는 두 가지이다. 첫째는 미평가된 아이템의 등급이 역방향 협업적 필터일에 의해 예측될 경우, 역방향 협업적 필터링과 항목 기반 협업적 필터링 알고리즘은 대개의 경우 항목을 예측하기 위해 동일한 이웃을 선택하게 된다. 둘째는, 미평가된 항목의 등급이 역방향 협업적 알고리즘에 의해 예측되지 않을 경우, 미평가 항목의 k-인접 이웃의 평균 유사도 값은 일반적으로 역방향 협업적 필터링에 의해 예측되는 다른 항목의 값보다 낮으며, 이 경우에는 항목 기반 협업적 필터링 알고리즘을 사용하더라도 정확한 등급의 예측이 어렵다.
도 3과 도 4는 k=20으로 설정하였을 때 본 발명의 방법을 이용한 추천 방법의 실험 결과를 보여준다. ItemCF는 항목 기반 협업적 필터링 기법을 의미하고, UserCF는 사용자 기반 협업적 필터링 기법을 의미한다. RCF는 본 발명에 따라 도 2에 나타난 과정을 수행했을 때 나타난 결과이다. RCF+TFIDF+GF (80%)는 도 2의 과정 수행 전, 그리디 필터링 방법을 이용해 빠르게 k-인접 이웃 그래프를 만들었을 때 나타난 결과이다. TF-IDF는 로그 데이터를 표현하는 방법이다. GF는 그리디 필터링 과정을 나타낸다.
본 발명에 따른 방법의 사용시 소요 시간이 현저히 저감되는 것을 알 수 있다.
(예)
본 발명의 방법에 사용될 수 있는 사용자 로그 데이터는 예를 들면, A, B, C, D라는 4개의 영화(항목)가 있고, a, b, c라는 3명의 사람(사용자)이 있다고 하고, 각 사람은 각 영화에 대해 1점에서 5점까지의 평점을 매길 수 있다고 가정한다. a, b, c에 대하여 다음과 같은 로그 데이터가 가능하다.
a = (2, 4, 5, 0)
b = (1, 4, 5, 5)
c = (5, 1, 1, 0)
위 로그 데이터는 아래와 같이 표현할 수도 있다.
A = (2, 1, 5)
B = (4, 4, 1)
C = (5, 5, 1)
D = (0, 5, 0)
이 경우, a는 A, B, C 영화에 대해 각각 2점, 4점, 5점을 매겼고, D 영화를 보지 않았거나 보았지만 평점을 매기지 않았다. b는 A, B, C, D 영화에 대해 각각 1점, 4점, 5점, 5점을 매겼다. c는 A, B, C 영화에 대해 5점 1점, 1점을 매겼고, D 영화를 보지 않았거나 평점을 매기지 않았다.
각 평점에 대하여 가중치를 다르게 줄 수 있는데, 예를 들어 사용자 a에게 가중치를 더 준다면, A = (4, 1, 5)와 같이 표현할 수 있다. 이러한 가중치를 두는 방식의 하나가 TF-IDF이다. 이렇게 가중치를 적용하는 이유는 추후에 유사도를 계산할 시, 더 중요한 사용자에 대해 가중치를 주는 것이 더 의미 있다고 보기 때문이다.
이 경우, 로그 데이터로부터 k-인접 이웃 그래프를 생성하는 것은 A 영화에 대하여 가장 가까운 k개의 영화를 찾고, B 영화에 대하여 가장 가까운 k개의 영화를 찾고, C 영화에 대하여 가장 가까운 k개의 영화를 찾고, D 영화에 대하여 가장 가까운 k개의 영화를 찾는 것이다. B 영화와 가장 가까운 영화는 C이다. B 영화와 C 영화에 각 사람이 가장 유사하게 평점을 매겼기 때문이다. 마찬가지로, C 영화와 가장 가까운 영화는 B 영화이다.
만약 영화가 매우 많다고 가정했을 때, 이렇게 모든 영화에 대해 가장 가까운 k개의 영화를 찾는 과정은 컴퓨터에게 매우 많은 시간이 소요되는 작업이다. 따라서 본 발명의 일실시예에서는 그리디 필터링 즉, GF(Greedy Filtering)를 이용하여 가장 가까운 영화들을 찾게 되는데, GF의 동작 원리는 영화를 자주 보지 않는 사람들이 어떤 두 영화에 대해 비슷하게 점수를 매긴다면, 그 두 개의 영화는 서로 가장 가까운 k개의 영화 중에 포함될 가능성이 높다는 개념에서 출발한다.
유사도 계산에서는, 만약 사용자 d에 대해 영화를 추천한다고 했을 때, d가 좋아한 영화가 어떤 것인지 확인한다. 만약, d가 B 영화에 대해 5점을 매겼다고 하면, B 영화와 가장 가까운 영화는 C 영화이므로, 따라서 d에게 C 영화를 추천한다.
기존에는 C 영화와 가까운 영화가 B 영화이고, B 영화를 b 사용자가 좋아했다면, C 영화를 b 사용자에게 추천하는 방식이었는데(항목 기반 협업적 필터링), RCF는 그와 같은 원리이지만 반대 방향으로 동작한다.

Claims (11)

  1. 사용자 맞춤형 항목 추천 방법에 있어서,
    k-인접 이웃 그래프를 생성하는 단계와,
    상기 k-인접 이웃 그래프를 이용하여 사용자 맞춤형 추천 항목을 선정하는 단계
    를 포함하며,
    상기 k-인접 이웃 그래프는 각 항목과 유사한 k개의 항목에 대한 정보를 나타내는 것인 사용자 맞춤형 항목 추천 방법.
  2. 제1항에 있어서,
    상기 k-인접 이웃 그래프를 생성하는 단계는 다수의 사용자를 차원으로 하고 다수의 항목을 벡터로 하는 매트릭스를 이용하며, 각 벡터에 해당하는 각 차원의 평점 유무를 확인하고, 고평점 차원을 가지면서 겹치지 아니하는 벡터 쌍을 필터링하는 단계를 포함하는 것인 사용자 맞춤형 항목 추천 방법.
  3. 제2항에 있어서,
    상기 필터링하는 단계는, 수식
    Figure pat00007
    을 이용하며,
    여기에서, M(i, dj)는 벡터 υi 및 차원 dj에 대응하는 매트릭스의 초기 값이고, D는 차원 세트이며, VF(dj)는 차원 dj에 대응하는 값을 가지는 벡터의 수인 것인 사용자 맞춤형 항목 추천 방법.
  4. 제2항에 있어서,
    상기 k-인접 이웃 그래프를 생성하는 단계는 상기 필터링된 벡터 쌍에 대한 유사도를 계산하는 단계를 포함하는 것인 사용자 맞춤형 항목 추천 방법.
  5. 제2항에 있어서,
    상기 평점은 가중치를 반영한 평점인 것인 사용자 맞춤형 항목 추천 방법.
  6. 제2항에 있어서,
    상기 추천 항목을 선정하는 단계는
    평점이 매겨지지 않은 미평가 항목들 i에 대하여 항목 리스트를 초기화하는 단계와,
    평점이 매겨진 평가 항목들 i에 대하여 k2-인접 이웃 리스트 모두에 대하여 i를 더하는 단계와,
    상기 미평가 항목들 i에 대하여 그 리스트가 항목의 k1 숫자보다 많은 항목을 가질 경우에 가장 유사한 k1 항목을 제외한 모든 항목을 삭제하는 단계와,
    남은 k개의 상기 미평가 항목들에 대하여 평점을 계산하는 단계
    를 포함하는 것인 사용자 맞춤형 항목 추천 방법.
  7. 제6항에 있어서,
    상기 평점을 계산하는 단계는 수식
    Figure pat00008
    을 이용하여 평점을 계산하며,
    여기에서, list(i)는 미평가 항목 i의 리스트이고, sim(i,n)은 i와 n 사이의 코사인 유사도인 것인 사용자 맞춤형 항목 추천 방법.
  8. 제7항에 있어서,
    상기 코사인 유사도는 수식
    Figure pat00009
    인 것인 사용자 맞춤형 항목 추천 방법.
  9. 제1항에 있어서,
    상기 k는 1보다 큰 자연수인 사용자 맞춤형 항목 추천 방법.
  10. 제1항에 있어서, 상기 항목은 영화, 음악, 도서로 이루어지는 그룹에서 선택되는 것인 사용자 맞춤형 항목 추천 방법.
  11. 사용자 맞춤형 항목 추천 장치에 있어서,
    연산부를 포함하며,
    상기 연산부는 k-인접 이웃 그래프를 생성하기 위한 알고리즘을 수행하도록 프로그래밍 되며,
    상기 연산부는 상기 k-인접 이웃 그래프를 이용하여 사용자 맞춤형 추천 항목을 선정하는 알고리즘을 수행하도록 프로그래밍 되며,
    상기 k-인접 이웃 그래프는 각 항목과 유사한 k개의 항목에 대한 정보를 나타내는 것인 사용자 맞춤형 항목 추천 장치.
KR1020140146456A 2014-10-27 2014-10-27 사용자 맞춤형 항목 추천 방법 및 장치 KR101630642B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140146456A KR101630642B1 (ko) 2014-10-27 2014-10-27 사용자 맞춤형 항목 추천 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140146456A KR101630642B1 (ko) 2014-10-27 2014-10-27 사용자 맞춤형 항목 추천 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20160049401A true KR20160049401A (ko) 2016-05-09
KR101630642B1 KR101630642B1 (ko) 2016-06-15

Family

ID=56020420

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140146456A KR101630642B1 (ko) 2014-10-27 2014-10-27 사용자 맞춤형 항목 추천 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101630642B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190136941A (ko) * 2018-05-31 2019-12-10 한국과학기술원 관측평점과 유사도 그래프를 활용한 추천 알고리즘의 평점 예측 방법
CN112163163A (zh) * 2020-10-14 2021-01-01 广州欢网科技有限责任公司 多算法融合的信息推荐方法、装置和设备
CN113806636A (zh) * 2021-09-23 2021-12-17 湖北天天数链技术有限公司 项目推荐方法、装置、电子设备和计算机存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200200179Y1 (ko) 2000-05-08 2000-10-16 주식회사고려선박기술 부유물 수거장치
KR20060046002A (ko) * 2004-05-28 2006-05-17 마이크로소프트 코포레이션 시작 템플릿과 목표 템플릿 사이의 콘텐츠 맵핑을 위한방법 및 시스템
KR20070015918A (ko) 2004-02-06 2007-02-06 넷플릭스, 인크. 아이템들의 사용자 등급을 추정하기 위한 접근 방식
KR20080040925A (ko) * 2006-11-06 2008-05-09 (주)케이테크 칼라 이미지 스케일의 보간과 보간된 칼라 이미지를 이용한조화색 추천 방법 및 시스템
KR20090077073A (ko) 2006-10-20 2009-07-14 스트랜즈, 아이엔씨. 퍼스널 음악 추천 매핑
KR20090130774A (ko) * 2008-06-16 2009-12-24 성균관대학교산학협력단 사용자 추천 방법 및 이를 위한 프로그램이 기록된 기록매체
KR101259604B1 (ko) * 2011-11-15 2013-05-14 경기대학교 산학협력단 소셜 네트워크 기반의 컨텐츠 추천 시스템 및 컨텐츠 추천 방법
KR20130099240A (ko) 2011-01-06 2013-09-05 이베이 인크. 컴퓨팅 어드바이스 수단에서의 흥미도 추천

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200200179Y1 (ko) 2000-05-08 2000-10-16 주식회사고려선박기술 부유물 수거장치
KR20070015918A (ko) 2004-02-06 2007-02-06 넷플릭스, 인크. 아이템들의 사용자 등급을 추정하기 위한 접근 방식
KR20060046002A (ko) * 2004-05-28 2006-05-17 마이크로소프트 코포레이션 시작 템플릿과 목표 템플릿 사이의 콘텐츠 맵핑을 위한방법 및 시스템
KR20090077073A (ko) 2006-10-20 2009-07-14 스트랜즈, 아이엔씨. 퍼스널 음악 추천 매핑
KR20080040925A (ko) * 2006-11-06 2008-05-09 (주)케이테크 칼라 이미지 스케일의 보간과 보간된 칼라 이미지를 이용한조화색 추천 방법 및 시스템
KR20090130774A (ko) * 2008-06-16 2009-12-24 성균관대학교산학협력단 사용자 추천 방법 및 이를 위한 프로그램이 기록된 기록매체
KR20130099240A (ko) 2011-01-06 2013-09-05 이베이 인크. 컴퓨팅 어드바이스 수단에서의 흥미도 추천
KR101259604B1 (ko) * 2011-11-15 2013-05-14 경기대학교 산학협력단 소셜 네트워크 기반의 컨텐츠 추천 시스템 및 컨텐츠 추천 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190136941A (ko) * 2018-05-31 2019-12-10 한국과학기술원 관측평점과 유사도 그래프를 활용한 추천 알고리즘의 평점 예측 방법
CN112163163A (zh) * 2020-10-14 2021-01-01 广州欢网科技有限责任公司 多算法融合的信息推荐方法、装置和设备
CN112163163B (zh) * 2020-10-14 2024-03-19 广州欢网科技有限责任公司 多算法融合的信息推荐方法、装置和设备
CN113806636A (zh) * 2021-09-23 2021-12-17 湖北天天数链技术有限公司 项目推荐方法、装置、电子设备和计算机存储介质

Also Published As

Publication number Publication date
KR101630642B1 (ko) 2016-06-15

Similar Documents

Publication Publication Date Title
US9087108B2 (en) Determination of category information using multiple stages
CN103164463B (zh) 推荐标签的方法和装置
US9280565B1 (en) Systems, methods, and computer program products for displaying images
US20120035978A1 (en) System for and Method of Determining Relative Value of a Product
JP5493597B2 (ja) 検索方法及び検索システム
US20190012719A1 (en) Scoring candidates for set recommendation problems
US20150186947A1 (en) Digital content recommendations based on user comments
JP2019125313A (ja) 学習装置、学習方法および学習プログラム
KR102167593B1 (ko) 분산 퍼지 연관 규칙 마이닝에 기반한 영화 추천 장치 및 방법
JP5662299B2 (ja) 情報推薦装置及び方法及び装置及びプログラム
JP2017054214A (ja) 判定装置、学習装置、情報配信装置、判定方法及び判定プログラム
TW201814556A (zh) 資訊匹配方法及相關裝置
CN105447005B (zh) 一种对象推送方法及装置
KR101630642B1 (ko) 사용자 맞춤형 항목 추천 방법 및 장치
CN111078858A (zh) 文章搜索方法、装置及电子设备
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
Park et al. Fast Collaborative Filtering with a k-nearest neighbor graph
JP6077984B2 (ja) アイテム推薦装置、アイテム推薦方法、およびアイテム推薦プログラム
KR101334096B1 (ko) 높은 연관성을 가지는 아이템을 추천하는 아이템 기반의 추천 엔진
US10579752B2 (en) Generating a model based on input
Phuong Collaborative filtering with a graph-based similarity measure
CN106445922B (zh) 确定多媒体资源的标题的方法及装置
JP6831719B2 (ja) 情報処理システム、情報処理方法、およびプログラム
Das et al. Weighted slope one with threshold filtering
JP6680472B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190520

Year of fee payment: 4