KR20140079639A - 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법 - Google Patents

협업 필터링을 위한 emd 기반 유사 사용자 선별 방법 Download PDF

Info

Publication number
KR20140079639A
KR20140079639A KR1020120148150A KR20120148150A KR20140079639A KR 20140079639 A KR20140079639 A KR 20140079639A KR 1020120148150 A KR1020120148150 A KR 1020120148150A KR 20120148150 A KR20120148150 A KR 20120148150A KR 20140079639 A KR20140079639 A KR 20140079639A
Authority
KR
South Korea
Prior art keywords
user
similar
item
similarity
target user
Prior art date
Application number
KR1020120148150A
Other languages
English (en)
Other versions
KR101620659B1 (ko
Inventor
김상욱
이상철
정세현
강윤석
장민희
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020120148150A priority Critical patent/KR101620659B1/ko
Publication of KR20140079639A publication Critical patent/KR20140079639A/ko
Application granted granted Critical
Publication of KR101620659B1 publication Critical patent/KR101620659B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

협업 필터링을 위한 EMD 기반 유사 사용자 선별 방법이 개시된다. 타겟 사용자에 대한 유사 사용자를 선별하는 방법은 사용자에 대한 정보를 이용하여 상기 사용자의 아이템에 대한 선호도를 나타내는 히스토그램을 각각 생성하는 단계, 상기 생성된 히스토그램을 기초로 EMD(Earth Mover's Distance)를 이용하여 상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계 및 상기 계산된 유사도를 기초로 상기 타겟 사용자에 대한 유사 사용자를 선별하는 단계를 포함할 수 있다.

Description

협업 필터링을 위한 EMD 기반 유사 사용자 선별 방법{METHOD FOR SELECTING SIMILAR USERS FOR COLLABORATIVE FILTERING BASED ON EARTH MOVER´S DISTANCE}
본 발명의 실시예들은 협업 필터링을 위하여 타겟 사용자와 유사한 사용자를 선별하는 협업 필터링을 위한 EMD(Earth Mover's Distance) 기반 유사 사용자 선별 방법에 관한 것이다.
일반적으로 추천 방법은 다양한 아이템 중에서 사용자가 선호할 만한 아이템을 찾아주는 방법을 말한다. 협업 필터링(Collaborative Filtering) 기법은 가장 널리 사용되는 추천 방법 중 하나로서, 추천 대상 사용자(타겟 사용자)와 성향이 유사한 사용자를 이용하여 아이템을 추천한다. 따라서, 협업 필터링의 성능은 타겟 사용자와 얼마나 유사한 사용자를 선별할 수 있느냐에 따라 달라진다.
일 예로 한국공개특허공보 제10-2008-0043140호(공개일 2008년 5월 16일) "협업 필터링 시스템 및 방법"에는 사용자의 컨텐츠 이용정보와 사용자 속성정보를 이용하여 가중치를 적용하고, 보편 타당한 사용자가 아니라고 판단된 사용자의 행위를 필터링함으로써 컨텐츠를 추천하는 것이 개시되어 있다.
그러나, 이러한 기존의 협업 필터링 기법은 유사한 사용자와 타겟 사용자가 공통적으로 평가한 아이템이 존재할 경우에만 해당 사용자 간의 유사도를 측정할 수 있을 뿐 타겟 사용자가 아이템을 평가하지 않은 경우에는 유사한 사용자와 타겟 사용자 간의 유사도를 측정할 수 없다는 문제점이 있다.
따라서, 타겟 사용자가 아이템을 평가하지 않은 경우에도 보다 정확하게 타겟 사용자와 유사한 사용자를 선별할 수 있는 방법이 요구되고 있다.
사용자 간의 유사도를 측정할 때 아이템 간의 연관성을 반영함으로써 타겟 사용자가 아이템을 평가하지 않은 경우에도 보다 정확하게 타겟 사용자와 유사한 사용자를 선별할 수 있는 협업 필터링을 위한 EMD 기반 유사 사용자 선별 방법이 개시된다.
협업 필터링을 이용 시 양질의 추천이 가능한 협업 필터링을 위한 EMD 기반 유사 사용자 선별 방법이 개시된다.
타겟 사용자에 대한 유사 사용자를 선별하는 방법은 사용자에 대한 정보를 이용하여 상기 사용자의 아이템에 대한 선호도를 나타내는 히스토그램을 각각 생성하는 단계, 상기 생성된 히스토그램을 기초로 EMD(Earth Mover's Distance)를 이용하여 상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계 및 상기 계산된 유사도를 기초로 상기 타겟 사용자에 대한 유사 사용자를 선별하는 단계를 포함할 수 있다.
일측에 따르면, 상기 사용자에 대한 정보는 상기 사용자의 식별자, 상기 사용자가 구매 또는 이용한 아이템의 식별자 및 상기 사용자의 해당 아이템에 대한 평가 점수를 포함할 수 있다.
다른 측면에 따르면, 상기 생성하는 단계는 상기 히스토그램의 각 빈을 아이템의 카테고리로 결정하는 단계 및 상기 아이템에 대한 평균 평가 점수 또는 각 카테고리 내에서 평가한 아이템의 수를 상기 카테고리에 대한 선호도로 결정하는 단계를 포함할 수 있다.
또 다른 측면에 따르면, 상기 계산하는 단계 이전에 두 카테고리에 동시에 포함하는 아이템의 비중을 이용하여 상기 두 카테고리 간의 거리를 계산함으로써 상기 두 카테고리 간의 유사도를 계산하는 단계를 더 포함하고, 상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계는 카테고리 간의 거리가 계산된 히스토그램을 기초로 상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계일 수 있다.
또 다른 측면에 따르면, 상기 선별된 유사 사용자에 대한 정보는 상기 선별된 유사 사용자에 대한 정보를 기초로 협업 필터링을 이용하여 상기 타겟 사용자가 각 아이템에 부여할 점수를 예측하고, 상기 예측된 점수를 기초로 상기 타겟 사용자에게 추천할 아이템을 선정하는데 이용될 수 있다.
EMD(Earth Mover's Distance)를 이용하여 타겟 사용자와 유사한 취향을 가지는 사용자를 선별함으로써 타겟 사용자에 대한 유사 사용자를 정확하게 찾아낼 수 있다.
타겟 사용자에 대한 유사 사용자를 정확하게 찾아낼 수 있기 때문에 협업 필터링 이용 시 양질의 추천이 가능하다.
도 1은 본 발명의 일실시예에 있어서, EMD(Earth Mover's Distance)를 기반으로 유사 사용자를 선별하고 아이템을 추천하는 방법을 나타내는 흐름도이다.
도 2는 특정 사용자와 각 영화에 대한 정보 간의 관계를 나타내는 예시도이다.
도 3은 본 발명의 일실시예에 있어서, 특정 사용자를 히스토그램을 표현한 예시도이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 있어서, EMD(Earth Mover's Distance)를 기반으로 유사 사용자를 선별하고 아이템을 추천하는 방법을 나타내는 흐름도이다.
협업 필터링을 이용하여 타겟 사용자에게 추천하고자 하는 아이템을 선별하기 위해서는 우선 각 아이템에 대하여 타겟 사용자와 유사한 성향을 가지는 유사 사용자를 선별해야 한다.
유사 사용자가 선별되면, 유사 사용자들이 평가한 아이템들을 기초로 협업 필터링을 이용하여 타겟 사용자가 평가하지 않은 아이템의 평점을 예측할 수 있다. 그리고, 예측된 평점을 기반으로 타겟 사용자에게 아이템을 추천할 수 있다. 그러므로, 협업 필터링 기법의 추천 품질을 향상시키기 위해서는 타겟 사용자와 유사한 사용자를 선별하는 것이 매우 중요하다.
따라서, 본 발명에 따른 유사 사용자 선별 방법은 보다 정확하게 유사 사용자를 선별하기 위하여 사용자들의 과거 아이템 이용 내역을 기초로 EMD(Earth Mover's Distance)를 이용하여 사용자들과 타겟 사용자 간의 유사도를 계산한다(110).
EMD는 이미지 프로세싱(Image Processing) 분야에서 널리 사용되는 유사도 측정 함수로서, 그 정확도가 매우 높은 것으로 알려져 있다. 그러나, 유사 사용자 선별에 EMD를 적용하기 위해서는 우선 사용자에 대한 정보를 EMD에 적용 가능한 히스토그램 형태로 표현해야 한다. 이 때, 사용자에 대한 정보는 사용자의 식별자, 해당 사용자가 구매한 또는 이용한 아이템의 식별자 및 해당 아이템에 대한 평가 점수를 포함할 수 있다. 또한, 유사 사용자 선별에 EMD를 적용하기 위해서는 히스토그램의 빈(bin) 간의 거리가 정의되어 있어야 한다.
따라서, 본 발명에 따른 유사 사용자 선별 방법은 사용자 간의 유사도를 계산 시 EMD를 이용하기 위하여 임의의 사용자에 대한 히스토그램의 각 빈을 아이템의 카테고리로 정의하고, 해당 카테고리에 대한 선호도를 해당 카테고리의 값으로 표현함으로써 사용자의 아이템에 대한 선호도를 나타내는 히스토그램을 생성할 수 있다. 이 때, 선호도로서 각 아이템의 평균 평가 점수를 이용하거나 각 카테고리 내에서 평가한 아이템의 수를 이용할 수 있다.
일 예로, 본 발명에 따른 유사 사용자 선별 방법은 EMD를 이용하여 사용자 간의 거리를 측정하기 위해 비교하고자 하는 두 사용자 간의 데이터를 히스토그램으로 표현할 수 있다. 두 히스토그램 P={p1, p2, ..., pn}, Q={q1, q2, ...,qn}가 있을 때 pi, qi는 각 히스토그램의 i번째 빈(bin)의 비중(weight)을 의미한다. 여기서, P와 Q의 비율 총합은 동일하다고 가정한다.
그리고, 이 두 데이터 간의 거리를 측정하기 위해 최소(minimum) WORK를 계산한다. WORK란 히스토그램 P의 분포를 Q의 분포로 옮기는데 들어가는 최소의 양을 의미한다. 일 예로, WORK는 다음의 수학식 1과 같이 한 히스토그램에서 다른 히스토그램으로 옮겨진 빈들의 양(f)과 히스토그램 각 빈 간의 거리(d)의 곱으로 구할 수 있다.
Figure pat00001
여기서, F=[fij]는 pi에서 qi로 옮겨진 히스토그램 빈의 양을 의미하고, D=[dij]는 옮겨진 빈 간의 거리를 의미한다.
EMD는 이처럼 히스토그램 각 빈 간의 거리(d)를 통해 히스토그램 내 다른 위치의 빈 간에도 유사도를 측정할 수 있기 때문에 정확도가 매우 높다.
EMD를 통해 사용자들과 타겟 사용자 간의 유사도가 계산되면, 계산된 유사도를 기초로 타겟 사용자와 유사한 사용자를 검색함으로써 타겟 사용자에 대한 유사 사용자를 선별할 수 있다(120).
타겟 사용자와 유사한 사용자들이 선별되면, 유사 사용자들이 과거 평가했던 아이템에 대한 점수를 기초로 협업 필터링을 이용하여 타겟 사용자가 해당 아이템에 부여할 점수를 예측할 수 있다(130).
타겟 사용자가 아이템에 부여할 점수가 예측되면 이를 기초로 타겟 사용자에게 추천할 아이템들을 선정할 수 있고(140), 따라서 선정된 아이템들을 타겟 사용자에게 추천할 수 있다(150).
상술한 유사 사용자 선별 방법은 유사 사용자를 선별 장치에 의해 수행될 수 있다. 유사 사용자 선별 장치는 사용자에 대한 정보를 이용하여 사용자의 아이템에 대한 선호도를 나타내는 히스토그램을 각각 생성하는 생성부, 상기 생성된 히스토그램을 기초로 EMD(Earth Mover's Distance)를 이용하여 사용자와 타겟 사용자 간의 유사도를 계산하는 계산부 및 상기 계산된 유사도를 기초로 타겟 사용자에 대한 유사 사용자를 선별하는 선별부를 포함할 수 있다.
도 2는 특정 사용자와 각 영화에 대한 정보 간의 관계를 나타내는 예시도이고, 도 3은 본 발명의 일실시예에 있어서 특정 사용자를 히스토그램을 표현한 예시도이다. 이하, 도 2 및 도 3을 참조하여, 유사 사용자를 선별하는 과정에 대해 예를 들어 보다 상세히 설명한다.
먼저 도 2를 참조하면, 사용자 데이터(USER DATA)는 사용자 ID, 사용자가 평가한 영화 ID 및 해당 영화에 대한 평가 점수로 구성될 수 있다. 그리고, 아이템 데이터(ITEM DATA)는 영화 ID 및 해당 영화가 속한 카테고리 ID로 구성될 수 있다. 이 때, 하나의 영화는 여러 카테고리에 포함될 수 있다.
이와 같은 사용자 데이터와 아이템 데이터를 이용하여 해당 사용자에 대한 정보를 히스토그램으로 나타내면 도 3과 같다. 여기서, x축은 히스토그램의 각 빈을 나타내며, y축은 각 빈의 비중을 나타낸다. 그리고, 빈의 비중은 해당 빈에 대응하는 카테고리 안의 영화에 대하여 해당 사용자가 부여한 평균 평가 점수를 나타낸다. 예를 들어, 해당 사용자의 로맨스(Romance)에 해당하는 빈의 비중은 "4"를 의미한다.
유사 사용자 선별에 EMD를 적용하기 위해서는 각 빈간의 거리(ground distance)를 정의해야 한다. 그러나, 기존의 협업 필터링에는 카테고리 간의 거리가 정의되어 있지 않다. 또한, 카테고리는 서로 독립적이기 때문에 기존 EMD에서 일반적으로 사용하는 거리 함수 공식인 유클리드(Euclidean) 거리를 사용 할 수가 없다. 따라서, 본 발명에서는 다음의 수학식 2를 기초로 두 카테고리에서 동시에 존재하는 아이템의 비중을 이용하여 카테고리간 거리를 계산할 수 있다.
Figure pat00002
여기서, x, y는 카테고리 ID, Ix는 카테고리 x에 속한 아이템 집합, Iy는 카테고리 y에 속한 아이템 집합을 나타낸다.
앞서 제안한 기법을 다음의 수학식 3과 같은 협업 필터링 기법에 적용함으로써 타겟 사용자의 아이템에 대한 평가 점수를 예측할 수 있다.
Figure pat00003
여기서, ruq는 사용자(u)가 아이템(q)에 대해 예측 할 평가 점수,
Figure pat00004
는 사용자(u)의 평균 평가 점수, Nuq는 사용자(u)와 아이템(q)을 기준으로 했을 때 유사 사용자의 집합, v와 j는 집합 Nuq에 속한 사용자, rvq는 사용자(v)가 아이템(q)를 평가한 평가 점수, 그리고
Figure pat00005
는 사용자(v)의 평균 평가 점수를 각각 나타낸다. sim(x, y)는 사용자 x 와 y 간의 유사도이며, 본 발명에서는 EMD 기반의 유사도를 사용한다.
이하에서는 MovieLens 데이터를 이용한 실험 결과를 통해 본 발명에 따른 유사 사용자 선별 방법이 기존 기법에 비해 정확도와 다양성이 모두 우수함을 검증한다. k-folding 방식으로 트레이닝 데이터와 테스트 셋을 구성하며, 기존 코사인을 이용하여 유사 사용자를 찾는 기법, Pearson 상관 관계수를 이용하여 유사 사용자를 찾는 기법과 제안하는 기법의 정확도를 비교한다.
실험 결과의 정확도를 나타내는 척도로는 MAE(Mean Absolute Error)와 RMSE(Root Mean Square Error)가 사용되었다. MAE는 실제값과 예측값의 오차에 대한 절대값들의 평균이며, RMSE는 실제값과 예측값의 오차의 제곱에 대한 평균의 제곱근이다.
다음의 표 1은 사용자의 선호도를 평가한 영화의 수로 했을 때의 정확도를 나타낸다.
평가 대상 MAE RMSE
Count Cosine 0.90 1.76
Count Pearson 1.03 1.94
Count EMD 0.80 1.61
표 1을 참조하면, 본 발명에 따른 유사 사용자 선별 방법이 코사인 유사도에 비해 MAE는 11.33%, RMSE는 8.49% 향상 되었으며, Pearson 상관계수에 비해 MAE는 22.89%, RMSE는 17.03% 향상되었음을 알 수 있다.
다음의 표 2는 사용자의 선호도를 장르별 평균 평점으로 했을 경우의 정확도를 나타낸다.
평가 대상 MAE RMSE
평점 Cosine 0.92 1.80
평점 Pearson 0.83 2.29
평점 EMD 0.80 1.61
표 2를 참조하면, 본 발명에 따른 유사 사용자 선별 방법이 코사인 유사도에 비해 MAE는 13.10%, RMSE는 10.16% 향상 되었으며, Pearson 상관계수보다 MAE는 4.35%, RMSE는 29.66%향상 되었음을 알 수 있다.
즉, 본 발명에 따른 유사 사용자 선별 방법을 이용하는 경우, 코사인 유사도를 이용하는 경우에 비해 MAE는 최대 13%, RMSE는 최대 10% 향상되며, Pearson 상관계수를 이용하는 경우에 비해 MAE는 최대 23%, RMSE는 최대 30% 향상됨을 알 수 있다.
이상에서 설명된 유사 사용자 선별 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다.  예를 들어, 실시예들에서 설명된 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다.  유사 사용자 선별 장치는 운영 체제(OS: Operating System) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 실행할 수 있다.  또한, 유사 사용자 선별 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 구성요소는 각각 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 유사 사용자 선별 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 유사 사용자 선별 장치를 원하는 대로 동작하도록 하거나 독립적으로 또는 결합적으로(collectively) 명령할 수 있다.  소프트웨어 및/또는 데이터는, 유사 사용자 선별 장치에 의하여 해석되거나 유사 사용자 선별 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
본 실시예에 따른 유사 사용자 선별 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.  상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (5)

  1. 타겟 사용자에 대한 유사 사용자를 선별하는 방법에 있어서,
    사용자에 대한 정보를 이용하여 상기 사용자의 아이템에 대한 선호도를 나타내는 히스토그램을 각각 생성하는 단계;
    상기 생성된 히스토그램을 기초로 EMD(Earth Mover's Distance)를 이용하여 상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계; 및
    상기 계산된 유사도를 기초로 상기 타겟 사용자에 대한 유사 사용자를 선별하는 단계;
    를 포함하는 유사 사용자 선별 방법.
  2. 제1항에 있어서,
    상기 사용자에 대한 정보는,
    상기 사용자의 식별자, 상기 사용자가 구매 또는 이용한 아이템의 식별자 및 상기 사용자의 해당 아이템에 대한 평가 점수를 포함하는 것을 특징으로 하는 유사 사용자 선별 방법.
  3. 제1항에 있어서,
    상기 생성하는 단계는,
    상기 히스토그램의 각 빈을 아이템의 카테고리로 결정하는 단계; 및
    상기 아이템에 대한 평균 평가 점수 또는 각 카테고리 내에서 평가한 아이템의 수를 상기 카테고리에 대한 선호도로 결정하는 단계
    를 포함하는 것을 특징으로 하는 유사 사용자 선별 방법.
  4. 제3항에 있어서,
    상기 계산하는 단계 이전에,
    두 카테고리에 동시에 포함하는 아이템의 비중을 이용하여 상기 두 카테고리 간의 거리를 계산함으로써 상기 두 카테고리 간의 유사도를 계산하는 단계를 더 포함하고,
    상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계는,
    카테고리 간의 거리가 계산된 히스토그램을 기초로 상기 사용자와 타겟 사용자 간의 유사도를 계산하는 단계인 것을 특징으로 하는 유사 사용자 선별 방법.
  5. 제1항에 있어서,
    상기 선별된 유사 사용자에 대한 정보는,
    상기 선별된 유사 사용자에 대한 정보를 기초로 협업 필터링을 이용하여 상기 타겟 사용자가 각 아이템에 부여할 점수를 예측하고, 상기 예측된 점수를 기초로 상기 타겟 사용자에게 추천할 아이템을 선정하는데 이용되는 것을 특징으로 하는 유사 사용자 선별 방법.
KR1020120148150A 2012-12-18 2012-12-18 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법 KR101620659B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120148150A KR101620659B1 (ko) 2012-12-18 2012-12-18 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120148150A KR101620659B1 (ko) 2012-12-18 2012-12-18 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법

Publications (2)

Publication Number Publication Date
KR20140079639A true KR20140079639A (ko) 2014-06-27
KR101620659B1 KR101620659B1 (ko) 2016-05-13

Family

ID=51130659

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120148150A KR101620659B1 (ko) 2012-12-18 2012-12-18 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법

Country Status (1)

Country Link
KR (1) KR101620659B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160064446A (ko) 2014-11-28 2016-06-08 이종찬 선호 점수를 이용한 협력적 필터링 기반 선호도 예측 방법
KR20160064448A (ko) 2014-11-28 2016-06-08 이종찬 유사 집합의 예상 선호도 대비 기반 아이템 추천 제공 방법
KR20160064447A (ko) 2014-11-28 2016-06-08 이종찬 협력적 필터링의 예측 선호도를 이용한 처음 사용자에 대한 추천 제공 방법
KR20180077717A (ko) * 2016-12-29 2018-07-09 서울대학교산학협력단 정점 분류 장치 및 정점 분류 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5469046B2 (ja) * 2010-12-09 2014-04-09 日本電信電話株式会社 情報検索装置、情報検索方法及び情報検索プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160064446A (ko) 2014-11-28 2016-06-08 이종찬 선호 점수를 이용한 협력적 필터링 기반 선호도 예측 방법
KR20160064448A (ko) 2014-11-28 2016-06-08 이종찬 유사 집합의 예상 선호도 대비 기반 아이템 추천 제공 방법
KR20160064447A (ko) 2014-11-28 2016-06-08 이종찬 협력적 필터링의 예측 선호도를 이용한 처음 사용자에 대한 추천 제공 방법
KR20180077717A (ko) * 2016-12-29 2018-07-09 서울대학교산학협력단 정점 분류 장치 및 정점 분류 방법

Also Published As

Publication number Publication date
KR101620659B1 (ko) 2016-05-13

Similar Documents

Publication Publication Date Title
JP5980311B2 (ja) ビデオ・シグネチャ
CN109829775B (zh) 一种物品推荐方法、装置、设备及可读存储介质
CN110879864B (zh) 一种基于图神经网络和注意力机制的上下文推荐方法
KR101620748B1 (ko) 아이템 추천 방법 및 아이템 추천 장치
RU2617921C2 (ru) Способ и система распознания пути категории
CN108280843A (zh) 一种视频目标检测跟踪方法及设备
US11544751B2 (en) Quotation method executed by computer, quotation device, electronic device and storage medium
KR101620659B1 (ko) 협업 필터링을 위한 emd 기반 유사 사용자 선별 방법
CN111144874B (zh) 支付方式推荐方法、装置及设备
WO2016202214A2 (zh) 一种关键词的展示方法和装置
CN108446297B (zh) 一种推荐方法及装置,电子设备
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
KR101725510B1 (ko) 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치
KR20130134046A (ko) 하이브리드 협업적 여과 방법을 이용한 코사인 유사도 기반 전문가 추천 장치 및 방법
CN112085058A (zh) 一种对象组合召回方法、装置、电子设备及存储介质
CN111242318A (zh) 基于异构特征库的业务模型训练方法及装置
CN110347935A (zh) 基于用户兴趣变化的个性化影视项目推荐方法及系统
CN105260458A (zh) 一种用于显示装置的视频推荐方法及显示装置
CN110889737A (zh) 合租室友的推荐方法、装置、服务器及存储介质
US9460393B2 (en) Inference of anomalous behavior of members of cohorts and associate actors related to the anomalous behavior based on divergent movement from the cohort context centroid
JP5903376B2 (ja) 情報推薦装置、情報推薦方法、及び情報推薦プログラム
CN110209927B (zh) 个性化推荐方法、装置、电子设备及可读存储介质
CN104850600B (zh) 一种用于搜索包含人脸的图片的方法和装置
CN104798035A (zh) 调整应用任务开发
KR102170535B1 (ko) 감성 분석을 통한 사용자 선호 기반의 검색 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190415

Year of fee payment: 4