KR101592220B1 - 예측적 군집화 기반 협업 필터링 장치 및 방법 - Google Patents

예측적 군집화 기반 협업 필터링 장치 및 방법 Download PDF

Info

Publication number
KR101592220B1
KR101592220B1 KR1020150042144A KR20150042144A KR101592220B1 KR 101592220 B1 KR101592220 B1 KR 101592220B1 KR 1020150042144 A KR1020150042144 A KR 1020150042144A KR 20150042144 A KR20150042144 A KR 20150042144A KR 101592220 B1 KR101592220 B1 KR 101592220B1
Authority
KR
South Korea
Prior art keywords
user
symbol
transition
item
preference
Prior art date
Application number
KR1020150042144A
Other languages
English (en)
Inventor
이오준
유은순
조병준
Original Assignee
단국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 단국대학교 산학협력단 filed Critical 단국대학교 산학협력단
Priority to KR1020150042144A priority Critical patent/KR101592220B1/ko
Application granted granted Critical
Publication of KR101592220B1 publication Critical patent/KR101592220B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06F19/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

사용자들을 기호에 따라 군집화(Clustering)하고 각 기호를 나타내는 기호 벡터를 생성하는 기호 군집화 단계, 기호 벡터들을 이용하여 사용자들의 기호 변화를 탐지하고 상기 기호 변화를 기호 전이 시퀀스로 표현하는 사용자 기호 전이 탐지 단계, 사용자들을 기호 전이 패턴에 따라 군집화하고 각 성향을 나타내는 기호 전이모델을 생성하는 성향 군집화 단계, 상기 기호 벡터와 상기 기호 전이모델을 바탕으로 사용자 선호도 예측모델을 생성하고 사용자의 각 아이템에 대한 선호도를 예측하는 선호도 예측 단계를 포함하고, 사용자의 특정 아이템에 대한 선호도를 정확하게 예측하기 위한 예측적 군집화 기반 협업 필터링 장치 및 방법에 관한 것이다.

Description

예측적 군집화 기반 협업 필터링 장치 및 방법 {APPARATUS AND METHOD FOR PREDICTIVE CLUSTERING-BASED COLLABORATIVE FILTERING}
본 발명은, 추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 장치 및 방법에 관한 것이다. 더욱 상세하게는 본 발명은 군집화 기반 협업 필터링에 마르코프 전이 확률 모델과 퍼지 군집화 개념을 접목하여 사용자의 기호 변화를 추적하고 이를 활용해 사용자의 각 아이템에 대한 선호도를 예측하는 예측적 군집화 기반 협업 필터링 장치 및 방법에 관한 것이다.
인터넷의 진화로 사용자들이 접근할 수 있는 정보의 양이 폭발적으로 증가함에 따라 사용자들은 인터넷상에서 필요한 정보를 찾는데 많은 어려움을 겪고 있다.
정보 과부하로 인해 발생하는 문제들을 해결하기 위해 사용자의 취향과 선호도를 고려하여 사용자에게 맞는 정보를 제공해주는 추천시스템이 그 어느 때보다도 중요해졌다. 사용자의 입맛에 맞는 상품을 제공하는 개인화된 맞춤형 추천 시스템은 사용자의 만족도와 고객 충성도를 향상시키며, 전자 소매상의 이윤을 크게 증가시킨다.
현재 아마존, 구글, 넷플릭스, 티보 그리고 야후와 같은 선도 기업들은 이미 개인화된 추천이 가능한 추천 시스템을 운용하고 있다. 이 시스템들의 주요한 요구사항은 추천의 성능(performance)과 시스템의 확장성(scalability)이다. 이 요구사항들을 충족시키기 위해, 내용 기반 필터링(CBF, Content-Based Filtering), 인구통계학적 필터링(DF, Demographic Filtering), 협업 필터링(CF, Collaborative Filtering) 등의 기법들이 제안되었다.
그러나, 이들 중 내용 기반 필터링과 인구 통계학적 필터링은 외부 정보를 필요로 한다는 한계점으로 인해, 다양한 도메인에 적용이 불가능하다. 따라서 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다.
협업 필터링 기법들은 크게 메모리 기반 협업 필터링, 모델 기반 협업 필터링, 하이브리드 협업 필터링으로 나눌 수 있다.
이 중, 모델 기반 협업 필터링은 베이지안(Bayesian) 모델이나 군집화 모델, 의존성 네트워크 등의 모델을 사용해서 기존 협업 필터링의 단점을 보완한 방법이다. 모델 기반 협업 필터링은 희박성 문제와 확장성 문제 등을 개선하며, 예측 신뢰도를 높일 수 있다. 하지만, 모델 생성 비용이 크고 성능과 확장성 간의 트레이드오프(trade-off)가 발생하는 문제점이 있다.
종래 기술의 문제들을 해결하기 위해 사용자 또는 아이템의 추가와 평가 점수의 입력에 따라 해당 사용자나 아이템의 군집을 지역적으로 재배치하는 방법을 사용하는 적응형 군집화 기반 협업 필터링(ACCF, Adaptive Clustering based CF)이 제안되었으나, 적응형 군집화 기반 협업 필터링은 시스템의 부담을 가중시키며, 기존 협업 필터링 기법들의 신뢰도 불안정성을 완전히 해결하지 못하는 문제점이 있다.
따라서, 사용자의 특정 아이템에 대한 선호도를 예측하기 위해, 사용자의 기호 변화를 추적하고 마르코프 확률 전이 모델을 사용하여 기존 협업 필터링의 희박성 문제와 확장성 문제를 개선하고 신뢰도 불안정성 문제를 해결할 수 있는 예측적 군집화 기반 협업 필터링 장치 및 방법이 필요한 실정이다.
한국 등록특허공보 1054088호(2011.07.28.)
Gong, s., "A Collaborative Filtering Recommendation Algorithm Based on User Clustering and Item Clustering", Journal of Soft ware, Vol.5, No.7, (2010), 745~752.
본 발명의 목적은, 상기 문제점을 해결하기 위한 것으로, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화 개념을 접목하여 적용 범위 감소 문제와 성능 불안정성 문제를 해결하여 사용자의 특정 아이템에 대한 선호도를 정확하게 예측하기 위함이다.
또한, 본 발명의 목적은, 사용자의 기호의 변화를 전이 확률 모델을 이용하여 추적하여, 기호 변화를 고려하지 않는 정적인 모델과 기호가 동적으로 변화하는 실제 사용자의 괴리를 해소하여 성능 불안정성 문제를 해결하고 사용자의 기호의 전이 확률과 사용자가 어떤 군집에 소속되는지 판단하는 군집 소속 확률을 이용하여 적용 범위를 확장하여 적용범위 감소문제를 개선하여 사용자의 특정 아이템에 대한 선호도를 정확하게 예측하기 위함이다.
상기한 목적을 달성하기 위한 본 발명에 따른 예측적 군집화 기반 협업 필터링 장치는, 사용자들을 기호에 따라 군집화(Clustering)하고 각 기호를 나타내는 기호 벡터를 생성하는 기호 군집화부, 상기 기호 벡터들을 이용하여 사용자들의 기호 변화를 탐지하고 상기 기호 변화를 기호 전이 시퀀스로 표현하는 사용자 기호 전이 탐지부, 사용자들을 기호 전이 패턴에 따라 군집화하고 각 성향을 나타내는 기호 전이모델을 생성하는 성향 군집화부, 상기 기호 벡터와 상기 기호 전이모델을 바탕으로 사용자 선호도 예측모델을 생성하고 사용자의 각 아이템에 대한 선호도를 예측하는 선호도 예측부를 포함한다.
이 때, 상기 기호 군집화부는, 사용자들을 각 아이템 군집에 대한 선호도에 따라 군집화하여, 사용자들의 기호를 정규화한다. 상기 기호 군집화부는 아이템들간의 유사도를 기준으로 아이템을 군집화하는 아이템 군집화부, 사용자들간의 유사도를 기준으로 사용자를 군집화하는 사용자 군집화부 및 사용자 군집에 속한 사용자들의 특성벡터의 평균을 산출하고 이를 기호 벡터로 지정하는 기호벡터 생성부를 포함할 수 있다.
상기 아이템 군집화부는, 사용자들이 입력한 평가 점수를 기반으로 추정된 아이템들간의 유사도를 기준으로 아이템을 군집화 하며, 상기 아이템들간의 유사도는 두 아이템을 모두 평가한 적이 있는 사용자들의 평가 점수들을 바탕으로 코사인 유사도를 이용해 산출된다. 더욱 상세하게, 상기 아이템들간의 유사도는 수식1을 통해 산출되고 그 알고리즘은 K-NN알고리즘을 기반으로 한다. 여기서 원소간의 거리는 원소간의 유사도의 역수가 되고, 군집의 수는 BIC를 기준으로 결정될 수 있다.
(수식1)
Figure 112015029537747-pat00001
여기에서
Figure 112016008043938-pat00641
는 아이템
Figure 112016008043938-pat00642
Figure 112016008043938-pat00643
간 유사도를 의미하고 ,
Figure 112016008043938-pat00644
는 아이템
Figure 112016008043938-pat00645
Figure 112016008043938-pat00646
를 모두 평가한 사용자들의 집합을 의미하며,
Figure 112016008043938-pat00647
는 사용자
Figure 112016008043938-pat00648
의 아이템
Figure 112016008043938-pat00649
에 대한 평가 점수,
Figure 112016008043938-pat00650
는 사용자
Figure 112016008043938-pat00651
의 아이템
Figure 112016008043938-pat00652
에 대한 평가 점수이고,
Figure 112016008043938-pat00653
는 사용자 집합
Figure 112016008043938-pat00654
의 아이템
Figure 112016008043938-pat00655
에 대한 평가점수의 평균,
Figure 112016008043938-pat00656
는 사용자 집합
Figure 112016008043938-pat00657
의 아이템
Figure 112016008043938-pat00658
에 대한 평가점수의 평균일 수 있다.
상기 사용자 군집화부는 아이템 군집과 사용자들의 평가 점수를 포함하는 특성 벡터 및 사용자 간 유사도를 이용하여 사용자를 군집화한다.
상기 특성 벡터는 사용자의 각 아이템 군집에 속한 아이템들에 대한 평가 점수의 평균을 포함하여 구성되며, 그 차원의 수는 아이템 군집의 수와 같을 수 있다. 더욱 상세하게, 상기 특성 벡터는 수식2를 통해 도출될 수 있다.
(수식2)
Figure 112015029537747-pat00020
여기에서
Figure 112016008043938-pat00659
Figure 112016008043938-pat00660
의 특성벡터이고,
Figure 112016008043938-pat00661
은 아이템 군집의 수이며,
Figure 112016008043938-pat00662
Figure 112016008043938-pat00663
Figure 112016008043938-pat00664
번째 아이템 군집인
Figure 112016008043938-pat00665
에 속한 모든 아이템에 대한 평가점수의 평균일 수 있다.
상기 사용자 간 유사도는 두 사용자에 의해 모두 평가된 적이 있는 아이템들에 대한 평가 점수들을 바탕으로 코사인 유사도를 이용해 도출될 수 있으며, 더욱 상세하게, 상기 사용자 간 유사도는 수식3을 이용하여 산출될 수 있다.
(수식3)
Figure 112015029537747-pat00027
여기에서
Figure 112016008043938-pat00666
Figure 112016008043938-pat00667
와 사용자
Figure 112016008043938-pat00668
의 유사도,
Figure 112016008043938-pat00669
는 사용자
Figure 112016008043938-pat00670
와 사용자
Figure 112016008043938-pat00671
모두가 평가한 아이템들의 집합,
Figure 112016008043938-pat00672
는 사용자
Figure 112016008043938-pat00673
의 아이템
Figure 112016008043938-pat00674
에 대한 평가 점수,
Figure 112016008043938-pat00675
는 사용자
Figure 112016008043938-pat00676
의 아이템
Figure 112016008043938-pat00677
에 대한 평가 점수,
Figure 112016008043938-pat00678
는 아이템 집합
Figure 112016008043938-pat00679
에 대한 사용자
Figure 112016008043938-pat00680
의 평가점수의 평균,
Figure 112016008043938-pat00681
는 아이템 집합
Figure 112016008043938-pat00682
에 대한 사용자
Figure 112016008043938-pat00683
의 평가점수의 평균일 수 있다.
상기 사용자 군집화부는 기대치 최대화(EM, Expectation Maximization) 알고리즘과 가우시안-베이지안(Gaussian-Bayesian)확률 모델을 이용할 수 있으며 군집의 수는 BIC를 기준으로 결정된다.
상기 기호 벡터 생성부는, 기호 벡터를 생성하는 역할을 하며, 상기 기호 벡터는 사용자 군집화를 통해 나타난 사용자들의 기호의 대푯값으로 각 사용자 군집에 속한 사용자들의 특성 벡터의 평균일 수 있다. 더욱 상세하게, 상기 기호 벡터는 수식4를 통해서 산출될 수 있다.
(수식4)
Figure 112015029537747-pat00046
여기에서
Figure 112016008043938-pat00684
Figure 112016008043938-pat00685
번째 기호인
Figure 112016008043938-pat00686
의 특성벡터이며,
Figure 112016008043938-pat00687
는 사용자 군집
Figure 112016008043938-pat00688
의 원소 수,
Figure 112016008043938-pat00689
는 사용자
Figure 112016008043938-pat00690
의 특성벡터,
Figure 112016008043938-pat00691
은 아이템 군집의 수,
Figure 112016008043938-pat00692
는 사용자
Figure 112016008043938-pat00693
Figure 112016008043938-pat00694
번째 아이템 군집인
Figure 112016008043938-pat00695
에 속한 모든 아이템에 대한 평가 점수의 평균을 의미할 수 있다.
상기 사용자 기호 전이 탐지부는, 사용자의 기호 변화의 성향을 분석하기 위하여, 사용자가 입력한 평가 점수의 시퀀스로부터 각 시점에서의 사용자의 기호를 추정하고 상기 각 시점에서의 사용자의 기호 전이를 탐지한다. 상기 사용자 기호 전이 탐지부는 사용자가 입력한 평가점수를 기 설정된 크기의 윈도우로 관측하는 기호 전이 탐지부와 기호 전이 벡터를 생성하는 기호 전이 벡터 생성부를 포함할 수 있다.
상기 기호 전이 벡터 생성부는, 특정 시점에서 사용자의 기호의 특성을 나타내는 기호벡터, 사용자의 특성을 나타내는 사용자 특성 벡터 및 기호 전이가 일어나기까지 소요시간의 정보를 포함하는 기호 전이 벡터를 생성한다. 더욱 상세하게 상기 기호 전이 벡터는 수식5를 통하여 산출될 수 있다.
(수식5)
Figure 112015029537747-pat00058
여기에서
Figure 112015029537747-pat00059
를 사용자
Figure 112015029537747-pat00060
의 기호전이 벡터라 할 때,
Figure 112015029537747-pat00061
을 시점
Figure 112015029537747-pat00062
에서 사용자
Figure 112015029537747-pat00063
의 기호 전이,
Figure 112015029537747-pat00064
Figure 112015029537747-pat00065
에서 사용자
Figure 112015029537747-pat00066
의 기호의 특성을 나타내는 기호 벡터,
Figure 112015029537747-pat00067
Figure 112015029537747-pat00068
에서 사용자
Figure 112015029537747-pat00069
의 특성을 나타내는 사용자 특성 벡터,
Figure 112015029537747-pat00070
Figure 112015029537747-pat00071
에서 발생한 사용자
Figure 112015029537747-pat00072
의 기호 전이가 일어나기까지의 소요시간을 의미할 수 있다.
상기 성향 군집화부는, 사용자들의 기호 전이의 유사도에 따라 상기 사용자들을 군집화하여 사용자들의 기호 변화의 패턴을 정규화한다. 상기 성향 군집화부는 기호 전이의 유사도를 추정하는 기호 전이 유사도 추정부, 상기 유사도를 바탕으로 군집화를 통해 기호 전이의 패턴(성향)을 찾아내는 기호 전이 패턴 군집화부 및 추출될 성향들을 이용하여 기호 전이 모델을 생성하는 기호 전이 모델 생성부를 포함한다.
상기 기호 전이 유사도 추정부의 상기 기호 전이 유사도는, 기호의 전이 순서와 전이간 시간 간격을 바탕으로 추정된다. 이 때, 유사도를 추정하기 위해서 윈도우(Window)가 사용된다. 유사도를 추정하기 위하여 유사도를 측정하고자 하는 두 사용자 벡터에서 서로 가장 유사한 기호를 가지고 있었던 시점을 쌍으로 묶고 이를 유사도 추정의 기점으로 삼는다. 그리고 상기 서로 가장 유사한 기호를 가지고 있었던 시점을 쌍의 전후 시점을 윈도우를 이용해 탐색하여 그 전이 과정 또한 유사한지 탐색한다.
기호 전이 유사도는 기호 벡터간의 유사도, 기호 벡터와 사용자 벡터간의 유사도, 기호 전이 순서와 시간 간격을 이용하여 추정된다.
상기 기호 전이 패턴 군집화부는, 상기 기호 전이 유사도와 PTS를 바탕으로 K-NN알고리즘 또는 변형된 K-NN 알고리즘을 이용해 기호 전이 패턴을 군집화하고 이 때, 군집의 수는 BIC를 기준으로 결정된다.
상기 K-NN 알고리즘은, 군집 내 원소 간 거리의 총합이 최소가 되게 하는 군집의 중심을 찾는 알고리즘이며, 상기 변형된 K-NN 알고리즘은, 군집 내 원소 간 유사도의 합이 최대가 되게 하는 군집의 중심을 찾는 알고리즘이다.
상기 기호 전이 모델 생성부는, 각 성향의 사용자들의 기호 전이 패턴을 마르코프 모델 또는 변형된 마르코프 모델의 형을 이용하여 기호 전이 모델을 생성한다. 더욱 상세하게, 상기 기호 전이 모델 생성부는 군집에 포함된 사용자들의 기호가 전이되는 비율과 기호 전이가 일어나는데 걸리는 시간 정보를 포함하는 전이 확률 벡터를 포함하는 기호 전이 모델을 생성한다.
상기 마르코프 모델은, 노드와 간선으로 이루어진 확률 모델로 상기 노드는 상태(State)를 의미하고 상기 간선은 특정 노드에서 다른 노드로 전이할 스칼라(scalar)확률을 의미한다.
상기 변형된 마르코프 모델은, 노드와 간선으로 이루어진 확률 모델로 상기 노드는 상태(State)를 의미하고 상기 간선은 특정 노드에서 다른 노드로 전이할 확률을 나타내는 벡터(Vector)를 의미할 수 있다.
상기 전이 확률 벡터는, 수식6과 같이 산술적 확률을 바탕으로 한 전이 확률과 전이 시간 간격에 대한 가우시안 확률 모델 정보를 포함할 수 있다.
(수식6)
Figure 112015029537747-pat00073
여기에서
Figure 112015029537747-pat00074
Figure 112015029537747-pat00075
에서
Figure 112015029537747-pat00076
로의 전이 확률을 나타내는 벡터,
Figure 112015029537747-pat00077
Figure 112015029537747-pat00078
에 속해 있던 사람의 수,
Figure 112015029537747-pat00079
Figure 112015029537747-pat00080
에서
Figure 112015029537747-pat00081
로 전이되는 사람의 수,
Figure 112015029537747-pat00082
Figure 112015029537747-pat00083
에 속한 사람들이
Figure 112015029537747-pat00084
로 전이되는 비율,
Figure 112015029537747-pat00085
는 전이의 시간 간격의 평균,
Figure 112015029537747-pat00086
는 시간 간격의 표준편차를 의미할 수 있다.
상기 선호도 예측부는, 아이템 군집, 사용자 벡터, 기호 벡터 및 기호 전이 모델을 포함하는 정보들로 사용자의 특정 아이템에 대한 선호도를 예측한다. 더욱 상세하게, 상기 선호도 예측부는 수식7을 이용하여 사용자의 특정 아이템에 대한 선호도를 예측할 수 있다.
(수식7)
Figure 112015029537747-pat00087
여기에서
Figure 112015029537747-pat00088
Figure 112015029537747-pat00089
번째 사용자,
Figure 112015029537747-pat00090
Figure 112015029537747-pat00091
번째 아이템,
Figure 112015029537747-pat00092
Figure 112015029537747-pat00093
번째 아이템 군집,
Figure 112015029537747-pat00094
Figure 112015029537747-pat00095
번째 기호를 의미하며
Figure 112015029537747-pat00096
Figure 112015029537747-pat00097
Figure 112015029537747-pat00098
에 대한 선호도 예측치를 의미할 수 있다.
상기
Figure 112015029537747-pat00099
는 기호(
Figure 112015029537747-pat00100
)와 사용자(
Figure 112015029537747-pat00101
) 간 유사도를 의미하고 이 값이 1에 가까울수록 사용자가 해당 기호에 속할 확률이 높아지고, -1에 가까울수록 사용자가 해당기호에 속할 확률이 낮아지며 기호 벡터와 사용자 벡터 간의 코사인 유사도를 통해 도출된다. 더욱 상세하게, 상기
Figure 112015029537747-pat00102
는 수식8을 통해 도출될 수 있다.
(수식8)
Figure 112015029537747-pat00103

상기
Figure 112015029537747-pat00104
는 기호 전이 확률로 사용자의 기호가
Figure 112015029537747-pat00105
에서
Figure 112015029537747-pat00106
로 전이될 확률을 의미하고, 상기 기호 전이 확률은 사용자가 속한 성향의 기호 전이 모델을 기반으로 가우시안-베이지안 모델을 이용해 추정된다. 더욱 상세하게, 기호 전이 모델의 간선에 있는 전이 시간 간격의 평균과 표준편차로부터 가우시안 확률분포모델을 생성하고, 베이지안 모델을 이용하여 해당 시간에서 기호 전이 확률을 추정한다.
Figure 112015029537747-pat00107
가 특정한 성향의 사용자들에 대한 특정한 시점
Figure 112015029537747-pat00108
에서의 기호 전이 확률일 때 상기
Figure 112015029537747-pat00109
는 수식9를 통해 산출될 수 있다.
(수식9)
Figure 112015029537747-pat00110

상기
Figure 112015029537747-pat00111
는 특정한 기호의 특성을 표현하기 위해 각 아이템 군집들에 대한 기호 군집 내 사용자들의 선호도의 평균으로 구성된다. 즉,
Figure 112015029537747-pat00112
번째 기호의 사용자들의
Figure 112015029537747-pat00113
번째 아이템 군집에 대한 선호도의 대푯값은
Figure 112015029537747-pat00114
번째 기호 벡터의
Figure 112015029537747-pat00115
번째 항의 값일 수 있다. 더욱 상세하게
Figure 112015029537747-pat00116
를 수식으로 표현하면 수식10으로 표현된다.
(수식10)
Figure 112015029537747-pat00117

상기
Figure 112015029537747-pat00118
는 특정한 아이템이 아이템 군집에 포함되어 있을 확률을 의미하고, 상기
Figure 112015029537747-pat00119
는 수식11과 같이 아이템 군집의 중심과 아이템 간의 유사도로 측정될 수 있다.
(수식11)
Figure 112015029537747-pat00120

또한, 상기한 목적을 달성하기 위한 본 발명에 따른 예측적 군집화 기반 협업 필터링 방법은, 사용자들을 기호에 따라 군집화(Clustering)하고 각 기호를 나타내는 기호 벡터를 생성하는 기호 군집화 단계, 상기 기호 벡터들을 이용하여 사용자들의 기호 변화를 탐지하고 상기 기호 변화를 기호 전이 시퀀스로 표현하는 사용자 기호 전이 탐지 단계, 사용자들을 기호 전이 패턴에 따라 군집화하고 각 성향을 나타내는 기호 전이모델을 생성하는 성향 군집화 단계, 상기 기호 벡터와 상기 기호 전이모델을 바탕으로 사용자 선호도 예측모델을 생성하고 사용자의 각 아이템에 대한 선호도를 예측하는 선호도 예측 단계를 포함한다.
이 때, 상기 기호 군집화 단계는, 사용자들을 각 아이템 군집에 대한 선호도에 따라 군집화하여, 사용자들의 기호를 정규화한다. 상기 기호 군집화 단계는 아이템들간의 유사도를 기준으로 아이템을 군집화하는 아이템 군집화 단계, 사용자들간의 유사도를 기준으로 사용자를 군집화하는 사용자 군집화 단계 및 사용자 군집에 속한 사용자들의 특성벡터의 평균을 산출하고 이를 기호 벡터로 지정하는 기호벡터 생성 단계를 포함할 수 있다.
상기 아이템 군집화 단계는, 사용자들이 입력한 평가 점수를 기반으로 추정된 아이템들간의 유사도를 기준으로 아이템을 군집화 하며, 상기 아이템들간의 유사도는 두 아이템을 모두 평가한 적이 있는 사용자들의 평가 점수들을 바탕으로 코사인 유사도를 이용해 산출된다. 더욱 상세하게, 상기 아이템들간의 유사도는 수식1을 통해 산출되고 그 알고리즘은 K-NN알고리즘을 기반으로 한다. 여기서 원소간의 거리는 원소간의 유사도의 역수가 되고, 군집의 수는 BIC를 기준으로 결정될 수 있다.
(수식1)
Figure 112015029537747-pat00121
여기에서
Figure 112015029537747-pat00122
는 아이템
Figure 112015029537747-pat00123
Figure 112015029537747-pat00124
간 유사도를 의미하고 ,
Figure 112015029537747-pat00125
는 아이템
Figure 112015029537747-pat00126
Figure 112015029537747-pat00127
를 모두 평가한 사용자들의 집합을 의미하며,
Figure 112015029537747-pat00128
는 사용자
Figure 112015029537747-pat00129
의 아이템
Figure 112015029537747-pat00130
에 대한 평가 점수,
Figure 112015029537747-pat00131
는 사용자
Figure 112015029537747-pat00132
의 아이템
Figure 112015029537747-pat00133
에 대한 평가 점수이고,
Figure 112015029537747-pat00134
는 사용자 집합
Figure 112015029537747-pat00135
의 아이템
Figure 112015029537747-pat00136
에 대한 평가점수의 평균,
Figure 112015029537747-pat00137
는 사용자 집합
Figure 112015029537747-pat00138
의 아이템
Figure 112015029537747-pat00139
에 대한 평가점수의 평균일 수 있다.
상기 사용자 군집화 단계는 아이템 군집과 사용자들의 평가 점수를 포함하는 특성 벡터 및 사용자 간 유사도를 이용하여 사용자를 군집화한다.
상기 특성 벡터는 사용자의 각 아이템 군집에 속한 아이템들에 대한 평가 점수의 평균을 포함하여 구성되며, 그 차원의 수는 아이템 군집의 수와 같을 수 있다. 더욱 상세하게, 상기 특성 벡터는 수식2를 통해 도출될 수 있다.
(수식2)
Figure 112015029537747-pat00140
여기에서
Figure 112015029537747-pat00141
Figure 112015029537747-pat00142
의 특성벡터이고,
Figure 112015029537747-pat00143
은 아이템 군집의 수이며,
Figure 112015029537747-pat00144
Figure 112015029537747-pat00145
Figure 112015029537747-pat00146
에 속한 모든 아이템에 대한 평가점수의 평균일 수 있다.
상기 사용자 간 유사도는 두 사용자에 의해 모두 평가된 적이 있는 아이템들에 대한 평가 점수들을 바탕으로 코사인 유사도를 이용해 도출될 수 있으며, 더욱 상세하게, 상기 사용자 간 유사도는 수식3을 이용하여 산출될 수 있다.
(수식3)
Figure 112015029537747-pat00147
여기에서
Figure 112015029537747-pat00148
Figure 112015029537747-pat00149
Figure 112015029537747-pat00150
의 유사도,
Figure 112015029537747-pat00151
는 사용자
Figure 112015029537747-pat00152
와 사용자
Figure 112015029537747-pat00153
모두가 평가한 아이템들의 집합,
Figure 112015029537747-pat00154
는 사용자
Figure 112015029537747-pat00155
의 아이템
Figure 112015029537747-pat00156
에 대한 평가 점수,
Figure 112015029537747-pat00157
는 사용자
Figure 112015029537747-pat00158
의 아이템
Figure 112015029537747-pat00159
에 대한 평가 점수,
Figure 112015029537747-pat00160
는 아이템 집합
Figure 112015029537747-pat00161
에 대한 사용자
Figure 112015029537747-pat00162
의 평가점수의 평균,
Figure 112015029537747-pat00163
는 아이템 집합
Figure 112015029537747-pat00164
에 대한 사용자
Figure 112015029537747-pat00165
의 평가점수의 평균일 수 있다.
상기 사용자 군집화 단계는 기대치 최대화(EM, Expectation Maximization) 알고리즘과 가우시안-베이지안(Gaussian-Bayesian)확률 모델을 이용할 수 있으며 군집의 수는 BIC를 기준으로 결정된다.
상기 기호 벡터 생성 단계는, 기호 벡터를 생성하는 역할을 하며, 상기 기호 벡터는 사용자 군집화를 통해 나타난 사용자들의 기호의 대푯값으로 각 사용자 군집에 속한 사용자들의 특성 벡터의 평균일 수 있다. 더욱 상세하게, 상기 기호 벡터는 수식4를 통해서 산출될 수 있다.
(수식4)
Figure 112015029537747-pat00166
여기에서
Figure 112015029537747-pat00167
Figure 112015029537747-pat00168
번째 기호인
Figure 112015029537747-pat00169
의 특성벡터이며,
Figure 112015029537747-pat00170
는 사용자 군집
Figure 112015029537747-pat00171
의 원소 수,
Figure 112015029537747-pat00172
Figure 112015029537747-pat00173
의 특성벡터,
Figure 112015029537747-pat00174
은 아이템 군집의 수,
Figure 112015029537747-pat00175
Figure 112015029537747-pat00176
Figure 112015029537747-pat00177
에 속한 모든 아이템에 대한 평가 점수의 평균을 의미할 수 있다.
상기 사용자 기호 전이 탐지 단계는, 사용자의 기호 변화의 성향을 분석하기 위하여, 사용자가 입력한 평가 점수의 시퀀스로부터 각 시점에서의 사용자의 기호를 추정하고 상기 각 시점에서의 사용자의 기호 전이를 탐지한다. 상기 사용자 기호 전이 탐지 단계는 사용자가 입력한 평가점수를 기 설정된 크기의 윈도우로 관측하는 기호 전이 탐지 단계와 기호 전이 벡터를 생성하는 기호 전이 벡터 생성 단계를 포함할 수 있다.
상기 기호 전이 벡터 생성 단계는, 특정 시점에서 사용자의 기호의 특성을 나타내는 기호벡터, 사용자의 특성을 나타내는 사용자 특성 벡터 및 기호 전이가 일어나기까지 소요시간의 정보를 포함하는 기호 전이 벡터를 생성한다. 더욱 상세하게 상기 기호 전이 벡터는 수식5를 통하여 산출될 수 있다.
(수식5)
Figure 112015029537747-pat00178
여기에서
Figure 112015029537747-pat00179
를 사용자
Figure 112015029537747-pat00180
의 기호전이 벡터라 할 때,
Figure 112015029537747-pat00181
을 시점
Figure 112015029537747-pat00182
에서 사용자
Figure 112015029537747-pat00183
의 기호 전이,
Figure 112015029537747-pat00184
Figure 112015029537747-pat00185
에서 사용자
Figure 112015029537747-pat00186
의 기호의 특성을 나타내는 기호 벡터,
Figure 112015029537747-pat00187
Figure 112015029537747-pat00188
에서 사용자
Figure 112015029537747-pat00189
의 특성을 나타내는 사용자 특성 벡터,
Figure 112015029537747-pat00190
Figure 112015029537747-pat00191
에서 발생한 사용자
Figure 112015029537747-pat00192
의 기호 전이가 일어나기까지의 소요시간을 의미할 수 있다.
상기 성향 군집화 단계는, 사용자들의 기호 전이의 유사도에 따라 상기 사용자들을 군집화하여 사용자들의 기호 변화의 패턴을 정규화한다. 상기 성향 군집화 단계는 기호 전이의 유사도를 추정하는 기호 전이 유사도 추정 단계, 상기 유사도를 바탕으로 군집화를 통해 기호 전이의 패턴(성향)을 찾아내는 기호 전이 패턴 군집화 단계 및 추출될 성향들을 이용하여 기호 전이 모델을 생성하는 기호 전이 모델 생성 단계를 포함한다.
상기 기호 전이 유사도 추정 단계의 상기 기호 전이 유사도는, 기호의 전이 순서와 전이간 시간 간격을 바탕으로 추정된다. 이 때, 유사도를 추정하기 위해서 윈도우(Window)가 사용된다. 유사도를 추정하기 위하여 유사도를 측정하고자 하는 두 사용자 벡터에서 서로 가장 유사한 기호를 가지고 있었던 시점을 쌍으로 묶고 이를 유사도 추정의 기점으로 삼는다. 그리고 상기 서로 가장 유사한 기호를 가지고 있었던 시점을 쌍의 전후 시점을 윈도우를 이용해 탐색하여 그 전이 과정 또한 유사한지 탐색한다.
기호 전이 유사도는 기호 벡터간의 유사도, 기호 벡터와 사용자 벡터간의 유사도, 기호 전이 순서와 시간 간격을 이용하여 추정된다.
상기 기호 전이 패턴 군집화 단계는, 상기 기호 전이 유사도와 PTS를 바탕으로 변형된 K-NN 알고리즘을 이용해 기호 전이 패턴을 군집화하고 이 때, 군집의 수는 BIC를 기준으로 결정된다.
상기 K-NN 알고리즘은, 군집 내 원소 간 거리의 총합이 최소가 되게 하는 군집의 중심을 찾는 알고리즘이며, 상기 변형된 K-NN 알고리즘은, 군집 내 원소 간 유사도의 합이 최대가 되게 하는 군집의 중심을 찾는 알고리즘이다.
상기 기호 전이 모델 생성 단계는, 각 성향의 사용자들의 기호 전이 패턴을 변형된 마르코프 모델의 형을 이용하여 기호 전이 모델을 생성한다. 더욱 상세하게, 상기 기호 전이 모델 생성 단계는 군집에 포함된 사용자들의 기호가 전이되는 비율과 기호 전이가 일어나는데 걸리는 시간 정보를 포함하는 전이 확률 벡터를 포함하는 기호 전이 모델을 생성한다.
상기 마르코프 모델은, 노드와 간선으로 이루어진 확률 모델로 상기 노드는 상태(State)를 의미하고 상기 간선은 특정 노드에서 다른 노드로 전이할 스칼라(scalar)확률을 의미한다.
상기 변형된 마르코프 모델은, 노드와 간선으로 이루어진 확률 모델로 상기 노드는 상태(State)를 의미하고 상기 간선은 특정 노드에서 다른 노드로 전이할 확률을 나타내는 벡터(Vector)를 의미할 수 있다.
상기 전이 확률 벡터는, 수식6과 같이 산술적 확률을 바탕으로 한 전이 확률과 전이 시간 간격에 대한 가우시안 확률 모델 정보를 포함할 수 있다.
(수식6)
Figure 112015029537747-pat00193
여기에서
Figure 112015029537747-pat00194
Figure 112015029537747-pat00195
에서
Figure 112015029537747-pat00196
로의 전이 확률을 나타내는 벡터,
Figure 112015029537747-pat00197
Figure 112015029537747-pat00198
에 속해 있던 사람의 수,
Figure 112015029537747-pat00199
Figure 112015029537747-pat00200
에서
Figure 112015029537747-pat00201
로 전이되는 사람의 수,
Figure 112015029537747-pat00202
Figure 112015029537747-pat00203
에 속한 사람들이
Figure 112015029537747-pat00204
로 전이되는 비율,
Figure 112015029537747-pat00205
는 전이의 시간 간격의 평균,
Figure 112015029537747-pat00206
는 시간 간격의 표준편차를 의미할 수 있다.
상기 선호도 예측 단계는, 아이템 군집, 사용자 벡터, 기호 벡터 및 기호 전이 모델을 포함하는 정보들로 사용자의 특정 아이템에 대한 선호도를 예측한다. 더욱 상세하게, 상기 선호도 예측 단계는 수식7을 이용하여 사용자의 특정 아이템에 대한 선호도를 예측할 수 있다.
(수식7)
Figure 112015029537747-pat00207
여기에서
Figure 112015029537747-pat00208
Figure 112015029537747-pat00209
번째 사용자,
Figure 112015029537747-pat00210
Figure 112015029537747-pat00211
번째 아이템,
Figure 112015029537747-pat00212
Figure 112015029537747-pat00213
번째 아이템 군집,
Figure 112015029537747-pat00214
Figure 112015029537747-pat00215
번째 기호를 의미하며
Figure 112015029537747-pat00216
Figure 112015029537747-pat00217
Figure 112015029537747-pat00218
에 대한 선호도 예측치를 의미할 수 있다.
상기
Figure 112015029537747-pat00219
는 기호(
Figure 112015029537747-pat00220
)와 사용자(
Figure 112015029537747-pat00221
) 간 유사도를 의미하고 이 값이 1에 가까울수록 사용자가 해당 기호에 속할 확률이 높아지고, -1에 가까울수록 사용자가 해당기호에 속할 확률이 낮아지며 기호 벡터와 사용자 벡터 간의 코사인 유사도를 통해 도출된다. 더욱 상세하게, 상기
Figure 112015029537747-pat00222
는 수식8을 통해 도출될 수 있다.
(수식8)
Figure 112015029537747-pat00223

상기
Figure 112015029537747-pat00224
는 기호 전이 확률로 사용자의 기호가
Figure 112015029537747-pat00225
에서
Figure 112015029537747-pat00226
로 전이될 확률을 의미하고, 상기 기호 전이 확률은 사용자가 속한 성향의 기호 전이 모델을 기반으로 가우시안-베이지안 모델을 이용해 추정된다. 더욱 상세하게, 기호 전이 모델의 간선에 있는 전이 시간 간격의 평균과 표준편차로부터 가우시안 확률분포모델을 생성하고, 베이지안 모델을 이용하여 해당 시간에서 기호 전이 확률을 추정한다.
Figure 112015029537747-pat00227
가 특정한 성향의 사용자들에 대한 특정한 시점
Figure 112015029537747-pat00228
에서의 기호 전이 확률일 때 상기
Figure 112015029537747-pat00229
는 수식9를 통해 산출될 수 있다.
(수식9)
Figure 112015029537747-pat00230

상기
Figure 112015029537747-pat00231
는 특정한 기호의 특성을 표현하기 위해 각 아이템 군집들에 대한 기호 군집 내 사용자들의 선호도의 평균으로 구성된다. 즉,
Figure 112015029537747-pat00232
번째 기호의 사용자들의
Figure 112015029537747-pat00233
번째 아이템 군집에 대한 선호도의 대푯값은
Figure 112015029537747-pat00234
번째 기호 벡터의
Figure 112015029537747-pat00235
번째 항의 값일 수 있다. 더욱 상세하게
Figure 112015029537747-pat00236
를 수식으로 표현하면 수식10으로 표현된다.
(수식10)
Figure 112015029537747-pat00237

상기
Figure 112015029537747-pat00238
는 특정한 아이템이 아이템 군집에 포함되어 있을 확률을 의미하고, 상기
Figure 112015029537747-pat00239
는 수식11과 같이 아이템 군집의 중심과 아이템 간의 유사도로 측정될 수 있다.
(수식11)
Figure 112015029537747-pat00240
본 발명에 의하면, 사용자의 기호와 사용자의 기호 변화를 추정하여 생성되는 데이터를 기초로 사용자의 각 아이템에 대한 선호도를 정확하게 예측할 수 있는 효과가 있다.
또한, 본 발명에 의하면, 사용자 기호의 변화를 추적하여 성능 불안정성 문제를 개선하며, 전이 확률과 군집 소속 확률을 이용하여 적용 범위 감소문제를 해결한다. 나아가, 사용자의 각 아이템에 대한 선호도를 예측함에 있어서 그 성능과 안정성 측면에서 개선된 효과를 제공하여 사용자의 각 아이템에 대한 선호도를 정확하게 예측할 수 있는 효과가 있다.
도 1은 본 발명에 따른 추천 시스템에서의 예측적 군집화 기반 협업 필터링 장치의 블록도이다.
도 2는 본 발명에 따른 추천 시스템에서의 기호 군집화부의 실시예를 설명하기 위한 도면이다.
도 3은 본 발명에 따른 추천 시스템에서의 사용자 기호전이 탐지부의 실시예를 설명하기 위한 도면이다.
도 4는 본 발명에 따른 추천 시스템에서의 기호전이 탐지부의 동작 원리를 설명하기 위한 도면이다.
도 5는 본 발명에 따른 추천 시스템에서의 성향 군집화부의 실시예를 설명하기 위한 도면이다.
도 6은 본 발명에 따른 추천 시스템에서의 기호 전이 유사도 추정부의 동작 원리를 설명하기 위한 도면이다.
도 7은 본 발명에 따른 추천 시스템에서의 기호 전이 모델을 설명하기 위한 도면이다.
도 8은 본 발명에 따른 추천 시스템에서의 사용자 선호도 예측 모델을 설명하기 위한 도면이다.
도 9는 본 발명에 따른 추천 시스템에서의 예측적 군집화 기반 협업 필터링 방법의 순서도이다.
도 10은 본 발명에 따른 추천 시스템에서의 기호 군집화 단계를 설명하기 위한 순서도이다.
도 11은 본 발명에 따른 추천 시스템에서의 사용자 기호 전이 탐지 단계를 설명하기 위한 순서도이다.
도 12는 본 발명에 따른 추천 시스템에서의 성향 군집화 단계를 설명하기 위한 순서도이다.
도 13은 본 발명에 따른 추천 시스템에서의 선호도 예측 단계를 설명하기 위한 순서도이다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 가장 바람직한 실시예를 첨부 도면을 참조하여 설명하기로 한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
이하, 본 발명의 실시예에 따른 예측적 군집화 기반 협업 필터링 장치 및 방법을 첨부된 도면을 참조하여 상세하게 설명하면 아래와 같다. 도 1은 본 발명의 실시예에 따른 예측적 군집화 기반 협업 필터링 장치를 설명하기 위한 도면이다. 도 2, 3 및 5는 본 발명의 실시예에 따른 예측적 군집화 기반 협업 필터링 장치의 구성을 설명하기 위한 도면이다. 도 4, 7 및 8은 각각 기호전이 탐지부의 동작 원리, 기호 전이 모델 및 사용자 선호도 예측 모델을 설명하기 위한 도면이다. 그리고 도 9 내지 도 13은 본 발명의 실시예에 따른 예측적 군집화 기반 협업 필터링 방법을 설명하기 위한 순서도이다.
도 1에 도시된 바와 같이, 예측적 군집화 기반 협업 필터링 장치(100)는 기호 군집화부(110), 사용자 기호전이 탐지부(120), 성향 군집화부(130), 선호도 예측부(140)를 포함하여 구성된다.
기호 군집화부(110)는 사용자들을 각 아이템 군집에 대한 선호도에 따라 군집화하여 사용자들의 기호를 정규화한다.
사용자 기호전이 탐지부(120)는 사용자의 기호 성향을 분석하기 위하여, 사용자가 입력한 평가 점수의 시퀀스로부터 각 시점에서의 사용자의 기호를 추정하고 그 전이를 탐지한다.
성향 군집화부(130)는 사용자들을 기호 전이의 유사도에 따라 군집화하여 사용자들의 기호 변화의 패턴을 정규화한다. 상기 패턴은 사용자들의 성향을 의미한다고 해석될 수 있다.
선호도 예측부(140)는 아이템 군집, 사용자 벡터, 기호 벡터, 기호 전이 모델을 포함하는 정보를 이용하여 사용자의 특정 아이템에 대한 선호도를 예측한다.
도 2에 도시된 바와 같이, 기호 군집화부(110)는 사용자들의 소비 경향에 따라 아이템들을 군집화하는 아이템 군집화부(111), 사용자들을 기호에 따라 군집화하여 각 기호를 나타내는 군집을 도출하는 사용자 군집화부(112), 사용자들의 각 기호들의 대푯값을 기호 벡터로 결정하는 기호벡터 생성부(113)를 포함할 수 있다.
아이템 군집화부(111)는 사용자들이 입력한 평가 점수를 기반으로 추정된 아이템간의 유사도를 기준으로 아이템을 군집한다. 상기 아이템간의 유사도는 두 아이템을 모두 평가한 적이 있는 사용자들의 평가 점수를 바탕으로 코사인 유사도를 이용해 도출되며, 아이템 군집화 알고리즘은 K-NN알고리즘을 기반으로 하고, 이 때 원소간의 거리는 원소 간의 유사도의 역수로 결정된다. 또한 상기 아이템 군집의 수는 BIC를 기준으로 설정될 수 있다. 더욱 상세하게, 상기 아이템 간의 유사도는 수식1을 통해 도출될 수 있다.
(수식1)
Figure 112015029537747-pat00241
상기
Figure 112016008043938-pat00696
는 아이템
Figure 112016008043938-pat00697
Figure 112016008043938-pat00698
간 유사도를 의미하고 ,
Figure 112016008043938-pat00699
는 아이템
Figure 112016008043938-pat00700
Figure 112016008043938-pat00701
를 모두 평가한 사용자들의 집합을 의미하며,
Figure 112016008043938-pat00702
는 사용자
Figure 112016008043938-pat00703
의 아이템
Figure 112016008043938-pat00704
에 대한 평가 점수,
Figure 112016008043938-pat00705
는 사용자
Figure 112016008043938-pat00706
의 아이템
Figure 112016008043938-pat00707
에 대한 평가 점수이고,
Figure 112016008043938-pat00708
는 사용자 집합
Figure 112016008043938-pat00709
의 아이템
Figure 112016008043938-pat00710
에 대한 평가점수의 평균,
Figure 112016008043938-pat00711
는 사용자 집합
Figure 112016008043938-pat00712
의 아이템
Figure 112016008043938-pat00713
에 대한 평가점수의 평균일 수 있다.
사용자 군집화부(112)는 아이템 군집과 사용자들의 평가 점수를 이용하여 구성된 특성벡터와 사용자 간의 유사도를 기준으로 사용자를 군집화한다. 상기 특성벡터는 사용자의 각 아이템 군집에 속한 아이템들에 대한 평가점수의 평균을 포함하는 수식2로 나타낼 수 있으며, 상기 특성 벡터의 차원의 수는 아이템 군집의 수와 같다.
(수식2)
Figure 112015029537747-pat00260
상기
Figure 112016008043938-pat00714
는 사용자
Figure 112016008043938-pat00715
의 특성벡터이고,
Figure 112016008043938-pat00716
은 아이템 군집의 수이며,
Figure 112016008043938-pat00717
는 사용자
Figure 112016008043938-pat00718
Figure 112016008043938-pat00719
번째 아이템 군집인
Figure 112016008043938-pat00720
에 속한 모든 아이템에 대한 평가점수의 평균일 수 있다.
상기 사용자 간 유사도는 두 사용자에 의해 모두 평가된 적이 있는 아이템들에 대한 평가 점수들을 바탕으로 코사인 유사도를 이용해 도출될 수 있으며, 더욱 상세하게, 상기 사용자 간 유사도는 수식3을 이용하여 산출될 수 있다.
(수식3)
Figure 112015029537747-pat00267
상기
Figure 112016008043938-pat00721
는 사용자
Figure 112016008043938-pat00722
와 사용자
Figure 112016008043938-pat00723
의 유사도,
Figure 112016008043938-pat00724
는 사용자
Figure 112016008043938-pat00725
와 사용자
Figure 112016008043938-pat00726
모두가 평가한 아이템들의 집합,
Figure 112016008043938-pat00727
는 사용자
Figure 112016008043938-pat00728
의 아이템
Figure 112016008043938-pat00729
에 대한 평가 점수,
Figure 112016008043938-pat00730
는 사용자
Figure 112016008043938-pat00731
의 아이템
Figure 112016008043938-pat00732
에 대한 평가 점수,
Figure 112016008043938-pat00733
는 아이템 집합
Figure 112016008043938-pat00734
에 대한 사용자
Figure 112016008043938-pat00735
의 평가점수의 평균,
Figure 112016008043938-pat00736
는 아이템 집합
Figure 112016008043938-pat00737
에 대한 사용자
Figure 112016008043938-pat00738
의 평가점수의 평균일 수 있다.
상기 사용자 군집화부(112)는 기대치 최대화(EM, Expectation Maximization) 알고리즘과 가우시안-베이지안(Gaussian-Bayesian)확률 모델을 이용할 수 있으며 사용자 군집의 수는 BIC를 기준으로 결정될 수 있다.
기호벡터 생성부(113)는 각 사용자 군집에 속한 사용자들의 특성벡터의 평균을 기호벡터로 설정하며 상기 기호벡터는 사용자 군집화를 통해 도출된 사용자들의 기호의 대푯값일 수 있다. 더욱 상세하게, 상기 기호벡터는 수식4를 통해 도출될 수 있다.
(수식4)
Figure 112015029537747-pat00286
상기
Figure 112016008043938-pat00739
Figure 112016008043938-pat00740
번째 기호인
Figure 112016008043938-pat00741
의 특성벡터이며,
Figure 112016008043938-pat00742
는 사용자 군집
Figure 112016008043938-pat00743
의 원소 수,
Figure 112016008043938-pat00744
Figure 112016008043938-pat00745
의 특성벡터,
Figure 112016008043938-pat00746
은 아이템 군집의 수,
Figure 112016008043938-pat00747
는 사용자
Figure 112016008043938-pat00748
Figure 112016008043938-pat00749
번째 아이템 군집인
Figure 112016008043938-pat00750
에 속한 모든 아이템에 대한 평가 점수의 평균을 의미할 수 있다.
도 3에 도시된 바와 같이, 사용자 기호전이 탐지부(120)는 사용자가 입력한평가 점수의 시퀀스로부터 각 시점에서의 사용자의 기호를 추정하고 그 전이를 탐지하는 기호전이 탐지부(121)와 성향 군집화의 기반이 되는 기호전이 벡터를 생성하는 기호전이 벡터 생성부(122)를 포함할 수 있다.
기호전이 벡터 생성부(122)는 전이된 기호의 기호벡터, 전이 시점의 사용자 벡터, 전이 소요시간을 포함하는 기호전이 벡터를 생성하고 상기 기호전이 벡터는 수식5를 통해 산출될 수 있다.
(수식5)
Figure 112015029537747-pat00298
상기
Figure 112015029537747-pat00299
를 사용자
Figure 112015029537747-pat00300
의 기호전이 벡터라 할 때,
Figure 112015029537747-pat00301
을 시점
Figure 112015029537747-pat00302
에서 사용자
Figure 112015029537747-pat00303
의 기호 전이,
Figure 112015029537747-pat00304
Figure 112015029537747-pat00305
에서 사용자
Figure 112015029537747-pat00306
의 기호의 특성을 나타내는 기호 벡터,
Figure 112015029537747-pat00307
Figure 112015029537747-pat00308
에서 사용자
Figure 112015029537747-pat00309
의 특성을 나타내는 사용자 특성 벡터,
Figure 112015029537747-pat00310
Figure 112015029537747-pat00311
에서 발생한 사용자
Figure 112015029537747-pat00312
의 기호 전이가 일어나기까지의 소요시간을 의미할 수 있다.
도 4에 도시된 바와 같이, 상기 기호전이 탐지부(121)는 시간
Figure 112015029537747-pat00313
에 입력된 사용자의 특정 아이템에 대한 평가점수
Figure 112015029537747-pat00314
의 시퀀스를 기 설정된
Figure 112015029537747-pat00315
크기의 윈도우로 관측하여 기호 전이를 탐지한다.
도 5에 도시된 바와 같이, 상기 성향 군집화부(130)는 사용자들의 기호 전이의 유사도를 추정하는 기호전이 유사도 추정부(131), 상기 기호전이 유사도를 기반으로 기호 전이 패턴을 군집화하고 군집의 중심을 찾는 기호전이 패턴 군집화부(132), 각 성향의 사용자들의 기호 전이 패턴의 모델을 생성하는 기호 전이 모델 생성부(133)를 포함할 수 있다.
상기 기호전이 패턴 군집화부(132)는 상기 기호 전이 유사도를 이용하여 K-NN알고리즘 또는 변형된 K-NN알고리즘을 통해 기호전이 패턴을 군집화한다.
상기 K-NN 알고리즘은, 군집 내 원소 간 거리의 총합이 최소가 되게 하는 군집의 중심을 찾는 알고리즘이며, 상기 변형된 K-NN 알고리즘은, 군집 내 원소 간 유사도의 합이 최대가 되게 하는 군집의 중심을 찾는 알고리즘이다.
도 6에 도시된 바와 같이, 상기 기호전이 유사도 추정부(131)는 기호의 전이 순서와 전이 간 시간 간격을 바탕으로 사용자들의 기호 전이 유사도를 추정한다. 유사도의 추정에는 윈도우가 사용된다. 유사도를 추정하기 위하여 유사도를 측정하고자 하는 두 사용자 벡터에서 서로 가장 유사한 기호를 가지고 있었던 시점을 쌍으로 묶고 이를 유사도 추정의 기점으로 삼는다. 그리고 상기 서로 가장 유사한 기호를 가지고 있었던 시점 쌍의 전후를 윈도우를 이용해 탐색하여 그 전이 과정 또한 유사한지 탐색한다. 더욱 상세하게 설명한다면, 상기 기호전이 유사도 추정부(131)는, 사용자
Figure 112015029537747-pat00316
Figure 112015029537747-pat00317
가 서로 가장 유사한 기호를 가지고 있는 시점인
Figure 112015029537747-pat00318
시점을 쌍으로 묶고
Figure 112015029537747-pat00319
시점의 전후를 윈도우로 탐색하여 사용자
Figure 112015029537747-pat00320
의 시점
Figure 112015029537747-pat00321
과 사용자
Figure 112015029537747-pat00322
의 시점
Figure 112015029537747-pat00323
에서 기호의 전이 과정이 유사한지 여부를 탐색한다.
도 7에 도시된 바와 같이, 상기 기호 전이 모델 생성부(133)는 각 성향의 사용자들의 기호 전이 패턴을 마르코프 모델 또는 변형된 마르코프 모델형을 이용하여 기호 전이 모델을 생성한다.
Figure 112015029537747-pat00324
를 비롯한 각 노드들은 해당 성향 군집 내의 사용자들의 기호를 의미할 수 있고,
Figure 112015029537747-pat00325
를 비롯한 각 간선들은 노드간의 전이 확률을 의미한다. 상기 기호 전이 모델은 전이에 걸리는 시간 정보를 포함하는 확률 모델일 수 있다.
상기 마르코프 모델의 간선들은 스칼라(scalar) 값을 가지며, 상기 변형된 마르코프 모델의 간선들은 전이 확률과 전이 시간 간격에 대한 정보를 포함할 수 있다.
다시 도7에 대한 설명으로 돌아가면, 상기
Figure 112015029537747-pat00326
Figure 112015029537747-pat00327
에서
Figure 112015029537747-pat00328
로의 전이 확률을 나타내는 벡터이며, 보다 상세하게 수식6을 통해 도출될 수 있다.
(수식6)
Figure 112015029537747-pat00329
상기
Figure 112015029537747-pat00330
Figure 112015029537747-pat00331
에서
Figure 112015029537747-pat00332
로의 전이 확률을 나타내는 벡터,
Figure 112015029537747-pat00333
Figure 112015029537747-pat00334
에 속해 있던 사람의 수,
Figure 112015029537747-pat00335
Figure 112015029537747-pat00336
에서
Figure 112015029537747-pat00337
로 전이되는 사람의 수,
Figure 112015029537747-pat00338
Figure 112015029537747-pat00339
에 속한 사람들이
Figure 112015029537747-pat00340
로 전이되는 비율,
Figure 112015029537747-pat00341
는 전이의 시간 간격의 평균,
Figure 112015029537747-pat00342
는 시간 간격의 표준편차를 의미할 수 있다.
도 8에 도시된 바와 같이, 상기 선호도 예측부(140)는 아이템 군집, 사용자 벡터, 기호 벡터, 기호 전이 모델을 비롯한 정보들을 이용하여 사용자의 특정 아이템에 대한 선호도 예측모델을 생성하고 이를 통해 사용자의 각 아이템에 대한 선호도를 예측한다.
보다 상세하게,
Figure 112015029537747-pat00343
Figure 112015029537747-pat00344
번째 사용자를,
Figure 112015029537747-pat00345
Figure 112015029537747-pat00346
번째 아이템을,
Figure 112015029537747-pat00347
Figure 112015029537747-pat00348
번째 아이템 군집을,
Figure 112015029537747-pat00349
Figure 112015029537747-pat00350
번째 기호를,
Figure 112015029537747-pat00351
Figure 112015029537747-pat00352
번째 성향을,
Figure 112015029537747-pat00353
Figure 112015029537747-pat00354
번째 성향의 사용자들의 기호 전이모델을 나타낼 수 있다. 이 때,
Figure 112015029537747-pat00355
Figure 112015029537747-pat00356
에 대한 선호도 예측치인
Figure 112015029537747-pat00357
는 수식7을 통해 산출될 수 있다.
(수식7)
Figure 112015029537747-pat00358
상기
Figure 112015029537747-pat00359
는 기호(
Figure 112015029537747-pat00360
)와 사용자(
Figure 112015029537747-pat00361
) 간 유사도를 의미하고 이 값이 1에 가까울수록 사용자가 해당 기호에 속할 확률이 높아지고, -1에 가까울수록 사용자가 해당기호에 속할 확률이 낮아지며 기호 벡터와 사용자 벡터 간의 코사인 유사도를 통해 도출된다. 더욱 상세하게, 상기
Figure 112015029537747-pat00362
는 수식8을 통해 도출될 수 있다.
(수식8)
Figure 112015029537747-pat00363

상기
Figure 112015029537747-pat00364
는 기호 전이 확률로 사용자의 기호가
Figure 112015029537747-pat00365
에서
Figure 112015029537747-pat00366
로 전이될 확률을 의미하고, 상기 기호 전이 확률은 사용자가 속한 성향의 기호 전이 모델을 기반으로 가우시안-베이지안 모델을 이용해 추정된다. 더욱 상세하게, 기호 전이 모델의 간선에 있는 전이 시간 간격의 평균과 표준편차로부터 가우시안 확률분포모델을 생성하고, 베이지안 모델을 이용하여 해당 시간에서 기호 전이 확률을 추정한다.
Figure 112015029537747-pat00367
가 특정한 성향의 사용자들에 대한 특정한 시점
Figure 112015029537747-pat00368
에서의 기호 전이 확률일 때 상기
Figure 112015029537747-pat00369
는 수식9를 통해 산출될 수 있다.
(수식9)
Figure 112015029537747-pat00370

상기
Figure 112015029537747-pat00371
는 특정한 기호의 특성을 표현하기 위해 각 아이템 군집들에 대한 기호 군집 내 사용자들의 선호도의 평균으로 구성된다. 즉,
Figure 112015029537747-pat00372
번째 기호의 사용자들의
Figure 112015029537747-pat00373
번째 아이템 군집에 대한 선호도의 대푯값은
Figure 112015029537747-pat00374
번째 기호 벡터의
Figure 112015029537747-pat00375
번째 항의 값일 수 있다. 더욱 상세하게
Figure 112015029537747-pat00376
를 수식으로 표현하면 수식10으로 표현된다.
(수식10)
Figure 112015029537747-pat00377

상기
Figure 112015029537747-pat00378
는 특정한 아이템이 아이템 군집에 포함되어 있을 확률을 의미하고, 상기
Figure 112015029537747-pat00379
는 수식11과 같이 아이템 군집의 중심과 아이템 간의 유사도로 측정될 수 있다.
(수식11)
Figure 112015029537747-pat00380

도 9에 도시된 바와 같이 예측적 군집화 기반 협업 필터링 방법은 사용자들을 각 아이템 군집에 대한 선호도에 따라 군집화하는 기호 군집화 단계(S100), 사용자가 입력한 평가점수의 시퀀스로부터 각 시점에서의 사용자의 기호를 추정하고 그 전이를 탐지하는 사용자 기호 전이 탐지 단계(S200), 사용자들을 기호 전이의 유사도에 따라 군집화하여 사용자들의 기호 변화의 패턴을 정규화하는 성향 군집화 단계(S300), 사용자의 특정 아이템에 대한 선호도를 예측하는 선호도 예측 단계(S400)를 포함할 수 있다.
도 10에 도시된 바와 같이 기호 군집화 단계(S100)는 사용자들의 소비 경향과 사용자들이 입력한 평가점수를 기반으로 측정된 아이템들간의 유사도를 이용하여 아이템들을 군집화하는 아이템 군집화 단계(S110), 아이템 군집과 사용자들의 평가점수를 이용하여 생성된 특성 벡터와 사용자들간 유사도를 이용하여 사용자를 군집화 하는 사용자 군집화 단계(S120), 사용자들의 각 기호들의 대푯값을 기호 벡터로 결정하는 기호벡터 생성 단계(S130)를 포함할 수 있다.
상기 아이템 군집화 단계(S110)는 사용자들이 입력한 평가 점수를 기반으로 추정된 아이템간의 유사도를 기준으로 아이템을 군집화한다. 상기 아이템간의 유사도는 두 아이템을 모두 평가한 적이 있는 사용자들의 평가 점수를 바탕으로 코사인 유사도를 이용해 도출되며, 아이템 군집화 알고리즘은 K-NN알고리즘을 기반으로 하고, 이 때 원소간의 거리는 원소 간의 유사도의 역수로 결정된다. 또한 상기 아이템 군집의 수는 BIC를 기준으로 설정될 수 있다. 더욱 상세하게, 상기 아이템 간의 유사도는 수식1을 통해 도출될 수 있다.
(수식1)
Figure 112015029537747-pat00381
상기
Figure 112015029537747-pat00382
는 아이템
Figure 112015029537747-pat00383
Figure 112015029537747-pat00384
간 유사도를 의미하고 ,
Figure 112015029537747-pat00385
는 아이템
Figure 112015029537747-pat00386
Figure 112015029537747-pat00387
를 모두 평가한 사용자들의 집합을 의미하며,
Figure 112015029537747-pat00388
는 사용자
Figure 112015029537747-pat00389
의 아이템
Figure 112015029537747-pat00390
에 대한 평가 점수,
Figure 112015029537747-pat00391
는 사용자
Figure 112015029537747-pat00392
의 아이템
Figure 112015029537747-pat00393
에 대한 평가 점수이고,
Figure 112015029537747-pat00394
는 사용자 집합
Figure 112015029537747-pat00395
의 아이템
Figure 112015029537747-pat00396
에 대한 평가점수의 평균,
Figure 112015029537747-pat00397
는 사용자 집합
Figure 112015029537747-pat00398
의 아이템
Figure 112015029537747-pat00399
에 대한 평가점수의 평균일 수 있다.
상기 사용자 군집화 단계(S120)는 아이템 군집과 사용자들의 평가 점수를 이용하여 구성된 특성벡터와 사용자 간의 유사도를 기준으로 사용자를 군집화한다. 상기 특성벡터는 사용자의 각 아이템 군집에 속한 아이템들에 대한 평가점수의 평균을 포함하는 수식2로 나타낼 수 있으며, 상기 특성 벡터의 차원의 수는 아이템 군집의 수와 같다.
(수식2)
Figure 112015029537747-pat00400
상기
Figure 112015029537747-pat00401
Figure 112015029537747-pat00402
의 특성벡터이고,
Figure 112015029537747-pat00403
은 아이템 군집의 수이며,
Figure 112015029537747-pat00404
Figure 112015029537747-pat00405
Figure 112015029537747-pat00406
에 속한 모든 아이템에 대한 평가점수의 평균일 수 있다.
상기 사용자 간 유사도는 두 사용자에 의해 모두 평가된 적이 있는 아이템들에 대한 평가 점수들을 바탕으로 코사인 유사도를 이용해 도출될 수 있으며, 더욱 상세하게, 상기 사용자 간 유사도는 수식3을 이용하여 산출될 수 있다.
(수식3)
Figure 112015029537747-pat00407
상기
Figure 112015029537747-pat00408
Figure 112015029537747-pat00409
Figure 112015029537747-pat00410
의 유사도,
Figure 112015029537747-pat00411
는 사용자
Figure 112015029537747-pat00412
와 사용자
Figure 112015029537747-pat00413
모두가 평가한 아이템들의 집합,
Figure 112015029537747-pat00414
는 사용자
Figure 112015029537747-pat00415
의 아이템
Figure 112015029537747-pat00416
에 대한 평가 점수,
Figure 112015029537747-pat00417
는 사용자
Figure 112015029537747-pat00418
의 아이템
Figure 112015029537747-pat00419
에 대한 평가 점수,
Figure 112015029537747-pat00420
는 아이템 집합
Figure 112015029537747-pat00421
에 대한 사용자
Figure 112015029537747-pat00422
의 평가점수의 평균,
Figure 112015029537747-pat00423
는 아이템 집합
Figure 112015029537747-pat00424
에 대한 사용자
Figure 112015029537747-pat00425
의 평가점수의 평균일 수 있다.
상기 사용자 군집화 단계(S120)는 기대치 최대화(EM, Expectation Maximization) 알고리즘과 가우시안-베이지안(Gaussian-Bayesian)확률 모델을 이용할 수 있으며 사용자 군집의 수는 BIC를 기준으로 결정될 수 있다.
상기 기호벡터 생성 단계(S130)는 각 사용자 군집에 속한 사용자들의 특성벡터의 평균을 기호벡터로 설정하며 상기 기호벡터는 사용자 군집화를 통해 도출된 사용자들의 기호의 대푯값일 수 있다. 더욱 상세하게, 상기 기호벡터는 수식4를 통해 도출될 수 있다.
(수식4)
Figure 112015029537747-pat00426
상기
Figure 112015029537747-pat00427
Figure 112015029537747-pat00428
번째 기호인
Figure 112015029537747-pat00429
의 특성벡터이며,
Figure 112015029537747-pat00430
는 사용자 군집
Figure 112015029537747-pat00431
의 원소 수,
Figure 112015029537747-pat00432
Figure 112015029537747-pat00433
의 특성벡터,
Figure 112015029537747-pat00434
은 아이템 군집의 수,
Figure 112015029537747-pat00435
Figure 112015029537747-pat00436
Figure 112015029537747-pat00437
에 속한 모든 아이템에 대한 평가 점수의 평균을 의미할 수 있다.
도 11에 도시된 바와 같이 사용자 기호 전이 탐지 단계(S200)는 평가점수를 특정한 크기의 윈도우로 관측하여 기호 전이를 탐지하는 기호 전이 탐지단계(S210), 특정 시점에서 사용자들의 기호의 특성을 나타내는 기호 벡터, 상기 특정 시점에서 상기 사용자들의 특성을 나타내는 사용자 특성 벡터 및 상기 특정 시점에서 상기 사용자들의 기호 전이가 일어나기까지 소요시간을 포함하는 기호 전이 벡터를 생성하는 기호 전이 벡터 생성 단계(S220)를 포함할 수 있다.
상기 기호 전이 탐지 단계(S210)는 시간
Figure 112015029537747-pat00438
에 입력된 사용자의 특정 아이템에 대한 평가점수
Figure 112015029537747-pat00439
의 시퀀스를 기 설정된
Figure 112015029537747-pat00440
크기의 윈도우로 관측하여 기호 전이를 탐지한다.
상기 기호 전이 벡터 생성 단계(S220)는 전이된 기호의 기호벡터, 전이 시점의 사용자 벡터, 전이 소요시간을 포함하는 기호전이 벡터를 생성하고 상기 기호전이 벡터는 수식5를 통해 산출될 수 있다.
(수식5)
Figure 112015029537747-pat00441
상기
Figure 112015029537747-pat00442
를 사용자
Figure 112015029537747-pat00443
의 기호전이 벡터라 할 때,
Figure 112015029537747-pat00444
을 시점
Figure 112015029537747-pat00445
에서 사용자
Figure 112015029537747-pat00446
의 기호 전이,
Figure 112015029537747-pat00447
Figure 112015029537747-pat00448
에서 사용자
Figure 112015029537747-pat00449
의 기호의 특성을 나타내는 기호 벡터,
Figure 112015029537747-pat00450
Figure 112015029537747-pat00451
에서 사용자
Figure 112015029537747-pat00452
의 특성을 나타내는 사용자 특성 벡터,
Figure 112015029537747-pat00453
Figure 112015029537747-pat00454
에서 발생한 사용자
Figure 112015029537747-pat00455
의 기호 전이가 일어나기까지의 소요시간을 의미할 수 있다.
도 12에 도시된 바와 같이 성향 군집화 단계(S300)는 유사도를 측정하고자 하는 두 사용자 벡터에서, 서로 가장 유사한 기호를 가지고 있었던 시점을 기준으로 하여 상기 시점 이후 전이 과정이 유사한지 탐색하는 기호 전이 유사도 추정 단계(S310), 기호 전이 유사도를 기반으로 상기 사용자간 유사도의 합이 최대가 되게하는 군집의 중심을 찾는 기호 전이 패턴 군집화 단계(S320), 군집에 포함된 사용자들의 기호가 전이되는 비율과 기호 전이가 일어나는데 걸리는 시간 정보를 포함하는 전이 확률 벡터를 포함하는 기호 전이 모델을 생성하는 기호 전이 모델 생성단계(S330)를 포함할 수 있다.
상기 기호전이 유사도 추정 단계(S310)는 기호의 전이 순서와 전이 간 시간 간격을 바탕으로 사용자들의 기호 전이 유사도를 추정한다. 유사도의 추정에는 윈도우가 사용된다. 유사도를 추정하기 위하여 유사도를 측정하고자 하는 두 사용자 벡터에서 서로 가장 유사한 기호를 가지고 있었던 시점을 쌍으로 묶고 이를 유사도 추정의 기점으로 삼는다. 그리고 상기 서로 가장 유사한 기호를 가지고 있었던 시점 쌍의 전후를 윈도우를 이용해 탐색하여 그 전이 과정 또한 유사한지 탐색한다. 도 6을 참조하여 더욱 상세하게 설명한다면, 상기 기호전이 유사도 추정 단계(S310)는, 사용자
Figure 112015029537747-pat00456
Figure 112015029537747-pat00457
가 서로 가장 유사한 기호를 가지고 있는 시점인
Figure 112015029537747-pat00458
시점을 쌍으로 묶고
Figure 112015029537747-pat00459
시점의 전후를 윈도우로 탐색하여 사용자
Figure 112015029537747-pat00460
의 시점
Figure 112015029537747-pat00461
과 사용자
Figure 112015029537747-pat00462
의 시점
Figure 112015029537747-pat00463
에서 기호의 전이 과정이 유사한지 여부를 탐색한다.
상기 기호 전이 패턴 군집화 단계(S320)는 상기 기호 전이 유사도를 이용하여 K-NN알고리즘 또는 변형된 K-NN알고리즘을 통해 기호전이 패턴을 군집화한다.
상기 K-NN 알고리즘은, 군집 내 원소 간 거리의 총합이 최소가 되게 하는 군집의 중심을 찾는 알고리즘이며, 상기 변형된 K-NN 알고리즘은, 군집 내 원소 간 유사도의 합이 최대가 되게 하는 군집의 중심을 찾는 알고리즘이다.
상기 기호 전이 모델 생성단계(S330)는 각 성향의 사용자들의 기호 전이 패턴을 마르코프 모델 또는 변형된 마르코프 모델형을 이용하여 기호 전이 모델을 생성한다.
Figure 112015029537747-pat00464
를 비롯한 각 노드들은 해당 성향 군집 내의 사용자들의 기호를 의미할 수 있고,
Figure 112015029537747-pat00465
를 비롯한 각 간선들은 노드간의 전이 확률을 의미한다. 상기 기호 전이 모델은 전이에 걸리는 시간 정보를 포함하는 확률 모델일 수 있다.
상기 마르코프 모델의 간선들은 스칼라(scalar) 값을 가지며, 상기 변형된 마르코프 모델의 간선들은 전이 확률과 전이 시간 간격에 대한 정보를 포함할 수 있다.
도 7을 참조하여 보다 상세하게 설명하면, 상기
Figure 112015029537747-pat00466
Figure 112015029537747-pat00467
에서
Figure 112015029537747-pat00468
로의 전이 확률을 나타내는 벡터이며, 상기 간선들은 수식6을 통해 도출될 수 있다.
(수식6)
Figure 112015029537747-pat00469
상기
Figure 112015029537747-pat00470
Figure 112015029537747-pat00471
에서
Figure 112015029537747-pat00472
로의 전이 확률을 나타내는 벡터,
Figure 112015029537747-pat00473
Figure 112015029537747-pat00474
에 속해 있던 사람의 수,
Figure 112015029537747-pat00475
Figure 112015029537747-pat00476
에서
Figure 112015029537747-pat00477
로 전이되는 사람의 수,
Figure 112015029537747-pat00478
Figure 112015029537747-pat00479
에 속한 사람들이
Figure 112015029537747-pat00480
로 전이되는 비율,
Figure 112015029537747-pat00481
는 전이의 시간 간격의 평균,
Figure 112015029537747-pat00482
는 시간 간격의 표준편차를 의미할 수 있다.
도 13에 도시된 바와 같이, 상기 선호도 예측 단계(S400)는 기호와 사용자 간의 유사도를 생성하는 단계(S410), 기호 전이 확률을 생성하는 단계(S420), 기호 벡터를 도출하는 단계(S430), 아이템 간 유사도를 산출하는 단계(S440)를 포함할 수 있고, 상기 기호와 사용자 간의 유사도, 기호 간 전이 확률, 기호 벡터, 아이템 간 유사도를 이용하여 사용자의 특정한 아이템에 대한 선호도를 예측(S450)할 수 있다.
상기 기호와 사용자 간의 유사도를 생성하는 단계(S410)는 기호(
Figure 112015029537747-pat00483
)와 사용자(
Figure 112015029537747-pat00484
) 간 유사도를 산출하고 이 값이 1에 가까울수록 사용자가 해당 기호에 속할 확률이 높아지고, -1에 가까울수록 사용자가 해당기호에 속할 확률이 낮아지며 기호 벡터와 사용자 벡터 간의 코사인 유사도를 통해 도출된다. 더욱 상세하게, 상기 기호와 사용자 간의 유사도는 수식8을 통해 도출될 수 있다.
(수식8)
Figure 112015029537747-pat00485

상기 기호 전이 확률을 생성하는 단계(S420)는 사용자의 기호가
Figure 112015029537747-pat00486
에서
Figure 112015029537747-pat00487
로 전이될 확률을 산출하고, 상기 기호 전이 확률은 사용자가 속한 성향의 기호 전이 모델을 기반으로 가우시안-베이지안 모델을 이용해 추정된다. 더욱 상세하게, 기호 전이 모델의 간선에 있는 전이 시간 간격의 평균과 표준편차로부터 가우시안 확률분포모델을 생성하고, 베이지안 모델을 이용하여 해당 시간에서 기호 전이 확률을 추정한다.
Figure 112015029537747-pat00488
가 특정한 성향의 사용자들에 대한 특정한 시점
Figure 112015029537747-pat00489
에서의 기호 전이 확률일 때 상기
Figure 112015029537747-pat00490
는 수식9를 통해 산출될 수 있다.
(수식9)
Figure 112015029537747-pat00491
상기 기호 벡터를 도출하는 단계(S430)는 특정한 기호의 특성을 표현하기 위해 각 아이템 군집들에 대한 기호 군집 내 사용자들의 선호도의 평균으로 구성 기호 벡터를 도출한다. 즉,
Figure 112015029537747-pat00492
번째 기호의 사용자들의
Figure 112015029537747-pat00493
번째 아이템 군집에 대한 선호도의 대푯값은
Figure 112015029537747-pat00494
번째 기호 벡터의
Figure 112015029537747-pat00495
번째 항의 값일 수 있다. 더욱 상세하게 상기 기호 벡터를 수식으로 표현하면 수식10으로 표현될 수 있다.
(수식10)
Figure 112015029537747-pat00496
상기 아이템 간 유사도를 산출하는 단계(S440)는 특정한 아이템이 아이템 군집에 포함되어 있을 확률을 산출하고 , 상기 특정한 아이템이 아이템 군집에 포함되어 있을 확률은 수식11과 같이 아이템 군집의 중심과 아이템 간의 유사도로 측정될 수 있다.
(수식11)
Figure 112015029537747-pat00497
상기 선호도 예측 단계(S400)는 아이템 군집, 사용자 벡터, 기호 벡터, 기호 전이 모델을 비롯한 정보들을 이용하여 사용자의 특정 아이템에 대한 선호도 예측모델을 생성하고 이를 통해 사용자의 각 아이템에 대한 선호도를 예측한다.(S450)
도 8을 참조하여 보다 상세하게 설명하면,
Figure 112015029537747-pat00498
Figure 112015029537747-pat00499
번째 사용자를,
Figure 112015029537747-pat00500
Figure 112015029537747-pat00501
번째 아이템을,
Figure 112015029537747-pat00502
Figure 112015029537747-pat00503
번째 아이템 군집을,
Figure 112015029537747-pat00504
Figure 112015029537747-pat00505
번째 기호를,
Figure 112015029537747-pat00506
Figure 112015029537747-pat00507
번째 성향을,
Figure 112015029537747-pat00508
Figure 112015029537747-pat00509
번째 성향의 사용자들의 기호 전이모델을 나타낼 수 있다. 이 때,
Figure 112015029537747-pat00510
Figure 112015029537747-pat00511
에 대한 선호도 예측치인
Figure 112015029537747-pat00512
는 수식7을 통해 산출될 수 있다.
(수식7)
Figure 112015029537747-pat00513
한편, 본 발명은 상술한 예측적 군집화 기반 협업 필터링 방법을 기록매체에 저장한 예측적 군집화 기반 협업 필터링 프로그램일 수 있다.
상기한 예측적 군집화 기반 협업 필터링 프로그램은 기호 군집화 프로그램, 기호 전이 탐지 프로그램, 성향 군집화 프로그램, 선호도 예측 프로그램을 포함할 수 있으며 이 외에도 상술한 예측적 군집화 기반 협업 필터링 방법의 모든 단계를 기록매체에 저장한 형태로 포함할 수 있음은 자명하다.
상기 기록매체는 CD-ROM, DVD, 블루레이, 하드디스크, SSD, USB를 포함하며 통상의 기술자가 용이하게 이용할 수 있는 기록매체를 포함할 수 있다.
상기 프로그램은 C++, JAVA를 포함하며 통상의 기술자가 용이하게 이용할 수 있는 프로그래밍용 언어를 포함할 수 있다.
100: 예측적 군집화 기반 협업 필터링 장치
110: 기호 군집화부 120: 기호전이 탐지부
130: 성향 군집화부 140: 선호도 예측부
111: 아이템 군집화부 112: 사용자 군집화부
113: 기호벡터 생성부 121: 사용자 기호전이 탐지부
122: 기호전이 벡터 생성부 131: 기호전이 유사도 추정부
132: 기호전이 패턴 군집화부 133: 기호전이 모델 생성부

Claims (11)

  1. 기호 군집화부가 사용자들을 기호에 따라 군집화(Clustering)하고 각 기호를 나타내는 기호 벡터를 생성하는 기호 군집화 단계;
    사용자 기호전이 탐지부가 상기 기호 벡터들을 이용하여 사용자들의 기호 변화를 탐지하고 상기 기호 변화를 기호 전이 시퀀스로 표현하는 사용자 기호 전이 탐지 단계;
    성향 군집화부가 사용자들을 기호 전이 패턴에 따라 군집화하고 각 성향을 나타내는 기호 전이모델을 생성하는 성향 군집화 단계;및
    선호도 예측부가 상기 기호 벡터와 상기 기호 전이모델을 바탕으로 사용자 선호도 예측모델을 생성하고 사용자들의 각 아이템에 대한 선호도를 예측하는 선호도 예측 단계를 포함하며,
    상기 성향 군집화 단계는,
    기호전이 유사도 추정부가 유사도를 측정하고자 하는 두 사용자 벡터에서, 서로 가장 유사한 기호를 가지고 있었던 시점을 기준으로 하여 상기 시점 이후 전이 과정이 유사한지 탐색하는 기호 전이 유사도 추정 단계, 기호전이 패턴 군집화부가 기호 전이 유사도를 기반으로 상기 사용자간 유사도의 합이 최대가 되게 하는 군집의 중심을 찾는 기호 전이 패턴 군집화 단계 및 기호전이 모델 생성부가 상기 군집에 포함된 사용자들의 기호가 전이되는 비율과 기호 전이가 일어나는데 걸리는 시간 정보를 포함하는 전이 확률 벡터를 포함하는 기호 전이 모델을 생성하는 기호 전이 모델 생성단계를 포함하는 예측적 군집화 기반 협업 필터링 방법.
  2. 청구항 1에 있어서,
    상기 기호 군집화 단계는,
    아이템 군집화부가 상기 사용자들의 평가 점수를 기반으로 추정된 아이템들 간의 유사도를 기준으로 아이템을 군집화하는 아이템 군집화 단계;
    사용자 군집화부가 아이템 군집과 상기 평가 점수를 바탕으로 생성된 특성 벡터와 사용자 간의 유사도를 기준으로 사용자들을 군집화하는 사용자 군집화 단계;및
    기호벡터 생성부가 사용자 군집에 속한 사용자들의 특성 벡터의 평균을 기호 벡터로 설정하는 기호 벡터 생성 단계를 포함하는 예측적 군집화 기반 협업 필터링 방법.
  3. 청구항 2에 있어서,
    상기 아이템 군집화 단계는,
    수식1을 이용하여 아이템간 유사도를 도출하고, 상기 아이템간 유사도를 이용하여 아이템을 군집화하는 예측적 군집화 기반 협업 필터링 방법.
    (수식1)
    Figure 112016008043938-pat00514

    (
    Figure 112016008043938-pat00515
    는 아이템
    Figure 112016008043938-pat00631
    Figure 112016008043938-pat00632
    간 유사도,
    Figure 112016008043938-pat00518
    는 아이템
    Figure 112016008043938-pat00519
    Figure 112016008043938-pat00520
    를 모두 평가한 사용자들의 집합,
    Figure 112016008043938-pat00521
    는 사용자
    Figure 112016008043938-pat00522
    의 아이템
    Figure 112016008043938-pat00523
    에 대한 평가 점수,
    Figure 112016008043938-pat00524
    는 사용자
    Figure 112016008043938-pat00525
    의 아이템
    Figure 112016008043938-pat00526
    에 대한 평가 점수,
    Figure 112016008043938-pat00527
    는 사용자 집합
    Figure 112016008043938-pat00528
    의 아이템
    Figure 112016008043938-pat00529
    에 대한 평가점수의 평균,
    Figure 112016008043938-pat00530
    는 사용자 집합
    Figure 112016008043938-pat00531
    의 아이템
    Figure 112016008043938-pat00532
    에 대한 평가점수의 평균이다.)
  4. 청구항 2에 있어서,
    상기 사용자 군집화 단계는,
    수식2를 이용하여 특성 벡터를 도출하고,
    수식3을 이용하여 사용자간 유사도를 도출한 뒤, 상기 특성 벡터와 상기 사용자간 유사도를 이용하여 사용자를 군집화하는 예측적 군집화 기반 협업 필터링 방법.
    (수식2)
    Figure 112015095301110-pat00533

    (
    Figure 112015095301110-pat00534
    는 사용자
    Figure 112015095301110-pat00633
    의 특성벡터,
    Figure 112015095301110-pat00536
    은 아이템 군집의 수,
    Figure 112015095301110-pat00537
    는 사용자
    Figure 112015095301110-pat00634
    Figure 112015095301110-pat00635
    번째 아이템 군집인
    Figure 112015095301110-pat00539
    에 속한 모든 아이템에 대한 평가점수의 평균이다.)
    (수식3)
    Figure 112015095301110-pat00540

    (
    Figure 112015095301110-pat00541
    는 사용자
    Figure 112015095301110-pat00636
    와 사용자
    Figure 112015095301110-pat00637
    의 유사도,
    Figure 112015095301110-pat00544
    는 사용자
    Figure 112015095301110-pat00545
    와 사용자
    Figure 112015095301110-pat00546
    모두가 평가한 아이템들의 집합,
    Figure 112015095301110-pat00547
    는 사용자
    Figure 112015095301110-pat00548
    의 아이템
    Figure 112015095301110-pat00549
    에 대한 평가 점수,
    Figure 112015095301110-pat00550
    는 사용자
    Figure 112015095301110-pat00551
    의 아이템
    Figure 112015095301110-pat00552
    에 대한 평가 점수,
    Figure 112015095301110-pat00553
    는 아이템 집합
    Figure 112015095301110-pat00554
    에 대한 사용자
    Figure 112015095301110-pat00555
    의 평가점수의 평균,
    Figure 112015095301110-pat00556
    는 아이템 집합
    Figure 112015095301110-pat00557
    에 대한 사용자
    Figure 112015095301110-pat00558
    의 평가점수의 평균이다.)
  5. 청구항 2에 있어서,
    상기 기호 벡터는,
    수식4를 통해서 산출되는 예측적 군집화 기반 협업 필터링 방법.
    (수식4)
    Figure 112015095301110-pat00559

    (
    Figure 112015095301110-pat00560
    Figure 112015095301110-pat00561
    번째 기호
    Figure 112015095301110-pat00562
    의 특성벡터이며,
    Figure 112015095301110-pat00563
    는 사용자 군집
    Figure 112015095301110-pat00564
    의 원소 수,
    Figure 112015095301110-pat00565
    는 사용자
    Figure 112015095301110-pat00638
    의 특성벡터,
    Figure 112015095301110-pat00567
    은 아이템 군집의 수,
    Figure 112015095301110-pat00568
    는 사용자
    Figure 112015095301110-pat00639
    Figure 112015095301110-pat00640
    번째 아이템 군집인
    Figure 112015095301110-pat00570
    에 속한 모든 아이템에 대한 평가 점수의 평균이다.)
  6. 청구항 1에 있어서,
    상기 사용자 기호 전이 탐지 단계는,
    기호전이 탐지부가 특정 시점에 특정 아이템에 대한 상기 사용자들의 평가 점수를 기설정된 크기의 윈도우로 관측하는 기호 전이 탐지 단계; 및
    기호전이 벡터 생성부가 상기 특정 시점에서 상기 사용자들의 기호의 특성을 나타내는 기호 벡터, 상기 특정 시점에서 상기 사용자들의 특성을 나타내는 사용자 특성 벡터 및 상기 특정 시점에서 상기 사용자들의 기호 전이가 일어나기까지 소요시간을 포함하는 기호 전이 벡터를 생성하는 기호 전이 벡터 생성 단계를 포함하는 예측적 군집화 기반 협업 필터링 방법.
  7. 청구항 6에 있어서,
    상기 기호 전이 벡터는,
    수식5를 이용하여 산출되는 예측적 군집화 기반 협업 필터링 방법.
    (수식5)
    Figure 112015029537747-pat00571

    (
    Figure 112015029537747-pat00572
    는 사용자
    Figure 112015029537747-pat00573
    의 기호전이 벡터,
    Figure 112015029537747-pat00574
    을 시점
    Figure 112015029537747-pat00575
    에서 사용자
    Figure 112015029537747-pat00576
    의 기호 전이,
    Figure 112015029537747-pat00577
    Figure 112015029537747-pat00578
    에서 사용자
    Figure 112015029537747-pat00579
    의 기호의 특성을 나타내는 기호 벡터,
    Figure 112015029537747-pat00580
    Figure 112015029537747-pat00581
    에서 사용자
    Figure 112015029537747-pat00582
    의 특성을 나타내는 사용자 특성 벡터,
    Figure 112015029537747-pat00583
    Figure 112015029537747-pat00584
    에서 발생한 사용자
    Figure 112015029537747-pat00585
    의 기호 전이가 일어나기까지의 소요시간을 의미한다.)
  8. 삭제
  9. 청구항 1에 있어서,
    상기 전이 확률 벡터는,
    수식6과 같이 산술적 확률을 바탕으로 한 전이 확률과 전이 시간 간격에 대한 가우시안 확률 모델 정보를 담고 있는 예측적 군집화 기반 협업 필터링 방법.
    (수식6)
    Figure 112015095301110-pat00586

    (
    Figure 112015095301110-pat00587
    Figure 112015095301110-pat00588
    에서
    Figure 112015095301110-pat00589
    로의 전이 확률을 나타내는 벡터,
    Figure 112015095301110-pat00590
    Figure 112015095301110-pat00591
    에 속해 있던 사람의 수,
    Figure 112015095301110-pat00592
    Figure 112015095301110-pat00593
    에서
    Figure 112015095301110-pat00594
    로 전이되는 사람의 수,
    Figure 112015095301110-pat00595
    Figure 112015095301110-pat00596
    에 속한 사람들이
    Figure 112015095301110-pat00597
    로 전이되는 비율,
    Figure 112015095301110-pat00598
    는 전이의 시간 간격의 평균,
    Figure 112015095301110-pat00599
    는 시간 간격의 표준편차를 의미한다.)
  10. 청구항 1에 있어서,
    상기 선호도 예측 단계는,
    수식7을 이용하여 상기 사용자의 각 아이템에 대한 선호도를 예측하는 예측적 군집화 기반 협업 필터링 방법.
    (수식7)
    Figure 112015029537747-pat00600
    (
    Figure 112015029537747-pat00601
    Figure 112015029537747-pat00602
    번째 사용자,
    Figure 112015029537747-pat00603
    Figure 112015029537747-pat00604
    번째 아이템,
    Figure 112015029537747-pat00605
    Figure 112015029537747-pat00606
    번째 아이템 군집,
    Figure 112015029537747-pat00607
    Figure 112015029537747-pat00608
    번째 기호를 의미하며,
    Figure 112015029537747-pat00609
    는 기호와 사용자 간 유사도를 의미하고 이 값이 1에 가까울수록 사용자가 해당 기호에 속할 확률이 높아지며, -1에 가까울수록 사용자가 해당기호에 속할 확률이 낮아지며,
    Figure 112015029537747-pat00610
    는 기호 전이 확률로 사용자의 기호가
    Figure 112015029537747-pat00611
    에서
    Figure 112015029537747-pat00612
    로 전이될 확률을 의미하고,
    Figure 112015029537747-pat00613
    는 각 아이템 군집들에 대한 기호 군집 내 사용자들의 선호도를 의미하고,
    Figure 112015029537747-pat00614
    는 특정한 아이템이 아이템 군집에 포함되어 있을 확률을 의미하고,
    Figure 112015029537747-pat00615
    Figure 112015029537747-pat00616
    Figure 112015029537747-pat00617
    에 대한 선호도 예측치를 의미한다.)
  11. 청구항 1항의 예측적 군집화 기반 협업 필터링 방법을 기록매체에 저장한 예측적 군집화 기반 협업 필터링 프로그램.
KR1020150042144A 2015-03-26 2015-03-26 예측적 군집화 기반 협업 필터링 장치 및 방법 KR101592220B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150042144A KR101592220B1 (ko) 2015-03-26 2015-03-26 예측적 군집화 기반 협업 필터링 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150042144A KR101592220B1 (ko) 2015-03-26 2015-03-26 예측적 군집화 기반 협업 필터링 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101592220B1 true KR101592220B1 (ko) 2016-02-11

Family

ID=55351760

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150042144A KR101592220B1 (ko) 2015-03-26 2015-03-26 예측적 군집화 기반 협업 필터링 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101592220B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944487A (zh) * 2017-11-20 2018-04-20 北京信息科技大学 一种基于混合协同过滤算法的作物育种品种推荐方法
KR101877282B1 (ko) * 2017-02-14 2018-07-11 주식회사 아이디어랩스 개인화 회귀 분석을 이용하여 품목의 이용자가 상기 품목에 부여하는 선호도를 예측하기 위하여 정보를 정화하는 방법 및 이를 이용한 컴퓨팅 장치
KR20180093742A (ko) * 2017-02-14 2018-08-22 주식회사 아이디어랩스 맥락 정보를 반영한 개인화 회귀 분석을 이용하여 품목의 이용자가 상기 품목에 부여하는 선호도를 예측하기 위하여 정보를 정화하는 방법 및 이를 이용한 컴퓨팅 장치
KR101895961B1 (ko) * 2017-10-31 2018-09-06 (주)뤼이드 점수 추정 방법, 장치 및 컴퓨터 프로그램
CN110286094A (zh) * 2019-07-18 2019-09-27 山东省科学院海洋仪器仪表研究所 一种基于聚类分析的光谱模型转移方法
WO2023132384A1 (ko) * 2022-01-06 2023-07-13 엘지전자 주식회사 전이 학습 수행 방법, 통신 기기, 프로세싱 장치 및 저장 매체

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110032303A (ko) * 2009-09-22 2011-03-30 주식회사 케이티 군집 예측을 통한 콘텐츠 추천 시스템 및 방법
KR101507328B1 (ko) * 2014-03-10 2015-03-31 단국대학교 산학협력단 협업 추천 시스템에서의 사용자 피드백 예측 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110032303A (ko) * 2009-09-22 2011-03-30 주식회사 케이티 군집 예측을 통한 콘텐츠 추천 시스템 및 방법
KR101507328B1 (ko) * 2014-03-10 2015-03-31 단국대학교 산학협력단 협업 추천 시스템에서의 사용자 피드백 예측 장치 및 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Gong, s., "A Collaborative Filtering Recommendation Algorithm Based on User Clustering and Item Clustering", Journal of Soft ware, Vol.5, No.7, (2010), 745~752.
박성은 외 3인. "사용자 청취 로그의 음악 청취 순서를 이용한 다음 음악 추천". 한국정보과학회. 2011년 6월, 한국컴퓨터종합학술대회 논문집, 제38권, 제1호, pp.41-44.* *
이오준 외 3인. "적응형 군집화 기반 확장 용이한 협업 필터링 기법". 한국지능정보시스템학회. 2014년 6월, 지능정보연구, 제20권, 제2호, pp.73-92.* *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101877282B1 (ko) * 2017-02-14 2018-07-11 주식회사 아이디어랩스 개인화 회귀 분석을 이용하여 품목의 이용자가 상기 품목에 부여하는 선호도를 예측하기 위하여 정보를 정화하는 방법 및 이를 이용한 컴퓨팅 장치
KR20180093742A (ko) * 2017-02-14 2018-08-22 주식회사 아이디어랩스 맥락 정보를 반영한 개인화 회귀 분석을 이용하여 품목의 이용자가 상기 품목에 부여하는 선호도를 예측하기 위하여 정보를 정화하는 방법 및 이를 이용한 컴퓨팅 장치
KR101908272B1 (ko) 2017-02-14 2018-10-16 주식회사 아이디어랩스 맥락 정보를 반영한 개인화 회귀 분석을 이용하여 품목의 이용자가 상기 품목에 부여하는 선호도를 예측하기 위하여 정보를 정화하는 방법 및 이를 이용한 컴퓨팅 장치
KR101895961B1 (ko) * 2017-10-31 2018-09-06 (주)뤼이드 점수 추정 방법, 장치 및 컴퓨터 프로그램
CN107944487A (zh) * 2017-11-20 2018-04-20 北京信息科技大学 一种基于混合协同过滤算法的作物育种品种推荐方法
CN107944487B (zh) * 2017-11-20 2020-01-24 北京信息科技大学 一种基于混合协同过滤算法的作物育种品种推荐方法
CN110286094A (zh) * 2019-07-18 2019-09-27 山东省科学院海洋仪器仪表研究所 一种基于聚类分析的光谱模型转移方法
WO2023132384A1 (ko) * 2022-01-06 2023-07-13 엘지전자 주식회사 전이 학습 수행 방법, 통신 기기, 프로세싱 장치 및 저장 매체

Similar Documents

Publication Publication Date Title
KR101592220B1 (ko) 예측적 군집화 기반 협업 필터링 장치 및 방법
Cui et al. Personalized travel route recommendation using collaborative filtering based on GPS trajectories
CN105701191B (zh) 一种推送信息点击率估计方法和装置
Hu et al. Your neighbors affect your ratings: on geographical neighborhood influence to rating prediction
Chua et al. Modeling temporal adoptions using dynamic matrix factorization
Wei et al. Collaborative filtering and deep learning based hybrid recommendation for cold start problem
KR101864822B1 (ko) 사용자를 위한 항목을 추천하는 장치 및 방법
Shi et al. Long-term performance of collaborative filtering based recommenders in temporally evolving systems
Hu et al. An item orientated recommendation algorithm from the multi-view perspective
Phuong et al. Graph-based context-aware collaborative filtering
Manotumruksa et al. Regularising factorised models for venue recommendation using friends and their comments
Unger et al. Inferring contextual preferences using deep auto-encoding
Yang et al. Next poi recommendation via graph embedding representation from h-deepwalk on hybrid network
da Costa Fortes et al. Ensemble learning in recommender systems: Combining multiple user interactions for ranking personalization
Li et al. Sentiment based multi-index integrated scoring method to improve the accuracy of recommender system
Christensen et al. Matrix factorization in social group recommender systems
Gong A Personalized Recommendation Algorithm on Integration of Item Semantic Similarity and Item Rating Similarity.
KR101910424B1 (ko) 태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치
CN113326432A (zh) 一种基于决策树与推荐方法的模型优选方法
Li et al. ICAMF: improved context-aware matrix factorization for collaborative filtering
CN108519993A (zh) 基于多数据流计算的社交网络热点事件检测方法
Margaris et al. Enhancing rating prediction quality through improving the accuracy of detection of shifts in rating practices
Bhargavi et al. Comparative study of consumer purchasing and decision pattern analysis using pincer search based data mining method
Chen et al. From tie strength to function: Home location estimation in social network
Nguyen et al. Improved collaborative filtering recommendations using quantitative implication rules mining in implication field

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190107

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 5